MXPA00000336A

MXPA00000336A - Metodos y composiciones para producir plantas y microorganismos que expresan la treonina deshidratasa/desaminasa insensible a la retroalimentacion

Info

Publication number: MXPA00000336A
Application number: MXPA/A/2000/000336A
Authority: MX
Inventors: Georges S Mourad
Original assignee: Georges S Mourad; Purdue Research Foundation
Priority date: 1997-07-10
Filing date: 2000-01-07
Publication date: 2001-05-07

Abstract

La presente invención se refiere a métodos y materiales en el campo de al biología molecular y a la regulación de la síntesis de polipéptidos a través de la ingeniería genética de las plantas y/o los microorganismos. Más particularmente, la invención se refiere a secuencias de nucleótidos aislados recientemente, a secuencias de nucleótidos que tienen una identidad substancial con la misma y a los equivalentes de la misma, asícomo a los polipéptidos codificados por la misma. La invención también involucra la introducción de secuencias de nucleótidos extrañas en el genoma de una planta y/o microorganismo, en donde la introducción de la secuencia de nucleótidos efectúa un incremento en la resistencia del transformante a los análogos estructurales de la isoleucina tóxicos. Las secuencias inventivas por lo tanto pueden ser utilizadas como marcadores moleculares excelentes para seleccionar los transformantes exitosos, por lo cual se reemplazan los genes resistentes a los antibióticos utilizados en la técnica previa. Los transformantes hospedan una secuencia de nucleótidos que comprende un promotor enlazado operativamente a una secuencia de nucleótidos de la invención, demostraron niveles incrementados de producción de isoleucina, por lo cual se proporciona una fuente de nutrientes mejorada.

Description

MÉTODOS Y COMPOSICIONES PARA PRODUCIR PLANTAS Y MICROORGANISMOS QUE EXPRESAN LA TREONINA DESHIDRATASA/DESAMINASA INSENSIBLE A IA RETROALIMENTACIÓN ANTECEDENTES DE LA INVENCIÓN Campo de la Invención La presente invención se refiere a métodos y materiales en el campo de la biología molecular y a la utilización de secuencias de nucleótidos aisladas para diseñar genéticamente plantas, y/o microorganismos. Más particularmente, la invención se refiere en ciertos aspectos preferidos a nuevas secuencias de nucleótidos y a los usos de la misma, incluyendo su uso en las construcciones de ADN para transformar plantas, hongos, levaduras y bacterias. Las secuencias de nucleótidos son particularmente útiles como marcadores seleccionables para seleccionar plantas y/o microorganismos para transformantes exitosos y también para mejorar el valor nutricional de las plantas.

Rßf .032459 Introducción y Descripción de la Técnica Relacionada La treonina deshidratasa/desaminasa ("TD") es la primera enzima en la ruta biosintética de la isoleucina, y cataliza la formación del 2-oxobutirato a partir de la treonina ("Thr") en una reacción de dos pasos. El primer paso es una deshidratación de la Thr, seguido por la rehidratación y liberación de amoníaco. Todas las reacciones corriente abajo del TD son catalizadas por enzimas que son compartidas por dos ramificaciones principales de la ruta biosintética que conduce a la producción de los aminoácidos de cadena ramificada, isoleucina ("lie"), leucina ("Leu"), y valina ("Val") . Una ilustración de la ruta biosintética se describe en la Figura 1. Los niveles celulares de la lie son controlados por la inhibición de la retroalimentación negativa. Cuando los niveles celulares de la lie son elevados, la lie se une a la TD en un sitio regulatorio (sitio aloestérico) que es diferente del sitio de unión del substrato (sitio catalítico) de la enzima. La formación de este complejo de Ile-TD provoca cambios conformacionales a la TD, los cuales previenen la unión del substrato, inhibiendo así la ruta biosintética de la He.

Ya se sabe que existen ciertos análogos estructurales de la He los cuales son tóxicos para una amplia variedad de plantas y microorganismos. Se cree que estos análogos de He son tóxicos a causa de que las células incorporan los análogos en los polipéptidos en lugar de la He, por lo cual se sintetizan polipéptidos defectuosos. A este respecto, la L-O-metiltreonina ("OMT") se reportó en 1955 que es un análogo estructural de la He que inhibe el crecimiento de los cultivos de las células de los mamíferos, inhibiendo la incorporación de la He en las proteínas. (Rabinovitz M. et al., Steric relationship between threonine and isoleucine as indicated by an antimetabolite study. J Am Chem Soc 77:3109-3111 (1955)). Se cree que el mismo fenómeno explica la inhibición del crecimiento, el cual es provocado por otros análogos estructurales de la He tales como, por ejemplo, thialle. Ciertas cepas de las bacterias y levaduras y ciertas líneas vegetales han sido identificadas, las cuales son resistentes a la toxicidad de los análogos estructurales de He señalados anteriormente, y esta resistencia ha sido atribuida a una mutación en la enzima de TD. La TD mutada aparentemente caracteriza una pérdida o reducción de la sensibilidad de retroalimentación de la He (referida aquí como "insensibilidad") . Como resultado de esta insensibilidad, las células que hospedan la TD insensible producen cantidades incrementadas de He, por lo cual compiten con el análogo de He tóxico durante la incorporación en las proteínas celulares. Por ejemplo, la resistencia a thialle ha sido asociada en ciertas cepas de bacterias y levadura con una pérdida de la sensibilidad en la retroalimentación de TD a He. En las células de Rosa, la resistencia a OMT también fue asociada con una TD que tiene sensibilidad reducida a la inhibición en la retroalimentación por He. Existiendo en el cultivo del tejido y teniendo un nivel de ploidía elevado, sin embargo, no fue posible determinar las bases genéticas de la insensibilidad en la retroalimentación a la He en la variante Rosa, la única planta conocida mutada con una TD insensible a la He. Pasando a un campo de investigación en donde la presente invención encuentra aplicación ventajosa, los marcadores seleccionables son utilizados ampliamente en métodos para transformar genéticamente células, tejidos y organismos. Tales marcadores son utilizados para seleccionar células, más comúnmente bacterias, para determinar si un procedimiento de transformación ha sido exitoso. Como un ejemplo específico, se conoce ampliamente que las construcciones para transformar una célula pueden incluir como un marcador seleccionable una secuencia de nucleótidos que confiere resistencia a los antibióticos a la célula transformada. Cuando se utilice aquí con relación a las células y las plantas, los términos "transformada" y "transgénica" son utilizados intercambiablemente para referirse a una célula o planta que expresa una secuencia de nucleótidos extraña introducida por medio de esfuerzos de transformación. El término "secuencia de nucleótidos extraña" está propuesto para indicar una secuencia que codifica un polipéptido cuya secuencia de aminoácidos exacta no es encontrada normalmente en la célula huésped, pero es introducida en la misma a través de técnicas de transformación. Después de la transformación, las células se pueden poner en contacto con un antibiótico en un procedimiento de selección. Solamente los transformantes exitosos, es decir, aquellos que poseen el gen de resistencia a los antibióticos, sobreviven y continúan creciendo y proliferando en la presencia del antibiótico. Estas técnicas proporcionan una manera por la cual los transformantes exitosos pueden ser identificados y propagados, por lo cual se elimina el consumo de tiempo y las alternativas costosas de crecimiento y trabajo con las células las cuales no fueron transformadas exitosamente.

La técnica de selección descrita anteriormente está llegando a ser menos ventajosa, sin embargo, a causa de que, debido a la exposición prolongada a los antibióticos, un número siempre creciente de microorganismos que están presentes naturalmente están desarrollando resistencia a los antibióticos por la mutación espontánea. La confiabilidad de esta técnica de selección está comprometida por lo tanto a causa de que la exposición continua a los antibióticos provoca que los microorganismos que no son transformados desarrollen una mutación espontánea que les confiere resistencia a los antibióticos. Además, de la viabilidad decreciente de esta técnica de selección, el sobreuso de antibióticos, y la resistencia resultante desarrollada espontáneamente por los microorganismos, es de un interés médico creciente porque la eficacia de los antibióticos en la batalla contra las infecciones bacterianas está disminuyendo. Muchas infecciones -incluyendo la meningitis- ya no responden bien a los fármacos que una vez trabajaron bien contra ellos. Este fenómeno es atribuido ampliamente al sobreuso de los antibióticos, tanto a los fármacos y como una herramienta de selección de laboratorio, como a la resistencia a los antibióticos resultantes de un número creciente de microorganismos. Como un ejemplo, la bacteria que provoca la meningitis una vez fue controlada rutinariamente con ampicilina, un antibiótico prescrito comúnmente y un antibiótico utilizado muy pesadamente en la selección de las células bacterianas transformadas para la resistencia como un marcador seleccionable. Ahora, sin embargo, aproximadamente 20 por ciento de tales infecciones son resistentes a la ampicilina. La presente invención se dirige a los problemas mencionados anteriormente en la selección de transformantes genéticos y proporciona secuencias de nucleótidos las cuales pueden ser utilizadas ventajosamente como marcadores seleccionables, y las cuales pueden ser insertadas en el genoma de una planta o microorganismo para proporcionar una planta o microorganismo transformado. Tal planta o microorganismo transformado exhibe venta osamente niveles incrementados significativamente de la síntesis de He y la síntesis de los compuestos intermedios de la ruta biosintética de He y por lo tanto también son capaces de sobrevivir en la presencia de un análogo de He tóxico.

Breve Descripción de la Invención La presente invención proporciona secuencias de nucleótidos, aisladas y clonadas originalmente a partir de Arabidopsis thaliana, las cuales codifican la TD insensible a la retroalimentación que pueden ser utilizadas ventajosamente para transformar una amplia variedad de plantas, hongos, bacterias y levaduras. Las formas inventivas de TD no solamente son insensibles a la inhibición de la retroalimentación por la isoleucina, sino también insensibles a los análogos estructurales de la isoleucina que son tóxicos para las plantas y los microorganismos que sintetizan solamente la TD del tipo silvestre. Por lo tanto, las secuencias de nucleótidos inventivas que codifican las formas mutadas de la TD pueden ser utilizadas para crear las células que son insensibles a los compuestos normalmente tóxicos a las células que expresan solamente las enzimas de TD del tipo silvestre. A este respecto, una secuencia de nucleótidos de la invención puede ser utilizada en una construcción de ADN para proporcionar un marcador seleccionable bioquímico. Un aspecto de la presente invención es la identificación, aislamiento y purificación de un gen que codifica una forma del tipo silvestre de la TD. La secuencia de ADN de la misma puede ser utilizada como se describe aquí para determinar la secuencia de aminoácidos completa para la proteína codificada por la misma y por consiguiente permite la identificación de los dominios encontrados allí que pueden ser mutados para producir las proteínas de TD adicionales que tienen características enzimáticas alteradas. En otro aspecto de la invención, se proporcionan polinucleótidos aislados y purificados, los polinucleótidos codifican una forma mutada de la TD, o una porción de la misma, como se describe aquí. Por ejemplo, la invención proporciona polinucleótidos aislados que comprenden las secuencias descritas en las SEC ID N0:2, SEC ID NO: 3 y la SEC ID NO: 4, las secuencias de nucleótidos que tienen la identidad substancial para la misma, y las secuencias de nucleótidos que codifican las variantes de TD de la invención. También son provistos los polipéptidos aislados que comprenden las secuencias de aminoácidos descritas en las SEC ID NO: 2, SEC ID NO: 3 y la SEC ID NO: 4 y las variantes de las mismas seleccionadas de acuerdo con la invención. En un aspecto alternativo de la invención, se proporciona una construcción de ADN quimérica que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es substancialmente resistente a la inhibición de la retroalimentación. En una célula que hospeda la construcción, la secuencia de nucleótidos puede ser transcrita para producir el ARNm y dicho ARNm puede ser transladado o traducido para producir ya sea la TD mutada, madura o una proteína de TD mutada del precursor, la proteína es funcional en la célula. También se provee, por lo tanto, un vector útil para transformar una células, y las plantas y microorganismos transformados .con el mismo, el vector comprende una construcción de ADN seleccionada de acuerdo con la invención. En los aspectos alternativos de la invención, se proporcionan células y plantas que tienen incorporado en su genoma una secuencia de nucleótidos extraña enlazada operativamente a un promotor, la secuencia extraña comprende una secuencia de nucleótidos que tiene una identidad substancial con respecto a una secuencia descrita aquí o una secuencia de nucleótidos extraña que codifica un polipéptido de la invención. En otro aspecto de la invención, se proporciona un método que comprende incorporar en un genoma de la planta una construcción de ADN de la invención para proporcionar una planta transformada; en donde la planta transformada es capaz de expresar las secuencias de nucleótidos. Todavía otro aspecto de la invención es la producción y propagación de las células transformadas de acuerdo con la invención, en donde las células expresan una enzima de TD mutada, haciendo por consiguiente resistentes a las células para la inhibición de la retroalimentación por la leucina, y resistentes a las moléculas que son tóxicas para una célula que produce solamente la enzima de TD del tipo silvestre. A este respecto, se proporciona un método que comprende proveer un vector que caracteriza un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es resistente a la inhibición de la retroalimentación, en donde el promotor regula la expresión de la secuencia de nucleótidos en una célula de la planta huésped; y transformar una planta de blanco u objetivo con el vector para proporcionar una planta transformada, la planta transformada es capaz de expresar la secuencia de nucleótidos. Las plantas transformadas de acuerdo con la invención tienen dentro de sus cloroplastos una forma mutado de la TD, madura, la cual hace a las células resistentes a los análogos de He tóxicos. También se proporcionan plantas transformadas obtenidas de acuerdo con los métodos de la invención y la progenie de los mismos. También se proporciona un método para seleccionar los transformantes potenciales, que comprende (1) proveer una pluralidad de células, en donde al menos una de las células tiene en su genoma una secuencia de nucleótidos extraña, expresable, seleccionada de acuerdo con la invención; y (2) poner en contacto la pluralidad de las células con un substrato que comprende un análogo estructural de isoleucina tóxica; en donde las células que comprenden la secuencia de nucleótidos extraña, expresable, son capaces de crecimiento en el substrato, y en donde las células que no comprenden la secuencia de nucleótidos extraña, expresable, son incapaces de crecer en el substrato. En otro aspecto de la invención, se proporciona una construcción que comprende una secuencia de nucleótidos primaria que va a ser introducida en el genoma de una célula, tejido y/u organismo de blanco u objetivo, y que comprende además un marcador seleccionable bioquímico, seleccionado de acuerdo con la invención. Este aspecto de la invención puede ser utilizado ventajosamente para transformar una amplia variedad de células, que incluyen los microorganismos y las células vegetales. Después de introducir la construcción de ADN, la cual también incluye un promotor apropiado y tales otras secuencias regulatorias como pueden ser seleccionadas por un artesano experto, en un microorganismo o planta de blanco u objetivo, la planta o microorganismo, se puede hacer crecer en un substrato que comprende un análogo de isoleucina tóxica (un "substrato tóxico"), por lo cual se proporciona un mecanismo para la determinación inicial si la transformación fue exitosa. En donde una pluralidad de plantas o microorganismos son transformadas, colocando los transformantes potenciales en un substrato tóxico proporciona un paso de selección inicial por el cual los transformantes exitosos pueden ser ientificados. Se entiende fácilmente por una persona experta en el campo relevante, en vista de la presente especificación, que los transformantes exitosos crecerán normalmente en el substrato tóxico en virtud de la expresión de la TD insensible; sin embargo, las plantas y/o los microorganismos transformados no exitosamente morirán debido al efecto tóxico del substrato. Las plantas transformadas pueden ser identificadas por lo tanto rápidamente de acuerdo con la invención, y los microorganismos transformados pueden ser identificados de acuerdo con la invención sin utilizar genes resistentes a los antibióticos. En otro aspecto de la invención, se proporciona un método para incorporar confiablemente una primera secuencia de nucleótidos extraña, expresable, en una célula de blanco u objetivo, que comprende proporcionar un vector que comprende un promotor enlazado operativamente a una primera secuencia de nucleótidos primaria y una segunda secuencia de nucleótidos seleccionada de acuerdo con la invención, la segunda secuencia que codifica una enzima de TD insensible; transformar la célula de blanco u objetivo con el vector para proporcionar una célula transformada; y poner en contacto la célula con un substrato que comprende la L-0-metiltreonina; en donde las células transformadas exitosamente son capaces de crecer en el substrato, y en donde las células transformadas exitosamente son incapaces de crecer en el substrato. En un aspecto alternativo de la invención, se proporciona un método para hacer crecer una pluralidad de plantas en la ausencia de las plantas indeseables, tales como, malas hierbas, el método comprende proporcionar una pluralidad de plantas, cada una teniendo en su genoma una secuencia de nucleótidos extraña que comprende un promotor enlazado operativamente a una secuencia de nucleótidos seleccionada de acuerdo con la invención; hacer crecer la pluralidad de las plantas en un substrato; e introducir una cantidad preseleccionada de un análogo estructural de isoleucina en el substrato. Las enzimas de TD descritas aquí funcionan en los cloroplastos de una célula vegetal. Por lo tanto, es apreciado fácilmente por un artesano experto que una secuencia de nucleótidos insertada en una célula vegetal codificará necesariamente un péptido de TD del precursor. Por consiguiente, las construcciones del ADN quimérico son descritas aquí, las cuales comprenden una primera secuencia de nucleótidos que codifica una forma mutada madura de la TD y una segunda secuencia de nucleótidos que codifica un péptido de tránsito de cloroplastos de elección, la segunda secuencia está unida funcionalmente al extremo 5' de la primera secuencia. La expresión de la construcción del ADN quimérico conduce a la producción de una enzima de TD precursora mutada que puede ser translocada o translocalizada en un cloroplasto. La presencia de una TD mutada madura en el cloroplasto conduce a una célula vegetal que tiene las características descritas aquí. Es un objeto de la presente invención proporcionar secuencias de nucleótidos aisladas las cuales pueden ser introducidas en el genoma de una planta o microorganismo para incrementar la capacidad de la planta o microorganismo para sintetizar la He y los compuestos intermedios de la ruta biosintética de la He. Adicionalmente, es un objeto de la invención proporcionar secuencias de nucleótidos, las cuales puedan ser utilizadas como excelentes marcadores seleccionables bioquímicos para identificar transformantes exitosos en los protocolos de la ingeniería cinética.

También es un objeto de la invención proporcionar un sistema herbicida, que no es nocivo para el medio ambiente, selectivo, eficiente, novedoso. Los objetos, ventajas y características adicionales de la presente invención serán evidentes a partir de la descripción detallada de aquí.

Breve Descripción de las Figuras Aunque las características distintivas de esta invención serán puntualizadas particularmente en las reivindicaciones, la invención por sí misma, y la manera en la cual la misma se puede hacer y utilizar, puede ser mejor entendida por la referencia a la siguiente descripción tomada con relación a las Figuras que se acompañan que forman una parte de la misma. La Figura 1 ilustra la ruta biosintética de los aminoácidos de cadena ramificada de valina, leucina e isoleucina. La Figura 2 describe el alineamiento de la secuencia de aminoácidos de TD del tomate y el garbanzo. Las regiones C son regiones altamente conservadas del sitio catalítico de TD mientras que las regiones R son regiones altamente conservadas del sitio regulatorio de TD. También se muestran las localizaciones de los cebadores de oligonucleótidos degeneradas TD205 y TD206 utilizadas para amplificar por PCR un fragmento de ADN genómico de TD de Arabidopsis. La Figura 3 muestra la estructura y el grado de degeneración de los dos cebadores de oligonucleótidos TD205 y TD206 utilizados en la amplificación de un fragmento de ADN genómico de Arabidopsis del gen de TD omr 1. El TD205 es anclado con un sitio Eco IR (subrayado) en su extremo 5' y el TD206 es anclado con un sitio Hind III (subrayado) en su extremo 5' . La Figura 4 describe la secuencia de ADN del clon 23 (pGM-td23) aislada de una biblioteca de ADNc de la línea mutada GMHb (omr 1/omr 1) de Arabidopsis thaliana. La Figura 5 describe la secuencia de nucleótidos y la secuencia de aminoácidos predicha del clon 23 como se aislan de la biblioteca de ADNc construida a partir de la línea GMllb de Arabidopsis (omr 1/omr 1) . El inserto de TD en el clon 23 está en el vector pBluescript entre los sitios Eco IR y Xho. Un marco de lectura abierta (marco de lectura superior) se observó que muestra un codón ATG en el nucleótido 166 y un codón de terminación en el nucleótido 1801. La Figura 6a muestra la estructura del vector de expresión pCM35S-omr 1 utilizado en la transformación de la Arabidopsis thaliana del tipo silvestre y la cual expresó una forma mutada de TD capaz de conferir resistencia a la L-O-metiltreonina del análogo tóxico sobre los transformantes. La Figura 6b describe la secuencia de nucleótidos y la secuencia de aminoácidos predicha del mutante quimérico omr 1 que expresa resistencia a la L-O-metiltreonina en las plantas de Arabidopsis transgénicas que han sido transformadas con el vector de expresión pCM35s-ornr 1 (mostrado en la Figura 6a) . La longitud total del TD mutante de la fusión (quimérico) expresado en las plantas transgénicas fue de 609 residuos de aminoácidos. Los primeros 9 residuos amino-terminales empiezan por la metionina codificada por un codón de inicio (ATG) provisto por el extremo 3' de la secuencia de nucleótidos del promotor de CaMV 35s enlazado al inserto de omr 1 del clon 23. Los siguientes 15 residuos de aminoácidos son generados por la secuencia de nucleótidos de la región polienlazadora desde el sitio de clonación múltiple del vector y finalmente los 585 residuos de aminoácidos restantes son codificados por el alelo mutante omr 1 de Arabidopsis como está presente en el clon 23. El primer residuo de la porción larga de 585 aminoácidos codificada por omr 1 en pCM35s-omr 1 corresponde a la treonina (Thr) la cual es el residuo amino-terminal numero 8 del ADNc de omr 1 de longitud total mostrado en las Figuras 8 y 9 y la SEC ID NO: 2. La Figura 7 es la secuencia de nucleótidos del ADNc de longitud total del alelo de omr 1 que codifica el TD mutado. La longitud total del ADNc del omr 1 es de 1779 nucleótidos incluyendo el codón de parada. La Figura 8 es la secuencia de aminoácidos predicha de la TD mutada codificada por el omr 1. La longitud total de la proteína de TD codificada por omr 1 es de 592 aminoácidos. La Figura 9 es la secuencia de nucleótidos y la secuencia de aminoácidos predicha codificada por el omr 1 del alilo mutado de la línea GMllb de la Arabidopsis thaliana. La Figura 10 es la secuencia de nucleótidos del ADNc de longitud total del OMRl del alelo del tipo silvestre que codifica la TD del tipo silvestre. La Figura 11 es la secuencia de aminoácidos predicha del TD del tipo silvestre codificada por OMRl. La Figura 12 es la secuencia de nucleótidos y la secuencia de aminoácidos predicha codificada por el OMRl del alelo del tipo silvestre Columbia de la Arabidopsis thaliana. La Figura 13 describe el alineamiento múltiple de la secuencia de aminoácidos deducida de la TD del tipo silvestre de la Arabidopsis thaliana reportada en esta descripción con aquella de otros organismos obtenida de GenBank con los siguientes números de acceso: 940472 para el garbanzo; 10257 para el tomate; 401179 para la papa; 730904 para la levadura 1; 134962 para la levadura 2, 68318 para E. coli Biosintético; 135723 para E. coli catabólico; 1174668 para Salmonella typhimurium. El programa megalign de la Lasergene software, DNASTAR Inc., Madison, Wisconsin fue utilizado. La Figura 14 es una porción del gel de secuenciamiento del ADN comparando la secuencia de nucleótidos del alelo de omr 1 mutado y su OMR 1 del alelo del tipo silvestre y que muestra la substitución básica C (en OMRl) a T (en omr 1) en el residuo 1495 del nucleótido partiendo del inicio de la secuencia de codificación. La flecha está apuntando a la substitución básica. La Figura 15 muestra la mutación puntual en omr 1 en el residuo de nucleótidos 1495, que predice una substitución de aminoácidos, desde la arginina (R) hasta la cisteína (C) en el residuo de aminoácidos 499 al nivel de la TD. La Figura 16 describe la secuencia de aminoácidos en la región regulatoria R4 de la TD codificada por los alelos de omr 1 mutada y OMRl del tipo silvestre de la Arabidopsis thaliana comparada por aquella de varios organismos. La flecha apunta al residuo de aminoácidos mutado en omr 1. La Figura 17 es una porción del gel de secuenciamiento del ADN que compara la secuencia de nucleótidos del alelo de omr 1 mutado y su OMRl del alelo del tipo silvestre y que muestra la substitución básica G (en OMRl) a A (en omr 1) en el residuo de nucleótidos 1631. La flecha está apuntando a la substitución básica. La Figura 18 muestra la mutación puntual en omr 1 en el residuo de nucleótido 1631, que predice una substitución de aminoácido, arginina (R) a histidina (H) en el residuo de aminoácidos 544 al nivel de la TD. La Figura 19 describe la secuencia de aminoácidos en la región regulatoria R6 de la TD codificada por los alelos de la omr 1 mutada y el OMRl del tipo silvestre de la Arabidopsis thaliana comparado con aquella de varios organismos. La flecha apunta al residuo de aminoácidos mutado en omr 1.

Descripción Detallada de la Invención __ Para propósitos de promover un entendimiento de los principios de la invención, se hará referencia ahora a las modalidades particulares de la invención y el lenguaje específico será utilizado para describir el mismo. Sin embargo se entenderá que ninguna limitación del alcance de la invención es propuesta por medio de esto, y las alteraciones y las modificaciones adicionales en la invención, y para tales aplicaciones adicionales de los principios de la invención como se describió aquí, están contempladas como se le podrían ocurrir normalmente a una persona experta en la técnica a la cual pertenece la invención. Como se describió anteriormente, la presente invención se refiere a métodos y composiciones para obtener células transformadas, las células que expresan en las mismas una forma mutada de treonina deshidratasa/desaminasa ("TD") . Más particularmente, la invención proporciona secuencias de nucleótidos aisladas que codifican los polipéptidos funcionales de TD mutados ("TD mutada") los cuales son resistentes a la inhibición de la retroalimentación de la He y son resistentes a los efectos tóxicos de los análogos de la He. Estas secuencias de nucleótidos inventivas pueden ser incorporadas en vectores, los cuales a su vez pueden ser utilizados para transformar células. Tal transformación puede ser utilizada, por ejemplo, para los propósitos de proporcionar un marcador seleccionable, para incrementar el valor nutricional de la planta o para incrementar la producción de los compuestos intermedios importantes comercialmente de la ruta biosintética de la isoleucina. La expresión de la TD mut.ada conduce a una célula que tiene una susceptibilidad alterada con respecto a ciertos inhibidores de enzima con relación a las células que tienen solo la TD del tipo silvestre. Estas y otras características de la invención son descritas con detalle adicional posteriormente. Una característica de la presente invención involucra el descubrimiento, el aislamiento y la caracterización de una secuencia de genes a partir de la Arabidopsis thaliana, designada omr 1, la cual codifica una forma mutada sorprendentemente ventajosa de la TD de la enzima. Los aspectos de la presente invención se refieren así a las secuencias de nucleótidos que codifican las formas mutadas de la TD, tales secuencias pueden ser introducidas en células vegetales o microorganismos de objetivo para proporcionar una planta o microorganismo transformado que tiene un número de características deseables. Las formas mutadas de la TD, a diferencia de la TD del tipo silvestre, son resistentes a la inhibición de la retroalimentación negativa por la isoleucina ("He") y las células transformadas son resistentes a las moléculas las cuales son tóxicas para las células que no expresan la TD insensible a la retroalimentación. Por lo tanto, los transformantes que hospedan una secuencia de nucleótidos de la invención, expresable, demuestran niveles incrementados de producción de isoleuceno y niveles incrementados de la producción de los compuestos intermediarios en la ruta biosintética de He, y los agentes transformantes son resistentes a los análogos estructurales de He los cuales son letales para los no transformantes, los cuales expresan solamente la TD del tipo silvestre. La presente invención se refiere a otro aspecto de las secuencias de aminoácidos que comprenden enzimas de TD sensibles a la retroalimentación, funcionales. El término "secuencia de aminoácidos" es utilizada aquí para designar una pluralidad de aminoácidos enlazados en una red o arreglo en serie. Los artesanos expertos reconocerán que por medio del proceso de mutación y/o evolución, pueden surgir polipéptidos de diferentes longitudes y que tienen diferentes constituyentes, por ejemplo, con las inserciones, substituciones, deleciones de los aminoácidos, y semejantes, que están relacionados con una secuencia descrita aquí en virtud de la homología de la secuencia de aminoácidos y una funcionalidad ventajosa como se describió con detalle aquí. El término "enzima de TD" es utilizado para referirse en general a una secuencia de aminoácidos de TD del tipo silvestre, a una TD mutada seleccionada de acuerdo con la invención, y a variantes de cada una las cuales catalizan la reacción de la treonina al 2-oxobutirato en las rutas biosintéticas de la He, como se describió aquí. Para propósitos de claridad, la forma del tipo silvestre es distinguida de una forma mutada, en donde sea necesario, por el uso de los términos "TD del tipo silvestre" y "TD mutada". No está propuesto que la presente invención esté limitada a las secuencias específicas descritas aquí. Se sabe bien que las plantas y microorganismos de una amplia variedad de especies expresan y utilizan comúnmente enzimas y/o polipéptidos análogos los cuales tienen grados variables de degeneración, y todavía que proporcionan efectivamente la misma función o una similar. Por ejemplo, una secuencia de aminoácidos aislada de una especie puede diferir a un cierto grado de la secuencia del tipo silvestre descrita en la SEC ID N0:1, y todavía tiene una funcionalidad similar con respecto a la función catalítica y reguladora. Las secuencias de aminoácidos que comprenden tales variaciones están incluidas dentro del alcance de la presente invención y están consideradas substancialmente similares a una secuencia de aminoácidos de referencia. Se cree que la identidad entre las secuencias de aminoácidos que es necesaria para mantener una funcionalidad apropiada está relacionada con el mantenimiento de la estructura terciaria del polipéptido de tal modo que las secuencias interactivas específicas serán localizadas apropiadamente y tendrán la actividad deseada. Aunque no está propuesto que la presente invención esté limitada por cualquier teoría por la cual la misma logre su resultado ventajoso, está contemplado que un polipéptido que incluye estas secuencias interactivas en el contexto espacial apropiado tendrán buena actividad, aún en donde existan alteraciones en otras porciones de las mismas . A este respecto, una variante de TD se espera que sea funcionalmente similar a la TD del tipo silvestre descrita en la SEC ID N0:1, por ejemplo, si la misma incluye aminoácidos los cuales son conservados entre una variedad de especies o si la misma incluye aminoácidos no conservados los cuales existen en una localización dada en otras especies que expresan la TD funcional. La Figura 13 describe un alineamiento de aminoácidos de los polipéptidos de TD de un número de especies. Dos observaciones significativas las cuales se pueden hacer con base en la Figura 13 son (1) que existe un alto grado de conservación de los aminoácidos en muchos lugares entre las especies mostradas, y (2) un número de inserciones, substituciones y/o deleciones están representadas en la TD de ciertas especies y/o cepas, las cuales no eliminan la funcionalidad doble de las enzimas de TD respectivas. Por ejemplo, en la Página 4 de la Figura 13, la Región Reguladora 4 ("R4") de la Arabidopsis del tipo silvestre es mostrada, la cual comprende la siguiente secuencia (que corresponde a los códigos de tres letras numerados como se describe en la SEC ID N0:1) : V N L T T D L V D K L R ? M G G Val Asn Leu Thr Th. Se: Aso Leu Val Lys Asp His- Leu Arg Tyr Leu Met Gly Gl 486 490 495 500 La degeneración mostrada en la Figura 13 en esta porción de la secuencia, proporciona ejemplos de substituciones las cuales se pueden hacer sin alterar substancialmente la funcionalidad de la secuencia del tipo silvestre descrita en la SEC ID NO:l. Por ejemplo, se espera que el Asp ("D") en la posición 492 podría ser substituido con una Glu ("E") y que la Leu ("L") en la posición 493 podría ser substituida con una Met ("M") sin alterar substancialmente la funcionalidad de la secuencia de aminoácidos. Lo siguiente describe una pluralidad de secuencias de R4, mostrada de tal modo que las substituciones aceptables sean descritas en varias localizaciones de los aminoácidos. Las secuencias abarcadas por medio de esto se espera que exhiban una funcionalidad similar a la porción correspondiente de la SEC ID N0:1. Una barra diagonal ("/") entre dos o en una serie de aminoácidos indica que cualquiera de los aminoácidos indicados puede estar presente en este lugar.

Val /Leu/ Phe/Ile Asn/Asp/Glu/Ser -eu/Iie/Phe/Vai/Gly Thr/Ser/Ala/Glv 486 Thr/HiS/Asp/Asn Ser/Asn/Asp/Iie Asp/Glu Leu/Met Val/Ala ys/Val/Ala 495 Asp/ Ile/Glu/Ser His Leu/Gly/Ile /Val Arg/Lvs Tyr/His Leu/Met Met /Va 500 Gl y Gl v 504 Se sobreentiende que las substituciones análogas en toda la secuencia están abarcadas dentro del alcance de la invención, y que la Región R4 simplemente es utilizada anteriormente para propósitos de ilustración. Otra manera en la cual puede existir una similaridad entre dos secuencias de aminoácidos es en donde un aminoácido dado está substituido con otro aminoácido a partir del mismo grupo de aminoácidos. De esta manera, se sabe que la serina puede ser substituida comúnmente con la treonina en un polipéptido sin alterar substancialmente la funcionalidad del polipéptido. Lo siguiente describe los grupos de los aminoácidos que se cree que van a ser intercambiables en las secuencias de aminoácidos de la invención en una amplia variedad de lugares sin alterar substancialmente la funcionalidad del mismo : Grupo I: Aminoácidos no polares: Alanina, valina, prolina, leucina, fenilalanina, triptófano, metionina, isoleucina, cisteína, glicina; Grupo II: Aminoácidos polares no cargados: Serina, treonina, asparagina, glutamina, tirosina; Grupo III: Aminoácidos ácidos polares cargados: Aspártico, glutámico; y Grupo IV: Aminoácidos básicos polares cargados: Lisina, arginina, histidina. En donde se esté inseguro de si una substitución dada afectará la funcionalidad de la enzima, esta puede ser determinada sin experimentación indebida utilizando técnicas de síntesis y ensayos de selección conocidos en la técnica. Habiéndose establecido el significado de la similaridad con respecto a una secuencia de aminoácidos, es importante señalar que la invención caracteriza secuencias de aminoácidos mutadas que comprenden una o más substituciones de aminoácidos que no alteran la funcionalidad de la enzima de TD del tipo silvestre. Las enzimas de TD insensibles de la invención no son similares a la TD del tipo silvestre, como este término es definido y utilizado aquí, a causa de que la funcionalidad de la inhibición es alterada. Las enzimas de TD insensibles caracterizan una o más mutaciones en el sitio regulatorio, tales mutaciones alteran la funcionalidad del sitio regulatorio sin alterar substancialmente la funcionalidad del sitio catalítico. En un aspecto específico de la invención, se proporciona una secuencia de aminoácidos (SEC ID NO: 2) que tiene dos substituciones, esta secuencia comprende una TD mutada la cual tiene buena funcionalidad catalítica pero la cual no exhibe funcionalidad regulatoria. En otras palabras, la enzima descrita en la SEC ID NO: 2 comprende una TD de Arabidopsis thaliana insensible a la retroalimentación. Se observa comparando la TD del tipo silvestre descrita en la SEC ID NO:l y la secuencia mutada de la SEC ID NO: 2, la cual comprende una modalidad específica de la invención, que las secuencias difieren solamente en dos mutaciones puntuales en las secuencias de nucleótidos respectivas (C a T en el nucleótido 1495; y G a A en el nucleótido 1631) , lo cual conduce a dos substituciones de aminoácidos en el polipéptido de TD (Arg a Cys en el lugar 499 del aminoácido; y Arg a His en el lugar 544 del aminoácido) . La primera mutación está en la región regulatoria R4 de TD, y la segunda está en la región regulatoria R6 de TD. La substitución de Arg a Cys en el residuo 499 de aminoácidos cambió a un aminoácido básico, polar (Arg) a un aminoácido no polar (Cys), los cuales alteraron el sitio de retroalimentación en TD. Por otra parte, el cambio de Arg a His en el residuo 544 fue un cambio desde un aminoácido básico, polar, cargado (Arg) hasta otro aminoácido básico, polar, cargado (His) . Aunque no está propuesto que la presente invención esté limitada por cualquier teoría por la cual la misma logre su resultado ventajoso, se cree que la substitución en el residuo 544 sola no puede tener substancialmente alterado el sitio de retroalimentación de TD, y, en contraste, que la substitución en el residuo 499 solo puede tener una TD desensibilizada codificada por medio de esto a una regulación de la retroalimentación. Ciertamente, cuando se combinan, las substituciones fueron muy efectivas para desensibilizar la TD codificada por omr 1 a la regulación de la retroalimentación. Se reconoce que la secuencia de aminoácidos descrita en la SEC ID NO: 3 (585 residuos codificados por omrl) es una versión truncada, omitiendo 7 residuos a ino-terminales, de aquella descrita en la SEC ID NO: 2. Se observa de la siguiente descripción, incluyendo los Ejemplos descritos aquí, que una cantidad significativa de búsqueda fue efectuada con base en esta versión ligeramente acortada, y que la versión acortada ligeramente puede ser utilizada ventajosamente para transformar una amplia variedad de plantas y microorganismos. Se cree que la porción de la secuencia de aminoácidos que está presente en la SEC ID NO: 2 y ausente en la SEC ID NO: 3 es una porción de la secuencia directora del cloroplasto, y no está presente en la enzima de TD madura. Como se mencionó anteriormente, para ayudar en la descripción de la presente invención, la SEC ID N0:1 es provista, la cual describe una secuencia de nucleótidos, y la secuencia de aminoácidos codificada por la misma, que comprende una TD del tipo silvestre de la Arabidopsis thaliana. Las SEC ID NOS : 2 y 3 describen secuencias de nucleótidos, y las secuencias de aminoácidos codificadas por la misma, que comprende las proteínas precursoras de diferentes longitudes. La SEC ID NO: 3 (véase también la Figura 6b) codifica un polipéptido quimérico o de fusión de 609 aminoácidos de los cuales 585 residuos de aminoácidos son codificados por la omr 1 mutante de la Arabidopsis. Es decir, la SEC ID NO: 3 codifica una TD mutante que es más corta que la TD mutante de longitud completa mostrada en la SEC ID NO: 2 por 7 residuos amino terminales. Puesto que las plantas transgénicas transformadas con pCM35s-omrl fueron capaces de expresar resistencia a la OMT, entonces el precursor truncado largo de 585 aminoácidos fue totalmente capaz de translocación desde el citoplasma hasta el cloroplasto. Las SEC ID NOS: 4, 5 y 6 describen las secuencias que comprenden tres proteínas maduras predichas. La SEC ID NO: 7 describe el sitio regulatorio putativo o supuesto de una enzima de TD mutada de la invención, y las SEC ID NOS: 8 y 9 describen regiones regulatorias que hospedan mutaciones de acuerdo con un aspecto de la invención. Se sobreentiende que la enzima de TD del tipo silvestre caracteriza la doble funcionalidad. Específicamente, la enzima de TD tiene un sitio catalítico el cual es dividido en regiones catalíticas de C1-C5, como se muestra con respecto a la enzima de TD del tomate análoga, y la enzima de TD del garbanzo en la Figura 2. El sitio catalítico cataliza la reacción de la treonina al 2-oxobutirato. La TD también tiene un sitio regulatorio el cual es dividido en regiones regulatorias R1-R7, como se muestra en la Figura 2. El sitio regulatorio es responsable de la inhibición de la retroalimentación la cual ocurre cuando el sitio regulatorio se une a un inhibidor, en este caso la isoleucina. La presente solicitud encuentra un uso ventajoso en una amplia variedad de plantas, así como en una amplia variedad de microorganismos. Con respecto a las plantas, es importante reconocer que la enzima de TD funciona en los cloroplastos, y, por lo tanto, que el polipéptido transcrito por lo tanto, es una proteína precursora la cual incluye una porción identificada aquí como una "secuencia directora de cloroplasto". Para los propósitos de la presente invención, el término "secuencia directora de cloroplastos" es utilizado intercambiablemente con el término "péptido de tránsito". La secuencia directora de cloroplasto está unida covalentamente a la "enzima madura" o "enzima pasajera". El término "proteína precursora" se entiende como un polipéptido que tiene un péptido de tránsito, unidos o fijados covalentemente entre sí. Típicamente, el extremo carboxi del péptido de tránsito está unido covalentamente al extremo amino del péptido pasajero. El péptido pasajero y el péptido de tránsito pueden ser codificados por el mismo sitio del gen, es decir, homólogos entre sí, de modo que los mismos sean codificados de una manera aislada desde una sola fuente. Alternativamente, el péptido de tránsito y el péptido pasajero pueden ser heterólogos entre sí, es decir, el péptido de tránsito y el péptido pasajero pueden ser de diferentes genes y/o diferentes organismos. Los términos "péptido de tránsito", "secuencia directora del cloroplasto", y "péptido de la señal" son utilizados intercambiablemente para designar aquellos aminoácidos que dirigen un péptido pasajero a un cloroplasto. Por "péptido maduro" o "péptido pasajero" se entiende un polipéptido el cual es encontrado después del procesamiento y en el paso hacia un organelo y el cual es funcional en el organelo para su propósito propuesto. Los péptidos pasajeros se hacen originalmente en una forma del precursor que incluye un péptido de tránsito y el péptido del pasajero. Durante la entrada en un organelo, la porción del péptido de tránsito es escindida, dejando por consiguiente el péptido "pasajero" o "maduro". Los péptidos pasajeros son los polipéptidos obtenidos típicamente durante la purificación desde un homogenato, la secuencia del cual puede ser determinada como se describió aquí. El péptido de tránsito puede ser derivado de las plantas monocotiledóneas o dicotiledóneas a elección del artesano. Las secuencias de ADN que codifican los péptidos de tránsito pueden ser obtenidos de las proteínas de cloroplastos tales como la ?-9 desaturasa, palmitoil-ACP tioesterasa, ß-KETOACYL-ACP sintasa, oleil-ACP tioesterasa, proteína de unión de la clorofila a/b, la gliceraldehido-3-fosfato deshidrogenasa dependiente de NADPH+, la proteína inducible con luz más inicial, la proteasa regulatoria de la proteasa de unión, la piruvato ortofosfato dicinasa, la proteína de unión de la clorofila a/b, el translocalizador de la triosa fosfato3-fosfoglicerato fosfato, 5-enol piruval shikimato-e-fosfato sintasa, dihidrofolato reductasa, timidilato sintasa, acetil-coenzima A carboxilasa, Cu/Zn superóxido dismutasa, cisteína sintasa, rubisco activasa, ferritina, sintasa de la fécula de unión de los granulos, pirofosfato, glutamina sintasa, aldolasa, glutation reductasa, nitrito reductasa, translocalizador de la 2-oxoglutarato/malato, ADP-glucosa pirofosforilasa, ferrodoxina, anhidrasa carbónica, polifenol oxidasa, ferrodoxin NADP= oxidoreductasa, platocianina, glicerol-3-fosfato deshidrogenasa, lipoxigenasa, o-acetilserina (tiol) -lisasa, proteína portadora de acilo, 3-desoxi-D-arabino-heptulosonato 7-fosfato sintasa, proteína de choque térmico localizada en el cloroplasto, fosforilasa de almidón, piruvato ortofosfato dicinasa, glicosiltransferasa de almidón, y semejantes, de los cuales la porción del péptido de tránsito ha sido definida en GenBank.

En las plantas, la secuencia directora del cloroplasto es utilizada para dirigir la proteína pasajera a los cloroplastos; sin embargo, los mismos son típicamente escindidos y degradados durante la entrada de la proteína pasajera en el organelo de interés. Por lo tanto, la purificación de un péptido de tránsito escindido desde los tejidos de las plantas típicamente no es posible. En algunos casos, sin embargo, las secuencias del péptido de transito pueden ser determinadas por la comparación de la secuencia de aminoácidos de la proteína precursora obtenida desde el gen que codifica el mismo hasta la secuencia de aminoácidos de la proteína pasajera aislada (proteína madura) . Además, las secuencias de la proteína pasajera también pueden ser determinadas de las proteínas del péptido de tránsito asociadas con la misma por la comparación de las secuencias con otras proteínas similares aisladas de las diferentes especies. Como se ejemplificó aquí, los genes que codifican las formas precursoras de la proteína de TD mutada, descrita como la SEC ID NO: 2 y la SEC ID NO: 3, cuando se comparan con el precursor del tipo silvestre y la proteína de TD madura de otras especies, puede establecer la secuencia esperada de la proteína madura. Como se describió previamente, la secuencia de aminoácidos y por consiguiente la secuencia de ácidos nucleicos de un péptido de tránsito pueden ser determinadas en una variedad de formas disponibles para el artesano experto. Por ejemplo, las proteína pasajeras de interés pueden ser purificadas utilizando una variedad de técnicas disponibles para la persona experta en la técnica de' la bioquímica de las proteínas. Una vez purificada, la secuencia amino terminal de la proteína puede ser determinada utilizando métodos tales como la degradación de Edman, la espectroscopia de masa, la espectroscopia magnética nuclear y semejantes. Utilizando esta información y el código genético, las técnicas de biología molecular estándares pueden ser empleadas para clonar el gen que codifica la proteína como se ejemplificó aquí. La comparación de la secuencia de aminoácidos determinada del ADNc con aquella obtenida de la secuencia amino terminal de la proteína pasajera puede permitir la determinación de la secuencia del péptido de tránsito. Además, muchas secuencias del péptido de tránsito están disponibles en la técnica y pueden ser obtenidas fácilmente de GenBank localizado en la Base de Datos Entrez en el sitio de la red del National Center for Biotechnology Information. El objetivo de las péptidos de tránsito en las plantas ha sido revisado extensamente por Keegstra et al., (1989) (Cell, 56:247-253), el cual es incorporado aquí para referencia. Típicamente, existe una homología de la secuencia de aminoácidos primaria muy pequeña entre los diferentes péptidos de tránsito de la planta. Aún cuando las proteínas pasajeras pueden tener similaridades de las secuencias de aminoácidos y ácidos nucleicos entre los cultivares, las líneas, y las especies, el péptido de tránsito puede mostrar una homología de la secuencia muy pequeña a cualquier nivel. Además, la longitud de los péptidos de tránsito puede variar, con algunas proteínas precursoras que comprenden las proteínas del péptido de tránsito con tan poco como aproximadamente 10 aminoácidos mientras que otras pueden ser de aproximadamente 150 aminoácidos o más largos. Las descripciones adicionales de las características del péptido de tránsito en las plantas y los mecanismos asociados con las mismas se pueden encontrar en Ko y Ko, (1992) J. Biol. Chem. 267, 13910-13916; Bascomb et al. (1992) Plant Microb. Biotechnol. Res. Ser. 1:142-163; y Bakau et al., (1996) Trends en Cell Biol. 6:480-486; las cuales son incorporadas aquí para referencia. A este respecto, los primeros 90 residuos de aminoácidos en la región N-terminal de la proteína de TD de Arabidopsis codificada por omr 1 (en la SEC ID NO: 2) representa una región esperada que comprende el péptido de tránsito, como está indicado por: (i) la disimilaridad con las proteínas de TD de la levadura, Salmonella y E. coli, (ii) la comparación de los tamaños de TD de Arabidopsis, tomate, garbanzo, levadura, Salmonella y E. coli, y (iii) la composición de aminoácidos la cual contiene 12 residuos de prolina y 33 de otros residuos hidrofóbicos que constituyen un total de 50% de los residuos hidrofóbicos. Por lo tanto, se espera que la TD pasajera/madura de la Arabidopsis sea codificada por el sitio omr 1, la escisión del péptido de tránsito puede ocurrir en el enlace del péptido entre la alanina en el residuo 90 y al ácido glutámico en el residuo 91, dejando debajo una TD pasajera/madura que empieza en el ácido glutámico en el residuo 91. Como tal, la SEC ID NO: 4 identifica una TD madura esperada para la Arabidopsis que empieza en el ácido glutámico en al residuo 91 de la SEC ID NO: 2 (clon 592) . Este polipéptido de TD maduro esperado comprende 502 residuos de aminoácidos secuenciales. Los dos únicos diferentes de los genes de TD de la planta más elevados que han sido clonados hasta la fecha, son aquellos del tomate (Samach A., Harven D., Gutfinger T., Ken-Dror S., Lifschitz E., 1991, Proc Nati Acad Sci EUA 88:2678-2682) y el garbanzo (Jacob John S., Srivastava V., Guha-Mukherjee S., 1995, Plant Physiol 107:1023-1024). Las longitudes de los péptidos de tránsito de la TD del tomate y la TD del garbanzo se predijo que van a ser los primeros 80 y 91 residuos amino terminales, respectivamente, y las proteínas precursoras de la longitud completa se reportaron que van a ser de 595 residuos y de 590 residuos, respectivamente (Samach et al., 1991; Jacob John et al., 1995). Tanto en el tomate como el garbanzo, la extremidad amino de la proteína de TD contuvo un péptido de tránsito de dos dominios típico, consistente con las secuencias de ubicación del blanco del lumen del cloroplasto (Keegstra K., Olsen L. J. , Theg S.M., 1989, Chloroplast precursors and their transport across the membrane. Annu Rev Plant Physiol Plant Mol Biol 40:471-501). En el tomate, el primer dominio en el amino-terminal (45 residuos) del péptido de tránsito fue rico en serina y treonina (33 %) mientras que la siguiente secuencia de 35 residuos contuvo 8 prolíneas espaciadas regularmente y otros residuos hidrofóbicos (Samach et al., 1991). Secuenciando los primeros diez residuos amino-terminales de una TD de tomate purificado a partir de las flores, Samach et al., (1991) encontraron que la lisina en el residuo 52 es el primer aminoácido en el extremo amino-terminal de la proteína pasajera/madura. De acuerdo con Samach et al., (1991), el dominio hidrofóbico del péptido de tránsito de la TD del tomate no es escindido y permanece como parte de la TD madura en los cloroplastos. Samach et al., (1991) también explicó que "es posible que solamente una fracción de la proteína de TD del tomate sea escindida en la posición 52, mientras que el resto del péptido de tránsito es escindido en cualquier parte y permanece refractario con respecto al secuenciamiento amino-terminal". En el garbanzo, el primer dominio en el extremo amino-terminal del péptido de tránsito se dedujo que va a ser de 45 residuos y rico en treonina y serina (37%) mientras que los 46 residuos restantes contuvieron 8 residuos de prolína espaciados regularmente y 19 de otros residuos hidrofóbicos (Jacob John et al., 1995). El sitio de escisión del péptido de tránsito de la TD del garbanzo no fue determinado. Por analogía con el tomate y el garbanzo, la TD de Arabidopsis también mostró un péptido de tránsito de dos dominios, típico, consistente con las secuencias de ubicación de blanco del lumen del cloroplasto (como se revisó por Keegstra et al., 1989). Los primeros 49 residuos del extremo amino terminal representaron un dominio que fue rico en serina y treonina (31%) y otros residuos hidrofílicos mientras que los 41 residuos restantes representaron un segundo dominio que contuvo 59% de los residuos hidrofóbicos. El sitio de escisión del péptido de tránsito de la TD de Arabidopsis no fue determinado. Por lo tanto, por analogía con el tomate, se espera que el sitio de escisión del péptido de tránsito de la TD de Arabidopsis puede iniciar alternativamente en la lisina en el residuo 54 o en la lisina en el residuo 61. Este es un sitio de escisión presumible y un experto en la técnica puede determinar fácilmente el sitio de escisión de un modo similar como en el caso del tomate (Samach et al., 1991) purificando la TD de Arabidopsis luego secuenciandp los primeros diez aminoácidos en el extremo amino-terminal. Por lo tanto, dos secuencias adicionales son provistas como las SEC ID NOS: 5 y 6 que identifican alternativamente dos TD maduras esperadas en la Arabidopsis. Está dentro del alcance de la presente invención crear polinucleótidos quiméricos que codifican las proteínas precursoras en donde un péptido de tránsito de elección está en el marco de lectura apropiado con la secuencia de codificación madura de la TD mutada. Cuando se utilicen aquí, los términos "polinucleótido quimérico", "construcción de ADN quimérico" y "ADN quimérico" son utilizadas para referirse al ADN recombinante.

En la creación de una construcción de ADN quimérico que codifica un péptido de tránsito como se describe aquí, el péptido de tránsito es heterólogo con respecto a la TD mutada, madura, el ADN que codifica el péptido de tránsito está en el lugar 5' y el marco de lectura apropiado con el ADN que codifica la proteína de TD mutada, madura. La colocación del ADN quimérico en la relación correcta con los elementos regulatorios promotores y otras secuencias como se describe aquí, pueden permitir la producción de las moléculas de ARNm que codifican las proteínas precursoras heterólogas. Por "elemento regulatorio del promotor" se entiende los elementos de la secuencia de nucleótidos dentro de una secuencia de nucleótidos la cual controla la expresión de esta secuencia de nucleótidos. Los elementos regulatorios promotores proporcionan la secuencia de ácido nucleico necesaria para el reconocimiento de la ARN polimerasa y otros factores transcripcionales requeridos para una transcripción eficiente. Los elementos regulatorios promotores se entiende que incluyen los promotores inducibles, específicos para el desarrollo, específicos para el tejido, constitutivos, y semejantes. Los elementos regulatorios del promotor también pueden incluir ciertos elementos de la secuencia mejoradora que mejoran la eficiencia transcripcional . El ARNm puede ser transladado entonces produciendo así una proteína precursora heteróloga funcional la cual puede ser suministrada al cloroplasto. Por supuesto, se sobreentiende que una construcción de ADN puede estar de acuerdo con la invención para incluir un promotor que es natural con respecto al gen de una especie seleccionada que codifica este polipéptido del precursor de TD de las especies'. La recepción de la proteína por el cloroplasto y la escisión del péptido de tránsito asociado puede conducir a un cloroplasto que contiene una forma mutada, madura, de la TD, haciendo así a la célula resistente a la inhibición de la retroalimentación lo cual podría inhibir normalmente las células que contienen solamente la proteína de TD del tipo silvestre. La presente invención, por lo tanto, proporciona, en los aspectos alternativos, una TD insensible a la retroalimentación que comprende la secuencia de aminoácidos descrita en la SEC ID NO: 2 o la SEC ID NO: 3 (polipéptidos precursores); descritos en la SEC ID NO: 4, la SEC ID NO: 5 o la SEC ID NO: 6 (excepto las enzimas de TD maduras esperadas); la SEC ID NO:7 (un sitio regulatorio de TD insensible) ; y descritos en la SEC ID NO: 8 (región regulatoria R4 ) o la SEC ID NO: 9 (región regulatoria R6) . La SEC ID NO: 7 o las variantes de la misma como se describieron anteriormente, pueden ser acopladas operativamente a una secuencia que codifica un sitio catalítico de TD desde una amplia variedad de especies, que incluyen una funcionalidad similar a las variantes de la misma, para proporcionar el resultado ventajoso de la invención. Se entiende fácilmente que, en el caso de la transformación de los procariotas, no es necesario incluir un péptido de tránsito en la región de codificación del vector. En lugar de esto, puesto que tales células no poseen cloroplastos, una construcción de ADN inventivo para transformar, por ejemplo, las bacterias, se puede hacer simplemente fijando un codón de partida directamente a, y en el marco de lectura apropiado con, un péptido maduro. Por supuesto, otros elementos están presentes preferentemente como se describió aquí, tales como un promotor corriente arriba del codón de parada y una secuencia de terminación corriente abajo de la región de codificación. Las SEC ID NOS : 8 y 9 también pueden ser acopladas operativamente a una amplia variedad de secuencias para proporcionar enzimas de TD insensibles, y por lo tanto comprenden ciertos aspectos preferidos de la invención. Las substituciones que ocasionan secuencias de aminoácidos similares, como se describe aquí, son particularmente aplicables a la SEC ID NO: 8, y lo siguiente describe una pluralidad de secuencias alternativas preferidas particularmente para la SEC ID NO: 8 de acuerdo con la invención: Vai/Leu/Phe/Ile Asn/Asp/Glu/Ser Leu/Ile/Phe/Val/Gly Thr/Ser/Ala/Gly Thr/His/Asp/Asn Ser/Asn/Asp/Ile Aso/Glu Leu/Met Val/Ala Lys/Val/Ala Asp/Ile/Glu/Ser His Leu/Gly/Ile/Vai Cys Tvr/His Leu/Met Met/Val Gly Gly La invención también abarca por lo tanto las secuencias de aminoácidos similares a las secuencias de aminoácidos descritas aquí que tienen al menos aproximadamente 50% de identidad con la misma y que son insensibles a la inhibición de la retroalimentación por la He. Preferentemente, las secuencias de aminoácidos de la invención tienen al menos aproximadamente 75% de identidad con estas secuencias, más preferentemente al menos aproximadamente 85% de identidad y aún más preferentemente al menos aproximadamente 95% de identidad. La identidad porcentual puede ser determinada, por ejemplo, comparando la información de • la secuencia utilizando el programa de computadora GAP, versión 6.0, disponible de la University of Wisconsin Genetics Computer Group (UWGCG) . El programa GAP utiliza el método de alineamiento de Needleman y Wunsch (J. Mol. Biol. 48:443, 1970), como se revisó por Smith y Waterman (Adv.

Appl. Math. 2:482,1981). Brevemente, el programa GAP define la identidad como el número de símbolos alineados (es decir, los nucleótidos o aminoácidos) los cuales son los mismos, divididos entre el número total de símbolos en la más corta de las dos secuencias. Los parámetros de falla preferidos para el programa de GAP incluyen: (1) una matriz de comparación unitaria (que contiene un valor de 1 para las identidades y de 0 para las no identidades), y la matriz de comparación ponderada de Gribskov y Burgess, Nucí. Acids Res. 14:6745, 1986, como se describe por Schwartz y Dayhoff, eds . , Atlas of Protein Sequence and Structure, National Biomedical Research Foundation, pp. 353-358, 1979; (2) una penalidad de 3.0 para cada vacío y una penalidad de 0.10 adicional para cada símbolo en cada hueco; y (3) ninguna penalidad para los huecos finales. La invención también contempla las secuencias de aminoácidos que tienen mutaciones alternativas a aquellas identificadas aquí las cuales podrían conducir a una TD insensible a la retroalimentación. Por ejemplo, se espera que la cys en la posición 499 y la his en la posición 544 en la SEC ID NO: 2 podrían ser substituidas con aminoácidos alternativos desde el mismo grupo de aminoácidos que cys y his, respectivamente (como se describió anteriormente) para proporcionar una enzima inventiva alternativa. Además, están bien adentro del punto de vista de una persona experta en la técnica diseñar una TD insensible a la retroalimentación proporcionando una TD del tipo silvestre y substituir un aminoácido altamente conservado en una localización dada en el sitio regulatorio con un aminoácido diverso (es decir, uno de un grupo de aminoácido diferente) , y ensayar la enzima resultante para verificar la actividad catalítica y la sensibilidad de la retroalimentación. Por ejemplo, un artesano experto puede alterar la secuencia de nucleótidos descrita en la SEC ID NO:l por la mutagénesis dirigida al sitio para proporcionar una secuencia mutada la cual codifica una enzima que tiene un aminoácido alternativo en una localización dada de la enzima. Alternativamente, un artesano experto puede sintetizar una secuencia de aminoácidos que tiene una o más adiciones, substituciones y/o deleciones en un sitio altamente conservado de la enzima de TD del tipo silvestre utilizando técnicas bien conocidas en el arte. Tales variantes, las cuales exhiben una funcionalidad substancialmente similar a un polipéptido que comprende las secuencias descritas en la SEC ID NO: 2, están incluidas dentro del alcance de la presente invención. Pasando ahora a las secuencias de nucleótidos que codifican las enzimas de TD insensibles de la invención, las secuencias de nucleótidos que codifican la TD precursora insensible a la retroalimentación, preferida, de las especies de Arabidopsis thaliana se describen en las SEC ID NOS : 2 y 3 de aquí. Los polinucleótidos mutados descritos allí son referidos como omrl . El omrl se encontró que va a ser un alelo dominante, impartiendo esto un valor significativo a la invención. Por supuesto que no está propuesto que la presente invención sea limitada a esta secuencia de nucleótidos ejemplar, sino que incluya secuencias que tienen una identidad substancial con la misma y las secuencias que codifican las formas variantes de la TD insensible como se describieron anteriormente. El término "secuencias de nucleótidos", como se utiliza aquí, está propuesto para referirse a una arreglo secuencial y lineal natural o sintético de nucleótidos y/o nucleósidos, y derivados de los mismos. Los términos "que codifica" y "codifica" se refieren al proceso por el cual una secuencia de nucleótidos, por medio de los mecanismos de transcripción y translación, proporciona la información a una célula a partir de la cual una serie de aminoácidos puede ser ensamblada en una secuencia de aminoácidos específica para producir un polipéptido funcional, tal como, por ejemplo, una enzima activa. El proceso de codificación de una secuencia de aminoácidos específica puede involucrar las secuencias de ADN que tienen uno o más cambios básicos (es decir, inserciones, deleciones, substituciones) que no provocan un cambio en el aminoácido codificado, o los cuales involucran cambios básicos los cuales pueden alterar uno o más aminoácidos, pero no eliminan las propiedades funcionales del polipéptido codificado por la secuencia de ADN. Por lo tanto se entiende que la invención abarca más de la secuencia de nucleótidos ejemplar específica de omr 1. Por ejemplo, una secuencia de ácido nucleico que codifica una secuencia de aminoácidos variable, como se describió anteriormente, está dentro del alcance de la invención. Las modificaciones a una secuencia, tales como deleciones, inserciones, o substituciones en la secuencia que producen cambios "silenciosos" que no afectan substancialmente las propiedades funcionales de la molécula del polipéptido resultante, son contempladas expresamente por la presente invención. Por ejemplo, se sobreentiende que las alteraciones en una secuencia de nucleótidos la cual refleja la degeneración del código genético, o la cual conduce a la producción de un aminoácido equivalente químicamente en un sitio dado, están contemplados. Por consiguiente, un codón para la alanina del aminoácido, un aminoácido hidrofóbico, puede ser substituido por un codón que codifica otro residuo menos hidrofóbico, tal como la glicina, o un residuo más hidrofóbico, tal como la valina, leucina, o isoleucina. De manera similar, los cambios que conducen a la substitución de un residuo cargado negativamente por otro, tal como el ácido aspártico por el ácido glutámico, o un residuo cargado positivamente por otro, tal como la lisina por la arginina, también se puede esperar que produzca un producto equivalente biológicamente. Los cambios de nucleótidos que conducen a una alteración de las porciones N-terminal y C-terminal de la molécula del polipéptido tampoco se podría esperar que alteren la actividad del polipéptido. En algunos casos, puede ser deseable en efecto hacer mutaciones en la secuencia para estudiar el efecto de la alteración sobre la actividad biológica del polipéptido. Cada una de las modificaciones propuestas está bien adentro de la experiencia rutinaria en la técnica. En un aspecto preferido, por lo tanto, la presente invención contempla secuencias de nucleótidos que tienen una identidad substancial con respecto a las secuencias descritas aquí y las variantes de las mismas que se describieron aquí. El término "identidad substancial" es utilizado aquí con respecto a una secuencia de nucleótidos para designar que la secuencia de nucleótidos tenga una secuencia suficientemente similar a una secuencia de nucleótidos de referencia que se hibridizará con la misma bajo condiciones moderadamente estrictas, este método de determinación de la identidad es bien conocido en la técnica a la cual pertenece la invención. Brevemente, las condiciones moderadamente estrictas son definidas en Sambrook et al., Molecular Cloning: a Laboratory Manual, 2/a. ed., Vol. 1, pp. 101-104, Cold Spring Harbor Laboratory Press (1989) como incluyendo el uso de una solución de prelavado de 5 x SSC, 0.5% SDS, 1.0 mM EDTA (pH 8.0) y las condiciones de hibridación y lavado de aproximadamente 55 °C, 5 x SSC. Un requerimiento adicional de una variante de polinucleótido de la invención es que la misma debe codificar un polipéptido que tiene una funcionalidad similar a las enzimas de TD mutadas específicas recitadas aquí, es decir, una buena funcionalidad catalítica e insensibilidad a la inhibición de la retroalimentación. Una secuencia de ADN adecuada, seleccionada para su uso de acuerdo con la invención puede ser obtenida, por ejemplo, por técnicas de clonación que utilizan las bibliotecas de ADNc que corresponden a una amplia variedad de especies, estas técnicas son bien conocidas en la técnica relevante. Las secuencias de nucleótidas adecuadas pueden ser aisladas de las bibliotecas de ADN obtenidas de una amplia variedad de especies por medio de la hibridación del ácido nucleico o PCR, utilizando como sondas de hibridación o las secuencias de nucleótidos de los cebadores seleccionadas de acuerdo con la invención, tales como aquellas descritas en las SEC ID NOS: 1-10; las secuencias de nucleótidos que tienen una identidad substancial con la misma; o porciones de la misma. Las secuencias del tipo silvestre aisladas que codifican la TD pueden ser alteradas entonces como se provea por la presente invención, por la mutagénesis dirigida al sitio. Alternativamente, una secuencia adecuada se puede hacer por técnicas las cuales son bien conocidas en la técnica. Por ejemplo, las secuencias de ácido nucleico que codifican las enzimas de la invención pueden ser construidas utilizando la tecnología del ADN recombinante estándar, por ejemplo, cortando o dividiendo los ácidos nucleicos los cuales codifican las citocinas y/u otros péptidos utilizando las enzimas de restricción y la ligasa del ADN. Alternativamente, las secuencias del ácido nucleico pueden ser construidas utilizando la síntesis química, tal como la tecnología de fosforamidato de fase sólida. En las modalidades preferidas de la invención, la reacción en cadena de la polimerasa (PCR) es utilizada para efectuar la separación o división de las secuencias del ácido nucleico por la extensión de superposición como se conoce en la técnica. Las secuencias de ADN de la invención pueden ser incorporadas en el genoma de una planta o microorganismo utilizando la tecnología de ADN recombinante convencional, haciendo por lo tanto una planta o microorganismo transformado que tiene las excelentes características descritas aquí. A este respecto, el término "genoma" como es utilizado aquí, está propuesto para referirse al ADN el cual está presente en una planta o microorganismo y el cual es heredable por la progenie durante la propagación de la misma. Como tal, una planta o microorganismo transformado de la invención puede ser producido alternativamente produciendo Fl o una progenie de una generación más elevada de una planta o microorganismo transformado directamente, en donde la progenie comprende la secuencia de nucleótidos extraña. Las plantas o microorganismos transformados y la progenie de los mismos son todos contemplados por la invención y todos están propuestos para caer directamente dentro del significado de los término "planta transformada" y "microorganismo transformado" . De esta manera, la presente invención contempla el uso de las plantas transformadas las cuales son purificadas para producir una planta endogámica. La planta endogámica produce semillas que contienen el gen de interés. Estas semillas se pueden hacer crecer para producir plantas que expresan la proteína de interés. Las líneas endogámicas también pueden ser cruzadas con otras líneas endogámicas para producir híbridos. Las partes obtenidas de la planta regenerada, tales como las flores, semillas, hojas, ramas, fruta, y semejantes, sean recuperadas por la invención siempre que las partes contengan genes que codifican yo expresan la proteína de interés. La progenie y las variantes, y los mutantes de las plantas regeneradas también son incluidas dentro del alcance de la invención. En plantas diploides, típicamente un padre puede ser transformado y el otro padre es del tipo silvestre. Después de cruzar a los padres, los híbridos de la primera generación (Fl) son purificados para producir los híbridos de la segunda generación (F2) . Aquellas plantas que exhiben los niveles más elevados de la expresión pueden ser elegidas entonces para multiplicación adicional. Los genes que codifican los polipéptidos de TD mutados del precursor, como se describieron aquí como la SEC ID NO:2 y la SEC ID NO:3, pueden ser utilizados en conjunción con otros elementos regulatorios de las plantas para crear células vegetales que expresan los polipéptidos. Por "expresión" como se utiliza aquí, se entiende la transcripción y la acumulación estable del ARNm dentro de una célula, la célula es de un origen procariótico o eucariótico. Además, está dentro del alcance de la invención colocar la TD madura mutada de Arabidopsis en otras especies que incluyen plantas monocotiledóneas y dicotiledóneas. Haciéndolo así, las construcciones del gen quimérico que codifican las proteínas de TD mutadas, maduras, que tienen péptidos de tránsito heterólogos para la misma (péptidos de tránsito de una proteína o especie diferente) pueden ser utilizados. Los péptidos de tránsito de la presente invención, cuando se fijan covalentamente a la proteína mutada, madura, pueden proporcionar un transporte intracelular al cloroplasto. En las plantas, una forma madura mutada de la TD encontrada en un cloroplasto de una célula hace a la célula resistente a la inhibición de la retroalimentación y con resistencia a los análogos estructurales de He. En general, la transformación de una planta o microorganismo involucra la inserción de la secuencia de ADN en un vector de expresión en la orientación apropiada y el marco de lectura correcto. El vector puede contener deseablemente los elementos necesarios para la transcripción de la secuencia de codificación del polipéptido insertada. Una amplia variedad de sistemas del vector conocidos en la técnica pueden ser utilizados ventajosamente de acuerdo con la invención, tales como los plásmidos, los virus bacteriófagos u otros virus modificados. Los vectores adecuados incluyen, pero no están limitados a los siguientes vectores virales: sistemas gtll, gtlO, Charon 4 del vector lambda y los vectores del plásmido tales como pBH21, pBR322, pACYC177, pACYC184, series PAR, pKK223-3, pUC8, pUC9, pUC18, pUC19, pLG339, pRK290, pKC37, pKClOl, pCDNAII, y otros sistemas similares. Las secuencias de ADN pueden ser clonadas en el vector utilizando los procedimientos de clonación estándares en la técnica, por ejemplo, como se describe por Maniatis et al., Molecular Cloning: a Laboratory Manual, Cold Springs Laboratory, Cold Springs Harbor, New York (1982), el cual es incorporado aquí para referencia en su totalidad. El plásmido pBI121 está disponible de Clontech Laboratories, Palo Alto, California. Se sobreentiende que las técnicas conocidas pueden ser utilizadas ventajosamente de acuerdo con la invención para transformar los microorganismos tales como, por ejemplo, Agrobacterium sp., levadura, E. coli y Pseudomonas sp.

Para obtener la expresión satisfactoria de una secuencia de nucleótidos que codifica una TD insensible a la retroalimentación de la invención en una planta o microorganismo, se prefiere que un promotor esté presente en el vector de expresión. El promotor es preferentemente un promotor constitutivo, pero puede ser alternativamente un promotor específico para el tejido o un promotor inducible. Preferentemente, el promotor es uno aislado de un gen natural que codifica una TD. Aunque los promotores para ciertas clases de genes difieren comúnmente entre las especies, se sobreentiende que la presente invención incluye los promotores que regulan la expresión de una amplia variedad de genes en una amplia variedad de especies de plantas o microorganismos. Un vector de expresión de acuerdo con la invención puede ser producido ya sea natural o artificialmente a partir de las partes derivadas de las fuentes heterólogas, tales partes pueden estar presentes en forma natural o sintetizadas químicamente, y en donde las partes han sido unidas por ligamiento u otros medios conocidos en la técnica. La secuencia de codificación introducida está preferentemente bajo el control del promotor y por consiguiente generalmente estará corriente abajo desde el promotor. Establecido alternativamente, la secuencia promotora generalmente estará corriente arriba (es decir, en el extremo 5' ) de la secuencia de codificación. La frase "bajo el control de" contempla la presencia de tales otros elementos que pueda ser necesario para lograr la transcripción de la secuencia introducida. Como tal, en un ejemplo representativo, la producción mejorada de una TD insensible a la retroalimentación puede ser lograda insertando una secuencia de nucleótidos de la invención en un vector corriente abajo desde y enlazado operativamente a una secuencia promotora capaz de impulsar la expresión en una célula huésped. Dos secuencias de ADN (tales como una secuencia de una región promotora y una secuencia de nucleótidos que codifica la TD, insensible a la retroalimentación) se dice que van a estar enlazadas operativamente si la naturaleza del enlace entre las dos secuencias de ADN no (1) conduce a la introducción de una mutación de desplazamiento del marco, (2) interfiere con la capacidad de la secuencia de la región promotora para dirigir la transcripción de la secuencia de nucleótidos deseada, o (3) interfiere con la capacidad de la secuencia de nucleótidos deseada que va a ser transcrita por la secuencia de la región promotora. La polimerasa de ARN normalmente se une al promotor e inicia la transcripción de una secuencia de ADN o un grupo de secuencias de ADN enlazadas y elementos regulatorios (operon) . Un transgen, tal como una secuencia de nucleótidos seleccionada de acuerdo con la presente invención, es expresada en una célula transformada para producir en la célula un polipéptido codificado por el mismo. Brevemente, la transcripción de la secuencia de ADN es iniciada por la unión de la ARN polimerasa a la región promotora de la secuencia del ADN. Durante la transcripción, el movimiento de la ARN polimerasa a lo largo de la secuencia del ADN forma el ARN mensajero ("ARNm") y, como resultado, la secuencia del ADN es transcrita en un ARNm correspondiente. Este ARNm se mueve entonces a los ribosomas del citoplasma o el retículo endoplásmico áspero el cual, con el ARN de transferencia ("ARNt") , translada el ARNm hacia el polipéptido codificado por el mismo. Se sabe bien que pueden existir o no existir otros elementos regulatorios (por ejemplo, secuencias mej oradoras) las cuales cooperan con el promotor y un sitio de inicio transcripcional para lograr la transcripción de la secuencia de codificación introducida (es decir, extraña) . Por "mejorador" se entiende elementos de la secuencia de nucleótidos la cual puede estimular la actividad del promotor en una célula tal como aquellas encontradas en las plantas como se ejemplificó por la secuencia directora del virus de la línea del maíz (MSV) , el intrón 1 de la alcohol deshidrogenasa, y semejantes. También, el ADN recombinante incluirá preferentemente una secuencia de terminación transcripcional corriente abajo de la secuencia introducida. Puede ser deseable utilizar un gen reportero. En algunos casos, un gen reportero puede ser utilizado con o sin un marcador seleccionable. Los genes reporteros son los genes los cuales típicamente no están presentes en el organismo o tejido del receptor y típicamente codifican las proteínas que conducen a un cambio fenotípico o a una propiedad enzimática. Los ejemplos de tales genes se proporcionan en K. Wising et al. (1988) Ann. Rev. Genetics, 22:421, la cual es incorporada aquí para referencia. Los genes reporteros preferidos incluyen la beta-glucuronidasa (GUS) del sitio uidA del E. coli, la proteína fluorescente verde de la Aequorea victoria de la medusa bioluminiscente, y los genes de luciferasa de la P otinus pyralis de la luciérnaga. Un ensayo para detectar la expresión del gen reportero puede ser efectuado entonces en un tiempo adecuado después que el gen ha sido introducido en las células receptoras. Un ensayo preferido de tales ensayos abarca el uso del gen que codifica la beta-glucuronidasa (GUS) del sitio uidA del E. coli, como se describe por Jefferson et al., (1987 Biochem. Soc. Trans. 15, 17-19) para identificar las células transformadas. Los elementos reguladores del promotor de la planta desde una amplia variedad de fuentes pueden ser utilizados eficientemente en las células vegetales para expresar genes extraños. Por ejemplo, los elementos regulatorios del promotor de origen bacteriano, tales como el promotor de la octipina sintasa, el promotor de la nopalina sintasa, el promotor de la manopina sintasa, y los promotores de origen viral, tales como el virus de mosaico de la coliflor (35S y 19S), 35T (el cual es un promotor de 35S rediseñado, WO 97/13402 publicada el 17 de abril de 1997) y semejantes, pueden ser utilizados. Los elementos regulatorios del promotor de la planta incluyen, pero no están limitados a, la subunidad pequeña (ssu) de la tibulosa-1, 5-bisfosfato (RUBP) carboxilasa, el promotor de beta-conglicinina, el promotor de beta-faseolin, el promotor de ADH, los promotores del choque térmico, y los promotores específicos para el tejido. Otros elementos tales como las regiones de fijación de la matriz, las regiones de fijación en forma de andamio, los intrones, los mejoradores, las secuencias de poliadenilación, y semejantes, pueden estar presentes y por consiguiente pueden mejorar la eficiencia de la transcripción o la integración del ADN. Tales elementos pueden o no pueden ser necesarios para la función del ADN, aunque los mismos pueden proporcionar una mejor expresión o funcionamiento del ADN afectando la transcripción, la estabilidad de ARNm, y semejantes. Tales elementos pueden ser incluidos en el ADN cuando se desee para obtener un funcionamiento óptimo del ADN transformado en la planta. Los elementos típicos incluyen, pero no están limitados a, Adh-intrón 1, Adh-intrón 6, la secuencia directora de la proteína de recubrimiento del virus de mosaico de la alfalfa, la secuencia directora de la proteína de recubrimiento del virus de la línea del maíz, así como otros valiosos para el experto en la técnica. Los elementos regulatorios del promotor, constitutivos, pueden ser utilizados, por lo cual se dirige la expresión del gen continua en todos los tipos de células en cualquier instante (por ejemplo, la actina, ubiquitina, CaMV 35S, y semejantes) . Los elementos regulatorios del promotor específico del tejido son responsables de la expresión del gen en los tipos de célula o tejido específicos, tales como las hojas o las semillas (por ejemplo, la zeína, oleosina, napina, ACP, globulina, y semejantes) y estos pueden ser utilizados alternativamente .

Los elementos regulatorios del promotor también pueden ser activos durante una cierta etapa del desarrollo de la pianta así como activos en los tejidos y órganos de la planta. Los ejemplos de tales elementos incluyen, pero no están limitados a, elementos regulatorios del promotor específico para el polen, específico para el embrión, específico para la seda maíz, específicos para la fibra del algodón, específicos para la raíz, específicos para el endosperma de la semilla, y semejantes. Bajo ciertas circunstancias, puede ser deseable utilizar un elemento regulatorio del promotor inducible, el cual es responsable de la expresión de los genes en respuesta a una señal específica, tal como, por ejemplo, un estímulo físico (genes del choque térmico) , la luz (RUBP carboxilasa), las hormonas (Em), los metabolitos, las substancias químicas y la tensión. Otros elementos de transcripción y translación deseables que funcionan en las plantas también pueden ser utilizados*. Numerosos vectores de transferencia del gen, específicos para la planta son conocidos en la técnica. Una vez que la construcción de ADN de la presente invención ha sido clonada en un vector de expresión, la misma puede ser transformada entonces en una célula huésped. Además de numerosas tecnologías para transformar las plantas, el tipo de tejido el cual se pone en contacto con los polinucleótidos extraños puede variar también. El tejido de las plantas adecuado para la transformación de una planta de acuerdo con ciertos aspectos preferidos de la invención incluye, por ejemplo, las plantas completas, los tejidos de las hojas, los botones de las flores, los tejidos de las raíces, los tipos I, II y III del tejido calloso, el tejido embriogénico, los meristemas, los protoplastos, los hipocotilos y los cotiledones. Se sobreentiende, sin embargo, que esta lista no está propuesta para ser limitativa, sino solamente proporcionar ejemplos de los tejidos de las plantas los cuales pueden ser transformados ventajosamente de acuerdo con la presente invención. Una amplia variedad de tejidos de las plantas pueden ser transformados durante la diferenciación utilizando las técnicas apropiadas descritas aquí. La transformación de una planta o microorganismo puede ser lograda utilizando una de una amplia variedad de las técnicas conocidas en el arte. La manera en la cual la unidad transcripcional es introducida en el huésped de la planta no es crítica para la invención. Cualquier método que proporciona una transformación eficiente puede ser empleada. Una técnica de transformación de las plantas con una construcción de ADN de acuerdo con la presente invención es poniendo en contacto el tejido de tales plantas con un inoculo de las bacterias transformado con un vector que comprende la construcción de ADN. En general, este procedimiento involucra la inoculación del tejido de la planta con una suspensión de bacterias e incubar el tejido durante aproximadamente 48 hasta aproximadamente 72 horas sobre el medio de regeneración sin antibióticos a aproximadamente 25-28 °C. Las bacterias del género Agrobacterium pueden ser utilizadas ventajosamente para transformar las células vegetales. Las especies adecuadas de tales bacterias incluyen Agrobacterium tumefaciens y Agrobacterium rhizogenes. El Agrobacterium tumafaciens (por ejemplo, las cepas LBAA4404 o EHA105) es particularmente útil debido a su capacidad bien conocida para transformar las plantas. Otra técnica la cual puede ser utilizada ventajosamente es la infiltración al vacío de los botones de las flores utilizando los vectores a base de Agrobacterium. Varios métodos para la transformación de la planta incluyen el uso de los plásmidos Ti o Ir y semejantes para efectuar la transformación mediada por Agrobacterium. En muchos casos, es deseable tener la construcción utilizada para la transformación limitada sobre uno o ambos lados por las fronteras o límites de T-ADN, más específicamente la frontera o límite derecho.

Esto es particularmente útil cuando la construcción utiliza el Agrobacterium tumefaciens o el Agrobacterium rhizogenes como un modo para la transformación, aunque los límites o fronteras de T-ADN pueden encontrar uso con otros modos de transformación. En donde el Agrobacterium es utilizado para la transformación de la planta, un vector puede ser utilizado, el cual puede ser introducido en el huésped para la recombinación homologa con el T-ADN o el plásmido de Ti o Ri presente en el huésped. La introducción del vector puede ser efectuada por medio de electroporación, correspondencia o igualación tri-parental u otras técnicas para transformar las bacterias gram-negativas las cuales son conocidas por aquellos expertos en la técnica. La manera de la transformación del vector en el huésped de Agrobacterium no es crítica para la invención. En algunos casos en donde el Agrobacterium es utilizado para la transformación, la construcción de la expresión que es dentro de los límites o fronteras de T-ADN será insertada en un vector de espectro amplio tal como pRK2 o derivados de los mismos como se describe en Ditta et al. (PNAS USA (1980) 77:7347-7351 y EPO 0 120 515), los cuales son incorporados aquí para referencia. Las explantas pueden ser combinadas e incubadas con el Agrobacterium transformado durante un período de tiempo suficiente para permitir la transformación de las mismas. Después de la transformación, las Agrobacterias y las células vegetales son cultivadas con el medio selectivo apropiado. Una vez que se forman ramificaciones, la formación de brotes puede ser estimulada empleando las hormonas de las plantas apropiadas de acuerdo con los métodos bien conocidos en la técnica del cultivo de tejidos de las plantas y la regeneración de las plantas. Sin embargo, una etapa intermedia de renuevos no es siempre necesaria. Después de la formación de los brotes, las células de la planta pueden ser transferidas a un medio el cual estimula la formación de las raíces por lo cual se completa la regeneración de la planta. Las plantas se pueden hacer crecer entonces hasta obtener semillas y las semillas pueden ser utilizadas para establecer generaciones futuras. Sin importar la técnica de la transformación, el polinucleótido de interés es incorporado preferentemente en un vector de transferencia adaptado para expresar el polinucleótido en una célula vegetal incluyendo en el vector un elemento regulatorio del promotor de la planta, así como las regiones de terminación transcripcional no transladadas en 3' tales como Nos y semejantes. Los sistemas de base viral de ARN de la planta también pueden ser utilizados para expresar los genes para los propósitos descritos aquí. Haciéndolo así, los genes quiméricos de interés pueden ser insertados en las regiones del promotor de recubrimiento de un virus de la planta adecuado bajo el control de un promotor subgenómico el cual infectará la planta huésped de interés. Los sistemas de base viral del ARN de la planta se describen, por ejemplo, en las Patentes U.S. Nos. 5,550,360; 5,316,931 y 5,589,367, cada una de las cuales es incorporada aquí por el presente para referencia en su totalidad. Otro enfoque para transformar las células vegetales con una secuencia de ADN seleccionada de acuerdo con la presente invención, involucra la propulsión de partículas activas biológicamente o inertes en las células o tejidos de la planta. Esta técnica se describe en las patentes U.S. Nos. 4,945,050, 5,036,006 y 5,100,792, todas de Sanford et al., las cuales son incorporadas aquí para referencia. En general, este procedimiento involucra la propulsión de partículas activas biológicamente o inertes en las células bajo condiciones efectivas para penetrar la superficie externa de la célula y para ser incorporados dentro del interior de la misma. Cuando las partículas inertes son utilizadas, el vector puede ser introducido en la célula recubriendo las partículas con el vector.

Alternativamente, la célula de blanco u objetivo puede estar rodeada por el vector de modo que el vector sea llevado en la célula por la estela de la partícula. Las partículas activas biológicamente (por ejemplo, las células de levadura secas, las bacterias secas o un bacteriófago, cada uno conteniendo el material de ADN que se desea que sea introducido) también pueden ser propulsadas hacia las células vegetales. No está propuesto, sin embargo, que la presente invención esté limitada por la selección del vector o la célula huésped. Se debe entender por supuesto que no todos los vectores y las secuencias de control de la invención funcionarán igualmente bien para expresar las secuencias de ADN de esta invención. Ni todos los huéspedes funcionarán igualmente bien con el mismo sistema de expresión del vector. Sin embargo, una persona con experiencia en la técnica puede hacer una selección entre los vectores, las secuencias de control de la expresión, y los huéspedes sin la experimentación indebida y sin apartarse del alcance de esta invención. Una construcción del ADN aislada seleccionada de acuerdo con la presente invención puede ser utilizada en un vector de expresión para transformar una amplia variedad de plantas, incluyendo monocotiledóneas y dicotiledóneas. La invención encuentra un uso ventajoso, por ejemplo, en la transformación de las siguientes plantas; arroz, trigo, cebada, centeno, maíz, papa, zanahoria, camote, frijol, arveja, achicoria, lechuga, col, coliflor, brócoli, nabo, rábano, espinaca, espárrago, cebolla, ajo, berenjena, pimienta, apio, chayóte, calabaza, calabacín, pepino, manzana, pera, membrillo, melón, ciruela, cereza, durazno, melocotón, albaricoque, fresa, uva, frambuesa, zarzamora, pina, aguacate, papaya, mango, banana, soya, tabaco, tomate, sorgo y caña de azúcar. La literatura adicional que describe la transformación de las plantas y/o los microorganismos incluye las siguientes, cada una de las cuales es incorporada aquí en su totalidad: Zhijian Li et al. "A Sulfonylurea Herbicide Resistance Gene from Arabidopsis thaliana as a New Selectable Marker for Production of Fertile Transgenic Rice Plants" Plant Physiol. 100, 662-668 (1992); Parsons et al. (1997) Proc. Nati. Acad. Sci. EUA 84:4161-4165; Daboussi et al. (1989) Curr. Genet. 15:453-456; Leung et al. (1990) Curr. Genet. 17:409-411; Kóetter et al., "Isolation and characterization of the Pichia stipitis xylitol dehydrogenase gene, XYL2, and construction of a xylose-utilizing Saccharomices cerevisiae transformant", Curr. Genet., 18:493-500 (1990); Strasser et al., "Cloning of yeast xylose reductase and xylitol dehydrogenase genes and their use", solicitud de patente alemana (1990); Hallborn et al., "Xylitol production by recombinant Saccharomyces cerevisiae", Bio. /Technol. , 9:1090 (1991); Becker and Guarente, "High efficiency transformation of yeast by electroporation", Methods in Enzymol. 194:182-186 (1991); Ammerer, "Expression of genes in yeast using the ADC1 promoter", Methods in Enzymol. 101:192-201 (1983); Sarthy et al., "Expression of the E. coli xylose isomerase gene in S. cerevisiae", Appl. Environ.Microb. , 53:1996-2000 (1987); Patentes U.S. Nos. 4,945,050, 5,141,131, 5,177,010, 5,104,310, 5,149,645, 5,469,976, 5,464,763, 4,940,838, 4,693,976, 5,591,616, 5,231,019, 5,463,174, 4,762,785, 5,004,863, 5,159,135, 5,302,523, 5,464,765, 5,472,869, 5,384,253; Solicitudes de Patente Europea Nos. 0131624B1, 120516, 159418B1, 176112, 116718, 290799, 320500, 604662, 627752, 0267159, 0292435; WO 87/06614; WO 92/09696; y WO 93/21335. Aquellos expertos en la técnica reconocerán las ventajas comerciales y agrícolas inherentes en las plantas transformadas para expresar la TD insensible a la retroalimentación. Tales plantas tienen la capacidad mejorada de sintetizar la He y, por lo tanto, se espera que sean más valiosas nutricionalmente, comparado con una planta no transformada correspondiente. Además, ciertos compuestos intermedios de la ruta biosintética de la He tienen un valor comercial significativo, y la producción de estos compuestos intermedios es incrementada ventajosamente en un transformante de acuerdo con la invención. Por ejemplo, el 2-oxobutirato, el producto de la reacción de la reacción catalizada por TD, se sabe que va a ser un precursor para la producción del polihidroxibutirato en las plantas que han sido diseñadas genéticamente utilizando las técnicas conocidas en el arte para incluir los genes bacterianos necesarios para producir el polihidroxibutirato. El polihidroxibutirato es un biopolímero deseado en la industria del plástico a causa de que el mismo puede ser degradado biológicamente. A causa de que las plantas y los . microorganismos transformados de acuerdo con la invención caracterizan la producción incrementada del 2-oxobutirato, tales plantas y/o microorganismos pueden ser utilizados ventajosamente por los fabricantes del plástico de esta manera. Por ejemplo, las plantas que sobreproducen el 2-oxobutirato podrían ser ideales para el diseño metabólico por los genes bacterianos para la producción del polihidroxibutirato a causa de que la sobreproducción del 2-oxobutirato podría proporcionar una abundancia del substrato por la ruta tanto biosintética de la He natural como la ruta del polihidroxibutirato diseñado.

Quizás la ventaja más significativa de la presente invención es que una secuencia de nucleótidos de la invención puede ser utilizada en un vector de expresión como un marcador seleccionable. En este aspecto de la invención, una secuencia de nucleótidos de la invención es incorporada en un vector tal como el mismo es expresado en una célula transformado por el mismo, en compañía de una segunda secuencia de nucleótidos preseleccionada (es decir, la secuencia primaria) la cual se desea que sea incorporada en el genoma de la célula de blanco u objetivo. En esta protocolo de selección de la invención, los transformantes exitosos no solamente expresarán la secuencia primaria, sino también expresarán una TD insensible a la retroalimentación. Por consiguiente, una vez que el ADN recombinante es introducido en el tejido de la planta o el microorganismo, los transformantes exitosos pueden ser seleccionados de acuerdo con la invención haciendo crecer la planta o microorganismo en un substrato que comprende un análogo de He tóxico, tal como, por ejemplo, OMT (llamado el "substrato tóxico" aquí) . El análogo estructural de la He es tóxico para la TD del tipo silvestre, y solamente los transformantes exitosos, es decir, aquellos que expresan la TD insensible a la retroalimentación, estarán vivos, crecerán y/o proliferarán en el substrato tóxico. De esta manera, omr 1 también es un excelente marcador bioquímico que va a ser utilizado en los experimentos de ingeniería genética de las bacterias reemplazando a los genes resistentes a los antibióticos, peligrosos ambientalmente y utilizados tradicionalmente (tales como los genes marcadores resistentes a la ampicilina y a la kanamicina) . El omr 1 es muy favorable para el medio ambiente y no posee ningún riesgo para la salud humana cuando se incluye en un transformante, a causa de que el mismo no tiene un ortólogo en los seres humanos. Los seres humanos no sintetizan la isoleucina y solamente pueden obtenerla por la digestión de los alimentos. Con base en las características ventajosas de la invención, también se proporciona un sistema de herbicida novedoso. De acuerdo con este sistema, las líneas de las plantas valiosas agrícolamente que comprenden una secuencia de nucleótidos expresable que codifica una td insensible ("línea de la planta transformada") se hacen crecer en un substrato y un análogo estructural de la He seleccionado de acuerdo con la invención se pone en contacto con el substrato o con las propias plantas. Como resultado, solamente las plantas transformadas continuarán creciendo y otras plantas puestas en contacto con el análogo morirán. La invención será descrita adicionalmente con referencia a los siguientes ejemplos específicos. Se sobreentenderá que estos Ejemplos son ilustrativos y no de naturaleza restrictiva. Las digestiones, las fosforilaciones, los ligamientos y las transformaciones con bacterias de la enzima de restricción, se hicieron como se describió en Sambrook et al, Molecular Cloning: A Laboratory Manual, Segunda Edición (1989) Cold Spring Harbor Laboratory Press. Las transformaciones de las plantas se hicieron de acuerdo con Bent et al. "RPS2 de Arabidopsis' thaliana: A leucine-rich repeat class of plant disease resistence genes". Science 265:1856-1860 (1994). Cada cita bibliográfica es incorporada aquí para referencia en su totalidad.

EJEMPLO UNO Como se reporta en Mourad G, King J (1995) el mutante resistente a la L-O-metiltreonina de la Arabidopsis defectuosa en la regulación de la retroalimentación de la isoleucina, Plant Physiol 107:43-52, el GMllb de la línea mutada de Arabidopsis thaliana fue obtenido, utilizando la mutagénesis de EMS, por la selección en la presencia del análogo estructural de He tóxico, L-O-metiltreonina (OMT) . La base de la selección del mutante fue que el OMT se incorporó en las proteínas celulares en lugar de la He, provocando la pérdida de la función de la proteína y, por consiguiente, la muerte de la célula. La GMllb fue rescatada a causa de una mutación dominante en el omr 1 del gen único el cual codifica la TD. La mutación en el gen de omr 1 provoca que la TD desde GMllb sea insensible al control de la alimentación por la lie. La actividad de la TD en los extractos de las plantas de GMllb fue de aproximadamente 50 veces más resistente a la inhibición de la retroalimentación por la He que el TD en los extractos de las plantas del tipo silvestre. La pérdida de la sensibilidad a la retroalimentación de la He en GMllb conduce a una sobreproducción de 20 veces de la He libre cuando se compara con el tipo silvestre. Esta sobreproducción de la He en GMllb no tuvo efecto sobre el crecimiento o reproducción de las plantas.

EJEMPLO DOS Clonación, Secuenciamiento y Prueba del omr 1 como un Marcador Seleccionable en Experimentos de Ingeniería Genética 1. La construcción de una biblioteca de ADNc a partir de GMllb (omrl/omrl) : El ARN total se extrajo de las plantas de GMllb (omrl/omrl) de 16 días de edad en un medio de agar mínimo suplementado con 0.2 mM MTR. El Poli (A) ARN (ARNm) se extrajo desde el ARN total y el ADN complementario (ADNc) se sintetizó utilizando la transcriptasa inversa. La biblioteca de ADNc se sintetizó utilizando el juego o conjunto de síntesis de ZAP-ADNc de Stratagene. Para cebar la síntesis de ADNc, un cebador del enlazador de oligonucleótidos de base 50 que contiene un sitio X o I y un poli(dT) de base 18 fueron utilizados. Un adaptador de oligonucleótidos 13-mer que contiene un extremo cohesivo de Eco IR se ligó a las moléculas de ADNc de doble hebra en el extremo 5' . Esto permitió la clonación unidireccional de las moléculas de ADNc, en el sentido de la orientación, en los sitios Eco IR y Xho I del vector Uni-ZAP XR de Stratagene. La biblioteca del fago ? recombinante se amplificó utilizando las células huésped de E. coli XLl-Blue MRF* que dan una concentración de 6.8 x 109 pfu/ml. El inserto de tamaño promedio fue aproximadamente de 1.4 kb. Este se calculó a partir de un análisis de PCR de 20 placas claras, al azar, aisladas desde la biblioteca amplificada. El vector Uni-ZAP XR contiene el plásmido pBluescript SK(-) que contiene el extremo N del gen de lacZ. Para escindir el faguemido de pBluescript que contiene el' inserto de ADNc clonado, el sistema ExAssist/SOLR provisto por Stratagene fue utilizado. Esto permitió el rescate de los insertos de ADNc desde los clones de ? positivos en los plásmidos de pBluescript SK en un solo paso. 2. El aislamiento de un fragmento de TD-ADN pequeño para su uso co o una sonda homologa: Para aislar el gen omr 1 que codifica la TD de la biblioteca de ADNc de la línea GMllb, un oligonucleótido homólogo, aislado del ADN del Arabidopsis, se utilizó como una sonda contra la biblioteca de ADNc. Tomando en consideración que el TD es conservado en una variedad de organismos, los cebadores degenerados fueron diseñados a partir de las regiones de aminoácidos conservados de la TD. Tales regiones conservadas fueron identificadas alineando la secuencias de aminoácidos de la TD desde el garbanzo y el tomate. La Figura 2 muestra la localización de las secuencias de amino conservadas en el tomate y el garbanzo y también la localización de los cebadores de oligonucleótidos degenerados TD205 y TD206 que fueron diseñados para aislar un fragmento de TD-ADN de Arabidopsis. La Figura 4 muestra la estructura y el grado de degeneración de los cebadores de oligonucleótidos de PCR, TD205 (el cebador del extremo 5' ) y TD206 (el cebador del extremo 3' ) . Ambos cebadores TD 205 y TD 206 fueron diseñados para acomodar la desviación o desplazamiento del codón de Arabidopsis. El cebador TD 205 tuvo una degeneración de 384 veces y fue un 28-mer anclado con un sitio Eco IR partiendo de 2 bases corriente abajo del primer nucleótido en el extremo 5' del cebador. La TD 206 tuvo una degeneración de 324 veces y fue un 28-mer anclado con un sitio Hind III partiendo de 2 bases corriente abajo del primer nucleótido en el extremo 5' del cebador. El ADN genómico se aisló de GMllb y se utilizó como un modelo o plantilla en una amplificación de PCR con los cebadores TD205 y TD206. Un fragmento de 438 pb fue amplificado. El fragmento se clonó en los sitios Eco IR-Hind III del plásmido pGEM3Zf(+). El fragmento se secuenció hasta que se completó utilizando el método de terminación de la cadena de didesoxi y el juego o conjunto de secuenasa de USB. El fragmento mostró un intrón de 280 pb putativo o supuesto. Los restantes 158 pb del fragmento de PCR tuvieron 60.1 % de identidad de la secuencia de nucleótidos con el gen de TD del garbanzo. Para eliminar las secuencias del intrón putativas o supuestas, un segundo par de cebadores TD 211 y TD212 fue diseñado y utilizado en una reacción de PCR con el fragmento de 438 pb como un modelo o plantilla. Un fragmento de ADN de aproximadamente 100 pb de longitud, que contiene las secuencias del exon, fue amplificado y purificado. Esta fue la sonda homologa utilizada para la selección de la biblioteca de ADNc construida desde GMllb. 3. Selección de la biblioteca de ADNc de GMllb: El fragmento de PCR de 100 pb fue etiquetado con [a-32P]dCTP (3000 Ci/mmoles) utilizando la cebadura al azar (juego o conjunto de etiquetación de un gen con el cebador a de Promega) y se utilizó como una sonda para seleccionar levantamientos de la placa (dos réplicas por placa) de la biblioteca de ADNc del GMllb colocado en placas. La hibridación se hizo a 42 °C en formamida durante 2 días. Las membranas de nilón que contienen los levantamientos de la placa se lavaron 3X a temperatura ambiente (25 °C) en 7XSSPE y 0.5% de SDS durante 5 minutos. Las membranas de nilón se colocaron entonces sobre una película de rayos X y se expusieron durante 1 día. Dos placas se hibridizaron y mostraron la señal sobre las películas de rayos X de las dos réplicas tomadas desde la misma placa. En el sitio de la hibridación positiva, se cortaron tapones de la placa de agar y se colocaron en 1 ml de la solución amortiguadora de SM con 20 µl de cloroformo. Una selección secundaria, terciaria y cuaternaria se efectuó hasta que aproximadamente 90% de las placas sobre la caja mostraron una señal fuerte sobre la película de rayos X de ambas réplicas de la misma caja. Una placa aislada de la cavidad que representa cada clon se cortó de la caja y se colocó en la solución amortiguadora de SM. El fago eluído se infectó con el fago del ayudante ExAssist para escindir el plásmido SK de pBluescript que contiene el inserto del ADNc y las bacterias recombinantes resultantes se colocaron en placas sobre un medio con ampicilina (60 µg/ml). Pocas colonias bacterianas fueron seleccionadas, el ADN del plásmido se preparó luego se digirió con Eco IR y Xho I para liberar los insertos. Una mancha de Southern se preparó a partir de las digestiones del plásmido y se sondearon con el fragmento de TD de 100 pb etiquetado con 32P. Todos los clones, descendientes de los dos clones del fago, mostraron una señal muy fuerte. Esta fue una indicación fuerte de que los clones aislados contuvieron la TD desde la línea GMllb. Un clon fue llamado TD23 y se- seleccionó para el secuenciamiento del ADN. El tamaño del inserto del ADNc en el clon TD23 fue de 2229 nucleótidos. 4. Secuenciamiento del fragmento de 2229 pb del clon TD23: El secuenciamiento del inserto del ADNc del clon TD23 se efectuó por el método de terminación de la cadena de didesoxi utilizando el juego o conjunto de secuenasa de USB. Al inicio del proyecto _ de secuenciamiento, un cebador del oligonucleótido complementario para el promotor T3 de pBluescript T3 se sintetizó y se utilizó para obtener la secuencia de pocos de los primeros nucleótidos del inserto. Esta secuencia, de 30 nucleótidos, incluyó el sitio de clonación múltiple corriente abajo del promotor de T3. El inicio de la secuencia de ADNc fue inmediatamente a continuación del sitio de Eco IR el cual inicia en la posición 31. El secuenciamiento del ADN también fue efectuado sobre la hebra opuesta partiendo del extremo 3' y utilizando el promotor de T7 del pBluescript SK. Ambas hebras del inserto TD 23 se secuenciaron hasta que se completaron utilizando un conjunto de cebadores de oligonucleótidos diseñados a partir del ADN revelado después de cada reacción de secuenciamiento. Un total de 19 cebadores de oligonucleótidos se sintetizaron y se utilizaron en el secuenciamiento del inserto del ADNc. La longitud del fragmento secuenciado fue de 2277 nucleótidos de los cuales 229 fueron del "inserto de ADNc. De los restantes 48 nucleótidos, 2277-2229, 31 nucleótidos fueron el sitio de clonación múltiple entre el promotor T3 y el sitio de Eco IR en el extremo 5' del inserto y 17 nucleótidos fueron el sitio de clonación múltiple entre el promotor T7 y el sitio Xho I en el extremo 3' del inserto (Figura 4). La Figura 5 muestra la secuencia de nucleótidos y la secuencia de aminoácidos predicha del clon 23 como se aisló de la biblioteca de ADNc construida de la línea GMllb de Arabidopsis (omrl/omrl) . El inserto de TD en el clon 23 está en el vector pBluescript entre los sitios Eco IR y Xho I. Un marco de lectura abierta (marco de lectura superior) se observó el cual mostró un codón de ATG en el nucleótido 166 y un codón de terminación en el nucleótido 1801. El inserto de ADNc total en el clon 23 es de 1758 nucleótidos (incluyendo el codón de parada) que codifica un polipéptido de 585 aminoácidos. La Figura 4 muestra la secuencia de ADN del clon 23 y la Figura 5 muestra la secuencia de ADN y el marco de lectura abierta con la secuencia de aminoácidos predicha codificada por el inserto de ADNc. La secuencia se aminoácidos predicha codificada por el gen de ADNc de TD 23 compartió una identidad mayor que el 50% con la secuencia de aminoácidos de TD de la papa y el tomate respectivamente. Esto fue una evidencia fuerte de que el inserto de ADNc del clon TD23 es realmente el gen que codifica la treonina deshidratasa/desaminasa, omr 1, de la GMllb de la línea resistente a la L-O-metiltreonina de la Arabidopsis thaliana.

. Prueba de funcionalidad del inserto de ADNc (omr 1) ue codifica la TD de Arabidopsis: Para probar que el inserto de .ADNc clonado del clon Td 23 está codificando realmente una treonina deshidratasa/desaminasa funcional, se efectuó una prueba complementaria. La TGXA de la cepa de E. coli es un auxótrofo con una deleción en el gen ilvA que codifica la treonina deshidratasa/desaminasa. Fisher KE, Eisenstein e (1993), An efficient approach to identify ilva mutations reveáis an amino-terminal catalytic domain in biosynthetic threonine deaminase from Escherichia coli, J Bacteriol 175:6605-6613. Esta cepa no puede crecer sobre un medio mínimo sin suplemento con la He. Esta cepa fue un regalo generoso de los Drs. Kathryn E. Fisher y Edward Eisenstein, University of Maryland Baltimore County, Maryland. Los primeros experimentos complementarios se hicieron para probar la capacidad del omr 1 para invertir la TGXA del auxótrofo de He bacteriano a prototrofia. Esto se hizo transformando la TGXA con pGM-td23, que contiene el omr 1 de inserto del ADNc en pBluescript SK bajo el control del promotor T3. Además, el inserto de ADNc que contiene el omr 1 se subclonó en dos diferentes vectores de expresión procarióticos . Un fragmento de Xba I-Xho I, que contiene la secuencia de ADNc de omr 1, se escindió de pGM-td23 y se clonó en Xba I-Sal I de los vectores de expresión procarióticos linearizados pTrc99A y pUCK2. En pTrc99A, el omr 1 se clonó en el frente del promotor inducible de IPTG lacZ mientras que en pUCK2, el omr 1 se clonó en el frente de un promotor constitutivo. Las terminales o extremos cohesivos Xho I y Sal I son compatibles y por lo tanto se permite el ligamiento de los insertos en los vectores de expresión. Los vectores recombinantes pTrc-td23, pUCK-td23 o pBluescript-td23 todos conteniendo el omr 1 de longitud completa fueron transformados en la cepa TGXA y colocados en placas sobre un medio mínimo sin suplementación. La totalidad de las tres construcciones fueron capaces de invertir la auxotrofía de He de la TGXA huésped a prototrofía. Estos experimentos confirmaron que el omr 1 que codifica la Arabidopsis thaliana (línea GMllb) es funcional y capaz de desbloquear la ruta biosintética del He de la cepa TGXA de E. coli. En el segundo experimento de complemento, el huésped DH5a del prototrofo de E. coli se transformó con pTrc-td23 o pUCK-td23 y se colocó en placas sobre un medio mínimo suplementado con concentraciones variables de la L-O-metiltreonina del análogo tóxico. Ambas de las construcciones fueron capaces de conferir la resistencia del DH5a a 30 µM de la L-O-metiltreonina. Ninguna colonia bacteriana creció sobre las placas que contienen la DH5a no transformada. Este resultado proporcionó una evidencia fuerte de que el gen de omr 1 mutado de la línea GMllb de la Arabidopsis es capaz de conferir resistencia a la L-O-metiltreonina presente en el medio de crecimiento. Por lo tanto el omr 1 proporciona un nuevo marcador seleccionable favorable para el medio ambiente para la transformación genética de las bacterias. 6. Construcción del vector de expresión de pCM35S-omr 1 para la transformación de la planta: La estrategia para clonar el alelo de omr 1 en un vector de expresión de la planta fue como sigue: A. La región de codificación del alelo omr 1 se escindió de pGM-td23 como un fragmento de Xba I - Kpn I. B. El promotor de CaMV 35S de 500 pb se desdobló del vector pBI121.1 (Jefferson et al., 1987) con Hind III y Ba Hl. El vector pBINl9 se linearizó con Hind III y Bam Hl luego se ligó al promotor de CaMV 35S para colocar el promotor en el sitio de clonación múltiple en la orientación correcta. Este vector fue llamado pCM35S. C. El plásmido pCM35S se digirió con Xba I - Kpn I y el fragmento de omr 1 aislado en el paso A se clonó en los sitios Xba I - Kpn I colocando la secuencia de codificación de omr 1 en el frente del promotor de CaMV 35S y creando un plásmido con el gen resistente a la kanamicina (NOS:NPTII:NOS) cercano al borde o límite derecho RB de la región del T-ADN del plásmido Ti y 35S:omr 1 corriente abajo y cercano al borde izquierdo LB de la región de T-ADN del plásmido de Ti. Este plásmido se llamó pCM35S-omr 1-nos (ca. 13 kb) . D. El terminador NOS de pBIN19 fue amplificado por PCR utilizando un par de cebadores de oliglonucleótidos, el cebador 5' se ancló con un sitio Xha I y el cebador 3' se ancló con un sitio Sal I. La amplificación por PCR produjo un fragmento del terminador NOS de 300 pb.

E. Para clonar un terminador de NOS al extremo 3' del gen omr 1, el plásmido recombinante pCM35S-omr 1-nos se digirió con el Nhe I y Xho I. Esto produjo tres fragmentos : (i) un fragmento de Nhe I - Nhe I de 5 kb que contiene una parte del promotor NOS del gen NPTII, el promotor 35S y el ADNc del omr 1 de longitud completa excepto 200 pb de las secuencias no transladadas en el extremo 3' el cual incluye la cola o extremidad de poly A. (ii) un fragmento de Nhe I - Xho I de 200 pb que contiene el fragmento de 200 pb mencionado en (i) y que contuvo la cola o extremidad poly A y las secuencias no transladadas en el extremo 3' de omr 1. (iii) un fragmento Nhe I - Xho I de 8 kb que contiene el promotor NOS del extremo 5' del gen NPTII y las secuencias restantes fuera de LB y RB del pCM35S-omr 1-nos. F. Para clonar el terminador NOS inmediatamente corriente abajo del gen omr 1 en pCM35S-omr 1-nos, se efectuó una triple ligadura incluyendo el fragmento Nhe I - Nhe I de 5 kb que contiene parte del promotor NOS del gen NPTII mencionado anteriormente en E(i), el fragmento del terminador NOS de Sba I - Sal I de 300 pb mencionado en C, y el fragmento de Nhe I - Xho I de 8 kb que contiene el promotor NOS del extremo 5' del gen NPTH y las secuencias restantes fuera de LB y RB del pCM35S-omr 1-nos. El resultado de esta triple clonación fue el ligamiento del fragmento de 5 kb en un extremo Nhe I (el extremo del promotor NOS) al sitio Nhe I del fragmento de 8 kb (Nhe I/Nhe I) y el otro extremo Nhe I (en el extremo 3' de la secuencia de codificación de omr 1) del fragmento de 5 kb se ligó el Xba I (isosquizómero) del fragmento del terminador NOS de 300 pb. El extremo de Sal I del terminador NOS de 300 pb se ligó al extremo Xho I (isosquizómero) del fragmento de 8 kb. Esto generó el plásmido recombinante pCCM35S-omr 1 que contiene el gen omr 1 impulsado o activado por el promotor CaMV 35S y terminado por el terminador NOS y el gen resistencia a la kanamicina (Promotor NOS :NPTII: OS: terminador) entre el LB y el RB (Figura 16) . Para confirmar la clonación de los tres fragmentos en la orientación apropiada, una digestión de diagnóstico con Xba I y Kpn I produjo un fragmento de 2.3-2.4 kb. El plásmido pCM35S-omr 1 por lo tanto contuvo dos construcciones que podrían ser expresadas en las plantas, el CaMV35S:omr 1: terminador NOS que expresa la resistencia a la L-O-metiltreonina y el promotor NOS :NPTII : terminador NOS que expresa la resistencia a la kanamicina. 7. Transformación de la planta utilizando pCM35S-omr 1 : Utilizando el método de infiltración al vacío de Bent et al. (1994), el tipo silvestre Columbia de la Arabidopsis thaliana sensible a la L-O-metiltreonina se transformó con pCM35S-omr 1. Diez macetas, cada una con 3-4 plantas, fueron transformadas y las semillas de TI fueron colectadas desde las plantas transformadas T0 de cada maceta separadamente. Las semillas TI de cada maceta fueron seleccionadas para la expresión de la resistencia a la L-O-metiltreonina por la germinación en un medio de agar suplementado con 0.2 mM de la L-O-metiltreonina, una concentración previamente determinada y conocida para inhibir completamente el crecimiento de los plantas que han crecido de las semillas más allá de la etapa cotiledónea (Mourad y King, 1995) . La mitad de las semillas TI de cada una de las diez macetas fueron seleccionadas para verificar la resistencia de la L-O-metiltreonina y 5 transformantes independientes fueron capaces de germinar y continuar haciendo crecer las raíces sanas y los renuevos entre miles de plantas crecidas de las semillas que fueron blanqueadas completamente después de la salida de los cotiledones. En una placa llena, es posible identificar los transformantes mirando en la parte inferior de la placa, los transformantes muestran el crecimiento de la raíz mientras que los no transformantes no tendrán ninguno. Después de tres semanas de crecimiento en el medio de agar de la L-O-metiltreonina 0.2 mM, cada uno de los 5 transformantes positivos se transfirió al suelo, se mantuvo separadamente y se le permitió autofertilizarse para producir la semilla T2. 8. Caracterización genética de los transformantes de omr 1: La semilla T2 fue colectada de cada uno de los transformantes de TI positivos y 50 semillas T2/transforinantes fueron plantados en una caja de petri separada que contiene 0.2 mM de medio de agar de la L-O-metiltreonina. En cada una de las 5 cajas de petri, la mayoría (75% o más) de las plantas que han crecido de las semillas T2 fueron resistentes a la L-O-metiltreonina indicando que una copia única del omr 1 del transgen ha sido insertado en el planta transgénica de TI original. La Figura 6b muestra que los residuos de 585 residuos de aminoácidos de los 592 residuos totales que representan la TD mutante de longitud total se expresaron en las plantas transgénicas. Esta TD mutante precursora ligeramente truncada fue capaz de translocalizarse hasta el cloroplasto y conferir a las plantas transgénicas resistencia a la OMT.

. Caracterización molecular de los transformantes de omr 1: Dos a tres hojas de cada uno de los cinco transformantes de TI fueron escindidas de las plantas en la etapa de rosetón y el ADN total fue extraído de acuerdo con una modificación del procedimiento de Konieczny y Ausubel (1993). Un enfoque de PCR fue utilizado para confirmar la presencia del omr 1 del transgen introducido. Para esto, un par de cebadores de oligonucleótidos fueron sintetizados de tal modo que un cebador es complementario con el inicio de la omr 1 y el otro cebador fue complementario con el extremo del terminador de NOS. La reacción de PCR utilizando el ADN extraído de cada uno de los cinco transformantes de TI fue amplificado por PCR y cada uno produjo un fragmento de 2.5 kb que confirma la presencia del omr 1 del transgen seguido por el terminador de NOS en cada uno de los transformantes. El OMRl del alelo del tipo silvestre natural no se amplificó por PCR a causa de que el mismo no está seguido por el terminador de NOS y por lo tanto ninguna reacción por PCR podría llevarse a cabo. El ADN extraído de las plantas de Arabidopsis no transformadas fallaron en la amplificación utilizando tales cebadores.

EJEMPLO TRES La Base Molecular de la Resistencia a la L-O- Metiltreonina Codificada por el Alelo omr 1 de la Linea GMllb de la Arabidopsis thaliana 1. Aislamiento del alelo de OMRl del tipo silvestre : Una biblioteca de ADNc del tipo silvestre Columbia de Arabidopsis thaliana construida a partir de plantas que crecieron de semillas, de 3 días de edad, eir el vector ? ZAP II de Stratagene se seleccionaron con un fragmento de ADN de 1080 pares base etiquetado con 32P amplificado por PCR a partir de la secuencia de ADNc del omr 1 (descrito anteriormente) como una sonda. La selección produjo un clon positivo TD54 el cual se purificó y se probó que va a ser el OMRl del alelo del tipo silvestre por- PCR y análisis de Southern. 2. Secuenciamiento del alelo del tipo silvestre de OMRl : El plásmido recombinante que contiene el OMRl del alelo del tipo silvestre fue nombrado pGM-td54 y el alelo de OMRl fue secuenciado manualmente utilizando el juego o conjunto de secuenasa de USB y el mismo conjunto de cebadores de los oligonucleótidos que fue utilizado previamente en el secuenciamiento del alelo de omr 1. La secuencia de ADN del OMRl del tipo silvestre fue similar a aquel del omr 1 excepto para dos substituciones básicas diferentes que predicen dos substituciones de aminoácidos en la TD mutada codificada por omr 1. En un intento por clonar las secuencias corriente arriba de 5' desde el codón de partida del ATG del clon 23 (Figura 5) y utilizando un enfoque de PCR, un nuevo codón de ATG fue detectado en los 141 nucleótidos corriente arriba del codón de ATG reportado en el clon 23. Esto se confirmó tanto en el OMRl del alelo del tipo silvestre como en el omr 1 del alelo mutado. Por lo tanto el ADNc de longitud completa del sitio omr 1 se encontró que va a ser de 1779 nucleótidos (Figura 7) que codifican una proteína de TD de 592 aminoácidos (Figuras 8 y 9) . El inserto de omr 1 como se muestra en la Figura 6b (SEC ID NO: 3) fue no solamente expresado fuertemente en las primeras plantas transgénicas (TI) sino también fue heredado y expresado fuertemente en su progenie (plantas de T2) . Como se esperaba, el ADNc de longitud completa del alelo de OMRl del sitio de omrl fue de 1779 nucleótidos (Figura 10) que codifica una TD del tipo silvestre de 592 aminoácidos (Figuras 11 y 12) . El alineamiento de los aminoácidos de la treonina deshidratasa/desaminasa del tipo silvestre de la Arabidopsis thaliana con aquella del garbanzo (John et al., 1995), el tomate (Samach et al., 1991), la papa (Hildmann T, Ebneth M, Pena-Cortes H, Sánchez-Serrano JJ, Willmitzer L, Prat S (1992) General roles of abscisic and jasmonic acids in gene activation as a result of mechanical wounding. Plant Cell 4:1157-1170), la levadura 1 (Kielland-Brandt MC, Holmberg S, Petersen JGL, Nilsson-Tillgren T (1984) Nucleotide sequence of the gene for threonine deaminase (ilvl) of Saccharomyces cerevisiae. Carlsberg Res Commun 49:567-575), la levadura 2 (Bornaes C, Petersen JG. Holmberg S (1992) Serine and threonine catabolism in Saccharomyces cerevisiae: el polipéptido CHAI es homólogo con otras serina y treonina « deshidratasas . Genetics 131:531-539), E. coli biosynthetic (Wek RC, Hatfield GC (1986) Nucleotide sequence and in vivo expression of ilvY and illvC genes in Escherichia coli K12. La transcripción de los promotores de superposición divergentes, J Biol Chem 261:2441-2450), E. coli catabolic (Datta P, Goss TJ, Omnaas JR, Patil RV (1987) Covalent structure of biodegradative threonine dehydratase of Escherichia coli:homology with other dehydratases . Proc Nati Acad Sci USA 84:393-397), y Salmonella typhimurium (Taillon BE, Little R, Lawther RP (1988) . El análisis de los dominios funcionales de la treonina desaminasa biosintética por comparación de las secuencias de aminoácidos de los tres alelos del tipo silvestre con respecto al aminoácido de la treonina desaminasa biodegradante, Gene 62:245-252) se describe en la Figura 13. Se utilizó el programa Megalign del programa Lasergene, DNASTAR Inc., Madison, Wisconsin. El grado de similaridad entre los residuos de aminoácidos de la treonina deshidratasa/desaminasa de Arabidopsis y aquellos de los otros organismos se calcula por el método de alineamiento de la proteína de Lipman-Pearson utilizando el programa Lasergene y se encontró que va a ser del 46.2% con el garbanzo, 52.7% con el tomate, 55-0% con la papa (parcial), 45.0% con la levadura 1, 24.7% de la levadura 2, 43.4% con el E.coli (biosintético) , 39.3% con el E. coli (catabólico) y 43.3% con Salmonella. 3. Comparando las secuencias de ADN del omrl y el OMRl se revelaron las mutaciones puntuales involucradas : Con referencia a la numeración de los residuos de nucleótidos en la SEC ID N0:1 y la SEC ID NO: 2, la primera substitución básica ocurrió en el nucleótido 1519 en donde C (citosina) en el OMRl del alelo del tipo silvestre fue substituido por T (timina) en el omr 1 del alelo mutado (Figuras 14 y 15) . Esta substitución básica predijo una substitución de aminoácidos en el residuo 452 de los aminoácidos al nivel del polipéptido en donde el residuo de arginina en la TD del tipo silvestre codificada por el OMRl se substituyó por un residuo de cisteína en la TD insensible a la isoleucina mutada, codificada por omr 1 (Figura 15) . Esta mutación puntual radica en una región regulatoria conservada de los aminoácidos designados como R4 (regulatorios) por Taillon et al. (1988) en donde el aminoácido mutado es normalmente un residuo de arginina en la TD de Arabidopsis, la levadura 1, el E. coli (biosintético) y Salmonella y un residuo de lisina en la TD del garbanzo, el tomate, y la papa (parcial) (Figura 16) . La segunda substitución básica ocurrió en el nucleótido 1655 en donde G (guanina) en el OMRl del alelo del tipo silvestre fue substituido por A (adenina) en el omr 1 del alelo mutado (Figuras 17 y 18) . Esta substitución básica predijo una substitución de aminoácidos en el residuo 597 al nivel del polipéptido en donde el residuo de arginina en la TD del tipo silvestre codificada por OMRl fue substituida por un residuo de histidina en la TD insensible a la isoleucina mutada, codificada por omr 1 (Figura 18) . Esta mutuación puntual radica en una región regulatoria conservada de los aminoácidos designados R6 (regulatorios) por Taillon et al. (1988) en donde el aminoácido mutado es normalmente un residuo de arginina en TD de la Arabidopsis, el garbanzo, el tomate, la papa (parcial), la levadura 1, el E. coli (biosintético) y Salmonella (Figura 19) .

LISTADO DE SECUENCIAS (1) INFORMACIÓN GENERAL (i) SOLICITANTE: Mourad, George S. (ii) TITULO DE LA INVENCIÓN: MÉTODOS Y COMPOSICIONES PARA PRODUCIR PLANTAS Y MICROORGANISMOS QUE EXPRESAN LA TREONINA DESHIDRATASA/DESAMINASA INSENSIBLE A LA RETROALIMENTACIÓN (iii) NUMERO DE SECUENCIAS: 9 (iv) DIRECCIÓN PARA LA CORRESPONDENCIA (A) DESTINATARIO: Thomas Q. Henry Woodard, Emhardt, Naughton, Moriarty & McNett (B) CALLE: 111 Monument Circle, Suite 3700 (C) CIUDAD: Indianapolis (D) ESTADO: Indiana (E) PAÍS: E.U.A. (F) CÓDIGO POSTAL (ZIP) : 46204-5237 (v) FORMA LEÍBLE PARA LA COMPUTADORA: (A) TIPO DE MEDIO: Disquete, 3.5:, 1.44 Mb (B) COMPUTADORA: Hewlett Packard (C) SISTEMA OPERATIVO: MSDOS (D) PROGRAMA: ASCII (vi) DATOS COMUNES DE LA SOLICITUD: (A) NUMERO DE SOLICITUD: Desconocido (B) FECHA DE PRESENTACIÓN: 10-JUL-1998 (C) CLASIFICACIÓN: desconocida (vii) DATOS DE LA SOLICITUD PREVIA: (A) NUMERO DE SOLICITUD: 60/052,096 (B) FECHA DE PRESENTACIÓN: 10-JUL-1997 (vii) DATOS DE LA SOLICITUD PREVIA: (A) NUMERO DE SOLICITUD: 60/074,875 (B) FECHA DE PRESENTACIÓN: 17-FEB-1998 (viii) INFORMACIÓN DEL APODERADO/MANDATARIO: (A) NOMBRE: Henry, Thomas Q. (B) REGISTRO NO.: 28,309 (C) NUMERO DE REGISTRO/REFERENCIA: 7024-284 (ix) INFORMACIÓN DE TELECOMUNICACIÓN (A) TELEFONO: (317) 634-3456 (B) TELEFAX: (317) 637-7561 (2) INFORMACIÓN PARA LA SEC ID NO:l: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1779 nucleótidos (592 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO:l: ATG AAT TCC GTT CAG CTT CCG ACG GCG C?A TCC TCT CTC CGT AGC CAC Met Asn Ser Val Gln Leu Pro Thr Ala Gln Ser Ser Leu Arg Ser His 1 5 10 15 ATT CAC CGT CCA TCA AAA CCA GTG GTC GGA TTC ACT CAC TTC TCC TCC lie His Arg Pro Ser Lvs Pro Val Val Gly Phe Thr His Phe Ser Ser 20 25 30 CGT TCT CGG ATC GCA GTG GCG GTT CTG TCC CGA GAT GAA ACÁ TCT ATG 1 Arg Ser Arg lie Ala Val Ala Val Leu Ser Arg Asp Glu Thr Ser Met 35 40 45 ACT CCA CCG CCT CCA AAG CTT CCT TTA CCA CGT CTT AAG GTC TCT CCG 1 Thr Pro Pro Pro Pro Lvs Leu Pro Leu Pro Arg Leu Lys Val Ser Pro .50 ' 55 60 AAT TCG TTG CAÁ TAC CCT GCC GGT TAC CTC GGT GCT GTA CCA GAA CGT 2 Asn Ser Leu Gln Tyr Pro Ala Gly Tyr Leu Gly Ala Val Pro Glu Arg 65 70 75 80 ACG AAC GAG GCT GAG AAC GGA AGC ATC GCG GAA GCT ATG GAG TAT TTG 2 Thr Asn Glu Ala Glu Asn Glv Ser líe Ala Glu Ala Met Glu Tvr Leu 85 " 90 95 ACG AA.T ATA CTG TCC ACT AAG GTT TAC GAC ATC GCC ATT GAG TCA CCA 3 Thr Asn He Leu Ser Thr Lys Val Tyr ASD He Ala He Glu Ser Pro 100 105 110 CTC CAÁ TTG GCT AAG AAG CTA TCT AAG AGA TTA GGT GTT CGT ATG TAT 3 Leu Gln Leu Ala Lys Lys Leu Ser Lys Arg Leu Gly Val Arg Met Tyr 115 120 125 CTT AAA AGA GAA GAC TTG CAÁ CCT GTA TTC TCG TTT AAG CTT CGT GGA Leu Lys Arg Glu Asp Leu Gln Pro Val Phe Ser Phe Lys Leu Arg Gly 130 135 140 GCT TAC AAT ATG A.TG GTG AAA CTT CCA GCA GAT CAÁ TTG GCA AAA GGA Ala Tyr Asn Met Met Val Lys Leu Pro Ala Aso Gln Leu Ala Lys Gly 145 150 155 160 GTT ATC TGC TCT TCA GCT GGA AAC CAT GCT CAÁ GGA GTT GCT TTA TCT Val He Cys Ser Ser Ala Gly Asp His Ala Gln Gly Val Ala Leu Ser 165 170 175 GCT AGT AAA CTC GGC TGC ACT oCT GTG ZXTT- GTT ATG CCT GTT ACG ACT Ala Ser Lys Leu Gly Cys Thr Ala Val He Val Met Pro Val Thr Thr 180 185 190 CCT GAG ATA AAG TGG CA GCT GTA GAG AAT TTG GGT GCA ACG GTT GTT Pro Glu He Lys i rp Gln Ala Val Glu Asn Leu Gly Ala Thr Val Val 195 200 205 CTT TTC GGA GAT TCG TAT GAT CAÁ GCA CAÁ GCA CAT GCT AAG ATA CGA Leu Phe Gly Asp Ser Tvr Aso Gln Ala Gln Ala His Ala Lys lie Arg 210 215 220 GCT GAA GAA G.AG GGT CTG ACG TTT ATA CCT CCT TTT GAT CAC CCT GAT 7 Ala Glu Glu Glu Gl Leu Thr Phe He Pro Pro Phe Asp His Pro Asp 225 230 235 240 GTT ATT GCT GGA CAÁ GGG ACT GTT GGG ATG GAG ATC ACT CGT CAG GCT 7 Val He Ala Gly Gin Gly Thr Val Giy Met Giu He Thr Arg Gln Ala 245 250 255 AAG GGT CCA TTG CAT GCT ATA GTG CCA GTT GGT GGT GGT GGT TTA Lys Gly Pro Leu His Ala He Phe Val Pro Val Gly Gly Gly Gly Leu 260 265 270 ATA GCT GGT ATT GCT GCT TAT GTG AAG AGG GTT TCT CCC GAG GTG AAG 1 He Ala Gly He Ala Ala Tyr Val Lys Arg Val Ser Pro Glu Val Lys 275 280 285 ATC ATT GGT GTA GAA CCA GCT GAC GCA AAT GCA ATG GCT TTG TCG CTG 9 He He Gly Val Glu Pro Ala Asp Ala Asn Ala Met Ala Leu Ser Leu 290 295 300 CAT CAC GGT GAG AGG GTG ATA TTG GAC CAG GTT GGG GGA TTT GCA GAT His His Gly Glu Arg Val He Leu Aso Gln Val Gly Gly Phe Ala Asp 305 310 315 320 GGT GTA GCA GTT AAA GAA GTT GGT GAA GAG ACT TTT CGT ATA AGC AGA l Gly Val Ala Val Lys Glu Val Gly Glu Glu Thr Phe Arg He Ser Arg 325 330 335 AAT CTA Al vj GAT GGT GTT GTT CTT ACT CGT GA.T GCT ATT TGT G'x.r-. 1 Asn JLIS — Met Asp Giy Val Val Leu Val Thr Arg Asp Ala He Cys Ala 340 345 350 TCA ATA AAG GAT ATG TTT GAG GAG AAA V_ J AAC ATA GAA CCA GCA .

Ser He Lys Asp Me Phe Glu Glu Lys .-. e Asn He Leu Glu Pro Ala 355 360 365 GGG GCT CTT GCA CTC GCT GGA O — * GAG TAC AAA x -. - TAT UJI-G1y Ala Leu Ala Leu .".— Cl Giy Ala Glu Ala Tyr Cvs Lys Tvr Tvr Gly 370 375 380 CTA AAG GAC GTG AAT G C GTA GCC ATA ACC AGT G *^ GCT AAC ATG AAC 1 Leu Lys Asp Val Asn Val Val Ala He Thr Ser Giy Ala A.sn Met As 385 390 395 400 TTT GAC AAG CTA AGG ATT v;r-_n >— C GCC AAT T*« GGT AGG CA 1 Phe .Ase Lys Leu Arg S I. s Val Thr Glu Leu nl? Asn al Gly Arg Gln 405 410 415 CAG GAA GGT GTT CTT GCT ACT CTC .".* CCG GGA AGC TTT 1 Glr. Glu Ala Val Leu Ala Thr Leu Me Pro Glu Lys Pro Glv Ser Fhe 420 425 430 AAG CAÁ -L i - iv ? GAG CTG u. CCA AAC ATA ? V. GAG i J. \_ AAA 1 Lys Gln Phe Cys Giu Leu Val Gly Pro Met Asn He Ser Glu Phe Lys 435 440 445 TAT AGA i J i AGC TCG GAA. AAG p.z.p. GCT GTT GTA CTA TAC GTC GGA .

Tyr Arg Cys Ser Ser Giu Lys Glu Ala ei Val Leu Tyr Ser Val Gly 450 455 460 GTT CAC ACÁ GCT G?n GAG ? "* — v-.-i CTA CAG AAG AGA. ATG GAA -.. Val His Thr Ala Giy Giu Leu Lys Ala Leu Gln Lys Arg Met Giu Ser 465 470 475 480 CT CAÁ CTC AAA ACT GTC AAT CTC ACT ACC AGT .— TTA GTG AAA GAT 1 Ser Gln Leu Lys Val Asn Leu Thr Thr Ser Asp Leu Val Lys Asp 465 490 495 CAC CGT TAC ATG GGA GGA AC-A ?-^rn ACT GTT GGA vr-.v_ GAG GTT I M -i ß Leu Met Giy Gly Arg Ser Thr Val Gly ASD Glu Val —s Leu Axg Tyr 500 505 510 CTA TGC CGA TTC ACC TTT GAG AGA CCT GGT GCT CTA ATG AAC TTC 15 Leu Cys Arg Phe Thr Phe Pro Glu Arg Pro Gly Ala Leu Met Asn Phe 515 520 525 TTG GAC TCT TTC AGT CCA ACC CTT TTC CAT TAC CGT 1 Leu Asp Ser Phe Ser Pro Aro Tro Asn II ?hr Leu Phe His Tyr Arg 530 535 540 GGA CAG GGT GAG ACG GGC GCG AAT GTG CTG GTC GGG ATC CAÁ GTC CCC 16 Giy Gln Gly Glu Thr Gly Ala Asn Val Leu Val Gly He Gln Val Pro 545 550 555 560 GAG CAÁ GAA ATG GAG GAA TTT AAA AAC CGA GCT AAA GCT CTT GGA TAC 17 Glu Gln Glu Met Glu Glu ?he Lys Asn Arg Ala Lys Ala Leu Gly Tyr 565 570 575 GAC TAC TTC TTA GTA AGT GAT GAC GAC TAT TTT AAG CTT CTG ATG CAC 17 Asp Tyr Phe Leu Val Ser Aso Asp Asp Tyr Phe Lys Leu Leu Met His 580 585 590 TGA .7 (2) INFORMACIÓN PARA LA SEC ID NO: 2: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 2277 nucleótidos 592 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 2 AAT TCC GTT CAG CTT CCG ACG GCG CAÁ TCC TCT CTC CGT AGC CAC Met Asn Ser Val Gln Leu P o Thr Ala Gl.-i Ser Ser Leu Arg Ser His 5 10 15 ATT CAC CGT CCA TCA AAA CCA GTG GTC GGA ?'?r* ACT CAC TTC TCC TCC He His Arg Pro Ser Lys Pro Val Val Gly ?he Thr H i- S ^'ns 3 = *~ 3 s3c 20 25 30 CGT TCT CGG ATC GCA GTG GCG GTT CTG TCC CGA GAT GAA ACÁ TCT ATG 1 Arg Ser Arg He Ala Val Ala Val Leu Ser Arg Asp Glu Thr Ser Met 35 40 45 ACT CCA CCG CCT CCA AAG CTT CCT TTA CCA CGT CTT AAG GTC TCT CCG 1 Thr Pro Pro Pro Pro Lys Leu Pro Leu Pro Arg Leu Lys Val Ser Pro 50 55 60 AAT TCG TTG CAÁ TAC CCT GCC GGT TAC CTC GGT GCT GTA CCA GAA CGT 2 Asn Ser Leu Gln Tyr Pro Ala Gly Tyr Leu Gly Ala Val Pro Glu Arg 65 70 75 80 ACG AAC GAG GCT GAG AAC GGA AGC ATC GCG GAA GCT ATG GAG TAT TTG Thr Asn Glu Ala Glu Asn Gly Ser He Ala Glu Ala Met Glu Tyr Leu 85 90 95 AAT ATA CTG TCC ACT GTT TAC GAC ATC GCC ATT GAG TCA CCA 3 Thr A.sn He Leu Ser Thr Lys Val Tvr Asp lie Ala lie Glu Ser Pro 100 105 110 CTC CA TTG GCT AAG CTA TCT AAG AGA TTA GGT GTT CGT ATG TAT 3 Leu Gln Leu Ala Lys Lys Leu Ser Lys Arg Leu Gly Val Arg Met Tyr 115 120 125 CTT AAA AGA G.AA GAC TTG CAÁ CCT GTA TTC TCG AAG CTT CGT GGA 4 Leu Lvs Arg Glu Asp Leu Gin Pro Val Phe Ser Phe Lys Leu Arg Gly 130 135 140 GCT TAC AAT ATG ATG AAA CTT CCA GCA GAT CAÁ TTG GCA AAA GGA 4 Ala Tyr Asn Met Met Val Lys Leu Pro Ala Aso Gln Leu Ala Lys Gly 145 150 155 160 GTT ATC TGC TCT TCA GCT GGA AAC CAT GCT CA GGA GTT GCT TTA TCT 5 Val He Cys Ser Ser Ala Gly Asn His Ala Gln Gl'y Val Ala Leu Ser 165 170 175 GT AGT .AAA GGC TGC ACT GCT ATT GTT ATG CCT GTT ACG ACT 5 Ala Ser Lys Leu Gi Cys Thr Ala Va i He Val Met Pro Val Thr Thr 180 185 190 CCT GAG ATA AAG CA GCT GTA GAG .AAT TTG GGT GCA ACG GTT GTT 5 Pro Glu He Lys Trp Gl Ala Val Giu Asn Leu Gly Ala Thr Val Val 195 200 205 CTT GAT TCG T-T CAÁ GCA CAÁ GCA CAT GCT AAG ATA CGA 6 Leu Phe Gly Asp Ser T *" Aso GIn Ala Gln Ala His Ala Lys He Arg 210 215 220 GCT GAA GAA GAG GGT CTG ATA CCT CCT TTT GAT CAC CCT GAT 7 Ala Glu Glu Giu Gly Leu Thr Phe He Pro Pro Phe Asp His Pro Asp 225 230 235 240 GTT ATT GCT GGA C.AA GC ACT GTT GGG ATG GAG ATC ACT CGT CAG GCT 7 Val He Ala Gly Gln Giy Thr Val Gly Met Giu He Thr Arg Gln Ala 245 250 255 AAG GGT CCA TTG CAT GCT ATA TTT GTG CCA GTT GGT GGT GGT GGT TTA 8 Lys Gly Pro Leu HlS Ala He Phe Val Pro Val Gly Gly Gly Gly Leu 260 265 270 ATA GCT GGT ATT GCT GCT TAT GTG AAG AGG GTT TCT CCC GAG GTG AAG 8 He Ala Gly He Ala Ala Tyr Val Lys Arg Val Ser Pro Glu Val Lys 275 280 285 ATC ATT GGT GTA GAA CCA GCT GAC GCA AAT GCA ATG GCT TTG TCG CTG 9 He He Gly Val Glu Pro Ala Asp Ala Asn Ala Met Ala Leu Ser Leu 290 295 300 CAT CAC GGT GAG AGG GTG ATA TTG GAC CAG GTT GGA ~"T"J» GCA GAT 9 HlS His Gly Giu Arg Val He Leu Asp Gln Val Gly Giy Phe Ala Asp 3C5 310 315 320 GGT GTA GCA GTT AAA GAA GTT GGT GAA GAG ACT TTT CGT ATA AGC AGA 10 Gly Val Ala Val Lys Glu Val Gly Glu Gíu Thr Phe Arg He Ser Arg 325 330 335 AAT CTA ATG GAT GGT GTT GTT CTT GTC ACT CGT GAT GCT ATT TGT GCA 10 Asn Leu Met Asp Gly Val Val Leu Val Thr Arg Asp Ala He Cys Ala 340 345 350 TCA ATA AAG GAT ATG TTT G J GAG AAA CGG ATA TTG GAA CCA GCA 11 Ser He' Lvs A.sp Met Phe Giu Glu Lys Arg Asn He Leu Glu Pro Ala 355 360 365 GGG GCT CTT GCA CTC GCT GGA GCT GAG GCA TAC TGT AAA TAT TAT GGC 11 Gly Ala Leu Ala Leu Ala Gly Ala Glu Ala Tyr Cys Lys Tyr Tyr Gly 370 375 380 CTA AAG GAC GTG AAT GTC GTA GCC ATA ACC AGT \JO* GCT AAC ATG AA.C 12 Leu Lys Asp Val Asn Val Val Ala He Tr". v- Ser Gly Ala Asn Met Asn 335 390 395 400 TTT GAC AAG CTA AGG ATT GTG ACÁ GAA CTC GCC AAT GTC GGT AGG CAÁ 12 Phe Asp Lys Leu Arg He Val Thr Glu LJTU Ala Asn Val Gly Arg Gln 405 410 415 CAG GAA GCT GTT CTT GCT ACT CTC ATG CCG GAA AAA CCT GGA AGC TTT 12 GIn Glu Ala Val Leu Ala T r Leu Me Pro Glu Lys Pro Gly Ser Phe 420 425 430 AAG CAÁ TTT TGT GAG CTG GTT GGA CCA ATG AAC ATA GAG TTC AAA 1 Lys Gln Phe Cys Glu Leu Val Giy Pro Me Asn He Ser Glu Phe Lys 435 440 445 TAT AGA TGT AGC TCG GAA AAG GAG GCT GTT GTA CTA TAC AGT GTC GGA 1 Tyr Arg Cys Ser Ser Glu Lys Giu Ala Val Val Leu Tyr Ser Val Gly 450 455 460 GTT CAC ACÁ GCT GGA GAG AAA GCA CTA CAG AAG AGA ATG GAA TCT 1 Val His Thr Ala Gly Glu Leu Lys Ala Leu Gln Lys Arg Met Glu Ser 465 470 475 480 rrt CAÁ CTC AAA ACT GTC AAT CTC ACT ACC AGT GAC TTA GTG AAA GAT 1 Ser Gln Leu Lys Thr Val Asn Leu Thr Thr Ser Asp Leu Val Lys Asp 485 490 495 CAC CTG TGT TAC TTG ATG GGA GGA AGA TCT ACT GTT GGA GAC GAG GTT 1 His Leu Cys Tyr Leu Me Gly Gly Arg Ser Thr Val Gly Asp Glu Val 500 505 510 CTA TGC CGA TTC ACC TTT T" ^ GAG AGA /*•»"•** GGT GCT CTA ATG AAC ™"p?~ 1 Leu Cys Arg Phe Thr Phe Pro Giu Arg Pro Gly Ala Leu Met Asn Phe 515 520 525 TTG GA.C CT t^t r AGT CCA CGG TGG AAC ATC ACC CTT TTC CAT .TAC CAT 1 Leu Asp Ser Phe Ser Pro Arg Trp Asn He Thr Leu Phe His Tyr His 530 535 540 GGA CAG GGT GAG ACG AAT GTu CTG GTC GGG ATC CAÁ GTC CCC 1 Gly Gln Gly Glu Thr Giv Ala Asn Val Leu Val Gly He Gln Val Pro 545 550 555 560 GAG CAÁ GP-? ATG GAG GAA AAA AAC CGA GCT AAA GCT CTT GGA TAC 1 Glu Gin Glu Me Glu Phe Lys Asn Arg Ala Lys Ala Leu Glv Tyr 565 570 575 GAC TAC TTC TTA GTA AGT GAT GAC GAC T—<t* TTT AAG CTT CTG ATG CAC 1 Asp Tyr Phe Leu Val Ser Asp Asp Asp Tyr Phe Lys Leu Leu Me His 580 585 590 TGA 1 (2) INFORMACIÓN PARA LA SEC ID NO: 3: [i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 2304 nucleótidos (609 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 3: ATG GGC GAG CTC GGT ACC CGG GGA TCC TCT AGA ACT AGT GGA TCC CCC Met Gly Glu Leu Glv Thr Arg Gly Ser Ser Arg Thr Ser Gly Ser Pro 1 5 10 15 GGG CTG CAG GAA TTC GGC ACG AGG ACG GCG CA TCC TCT CTC CGT AGC Gly Leu Gln Glu Phe Giy Thr Arg Thr Ala Gln Ser Ser Leu Arg Ser 20 25 30 CAC ATT CAC CGT CCA TCA AAA CCA GTG GTC GGA TTC ACT CAC TTC TCC His He His Arg Pro Ser Lys Pro Val Val Gly Phe Thr His Phe Ser - 40 45 TCC CGT TCT CGG ATC GCA GTG GCG GTT CTG TCC CGA GAT GAA ACÁ TCT Ser Arg Ser Arg He Ala Val Ala Val Leu Ser Arg Aso Glu Thr Ser 50 55 60 ATG ACT CCA CCG CCT CCA AAG CTT CCT TTA CCA CGT CTT AAG GTC TCT M<=t Th1* Pro Pro Pro Dro Lvs Leu Pro Leu Pro Arg Leu Lys Val Ser ' 65 - 0 " 75 80 CCG AAT TCG TTG CAÁ i ew* CCT GCC GGT TAC CTC GGT GCT GTA CCA GAA Pro Asn Ser Leu Gln Tyr Pro Ala Gly Tyr Leu Gly Ala Val Pro Glu 85 90 95 CGT ACG AAC GAG GCT GAG AAC GGA AGC ATC GCG GPJ GCT ATG GAG TAT Thr Asn Glu Ala Glu Asn Gly Ser He Ala Arg Glu Ala Met Glu Tyr 100 105 110 TTG ACG AAT ATA TCC ACT AAG GTT TAC GAC ATC GCC ATT GAG TCA Leu Thr Asn He Leu Ser Thr Lys Val Tyr Asp He Ala He Glu Ser 115 120 125 CCA CTC CAÁ TTG GCT ^G AAG CTA TCT AAG AGA TTA GGT GTT CGT ATG Pro Leu Gln Leu Ala Lys Lys Leu Ser Lys Arg Leu Gly Val Arg Met 130 135 1 0 TAT ' 'CTT AAA AGA GAA TTG CAÁ CCT GTA r^ ~ r* TCG TTT AAG CTT CGT Tyr Leu Lys Arg Glu Asp Leu Gln Pro Val Phe Ser Phe Lys Leu Arg 145 150 155 160 GGA GCT TAC AAT ATG ATG AAA CTT CCA GCA GAT CAÁ GCA ??A Gly Ala Tyr Asn Met Met Val Lys Leu Pro Ala Asp Gln Leu Ala Lys 165 170 175 GGA GTT ATC TGC TCA GCT GGA AAC CAT GCT CAÁ GGA GTT GCT TTA Gly Val He Cys Ser Ser Ala Gly Asn His Ala Gln Gly Val. Ala Leu 180 185 190 TCT GCT AGT AAA CTC GGC TGC ACT GCT GTG ATT GTT ATG CCT GTT ACG Ser Ala Ser Lys Leu Gly Cys Thr Ala Val He Val Me Pro Val Thr 195 200 205 ACT CCT GAG ATA AAG TGG tnr. GCT GTA GAG AAT TTG GGT GCA ACG GTT Thr Pro Glu He Lys Trp Gln Ala Val Glu Asn Leu Gly Ala Thr Val 210 215 220 GTT CTT TTC GGA GAT TCG TAT GAT CAÁ GCA CA GCA CAT GCT AAG ATA Val Leu Phe Gly Asp Ser Tyr Asp Gln Ala Gln Ala His Ala Lys He 225 230 235 240 CGA GCT GAA GAA GAG GGT CTG ACG TTT ATA CCT CCT TTT GAT CAC CCT Arg Ala Glu Glu Glu Gly Leu Thr Phe He Pro Pro Phe Asp His Pro 245 250 255 GAT GTT ATT GCT GGA CAÁ GGG ACT GTT GGG ATG GAG ATC ACT CGT CAG Asp Val He Ala Gly Gln Gly Thr Val Gly Met Glu He Thr Arg Gln 260 265 270 UU . AAG GGT CCA TTG CAT GCT ATA GTG CCA GTT GGT GGT GGT GGT Ala Lys Giv Pro Leu His Ala He ? e Val Pro Val Gly Gly Gly Gly 275 280 285 TTA ATA GCT GGT ATT GCT GCT AAG AGG GTT TCT CCC GAG GTG Leu He Ala Gly He Ala Ala Tyr Val Lys Arg Val Ser Pro Glu Val 290 295 300 AAG GGT GTA GAA CCA GCT GAC GCA AAT GCA ATG GCT TTG TCG Lys He lie Gly Val Glu Pro Ala Asp Ala Asn Ala Met Ala Leu Ser 305 310 315 320 CtG CAT CAC GGT GAG AGG GTG ATA TTG GAC CAG GTT GGG GGA TTT GCA 1 Leu His His Gly Glu Arg Val He Leu Aso Gln Val Gly Gly Phe Ala 325 33*0 335 GAT GGT GTA GCA GTT AAA GAA GAA GAG ACT T"J"T' CGT ATA AGC i Asp Giy Val Ala Val Lys Glu v'a . Gly p. ? 1 * Glu -"' Phe Aro He Ser 340 345 35Ó AGA AAT CTA ATG GAT GGT GTT GTT ^T GTC ACT CGT GAT GCT r-iTT TGT 1 Arg Asn Ala He Cys GCA TCA ATA AAG GAT ATG GAG GAG AAA CGG AAC ATA TTG GAA CCA .

Ala Ser He Lys Asp Met ?he Glu Glu Lys Arg Asn lie Leu Glu Pro 370 375 380 GCA GGG GCT CTT GCA CTC GGA GCT GAG TAC X . AAA TAT T.AT 1 Ala Gly Ala Leu Ala Leu Ala Gly Ala Glu Al T r Cys Lys Tyr Tyr 385 390 395 400 GGC CTA AAG GAC GTG AAT GTC GTA ATA ACC AGT GGC GCT AAC ATG 1 Gly Leu Lys Asp Val Asn Val Val Ala lie Thr Ser Gly Ala Asn Me 405 410 415 AAC TTT GAC AAG CTA AGG ATT 1 ACÁ G.AA CTC GCC AAT GTC GGT AGG Asn Phe Asp Lvs Leu Arg He Val Thr Glu Leu Ala Asn Val Gly Arg 420 425 430 CA CAG GAA GCT GTT CTT GCT ACT ATG CCG GAA CCT GGA AGC 1 Gin Gin Glu Ala Val Leu Ala Thr Leu Met Pro Glu Lys Pro Gly Ser 435 440 445 TTT AAG CAÁ TTT TGT GAG CTG GTT GGA CCA ATG AAC ATA AGC GAG TTC - Phe Lys Gln Phe Cys Glu Leu Val Gly Pro Met A.s He Ser Glu Phe 450 455 460 TGT AGC TCG GAA AAG GAG GCT GTT GTA CTA TAC AGT GTC Lys Tyr Arg Cys Ser Ser Glu Lys Giu Ala Val Val Leu Tyr Ser Val 465 470 475 480 GGA GTT CAC ACÁ GCT GGA GAG CTC AAA GCA CTA CAG AAG AGA ATG GAA Gly Val His Thr Ala Gly Glu Leu Lys Ala Leu Gln Lys Arg Met Glu 485 490 495 TCT TCT CAÁ CTC AAA ACT GTC AAT CTC ACT ACC AGT GAC TTA GTG AAA Ser Ser Gln Leu Lys Thr Val Asn Leu Thr Thr Ser Asp Leu Val Lys 500 505 510 GAT CAC CTG TGT TAC TTG ATG GGA GGA AGA TCT ACT GTT GGA GAC GAG 1 Asp His Leu Cys Tyr Leu Met Gly Gly Arg Ser Thr Val Gly Asp Glu 515 520 525 GTT CTA TGC CGA TTC ACC TTT CCC GAG AGA CCT GGT GCT CTA ATG AAC 1 Val Leu Cys Arg Phe Thr Phe Pro Glu Arg Pro Gly Ala Leu Met Asn 530 535 540 TTC TTG GAC TCT TTC AGT CCA CGG TGG AAC ATC ACC CTT TTC CAT TAC 1 Phe Leu Asp Ser Phe Ser Pro Arg Trp Asn He Thr Leu Phe His Tvr 545 550 555 560 CAT GGA CAG GGT GAG ACG GGC GCG AAT GTG CTG GTC GGG ATC CAÁ GTC 1 His Gly Gln Gly Glu Thr Giy Ala Asn Val Leu Val Gly He Gln Val 565 570 575 CCC GAG CAÁ GAA ATG GAG GAA TTT AAA AA.C CGA GCT AAA GCT CTT GGA 1 Pro Glu Gln Glu Met Glu Glu Phe Lys A.sn Arg Ala Lys Ala Leu Gly 580 535 590 TAC GAC TAC TTC TTA GTA AGT GAT GAC GAC TAT TTT AAG CTT. CTG ATG 1 Tyr Asp Tyr Phe Leu Val Ser ASD Asp Asp Tyr Phe Lys Leu Leu Met 595 600 605 CAC TGA 1 His 609 (2) INFORMACIÓN PARA LA SEC ID NO: 4: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1509 nucleótidos (502 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 4 GAA GCT ATG GAG TAT TTG ACG .AAT ATA CTG TCC ACT AAG TAC GAC Glu Ala Met Glu Tyr Leu Thr Asn He Leu Ser Thr Lys Val Tyr Asp 1 5 10 15 ATC GCC ATT GAG TCA CCA CTC CAÍ TTG i .AAG AAG CTA TCT AAG AGA He Ala He Glu Ser Pro Leu Gl: Leu Ala Lys Lys Leu Ser Lys Arg 20 25 30 TTA GGT GTT CGT ATG TAT CTT AAA AGA GAA GAC TTG CAÁ CCT GTA TTC Leu Gly Val Arg Met Tyr Leu Lvs Arg Giu Asp Leu Gin Pro Val Phe 35 40 45 1 TTT AAG CTT CGT GGA GCT TAC AAT ATG ATG GTG AAA CTT CCA GCA Ser Phe Lys Leu Arg Gly Ala Tyr Asn Met Met Val Lys Leu Pro Ala 50 55 60 GAT CAÁ TTG GCA AAA GGA GTT ATC TGC TCT TCA GCT GGA AAC CAT GCT Asp Gln Leu Ala Lys Gly Val He Cys Ser Ser Ala Giy Asn His Ala 65 70 75 80 CAÁ GGA GTT GCT TTA TCT GCT AGT AAA CTC GGC TGC ACT Gv, X GTG ATT Gln Gly Val Ala Leu Ser Ala Ser Lys Leu Gly Cys Thr Ala Val He 85 90 95 GTT ATG CCT GTT ACG ACT CCT GAG ATA AAG TGG CA GCT GTA GAG AAT Val Met Pro Val Thr Thr Pro Giu He Lys Trp Gin Ala Val Glu Asn 100 105 110 TTG GGT GCA ACG GTT GTT CTT T'"""" GGA GAT TCG GAT CAÁ GCA CAÁ Leu Gly Ala Thr Val Val Leu Phe Giy Asp Ser Tyr Aso Gln Ala Gln 115 120 125 GCA CAT AAG ATA CC-A GCT GAA GAA GAG ATA CCT Ala His Ala Lys He Arg Ala Glu Giu Glu Gly Leu T r Phe He Pro 130 135 140 CCT TTT GAT CAC CCT GAT GTT ATT GCT GGA CA GGG GTT GGG ATG Pro Phe Asp His 'Pro Asp Val He Ala Giy Gln Giy Thr Val Gly Met 145 150 155 160 GAG ATC ACT CGT CAG GCT J IJ Í CCA TTG CAT GCT ATA TTT GTG CCA Glu He Thr Arg Gln Ala Lys Gly Pro Leu His Ala ~ T Phe Val Pro 165 170 175 GTT GGT GGT GGT GGT TTA ATA GCT GGT ATT GCT GCT TAT GTG AAG AGG Val Gly Gly Gly Gly Leu He Ala Gly He Ala Ala Tyr Val Lys Arg 180 185 190 GTT TCT CCC GAG GTG AAG ATC ATT GGT GTA GAA CCA GCT GAC GCA AAT Val Ser Pro Giu Val Lys He He Gly Val Glu Pro Ala Aso Ala Asn 195 200 205 GCA ATG GCT TTG TCG CTG CAT CAC GAG AGG GTG ATA TTG GAC CAG Ala Met Ala Leu Ser Leu His His Gly Glu Arg Val He Leu .Asp Gln 210 215 220 GTT GGG GGA TTT GCA GAT GGT GTA GCA GTT AAA GAA GTT GGT GAA GAG 7 Val Gly Gly Phe Ala ASD Gly Val Ala Val Lvs Glu Val Gly Glu Glu 225 230 235 240 ACT TTT CGT ATA AGC AGA AAT CTA ATG GAT GGT GTT GTT CTT GTC ACT 7 Thr P e Arg He Ser Arg Asn Leu Met Asp Gly Val Val Leu Val Thr 245 250 255 CGT GAT GCT ATT TGT GCA TCA ATA AAG GAT ATG TTT GAG GAG AAA CGG 8 Arg Asp Ala He Cys Ala Ser He Lys Asp Met Phe Glu Glu Lys Arg 260 2*65 270 AAC ATA TTG GAA CCA GCA GGG GCT CTT GCA CTC GCT GGA GCT GAG GCA 8 Asn He Leu Glu Pro Ala Gly Ala Leu Ala Leu Ala Giy Ala Glu Ala 275 280 285 TAC r-ir f AAA TAT TAT GGC CTA AAG GTC- AAT GTC GTA GCC ATA ACC 9 Tyr Cys Lys Tyr Tyr Gly Leu Lys Asp Val Asn Val Val Ala He Thr 290 295 300 AGT, GGC GCT AAC ATG AAC TTT GAC AAG CTA AGG ATT GTG ACÁ GAA CTC 9 Ser Giy Ala Asn Met Asn Phe Asp Lys Leu Arg He Val Thr Glu Leu 305 310 315 320 GCC AAT GTC GGT AGG CA CAG GAA GCT GTT CTT ACT CTC ATG CCG 1 Ala Asn Val Gly Arg Gln Gln Glu Ala Val Leu Ala Thr Leu Met Pro 325 330 335 GAA AAA CCT GGA AGC TTT AAG CAÁ TTT TGT GAG CTG GTT GGA CCA ATG 10 Glu Lys Pro Gly Ser Phe Lys Gln Phe Cys Glu Leu Val Glv Pro Met 340 345 350 AAC ATA AGC GAG TTC AAA TAT TGT AGC TCG GAA AAG GAG GCT GTT 1 Asn He Ser Glu Phe Lys Tyr Arg Cys Ser Ser Glu Lys Glu Ala Val 355 360 365 GTA CTA TAC AGT GTC GGA GTT CAC ACÁ GCT GGA GAG CTC AAA GCA CTA Val Leu Tyr Ser Val Gly Val His Thr Ala Gly Glu Leu Lys Ala Leu 370 375 380 CAG AAG AGA ATG GAA TCT TCT CAÁ CTC AAA ACT GTC AAT CTC ACT ACC 1 Gln Lvs Arg Met Glu Ser Ser Gln Leu Lys Thr Val Asn Leu Thr Thr 385 " 390 395 400 AGT GAC TTA GTG AAA GAT CAC CTG TGT TAC TTG ATG GGA GGA AGA TCT 1 Ser Asp Leu Val Lys Asp His Leu Cys Tyr Leu Met Gly Gly Arg Ser 405 410 415 ACT GTT GGA GAC GAG GTT CTA TGC CGA TTC ACC TTT CCC GAG AGA CCT .

Thr Val Gly Aso Glu Val Leu Cvs Arg Phe Thr Phe Pro Glu Arg Pro 420 425 430 GGT GCT CTA ATG AAC TTC TTG GAC TCT TTC AGT CCA CGG TGG AAC ATC 1 Gly Ala Leu Met Asr. Phe Leu Asp Ser Phe Ser Pro Arg Tro Asn He 435 44*0 445 ACC CTT TTC CAT TAC CAT GGA CAG GGT GAG ACG GGC GCG AAT GTG CTG 1 Thr Leu Phe His Tyr His Gly Glr. Giy Glu Thr Gly Ala Asn Val Leu 450 455 460 GTC GGG ATC CAÁ GTC CCC GAG CA GAA ATG GAG GAA TTT AAA AAC CGA 1 Val Gly He Gln Val Pro Glu Gln Glu Met Glu Giu Phe Lys Asn Arg 465 470 475 430 GCT AAA GCT CTT GGA TAC GAC TAC — - x/-? vji? HUÍ GAT GAC GAC TAT 14 Ala Lys Ala Leu Gly Tvr Aso Tyr Phe Leu Val Ser Asp Asp Asp Tyr 485 490 ' -495 TTT AAG CTT CTG ATG CAC TGA 15 Phe Lvs Leu Leu Met His 500 '2) INFORMACIÓN PARA LA SEC ID NO: 5: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1620 nucleótidos (539 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 5: AAG CTT CCT TTA CCA CGT CTT AAG GTC TCT CCG AAT TCG TTG CAÁ TAC Lys Leu Pro Leu Pro Arg Leu Lys Val Ser Pro Asn Ser Leu Gln Tyr 1 5 10 15 CCT GCC GGT TAC CTC GGT GCT GTA CCA GAA CGT ACG AAC GAG GCT GAG Pro Ala Gly Tyr Leu Gly Ala Val Pro Glu Arg Thr Asn Glu Ala Glu 20 25 30 AAC GGA AGC ATC GCG GAA GCT ATG GAG TAT TTG ACG AAT ATA CTG TCC Asn Gly Ser He Ala Glu Ala Met Glu Tyr Leu Thr Asn He Leu Ser 35 4C 45 ACT AAG GTT TAC GAC ATC GCC ATT GAG TCA CCA CTC CAÁ TTG GCT AAG Thr Lys Val Tyr Asp He Ala He Glu Ser Pro Leu Gln Leu Ala Lys 50 55 60 AAG CTA TCT AAG AGA TTA GGT GTT CGT ATG TAT CTT AAA AGA GAA GAC Lys Leu Ser Lys Arg Leu Gly Val Arg Met Tyr Leu Lys Arg Glu Asp 65 70 " 75 80 TTG CAÁ CCT GTA TTC TCG TTT AAG CTT CGT GGA GCT TAC AAT ATG ATG Leu Gln Pro Val Phe Ser Phe Lys Leu Arg Gly Ala Tyr Asn Met Met 85 90 95 GTG AAA CTT CCA GCA GAT CAÁ TTG GC.A AAA GGA GTT ATC TGC TCT TCA Val Lys Leu Pro Ala Asp Gln Leu Ala Lys Gly Val He Cys Ser Ser 100 105 110 GCT GGA AAC CAT GCT CAÁ GGA GTT GCT TTA TCT GCT AGT AAA CTC GGC Ala Gly Asn His Ala Gin Gly Val Ala Leu Ser Ala Ser Lys Leu Gly 115 120 ' 125 TGC ACT GCT GTG ATT GTT ATG CCT GTT ACG ACT CCT GAG ATA AAG TGG Cys Thr Ala Val He Val Met Pro Val Thr Thr Pro Giu He Lys Trp 130 135 140 CAÁ GCT GTA GAG AAT TTG GGT GC.A ACG GTT GTT CTT TTC GGA GAT TCG Gln Ala Val Glu Asn Leu Gly Ala Thr Val Val Leu Phe Gly Asp Ser 145 150 155 160 TAT GAT CAÁ GCA CAÁ GCA CAT GCT AAG ATA CGA GCT GAA GAA GAG GGT Tyr A.sp Gln Ala Gln Ala His Ala Lys He Arg Ala Giu Glu Glu Gly 165 170 175 CTG ACG TTT ATA CCT CCT TTT GAT v-r-.v- CCT GAT GTT ATT GCT GGA CAÁ Leu Thr Phe He Pro Pro Phe Asp His Pro Asp Val He Ala Gly Gln 180 185 190 GGG ACT GTT GGG ATG GAG ATC ACT CGT CAG GCT AAG GGT CCA TTG CAT Gly Thr Val Gly Met Glu He Thr Arg Gln Ala Lys Gly Pro Leu His 195 200 205 ? GCT ATA TTT GTG CCA GTT GGT GGT GGT GGT TTA ATA GCT GGT ATT GCT Ala He Phe Val Pro Val Gly Gly Gly Gly Leu He Ala Gly He Ala 210 215 220 GCT TAT GTG AAG AGG GTT TCT CCC GAG GTG AAG ATC ATT GGT GTA GAA Ala Tyr Val Lys Arg Val Ser Pro Glu Val Lys He He Gly Val Glu 225 230 235 240 CCA GCT GAC GCA AAT GCA ATG GCT TTG TCG CTG CAT CAC GGT GAG AGG Pro Ala Asp Ala Asn Ala Met Ala Leu Ser Leu His Kis Gly Glu Arg 245 250 255 GTG A TA TTG GAC CAG GGG GGA TTT GCA GAT GGT GTA GCA GTT AAA Val le Leu Aso Gin Val Gly Giy Phe Ala Asp Gly Val Ala Val Lvs 26*0 265 GAA GTT GGT GAA GAG ACT TTT CGT ATA AGC AGA AAT CTA ATG GAT GGT Glu Val Glv Glu Glu Thr Arg Asn Leu Met Asp Giv 275 280 285 GTT GTT CTT GTC ACT CGT ?X (j i r.- i J.G- GCA TCA ATA AAG GAT ATG Val Val Leu Val Thr Arg Asp Ala He Cvs Ala Ser He Lys Aso Met 290 29*5 300 TTT GAG GAG AAA CGG AAC ATA TTG GAA CCA GCA GGG GCT CTT GCA CTC Phe Glu Glu Lys Arg Asn lie Leu Glu Pro Ala Gly Ala Leu Ala Leu 305 " " 310 315 320 GCT GGA GCT GAG GCA TAC GGC - ln AAG GAC GTG AAT Ala Gly A.la Giu Ala Tyi Cvs Lys Tyr Tvr Giy Leu Lys Asp Val Asn 330 -* -. D GTC GTA GCC •- r* * TTT GAC A.AG CTA AG Val Val Ala He hr Ser Giy Ala Asn Met Asn Phe Asp Lys Leu Ar: 340 345 350 ATT GTG ACÁ GAA CTC GCC AAT GTC GGT AGG CAG GAA GCT GTT C71 He Val Thr Giu Leu Ala Asn Val Giy Arg Gln Gin Glu Ala Val Leí 355 360 365 GCT ACT CTC ATG CAÁ T"T"T TGT GAG Ala Thr Leu Met Pro Giu Lvs Pro Gly Ser Phe Lvs Gln Phe Cys Glu 370 375 380 CTG GTT GGA CCA ATG AAC ATA AGC GAG TTC AAA TAT AGA TGT AGC TCG .

Leu Val Gly Pro Met Asn He Ser Giu no Lys Tyr Arg Cys Ser Ser 385 390 395 400 GAA AAG GAG GCT GTT GTA CTA TAC AGT GTC GGA GTT CAC ACÁ GCT GGA 1 Glu Lvs Glu Ala Val Val Leu Tyr Ser Val Gly Val His Thr Ala Gly 405 410 415 GAG CTC AAA GCA CTA AAG AGA ATG GAA - V-T TCT CAÁ CTC AAA ACT 1 Glu Leu Lys Ala Leu Gln Lys Arg Me Glu Ser Ser Gin Leu Lys Thr 420 425 430 GTC A-AT CTC ACT ACC AGT GAC TTA GTG GAT CAC CTG TGT TAC TTG Val Asn Leu Thr T r Ser Asp Leu Val Ly= Asp His Leu Cys Tyr Leu 435 440 445 GGA GGA AGA TCT ACT G T GGA GAC GAG GTT CTA TGC CGA TTC ACC 1 Met Gly Gly Arg Ser Thr Val Giy Asp Glu Val Leu Cys Arg P Thr 450 455 460 TTT CCC GAG AGA CCT GGT GCT r~ T . A.TG AAC TTC TTG GAC TCT TTC AGT Phe Pro Glu Arg Pro Giy Ala Leu Ke Asn Phe Leu Asp Ser Phe Ser 465 470 475 480 CCA CGG TGG AAC ATC ACC CTT TC TP.C CAT GGA CAG GGT GAG ACG Pro Arg Trp Asn He Thr Leu Phe His Tyr His Giy Gln Gly Glu Thr 485 490 495 GGC GCG AAT GTG CTG GTC GGG A.TC CA GTC CCC GAG CAÁ GAA ATG GAG Giy Ala Asn Val Leu Val Giy He Gln Val Pro Glu Gln Glu Met Glu 500 505 510 GAA TTT AAA AAC CGA GCT AAA GCT CTT GGA TAC GAC TAC TTC TTA GTA Glu Phe Lys Asn Arg Ala Lys Ala Leu Gly Tyr Asp Tyr Phe Leu Val 515 520 525 AGT GAT GAC GAC ? T T X AAG CTT ATG CAC TGA Ser Asp Asp Asp Tyr Phe Lvs Leu Leu Met His 530 535 (2) INFORMACIÓN PARA LA SEC ID NO: 6: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1599 nucleótidos (532 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 6: r-H VJVJ _ j , l Lys Glv Ala 1 15 GTA CCA GAA CGT ACG AAC GAG GCT GAG AAC GGA AGC ATC GCG GAA GCT Val Pro Glu Arg Thr Asn Glu Ala Glu Asn Gly Ser He Ala Glu Ala 20 25 30 ATG GAG TAT TTG ACG AAT ATA CTG TCC ACT AAG GTT TAC GAC ATC GCC 1 Met Glu Tyr Leu Thr Asn He Leu Ser Thr Lys Val Tyr Asp He Ala 35 40 45 ATT GAG TCA CCA CTC CA TTG GCT AAG AAG CTA TCT AAG AGA TTA GGT 1 He Glu Ser Pro Leu Gln Leu Ala Lys Lvs Leu Ser Lys Arg Leu Gly 50 55 * 60 GTT CGT A G TAT CTT AAA AGA GAA CCT GTA TTC TCG TTT Val Arg Met Tyr Leu Lvs Arg Glu Asp Leu Gin Pro Val P e Ser Phe 65 70 75 80 AAG CTT CGT GGA GCT TAC .AAT ATG ATG GTG AAA CTT CCA GCA n x CAÁ Lys Leu Arg Giy Ala Tyr As Met M Val Lys Leu Pro Ala Aso Gln 85 90 95 TTG GCA AAA GGA GTT ATC TGC TCT - ,? GCT GGA AAC CAT GCT CAÁ GGA Leu Ala Lys' Giv Val He Cys Ser Ser Aia Gly Asn His Ala Gln Gly 10Ó 105 110 GTT GCT TTA GCT AGT AAA CTC GGC TGC ACT GCT xb ATT GTT ATG Val Ala Leu Ser Ala Ser Lys Leu Giy Cys Thr Aia Val He Val Met 115 120 125 CCT GTT ACG ACT CCT GAG ATA AAG TGG CAÁ GCT GTA GAG AAT TTG GGT Pro Val Thr Thr Pro Giu He Lys Trp Gln Aia Val Glu Asn Leu Gly 130 135 140 GCA ACG GTT GTT CTT TTC GGA GAT TCG TAT GAT CAÁ GCA GCA CAT Ala Thr Val Val Leu Phe Gly As? Ser Tyr Asp Gln Ala Gln Ala His 145 150 155 160 GCT AAG ATA CGA GCT GAA GAA Gr-.vr GGT -Tvj ACG TTT ATA CCT CCT TTT Ala Lys He Arg Aia Glu Glu Glu Gly Leu Thr Phe He Pro Pro Phe 165 170 175 GAT CAC CCT GAT GTT ATT GCT GC-A CA GGG ACT GTT GGG ATG- GAG ATC Asp Kis Pro Aso Val He Ala Giy Gln Gly Thr Val Gly Met Glu He 130 135 190 ACT CGT CAG GCT AAG GGT CC. T"*G CAT GCT Thr Arg Gln Ala Lys Gly Pro Leu His Ala He Phe Val Pro Val Gly 195 200 205 GGT GGT- GGT TTA ATA GCT GGT ATT GCT GCT TA.T GTG AAG AGG GTT TCT Giy Gly Gly Leu He Ala Gly He Ala Ala Tyr Val Lys Arg Val Ser 210 215 220 CCC GAG GTG AAG ATC ATT GGT GTA GAA CCA GCT GAC GCA AAT GCA ATG Pro Giu Val Lys He He Gly Val Glu Pro Ala Asp Ala Asn Ala Met 225 230 235 240 GCT TTG TCG CTG CAT CAC GGT GAG AGG GTG ATA TTG GAC CAG GTT GGG Ala Leu Ser Leu His Kis Gly Glu Arg Val He Leu Asp Gln Val Gly 245 250 255 GGA TT GCA GAT GGT GTA GCA GTT AAA GAA GTT X GAA GAG ACT TTT Gly Phe Ala Asp Gly Val Ala Val Lvs Glu Val Gly Giu Glu Thr Phe 26*0 2*65 270 CGT ATA AGC AGA AAT CTA ATG GAT GGT GTT GTT CTT GTC ACT CGT GAT 8 Arg He Ser Arg Asn Leu Met Aso Giy Val Val Leu Val Thr Arg Asp 275 23*0 235 GCT ATT TGT GCA TCA ATA AAG GAT ATG TTT GAG GAG AAA CGG AAC ATA 9 Ala He Cys Ala Ser He Lys Asp Met Phe Glu Glu Lys Arg Asn He 290 295 300 TTG GAA CCA GCA GGG GCT CTT GCA CTC GCT GGA GCT GAG GCA TAC TGT 9 Leu Glu Pro Ala Gly Ala Leu Ala Leu Ala Gly Ala Glu Ala Tyr Cys 305 310 315. 320 AAA TAT TAT GGC CTA AAG GAC GTG AAT GTC GTA GCC ATA ACC AGT GGC 10 Lys Tyr Tyr Gly Leu Lys Asp Val Asn Val Val Ala He Thr Ser Gly 325 330 335 GCT AAC ATG AAC TTT GAC AAG CTA AGG ATT GTG ACÁ GAA CTC GCC AAT 10 Aia Asn Me Asn Phe Asp Lys Leu Aro He Val Thr Glu Leu Ala Asn 340 345 350 GTC GGT AGG CAÁ CAG GAA GCT GTT CTT GCT ACT CTC ATG CCG GAA AAA .1 Val Gly Are Gln Gin Glu Ala Val eu Ala Thr Leu Met Pro Giu Lys 355 360 365 CCT GGA AGC -TTT AAG CAÁ TTT TGT CTG GTT GGA CCA ATG AAC ATA 11 Pro Gly Ser Phe Lys Gln Phe Cys Giu Leu Val Gly Pro Met Asn He 370 375 380 AGC GAG TTC AAA i i-. i AGA TGT ? C TCG GAA AAG GAG GCT GTT GTA CTA 12 Ser Glu Phe Lys Tyr Arg Cys Ser Ser Glu Lvs Glu Ala Val Val Leu 385 39Ó 395 400 TAC AGT GTC GGA GTT CAC ACÁ GCT GGA GAG CTC AAA GCA CTA CAG AAG 12 Tyr Ser Val Gly Val His Thr Ala Gly Glu Leu Lys Ala Leu Gln Lys 405 410 415 AGA ATG GAA TCT TCT CAÁ CTC AAA ACT GTC AAT CTC ACT ACC AGT GAC 12 Á g- Me Glu Ser Ser Gln Leu Lys Thr Val Asn Leu Thr Thr Ser Asp 420 425 430 TTA GTG AAA GAT CAC CTG TGT TAC TTG ATG GGA GGA AGA TCT ACT GTT 13 Leu Val Lys Asp His Leu Cys Tyr Leu Met Giy Gly Arg Ser Thr Val 435 440 445 GGA GAC GAG GTT CTA TGC CGA TTC ACC TTT CCC GAG AGA CCT GGT GCT 13 Gly Asp Glu Val Leu Cys Arg Phe Thr Phe Pro Glu Arg Pro Gly Ala 450 455 460 CTA ATG AAC TTC TTG GAC TCT TTC AGT CCA CGG TGG AAC ATC ACC CTT 1 Leu Met Asn Phe Leu Asp Ser Phe Ser Pro Arg Trp Asn He Thr Leu 465 47*0 475 480 TTC CAT TAC CAT GGA CAG GGT GAG ACG GGC GCG AAT GTG CTG GTC GGG Phe His Tyr His Gly GIn Gly Glu Thr Gly Ala Asn Val Leu Val Glv 435 490 495 ATC CAÁ .GTC CCC GAG CAÁ GAA ATG GAG GAA TTT AAA AAC CGA GCT "AAA lie Gln Val Pro Glu Gln Giu Met Giu Glu Phe Lys Asn Ar'g A^ a Lvs 500 505 510 ' GCT CTT GGA TAC GAC TAC TTC TTA GTA AGT GAT GAC GAC TAT TTT AAG Ala Leu Giy Tyr Asp Tyr Phe Leu Val Ser Aso Aso Asp Tv Phe Lvs 515 520 525 " CTT CTG ATG CAC TGA Leu Leu Met His 530 (2) INFORMACIÓN PARA LA SEC ID NO: 7: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 720 nucleótidos (240 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 7: TCA ATA AAG GAT ATG TTT GAG GAG AAA CGG AAC ATA TTG GAA CCA GCA Ser He Lys Asp Met Phe Glu Glu Lys Arg Asn He Leu Glu Pro Ala 10 15 GGG GCT CTT GCA CTC GCT GGA GCT GAG GCA TAC TGT AAA TAT TAT GGC Gly Ala Leu Ala Leu Ala Gly Ala Glu Ala Tyr Cys Lys Tyr Tyr Gly 20 25 30 CTA AAG GAC GTG AAT GTC GTA GCC ATA ACC AGT GGC GCT AAC ATG AAC Leu Lys Asp Val A=n Val Val Ala He Thr Ser Gly Ala Asn Met Asn 35 40 45 TTT GAC AAG CTA AGG ATT GTG ACÁ GAA CTC GCC AAT GTC GGT AGG CAÁ Phe A=p Lys Leu Arg He Val Thr Glu Leu Ala Asn Val Gly Arg Gln 50 55 60 CAG GAA GCT GTT CTT GCT ACT CTC ATG CCG GAA AAA CCT GGA AGC TTT Gln Gíu Ala Val Leu Ala Thr Leu Met Pro Glu Lys Pro Giy Ser Phe 65 70 75 80 AAG CAÁ TTT TGT GAG CTG GTT JVJ? CCA ATG AAC ATA AGC GAG TTC ?AA Lys Gln Phe Cys Glu Leu Val Giy Pro Met Asn He Ser Glu Phe -ys 85 90 95 TAT AGA TGT AGC TCG GAA AAG GCT GTT GTA CTA TAC AGT GTC GGA Tyr Arg Cys Ser Ser Glu Lys Giu Ala Val Val Leu Tyr Ser Val Gly 100 105 110 GTT CAC ACÁ GCT GGA GAG CTC AAA GCA CTA CAG AAG AGA ATG GAA TCT Val His Thr Ala Gly Glu Leu L s Ala Leu Gln Lys Arg Met Glu Ser 115 120 125 CAÁ CTC AAA ACT GTC AAT CTC ACT ACC AGT GAC TTA GTG AAA GAT Ser Gln Leu Lys Thr Val Asn Leu Thr Thr Ser Asp Leu Val Lys Asp 130 135 140 CAC CTG TGT TAC TTG ATG GGA G A AGA ACT GTT GGA GAC GAG GTT His Leu Cys Tyr Leu Met Gly Gly Arg Ser Thr Val Gly Asp- Glu Val 145 150 155 160 CTA TGC CGA TTC ACC TTT CCC GAG AGA CCT GGT GCT CTA ATG AAC TTC Leu Cys Arg Phe Thr Phe Pro Glu Arg Pro Gly Ala Leu Met Asn Phe 165 170 175 TTG GAC TCT TTC AGT CCA CGG TGG AAC ATC ACC CTT TTC CAT TAC CAT Leu Asp Ser Phe Ser Pro Arg Trp Asn He Thr Leu Phe His Tyr His 180 185 190 GGA CAG GGT GAG ACG GGC Gv.G AAT GTG CTG GTC GGG ATC CAÁ GTC CCC Gly Gln Gly Glu Thr Giy Ala Asn Val Leu Val Gly He Gln Val Pro 195 200 205 GAG CAÁ GAA ATG GAA TTT AAA AAC CGA GCT AAA GCT CTT GGA TAC Glu Gln Glu Met Glu Glu Phe Lys Asn Arg Ala Lys Ala Leu Giy Tyr 210 215 220 GAC TAC TTC TTA GTA AGT GAT GAC TAT TTT AAG CTT CTG ATG CAC Asp Tyr Phe Leu Val Ser Asp Asp Asp Tyr Phe Lys Leu Leu Met His 225 230 235 240 INFORMACIÓN PARA LA SEC ID NO: 8: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 81 nucleótidos (27 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 8: GTC AAT CTC ACT ACC AGT GAC TTA GTG AAA GAT CAC CTG TGT TAC TTG 4 Val Asn Leu Tnr Thr Ser Asp Leu Val Lys ASD His Leu Cys Tvr Leu 1 5 10 is ATG GGA GGA AGA TCT ACT GTT GGA GAC GAG GTT Met Giy Gly Arg Ser Thr Val Gly Aso Glu Val 20 " 25 (2) INFORMACIÓN PARA LA SEC ID NO: 9: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 75 nucleótidos (25 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEC ID NO: 9: TGG AAC ATC ACC CTT TTC CAT TAC CAT GGA CAG GGT GAG ACG GGC GCG 4 Trp Asn He Thr Leu Phe His Tyr His Gly Gln Gly Glu Thr Gly Ala 10 15 AAT GTG CTG GTC GGG ATC CAÁ GTC CCC Asn Val Leu Val Gly He Gin Val Pro 20 25 (2) INFORMACIÓN PARA LA SEC ID NO: 10: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1635 nucleótidos (545 aminoácidos) (B) TIPO: ácido nucleico (C) TIPO DE HEBRA: única (D) TOPOLOGÍA: lineal ( ii ) T I PO DE MOLÉCULA: ADNc ( xi ) DESCRI PCIÓN DE LA SECUENCIA : SEC ID NO : 10 : ATG ACT CCA CCG CCT CCA AAG CTT CCT TTA CCA CGT CTT AAG GTC TCT Met Thr Pro Pro Pro Pro Lys Leu Pro Leu Pro Arg Leu Lys Val Ser 1 5 10 15 CCG AAT TCG TTG v^.~_.-? T.AC CCT GCC GGT TAC CTC GGT GCT GTA CCA GAA Pro Asn Ser Leu Gln Tyr Pro Ala Glv Tyr Leu Gly Ala Val Pro Glu 20 25 30 CGT ACG AAC GAG GCT GAG AAC GGA AGC ATC GCG GAA GCT ATG GAG TAT Arg Thr Asn Glu Ala Glu Asn Gly Ser He Ala Giu Ala Met Glu Tyr 35 40 45 TTG ACG AAT ATA CTG TCC ACT AAG GTT TAC GAC ATC GCC ATT GAG TCA Leu Thr Asn He Leu Ser Thr Lys Val Tyr Asp He Ala He Glu Ser 50 55 60 CCA CTC CAÁ TTG GG AAG AAG CTA xC. AAG AGA TTA GGT GTT CGT ATG Pro Leu Gin Leu Ala Lys Lys Leu Ser Lys Arg Leu Gly Val Arg Met 65 70 75 80 TAT CTT AAA AGA GAA GAC TTG CCT GTA TTC TCG TT AAG CTT CGT Tyr Leu Lys Arg Glu Asp Leu Gin Pro Val Phe Ser Phe Lys Leu Arg 85 90 95 GGA GCT TAC AAT ATG ATG GTG AAA CTT CCA GCA GAT CAÁ TTG GCA AAA Gly Ala Tyr Asn Met Met Val Lys Leu Pro Ala Asp Gln Leu Ala Lys 100 105 110 GGA GTT ATC TGC TCT TCA GCT GGA AAC CAT GCT CAÁ GGA GTT GCT TTA Giy Val He Cys Ser Ser Ala Gly Asn His Aia Gln Gly Val Ala Leu 115 120 125 TCT GCT AGT AAA CTC GGC TGC ACT GCT GTG ATT GTT ATG CCT GTT ACG Ser Ala Ser Lys Leu Gly Cys Thr Ala Val He Val Met Pro Val Thr 130 135 140 ACT CCT GAG ATA AAG TGG CAÁ GCT GTA GAG AAT TTG GGT GCA ACG GTT Thr Pro Glu He Lys Tro Gln Ala Val Glu Asn Leu Gly Ala Thr Val 145 15*0 155 160 GTT CTT TTC GGA GAT TCG TAT GAT CAÁ GCA CAÁ GCA CAT GCT AAG ATA Val Leu Phe Gly Aso Ser Tyr Asp Gln Ala Gin Ala His Ala Lys He 165 170 175 CGA GCT GAA GAA GGT CTG ACG TTT ATA CCT CCT TTT GAT CAC CCT Arg Ala Glu Glu Glu Gly Leu Thr Phe He Pro Pro Phe Asp His Pro 180 185 19*0 GAT GTT ATT GCT GGA CA GGG ACT GTT GGG ATG GAG ATC ACT CGT CAG Asp Val He Ala Gly GIn Gly Thr Val Gly Met Giu He Thr Arg Gln 195 200 205 GCT AAG GGT CCA TTG CAT GCT ATA TT GTG CCA GTT GGT GGT oo X GGT Ala Lys Gly Pro Leu His Ala He Phe Val Pro Val Gly Gly Gly Gly 210 215 220 TTA ATA GCT GGT J rr"V GCT GCT TAT GTG AAG AGG GTT TCT CCC GAG GTG Leu He Ala Giy He Ala Aia Tyr Val Lys Arg Val Ser Pro Giu Val 225 230 235 240 AAG X GTA GAA CCA GCT GAC GCA A_AT GCA ATG GCT TTG TCG Lys He He Gly Val Glu Pro Aia Asp Ala Asn Ala Met Ala Leu Ser 245 250 255 CTG C.AT CAC GGT GAG AGG GTG ATA TTG GAC CAG GTT GGG GGA TTT GCA Leu His Hís Gly Glu Arg Val He Leu Asp Gln Val Gly Gly Phe Ala 260 265 270 GAT GGT GTA GCA GTT AAA GAA GTT oo GAA GAG ACT TTT CGT ATA AGC Asp Giy Val Ala Val Lys Glu Val Gly Giu Glu Thr Phe Arg He Ser 275 280 285 AGA AAT CTA ATG GAT V3 * GTT GTT CTT GTC ACT CGT GAT GCT ATT TGT Arg Asn Leu Met Asp Gly Val Val Leu Val Thr Arg Asp Ala He Cys 2S0 295 300 GCA TCA ATA AAG VJ? TTT GAG AAA AAC ATA TTG GAA CCA Ala Ser He Lys Asp Met Phe Glu Glu Lys Arg Asn He Leu Glu Pro 305 310 315 320 GCA GGG GCT CTT GCA CTC GCT GGA GCT GAG GCA TAC TGT AAA TAT TAT 1 Ala Gly Ala Leu Aia Leu Ala Gly Aia Glu Ala Tyr Cys Lys Tyr Tyr 325 330 335 GGC CTA AAG GAC GTG AAT GTC GTA GCC ATA ACC AGT GGC GCT AAC ATG 1 Gly Leu Lys Asp Val Asn Val Val Ala He Thr Ser Gly Ala Asn Met 340 345 350 AAC TTT GAC AAG CTA AGG ATT GTG ACÁ GAA CTC GCC AAT GTC GGT AGG 1 Asn Phe Asp Lys Leu Arg He Val t- »- Giu Leu Ala Asn Val Gly Arg 355 360 365 CAÁ CAG GAA GCT GTT CTT GCT ACT CTC ATG CCG GAA AAA CCT GGA AGC 1 Gln Gln Glu Ala Val Leu Ala Thr Leu Met Pro Glu Lys Pro Gly Ser 370 375 380 TTT AAG CAÁ TTT TGT GAG CTG GTT GGA CCA ATG AAC ATA AGC GAG TTC 1 Phe Lys Gln Phe Cys Glu Leu Val Gly Pro Met Asn lie Ser Glu Phe 385 3S0 395 400 AAA TAT AGA TGT AGC TCG GAA AAG GAG GCT X GTA CTA TAC AGT GTC 1 Lys Tyr Arg Cys Ser Ser Glu Lys Glu Ala Val Val Leu Tyr Ser Val 405 410 415 ? GGA GTT CAC ACÁ GCT GGA GAG CTC AAA GCA CTA CAG AAG AGA ATG GAA 1 Gly Val His Thr Ala Gly Glu Leu Lys Ala Leu Gln Lys Arg Met Glu 420 425 430 TCT TCT CAÁ CTC AAA ACT GTC AAT CTC ACT ACC rt i GAC TTA GTG AAA 1 Ser Ser Gln Leu Lys Thr Val Asn Leu Thr Thr Ser Asp Leu Val Lys 435 440 445 GAT CAC CTG TGT TAC TTG ATG GGA GGA AGA TCT ACT GTT GGA GAC GAG 1 Asp His Leu Cys Tyr Leu Met Gly Gly Arg Ser Thr Val Gly Asp Glu 450 455 460 GTT CTA TGC CGA TTC ACC TTT CCC GA.G AGA CZT GGT GCT CTA ATG AAC 1 Val Leu Cys Arg Phe Thr Phe Pro Glu Arg Pro Gly Ala Leu Met Asn 465 470 475 480 TTC TTG GAC TTC AGT CCA CGG TGG AAC ATC ACC CTT TTC CAT TAC 1 Phe Leu Asp Ser Phe Ser Pro Arg Trp Asn He Thr Leu Phe His Tyr 485 490 495 CAT GGA CAG GGT GAG ACG ^ GCG AAT GTG CTG GTC GGG ATC CAÁ GTC 1 His Gly Gln Gly Glu Thr Gly Ala Asn Val Leu Val Gly He Gln Val 500 505 510 CCC GAG CAÁ GAA ATG GAG GAA TTT AAA AAC CGA GCT AAA GCT CTT GGA 1 Pro Glu Gln Glu Met Glu Glu Phe Lys Asn Arg Ala Lys Ala Leu Gly .515 520 525 TAC GAC TAC TTC TTA GTA AGT GAT GAC GAC TAT TTT AAG CTT CTG ATG 1 Tyr Asp Tyr Phe Leu Val Ser A.sp Asp Asp Tyr Phe Lys Leu Leu Met 530 535 540 CAC TGA His 545 Se hace constar que con relación a esta fecha el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes

Claims

REIVINDICACIONES

1. Un polinucleótido aislado, caracterizado porque comprende una secuencia de nucleótidos que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.

2. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 2.

3. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 3.

4. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 4.

5. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 5.

6. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 6.

7. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 7.

8. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 8.

9. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 9.

10. El polinucleótido de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con respecto a la secuencia descrita en la SEC ID NO: 10.

11. Un polinucleótido, caracterizado porque comprende una secuencia de nucleótidos seleccionada del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.

12. Un polinucleótido, caracterizado porque tiene una secuencia de nucleótidos que codifica una enzima de treonina deshidratasa/desaminasa insensible a la retroalimentación, funcional y porque se hibridiza bajo condiciones moderadamente estrictas con un elemento seleccionado del grupo que consiste de la secuencia de nucleótidos descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.

13. Una secuencia de nucleótidos que codifica una secuencia de aminoácidos seleccionada del grupo que consiste de la secuencia de aminoácidos descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10 y las secuencias de aminoácidos substancialmente similares a las mismas.

14. Un método para producir células resistentes a los análogos estructurales de la isoleucina, caracterizado porque comprende: colocar en una célula una construcción que comprende en la dirección 5' a 3' de la transcripción un promotor funcional en la célula, una primera secuencia de nucleótidos que codifican un péptido de transito operable fijado al promotor, una segunda secuencia de nucleótidos que codifica una forma insensible a la retroalimentación, mutante, de la treonina desaminasa/deshidratasa fijada operativamente a la primera secuencia, y una región de terminación funcional en la célula fijada operativamente a la segunda secuencia; y hacer crecer la célula transformada por lo cual las primera y segunda secuencias de nucleótidos son expresadas para proporcionar un polipéptido del precursor; en donde el polipéptido del precursor permite que la célula sea resistente a los análogos estructurales de la isoleucina.

15. El método de conformidad con la reivindicación 14, caracterizado porque el polipéptido del precursor comprende una secuencia de aminoácidos seleccionada del grupo que consiste de la secuencia de aminoácidos descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10 y las secuencias de aminoácidos substancialmente similares a las mismas.

16. El método de conformidad con la reivindicación 14, caracterizado porque la célula se selecciona del grupo que consiste de una célula de la planta, una célula bacteriana, una célula fungosa y una célula de levadura.

17. Una célula, caracterizada porque se produce de acuerdo con el método de conformidad con la reivindicación 14.

18. Una construcción de ADN, caracterizada porque comprende un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es substancialmente resistente a la inhibición de la retroalimentación.

19. La construcción de ADN de conformidad con la reivindicación 18, caracterizada porque la secuencia de nucleótidos tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.

20. La construcción de ADN de conformidad con la reivindicación 18, caracterizada porque el promotor es un promotor de una planta.

21. La construcción de ADN de conformidad con la reivindicación 18, caracterizada porque el promotor tiene una identidad substancial con un promotor de treonina deshidratasa/desaminasa natural .

22. Un vector útil para transformar una célula, el vector está caracterizado porque comprende una secuencia de nucleótidos que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.

23. Una planta transformada con el vector de conformidad con la reivindicación 22, o la progenie de la misma, la planta está caracterizada porque es capaz de expresar la secuencia de nucleótidos.

24. La planta de conformidad con la reivindicación 23, caracterizada porque la planta se selecciona del grupo que consiste de gimnospermas, arroz, trigo, cebada, centeno, maíz, papa, zanahoria, camote, frijol, arveja, achicoria, lechuga, col, coliflor, brócoli, nabo, rábano, espinaca, espárrago, cebolla, ajo, berenjena, pimienta, apio, chayóte, calabaza, calabacín, pepino, manzana, pera, membrillo, melón, ciruela, cereza, durazno, melocotón, albaricoque, fresa, uva, frambuesa, zarzamora, pina, aguacate, papaya, mango, banana, soya, tabaco, tomate, sorgo y caña de azúcar.

25. Un microorganismo transformado con el vector de conformidad con la reivindicación 22, o la progenie del mismo, el microorganismo está caracterizado porque es capaz de expresar la secuencia de nucleótidos.

26. El microorganismo de conformidad con la reivindicación 25, caracterizado porque el microorganismo es una célula de una levadura.

27. El microorganismo de conformidad con la reivindicación 25, caracterizado porque el microorganismo es una célula bacteriana.

28. El microorganismo de conformidad con la reivindicación 25, caracterizado porque el microorganismo es una célula fungosa.

29. Una célula, caracterizada porque tiene incorporada en la misma una secuencia de nucleótidos extraña que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.

30. La célula de conformidad con la reivindicación 29, caracterizada porque la célula es un microorganismo .

31. La célula de conformidad con la reivindicación 29, caracterizada porque la célula es una célula bacteriana.

32. La célula de conformidad con la reivindicación 29, caracterizada porque la célula es una célula fungosa.

33. La célula de conformidad con la reivindicación 29, caracterizada porque la célula es una célula de levadura.

34. La célula de conformidad con la reivindicación 29, caracterizada porque la célula es una célula vegetal.

35. Una planta que tiene incorporada en su genoma una construcción de ADN extraña que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la ?EC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.

36. Una célula, caracterizada porque tiene incorporada en su genoma una secuencia de nucleótidos extraña que codifica una treonina deshidratasa/desaminasa que es substancialmente resistente a la inhibición de la retroalimentación .

37. Un método, caracterizado porque comprende: incorporar en un genoma de la planta una construcción de ADN para proporcionar una planta transformada, la construcción comprende un promotor enlazado operativamente a una secuencia de nucleótidos que tiene una identidad substancial con respecto a un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10; en donde la planta transformada es capaz de expresar la secuencia de nucleótidos.

38. Un método, caracterizado porque comprende: proporcionar un vector que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es resistente a la inhibición de la retroalimentación, en donde el promotor regula la expresión de la secuencia de nucleótidos en una célula de la planta huésped; y transformar una planta de blanco u objetivo con el vector para proporcionar una planta transformada, la planta es capaz de expresar la secuencia de nucleótidos.

39. El método de conformidad con la reivindicación 38, caracterizado porque la treonina deshidratasa/desaminasa comprende una secuencia de aminoácidos que tiene una similaridad substancial con un elemento seleccionado del ' grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.

40. El método de conformidad con la reivindicación 38, caracterizado porque . la secuencia de nucleótidos tiene una identidad substancial con la secuencia de nucleótidos de la SEC ID NO: 2.

41. Una planta transgénica, caracterizada porque se obtiene de conformidad con el método de la reivindicación 38 o la progenie de la misma.

42. Un método para seleccionar transformantes potenciales, caracterizado porque comprende: proporcionar una pluralidad de células, en donde al menos una de las células tiene en su genoma una secuencia de nucleótidos extraña que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID N0:2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10, y poner en contacto la pluralidad de las células con un substrato que comprende un análogo estructural de isoleucina, tóxica; en donde las células que comprenden la secuencia de nucleótidos extraña, expresable, son capaces de crecer en el substrato, y en donde las células que no comprenden la secuencia de nucleótidos extraña, expresable, son incapaces de crecer en el substrato.

43. Un método para incorporar confiablemente una primera secuencia de nucleótidos extraña, expresable, en una célula de blanco u objetivo, caracterizado porque comprende : proporcionar un vector que comprende un promotor enlazado operativamente a un primer polinucleótido primario y un segundo polinucleótido, que comprende una secuencia de nucleótidos que tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10; transformar la célula de blanco u objetivo con el vector para proporcionar una célula transformada; y poner en contacto la célula con un substrato que comprende la L-O-metiltreonina; en donde las células transformadas exitosamente son capaces de crecer en el substrato, y en donde las células transformadas no exitosamente son incapaces de crecer en el substrato.

44. Un método de conformidad con la reivindicación 43, caracterizado porque la célula se selecciona del grupo que comprende una célula vegetal, una célula de levadura, una célula bacteriana y una célula fungosa.

45. Un método para hacer crecer una pluralidad de plantas en la ausencia de plantas indeseables, caracterizado porque comprende: proporcionar una pluralidad de plantas, cada una teniendo en su genoma una secuencia de nucleótidos extraña que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es resistente a la inhibición de la retroalimentación; hacer crecer la pluralidad de las plantas en un substrato; e introducir una cantidad preseleccionada de un análogo estructural de isoleucina en el substrato.

46. Un método de conformidad con la reivindicación 45, caracterizado porque la secuencia de nucleótidos tiene una identidad substancial con un elemento seleccionado del grupo que consiste de la secuencia descrita en la SEC ID NO: 2, la secuencia descrita en la SEC ID NO: 3, la secuencia descrita en la SEC ID NO: 4, la secuencia descrita en la SEC ID NO: 5, la secuencia descrita en la SEC ID NO: 6, la secuencia descrita en la SEC ID NO: 7, la secuencia descrita en la SEC ID NO: 8, la secuencia descrita en la SEC ID NO: 9 y la secuencia descrita en la SEC ID NO: 10.

47. El método de conformidad con la reivindicación 45, caracterizado porque el análogo es la L-O-metiltreonina .

48. Un método, caracterizado porque comprende: proporcionar una secuencia de nucleótidos que tiene una identidad substancial con la secuencia de nucleótidos descrita en la SEC ID N0:1 o una porción de la misma; y mutar la secuencia de modo que la secuencia codifica una treonina deshidratasa/desaminasa insensible a la retroalimentación; en donde la mutación comprende la mutagénesis dirigida al sitio.

49. El método de conformidad con la reivindicación 48, caracterizado porque la treonina deshidratasa/desaminasa insensibles a la retroalimentación comprende un aminoácido diferente del tipo silvestre en la localización de aminoácidos que corresponde a la localización 452 de la SEC ID NO: 2, en la localización de aminoácidos que corresponde a la localización 497 de la SEC ID NO: 2.

50. Un método, caracterizado porque comprende: proporcionar un vector que comprende un promotor enlazado operativamente a una secuencia de nucleótidos que codifica una treonina deshidratasa/desaminasa que es resistente a la inhibición de la retroalimentación, en donde el promotor regula la expresión de la secuencia de nucleótidos en una célula huésped; y transformar una célula de blanco u objetivo con el vector para proporcionar una célula transformada, la célula transformada es capaz de expresar la secuencia de nucleótidos . RESUMEN DE LA INVENCIÓN La presente invención se refiere a métodos y materiales en el campo de la biología molecular y a la regulación de la síntesis de polipéptidos a través de la ingeniería genética de las plantas y/o los microorganismos. Más particularmente, la invención se refiere a secuencias de nucleótidos aisladas recientemente, a secuencias de nucleótidos que tienen una identidad substancial con la misma y a los equivalentes de la misma, así como a los polipéptidos codificados por la misma. La invención también involucra la introducción de secuencias de nucleótidos extrañas en el genoma de una planta y/o microorganismo, en donde la introducción de la secuencia de nucleótidos efectúa un incremento en la resistencia del transformante a los análogos estructurales de la isoleucina tóxicos. Las secuencias inventivas por lo tanto pueden ser utilizadas como marcadores moleculares excelentes para seleccionar los transformantes exitosos, por lo cual se reemplazan los genes resistentes a los antibióticos utilizados en la técnica previa. Los transformantes hospedan una secuencia de nucleótidos que comprende un promotor enlazado operativamente a una secuencia de nucleótidos de la invención, demostraron niveles incrementados de producción de isoleucina, por lo cual se proporciona una fuente de nutrientes mejorada.