MX2010012720A - Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas. - Google Patents

Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas.

Info

Publication number
MX2010012720A
MX2010012720A MX2010012720A MX2010012720A MX2010012720A MX 2010012720 A MX2010012720 A MX 2010012720A MX 2010012720 A MX2010012720 A MX 2010012720A MX 2010012720 A MX2010012720 A MX 2010012720A MX 2010012720 A MX2010012720 A MX 2010012720A
Authority
MX
Mexico
Prior art keywords
nucleic acid
plant
plants
polypeptide
acid sequence
Prior art date
Application number
MX2010012720A
Other languages
English (en)
Inventor
Valerie Frankard
Ana Isabel Sanz Molinero
Christophe Reuzeau
Yves Hatzfeld
Original Assignee
Basf Plant Science Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Plant Science Gmbh filed Critical Basf Plant Science Gmbh
Publication of MX2010012720A publication Critical patent/MX2010012720A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance

Abstract

Un método para mejorar varias características de crecimiento de las plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica una GS1 (Glutamina Sintasa 1). También plantas que tienen expresión modulada de una secuencia de ácidos nucleicos que codifica una GS1, donde dichas plantas tienen características de crecimiento mejoradas con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. Además, un método para mejorar varios rasgos relacionados con el rendimiento de las plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido PEAMT (Fosfoetanolamina N-metiltransferasa). También plantas que tienen expresión modulada de una secuencia de ácidos nucleicos que codifica un PEAMT, donde dichas plantas tienen rasgos mejorados relacionados con el rendimiento con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. La invención también provee secuencias de ácidos nucleícos que codifican PEAMT desconocidas hasta el momento. Asimismo, un método para incrementar varios rasgos relacionados con el rendimiento de las semillas de plantas mediante el incremento de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido tioesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB). También plantas que tienen mayor expresión de una secuencia de ácidos nucleicos que codifica un polipéptido FATB, donde dichas plantas tienen rasgos aumentados relacionados con el rendimiento de las semillas con respecto a las plantas de control. La invención también se refiere a secuencias de ácidos nucleicos, constructos de secuencias de ácidos nucleicos, vectores y plantas que contienen dichas secuencias de ácidos nucleicos. Por otra parte, un método para mejorar varias características de crecimiento de las plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un tipo LFY (tipo LEAFY). La invención también provee constructos que son útiles en los métodos de la invención.

Description

PLANTAS QUE TIENEN RASGOS MEJORADOS RELACIONADOS CON EL RENDIMIENTO Y UN MÉTODO PARA OBTENERLAS La presente invención se relaciona en general con el campo de la biología molecular y se refiere a un método para mejorar varias características de crecimiento de las plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica una GS1 (Glutamina Sintasa 1 ). La presente invención también se refiere a plantas que tienen expresión modulada de una secuencia de ácidos nucleicos que codifica una GS1 , donde dichas plantas tienen características de crecimiento mejoradas con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. La invención también provee constructos que son útiles en los métodos de la invención.
Además, la presente invención se relaciona en general con el campo de la biología molecular y se refiere a un método para mejorar varios rasgos relacionados con el rendimiento de las plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido PEAMT (Fosfoetanolamina N-metiltransferasa). La presente invención también se refiere a plantas que tienen expresión modulada de una secuencia de ácidos nucleicos que codifica un PEAMT, donde dichas plantas tienen rasgos mejorados relacionados con el rendimiento con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. La invención también provee secuencias de ácidos nucleicos que codifican PEAMT desconocidas hasta el momento y construcciones que las comprenden, útiles en la realización de los métodos de la invención.
Asimismo, la presente invención se relaciona en general con el campo de la biología molecular y se refiere a un método para aumentar varios rasgos relacionados con el rendimiento de las semillas de plantas mediante el incremento de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido iioesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB). La presente invención también se refiere a plantas que tienen mayor expresión de una secuencia de ácidos nucleicos que codifica un polipéptido FATB, donde dichas plantas tienen rasgos aumentados relacionados con el rendimiento de las semillas con respecto a las plantas de control. La invención también se refiere a secuencias de ácidos nucleicos, construcciones de secuencias de ácidos nucleicos, vectores y plantas que contienen dichas secuencias de ácidos nucleicos.
Por otra parte, la presente invención se relaciona en general con el campo de la biología molecular y se refiere a un método para mejorar varias características de crecimiento de las plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un tipo LFY (tipo LEAFY). La presente invención también se refiere a plantas que tienen expresión modulada de una secuencia de ácidos nucleicos que codifica un tipo LFY, donde dichas plantas tienen características de crecimiento mejoradas con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. La invención también provee construcciones que son útiles en los métodos de la invención.
El aumento creciente de la población mundial y la provisión cada vez menor de tierra arable disponible para la agricultura, incentivan a investigar la posibilidad de incrementar la eficiencia de la agricultura. Los medios convencionales para mejorar los cultivos y la horticultura emplean técnicas de cultivo selectivo para identificar las plantas con las características deseables. Sin embargo, tales técnicas de cultivo selectivo tienen diversos inconvenientes, a saber, que dichas técnicas típicamente son laboriosas y dan como resultado plantas que a menudo contienen componentes genéticos heterogéneos que no siempre resultarán en que un rasgo deseable sea heredado de las plantas progenitoras. Los avances en la biología molecular han permitido que el hombre modifique el germoplasma de animales y plantas. La ingeniería genética de plantas implica el aislamiento y la manipulación del material genético (típicamente en la forma de ADN o A N) y la posterior introducción de tal material genético en una planta. Dicha tecnología tiene la capacidad de suministrar cultivos o plantas con diversos rasgos económicos, agronómicos o de horticultura mejorados.
Un rasgo de particular interés económico es el mayor rendimiento. El rendimiento se define normalmente como el producto mensurable de valor económico de un cultivo. Esto se puede definir en términos de cantidad y/o calidad. El rendimiento depende directamente de diversos factores, por ejemplo, del número y tamaño de los órganos, la arquitectura de las plantas (por ejemplo, la cantidad de ramas), la producción de semillas, la senescencia de las hojas y otros. El desarrollo de las raíces, la captación de nutrientes, la tolerancia al estrés y el vigor temprano también pueden ser factores importantes en la determinación del rendimiento. La optimización de los factores mencionados previamente puede entonces contribuir a incrementar de los cultivos.
El rendimiento de las semillas es un rasgo particularmente importante, dado que las semillas de muchas plantas son importantes para la nutrición humana y de animales. Los cultivos tales como maíz, arroz, trigo, cañóla y soja representan más de la mitad de la ingesta calórica total de humanos, ya sea por consumo directo de las propias semillas o por consumo de productos de carne obtenidos de semillas procesadas. También constituyen una fuente de azúcares, aceites muchos tipos de metabolitos usados en los procesos industriales. Las semillas contienen un embrión (fuente de nuevos brotes y raíces) y un endosperma (fuente de nutrientes para el crecimiento del embrión durante la germinación y durante el crecimiento temprano de las plántulas). El desarrollo de una semilla comprende muchos genes y requiere de la transferencia de metabolitos desde las raíces, hojas y tallos hasta la semilla en crecimiento. El endosperma, en particular, asimila los precursores metabólicos de carbohidratos, aceites y proteínas y los sintetiza en macromoléculas de almacenamiento para rellenar el grano.
La biomasa de la planta es el rendimiento para los cultivos de forraje como alfalfa, ensilaje de maíz y heno. Se han usado muchos sustitutos para el rendimiento en los cultivos de granos. Los principales entre ellos son los estimados del tamaño de la planta. El tamaño de la planta se puede medir de varias maneras de acuerdo con las especies y etapa de desarrollo, pero incluyen peso seco de la planta total, peso seco aéreo, peso fresco aéreo, área de hojas, volumen de tallo, altura de la planta, diámetro de roseta, longitud de hoja, longitud de raíz, masa de raíz, número de macollos y número de hojas. Muchas especies mantienen una relación conservadora entre el tamaño de diferentes partes de la planta en una etapa de desarrollo dado. Estas relaciones alométricas se usan para extrapolarse de una de estas mediadas de tamaño a otro (por ejemplo, Tittonell et al 2005 Agrie Ecosys & Environ 105: 213). El tamaño de la planta en una etapa de desarrollo temprano normalmente se correlacionará con el tamaño de la planta posterior en el desarrollo. Una planta más grande con un área de hojas mayor normalmente puede absorber más luz y dióxido de carbono que una planta más pequeña y en consecuencia probablemente ganará un peso mayor durante el mismo período (Fasoula & Tollenaar 2005 Maydica 50:39). Esto se suma a la continuación potencial de la ventaja del microambiente o genética que la planta tenía para obtener el mayor tamaño en forma inicial. Existe un fuerte componente genético para el tamaño de la planta y tasa de crecimiento (por ejemplo, ter Steege et al 2005 Plant Physiology 139:1078), y de este modo para una variedad de diversos genotipos el tamaño de planta en una condición ambiental es similar para correlacionar con el tamaño en otra (Hittalmani et al 2003 Theoretical Applied Genetics 107:679). De esta manera se usa un ambiente estándar como sustituto para los diversos y dinámicos ambientes hallados en diferentes lugares y tiempos para los cultivos en el campo.
Otro rasgo importante para muchos cultivos es el vigor temprano. Mejorar el vigor temprano constituye un objetivo importante de los programas modernos de cultivo de arroz en cultivares de arroz de climas tanto templados como tropicales. Las raíces largas son importantes para un anclaje apropiado al suelo en el arroz sembrado en agua. Cuando el arroz se siembra directamente en campos inundados, y las plantas deben emerger rápidamente a través del agua, los brotes más largos se asocian con el vigor. Cuando se emplea la siembra mediante máquina sembradora, los mesocotilos y coleoptilos más largos son importantes para una buena emergencia de las plántulas. La capacidad de brindarles a las plantas vigor temprano mediante ingeniería genética sería de gran importancia en la agricultura. Por ejemplo, el escaso vigor temprano ha sido una limitación para la introducción de híbridos de maíz (Zea mays L.) basados en el germoplasma del cinturón maizero en la zona atlántica europea.
El índice de cosecha, la relación del rendimiento de semillas al peso seco aéreo, es relativamente estable en muchas condiciones ambientales y de este modo con frecuencia se puede obtener una correlación robusta entre tamaño de planta y rendimiento del grano (por ejemplo, Rebetzke et al 2002 Crop Science 42:739). Estos procesos están intrínsecamente ligados debido a que la mayoría de la biomasa del grano es dependiente de la productividad fotosintética actual o almacenada por las hojas y el tallo de la planta (Gardener et al 1985 Physiology of Crop Plants. lowa State University Press, pp 68-73). En consecuencia, se ha usado la selección del tamaño de planta, incluso en etapas tempranas del desarrollo como un indicador para el futuro rendimiento potencial (por ejemplo, Tittonell et al 2005 Agrie Ecosys & Environ 105: 213). Cuando se examina el impacto de las diferencias genéticas sobre la tolerancia al estrés, la capacidad de estandarizar las propiedades del suelo, temperatura, agua y disponibilidad de nutrientes e intensidad de luz es una ventaja intrínseca de los ambientes del invernadero o cámara de crecimiento de plantas en comparación con el campo. Sin embargo, las limitaciones artificiales sobre el rendimiento a causa de la mala polinización debido a la ausencia de viento o insectos, o insuficiente espacio para la raíz madura o crecimiento del follaje, pueden restringir el uso de estos ambientes controlados para examinar diferencias de rendimiento. En consecuencia, las mediciones del tamaño de planta en desarrollo temprano, en condiciones estandarizadas en una cámara de crecimiento o invernadero, son prácticas estándares para proporcionar una indicación de potenciales ventajas genéticas de rendimiento.
Otro rasgo importante es una mejor tolerancia al estrés abiótico. El estrés abiótico es una causa principal de pérdida de cultivos en todo el mundo, lo cual reduce el rendimiento promedio de la mayoría de las plantas de cultivo principales en más de un 50% (Wang et al., Planta (2003) 218: 1-14). Los distintos tipos de estrés abiótico pueden deberse a sequía, salinidad, temperaturas extremas, toxicidad química y estrés oxidativo. La capacidad para mejorar la tolerancia de las plantas al estrés abiótico sería una gran ventaja económica para los granjeros en todo el mundo y permitiría el cultivo durante condiciones adversas y en territorios donde de otra manera no sería posible dicho cultivo.
En consecuencia, se puede aumentar el rendimiento de los cultivos mediante la optimización de uno de los factores mencionados previamente.
Según el uso final, se puede favorecer la modificación de ciertos rasgos del rendimiento sobre otros. Por ejemplo, para aplicaciones tales como la producción de forraje o madera, o recursos de biocombustible, puede ser deseable un incremento en las partes vegetativas de una planta, y para aplicaciones tales como producción de harina, almidón o aceite, puede ser particularmente deseable un incremento de los parámetros de las semillas. Aún entre los parámetros de las semillas, es posible favorecer a algunos sobre otros, según la aplicación. Varios mecanismos pueden contribuir a aumentar el rendimiento de las semillas, ya sea en forma de mayor tamaño de las semillas o de mayor cantidad de semillas.
Un enfoque para incrementar el rendimiento (rendimiento de semillas y/o biomasa) en plantas puede ser a través de la modificación de los mecanismos de crecimiento inherentes de una planta, tal como el ciclo celular o distintas vías de señalización involucradas en el crecimiento de las plantas o en los mecanismos de defensa.
Con respecto a los polipéptidos GS1 , ahora se ha descubierto que se pueden mejorar varias características de crecimiento en las plantas mediante la modulación de la expresión en una planta de un ácido nucleico que codifica una GS1 (Glutamina Sintasa 1) en una planta.
Con respecto a los polipéptidos PEA T, ahora se ha descubierto que se pueden mejorar varios rasgos relacionados con el rendimiento en plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un PEAMT (Fosfoetanolamina N-metiltransferasa) en una planta.
Con respecto a los polipéptidos FATB, ahora se ha descubierto que se pueden incrementar varios rasgos relacionados con el rendimiento de las semillas en plantas con respecto a las plantas de control, mediante el incremento de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido íioesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB). Los rasgos aumentados relacionados con el rendimiento comprenden uno o más de: rendimiento total de semilla por planta aumentado, cantidad total aumentada de semillas, cantidad aumentada de semillas llenas, Índice de llenado de semillas aumentado e índice de cosecha aumentado.
Con respecto a los polipéptidos tipo LFY, ahora se ha descubierto que se pueden mejorar varias características de crecimiento en las plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un tipo LFY (tipo LEAFY) en una planta.
Antecedentes Glutamina Sintasa (GS1) La Glutamina Sintasa cataliza la formación de glutamina a partir de glutamato y NH3, es la última etapa en la vía de asimilación del nitrato. En base a la comparación de secuencias, las Glutamina Sintasas se agrupan en dos familias, isoformas citosólicas (GS1) y ceroplásticas (GS2). Las Glutamina Sintasas GS1 forman una pequeña familia génica, donde GS2 parece ocurrir como un gen de única copia y tanto GS1 como GS2 ocurren las plantas y algas. Varios informes describen que las Glutamina Sintasas de plantas superiores tienen un impacto directo en el crecimiento de la planta en condiciones de nitrógeno limitado (Oliveira et al. Plant Physiol. 129, 1170-1180, 2002; Fuentes et al. J. Exp. Bot. 52, 1071-1081 , 2001 ; igge et al. Planta 210, 252-260, 2000; Martin et al. Plant Cell 18, 3252-3274). Sin embargo, hasta el momento no hay datos disponibles sobre el efecto de las Glutamina Sintasas de tipo alga en el crecimiento de la planta, en particular en condiciones de disponibilidad reducida de nitrógeno.
Fosfoetanolamina N-metiltransferasa (PEAMT) Fosfoetanolamina N-metiltransferasa (PEAMT), también denominada S-adenosil-L-metionina:etanolamina-fosfato N-metiltransferasa participa en la biosintesis de colina en las plantas. PEAMT funciona en las etapas de metilación necesarias para convertir fosfoetanolamina en fosfocolina (Nuccio et al. 2000. J Biol Chem. 275(19): 14095-101 ). Conforme a ello, una enzima PEAMT cataliza una o más de las siguientes reacciones: 1) N-dimetiletanolamina fosfato + S-adenosil-L-metionina <=> fosforil-colina + S- adenosil-homocisteína 2) N-metiletanolamina fosfato + S-adenosil-L-metionina <=> N-dimetiletanolamina fosfato + S-adenosil-homocisteína 3) fosforil-etanolamina + S-adenosil-L-metionina <=> S-adenosil-homocisteína + N- metiletanolamina fosfato.
El número de Enzyme Commission asignado por IUPAC-IUBMB (International Union of Biochemistry and Molecular Biology) para PEAMT es EC2.1.1.103. La enzima PEAMT pertenece a una clase de metiltransferasas (Mtases) que dependen de S- adenosil-L-metionina (SAM). La transferencia de metilo de SAM ubicuo a átomos de nitrógeno, oxígeno o carbono se utiliza frecuentemente en diversos organismos que abarcan desde bacterias a plantas y mamíferos. El análisis estructural muestra que las proteínas PEAMT pertenecen a una clase de Mtases que comprende dominios metiitransferasa que forman el plegamiento alfa-beta tipo Rossman (Yang et al. 2004 J. Mol. Biol. 340, 695-706). Además, las fosfatidiletanolamina transferasas típicamente comprenden un dominio metiitransferasa ubiE/COQ5 (referencia Pfam PF01209). Este dominio también está presente en varias metiltransferasas que participan en la biosíntesis de ubiquinona/menaquinona, biotina y esterol.
Los fosfolípidos son importantes componentes estructurales de las membranas celulares y además, tienen un rol significativo en el metabolismo de compuestos esenciales, tales como los ácidos grasos. En humanos, la Colina, una molécula de tipo vitamina B, es un nutriente esencial que se produce de manera natural y participa en la construcción de membranas celulares y hace que se desplacen las grasas y nutrientes entre las células.
La fosfocolina es el fosfolípido más importante en casi todos los tejidos vegetales. En los tejidos no fotosintéticos, la fosfoetanolamina es el segundo fosfolípido más frecuente, mientras que en los tejidos verdes, el nivel de fosfocolina es similar al del fosfatidilglicerol (Dykes et al. 1976. Biochem J. 158(3): 575-581).
Según se informó, en las plantas de tabaco que sobreexpresan un gen que codifica una enzima PEAMT se aumentaron los niveles de fosfocolina y colina libre sin afectar el crecimiento o contenido de fosfatidilcolina (McNeil et al. 2001. PNAS. 2001 , vol. 98, no. 17 10001-10005).
Tioesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB) Las plantas contienen una considerable variedad de lípidos membranales y de almacenamiento y en cada lípido se hallan varios ácidos grasos diferentes. Los ácidos grasos difieren entre sí por la longitud de su cadena y la cantidad de enlaces dobles. Todas las células vegetales sintetizan de novo ácidos grasos a partir de acetil-CoA mediante una vía común ubicada en los plástidos, a diferencia de en otros organismos. Los ácidos grasos se utilizan en esta organela o se transportan para suministrar diversas vías citoplasmáticas de biosíntesis y procesos celulares. La producción de ácidos grasos para el transporte depende de la actividad de las tioesterasa de proteína portadora de acilo graso-acilo (ACP) (FAT; también denominadas acil-ACP TE) que liberan ACP y ácidos grasos libres. Su actividad representa la etapa final en la vía de biosíntesis de los ácidos grasos plastídicos. Los ácidos grasos libres resultantes pueden ingresar el citosol donde son esterificados en coenzima A y luego metabolizados en lípidos membranales y/o triacilgliceroles de almacenamiento.
Los FAT tienen un rol esencial en la determinación de la cantidad y composición de los ácidos grasos que ingresan al conjunto de lípidos de almacenamiento. Se han descrito dos clases de FAT en las plantas, en base a las comparaciones de secuencias de aminoácidos y la especificidad del sustrato: la clase FATA y la clase FATB (Voelker et al. (1997) Plant Physiol 1 14:669-677). La especificidad del sustrato de estas isoformas determina la longitud de la cadena y el nivel de ácidos grasos saturados en las plantas. La mayor actividad de FATA ocurre con oleoli-ACP, un acil-ACP insaturado, con muy poca actividad con respecto a otros acil-ACP. FATB tiene la mayor actividad con acil-ACP saturados.
FATA y FATB son proteínas globulares dirigidas a los plástidos codificadas en el núcleo, que son funcionales como dímeros. Asimismo, los polipéptidos FATB comprenden un anclaje transmembranal helicoidal. La actividad de FATB es codificada por al menos dos genes en Arabidopsis (Bonaventure et al. (2003) Plant Cell 15: 1020-1033) y por al menos cuatro genes en Oryza sativa.
Las plantas transgénicas de Arabidopsis (Doermann et al. (2000) Plant Physiol 123: 637-643) y las plantas transgénicas de cañóla (Jones et al. (1995) Plant Cell 7: 359- g 371) que sobreexpresan un gen que codifica un FATB bajo el control de un promotor específico de semilla, exhibieron una composición modificada de aceite de semilla.
La solicitud de patente internacional WO 2008/006171 describe métodos para modificar genéticamente plantas de arroz de manera que el aceite de arroz, el salvado de arroz y las semillas de arroz producidas a partir de aquellas tienen niveles alterados de ácido oleico, ácido palmítico y/o ácido linoleico, mediante la modulación de la expresión génica de FAD2 y/o FATB.
Tipo Leafy (tipo LFY) Leafy es un factor de transcripción necesario para la inducción floral y el desarrollo de la flor, y participa en la especificación de la identidad del meristema floral. La expresión de LFY está regulada y restringida a pequeños grupos de células que flanquean el meristema apical del brote cuando su alto nivel de expresión marca la alteración del destino de un primordio de hoja a un primordio de flor (Weigel et al., Cell 69, 843-859, 1992). La secuencia proteica es altamente conservada y, en muchas especies de plantas, la proteína es codificada por un único gen, en pocas especies también hay parálogos. En el maíz, hay 2 copias del gen (zfM y zfl2). Los mutantes dobles exhiben un desarrollo normal durante el crecimiento vegetativo, pero el desarrollo floral se ve alterado (Bomblies et al., Development 130, 2385-2395, 2003). Como también sucede en Arabidopsis, los mutantes de pérdida de función de LFY exhiben deficiencias en el desarrollo floral con una transformación parcial de las flores en brotes de inflorescencia (Weigel et al., 1992). También se informa que Leafy participa en el tiempo de floración.
Síntesis Glutamina Sintasa (GS1) De modo sorprendente, en la actualidad se ha descubierto que modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 de tipo alga produce plantas que tienen rasgos mejorados relacionados con el rendimiento, en particular mayor rendimiento de las semillas con respecto a plantas de control.
De acuerdo con una forma de realización, se provee un método para mejorar rasgos relacionados con el rendimiento de una planta con respecto a plantas de control, que comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 en una planta.
Fosfoetanolamina N-metiltransferasa (PEAMT) De modo sorprendente, en la actualidad se ha descubierto que modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido PEAMT produce plantas que tienen rasgos mejorados relacionados con el rendimiento, con respecto a plantas de control.
De acuerdo con una forma de realización, se provee un método para mejorar rasgos relacionados con el rendimiento de una planta con respecto a plantas de control, que comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido PEAMT en una planta.
Tioesterasa B de proteina portadora de acilo graso-acilo (ACP) (FATB) De modo sorprendente, en la actualidad se ha descubierto que incrementar la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido FATB como se define en la presente, produce plantas que tienen rasgos aumentados relacionados con el rendimiento de las semillas, con respecto a plantas de control.
De acuerdo con una forma de realización, se provee un método para incrementar rasgos relacionados con el rendimiento de las semillas en las plantas con respecto a plantas de control, que comprende incrementar la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido FATB como se define en la presente. Los rasgos aumentados relacionados con el rendimiento de las semillas comprenden uno o más de los siguientes: mayor rendimiento total de las semillas por planta, mayor cantidad total de semillas, mayor cantidad de semillas llenas, mayor tasa de llenado de las semillas y mayor índice de cosecha.
Tipo Leafy (tipo LFY) De modo sorprendente, en la actualidad se ha descubierto que modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido tipo LFY produce plantas que tienen rasgos mejorados relacionados con el rendimiento, en particular mayor rendimiento de las semillas con respecto a plantas de control.
De acuerdo con una forma de realización, se provee un método para mejorar rasgos relacionados con el rendimiento de una planta con respecto a plantas de control, que comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido tipo LFY en una planta. Los rasgos mejorados relacionados con el rendimiento comprenden mayor rendimiento de las semillas y se obtuvieron sin modificar el tiempo de floración en comparación con las plantas de control.
Definiciones Polipéptido(s)/Proteína(s) Los términos "polipéptido" y "proteína" se usan en forma indistinta en la presente y se refieren a aminoácidos en forma polimérica de cualquier longitud, ligados por enlaces peptídicos.
Polinucleótido(s)/Secuencia(s) de ácidos nucleicos/Secuencia(s) de ácidos nucleicos/Secuencia(s) de nucleótidos Los términos "polinucleótido(s)", "secuencia(s) de ácidos nucleicos", "secuencia(s) de nucleótidos", "secuencia(s) de ácidos nucleicos", "molécula de la secuencia de ácidos nucleicos" se usan en forma indistinta en la presente y se refieren a los nucleótidos, sean ribonucleótidos o desoxirribonucleótidos o una combinación de ambos, en forma polimérica no ramificada de cualquier longitud.
Planta(s) de control La elección de plantas de control adecuadas es una parte rutinaria de un montaje experimental y puede incluir las correspondientes plantas de tipo silvestre o las correspondientes plantas sin el gen de interés. La planta de control es típicamente de la misma especie de planta o incluso la misma variedad que la planta a evaluar. La planta de control también puede ser un nulicigota de la planta a evaluar. Los nulicigotas son individuos que carecen del transgen por segregación. Una "planta de control" como se usa en la presente se refiere no solo a las plantas completas, sino también a las partes de las plantas, incluso a las semillas y las partes de las semillas.
Homóloqo(s) Los "homólogos" de una proteína comprenden péptidos, oligopéptidos, polipéptidos, proteínas y enzimas que tienen sustituciones, eliminaciones y/o inserciones de aminoácidos con respecto a la proteína en cuestión no modificada y que tienen actividad biológica y funcional similares a la proteína no modificada de la cual derivan.
Una eliminación se refiere a la supresión de uno o más aminoácidos de una proteína.
Una inserción se refiere a la introducción de uno o más residuos de aminoácidos en un sitio predeterminado de una proteína. Las inserciones pueden comprender fusiones N-terminal y/o C-terminal, además de inserciones intrasecuencía de aminoácidos únicos o múltiples. Generalmente, las inserciones dentro de la secuencia de aminoácidos serán más pequeñas que las fusiones N- o C-terminal, en el orden de aproximadamente de 1 a 10 residuos. Los ejemplos de péptidos o proteínas de fusión N- o C-terminal incluyen el dominio de unión o el dominio de activación de un activador de la transcripción como se usa en el sistema de dos híbridos de levadura, proteínas de revestimiento del fago, (histidina)-6-tag, glutatión S-transferasa-tag, proteína A, proteína de unión a maltosa, dihidrofolato reductasa, epitopo Tag»100, epitopo c-myc, epitopo FLAG®, lacZ, CMP (péptido de unión a calmodulina), epitopo HA, epitopo de proteína C y epitopo VSV.
Una sustitución se refiere al reemplazo de los aminoácidos de la proteína por otros aminoácidos que tienen propiedades similares (tales como hidrofobicidad, hidrofilicidad, antigenicidad, tendencia similares a formar o romper estructuras a-helicoidal o estructuras de lámina ß). Las sustituciones de aminoácidos son típicamente de residuos únicos, pero se pueden agrupar de acuerdo con las restricciones funcionales del polipéptido; las inserciones usualmente estarán en el orden de aproximadamente 1 a 10 residuos de aminoácidos. Preferentemente, las sustituciones de aminoácidos son sustituciones conservadoras de aminoácidos. Las tablas de sustituciones conservadoras son muy conocidas en el arte (ver, por ejemplo, Creighton (1984) Proteins. W.H. Freeman and Company (Eds) y la siguiente Tabla 1).
Tabla 1 : Ejemplos de sustituciones conservadoras de aminoácidos Las sustituciones, eliminaciones y/o inserciones de aminoácidos se pueden realizar fácilmente mediante técnicas de síntesis de péptidos muy conocidas en el arte, tales como síntesis de péptidos en fase sólida y similares, o mediante manipulación del ADN recombinante. Los métodos para la manipulación de secuencias de ADN para producir variantes de substitución, inserción o eliminación de una proteína son muy conocidos en el arte. Por ejemplo, las técnicas para realizar mutaciones por sustitución en sitios predeterminados del ADN son muy conocidas por los expertos en el arte e incluyen a mutagénesis de M13, mutagénesis de T7-Gen in vitro (USB, Cleveland, OH), mutagénesis dirigida al sitio QuickChange (Stratagene, San Diego, CA), mutagénesis dirigida al sitio mediada por PCR u otros protocolos de mutagénesis dirigida al sitio.
Derivados Los "derivados" incluyen péptidos, oligopéptidos, polipéptidos que, en comparación con la secuencia de aminoácidos de la forma natural de la proteína tal como la proteína de interés, comprenden sustituciones de aminoácidos con residuos de aminoácidos no naturales o adiciones de residuos de aminoácidos no naturales. Los "derivados" de una proteína también abarcan péptidos, oligopéptidos, polipéptidos que comprenden residuos de aminoácidos alterados naturales (glicosilados, acilados, prenilados, fosforilados, miristoilados, sulfatados, etc.) o residuos de aminoácidos alterados no naturales en comparación con la secuencia de aminoácidos de una forma natural del polipéptido. Un derivado también puede comprender uno o más sustituyentes o adiciones que no sean de aminoácidos en comparación con la secuencia de aminoácidos de la cual deriva, por ejemplo una molécula informadora u otro ligando, unido en forma covalente o no covalente a la secuencia de aminoácidos, tal como una molécula informadora que se une para facilitar su detección, y residuos de aminoácidos no naturales con respecto a la secuencia de aminoácidos de una proteína natural. Además, los "derivados" también incluyen fusiones de la forma natural de la proteína con péptidos de marcación tales como FLAG, HIS6 o tiorredoxina (para una revisión de los péptidos de marcación, ver Terpe, Appl. Microbiol. Biotechnol. 60, 523-533, 2003).
Ortólogo(s)/Parálogo(s) Los ortólogos y parálogos abarcan los conceptos de evolución que se utilizan para describir las relaciones ancestrales de los genes. Los parálogos son genes de la misma especie que se originaron mediante duplicación de un gen ancestral; los ortólogos son genes de organismos diferentes que se originaron mediante especiación y también derivan de un gen ancestral común.
Dominio El término "dominio" se refiere a un conjunto de aminoácidos conservados en posiciones específicas a largo de un alineamiento de secuencias proteicas relacionadas durante la evolución. Si bien los aminoácidos en otras posiciones pueden variar entre los homólogos, los aminoácidos que están muy conservados en posiciones específicas indican aminoácidos que posiblemente sean esenciales en cuanto a la estructura, estabilidad o función de una proteína. Los dominios identificados por su alto grado de conservación en secuencias alineadas de una familia de homólogos de proteínas, se pueden usar como identificadores para determinar si algún polipéptido en cuestión pertenece a una familia de polipéptidos previamente identificada.
Motivo/Secuencia de consenso/Distintivo El término "motivo" o "secuencia de consenso" o "distintivo" se refiere a una región corta conservada en la secuencia proteica relacionada durante la evolución. Con frecuencia, los motivos son partes muy conservadas de los dominios, pero también pueden incluir sólo una parte del dominio o pueden estar localizados fuera del dominio conservado (si todos los aminoácidos del motivo se encuentran fuera de un dominio definido).
Hibridación El término "hibridación" como se define en la presente es un proceso en el cual las secuencias de nucleótidos complementarias sustancialmente homologas se aparean entre sí. El proceso de hibridación puede ocurrir totalmente en solución, es decir, ambas secuencias de ácidos nucleicos complementarias están en solución. El proceso de hibridación también puede ocurrir con una de las secuencias de ácidos nucleicos complementarias inmovilizadas en una matriz, tal como esferas magnéticas, esferas de Sepharose o cualquier otra resina. El proceso de hibridación puede ocurrir además con una de las secuencias de ácidos nucleicos complementarias inmovilizadas en un soporte sólido tal como una membrana de nitrocelulosa o nylon o inmovilizadas, por ejemplo, por fotolitografía, por ejemplo, en un soporte de vidrio de silíceo (este último es conocido como matrices de secuencias de ácidos nucleicos o micromatrices o como chips de secuencias de ácidos nucleicos). Con el fin de permitir que se produzca la hibridación, las moléculas de las secuencias de ácidos nucleicos generalmente se desnaturalizan en forma térmica o química para fusionar una cadena doble en dos cadenas simples y/o eliminar las horquillas u otras estructuras secundarias de las secuencias de ácidos nucleicos de cadena simple.
El término "rigurosidad" se refiere a las condiciones en las cuales tiene lugar la hibridación. La rigurosidad de la hibridación está influenciada por condiciones tales como temperatura, concentración de sal, concentración iónica y composición del buffer de hibridación. Generalmente, las condiciones de baja rigurosidad se seleccionan para que la temperatura sea aproximadamente 30 °C más baja que el punto de fusión térmico (Tm) para la secuencia específica a una fuerza iónica y pH definidos. Las condiciones de rigurosidad media son aquellas en que la temperatura es 20 °C más baja que Tm, y las condiciones de alta rigurosidad tienen lugar cuando la temperatura es 10 °C más baja que Tm. Las condiciones de hibridación de alta rigurosidad se usan típicamente para aislar secuencias de hibridación cuyas secuencias son muy similares a la secuencia de ácidos nucleicos blanco. Sin embargo, las secuencias de ácidos nucleicos se pueden desviar de la secuencia y aún codificar un polipéptido sustancialmente idéntico, debido a la degeneración del código genético. En consecuencia, las condiciones de hibridación de alta rigurosidad algunas veces son necesarias para identificar tales moléculas de la secuencia de ácidos nucleicos.
La Tm es la temperatura a una concentración iónica y pH definidos, a la cual el 50% de la secuencia blanco se híbrida a una sonda perfectamente apareada. La Tm depende de las condiciones de la solución y la composición base y la longitud de la sonda. Por ejemplo, las secuencias más largas se hibridan específicamente a temperaturas mayores. La tasa máxima de hibridación se obtiene desde aproximadamente 16 °C hasta 32 °C por debajo de Tm. La presencia de cationes monovalentes en la solución de hibridación reduce la repulsión electrostática entre las dos cadenas de secuencias de ácidos nucleicos, fomentando de este modo la formación del híbrido; este efecto es visible en las concentraciones de sodio de hasta 0,4 (en concentraciones superiores, este efecto se puede ignorar). La formamida reduce la temperatura de fusión de los dúplex de ADN-ADN y ADN-ARN con 0,6 a 0,7°C para cada porcentaje de formamida y la adición de 50% de formamida permite que la hibridación se realice de 30 a 45 °C, aunque se reducirá la tasa de hibridación. La falta de apareamiento de los pares de bases reduce la tasa de hibridación y la estabilidad térmica de los dúplex. En promedio, y para sondas grandes, la Tm disminuye aproximadamente 1 °C por % de falta de apareamiento de las bases. La Tm se puede calcular mediante las siguientes ecuaciones, según los tipos de híbridos: 1) Híbridos de ADN-ADN (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984): Tm= 81 ,5°C+16,6xlog10[Na+]a+0,41x%[G/Cb]-500x[L 1-0,61x% de formamida 2) H íbridos de ADN-ARN o ARN -ARN : Tm= 79,8+18,5(log10[Na+]a)+0,58(%G/Cb)+11 ,8(%G/Cb)2-820/Lc 3) Híbridos de oligo-ADN u oligo-ARNd: Para <20 nucleótidos: Tm= 2 (l„) Para 20-35 nucleótidos: Tm= 22 + 1 ,46 (ln) a o para otro catión monovalente pero solo exacto en el rango 0,01-0,4 M. b solo exacto para el % de GC en el rango de 30% a 75% 0 L = longitud del dúplex en pares de bases. d oligo, oligonucleótidos; ln> = longitud efectiva del cebador = 2*(no. de G/C)+(no. de A/T).
La unión no especifica se puede controlar mediante cualquiera de las numerosas técnicas conocida tales como, por ejemplo, bloqueo de la membrana con soluciones que contienen proteínas, adiciones de ARN, ADN y SDS heterólogos al buffer de hibridación y tratamiento con Rnasa. En las sondas no homologas, se puede realizar una serie de hibridaciones mediante la variación de uno de los siguientes (i) reducir progresivamente la temperatura de apareamiento (por ejemplo de 68°C a 42°C) o (ii) reducir progresivamente la concentración de formamida (por ejemplo de 50% a 0%). El experto en el arte conoce los diversos parámetros que se pueden alterar durante la hibridación y que mantendrán o cambiarán las condiciones de rigurosidad.
Además de las condiciones de hibridación, la especificidad de hibridación generalmente también depende de la función de los lavados pos-hibridación. Para eliminar el fondo que resulta de la hibridación no específica, las muestras se lavan con soluciones salinas diluidas. Los factores críticos de dichos lavados incluyen la concentración iónica y la temperatura de la solución de lavado final: a menor concentración salina y mayor temperatura de lavado, se obtiene mayor rigurosidad del lavado. Las condiciones de lavado se realizan típicamente con la rigurosidad de la hibridación o con una rigurosidad inferior ella. Una hibridación positiva brinda una señal que es por lo menos el doble de la del fondo. Generalmente, las condiciones de rigurosidad adecuadas para los ensayos de hibridación de secuencias de ácidos nucleicos o procedimientos de detección de amplificación génica son como se expusieron anteriormente. También se pueden seleccionar condiciones más o menos rigurosas. El experto en el arte conoce los diversos parámetros que se pueden alterar durante el lavado y que mantendrán o cambiarán las condiciones de rigurosidad.
Por ejemplo, las condiciones de hibridación típicas de alta rigurosidad para los híbridos de ADN mayores de 50 nucleótidos comprenden hibridación a 65 °C en 1x SSC o a 42 °C en 1x SSC y 50% de formamida, seguida por lavado a 65 °C en 0,3x SSC. Los ejemplos de condiciones de hibridación de rigurosidad media para híbridos de ADN mayores de 50 nucleótidos comprenden hibridación a 50 °C en 4x SSC o a 40 °C en 6x SSC y 50% de formamida, seguida por lavado a 50 °C en 2x SSC. La longitud del híbrido es la longitud prevista para la secuencia de ácidos nucleicos de hibridación. Cuando las secuencias de ácidos nucleicos de secuencia conocida se hibridan, se puede determinar la longitud del híbrido por el alineamiento de las secuencias y la identificación de las regiones conservadas descritas en la presente. 1 *SSC es NaCI 0,15M y citrato de sodio 15mM; la solución de hibridación y las soluciones de lavado pueden incluir adicionalmente reactivo de Denhardt 5x, 0,5-1 ,0% de SDS, 100 pg/ml de ADN de esperma de salmón fragmentado y desnaturalizado, 0,5% de pirofosfato de sodio.
A los fines de definir el nivel de rigurosidad, se puede hacer referencia a Sambrook et al. (2001 ) Molecular Cloning: a laboratory manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York o a Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989 y actualizaciones anuales).
Variante de empalme El término "variante de empalme" como se usa en la presente abarca las variantes de una secuencia de ácidos nucleicos en las cuales se han escindido, reemplazado, desplazado o agregado los intrones y/o exones seleccionados, o en las cuales los intrones han sido acortados o alargados. Dichas variantes serán aquellas en las que la actividad biológica de la proteína está sustancialmente retenida; esto se puede obtener mediante la retención selectiva de los segmentos funcionales de la proteína. Dichas variantes de empalme se pueden hallar en la naturaleza o pueden ser realizadas por el hombre. Los métodos para predecir y aislar dichas variantes de empalme son muy conocidos en el arte (ver, por ejemplo, Foissac and Schiex (2005) BMC Bioinformatics 6: 25).
Variante alélica Los alelos o las variantes alélicas son formas alternativas de un gen determinado, ubicado en la misma posición del cromosoma. Las variantes alélicas abarcan los Polimorfismos de nucleótido único (SNP), además de Polimorfismos de eliminación/inserción pequeños (INDEL). El tamaño de los INDEL es usualmente menor de 100 pb. Los SNP e INDEL forman el mayor conjunto de variantes de secuencias en las cepas polimórficas naturales de la mayoría de los organismos.
Transposición qénica/Evolución dirigida La transposición génica o evolución dirigida consiste en iteraciones de la transposición de ADN seguida por la identificación y/o selección apropiada para generar variantes de secuencias de ácidos nucleicos o porciones de éstas que codifican proteínas que tienen una actividad biológica modificada (Castle et al., (2004) Science 304(5674): 1151-4; patentes estadounidenses 5.811.238 y 6.395.547).
Elemento regulador/Secuencia de control/Promotor Los términos "elemento regulador", "secuencia de control" y "promotor" se usan en forma indistinta en la presente y se deben interpretar en un contexto amplio para referirse a la secuencias de ácidos nucleicos reguladoras capaces de efectuar la expresión de las secuencias a las cuales están ligadas. El término "promotor" típicamente se refiere a una secuencia de control de ácidos nucleicos ubicada corriente arriba del comienzo de la transcripción de un gen y que participa en el reconocimiento y la unión de ARN polimerasa y otras proteínas, dirigiendo de este modo la transcripción de una secuencia de ácidos nucleicos ligada operativamente. Los términos antes mencionados abarcan a las secuencias reguladoras transcripcionales derivadas de un gen genómico eucariota clásico (que incluye la caja TATA necesaria para la iniciación de una transcripción precisa con o sin una secuencia de la caja CCAAT) y elementos reguladores adicionales (es decir, secuencias de activación corriente arriba, potenciadores y silenciadores) que alteran la expresión génica en respuesta a los estímulos del desarrollo y/o externos, o en forma específica de tejido. El término también incluye una secuencia reguladora transcripcional de un gen procariota clásico, en cuyo caso puede incluir una secuencia de la caja -35 y/o secuencias reguladoras transcripcionales de la caja -10. La expresión "elemento regulador" también abarca una molécula de fusión sintética o derivado que confiere, activa o potencia la expresión de una molécula de la secuencia de ácidos nucleicos en una célula, tejido u órgano.
Un "promotor de planta" comprende elementos reguladores que median la expresión de un segmento de una secuencia codificadora en las células vegetales. Por consiguiente, un promotor de planta no necesita ser de origen vegetal, sino que se puede originar a partir de virus o microorganismos, por ejemplo a partir de virus que atacan las células vegetales. El "promotor de planta" también se puede originar a partir de una célula de planta, por ejemplo, de la planta que se transforma con la secuencia de ácidos nucleicos expresada en el proceso de la invención y descrita en la presente. Esto también se aplica a otras señales reguladoras de "planta", tales como los terminadores de "planta". Los promotores corriente arriba de las secuencias de nucleótidos útiles en los métodos de la presente invención se pueden modificar por una o más sustitución(es), inserción(es) y/o eliminación(es) de nucleótidos sin interferir con la actividad o funcionalidad de cualquiera de los promotores, el marco de lectura abierto (ORF) o la región reguladora 3' tal como los terminadores u otras regiones reguladoras 3' que se ubican fuera de la ORF. Además, es posible que la actividad de los promotores aumente por la modificación de su secuencia o que estos sean reemplazados por completo por promotores más activos, incluso promotores de los organismos heterólogos. Para la expresión en las plantas, la molécula de la secuencia de ácidos nucleicos, como se describió anteriormente, debe estar ligada operativamente o comprender un promotor adecuado que exprese el gen en el momento correcto y con el patrón de expresión espacial requerido.
Para la identificación de los promotores funcionalmente equivalentes, la potencia del promotor y/o el patrón de expresión de un promotor candidato se pueden analizar, por ejemplo, por la unión operativa del promotor a un gen informante y la evaluación del nivel de expresión y el patrón del gen indicador en diversos tejidos de la planta. Los genes indicadores conocidos adecuados incluyen, por ejemplo, beta-glucuronidasa o beta-galactosidasa. La actividad del promotor se determina por la medición de la actividad enzimática de beta-glucuronidasa o beta-galactosidasa. La potencia del promotor y/o el patrón de expresión luego se pueden comparar con los de un promotor de referencia (tal como el que se usa en los métodos de la presente invención). De modo alternativo, la potencia del promotor se puede evaluar mediante la cuantificación de los niveles de mARN o por comparación de los niveles de mARN de la secuencia de ácidos nucleicos usada en los métodos de la presente invención, con niveles de ARNm de genes housekeeping tales como rARN 18S, mediante los métodos conocidos en el arte, tales como transferencia Northern con análisis densitométrico de autorradiogramas, PCR cuantitativa de tiempo real o RT-PCR (Heid et al., 1996 Genome Methods 6: 986-994). Generalmente, por "promotor débil" se entiende un promotor que dirige la expresión de una secuencia codificadora a un nivel bajo. Por "nivel bajo" se entiende los niveles de aproximadamente 1/10.000 transcripciones a aproximadamente 1/1 00.000 transcripciones, a aproximadamente 1/500.0000 transcripciones por célula. Por el contrario, un "promotor fuerte" dirige la expresión de una secuencia codificadora a un nivel alto o de aproximadamente 1/10 transcripciones a aproximadamente 1/100 transcripciones a aproximadamente 1/1000 transcripciones por célula. En general, por "promotor de potencia mediana" se entiende un promotor que dirige la expresión de una secuencia codificadora a un nivel más bajo que un promotor fuerte, en particular a un nivel que, en todos los casos, es inferior al obtenido bajo el control de un promotor de 35S CaMV.
Ligado operativamente El término "ligado operativamente" como se usa en la presente se refiere a la unión funcional entre la secuencia del promotor y el gen de interés, de modo tal que la secuencia del promotor puede iniciar la transcripción del gen de interés Promotor constitutivo Un "promotor constitutivo" se refiere a un promotor que es activo en la transcripción durante la mayoría, pero no necesariamente todas, las fases de crecimiento y desarrollo y en la mayoría de las condiciones ambientales, en por lo menos una célula, tejido u órgano. La siguiente Tabla 2a provee ejemplos de promotores constitutivos.
Tabla 2a: Ejemplos de promotores constitutivos Fuente génica Referencia Actina McEIroy et al, Plant Cell, 2: 163-171 , 1990 HMGP WO 2004/070039 Promotor ubicuo Un promotor ubicuo es activo en casi todos los tejidos o células de un organismo.
Promotor regulado por el desarrollo Un promotor regulado por el desarrollo es activo durante ciertas etapas del desarrollo o en partes de la planta que experimentan cambios en el desarrollo.
Promotor inducible Un promotor inducible ha inducido o aumentado la iniciación de la transcripción en respuesta a un estímulo químico (para una reseña ver Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), ambiental o físico o puede ser "inducible por estrés", es decir, activado cuando una planta se expone a varias condiciones de estrés, o "inducible por patógeno" es decir, activado cuando una planta se expone a diversos patógenos.
Promotor específico de órgano/específico de tejido Un promotor específico de órgano o específico de tejido es uno capaz de iniciar la transcripción preferentemente en ciertos órganos o tejidos, tales como hojas, raices, tejido de semilla, etc. Por ejemplo, un "promotor específico de raíz" es un promotor que es activo en la transcripción predominantemente en las raíces de las plantas, excluyendo sustancialmente cualquier otra parte de una planta, mientras que aún permite alguna filtración de expresión en estas otras partes de la planta. Los promotores capaces de iniciar la transcripción sólo en ciertas células se denominan en la presente "específicos de célula".
Los ejemplos de promotores específicos de raíz se enumeran en la siguiente Tabla 2b: Tabla 2b: Ejemplos de promotores específicos de raíz Un promotor específico de semilla es activo en la transcripción predominantemente en el tejido de las semillas, pero no necesariamente en forma exclusiva en el tejido de las semillas (en casos de filtración de expresión). El promotor específico de semilla puede ser activo durante el desarrollo de la semilla y/o durante la germinación. El promotor específico de raíz puede ser específico de endosperma/aleurona/embrión. Los ejemplos de promotores específicos de semilla (específicos de endosperma/aleurona/embrión) se muestran en las siguientes Tablas 2c a 2f. Otros ejemplos de promotores específicos de semilla se indican en Qing Qu and Takaiwa (Plant Biotechnol. J. 2, 1 13-125, 2004), cuya descripción se Incorpora a la presente por referencia como si se estableciera en su totalidad.
Tabla 2c: Ejemplos de promotores específicos de semilla aminotransferasa de arroz PRO0147, inhibidor ITR1 de no publicado tripsina (cebada) PRO0151 , WSI18 de arroz WO 2004/070039 PRO0175, RAB21 de arroz WO 2004/070039 PRO005 WO 2004/070039 PRO0095 WO 2004/070039 a-amilasa (Amy32b) Lanahan et al, Plant Cell 4:203-211 , 1992; Skriver et al, Proc Nati Acad Sci USA 88:7266-7270, 1991 gen tipo catepsina ß Cejudo et al, Plant Mol Biol 20:849-856, 1992 Ltp2 de cebada Kalla et al., Plant J. 6:849-60, 1994 Chi26 Leah et al., Plant J. 4:579-89, 1994 Maíz B— Perú Selinger et al., Genetics 149; 1 125-38,1998 Tabla 2d: Ejemplos de promotores específicos de endosperma Tabla 2e: Ejemplos de promotores específicos del embrión: Fuente génica Referencia 0SH1 de arroz Sato et al, Proc. Nati. Acad. Sci. USA, 93: 8117-8122, 1996 KNOX Postma-Haarsma et al, Plant Mol. Biol. 39:257-71 , 1999 PRO0151 WO 2004/070039 PRO0175 WO 2004/070039 PRO005 WO 2004/070039 PRO0095 WO 2004/070039 Tabla 2f: Ejemplos de promotores específicos de aleurona: Un promotor específico de tejido verde como se define en la presente es un promotor activo en la transcripción predominantemente en el tejido verde, excluyendo sustancialmente cualquier otra parte de una planta, mientras que aún permite alguna filtración de expresión en estas otras partes de la planta.
En la siguiente tabla 2g se exponen ejemplos de promotores específicos de tejido verde que se pueden utilizar para llevar a cabo métodos de la invención.
Tabla 2g: Ejemplos de promotores específicos de tejido verde Otro ejemplo de un promotor específico de tejido consiste en un promotor específico de meristema, que es activo en la transcripción predominantemente en tejido meristemático, excluyendo sustancialmente cualquier otra parte de una planta, mientras que aún permite alguna filtración de expresión en estas otras partes de la planta. En la siguiente tabla 2h se exponen ejemplos de promotores específicos de meristema verde que se pueden utilizar para llevar a cabo los métodos de la invención.
Tabla 2h: Ejemplos de promotores específicos de meristema Terminador El término "terminador" abarca una secuencia de control que es una secuencia de ADN en el extremo de una unidad de transcripción que señala el procesamiento en 3' y la poliadenilación de una transcripción primaria y la terminación de la transcripción. El terminador se puede derivar del gen natural, a partir de una variedad de otros genes de planta o de T-ADN. El terminador agregado puede derivar, por ejemplo, de los genes de nopálina sintasa u octopina sintasa, o alternativamente de otro gen de planta o, con menor preferencia, de cualquier otro gen eucariótico.
Modulación El término "modulación" significa, en relación con la expresión o expresión génica, un proceso en el que el nivel de expresión es modificado por dicha expresión génica en comparación con la planta de control, se puede aumentar o disminuir el nivel de expresión. La expresión original no modulada puede ser de cualquier clase de expresión de un ARN (rARN, tARN) o mARN estructural con traducción posterior. El término "modulación de la actividad" significa cualquier cambio de la expresión de las secuencias de ácidos nucleicos de la invención o proteínas codificadas, que conducen a mayor rendimiento y/o mayor crecimiento de las plantas.
Expresión El término "expresión" o "expresión génica" significa la transcripción de un gen específico o genes específicos o construcción genética específica. El término "expresión" o "expresión génica" en particular significa la transcripción de un gen o genes o construcción genética en ARN (rARN, tARN) o mARN estructural con o sin traducción posterior de la última en una proteína. El proceso incluye la transcripción de ADN y el procesamiento del producto de mARN resultante.
Mayor expresión /sobreexpresión El término "mayor expresión" o "sobreexpresión" como se usa en la presente , significa cualquier forma de expresión adicional al nivel de expresión de tipo silvestre original.
Los métodos para aumentar la expresión de genes o productos génicos están documentados en el arte e incluyen, por ejemplo, la sobreexpresión dirigida por promotores apropiados, el uso de potenciadores de la transcripción o potenciadores de la traducción. Las secuencias de ácidos nucleicos aisladas que actúan como elementos promotores o potenciadores se pueden introducir en una posición apropiada (típicamente corriente arriba) de una forma no heteróloga de un polinucleótido a fin de regular en forma ascendente la expresión de una secuencia de ácidos nucleicos que codifica el polipéptido de interés. Por ejemplo, los promotores endógenos se pueden alterar ¡n vivo por mutación, eliminación y/o sustitución (ver, Kmiec, US 5.565.350; Zarling et al., W09322443), o se pueden introducir promotores aislados en una célula de planta en la orientación y distancia apropiadas de un gen de la presente invención a fin de controlar la expresión del gen.
Si se desea la expresión de un polipéptido, generalmente es preferible incluir una región de poliadenilación en el extremo 3' de una región de codificación de polinucleótido. La región de poliadenilación puede derivar del gen natural, de una variedad de otros genes de planta, o de T-ADN. La secuencia del extremo 3' agregada puede derivar, por ejemplo, de los genes de nopalina sintasa u octopina sintasa, o alternativamente de otro gen de planta o, con menor preferencia, de cualquier otro gen eucariótico.
También se puede agregar una secuencia intrón a la región 5' no traducida (UTR) o la secuencia codificadora de la secuencia codificadora parcial para aumentar la cantidad de mensaje maduro que se acumula en el citosol. Se ha demostrado que la inclusión de un intrón que se puede empalmar en la unidad de transcripción de las construcciones de expresión vegetales y animales aumenta la expresión génica tanto al nivel del mARN como de las proteínas hasta 1000 veces (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987) Genes Dev 1 :1183-1200). Tal potenciación de la expresión génica por el intrón es típicamente mayor cuando se coloca cerca del extremo 5' de la unidad de transcripción. El uso de intrones de maíz intrón Adh1-S 1 , 2 y 6, el intrón Bronze-1 son conocidos en el arte. Para información general ver: The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
Gen endógeno La referencia en la presente a un gen "endógeno" no se refiere sólo al gen en cuestión hallado en una planta en su forma natural (es decir, sin que haya intervención humana), sino que también se refiere al mismo gen (o un gen/secuencia de ácidos nucleicos sustancialmente homologa) en una forma aislada posteriormente (re)introducida en una planta (un transgén). Por ejemplo, una planta transgénica que contiene dicho transgén puede comprender una reducción sustancial de la expresión del transgén y/o una reducción sustancial de la expresión del gen endógeno. El gen aislado se puede aislar de un organismo o puede ser preparado por el hombre, por ejemplo por síntesis química.
Menor expresión La referencia en la presente a "menor expresión" o "reducción o sustancial eliminación" de la expresión significa una disminución de la expresión del gen endógeno y/o de los niveles de polipéptidos y/o actividad de polipéptidos con respecto a las plantas de control. La reducción o sustancial eliminación es, en orden creciente de preferencia, al menos 10%, 20%, 30%, 40% ó 50%, 60%, 70%, 80%, 85%, 90% ó 95%, 96%, 97%, 98%, 99% o más reducida en comparación con la de las plantas de control. Los métodos para disminuir la expresión son conocidos en el arte y el experto será capaz de adaptar fácilmente los métodos conocidos de silenciamiento, a fin de lograr la reducción de la expresión de un gen endógeno en una planta completa o en partes de ésta, por ejemplo mediante el uso de un promotor apropiado.
Para la reducción o sustancial eliminación de la expresión de un gen endógeno en una planta, es necesario que los nucleótidos sustancialmente contiguos de una secuencia de ácidos nucleicos tengan suficiente longitud. A fin de realizar el silenciamiento génico, ésta puede tener tan pocos como 20, 19, 18, 17, 16, 15, 14, 13, 12, 11 , 10 o menos nucleótidos, alternativamente ésta puede ser igual al gen entero (incluso UTR 5' y/o 3', ya sea total o parcialmente). La porción de nucleótidos sustancialmente contiguos puede derivar de la secuencia de ácidos nucleicos que codifica la proteína de interés (gen blanco) o de cualquier secuencia de ácidos nucleicos capaz de codificar un ortólogo, parálogo u homólogo de la proteína de interés. Preferentemente, la porción de nucleótidos sustancialmente contiguos es capaz de formar uniones de hidrógeno con el gen blanco (ya sea cadena sentido o antisentido), más preferentemente, la porción de nucleótidos sustancialmente contiguos tiene, en orden creciente de preferencia, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% de identidad de secuencia con el gen blanco (ya sea cadena sentido o antisentido). Una secuencia de ácidos nucleicos que codifica un polipéptido (funcional) no es un requisito de los diversos métodos analizados en la presente para la reducción o sustancial eliminación de la expresión de un gen endógeno.
El experto en el arte conoce ejemplos de varios métodos para la reducción o sustancial eliminación de la expresión de un gen endógeno en una planta, o para la reducción de los niveles y/o actividad de una proteína. El experto podrá adaptar fácilmente los métodos conocidos de silenciamiento, a fin de lograr la reducción de la expresión de un gen endógeno en una planta completa o en partes de ésta, por ejemplo mediante el uso de un promotor apropiado.
Esta reducción o sustancial eliminación de la expresión se puede lograr mediante herramientas y técnicas de rutina. Un método preferido para la reducción o sustancial eliminación de la expresión del gen endógeno es mediante la introducción y expresión en una planta de una construcción genética en la cual la secuencia de ácidos nucleicos (en este caso una porción de nucleótidos sustancialmente contiguos derivados del gen de interés, o de cualquier secuencia de ácidos nucleicos capaz de codificar un ortólogo, paralogo u homólogo de cualquiera de la proteína de interés) se clona como una repetición invertida (en parte o completamente), separada por un espaciador (ADN no codificador).
En dicho método preferido, la expresión del gen endógeno se reduce o se elimina sustancialmente mediante el silenciamiento mediado por ARN utilizando una repetición invertida de una secuencia de ácidos nucleicos o una parte de éste (en este caso una porción de nucleótidos sustancialmente contiguos derivados del gen de interés o de cualquier secuencia de ácidos nucleicos capaz de codificar un ortólogo, paralogo u homólogo de la proteína de interés), preferentemente capaz de formar una estructura de horquilla, La repetición invertida se clona en un vector de expresión que comprende secuencias de control. Una secuencia de ácido nucleico de ADN no codificador (un separador, por ejemplo un fragmento de la región de unión a matriz (MAR), un intrón, un poliligador, etc.) se ubica entre las dos secuencias de ácidos nucleicos invertidos que forman la repetición invertida. Luego de la transcripción de la repetición invertida, se forma un ARN quimérico con una estructura autocomplementaria (parcial o completa). Esta estructura de ARN de cadena doble se denomina ARN horquilla (hpARN). El hpARN es procesado por la planta en siARN que se incorpora en un complejo de silenciamiento inducido por ARN (RISC). El RISC además diva las transcripciones de mARN, reduciendo sustancialmente de este modo la cantidad de transcripciones de mARN a ser traducidas en polipéptidos. Para más detalles generales ver, por ejemplo, Grierson et al. (1998) WO 98/53083; Waterhouse et al. (1999) WO 99/53050).
La realización de los métodos de la invención no depende de la introducción y expresión en una planta de una construcción genética en la cual se clona la secuencia de ácidos nucleicos como una repetición invertida, sino que se pueden utilizar uno o más de los diversos métodos de "silenciamiento génico" conocidos para lograr los mismos efectos.
Uno de dichos métodos para reducir la expresión del gen endógeno es el silenciamiento de la expresión génica mediado por ARN (regulación descendente). En este caso, el silenciamiento es activado en una planta por una secuencia de ARN de cadena doble (dsARN) que es sustancialmente similar al gen endógeno blanco. Este dsARN es procesado adicionalmente por la planta en alrededor de 20 a alrededor de 26 nucleótidos denominados ARN corto de interferencia (siARN). Los siARN se incorporan en un complejo de silenciamiento inducido por ARN (RISC) que escinde la transcripción de mARN del gen endógeno blanco, reduciendo sustancialmente de este modo la cantidad de transcripciones de mARN a ser traducidas en un polipéptido. Preferentemente, la secuencia de ARN de cadena doble corresponde a un gen blanco.
Otro ejemplo de un método de silenciamiento de ARN incluye introducir secuencias de ácidos nucleicos o sus partes (en este caso, una porción de nucleótidos sustancialmente contiguos derivados del gen de interés, o de cualquier secuencia de ácidos nucleicos capaz de codificar un ortólogo, paralogo u homólogo de la proteína de interés) en una orientación sentido en una planta. "Orientación sentido" se refiere a una secuencia de ADN que es homologa a una transcripción de mARN de ésta. Por lo tanto, se introducirá en una planta al menos una copia de la secuencia de ácidos nucleicos. La secuencia de ácidos nucleicos adicional reducirá la expresión del gen endógeno, generando un fenómeno conocido como cosupresión. La reducción de la expresión génica será más pronunciada si se introducen varias copias adicionales de una secuencia de ácidos nucleicos en la planta, ya que existe una correlación positiva entre los altos niveles de transcripciones y la activación de la cosupresión.
Otro ejemplo de un método de silenciamiento de ARN incluye el uso de secuencias de ácidos nucleicos antisentido. Una secuencia de ácidos nucleicos "antisentido" comprende una secuencia de nucleótidos que es complementaria de una secuencia de ácidos nucleicos "sentido" que codifica una proteína, es decir, complementaria de la cadena codificadora de una molécula de cADN de cadena doble o complementaria de una secuencia de transcripciones de mARN. La secuencia de ácidos nucleicos antisentido es preferentemente complementaria del gen endógeno a ser silenciado. La complementariedad puede estar ubicada en la "región codificadora" y/o en la "región no codificadora" de un gen. El término "región codificadora" se refiere a una región de la secuencia de nucleótidos que comprende codones que se traducen en residuos de aminoácidos. El término "región no codificadora" se refiere a secuencias 5' y 3' que flanquean la región codificadora que se transcriben pero no se traducen en aminoácidos (también denominadas regiones 5' y 3' no traducidas).
Las secuencias de ácidos nucleicos antisentido se pueden diseñar de acuerdo con las normas de formación de pares de bases de Watson y Crick. La secuencia de ácidos nucleicos antisentido puede ser complementaria de toda la secuencia de ácidos nucleicos (en este caso, una porción de nucleótidos sustancialmente contiguos derivados del gen de interés, o de cualquier secuencia de ácidos nucleicos capaz de codificar un ortólogo, paralogo u homólogo de la proteína de interés) pero también puede ser un oligonucleótido que es antisentido sólo con respecto a una parte de la secuencia de ácidos nucleicos (incluyendo UTR 5' y 3' de mARN). Por ejemplo, la secuencia de oligonucleótidos antisentido puede ser complementaria de la región que rodea al sitio de inicio de la traducción de un transcripto de mARN que codifica un polipéptido. La longitud de una secuencia de oligonucleótidos antisentido adecuada es conocida en el arte y puede comenzar desde alrededor de 50, 45, 40, 35, 30, 25, 20, 15 ó 10 nucleótidos de longitud o menos. Se puede construir una secuencia de ácidos nucleicos antisentido de acuerdo con la invención mediante síntesis química y reacciones de ligadura enzimáticas utilizando los métodos conocidos en el arte Por ejemplo, una secuencia de ácidos nucleicos antisentido (por ejemplo, una secuencia de oligonucleótidos antisentido) se puede sintetizar químicamente utilizando nucleótidos naturales o nucleótidos modificados de distinta manera diseñados para aumentar la estabilidad biológica de las moléculas o para aumentar la estabilidad física del dúplex formado entre las secuencias de ácidos nucleicos sentido y antisentido, por ejemplo, se pueden utilizar derivados de fosforotioato y nucleótidos sustituidos por acridina. Los ejemplos de nucleótidos modificados que se pueden utilizar para generar las secuencias de ácidos nucleicos antisentido son muy conocidos en el arte. Las modificaciones de nucleótidos conocidas incluyen metilación, ciclación y "capuchón" (caps) y sustitución de uno o más de los nucleótidos naturales por un análogo tal como inosina. Otras modificaciones de nucleótidos son conocidas en el arte.
La secuencia de ácidos nucleicos antisentido se puede producir de forma biológica usando un vector de expresión en el cual se ha subclonado una secuencia de ácidos nucleicos en orientación antisentido (es decir, el ARN transcripto desde la secuencia de ácidos nucleicos insertada tendrá orientación antisentido con respecto al una secuencia de ácidos nucleicos blanco de interés). Preferentemente, la producción de secuencias de ácidos nucleicos antisentido en las plantas ocurre por medio de una construcción de secuencia de ácidos nucleicos integrada de forma estable que comprende un promotor, un oligonucleótido antisentido ligado operativamente y un terminador.
Las moléculas de la secuencia de ácidos nucleicos utilizadas para el silenciamiento en los métodos de la invención (ya sea introducidas en una planta o generadas in situ) se hibridan o se unen a transcriptos de mARN y/o ADN genómico que codifica un polipéptido para inhibir de este modo la expresión de la proteína, por ejemplo, mediante la inhibición de la transcripción y/o traducción. La hibridación puede ocurrir mediante complementariedad convencional de nucleótidos para formar un dúplex estable o, por ejemplo en el caso de una secuencia de ácidos nucleicos antisentido que se une a dúplex de ADN, mediante interacciones específicas en la cavidad principal de la hélice doble. Las secuencias de ácidos nucleicos antisentido se pueden introducir en una planta mediante transformación o inyección directa en un sitio de tejido específico. Alternativamente, las secuencias de ácidos nucleicos antisentido se pueden modificar para que se dirijan a células seleccionadas y luego administrarlas de forma sistémica. Por ejemplo, para la administración sistémica, las secuencias de ácidos nucleicos antisentido se pueden modificar de manera tal que se unan específicamente a receptores o antígenos expresados en una superficie celular seleccionada, por ejemplo, mediante la unión de la secuencia de ácidos nucleicos antisentido a péptidos o anticuerpos que se unen a antígenos o receptores de la superficie celular. Las secuencias de ácidos nucleicos antisentido también se pueden dirigir a las células utilizando los vectores descritos en la presente.
De acuerdo con otro aspecto, la secuencia de ácidos nucleicos antisentido es una secuencia de ácidos nucleicos a-anomérica. Una secuencia de ácidos nucleicos a-anomérica forma híbridos específicos de cadena doble con ARN complementario en los cuales, a diferencia de las unidades b habituales, las cadenas corren de forma paralela entre sí (Gaultier et al. (1987) Nucí Ac Res 15: 6625-6641 ). La secuencia de ácidos nucleicos antisentido también puede comprender un 2'-o-metilrribonucleótido (Inoue et al. (1987) Nucí Ac Res 15, 6131-6148) o un análogo de ARN-ADN quimérico (Inoue et al. (1987) FEBS Lett. 215, 327-330).
La reducción o sustancial eliminación de la expresión del gen endógeno también se puede realizar utilizando ribozimas. Las ribozimas son moléculas de ARN catalítico con actividad de ribonucleasa capaces de clivar una secuencia de ácidos nucleicos de cadena simple, tal como un mARN, con la cual tienen una región complementaria. De este modo, las ribozimas (por ejemplo, ribozimas hammerhead (descritas en Haselhoff and Gerlach (1988) Nature 334, 585-591) se pueden utilizar para clivar de forma catalítica transcriptos de mARN que codifican un polipéptido, reduciendo sustancialmente de este modo la cantidad de transcriptos de mARN a ser traducidos en un polipéptido. Se puede diseñar una ribozima con especificidad para una secuencia de ácidos nucleicos (ver, por ejemplo: Cech et al. Patente estadounidense No. 4.987.071 ; y Cech et al. Patente estadounidense No. 5.1 16.742). Alternativamente, se pueden utilizar transcriptos de mARN que corresponden a una secuencia de ácidos nucleicos para seleccionar un ARN catalítico que tiene actividad de ribonucleasa específica de un conjunto de moléculas de ARN (Bartel and Szostak (1993) Science 261 , 1411-1418). La utilización de ribozimas para el silenciamiento génico en plantas es conocido en el arte (por ejemplo, Atkins et al. (1994) WO 94/00012; Lenne et al. (1995) WO 95/03404; Lutziger et al. (2000) WO 00/00619; Prinsen et al. (1997) WO 97/13865 y Scott et al. (1997) WO 97/38116).
El silenciamiento génico también se puede lograr mediante mutagénesis de inserción (por ejemplo, inserción de T-ADN o inserción de transposón) o mediante estrategias como las que describen, entre otros, Angelí and Baulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS WO 98/36083) o Baulcombe (WO 99/15682).
El silenciamiento génico también puede ocurrir si hay una mutación en un gen endógeno y/o una mutación en una secuencia de ácidos nucleicos/gen aislados que se introducen posteriormente en una planta. La reducción o sustancial eliminación puede ser causada por un polipéptido no funcional. Por ejemplo, el polipéptido puede unirse a varias proteínas interactuantes; por lo tanto, una o más mutaciones y/o truncamientos pueden generar un polipéptido que aún es capaz de unirse a proteínas interactuantes (tales como proteínas receptoras) pero que no puede exhibir su función normal (tal como un ligando de señalización).
Otro enfoque del silenciamiento génico consiste en hacer blanco en secuencias de ácidos nucleicos complementarias de la región reguladora del gen (por ejemplo, el promotor y/o potenciadores) para formar estructuras helicoidales triples que evitan la transcripción del gen en las células blanco. Ver Helene, C, Anticancer Drug Res. 6, 569-84, 1991 ; Helene et al., Ann. N.Y. Acad. Sci. 660, 27-36 1992; y Maher, L.J. Bioassays 14, 807-15, 1992.
Otros métodos, tal como el uso de anticuerpos dirigidos a un polipéptido endógeno para inhibir su función en la planta, o la interferencia en la vía de señalización en la cual participa un polipéptido, son bien conocidos por el experto en el arte. En particular, puede preverse que las moléculas obtenidas por el hombre pueden ser útiles para inhibir la función biológica de un polipéptido blanco o para interferir con la vía de señalización en la que participa el polipéptido blanco.
Alternativamente, se puede establecer un programa de control para identificar en la población de una planta las variantes naturales de un gen, cuyas variantes codifican polipéptidos con actividad reducida. Dichas variantes naturales también se pueden utilizar, por ejemplo, para realizar recombinación homologa.
Se puede utilizar microARN (miARN) artificial y/o natural para realizar el knock out de la expresión génica y/o la traducción de mARN. Los miARN endógenos son ARN pequeños de cadena simple que generalmente tienen 19-24 nucleótidos de longitud. Su función consiste principalmente en regular la expresión génica y/o la traducción de mARN. La mayoría de los microARN (miARN) vegetales tienen una complementariedad perfecta o casi perfecta con sus secuencias blanco. Sin embargo, existen blancos naturales con hasta cinco faltas de coincidencias. Se procesan a partir de ARN no codificadores más largos con estructuras de replegamiento características mediante RNasas específicas de cadena doble de la familia Dicer. Luego del procesamiento, se incorporan en el complejo de silenciamiento inducido por ARN (RISC) mediante la unión a su componente principal, una proteína Argonauta. MiARN sirve como componente de especificidad de RISC, debido a que forma pares de bases con las secuencias de ácidos nucleicos blanco, en su mayoría mARN, en el citoplasma. Los posteriores eventos reguladores incluyen la escisión y destrucción del mARN blanco y/o la inhibición de la traducción. De este modo, los efectos de la sobreexpresión de miARN a menudo se ven reflejados en niveles más bajos de mARN de genes blanco.
Los microARN artificiales (amiARN), que típicamente tienen 21 nucleótidos de longitud, se pueden modificar mediante ingeniería genética específicamente para regular de forma negativa la expresión génica de un único o de múltiples genes de interés. Los determinantes de la selección del blanco de microARN vegetal son bien conocidos en el arte. Los parámetros empíricos para el reconocimiento del blanco ya han sido definidos y se pueden utilizar para ayudar en el diseño de amiARN específico, (Schwab et al., Dev Cell 8, 517-527, 2005). Las herramientas adecuadas para el diseño y la generación de amiARN y sus precursores también se encuentran disponibles al público (Schwab et al., Plant Cell 18, 1121-1133, 2006).
Para un rendimiento óptimo, las técnicas de silenciamiento génico utilizadas para reducir la expresión de un gen endógeno en una planta requiere el uso de secuencias de ácidos nucleicos provenientes de plantas monocotiledóneas para la transformación de plantas monocotiledóneas, y provenientes de plantas dicotiledóneas para la transformación de plantas dicotiledóneas. Preferentemente, se introduce una secuencia de ácidos nucleicos de cualquier especie vegetal determinada en esa misma especie. Por ejemplo, una secuencia de ácidos nucleicos del arroz es transformada en una planta de arroz. Sin embargo, no es un requisito indispensable que la secuencia de ácidos nucleicos a ser introducida se origine a partir de la misma especie vegetal que la planta en la cual será introducida. Es suficiente que haya homología sustancial entre el gen endógeno blanco y la secuencia de ácidos nucleicos a ser introducida.
Anteriormente se describieron ejemplos de diversos métodos para la reducción o sustancial eliminación de la expresión de un gen endógeno en una planta. Un experto en el arte podrá adaptar fácilmente los métodos de silenciamiento antes mencionados a fin de lograr la reducción de la expresión de un gen endógeno en una planta entera o en sus partes, por ejemplo mediante el uso de un promotor adecuado.
(Gen) Marcador seleccionare /Gen indicador "Marcador seleccionable", "gen marcador seleccionable" o "gen indicador" incluyen cualquier gen que confiere un fenotipo en una célula en la cual se expresa para facilitar la identificación y/o selección de las células que se transfectan o transforman con una construcción de la secuencia de ácidos nucleicos de la invención. Estos genes marcadores permiten la identificación de una transferencia exitosa de las moléculas de la secuencia de ácidos nucleicos por medio de una serie de principios diferentes. Los marcadores adecuados se pueden seleccionar a partir de marcadores que confieren resistencia a antibióticos o herbicidas, que introducen un nuevo rasgo metabólico o que permiten la selección visual. Los ejemplos de genes de marcadores seleccionables incluyen genes que confieren resistencia a antibióticos (tales como nptll que fosforila neomicina y canamicina, o hpt que fosforila higromicina o genes que confieren resistencia, por ejemplo, a bleomicina, estreptomicina, tetraciclina, cloramfenicol, ampicilina, gentamicina, geneticina (G418), espectinomicina o blasticidina), a herbicidas (por ejemplo, bar que proporciona resistencia a Basta®; aroA o gox que proporciona resistencia al glifosato, o los genes que confieren resistencia, por ejemplo, a imidazolinona, fosfinotricina o sulfonilurea), o genes que proporcionan un rasgo metabólico (tales como manA que le permite a las plantas usar mañosa como única fuente de carbono o xilosa isomerasa para la utilización de xilosa o marcadores antinutritivos tales como la resistencia a 2-desoxiglucosa): La expresión de los genes marcadores visuales produce la formación de color (por ejemplo, ß-glucuronidasa, GUS o ß-galactosidasa con sus sustratos coloreados, por ejemplo X-Gal), luminiscencia (tal como el sistema de luciferina/luciferasa) o fluorescencia (proteína fluorescente verde, GFP y sus derivados). Esta lista representa sólo una pequeña cantidad de posibles marcadores. El trabajador experto está familiarizado con tales marcadores. Se prefieren diferentes marcadores según el organismo y el método de selección.
Se sabe que después de la integración estable o transitoria de las secuencias de ácidos nucleicos en las células de plantas, sólo una minoría de las células capta el ADN extraño y, si se desea, lo integra en su genoma, según el vector de expresión usado y la técnica de transfección usada. Para identificar y seleccionar estos integrantes, se introduce usualmente un gen codificador de un marcador seleccionable (tal como los descritos con anterioridad) en las células huésped junto con el gen de interés. Esos marcadores se pueden usar, por ejemplo, en mutantes en los cuales estos genes no son funcionales, por ejemplo, por eliminación con los métodos convencionales. Además, las moléculas de la secuencia de ácidos nucleicos que codifican un marcador seleccionable se puede introducir en una célula huésped en el mismo vector que comprende la secuencia que codifica los polipéptidos de la invención o usada en los métodos de la invención, o sino en un vector separado. Las células que se han transfectado en forma estable con la secuencia de ácidos nucleicos introducida se pueden identificar, por ejemplo mediante selección (por ejemplo, las células que han integrado el marcador seleccionable sobreviven mientras que las otras células mueren). Los genes marcadores se pueden retirar o escindir de la célula transgénica cuando ya no sean necesarios. Las técnicas para retirar él gen marcador son conocidas en el arte, las técnicas útiles se describieron anteriormente en la sección de definiciones.
Debido a que los genes marcadores, en particular los genes para la resistencia a antibióticos y herbicidas, ya no son necesarios o no son deseados en la célula huésped transgénica una vez que se han introducido éxitosamente las secuencias de ácidos nucleicos, el proceso de acuerdo con la invención para introducir las secuencias de ácidos nucleicos utiliza ventajosamente técnicas que permiten retirar o escindir estos genes marcadores. Uno de dichos métodos es conocido como cotransformación. El método de cotransformación emplea simultáneamente dos vectores para la transformación, un vector que porta la secuencia de ácidos nucleicos de acuerdo con la invención y un segundo que porta el/los gen(es) marcador(es). Una gran proporción de transformantes recibe o, en el caso de las plantas comprende (hasta 40% o más de los transformantes), ambos vectores. En el caso de la transformación con Agrobacterias, los transformantes usualmente reciben sólo una parte del vector, es decir, la secuencia flanqueada por el T-ADN, que usualmente representa el cásete de expresión. Los genes marcadores posteriormente se pueden retirar de la planta transformada mediante la realización de cruzas. En otro método, los genes marcadores integrados en un transposón se usan para la transformación junto con una secuencia de ácidos nucleicos deseada (conocido como tecnología Ac/Ds). Los transformantes se pueden cruzar con una fuente de transposasa o los transformantes se transforman con una construcción de la secuencia de ácidos nucleicos que confiere expresión de una transposasa, en forma transitoria o estable. En algunos casos (aprox. 10%), el transposón sale del genoma de la célula huésped una vez que se ha producido la transformación con éxito y se pierde. En otros casos, el transposón salta a un lugar diferente. En estos casos, el gen marcador debe ser eliminado mediante la realización de cruzas. En microbiología, se desarrollaron técnicas que posibilitan o facilitan la detección de dichos eventos. Un método ventajoso adicional consiste en lo que se conoce como sistemas de recombinación, cuya ventaja consiste en que se puede prescindir de la eliminación por cruza. El sistema más conocido de este tipo es el denominado sistema Cre/lox. La Creí es una recombinasa que elimina las secuencias ubicadas entre las secuencias loxP. Si el gen marcador está integrado entre las secuencias loxP, se lo elimina por expresión de la recombinasa una vez que se ha producido éxitosamente la transformación. Otros sistemas de recombinación son los sistemas HIN/HIX, FLP/FRT y REP/STB (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566). Es posible la integración específica de sitio en el genoma de la planta de las secuencias de ácidos nucleicos de acuerdo con la invención. Obviamente, estos métodos también se pueden aplicar en microorganismos tales como levaduras, hongos o bacterias.
Transgénico/Transgen /Recombinante A los fines de la invención, "transgénico", "transgen" o "recombinante" significa, con respecto por ejemplo a una secuencia de ácidos nucleicos, un cásete de expresión, una construcción génica o un vector que comprende la secuencia de ácidos nucleicos o un organismo transformado con las secuencias de ácidos nucleicos, casetes de expresión o vectores de acuerdo con la invención, todas esas construcciones se producen por métodos recombinantes en los cuales (a) las secuencias de ácidos nucleicos que codifican proteínas útiles en los métodos de la invención, o (b) secuencia(s) de control genético que está(n) ligada(s) operativamente a la secuencia de ácidos nucleicos de acuerdo con la invención, por ejemplo un promotor, o (c) a) y b) no están ubicadas en su entorno genético natural o han sido modificadas por métodos recombinantes, siendo posible que la modificación adopte la forma, por ejemplo, de una sustitución, adición, eliminación, inversión o inserción de uno o más residuos de nucleótidos. Por entorno genético natural se entiende el locus genómico o cromosómico natural en la planta original o la presencia en una biblioteca genómica. En el caso de una biblioteca genómica, el entorno genético natural de la secuencia de ácidos nucleicos es preferentemente retenido, por lo menos en parte. El entorno flanquea la secuencia de ácidos nucleicos por lo menos en un lado y tiene una longitud de secuencia de por lo menos 50 pb, preferentemente por lo menos 500 pb, con especial preferencia por lo menos 1000 pb, con máxima preferencia por lo menos 5000 pb. Un cásete de expresión natural - por ejemplo, la combinación natural del promotor natural de las secuencias de ácidos nucleicos con la correspondiente secuencia de ácidos nucleicos que codifica un polipéptido útil en los métodos de la presente invención, como se definió anteriormente - se convierte en un cásete de expresión transgénico cuando este cásete de expresión es modificado por métodos sintéticos no naturales ("artificiales") tales como, por ejemplo, tratamiento mutagénico. Los métodos adecuados se describen, por ejemplo, en US 5.565.350 o WO 00/15815.
Por lo tanto, a los fines de la invención, por planta transgénica se entiende, como se indicó anteriormente, que las secuencias de ácidos nucleicos usadas en el método de la invención no están en su locus natural en el genoma de dicha planta, lo cual posibilita que las secuencias de ácidos nucleicos se expresen en forma homologa o heteróloga. Sin embargo, como se mencionó, transgénico también significa que, mientras las secuencias de ácidos nucleicos de acuerdo con la invención o usadas en el método de invención están en su posición natural el genoma de una planta, la secuencia ha sido modificada con respecto a la secuencia natural y/o que las secuencias reguladoras de las secuencias naturales han sido modificadas. Por transgénico se entiende preferentemente la expresión de las secuencias de ácidos nucleicos de acuerdo con la invención en un locus no natural del genoma, es decir, se produce la expresión homologa, o preferentemente heteróloga, de las secuencias de ácidos nucleicos. En la presente se mencionan las plantas transgénicas preferidas.
Transformación El término "introducción" o "transformación" como se menciona en la presente abarca la transferencia de un polinucleótido exógeno en una célula huésped, independientemente del método usado para la transferencia. El tejido de planta capaz de propagación clonal posterior, sea por organogénesis o embriogénesis, se puede transformar con una construcción genética de la presente invención y una planta completa regenerada a partir de ella. El tejido particular elegido variará de acuerdo con los sistemas de propagación clonal disponibles y más adecuados para la especie particular a transformar. Los ejemplos de tejidos específicos incluyen discos de hoja, polen, embriones, cotiledones, hipocotilos, megagametofitos, tejido de callo, tejido meristemático existente (por ejemplo, meristema apical, brotes axilares y meristemas de raíz), y tejido de meristema inducido (por ejemplo, meristema de cotiledón y meristema de hipocotilo). El polinucleótido se puede introducir en forma transitoria o estable en una célula huésped y se puede mantener no integrado, por ejemplo, como un plásmido. Alternativamente, se lo puede integrar en el genoma del huésped. La célula de planta transformada resultante luego se puede usar para regenerar una planta transformada de la manera conocida por los expertos en el arte.
La transferencia de genes extraños al genoma de una planta se denomina transformación. La transformación de especies de planta es en la actualidad una técnica bastante rutinaria. Ventajosamente, se puede usar cualquiera de los diversos métodos de transformación para introducir el gen de interés en una célula ancestral adecuada. Los métodos descritos para la transformación y regeneración de las plantas a partir de los tejidos de planta o células de planta se pueden utilizar para la transformación transitoria o estable. Los métodos de transformación incluyen el uso de liposomas, electroporación, sustancias químicas que aumentan la captación de ADN libre, inyección del ADN directamente en la planta, bombardeo con pistola de partículas, transformación mediante virus o polen y microproyección. Los métodos se pueden seleccionar del método de calcio/polietilenglicol para protoplastos (Krens, F.A. et al., (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); electroporación de protoplastos (Shillito R.D. et al. (1985) Bio/Technol 3, 1099-1 102); microinyección en material de planta (Crossway A et al., (1986) Mol. Gen Genet 202: 179-185); bombardeo con partículas recubiertas de ADN o ARN (Klein TM et al., (1987) Nature 327: 70) infección con virus (no integrativo) o similares. Las plantas transgénicas, que incluyen plantas de cultivo transgénicas, se producen preferentemente por medido de transformación mediada por Agrobacterium. Un método de transformación ventajoso es la transformación in planta. Con este fin, es posible, por ejemplo, permitir que las agrobacterias actúen en las semillas de la planta o inocular el meristema de la planta con las agrobacterias. De acuerdo con la invención, se ha demostrado que es particularmente oportuno permitir que una suspensión de agrobacterias transformadas actúe en la planta intacta o por lo menos en los primordios de la flor. Luego se cultiva la planta hasta que se obtienen las semillas de la planta tratada (Clough and Bent, Plant J. (1998) 16, 735-743). Los métodos para la transformación de arroz mediada por Agrobacterium incluyen métodos bien conocidos para la transformación de arroz, tales como los descritos en alguna de las siguientes: solicitud de patente europea EP 1198985 A1 , Aldemita and Hodges (Planta 199: 612-617, 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282, 1994), cuyas descripciones se incorporan por referencia a la presente como si se expusieran en su totalidad. En el caso de la transformación del maíz, el método preferido es el que se describe en Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996) o Frame et al. (Plant Physiol 129(1 ): 13-22, 2002), cuyas descripciones se incorporan por referencia a la presente como si se expusieran en su totalidad. Dichos métodos también se describen a modo de ejemplo en B. Jenes et al., Techniques for Gene Transfer, in: Planta transgénicas, Vol. 1 , Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143 y en Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225). Las secuencias de ácidos nucleicos o la construcción a ser expresada se clona preferentemente en un vector que es adecuado para transformar Agrobacterium tumefaciens, por ejemplo pBin19 (Bevan et al., Nucí. Acids Res. 12 (1984) 871 1). Las agrobacterias transformadas por dicho vector se pueden usar de la manera conocida para la transformación de plantas, tales como las plantas usadas como modelo, como Arabidopsis (dentro del alcance de la presente invención, Arabidopsis thaliana no se considera una planta de cultivo), o plantas de cultivo tales como, a modo de ejemplo, plantas de tabaco, por ejemplo mediante la inmersión de hojas machacadas u hojas picadas en una solución de agrobacterias y el posterior cultivo en un medio adecuado. La transformación de plantas por medio de Agrobacterium tumefaciens se describe, por ejemplo, en Hofgen and Willmitzer in Nucí. Acid Res. (1988) 16, 9877 o se conoce inter alia de F.F. White, Vectors for Gene Transfer in Higher Plants; in Planta transgénicas, Vol. 1 , Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38.
Además de la transformación de células somáticas, que luego se han de regenerar en plantas intactas, también es posible transformar las células de los meristemas de las plantas y, en particular, las células que se desarrollan en gametos. En este caso, los gametos transformados siguen el desarrollo natural de la planta, dando origen a plantas transgénicas. De este modo, por ejemplo, las semillas de Arabidopsis se tratan con agrobacterias y las semillas se obtienen a partir de las plantas en desarrollo, de las cuales se transforma una cierta proporción y de este modo son transgénicas [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-H Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. Los métodos alternativos se basan en la eliminación reiterada de las inflorescencias y la incubación del sitio de escisión en el centro de la roseta con las agrobacterias transformadas, por la cual las semillas transformadas también se pueden obtener en un momento posterior (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). Sin embargo, un método especialmente efectivo es el método de infiltración al vacío con sus modificaciones, tal como el método de "inmersión floral". En el caso de infiltración al vacío de Arabidopsis, las plantas intactas bajo presión reducida se tratan con una suspensión de agrobacterias [Bechthold, N (1993). C R Acad Sci París Life Sci, 316: 1 194-1199], mientras que en el caso del método de "inmersión floral" el tejido floral en desarrollo se incuba durante poco tiempo con una suspensión de agrobacterias tratada con tensioactivos [Clough, SJ and Bent AF (1998) The Plant J. 16, 735-743]. En ambos casos se cosecha una proporción determinada de semillas transgénicas, y estas semillas se pueden distinguir de las semillas no transgénicas cultivándolas en las condiciones selectivas descritas anteriormente. Además, la transformación estable de los plástidos es ventajosa porque los plástidos se heredan por vía materna en la mayoría de los cultivos, lo cual reduce o elimina el riesgo de flujo del transgén mediante el polen. La transformación del genoma del cloroplasto se obtiene generalmente por un proceso que exhibe en forma esquemática Klaus et al., 2004 [Nature Biotechnology 22 (2), 225-229]. En resumen, las secuencias a transformar se clonan junto con un gen marcador seleccionable entre las secuencias flanqueadoras homologas al genoma del cloroplasto. Estas secuencias flanqueadoras homologas dirigen la integración específica de sitio en el plastoma. Se ha descrito la transformación de los plástidos para diferentes especies de plantas y se brinda un análisis general en Bock (2001 ) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21 ; 312 (3):425-38 o Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21 , 20-28. Recientemente se han informado más avances biotecnológicos en forma de transformantes de plástidos libres de marcador, que se pueden producir con un gen marcador cointegrado transitorio (Klaus et al., 2004, Nature Biotechnology 22(2), 225-229).
Rotulado de activación de T-ADN El rotulado de activación de T-ADN (Hayashi et al. Science (1992) 1350-1353) comprende la inserción de T-ADN, que generalmente contiene un promotor (también puede ser un potenciador de la traducción o un intrón), en la región genómica del gen de interés o 10 kb secuencia arriba o abajo de la región codificadora de un gen de manera tal que el promotor dirige la expresión del gen blanco. Generalmente, la regulación de la expresión del gen blanco es alterada por su promotor natural y el gen cae bajo el control del promotor recién introducido. El promotor generalmente está insertado en un T-ADN. Este T-ADN se inserta aleatoriamente en el genoma vegetal, por ejemplo, por infección de Agrobacterium y conduce a la expresión modificada de los genes cerca del T-ADN insertado. Las plantas transgénicas obtenidas muestran fenotipos dominantes debido a la expresión modificada de genes cercanos al promotor introducido.
TILLING El término "TILLING" es una abreviatura de "Lesiones locales dirigidas inducidas en genomas" [Targeted Induced Local Lesions In Genomes] y se refiere a una tecnología de mutagénesis útil para generar y/o identificar secuencias de ácidos nucleicos que codifican proteínas con expresión y/o actividad modificada. TILLING también permite la selección de plantas que portan tales variantes mutantes. Estas variantes mutantes pueden exhibir expresión modificada, tanto en relación a la potencia o localización o duración (por ejemplo, si las mutaciones afectan al promotor). Estas variantes mutantes pueden exhibir mayor actividad que la exhibida por el gen en su forma natural. TILLING combina mutagénesis de alta densidad con métodos de detección de alto rendimiento. Las etapas que típicamente se siguen en TILLING son: (a) mutagénesis EMS (Redei GP and Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16-82; Feldmann et al., (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratpry Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparación de ADN y agrupación de individuos; (c) amplificación por PCR de una región de interés; (d) desnaturalización y apareamiento para permitir la formación de heterodúplex; (e) DHPLC, donde se detecta la presencia de un heterodúplex en una agrupación como un pico extra en el cromatograma; (f) identificación del individuo mutante; y (g) secuenciación del producto de PCR mutante. Los métodos para TILLING son bien conocidos en el arte (McCallum et al., (2000) Nat Biotechnol 18: 455-457; reviewed by Stemple (2004) Nat Rev Genet 5(2): 145-50).
Recombinación homologa La recombinación homologa permite la introducción en un genoma de una secuencia de ácidos nucleicos seleccionada en una posición seleccionada definida. La recombinación homologa es una tecnología estándar usada en forma rutinaria en las ciencias biológicas para organismos inferiores tales como levaduras o musgo Physcomitrella. Se han descrito métodos para realizar la recombinación homologa en plantas, no sólo para plantas modelo (Offringa et al. (1990) EMBO J 9(10): 3077-84) sino también para plantas de cultivo, por ejemplo arroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; lida and Terada (2004) Curr Opin Biotech 15(2): 132-8) y hay enfoques que se pueden aplicar de manera general independientemente del organismo blanco (Miller et al, Nature Biotechnol. 25, 778-785, 2007).
Rendimiento El término "rendimiento" significa en general un producto medible de valor económico, típicamente relacionado con un cultivo específico, un área y un período de tiempo. Cada una de las partes de la planta contribuye directamente al rendimiento sobre la base de su cantidad, tamaño y/o peso, o el rendimiento real es el rendimiento por metro cuadrado para un cultivo y año, que se determina dividiendo la producción total (incluye la producción cosechada y tasada) por metros cuadrados plantados. El término "rendimiento" de una planta se puede relacionar con la biomasa vegetativa (biomasa de raíz y/o brote), con los órganos reproductores y/o con los propágulos (tales como semillas) de esa planta.
Vigor temprano "Vigor temprano" se refiere al crecimiento equilibrado, saludable y activo, en especial durante las etapas tempranas del crecimiento de la planta, y puede ser el resultado de una mayor aptitud de la planta debido, por ejemplo, a que las plantas se adaptan mejor a su ambiente (es decir, optimización del uso de los recursos de energía y distribución entre brote y raíz). Las plantas que tienen vigor temprano también muestran mayor supervivencia de las plántulas y un mejor establecimiento del cultivo, lo que con frecuencia da como resultado campos muy uniformes (en donde el cultivo crece en forma uniforme, es decir, la mayoría de las plantas alcanzan los diversos estadios de crecimiento casi al mismo tiempo), y con frecuencia mejor y mayor rendimiento. En consecuencia, el vigor temprano se puede determinar midiendo diversos factores, tales como peso de mil granos, porcentaje de germinación, porcentaje de emergencia, crecimiento de la plántula, altura de la plántula, longitud de la raíz, biomasa de la raíz y del brote, entre otros.
Incrementar/meiorar/potenciar Los términos "incrementar", "mejorar" o "potenciar" son indistintos y significan, en el sentido de la solicitud, al menos 3%, 4%, 5%, 6%, 7%, 8%, 9% o 10%, preferentemente al menos 15% o 20%, más preferentemente 25%, 30%, 35% o 40% más rendimiento y/o crecimiento en comparación con las plantas de control como se definen en la presente.
Rendimiento de la semilla Un mayor rendimiento de la semilla se puede manifestar como uno o más de los siguientes: a) un aumento de la biomasa de la semilla (peso total de la semilla) que puede ser en base a cada semilla y/o planta y/o metro cuadrado, b) mayor cantidad de flores por planta; c) mayor cantidad de semillas (llenas); d) mayor tasa de llenado de la semilla (que se expresa como la relación entre la cantidad de semillas llenas dividido por la cantidad total de semillas); e) mayor índice de cosecha, que se expresa como la relación entre el rendimiento de las partes cosechables, tales como semillas, dividido por la biomasa total; y f) mayor peso de mil granos (TKW), y g) mayor cantidad de panojas primarias, que se extrapola a partir de la cantidad de semillas llenas contadas y su peso total. Un mayor TKW puede ser el resultado de un mayor tamaño de la semilla y/o peso de la semilla, y también puede ser el resultado de un mayor tamaño del embrión y/o endosperma.
Un aumento del rendimiento de la semilla también se puede manifestar como un aumento del tamaño de la semilla y/o volumen de la semilla. Además, un aumento del rendimiento de la semilla también se puede manifestar como un aumento del área de la semilla y/o longitud de la semilla y/o ancho de la semilla y/o perímetro de la semilla. El mayor rendimiento de la semilla también puede dar como resultado una arquitectura modificada o puede producirse a causa de la arquitectura modificada. índice de verdor El "índice de verdor" como se usa en la presente se calcula a partir de las imágenes digitales de las plantas. Por cada píxel perteneciente a la planta objeto en la imagen, se calcula la relación del valor verde versus el valor rojo (para codificar el color en el modelo RGB). El índice de verdor se expresa como el porcentaje de píxeles para el cual la relación entre verde y rojo excede en un umbral determinado. En condiciones normales de crecimiento, en condiciones de crecimiento con estrés salino y en condiciones de crecimiento con disponibilidad reducida de nutrientes, el índice de verdor de las plantas se mide en la última toma de imágenes antes de la floración. Por el contrario, en condiciones de crecimiento con estrés por sequía, el índice de verdor de las plantas se mide en la primera toma de imágenes después de la sequía.
Planta El término "planta" como se usa en la presente abarca plantas completas, ancestros y progenie de las plantas y partes de las plantas, que incluyen semillas, brotes, tallos, hojas, raíces (incluso tubérculos), flores y tejidos y órganos, donde cada uno de los anteriores comprende la secuencia de ácidos nucleicos/genes de interés. El término "planta" también abarca células de planta, cultivos en suspensión, tejidos de callos, embriones, regiones meristemáticas, gametofitos, esporofitos, polen y microsporas, donde cada uno de los anteriores comprende la secuencia de ácidos nucleicos/genes de interés.
Las plantas que son particularmente útiles en los métodos de la invención incluyen todas las plantas que pertenecen a la superfamilia Viridiplantae, en particular plantas monocotiledóneas y dicotiledóneas que incluyen forraje o legumbres forrajeras, plantas ornombrentales, cultivos alimenticios, árboles o arbustos seleccionados de la lista que comprende Acer spp., Actinidia spp., Abelmoschus spp., Agave sisalana, Agropyron spp., Agrostis stolonifera, Allium spp., Amaranthus spp., Ammophila arenaria, Ananas comosus, Annona spp., Apium graveolens, Arachis spp, Artocarpus spp., Asparagus officinalis, Avena spp. (por ejemplo, Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida), Averrhoa carambola, Bambusa sp., Benincasa hispida, Bertholletia excelsea, Beta vulgaris, Brassica spp. (por ejemplo, Brassica napus, Brassica rapa ssp. [cañóla, semilla de aceite de colza, nabo]), Cadaba farinosa, Camellia sinensis, Canna indica, Cannabis sativa, Capsicum spp., Carex elata, Carica papaya, Carissa macrocarpa, Carya spp., Carthamus tinctorius, Castanea spp., Ceiba pentandra, Cichorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffea spp., Colocasia esculenta, Cola spp., Corchorus sp., Coriandrum sativum, Corylus spp., Crataegus spp., Crocus sativus, Cucúrbita spp., Cucumis spp., Cynara spp., Daucus carota, Desmodium spp., Dimocarpus longan, Dioscorea spp., Diospyros spp., Echinochloa spp., E/ae/'s fpor ejemplo, E/ae/s guineensis, Elaeis oleífera), Eleusine coracana, Eragrostis tef, Erianthus sp., Eriobotrya japónica, Eucalyptus sp., Eugenia uniflora, Fagopyrum spp., Fagus spp., Festuca arundinacea, Ficus carica, Fortunella spp., Fragaria spp., Ginkgo biloba, Glycine spp. fpor ejemplo, Glycine max, Soja hispida o Soja max), Gossypium hirsutum, Helianthus spp. fpor ejemplo, Helianthus annuus), Hemerocallis fulva, Hibiscus spp., Hordeum spp. fpor ejemplo, Hordeum vulgare), Ipomoea batatas, Juglans spp., Lactuca sativa, Lathyrus spp., Lens culinaris, Linum usitatissimum, Litchi chinensis, Lotus spp., Luffa acutangula, Lupinus spp., Luzula sylvatica, Lycopersicon spp. fpor ejemplo, Lycopersicon esculentum, Lycopersicon lycopersicum, Lycopersicon pyriforme), Macrotyloma spp., Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica, Manihot spp., Manilkara zapota, Medicago sativa, Melilotus spp., Mentha spp., Miscanthus sinensis, Momordica spp., Morus nigra, Musa spp., Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., O/yza spp. fpor ejemplo, Oryza saf/Va, Oryza latifolia), Panicum miliaceum, Panicum virgatum, Passiflora edulis, Pastinaca sativa, Pennisetum sp., Persea spp., Petroselinum crispum, Phalaris arundinacea, Phaseolus spp., Phleum pratense, Phoenix spp., Phragmites australis, Physalis spp., Pinus spp., Pistacia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Púnica granatum, Pyrus communis, Quercus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Ricinus communis, Rubus spp., Saccharum spp., Sa// sp., Sambucus spp., Sécale cereale, Sesamum spp., Sinapis sp., Solanum spp. fpor ejemplo, Solanum tuberosum, Solanum integrifolium o Solanum lycopersicum), Sorghum bicolor, Spinacia spp., Syzygium spp., Tagetes spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Tripsacum dactyloides, Triticale sp., Triticosecale rimpaui, Triticum spp. fpor ejemplo, Triticum aestivum, Triticum durum, Triticum turgidum, Triticum hybernum, Triticum macha, Triticum sativum, Triticum monococcum o Triticum vulgare), Tropaeolum minus, Tropaeolum majus, Vaccinium spp., Vicia spp., Wgna spp., Wo/a odorata, Vitis spp., Zea mays, Zizania palustris, Ziziphus spp., entre otros.
Descripción detallada de la invención De modo sorprendente, en la actualidad se ha descubierto que modular la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 produce plantas que tienen rasgos mejorados relacionados con el rendimiento, con respecto a plantas de control. De acuerdo con una primera forma de realización, la presente invención provee un método para mejorar rasgos relacionados con el rendimiento en plantas con respecto a plantas de control, que comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 en una planta Además, de modo sorprendente, en la actualidad se ha descubierto que modular la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido PEAMT produce plantas que tienen rasgos mejorados relacionados con el rendimiento, con respecto a plantas de control. De acuerdo con una primera forma de realización, la presente invención provee un método para mejorar rasgos relacionados con el rendimiento en plantas con respecto a plantas de control, que comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido PEAMT en una planta.
Además, de modo sorprendente, en la actualidad se ha descubierto que incrementar la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido FATB como se define en la presente, produce plantas que tienen rasgos aumentados relacionados con el rendimiento de las semillas, con respecto a plantas de control. De acuerdo con una primera forma de realización, la presente invención provee un método para incrementar rasgos relacionados con el rendimiento de las semillas en plantas con respecto a plantas de control, que comprende incrementar la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido FATB en una planta.
Además, de modo sorprendente, en la actualidad se ha descubierto que modular la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido tipo LFY produce plantas que tienen rasgos mejorados relacionados con el rendimiento, con respecto a plantas de control. De acuerdo con una primera forma de realización, la presente invención provee un método para mejorar rasgos relacionados con el rendimiento en plantas con respecto a plantas de control, que comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido tipo LFY en una planta.
Un método preferido para modular (preferentemente, incrementar) la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY consiste en la introducción y expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY.
En relación a los polipéptidos GS1, cualquier referencia de aquí en adelante a una "proteína útil en los métodos de la invención" significa un polipéptido GS1 como se define en la presente. Cualquier referencia de aquí en adelante a una "secuencia de ácidos nucleicos útil en los métodos de la invención" significa una secuencia de ácidos nucleicos capaz de codificar tal polipéptido GS1. La secuencia de ácidos nucleicos a introducir en una planta (y por lo tanto útil en la realización de los métodos de la invención) es cualquier secuencia de ácidos nucleicos que codifica el tipo de proteína que se describirá a continuación, de aquí en adelante también denominada "secuencia de ácidos nucleicos GS1" o "gen GST.
A los fines de la presente invención, un "polipéptido GS1" como se define en la presente se refiere a cualquier Glutamina Sintasa 1 (GS1) que se agrupa con las proteínas GS1 provenientes de algas (para formar un ciado tipo alga) en un árbol filogenético tal como el que se muestra en las Figuras 3A y 3B. Preferentemente, GS1 proviene de algas. Glutamina Sintasa (número de enzima en el catálogo EC 6.3.1.2) cataliza la siguiente reacción: ATP + L-Glutamato + NH3 ¾ L-Glutamina + ADP + Fosfato Preferentemente, la proteína GS1 comprende el dominio Gln-synt_C (acceso a Pfam PF00120) y un dominio Gln-synt_N (acceso a Pfam PF03951). Más preferentemente, la proteína GS1 útil en los métodos de la presente invención comprende al menos una, preferentemente por lo menos dos, más preferentemente las tres siguientes secuencias conservadas, en las cuales hay como máximo 4, preferentemente 3 o menos, más preferentemente 2 o menos, con máxima preferencia 1 o ninguna falta de coinc¡denc¡a| Motivo 1 (SEQ ID NO: 3): GY(Y/I_/F)(E T)DRRP(A/S/P)(A S)(N/D)(V/IJA/M)D (P/A)Y Preferentemente, el Motivo 1 es GY(Y/IJF)(E/T)DRRP(A/P)(A/S)(N/D)(V/UA)D(P/A)Y Motivo 2 (SEQ ID NO: 4): DP(I/F)RG(A/E/D/S/G/L/V)(P/N/D)(H/N)(V/I)( )V (L/l/M)(Cfi7A) Preferentemente, el Motivo 2 es DP(I/F)RG(A/E/G)(P/N/D)(H/N)(V/I)LV(L/M)(C/A) Motivo 3 (SEQ ID NO: 5): G(A/L/M/G/C)H(T/S/I/V/F)(N/K)(F/Y/V)S(T/S/N) Preferentemente, el Motivo 3 es G(A/M/G/C)H(T/I/V/F)(N/K)(F/Y)S(T/N) De modo alternativo, el homólogo de una proteína GS1 tiene, en orden creciente de preferencia, al menos 25%, 26%, 27%, 28%, 29%, 30%, 31 %, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41 %, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51 %, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71 %, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81 %, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia total con respecto al aminoácido representado por SEQ ID NO: 2, siempre que la proteína homologa comprenda los motivos conservados como se indicó anteriormente. La identidad de secuencia total se determina utilizando un algoritmo de alineamiento global, tal como el algoritmo de Needleman Wunsch en el programa GAP (GCG Wisconsin Package, Accelrys), preferentemente con parámetros predeterminados y preferentemente con secuencias de proteínas maduras (es decir, sin tener en cuenta señales de secreción o péptidos de tránsito). En comparación con la identidad de secuencia total, la identidad de secuencia generalmente será mayor cuando sólo se consideran los dominios o motivos conservados.
Con preferencia, la secuencia de polipéptidos que, cuando se usa en la construcción de un árbol filogenético, tal como el representado en las Figuras 3a y 3b, se agrupa con el ciado tipo alga (el grupo de polipéptidos GS1 de algas que comprende la secuencia de aminoácidos representada por SEQ ID NO: 2) en lugar de agruparse con el grupo glutamina sintasa ceroplástica vegetal o citosólica vegetal.
En relación a los polipéptidos PEAMT, cualquier referencia de aquí en adelante a una "proteína (o polipéptido) útil en los métodos de la invención" significa un polipéptido PEAMT como se define en la presente. Cualquier referencia de aquí en adelante a una "secuencia de ácidos nucleicos útil en los métodos de la invención" significa una secuencia de ácidos nucleicos capaz de codificar tal polipéptido PEAMT. La secuencia de ácidos nucleicos a introducir en una planta (y por lo tanto útil en la realización de los métodos de la invención) es cualquier secuencia de ácidos nucleicos que codifica el tipo de proteína que se describirá a continuación, de aquí en adelante también denominada "secuencia de ácidos nucleicos PEAMT o "gen PEAMT.
Un "polipéptido PEAMT" como se define en la presente se refiere a cualquier polipéptido que tiene actividad de fosfoetanolamina N-metiltransferasa.
Las herramientas y técnicas para medir la actividad de fosfoetanolamina N- metiltransferasa son conocidas en el arte. Por ejemplo, la actividad in vivo del polinucleótido PEAMT y el polipéptido de aquel codificado se puede analizar por complementación en Schizosaccharommyces pombe (Nuccio et al; 2000). La actividad de PEAMT también se puede determinar in vitro como se describe en (Nuccio et al; 2000).
Un polipéptido PEAMT comprende dos dominios IPR013216, metiltransferasa tipo 11 (número de acceso a Interpro: IPR013216; número de acceso a pfam: PF08241) y opcionalmente un dominio ubiE/COQ5 metiltransferasa (Ubie_methyltran (número de acceso a pfam: PF01209). ' Un dominio metiltransferasa tipo 11 y un método para identificar la presencia de dicho dominio en un polipéptido son conocidos en el arte. Los ejemplos de proteínas que comprenden dos dominios Metiltransferasa tipo 1 1 se indican en la. Tabla A2. Los dominios metiltransferasa tipo 1 1 que se presentan en SEQ ID NO: 58 se indican en SEQ ID NO: 86 y 87. La sección de ejemplos presenta métodos para identificar la presencia de metiltransferasa tipo 1 1 y ubiE/COQ5 metiltransferasa en el polipéptido PEAMT representado por SEQ ID NO: 58.
SEQ ID NO: 58 comprende dos dominios metiltransferasa tipo 1 1 representados por SEQ ID NO: 86 (PPYEGKSVLELGAGIGRFTGELAQKAGEVIALDIIESAIQKNESVNGHYKNIKFMCAD VTSPDLKIKDGSIDUFSNWLLMYLSDKEVELMAERMIGWVKPGGYIFFRES) y SEQ ID NO: 87 (DLKPGQKVLDVGCGIGGGDFYMAENFDVHWGIDLSVNMISFALERAIGLKCSVEFEV ADCTTKTYPDNSFDVIYSRDTILHIQDKPALFRTFFKWLKPGGKVLITDY). Además, SEQ ID NO: 58 comprende un dominio ubiE/COQ5 metiltransferasa representado por SEQ ID NO: 88 (ERVFGEGYVSTGGFETTKEFVAKMDLKPGQKVLDVGCGIGGGDFYMAENFDVHWGID LSVNMISFALERAIGLKCSVEFEVADCTTKTYPDNSFDVIYSRDTILHIQDKPALFRTFFKWL KPGGKVLITDYCRSAETPSPEFAEYIKQRGYDLHDVQAYGQMLKDAGFDDVIAEDRTDQ).
Un "polipéptido PEAMT" útil en los métodos de la invención también puede comprender uno o más de los siguientes motivos: 1. Motivo 4: IFFRESCFHQSGD (SEQ ID NO: 89); 2. Motivo 5: EYIKQR ( SEQ ID NO: 90); 3. Motivo 6: WGLFIA (SEQ ID NO: 91 ); Los Motivos 4 a 6 están ubicados en la mitad C-terminal del polipéptido PEAMT representado por SEQ ID NO: 58 en las posiciones de aminoácidos 138-150, 383-388 y 467-472, respectivamente.
Preferentemente, la proteína PEAMT útil en los métodos de la invención comprende un motivo que tiene por lo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100% de identidad de secuencia con cualquiera de los Motivos 1 a 3.
Más preferentemente, la proteína PEAMT útil en los métodos de la invención comprende un dominio conservado que tiene, en orden creciente de preferencia, por lo menos 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% de identidad de secuencia con cualquiera de SEQ ID NO: 86 a 88 o con cualquiera de los dominios de aminoácidos indicados en la Tabla C2 de la sección de ejemplos.
Un "PEAMT o su homólogo" como se define en la presente se refiere a cualquier polipéptido que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia total con el aminoácido representado por SEQ ID NO: 58.
Alternativamente, el homólogo de una proteína PEAMT comprende un dominio de aminoácido conservado que tiene, en orden creciente de preferencia, por lo menos 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia con los motivos de aminoácidos indicados en la Tabla C2.
La identidad de secuencia se determina utilizando un algoritmo de alineamiento, tal como el algoritmo de Needleman Wunsch en el programa GAP (GCG Wisconsin Package, Accelrys), con preferencia con parámetros predeterminados o BLAST. En comparación con la identidad de secuencia total, la identidad de secuencia generalmente será mayor cuando sólo se consideran dominios o motivos conservados.
Preferentemente, la secuencia de polipéptidos que, cuando se usa en la construcción de un árbol filogenético, tal como el que se representa en la Figura 6, se agrupa con el grupo I de los polipéptidos PEAMT que comprenden la secuencia de aminoácidos representada por SEQ ID NO: 58 en lugar de agruparse con cualquier otro grupo.
Además, la invención también provee secuencias de ácidos nucleicos desconocidas hasta el momento que codifican un polipéptido FATB y un polipéptido FATB.
De acuerdo con una forma de realización de la presente invención, se provee por lo tanto una secuencia de ácidos nucleicos aislada que comprende: (i) una secuencia de ácidos nucleicos representada por SEQ ID NO: 130; (ii) el complemento una secuencia de ácidos nucleicos representada por SEQ ID NO: 130; (iii) una secuencia de ácidos nucleicos que codifica un polipéptido FATB que tiene, en orden creciente de preferencia, al menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia de aminoácidos con la secuencia de polipéptidos representada por SEQ ID NO: 131.
De acuerdo con otra forma de realización de la presente invención, también se provee un polipéptido aislado que comprende: (i) una secuencia de polipéptidos representada por SEQ ID NO: 131 ; (ii) una secuencia de polipéptidos que tiene, en orden creciente de preferencia, al menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia con la secuencia de polipéptidos representada por SEQ ID NO: 131 ; (iii) derivados de cualquiera de las secuencias de polipéptidos indicadas en (i) o (ii) anterior.
Un método preferido para incrementar la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido FATB consiste en la introducción y expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido FATB.
En relación a los polipéptidos FATB, cualquier referencia de aquí en adelante a una "proteína útil en los métodos de la invención" significa un polipéptido FATB como se define en la presente. Cualquier referencia de aquí en adelante a una "secuencia de ácidos nucleicos útil en los métodos de la invención" significa una secuencia de ácidos nucleicos capaz de codificar dicho polipéptido FATB. La secuencia de ácidos nucleicos a introducir en una planta (y por lo tanto útil en la realización de los métodos de la invención) es cualquier secuencia de ácidos nucleicos que codifica el tipo de polipéptido que se describirá a continuación, de aquí en adelante también denominado "secuencia de ácidos nucleicos FATB" o "gen FATB".
Un "polipéptido FATB" como se define en la presente se refiere a cualquier polipéptido que comprende (i) un péptido de tránsito plastídico; (ii) al menos una hélice transmembranal; (iii) y un dominio de la familia acil-ACP tioesterasa con acceso a InterPro IPR002864; De manera alternativa o adicional, un "polipéptido FATB" como se define en la presente se refiere a cualquier secuencia de polipéptidos que tiene (i) un péptido de tránsito plastídico; (ii) en orden creciente de preferencia por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con una hélice transmembranal representada por SEQ ID NO: 141 ; y que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con un dominio de la familia acil-ACP tioesterasa representado por SEQ ID NO: 140.
De manera alternativa o adicional, un "polipéptido FATB" como se define en la presente se refiere a cualquier polipéptido que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con un polipéptido FATB representado por SEQ ID NO: 93 o con cualquiera de las secuencias de polipéptidos indicadas en la Tabla A3 de la presente.
De manera alternativa o adicional, un "polipéptido FATB" como se define en la presente se refiere a cualquier secuencia de polipéptidos que, cuando se usa en la construcción de un árbol filogenético de FAT (FATA y FATB en forma conjunta), tal como el representado en la Figura 10, se agrupa con el ciado de polipéptidos FATB que comprende la secuencia de polipéptidos representada por SEQ ID NO: 93 (se muestra con una flecha en la Figura 10) en lugar de agruparse con el ciado de polipéptidos FATA.
De manera alternativa o adicional, un "polipéptido FATB" es un polipéptido con actividad enzimática que consiste en hidrolizar uniones de acil-ACP tioéster, preferentemente de acil-ACP saturado (en donde la cadena tiene una longitud que varía de 8 a 18 carbonos), liberando ácidos grasos libres y proteína portadora de acilo (ACP).
En relación a los polipéptidos tipo LFY, cualquier referencia de aquí en adelante a una "proteína útil en los métodos de la invención" significa un polipéptido tipo LFY como se define en la presente. Cualquier referencia de aquí en adelante a una "secuencia de ácidos nucleicos útil en los métodos de la invención" significa una secuencia de ácidos nucleicos capaz de codificar dicho polipéptido tipo LFY. La secuencia de ácidos nucleicos a introducir en una planta (y por lo tanto útil en la realización de los métodos de la invención) es cualquier secuencia de ácidos nucleicos que codifica el tipo de proteína que se describirá a continuación, de aquí en adelante también denominada "secuencia de ácidos nucleicos tipo LFY o "gen tipo LFY'.
Un "polipéptido tipo LFY" como se define en la presente se refiere a cualquier factor de transcripción que comprende un dominio FLO_LFY (acceso a InterPro IPR002910; acceso a Pfam PF01698). El dominio FLO_LFY representa la parte principal de la secuencia de proteínas (ver Figura 14) y está muy conservada (Figura 15).
Preferentemente, la proteína tipo LFY tiene, en orden creciente de preferencia, por lo menos 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61 %, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71 %, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81 %, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia total con el aminoácido representado por SEQ ID NO: 146, siempre que la proteína homologa comprenda el motivo FLO_LFY conservado como se indicó anteriormente. La identidad de secuencia total se determina utilizando un algoritmo de alineamiento global, tal como el algoritmo de Needleman Wunsch en el programa GAP (GCG Wisconsin Package, Accelrys), preferentemente con parámetros predeterminados. En comparación con la identidad de secuencia total, la identidad de secuencia generalmente será mayor cuando sólo se consideran los dominios o motivos conservados (tal como el dominio FLO_LFY).
Preferentemente, la secuencia de polipéptidos, cuando se usa en la construcción de un árbol filogenético, tal como el representado en la Figura 16, se agrupa con el grupo de polipéptidos tipo LFY.
Los términos "dominio", "distintivo" y "motivo" están definidos en la sección "Definiciones" de la presente. Existen bases de datos especializadas para la identificación de dominios, por ejemplo, SMART (Schultz et al. (1998) Proc. Nati. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Secuencias de ácidos nucleicos Res 30, 242-244), InterPro (Mulder et al., (2003) Nucí. Acids. Res. 31 , 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61 , AAAI Press, Menlo Park; Hulo et al., Nucí. Acids. Res. 32:D134-D137, (2004)), o Pfam (Bateman et al., Secuencias de ácidos nucleicos Research 30(1): 276-280 (2002)). Se dispone de un conjunto de herramientas para el análisis in silico de secuencias de proteínas en el servidor proteómico ExPASy (Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Secuencias de ácidos nucleicos Res. 31:3784-3788(2003)). También se pueden identificar dominios o motivos usando técnicas de rutina, tal como alineamiento de secuencias.
En relación a los polipéptidos FATB, en el Ejemplo 4 de la presente se presenta un análisis de la secuencia de polipéptidos de SEQ ID NO: 93. Por ejemplo, un polipéptido FATB representado por SEQ ID NO: 93 comprende un dominio de la familia de acil-ACP tioesterasa con acceso a InterPro IPR002864. En la Figura 13 se muestra un alineamiento de los polipéptidos de la Tabla A3 de la presente. Dichos alineamientos son útiles para identificar los dominios o motivos más conservados entre los polipéptidos FATB, tal como la hélice transmembranal prevista TMpred (ver Ejemplo 5 de la presente) representada por SEQ ID NO: 141 (comprendida en SEQ ID NO: 93).
Los métodos para el alineamiento de secuencias para su comparación son conocidos en el arte, y dichos métodos incluyen GAP, BESTFIT, BLAST, FASTA y TFASTA. GAP usa el algoritmo de Needleman y Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar el alineamiento global (es decir, que abarca las secuencias completas) de dos secuencias que maximiza la cantidad de coincidencias y minimiza la cantidad de brechas. El algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula el porcentaje de identidad de secuencia y realiza un análisis estadístico de la similitud entre las dos secuencias. El software para realizar el análisis BLAST está disponible al público a través del National Centre for Biotechnology Information (NCBI). Los homólogos se pueden identificar con facilidad mediante, por ejemplo, el algoritmo ClustalW de alineamiento de secuencia múltiple (versión 1.83), con los parámetros de alineamiento apareado predeterminado y un método de calificación en porcentaje. Los porcentajes globales de similitud e identidad también se pueden determinar mediante uno de los métodos disponibles en el paquete de software MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Se puede realizar edición manual menor para optimizar el alineamiento entre motivos conservados, como sería evidente para un experto en el arte. Además, en lugar de utilizar secuencias de longitud total para la identificación de homólogos, también se pueden usar dominios específicos. Los valores de identidad de secuencia se pueden determinar para la totalidad de la secuencia de ácidos nucleicos o secuencia de aminoácidos, y/o para dominios seleccionados o motivo(s) conservado(s), utilizando los programas antes mencionados con los parámetros predeterminados. Para el alineamiento local, es particularmente útil el algoritmo de Smith-Waterman (Smith TF, Waterman MS (1981) J. Mol. Biol 147(1);195-7).
Con relación a los polipéptidos FATB, en la Tabla B3 del ejemplo 3 de la presente se describe el porcentaje de identidad entre el polipéptido FATB representado por SEQ ID NO: 93 y los polipéptidos FATB enumerados en la Tabla A2, que puede ser tan bajo como 53% de identidad de secuencia de aminoácidos.
La tarea de predecir la localización subcelular de proteínas es importante y está ampliamente estudiada. Conocer la localización de una proteína ayuda a dilucidar su función. Los métodos experimentales para la localización de proteínas varían desde inmunolocalización hasta rotulación de proteínas mediante proteína fluorescente verde (GFP) o beta-glucuronidasa (GUS). Dichos métodos son precisos aunque laboriosos en comparación con los métodos computacionales. Recientemente, se ha logrado un gran progreso en la predicción computacional de la localización de proteínas a partir de datos de secuencias. Entre los algoritmos bien conocidos por un experto en el arte, en ExPASy se encuentran disponibles herramientas proteómicas albergadas por Swiss Institute for Bioinformatics, por ejemplo, PSort, TargetP, ChloroP, LocTree, Predotar, LipoP, MITOPROT, PATS, PTS1 , SignalP, TMHMM, entre otras. La identificación de la localización subcelular del polipéptido de la invención se muestra en el Ejemplo 5. En particular, se asigna SEQ ID NO: 2 de la presente invención al compartimento plastídico (cloroplástico) de células vegetales. Los polipéptidos FATB comprenden, además de un péptido de tránsito, una hélice transmembranal prevista (ver Ejemplo 5 de la presente) para su sujeción a una membrana cloroplástica.
Los métodos para hacer blanco en los plástidos son conocidos en el arte e incluyen el uso de péptidos de tránsito. La siguiente Tabla 3 muestra ejemplos de péptidos de tránsito que se pueden usar para dirigir cualquier polipéptido FATB a un plástido, cuyo polipéptido FATB, en su forma natural, generalmente no se dirige a un plástido, o cuyo polipéptido FATB, en su forma natural, se dirige a un plástido en virtud de un péptido de tránsito diferente (por ejemplo, su péptido de tránsito natural). La clonación de una secuencia de ácidos nucleicos que codifica un péptido de tránsito corriente arriba y en el marco de una secuencia de ácidos nucleicos que codifica un polipéptido (por ejemplo, un polipéptido FATB que carece de su propio péptido de tránsito) incluye técnicas moleculares estándar conocidas en el arte.
Tabla 3: Ejemplos de secuencias de péptidos de tránsito útiles para que los polipéptidos se dirijan a los plástidos.
El polipéptido FATB se dirige al cloroplasto y es activo allí, es decir, el polipéptido FATB es capaz de hidrolizar uniones de acil-ACP tioéster, preferentemente de acil-ACP saturado (en donde la cadena tiene una longitud que varía de 8 a 18 carbonos), liberando ácidos grasos libres y proteína portadora de acilo (ACP). Los ensayos para evaluar estas actividades son conocidas en el arte. En el Ejemplo 6 se proveen más detalles.
Por otra parte, los polipéptidos GS1 (por lo menos en su forma nativa) típicamente tienen actividad de glutamina sintasa. Las herramientas y técnicas para medir la actividad de glutamina sintasa son conocidas en el arte (ver, por ejemplo, Martin et al. Anal.
Biochem. 125, 24-29, 1982 y el Ejemplo 6).
Además, los polipéptidos PEAMT, cuando se expresan en el arroz de acuerdo con los métodos de la presente invención como se indica en la sección Ejemplos, producen plantas que tienen rasgos aumentados relacionados con el rendimiento, en particular uno o más de los siguientes: mayor biomasa verde, vigor temprano, peso total de semillas, cantidad de flores por panoja, tasa de llenado de la semilla, peso de mil granos e índice de cosecha.
Asimismo, los polipéptidos tipo LFY (por lo menos en su forma nativa) típicamente tienen actividad de unión a ADN. Las herramientas y técnicas para medir la actividad de unión a ADN son conocidas en el arte. Xue (Plant J. 41 , 638-649, 2005) provee un ejemplo de la caracterización de las propiedades de unión a ADN de una proteína.
Además, los polipéptidos tipo LFY, cuando se expresan en el arroz de acuerdo con los métodos de la presente invención como se indica en los Ejemplos 7 y 8, producen plantas que tienen rasgos aumentados relacionados con el rendimiento, en particular mayor rendimiento de la semilla.
En relación a los polipéptidos GS1 , la presente invención se ilustra mediante la transformación de plantas con la secuencia de ácidos nucleicos representada por SEQ ID NO: 1, que codifica la secuencia de polipéptidos de SEQ ID NO: 2. Sin embargo, la realización de la invención no se restringe a estas secuencias; los métodos de la invención se pueden realizar ventajosamente con cualquier secuencia de ácidos nucleicos que codifica GS1 o polipéptido GS1 como se define en la presente.
Los ejemplos de secuencias de ácidos nucleicos que codifican polipéptidos GS1 se indican en la Tabla A1 del Ejemplo 1 de la presente. Dichas secuencias de ácidos nucleicos son útiles para realizar los métodos de la invención. Las secuencias de aminoácidos indicadas en la Tabla A1 del Ejemplo 1 son ejemplos de secuencias de ortólogos y parálogos del polipéptido GS1 representado por SEQ ID NO: 2, en donde los términos "ortólogos" y "parálogos" son como se definen en la presente. Se pueden identificar fácilmente ortólogos y parálogos adicionales al realizar la denominada búsqueda blast recíproca. Generalmente, esto incluye un primer BLAST que implica someter a BLAST una secuencia incógnita (por ejemplo, usando cualquiera de las secuencias enumeradas en la Tabla A1 del Ejemplo 1 ) contra cualquier base de datos de secuencias, tal como la base de datos disponible al público NCBI. Generalmente, se utiliza BLASTN o TBLASTX (con valores predeterminados estándar) cuando se comienza desde una secuencia de nucleótidos, y BLASTP o TBLASTN (con valores predeterminados estándar) cuando se comienza desde una secuencia de proteínas. Opcionalmente, se pueden filtrar los resultados de BLAST. Las secuencias de longitud total de los resultados filtrados o de los resultados no filtrados luego se someten de nuevo a BLAST (segundo BLAST) contra secuencias provenientes del organismo del cual deriva la secuencia incógnita (cuando la secuencia incógnita es SEQ ID NO: 1 o SEQ ID NO: 2, el segundo BLAST sería, por lo tanto, contra secuencias de Chlamydomonas). Luego se comparan los resultados del primer y segundo BLAST. Se identifica un parálogo si una coincidencia de alto rango en el primer BLAST proviene de la misma especie de la cual deriva la secuencia incógnita, entonces una nueva búsqueda BLAST idealmente da como resultado que la secuencia incógnita se encuentre entre las mayores coincidencias; se identifica un ortólogo si una coincidencia de alto rango en el primer BLAST no proviene de la misma especie de la cual deriva la secuencia incógnita, y preferentemente da como resultado que la nueva búsqueda BLAST en la secuencia incógnita se encuentre entre las mayores coincidencias.
En relación a los polipéptidos PEAMT, la presente invención se ilustra mediante la transformación de plantas con la secuencia de ácidos nucleicos representada por SEQ ID NO: 57, que codifica la secuencia de polipéptidos de SEQ ID NO: 58. Sin embargo, la realización de la invención no se restringe a estas secuencias; los métodos de la invención se pueden realizar ventajosamente con cualquier secuencia de ácidos nucleicos que codifica PEAMT o polipéptido PEAMT como se define en la presente.
Los ejemplos de secuencias de ácidos nucleicos que codifican polipéptidos PEAMT se indican en la Tabla A2 de la sección Ejemplos de la presente. Dichas secuencias de ácidos nucleicos son útiles para realizar los métodos de la invención. Las secuencias de aminoácidos indicadas en la Tabla A de la sección Ejemplos son ejemplos de secuencias de ortólogos y parálogos del polipéptido PEAMT representado por SEQ ID NO: 58, en donde los términos "ortólogos" y "parálogos" son como se definen en la presente. Se pueden identificar fácilmente ortólogos y parálogos adicionales al realizar la denominada búsqueda blast recíproca. Generalmente, esto incluye un primer BLAST que implica someter a BLAST una secuencia incógnita (por ejemplo, usando cualquiera de las secuencias enumeradas en la Tabla A2 de la sección Ejemplos) contra cualquier base de datos de secuencias, tal como la base de datos disponible al público NCBI. Generalmente, se utiliza BLASTN o TBLASTX (con valores predeterminados estándar) cuando se comienza desde una secuencia de nucleótidos, y BLASTP o TBLASTN (con valores predeterminados estándar) cuando se comienza desde una secuencia de proteínas. Opcionalmente, se pueden filtrar los resultados de BLAST. Las secuencias de longitud total de los resultados filtrados o de los resultados no filtrados luego se someten de nuevo a BLAST (segundo BLAST) contra secuencias provenientes del organismo del cual deriva la secuencia incógnita (cuando la secuencia incógnita es SEQ ID NO: 57 o SEQ ID NO: 58, el segundo BLAST sería, por lo tanto, contra secuencias de Arabidopsis thaliana). Luego se comparan los resultados del primer y segundo BLAST. Se identifica un parálogo si una coincidencia de alto rango en el primer BLAST proviene de la misma especie de la cual deriva la secuencia incógnita, entonces una nueva búsqueda BLAST idealmente da como resultado que la secuencia incógnita se encuentre entre las mayores coincidencias; se identifica un ortólogo si una coincidencia de alto rango en el primer BLAST no proviene de la misma especie de la cual deriva la secuencia incógnita, y preferentemente da como resultado que la nueva búsqueda BLAST en la secuencia incógnita se encuentre entre las mayores coincidencias.
En relación a los polipéptidos FATB, la presente invención se ilustra mediante la transformación de plantas con la secuencia de ácidos nucleicos representada por SEQ ID NO: 92, que codifica la secuencia de polipéptidos FATB de SEQ ID NO: 93. Sin embargo, la realización de la invención no se restringe a estas secuencias; los métodos de la invención se pueden realizar ventajosamente con cualquier secuencia de ácidos nucleicos que codifica un polipéptido FATB como se define en la presente.
Los ejemplos de secuencias de ácidos nucleicos que codifican polipéptidos FATB se indican en la Tabla A3 del Ejemplo 1 de la presente. Dichas secuencias de ácidos nucleicos son útiles para realizar los métodos de la invención. Las secuencias de polipéptidos indicadas en la Tabla A3 del Ejemplo 1 son ejemplos de secuencias de ortólogos y parálogos del polipéptido FATB representado por SEQ ID NO: 93, en donde los términos "ortólogos" y "parálogos" son como se definen en la presente. Se pueden identificar fácilmente ortólogos y parálogos adicionales al realizar la denominada búsqueda blast recíproca. Generalmente, esto incluye un primer BLAST que implica someter a BLAST una secuencia incógnita (por ejemplo, usando cualquiera de las secuencias enumeradas en la Tabla A3 del Ejemplo 1 ) contra cualquier base de datos de secuencias, tal como la base de datos disponible al público NCBI. Generalmente, se utiliza BLASTN o TBLASTX (con valores predeterminados estándar) cuando se comienza desde una secuencia de nucleótidos, y BLASTP o TBLASTN (con valores predeterminados estándar) cuando se comienza desde una secuencia de proteínas. Opcionalmente, se pueden filtrar los resultados de BLAST. Las secuencias de longitud total de los resultados filtrados o de los resultados no filtrados luego se someten de nuevo a BLAST (segundo BLAST) contra secuencias provenientes del organismo del cual deriva la secuencia incógnita (cuando la secuencia incógnita es SEQ ID NO: 92 o SEQ ID NO: 93, el segundo BLAST seria, por lo tanto, contra secuencias de Arabidopsis thaliana). Luego se comparan los resultados del primer y segundo BLAST. Se identifica un parálogo si una coincidencia de alto rango en el primer BLAST proviene de la misma especie de la cual deriva la secuencia incógnita, entonces una nueva búsqueda BLAST idealmente da como resultado que la secuencia incógnita se encuentre entre las mayores coincidencias; se identifica un ortólogo si una coincidencia de alto rango en el primer BLAST no proviene de la misma especie de la cual deriva la secuencia incógnita, y preferentemente da como resultado que la nueva búsqueda BLAST en la secuencia incógnita se encuentre entre las mayores coincidencias.
En relación a los polipéptidos tipo LFY, la presente invención se ilustra mediante la transformación de plantas con la secuencia de ácidos nucleicos representada por SEQ ID NO: 145, que codifica la secuencia de polipéptidos de SEQ ID NO: 146. Sin embargo, la realización de la invención no se restringe a estas secuencias; los métodos de la invención se pueden realizar ventajosamente con cualquier secuencia de ácidos nucleicos que codifica un tipo LFY o polipéptido tipo LFY como se define en la presente.
Los ejemplos de secuencias de ácidos nucleicos que codifican polipéptidos tipo LFY se indican en la Tabla A4 del Ejemplo 1 de la presente. Dichas secuencias de ácidos nucleicos son útiles para realizar los métodos de la invención. Las secuencias de aminoácidos indicadas en la Tabla A4 del Ejemplo 1 son ejemplos de secuencias de ortólogos y parálogos del polipéptido tipo LFY representado por SEQ ID NO: 146, en donde los términos "ortólogos" y "parálogos" son como se definen en la presente. Se pueden identificar fácilmente ortólogos y parálogos adicionales al realizar la denominada búsqueda blast recíproca. Generalmente, esto incluye un primer BLAST que implica someter a BLAST una secuencia incógnita (por ejemplo, usando cualquiera de las secuencias enumeradas en la Tabla A4 del Ejemplo 1) contra cualquier base de datos de secuencias, tal como la base de datos disponible al público NCBI. Generalmente, se utiliza BLASTN o TBLASTX (con valores predeterminados estándar) cuando se comienza desde una secuencia de nucleótidos, y BLASTP o TBLASTN (con valores predeterminados estándar) cuando se comienza desde una secuencia de proteínas. Opcionalmente, se pueden filtrar los resultados de BLAST. Las secuencias de longitud total de los resultados filtrados o de los resultados no filtrados luego se someten de nuevo a BLAST (segundo BLAST) contra secuencias provenientes del organismo del cual deriva la secuencia incógnita (cuando la secuencia incógnita es SEQ ID NO: 145 o SEQ ID NO: 146, el segundo BLAST seria, por lo tanto, contra secuencias de Arabidopsis). Luego se comparan los resultados del primer y segundo BLAST. Se identifica un parálogo si una coincidencia de alto rango en el primer BLAST proviene de la misma especie de la cual deriva la secuencia incógnita, entonces una nueva búsqueda BLAST idealmente da como resultado que la secuencia incógnita se encuentre entre las mayores coincidencias; se identifica un ortólogo si una coincidencia de alto rango en el primer BLAST no proviene de la misma especie de la cual deriva la secuencia incógnita, y preferentemente da como resultado que la nueva búsqueda BLAST en la secuencia incógnita se encuentre entre las mayores coincidencias.
Las coincidencias de alto rango son las que tienen bajo valor E. Cuanto más bajo es el valor E, más significativa es la calificación (o, en otras palabras, menor la probabilidad de hallar la coincidencia por azar). El cálculo del valor E es bien conocido en el arte. Además de los valores E, las comparaciones también se califican por porcentaje de identidad. El porcentaje de identidad se refiere a la cantidad de nucleótidos idénticos (o aminoácidos) entre las dos secuencias comparadas de ácidos nucleicos (o polipéptidos) en una longitud particular. En el caso de grandes familias, se puede usar ClustalW, seguido de un árbol de unión cercano, para contribuir a visualizar la agrupación de genes relacionados e identificar ortólogos y parálogos.
Además, la invención también provee secuencias de ácidos nucleicos que codifican GS1 y polipéptidos GS1 desconocidos hasta el momento.
De acuerdo con otra forma de realización de la presente invención, también se provee un polipéptido aislado seleccionado de: (i) una secuencia de aminoácidos representada por SEQ ID NO: 53 o SEQ ID NO: 54; (¡i) una secuencia de aminoácidos que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia con la secuencia de aminoácidos representada por SEQ ID NO: 53 o SEQ ID NO: 54, (iii) derivados de cualquiera de las secuencias de aminoácidos indicadas en (i) o (ii) anterior.
La invención también provee secuencias de ácidos nucleicos que codifican los polipéptidos GS1 desconocidos como se describieron anteriormente y secuencias de ácidos nucleicos que se hibridan con aquellas, preferentemente en condiciones rigurosas.
Las variantes de secuencias de ácidos nucleicos también pueden ser útiles para practicar los métodos de la invención. Los ejemplos de dichas variantes incluyen secuencias de ácidos nucleicos que codifican homólogos y derivados de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A1 a A4 de la sección Ejemplos, siendo los términos "homólogo" y "derivado" como se definen en la presente. También son útiles en los métodos de la invención las secuencias de ácidos nucleicos que codifican homólogos y derivados de ortólogos o parálogos de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A1 a A4 de la sección Ejemplos. Los homólogos y derivados útiles en los métodos de la presente invención tienen sustancialmente la misma actividad biológica y funcional que la proteína no modificada de la cual derivan.
Otras variantes de secuencias de ácidos nucleicos útiles para practicar los métodos de la invención incluyen porciones de secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY, secuencias de ácidos nucleicos que se hibridan a secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY, variantes de empalme de secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY, variantes alélicas de secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY, y variantes de secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY, obtenidos por transposición génica. Los términos secuencia de hibridación, variante de empalme, variante alélica y transposición génica son como se describen en la presente.
Las secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY no necesitan ser secuencias de ácidos nucleicos de longitud total, dado que la realización de los métodos de la invención no depende del uso de secuencias de ácidos nucleicos de longitud total. De acuerdo con la presente invención, se provee un método para mejorar rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta una porción de cualquiera de las secuencias de ácidos nucleicos dadas en la Tabla A1 a A4 de la sección Ejemplos, o una porción de una secuencia de ácidos nucleicos que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A1 a A4 de la sección Ejemplos.
Una porción de una secuencia de ácidos nucleicos se puede preparar, por ejemplo, al hacer una o más eliminaciones a la secuencia de ácidos nucleicos. Las porciones se pueden usar en forma aislada o se pueden fusionar con otras secuencias codificadoras (o no codificadoras), por ejemplo, a fin de producir una proteína que combine varias actividades. Cuando se fusiona con otras secuencias codificadoras, el polipéptido resultante producido tras la traducción puede ser más grande que el previsto para la porción de proteína.
En relación a los polipéptidos GS1 , las porciones útiles en los métodos de la invención codifican un polipéptido GS1 como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en la Tabla A1 del Ejemplo 1. Preferentemente, la porción es una porción de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A1 del Ejemplo 1 , o es una porción de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A1 del Ejemplo 1. Preferentemente, la porción tiene por lo menos 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150 nucleótidos consecutivos de longitud, siendo los nucleótidos consecutivos de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A1 del Ejemplo 1 , o de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A1 del Ejemplo 1. Con máxima preferencia, la porción es una porción de la secuencia de ácidos nucleicos de SEQ ID NO: 1. Preferentemente, la porción codifica un fragmento de una secuencia de aminoácidos que, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en las Figuras 3a y 3b, se agrupa con el dado tipo alga (el grupo de polipéptidos GS1 de algas que comprende la secuencia de aminoácidos representada por SEQ ID NO: 2) en lugar de agruparse con el grupo glutamina sintasa cloroplástica vegetal o citosólica vegetal.
En relación a los polipéptidos PEAMT, las porciones útiles en los métodos de la invención codifican un polipéptido PEAMT como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en la Tabla A2 de la sección Ejemplos. Preferentemente, la porción es una porción de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A2 de la sección Ejemplos, o es una porción de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A2 de la sección Ejemplos. Preferentemente, la porción tiene por lo menos 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 610, 620, 630, 640, 650, 660, 670, 680, 690, 700, 710, 720, 730, 740, 750, 760, 770, 780, 790, 800, 810 nucleótidos consecutivos de longitud, siendo los nucleótidos consecutivos de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A2 de la sección Ejemplos, o de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A2 de la sección Ejemplos. Con máxima preferencia, la porción es una porción de la secuencia de ácidos nucleicos de SEQ ID NO: 57. Preferentemente, la porción codifica un fragmento de una secuencia de aminoácidos que, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en la Figura 6, se agrupa con el grupo I de polipéptidos PEAMT que comprende la secuencia de aminoácidos representada por SEQ ID NO: 58 en lugar de agruparse con cualquier otro grupo.
En relación a los polipéptidos FATB, las porciones útiles en los métodos de la invención codifican un polipéptido FATB como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de polipéptidos indicadas en la Tabla A3 del Ejemplo 1. Preferentemente, la porción es una porción de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A3 del Ejemplo 1 , o es una porción de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de polipéptidos indicadas en la Tabla A3 del Ejemplo 1. Preferentemente, la porción tiene, en orden creciente de preferencia, por lo menos 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1 100, 1150, 1200 o más nucleótidos consecutivos de longitud, siendo los nucleótidos consecutivos de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A3 del Ejemplo 1 , o de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de polipéptidos indicadas en la Tabla A3 del Ejemplo 1. Preferentemente, la porción es una porción de una secuencia de ácidos nucleicos que codifica una secuencia de polipéptidos que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con el polipéptido FATB representado por SEQ ID NO: 93 o con cualquiera de las secuencias de polipéptidos indicadas en la Tabla A de la presente. Con máxima preferencia, la porción es una porción de la secuencia de ácidos nucleicos de SEQ ID NO: 92.
En relación a los polipéptidos tipo LFY, las porciones útiles en los métodos de la invención codifican un polipéptido tipo LFY como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en la Tabla A4 del Ejemplo 1. Preferentemente, la porción es una porción de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A4 del Ejemplo 1 , o es una porción de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A4 del Ejemplo 1. Preferentemente, la porción tiene por lo menos 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350 nucleótidos consecutivos de longitud, siendo los nucleótidos consecutivos de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A4 del Ejemplo 1 , o de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A4 del Ejemplo 1. Con máxima preferencia, la porción es una porción de la secuencia de ácidos nucleicos de SEQ ID NO: 145. Preferentemente, la porción codifica un fragmento de una secuencia de aminoácidos que, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en la Figura 16, se agrupa con el grupo de polipéptidos tipo LFY.
Otra variante de una secuencia de ácidos nucleicos útil en los métodos de la invención es una secuencia de ácidos nucleicos capaz de hibridizarse en condiciones de rigurosidad reducida, con preferencia en condiciones rigurosas, con una secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY, como se define en la presente, o con una porción como se define en la presente.
De acuerdo con la presente invención, se provee un método para mejorar los rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta una secuencia de ácidos nucleicos capaz de hibridarse a cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A1 a A4 del Ejemplo 1 , o que comprende introducir y expresar en una planta una secuencia de ácidos nucleicos capaz de hibridarse a una secuencia de ácidos nucleicos que codifica un ortólogo, paralogo u homólogo de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A1 a A4 del Ejemplo 1.
En relación a los polipéptidos GS1 , las secuencias de hibridación útiles en los métodos de la invención codifican un polipéptido GS1 como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en la Tabla A4 del Ejemplo 1. Preferentemente, la secuencia de hibridación es capaz de hibridarse al complemento de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A1 del Ejemplo 1 , o a una porción de cualquiera de estas secuencias, en donde una porción es como se definió anteriormente, o la secuencia de hibridación es capaz de hibridarse al complemento de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A1 del Ejemplo 1. Con máxima preferencia, la secuencia de hibridación es capaz de hibridarse al complemento de una secuencia de ácidos nucleicos representada por SEQ ID NO: 1 o a una porción de ésta.
En relación a los polipéptidos GS1 , preferentemente, la secuencia de hibridación codifica un polipéptido con una secuencia de aminoácidos que, cuando es de longitud total y se utiliza en la construcción de un árbol filogenético, tal como el representado en las Figuras 3a y 3b, se agrupa con el ciado tipo alga (el grupo de polipéptidos GS1 de algas que comprende la secuencia de aminoácidos representada por SEQ ID NO: 2) en lugar de agruparse con el grupo glutamina sintasa cloroplástica vegetal o citosólica vegetal.
En relación a los polipéptidos PEAMT, las secuencias de hibridación útiles en los métodos de la invención codifican un polipéptido PEAMT como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en la Tabla A2 de la sección Ejemplos. Preferentemente, la secuencia de hibridación es capaz de hibridarse al complemento de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A2 de la sección Ejemplos, o a una porción de cualquiera de estas secuencias, en donde una porción es como se definió anteriormente, o la secuencia de hibridación es capaz de hibridarse al complemento de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A2 de la sección Ejemplos. Con máxima preferencia, la secuencia de hibridación es capaz de hibridarse al complemento de una secuencia de ácidos nucleicos representada por SEQ ID NO: 57 o a una porción de ésta.
En relación a los polipéptidos PEAMT, preferentemente, la secuencia de hibridación codifica un polipéptido con una secuencia de aminoácidos que, cuando es de longitud total y se utiliza en la construcción de un árbol filogenético, tal como el representado en la Figura 6, se agrupa con el grupo I de polipéptidos PEAMT que comprende la secuencia de aminoácidos representada por SEQ ID NO: 58, en lugar de agruparse con cualquier otro grupo.
En relación a los polipéptidos FATB, las secuencias de hibridación útiles en los métodos de la invención codifican un polipéptido FATB como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de polipéptidos indicadas en la Tabla A3 del Ejemplo 1. Preferentemente, la secuencia de hibridación es capaz de hibridarse a cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A3 del Ejemplo 1 , o a un complemento de ésta, o a una porción de cualquiera de estas secuencias, en donde una porción es como se definió anteriormente, o la secuencia de hibridación es capaz de hibridarse a una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de polipéptidos indicadas en la Tabla A3 del Ejemplo 1 , o a un complemento de ésta.
En relación a los polipéptidos FATB, preferentemente, la secuencia de hibridación es capaz de hibridarse a cualquiera de las secuencias de ácidos nucleicos que codifican una secuencia de polipéptidos que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con el polipéptido FATB representado por SEQ ID NO: 93 ó con cualquiera de las secuencias de polipéptidos indicadas en la Tabla A3 del Ejemplo 1 de la presente. Con máxima preferencia, la secuencia de hibridación es capaz de hibridarse a una secuencia de ácidos nucleicos representada por SEQ ID NO: 92 o a una porción de ésta.
En relación a los polipéptidos tipo LFY, las secuencias de hibridación útiles en los métodos de la invención codifican un polipéptido tipo LFY como se define en la presente, y tienen sustancialmente la misma actividad biológica que las secuencias de aminoácidos indicadas en la Tabla A4 del Ejemplo 1. Preferentemente, la secuencia de hibridación es capaz de hibridarse al complemento de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A4 del Ejemplo 1 , o a una porción de cualquiera de estas secuencias, en donde una porción es como se definió anteriormente, o la secuencia de hibridación es capaz de hibridarse al complemento de una secuencia de ácidos nucleicos que codifica un ortólogo o paralogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A4 del Ejemplo 1. Con máxima preferencia, la secuencia de hibridación es capaz de hibridarse al complemento de una secuencia de ácidos nucleicos representada por SEQ ID NO: 145 o a una porción de ésta.
En relación a los polipéptidos tipo LFY, preferentemente, la secuencia de hibridación codifica un polipéptido con una secuencia de aminoácidos que, cuando es de longitud total y se utiliza en la construcción de un árbol filogenético, tal como el representado en la Figura 16, se agrupa con el grupo de polipéptidos tipo LFY.
Otra variante de secuencias de ácidos nucleicos útiles en los métodos de la invención es una variante de empalme que codifica un polipéptido GS1 , o un polipéptido PEAIvlT, o un polipéptido FATB, o un polipéptido tipo LFY, como se definió anteriormente, en donde una variante de empalme es como se define en la presente.
En relación a los polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos tipo LFY, de acuerdo con la presente invención, se provee un método para mejorar rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta una variante de empalme de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A1 , o A2, o A4 del Ejemplo 1 , o una variante de empalme de una secuencia de ácidos nucleicos que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A , o A2, o A4 del Ejemplo 1.
En relación a los polipéptidos FATB, de acuerdo con la presente invención, se provee un método para incrementar rasgos relacionados con el rendimiento de las semillas, que comprende introducir y expresar en una planta una variante de empalme de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A3 del Ejemplo 1 , o una variante de empalme de una secuencia de ácidos nucleicos que codifica un ortólogo, parálogo u homólogo de cualquiera de las secuencias de polipéptidos indicadas en la Tabla A3 del Ejemplo 1 , y que tiene sustancialmente la misma actividad biológica que la secuencia de polipéptidos representada por SEQ ID NO: 93 y cualquiera de las secuencias de polipéptidos representadas en la Tabla A3 del Ejemplo 1.
En relación a los polipéptidos GS1 , las variantes de empalme preferidas son variantes de empalme de una secuencia de ácidos nucleicos representada por SEQ ID NO: 1 , o una variante de empalme de una secuencia de ácidos nucleicos que codifica un ortólogo o parálogo de SEQ ID NO: 2. Preferentemente, la secuencia de aminoácidos codificada por la variante de empalme, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en las Figuras 3a y 3b, se agrupa con el ciado tipo alga (el grupo de polipéptidos GS1 de algas que comprende la secuencia de aminoácidos representada por SEQ ID NO: 2) en lugar de agruparse con el grupo glutamina sintasa ceroplástica vegetal o citosólica vegetal.
En relación a los polipéptidos PEAMT, las variantes de empalme preferidas son variantes de empalme de una secuencia de ácidos nucleicos representada por SEQ ID NO: 57, o una variante de empalme de una secuencia de ácidos nucleicos que codifica un ortólogo o parálogo de SEQ ID NO: 58. Preferentemente, la secuencia de aminoácidos codificada por la variante de empalme, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en la Figura 6, se agrupa con el grupo I de polipéptidos PEAMT que comprende la secuencia de aminoácidos representada por SEQ ID NO: 58, en lugar de agruparse con cualquier otro grupo.
En relación a los polipéptidos FATB, las variantes de empalme preferidas son variantes de empalme de una secuencia de ácidos nucleicos representada por SEQ ID NO: 92, o una variante de empalme de una secuencia de ácidos nucleicos que codifica un ortólogo o parálogo de SEQ ID NO: 93. Preferentemente, la variante de empalme es una variante de empalme de una secuencia de ácidos nucleicos que codifica una secuencia de polipéptidos que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con el polipéptido FATB representado por SEQ ID NO: 93 o con cualquiera de las secuencias de polipéptidos indicadas en la Tabla A3 de la presente.
En relación a los polipéptidos tipo LFY, las variantes de empalme preferidas son variantes de empalme de una secuencia de ácidos nucleicos representada por SEQ ID NO: 145, o una variante de empalme de una secuencia de ácidos nucleicos que codifica un ortólogo o parálogo de SEQ ID NO: 146. Preferentemente, la secuencia de aminoácidos codificada por la variante de empalme, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en la Figura 6, se agrupa con el grupo de polipéptidos tipo LFY.
Otra variante de una secuencia de ácidos nucleicos útil para la realización de los métodos de la invención es una variante alélicas de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY, como se define en la presente, siendo una variante alélicas como se define en la presente.
De acuerdo con la presente invención, se provee un método para mejorar los rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta una variante alélica de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A1 a A4 del Ejemplo 1 , o que comprende introducir y expresar en una planta una variante alélica de una secuencia de ácidos nucleicos que codifica un ortólogo, paralogo u homólogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A1 a A4 del Ejemplo 1.
En relación a los polipéptidos GS1 , los polipéptidos codificados por variantes alélicas útiles en los métodos de la presente invención tienen sustancialmente la misma actividad biológica que el polipéptido GS1 de SEQ ID NO: 2 y cualquiera de los aminoácidos representados en la Tabla A1 del Ejemplo 1. Las variantes alélicas existen en la naturaleza y el uso de estos alelos naturales está comprendido en los métodos de la presente invención. Preferentemente, la variante alélica es una variante alélica de SEQ ID NO: 1 o una variante alélica de una secuencia de ácidos nucleicos que codifica un ortólogo o parálogo de SEQ ID NO: 2. Preferentemente, la secuencia de aminoácidos codificada por la variante alélicas, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en las Figuras 3a y 3b, se agrupa con el ciado tipo alga (el grupo de polipéptidos GS1 de algas que comprende la secuencia de aminoácidos representada por SEQ ID NO: 2) en lugar de agruparse con el grupo glutamina sintasa cloroplástica vegetal o citosólica vegetal.
En relación a los polipéptidos PEAMT, los polipéptidos codificados por variantes alélicas útiles en los métodos de la presente invención tienen sustancialmente la misma actividad biológica que el polipéptido PEAMT de SEQ ID NO: 58 y cualquiera de los aminoácidos representados en la Tabla A2 de la sección Ejemplos. Las variantes alélicas existen en la naturaleza y el uso de estos alelos naturales está comprendido en los métodos de la presente invención. Preferentemente, la variante alélica es una variante alélica de SEQ ID NO: 57 o una variante alélica de una secuencia de ácidos nucleicos que codifica un ortólogo o parálogo de SEQ ID NO: 58. Preferentemente, la secuencia de aminoácidos codificada por la variante alélica, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en la Figura 6, se agrupa con el grupo I de polipéptidos PEAMT que comprende la secuencia de aminoácidos representada por SEQ ID NO: 58, en lugar de agruparse con cualquier otro grupo.
En relación a los polipéptidos FATB, las variantes alélicas útiles en los métodos de la presente invención tienen sustancialmente la misma actividad biológica que el polipéptido FATB de SEQ ID NO: 93 y cualquiera de las secuencias de polipéptidos representadas en la Tabla A3 del Ejemplo 1. Las variantes alélicas existen en la naturaleza y el uso de estos alelos naturales está comprendido en los métodos de la presente invención. Preferentemente, la variante alélica es una variante alélica de SEQ ID NO: 92 o una variante alélica de una secuencia de ácidos nucleicos que codifica un ortólogo o parálogo de SEQ ID NO: 93. Preferentemente, la variante alélica es una variante alélica de una secuencia de polipéptidos que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con el polipéptido FATB representado por SEQ ID NO: 93 o con cualquiera de las secuencias de polipéptidos indicadas en la Tabla A3 del Ejemplo 1 de la presente.
En relación a los polipéptidos tipo LFY, los polipéptidos codificados por variantes alélicas útiles en los métodos de la presente invención tienen sustancialmente la misma actividad biológica que el polipéptido tipo LFY de SEQ ID NO: 146 y cualquiera de los aminoácidos representados en la Tabla A4 del Ejemplo 1. Las variantes alélicas existen en la naturaleza y el uso de estos alelos naturales está comprendido en los métodos de la presente invención. Preferentemente, la variante alélica es una variante alélica de SEQ ID NO: 145 o una variante alélica de una secuencia de ácidos nucleicos que codifica un ortólogo o parálogo de SEQ ID NO: 146. Preferentemente, la secuencia de aminoácidos codificada por la variante alélica, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en la Figura 16, se agrupa con el grupo de polipéptidos tipo LFY.
También se puede utilizar transposición génica o evolución dirigida para generar variantes de secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY, como se definieron anteriormente; el término "transposición génica" es como se define en la presente.
De acuerdo con la presente invención, se provee un método para mejorar los rasgos relacionados con el rendimiento en plantas, que comprende introducir y expresar en una planta una variante de cualquiera de las secuencias de ácidos nucleicos indicadas en la Tabla A1 a A4 del Ejemplo 1 , o que comprende introducir y expresar en una planta una variante de una secuencia de ácidos nucleicos que codifica un ortólogo, paralogo u homólogo de cualquiera de las secuencias de aminoácidos indicadas en la Tabla A1 a A4 del Ejemplo 1 , cuya variante de secuencia de ácidos nucleicos se obtiene por transposición génica.
En relación a los polipéptidos GS1 , preferentemente, la secuencia de aminoácidos codificada por la variante de secuencia de ácidos nucleicos obtenida por transposición génica, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en las Figuras 3a y 3b, se agrupa con el ciado tipo alga (el grupo de polipéptidos GS1 de algas que comprende la secuencia de aminoácidos representada por SEQ ID NO: 2) en lugar de agruparse con el grupo glutamina síntasa cloroplástica vegetal o citosólica vegetal.
En relación a los polipéptidos PEAMT, preferentemente, la secuencia de aminoácidos codificada por la variante de secuencia de ácidos nucleicos obtenida por transposición génica, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en la Figura 6, se agrupa con el grupo I de polipéptidos PEAMT que comprende la secuencia de aminoácidos representada por SEQ ID NO: 58, en lugar de agruparse con cualquier otro grupo.
En relación a los polipéptidos FATB, preferentemente, la variante de secuencia de ácidos nucleicos obtenida por transposición génica codifica una secuencia de polipéptidos que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con el polipéptido FATB representado por SEQ ID NO: 93 o con cualquiera de las secuencias de polipéptidos indicadas en la Tabla A3 de la presente.
En relación a los polipéptidos tipo LFY, preferentemente, la secuencia de aminoácidos codificada por la variante de secuencia de ácidos nucleicos obtenida por transposición génica, cuando se utiliza en la construcción de un árbol filogenético, tal como el representado en la Figura 16, se agrupa con el grupo de polipéptidos tipo LFY.
Adicionalmente, las variantes de secuencias de ácidos nucleicos también se pueden obtener mediante mutagénesis dirigida a sitio. Hay diversos métodos disponibles para lograr mutagénesis dirigida a sitio, siendo los más comunes los métodos basados en PC (Current Protocols in Molecular Biology. Wiley Eds.).
Las secuencias de ácidos nucleicos que codifican polipéptidos GS1 pueden derivar de cualquier fuente natural o artificial. La secuencia de ácidos nucleicos se puede modificar de su forma nativa en composición y/o medio genómico mediante manipulación humana deliberada. Preferentemente, la secuencia de ácidos nucleicos que codifica polipéptidos GS1 deriva de la división de Chlorophyta, más preferentemente de la clase de Chlorophyceae, más preferentemente de la familia Chlamydomonadaceae, con máxima preferencia la secuencia de ácidos nucleicos deriva de Chlamydomonas reinhardtii.
Las secuencias de ácidos nucleicos que codifican polipéptidos PEAMT pueden derivar de cualquier fuente natural o artificial. La secuencia de ácidos nucleicos se puede modificar de su forma nativa en composición y/o medio genómico mediante manipulación humana deliberada. Preferentemente, la secuencia de ácidos nucleicos que codifica polipéptidos PEAMT deriva de una planta, más preferentemente de una planta dicotiledónea, más preferentemente de la familia Brasicaceae, con máxima preferencia la secuencia de ácidos nucleicos deriva de Arabidopsis thaliana.
Ventajosamente, la presente invención provee secuencias de polipéptidos y secuencias de ácidos nucleicos PEAMT desconocidas hasta el momento.
De acuerdo con otra forma de realización de la presente invención, se provee una molécula aislada de una secuencia de ácidos nucleicos que comprende por lo menos 98 % de identidad de secuencia con SEQ ID NO: 57.
Además, se provee un polipéptido aislado que comprende por lo menos 99 % de identidad de secuencia con SEQ ID NO: 58.
Las secuencias de ácidos nucleicos que codifican polipéptidos FATB ó polipéptidos tipo LFY pueden derivar de cualquier fuente natural o artificial. La secuencia de ácidos nucleicos se puede modificar de su forma nativa en composición y/o medio genómico mediante manipulación humana deliberada. La secuencia de ácidos nucleicos que codifica un polipéptido FATB o un polipéptido tipo LFY deriva de una planta, más preferentemente de una planta dicotiledónea, más preferentemente de la familia Brasicaceae, con máxima preferencia la secuencia de ácidos nucleicos deriva de Arabidopsis thaliana.
La realización de los métodos de la invención produce plantas que tienen rasgos mejorados relacionados con el rendimiento. En particular, la realización de los métodos de la invención produce plantas con mayor rendimiento, en especial mayor rendimiento de semillas con respecto a las plantas de control. Los términos "rendimiento" y "rendimiento de semillas" se describen en mayor detalle en la sección "definiciones" de la presente.
La referencia en la presente a rasgos mejorados relacionados con el rendimiento significa un aumento de biomasa (peso) de una o más partes de una planta, que pueden incluir partes sobre el nivel del suelo (cosechables) y/o partes debajo del nivel del suelo (cosechables). En particular, dichas partes cosechables son semillas, y la realización de los métodos de la invención genera plantas con mayor rendimiento de semilla con respecto al rendimiento de las semillas en las plantas de control.
Si se toma al maíz como ejemplo, un mayor rendimiento se puede manifestar como uno o más de los siguientes: aumento de la cantidad de plantas establecidas por metro cuadrado, aumento de la cantidad de mazorcas por planta, aumento de la cantidad de hileras, cantidad de granos por hilera, peso del grano, peso de mil granos, longitud/diámetro de la mazorca, aumento de la tasa de llenado de semillas (que es la cantidad de semillas llenas dividido por la cantidad total de semillas y multiplicado por 100), entre otros. Si se toma al arroz como ejemplo, un mayor rendimiento se puede manifestar como aumento de uno o más de los siguientes: cantidad de plantas por metro cuadrado, cantidad de panículos por planta, cantidad de espículas por panículo, cantidad de flores (inflorescencias) por panículo (que se expresa como la relación entre la cantidad de semillas llenas y la cantidad de panículos primarios), aumento de la tasa de llenado de semillas (que es la cantidad de semillas llenas dividido por la cantidad total de semillas y multiplicado por 100), aumento del peso de mil granos, entre otros.
La presente invención provee un método para incrementar el rendimiento, en especial el rendimiento de semillas en las plantas, con respecto a las plantas de control, cuyo método comprende modular la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY, como se definen en la presente.
La presente invención provee un método para incrementar el rendimiento, en especial el rendimiento de semillas en las plantas, con respecto a las plantas de control, cuyo método comprende modular la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido tipo LFY, como se definen en la presente.
La presente invención también provee un método para incrementar los rasgos relacionados con el rendimiento de semillas en las plantas, con respecto a las plantas de control, cuyo método comprende incrementar la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido FATB, como se definió en la presente.
Debido a que las plantas transgénicas de acuerdo con la presente invención tienen mayor rendimiento y/o rasgos relacionados con el mayor rendimiento de las semillas, es probable que estas plantas exhiban una mayor tasa de crecimiento (durante al menos parte de su ciclo de vida), respecto de la tasa de crecimiento de las plantas de control en el correspondiente estadio de su ciclo de vida. Sin embargo, en relación a los polipéptidos tipo LFY, no se observó inducción temprana del tiempo de floración.
El aumento de la tasa de crecimiento puede ser específica de una o más partes de una planta (incluso semillas), o puede estar sustancialmente en toda la planta. Las plantas con mayor tasa de crecimiento pueden tener un ciclo de vida más corto. El ciclo de vida de una planta puede significar el tiempo necesario para crecer desde la semilla madura seca hasta el estadio en el cual la planta produjo semillas maduras secas, similar al material de inicio. Este ciclo de vida puede estar influenciado por factores tales como velocidad de germinación, vigor temprano, tasa de crecimiento, índice de verdor, tiempo de floración y velocidad de maduración de la semilla. El aumento de la tasa de crecimiento puede ocurrir en uno o más estadios en el ciclo de vida de una planta o durante sustancialmente todo el ciclo de vida de la planta. El aumento de la tasa de crecimiento durante las etapas tempranas del ciclo de vida de una planta puede reflejar incremento del vigor. El aumento de la tasa de crecimiento puede alterar el ciclo de cosecha de una planta lo cual permite sembrar más tarde las plantas y/o cosecharlas antes de lo que sería posible de otro modo (se puede obtener un efecto similar con tiempo de floración más temprano). Si se incrementa lo suficiente la tasa de crecimiento, permitiría la siembra adicional de semillas de la misma especie vegetal (por ejemplo, la siembra y cosecha de plantas de arroz seguido de la siembra y cosecha de otras plantas de arroz, todo ello dentro de un periodo de crecimiento convencional). De modo similar, si se incrementa lo suficiente la tasa de crecimiento, permitiría la siembra adicional de semillas de distinta especie vegetal (por ejemplo, la siembra y cosecha de plantas de maíz seguido de, por ejemplo, la siembra y opcional cosecha de soja, papa o cualquier otra planta adecuada). También pueden ser posibles las cosechas adicionales de los mismos troncos en el caso de algunas plantas de cultivo. La alteración del ciclo de cosecha de una planta puede conducir a un aumento de la producción de biomasa anual por metro cuadrado (debido a un aumento de la cantidad de veces (por ejemplo, un año) que cualquier planta particular se puede cultivar y cosechar). Un aumento de la tasa de crecimiento también puede permitir el cultivo de plantas transgénicas en una zona geográfica más amplia que sus contrapartidas de tipo silvestre, dado que las limitaciones territoriales para cultivar una planta de cultivo a menudo están determinadas por condiciones ambientales adversas en el momento de la siembra (estación temprana) o en el momento de la cosecha (estación tardía). Dichas condiciones adversas se pueden evitar si se acorta el ciclo de cosecha. La tasa de crecimiento se puede determinar al derivar diversos parámetros de curvas de crecimiento, en donde dichos parámetros pueden ser: T-Mid (el tiempo que tardan las plantas en alcanzar el 50% de su tamaño máximo) y T-90 (el tiempo que tardan las plantas en alcanzar el 90% de su tamaño máximo), entre otros.
De acuerdo con una característica preferida de la presente invención, la realización de los métodos de la invención provee plantas con una mayor tasa de crecimiento con respecto a las plantas de control. En consecuencia, de acuerdo con la presente invención, se provee un método para incrementar la tasa de crecimiento de las plantas, cuyo método comprende modular y/o incrementar la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY, como se definen en la presente.
Un incremento de rendimiento y/o tasa de crecimiento tiene lugar si la planta está en condiciones sin estrés o si la planta está expuesta a diversos tipos de estrés en comparación con las plantas de control. Las plantas generalmente responden a la exposición al estrés con un crecimiento más lento. En condiciones de estrés severo, la planta incluso puede detener su crecimiento por completo. Por otra parte, el estrés leve se define en la presente como cualquier estrés al que está expuesta una planta y que no da por resultado que la planta cese de crecer por completo sin la capacidad de reiniciar el crecimiento. En el sentido de la invención, el estrés leve conduce a una reducción del crecimiento de las plantas estresadas de menos de 40%, 35% o 30%, preferentemente menos de 25%, 20% o 15%, más preferentemente menos de 14%, 13%, 12%, 11% o 10% o menos en comparación con la planta de control en condiciones sin estrés. Debido a los adelantos en las prácticas agrícolas (irrigación, fertilización, tratamientos con pesticidas) a menudo las plantas de cultivo no están sometidas a distintos tipos de estrés severos. Como consecuencia, el crecimiento comprometido inducido por estrés leve es a menudo una característica indeseable en la agricultura. El estrés leve es el estrés biótico y/o abiótico (ambiental) cotidiano al cual está expuesta una planta. El estrés abiótico se puede deber a sequía o exceso de agua, estrés anaeróbico, estrés salino, toxicidad química, estrés oxidativo y temperaturas cálidas, frías o de congelación. El estrés abiótico puede ser estrés osmótico causado por estrés hídrico (particularmente debido a sequía), estrés salino, estrés oxidativo o estrés iónico. El estrés biótico es generalmente el estrés causado por patógenos, tales como bacterias, virus, hongos, nemátodos e insectos.
Los rasgos relacionados con el mayor rendimiento de las semillas tiene lugar si la planta está en condiciones sin estrés o si la planta está expuesta a diversos tipos de estrés en comparación con las plantas de control en condiciones comparables. Las plantas generalmente responden a la exposición al estrés con un crecimiento más lento. En condiciones de estrés severo, la planta incluso puede detener su crecimiento por completo. Por otra parte, el estrés leve se define en la presente como cualquier estrés al que está expuesta una planta y que no da por resultado que la planta cese de crecer por completo sin la capacidad de reiniciar el crecimiento. En el sentido de la invención, el estrés leve conduce a una reducción del crecimiento de las plantas estresadas de menos de 40%, 35% o 30%, preferentemente menos de 25%, 20% o 5%, más preferentemente menos de 14%, 13%, 12%, 11% o 10% o menos en comparación con la planta de control en condiciones sin estrés. Debido a los adelantos en las prácticas agrícolas (irrigación, fertilización, tratamientos con pesticidas) a menudo las plantas de cultivo no están sometidas a distintos tipos de estrés severos. Como consecuencia, el crecimiento comprometido inducido por estrés leve es a menudo una característica indeseable en la agricultura. El estrés leve es el estrés biótico y/o abiótico (ambiental) cotidiano al cual está expuesta una planta. El estrés abiótico se puede deber a sequía o exceso de agua, estrés anaeróbico, estrés salino, toxicidad química, estrés oxidativo y temperaturas cálidas, frías o de congelación. El estrés abiótico puede ser estrés osmótico causado por estrés hídrico (particularmente debido a sequía), estrés salino, estrés oxidativo o estrés iónico. El estrés biótico es generalmente el estrés causado por patógenos, tales como bacterias, virus, hongos, nemátodos e insectos. El término condiciones "sin estrés" tal como se usa en la presente son las condiciones ambientales que permiten el óptimo crecimiento de las plantas. Los expertos en el arte conocen las condiciones normales del suelo y las condiciones climáticas para una determinada ubicación.
En particular, los métodos de la presente invención se pueden realizar en condiciones sin estrés o en condiciones de sequía leve para obtener plantas con mayor rendimiento con respecto a las plantas de control. Tal como se informa en Wang et al. (Planta (2003) 218: 1-14), el estrés abiótico conduce a una serie de cambios morfológicos, fisiológicos, bioquímicos y moleculares que afectan de manera adversa el crecimiento y la productividad de la planta. Se sabe que el estrés por sequía, salinidad, temperaturas extremas y oxidativo están interconectados y pueden inducir el crecimiento y el daño celular por mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) describe un grado particularmente alto de "intercomunicación" entre estrés por sequía y estrés por alta salinidad. Por ejemplo, la sequía y/o la salinización se manifiestan principalmente como estrés osmótico, lo cual da como resultado la alteración de la homeostasis y la distribución iónica en la célula. El estrés oxidativo, que a menudo acompaña al estrés por temperatura alta o baja, salinidad o sequía, puede causar la desnaturalización de proteínas funcionales y estructurales. Como consecuencia, estos diversos tipos de estrés ambiental a menudo activan vías de señalización celular y respuestas celulares similares, tales como la producción de proteínas de estrés, la regulación en forma ascendente de antioxidantes, la acumulación de solutos compatibles y la detención del crecimiento. El término condiciones "sin estrés" tal como se usa en la presente son las condiciones ambientales que permiten el óptimo crecimiento de las plantas. Los expertos en el arte conocen las condiciones normales del suelo y las condiciones climáticas para una determinada ubicación. Las plantas con óptimas condiciones de crecimiento (cultivadas en condiciones sin estrés) generalmente rinden, en orden creciente de preferencia, por lo menos 90%, 87%, 85%, 83%, 80%, 77% o 75% de la producción promedio de dicha planta en un ambiente determinado. La producción promedio se puede calcular sobre la base de la cosecha y/o temporada. Los expertos en el arte conocen el rendimiento de la producción promedio de un cultivo.
En relación a los polipéptidos GS1, la realización de los métodos de la invención le provee a las plantas cultivadas en condiciones sin estrés o en condiciones de sequía leve mayor rendimiento con respecto a las plantas de control cultivadas en condiciones comparables. Por lo tanto, de acuerdo con la presente invención, se provee un método para aumentar el rendimiento en las plantas cultivadas en condiciones sin estrés o en condiciones de sequía leve, cuyo método comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 en una planta.
En relación a los polipéptidos PEAMT, la realización de los métodos de la invención le provee a las plantas cultivadas en condiciones sin estrés o en condiciones de sequía leve mayor rendimiento con respecto a las plantas de control cultivadas en condiciones comparables. Por lo tanto, de acuerdo con la presente invención, se provee un método para aumentar el rendimiento en las plantas cultivadas en condiciones sin estrés o en condiciones de sequía leve, cuyo método comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido PEAMT en una planta.
En relación a los polipéptidos FATB, la realización de los métodos de la invención le provee a las plantas cultivadas en condiciones sin estrés o en condiciones de estrés leve rasgos aumentados relacionados con el rendimiento de las semillas, con respecto a las plantas de control cultivadas en condiciones comparables. Por lo tanto, de acuerdo con la presente invención, se provee un método para aumentar los rasgos relacionados con el rendimiento de las semillas en las plantas cultivadas en condiciones sin estrés o en condiciones de sequía leve, cuyo método comprende aumentar la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido FATB en una planta.
En relación a los polipéptidos tipo LFY, la realización de los métodos de la invención le provee a las plantas cultivadas en condiciones sin estrés o en condiciones de sequía leve mayor rendimiento con respecto a las plantas de control cultivadas en condiciones comparables. Por lo tanto, de acuerdo con la presente invención, se provee un método para aumentar el rendimiento en las plantas cultivadas en condiciones sin estrés o en condiciones de sequía leve, cuyo método comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido tipo LFY en una planta.
En relación a los polipéptidos GS1, la realización de los métodos de la invención le provee a las plantas cultivadas en condiciones de deficiencia de nutrientes, en particular en condiciones de deficiencia de nitrógeno, mayor rendimiento con respecto a las plantas de control cultivadas en condiciones comparables. En consecuencia, de acuerdo con la presente invención, se provee un método para incrementar el rendimiento en las plantas cultivadas en condiciones de deficiencia de nutrientes, cuyo método comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 en una planta. La deficiencia de nutrientes puede ser el resultado de la falta de nutrientes tales como nitrógeno, fosfatos y otros compuestos que contienen fósforo, potasio, calcio, cadmio, magnesio, manganeso, hierro y boro, entre otros. En una forma de realización particular de la presente invención, se provee un método para aumentar el rendimiento en las plantas cultivadas en condiciones de deficiencia de nitrógeno, cuyo método comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 en una planta.
En relación a los polipéptidos GS1, la realización de los métodos de la invención le provee a las plantas cultivadas en condiciones de estrés salino mayor rendimiento con respecto a las plantas de control cultivadas en condiciones comparables. En consecuencia, de acuerdo con la presente invención, se provee un método para incrementar el rendimiento en las plantas cultivadas en condiciones de estrés salino, cuyo método comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 en una planta. El término estrés salino no se restringe a la sal común (NaCI), sino que puede ser uno o más de: NaCI, KCI, LiCI, MgCI2, CaCI2, entre otros.
En relación a los polipéptidos PEAMT, la realización de los métodos de la invención le provee a las plantas cultivadas en condiciones de deficiencia de nutrientes, en particular en condiciones de deficiencia de nitrógeno, mayor rendimiento con respecto a las plantas de control cultivadas en condiciones comparables. En consecuencia, de acuerdo con la presente invención, se provee un método para incrementar el rendimiento en las plantas cultivadas en condiciones de deficiencia de nutrientes, cuyo método comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido PEAMT en una planta. La deficiencia de nutrientes puede ser el resultado de la falta de nutrientes tales como nitrógeno, fosfatos y otros compuestos que contienen fósforo, potasio, calcio, cadmio, magnesio, manganeso, hierro y boro, entre otros.
En relación a los polipéptidos FATB, la realización de los métodos de acuerdo con la presente invención le provee a las plantas cultivadas en condiciones de estrés abiótico rasgos aumentados relacionados con el rendimiento de las semillas, con respecto a las plantas de control cultivadas en condiciones de estrés comparables. Tal como se informa en Wang et al. (Planta (2003) 218: 1-14), el estrés abiótico conduce a una serie de cambios morfológicos, fisiológicos, bioquímicos y moleculares que afectan de manera adversa el crecimiento y la productividad de la planta. Se sabe que el estrés por sequía, salinidad, temperaturas extremas y oxidativo están interconectados y pueden inducir el crecimiento y el daño celular por mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) describe un grado particularmente alto de "intercomunicación" entre estrés por sequía y estrés por alta salinidad. Por ejemplo, la sequía y/o la salinización se manifiestan principalmente como estrés osmótico, lo cual da como resultado la alteración de la homeostasis y la distribución iónica en la célula. El estrés oxidativo, que a menudo acompaña al estrés por temperatura alta o baja, salinidad o sequía, puede causar la desnaturalización de proteínas funcionales y estructurales. Como consecuencia, estos diversos tipos de estrés ambiental a menudo activan vías de señalización celular y respuestas celulares similares, tales como la producción de proteínas de estrés, la regulación en forma ascendente de antioxidantes, la acumulación de solutos compatibles y la detención del crecimiento. Debido a que los diversos tipos de estrés ambientales activan vías similares, la ejemplificación en la presente invención con estrés por sequía no debe considerarse una limitación a este tipo de estrés, sino como un ejemplo para indicar la participación de los polipéptidos FATB, como se definieron anteriormente, para aumentar los rasgos relacionados con el rendimiento de las semillas, con respecto a las plantas de control cultivadas en condiciones de estrés comparables, en estrés abíótico en general. .
El término "estrés abiótico" tal como se define en la presente significa uno o más de los siguientes: estrés hídrico (debido a sequía o exceso de agua), estrés anaeróbico, estrés salino, estrés por temperatura (debido a temperaturas cálidas, frías o de congelación), estrés por toxicidad química y estrés oxidativo. De acuerdo con un aspecto de la invención, el estrés abiótico es estrés osmótico, seleccionado de estrés hídrico, estrés salino, estrés oxidativo y estrés iónico. Preferentemente, el estrés hídrico es estrés por sequía. El término estrés salino no se restringe a la sal común (NaCI), sino que puede ser estrés causado por uno o más de los siguientes: NaCI, KCI, LiCI, MgCI2, CaCI2, entre otros.
En relación a los polipéptidos FATB, la realización de los métodos de la invención le provee a las plantas cultivadas en condiciones de estrés abiótico rasgos aumentados relacionados con el rendimiento de las semillas, con respecto a las plantas de control cultivadas en condiciones de estrés comparables. En consecuencia, de acuerdo con la presente invención, se provee un método para incrementar los rasgos relacionados con el rendimiento de las semillas, en plantas cultivadas en condiciones de estrés abiótico, cuyo método comprende aumentar la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido FATB en una planta. De acuerdo con un aspecto de la invención, el estrés abiótico es estrés osmótico, seleccionado de uno o más de los siguientes: estrés hídrico, estrés salino, estrés oxidativo y estrés iónico.
Otro ejemplo de estrés ambiental abiótico consiste en la disponibilidad reducida de uno o más nutrientes que deben ser asimilados por las plantas para el crecimiento y desarrollo. Debido a la fuerte influencia de la eficiencia en el uso de nutrientes para el rendimiento vegetal y la calidad del producto, se verte una gran cantidad de fertilizante en los campos para optimizar el crecimiento y la calidad de la planta. La productividad de las plantas comúnmente está limitada por tres nutrientes primarios: fósforo, potasio y nitrógeno, y de los tres el último es el elemento que limita la velocidad de crecimiento de la planta. Por lo tanto, el principal elemento nutricional necesario para el crecimiento de la planta es el nitrógeno (N). Es un elemento constitutivo de numerosos compuestos importantes que se encuentran en las células vivientes, incluso aminoácidos, proteínas (enzimas), secuencias de ácidos nucleicos y clorofila. De 1 ,5% a 2% de la materia seca de la planta es nitrógeno y aproximadamente 16% de la proteína total de la planta. De este modo, la disponibilidad de nitrógeno es un factor limitativo importante para el crecimiento y la producción de plantas de cultivo (Frink ef al. (1999) Proc Nati Acad Sci USA 96(4): 1 175-1 180), y tiene también un impacto importante en la acumulación de proteínas y composición de aminoácidos. Por lo tanto, son de gran interés las plantas de cultivos con rasgos aumentados relacionados con el rendimiento de las semillas, cuando se cultivan en condiciones limitativas de nitrógeno.
En relación a los polipéptidos FATB, la realización de los métodos de la invención le provee a las plantas cultivadas en condiciones de disponibilidad reducida de nutrientes, en particular en condiciones de disponibilidad reducida de nitrógeno, rasgos aumentados relacionados con el rendimiento de las semillas, con respecto a las plantas de control cultivadas en condiciones comparables. En consecuencia, de acuerdo con la presente invención, se provee un método para incrementar los rasgos relacionados con el rendimiento de las semillas cultivadas en condiciones de disponibilidad reducida de nutrientes, preferentemente disponibilidad reducida de nitrógeno, cuyo método comprende aumentar la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido FATB en una planta. La disponibilidad reducida de nutrientes puede ser el resultado de la deficiencia o el exceso de nutrientes tales como nitrógeno, fosfatos y otros compuestos que contienen fósforo, potasio, calcio, cadmio, magnesio, manganeso, hierro y boro, entre otros. Preferentemente, la disponibilidad reducida de nutrientes es disponibilidad reducida de nitrógeno.
En relación a los polipéptidos tipo LFY, la realización de los métodos de la invención le provee a las plantas cultivadas en condiciones de deficiencia de nutrientes, en particular en condiciones de deficiencia de nitrógeno, mayor rendimiento con respecto a las plantas de control cultivadas en condiciones comparables. En consecuencia, de acuerdo con la presente invención, se provee un método para incrementar el rendimiento en plantas cultivadas en condiciones de deficiencia de nutrientes, cuyo método comprende modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido tipo LFY en una planta. La deficiencia de nutrientes puede ser el resultado de la falta de nutrientes tales como nitrógeno, fosfatos y otros compuestos que contienen fósforo, potasio, calcio, cadmio, magnesio, manganeso, hierro y boro, entre otros.
La presente invención abarca plantas o sus partes (incluso semillas) o células que se pueden obtener mediante los métodos de acuerdo con la presente invención. Las plantas o sus partes o células comprenden un transgen de la secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY, como se definieron anteriormente.
La invención también provee constructos genéticos y vectores para facilitar la introducción y/o expresión en las plantas de secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY, como se definen en la presente. Los constructos génicos se pueden insertar en vectores, que pueden estar disponibles en el comercio, adecuados para transformarse en plantas y adecuados para la expresión del gen de interés en las células transformadas. La invención también provee el uso de un constructo génico como se define en la presente en los métodos de la invención.
Más específicamente, la presente invención provee un constructo génico que comprende: (a) una secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY, como se definieron anteriormente; (b) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (a); y opcionalmente (c) una secuencia de terminación de la transcripción.
Preferentemente, la secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY, es como se definió anteriormente. Los términos "secuencia de control" y "secuencia de terminación" son como se definen en la presente.
Las plantas se transforman con un vector que comprende cualquiera de las secuencias de ácidos nucleicos descritas anteriormente. El experto en el arte conoce los elementos genéticos que deben estar presentes en el vector a fin de transformar, seleccionar y propagar con éxito las células huésped que contienen la secuencia de interés. La secuencia de interés está ligada operativamente a una o más secuencias control (al menos a un promotor).
En relación a FATB, preferentemente, una de las secuencias de control de un constructo es un promotor constitutivo aislado de un genoma vegetal. Un ejemplo de un promotor constitutivo vegetal es un promotor GOS2, preferentemente un promotor GOS2 del arroz, más preferentemente un promotor GOS2 representado por SEQ ID NO: 144.
En relación a GS1 , ventajosamente, cualquier tipo de promotor, ya sea natural o sintético, puede ser utilizado para dirigir la expresión de la secuencia de ácidos nucleicos, pero preferentemente el promotor deriva de una planta. Es particularmente útil en los métodos un promotor capaz de dirigir la expresión en los brotes y, en particular, en tejido verde. Ver la sección "Definiciones" de la presente para las definiciones de los diversos tipos de promotores.
En relación a PEAMT, ventajosamente, cualquier tipo de promotor, ya sea natural o sintético, puede ser utilizado para dirigir la expresión de la secuencia de ácidos nucleicos, pero preferentemente el promotor deriva de una planta. Es particularmente útil en los métodos un promotor constitutivo. Preferentemente, el promotor constitutivo es también un promotor ubicuo de mediana intensidad. Ver la sección "Definiciones" de la presente para las definiciones de los diversos tipos de promotores.
En relación a FATB, ventajosamente, cualquier tipo de promotor, ya sea natural o sintético, puede ser utilizado para aumentar la expresión de la secuencia de ácidos nucleicos. Es particularmente útil en los métodos un promotor constitutivo, preferentemente un promotor constitutivo aislado de un genoma vegetal. El promotor constitutivo vegetal dirige la expresión de una secuencia codificadora a un nivel que es, en todos los casos, inferior al obtenido bajo el control de un promotor viral 35S CaMV.
Asimismo, en relación a FATB, los promotores específicos de órganos, por ejemplo para la expresión preferida en hojas, tallos, tubérculos, meristemas, son útiles para realizar los métodos de la invención. Los promotores regulados por el desarrollo también son útiles para realizar los métodos de la invención. Ver la sección "Definiciones" de la presente para las definiciones de los diversos tipos de promotores En relación al tipo LFY, ventajosamente, cualquier tipo de promotor, ya sea natural o sintético, puede ser utilizado para dirigir la expresión de la secuencia de ácidos nucleicos, pero preferentemente el promotor deriva de una planta. Es particularmente útil en los métodos un promotor constitutivo. Preferentemente, el promotor constitutivo es también un promotor ubicuo de mediana intensidad. Ver la sección "Definiciones" de la presente para las definiciones de los diversos tipos de promotores. También son útiles en los métodos de la invención los promotores específicos de brotes (o específicos de tejido verde).
En relación a los polipéptidos GS1, debe quedar claro que la aplicabilidad de la presente invención no se restringe ni a la secuencia de ácidos nucleicos que codifica un polipéptido GS1 representado por SEQ ID NO: 1 , ni a la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 cuando es dirigido por un promotor específico de brote.
Preferentemente, el promotor específico de brote dirige la expresión en tejido verde, más preferentemente el promotor específico de brote es aislado de una planta, tal como un promotor protoclorofillida reductasa (pPCR), más preferentemente el promotor protoclorofillida reductasa deriva del arroz. Más preferentemente, el promotor protoclorofillida reductasa es representado por una secuencia de ácidos nucleicos sustancialmente similar a SEQ ID NO: 6, con máxima preferencia el promotor constitutivo es como se representa en SEQ ID NO: 6. Ver la sección "Definiciones" de la presente para más ejemplos de promotores específicos de tejido verde.
En relación a los polipéptidos GS1 , opcionalmente se pueden utilizar una o más secuencias terminador en el constructo introducido en una planta. Preferentemente, el constructo comprende un cásete de expresión que comprende un promotor protoclorofillida reductasa, sustancialmente similar a SEQ ID NO: 6, y el ácido nucleico que codifica al polipéptido GS1.
En relación a los polipéptidos PEAMT, debe quedar claro que la aplicabilidad de la presente invención no se restringe ni a la secuencia de ácidos nucleicos que codifica un polipéptido PEAMT representado por SEQ ID NO: 57, ni a la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido PEAMT cuando es dirigido por un promotor constitutivo.
El promotor constitutivo es preferentemente un promotor de mediana intensidad, más preferentemente seleccionado de un promotor que deriva de una planta, tal como un promotor GOS2, más preferentemente el promotor es un promotor GOS2 del arroz. Más preferentemente, el promotor constitutivo es representado por una secuencia de ácidos nucleicos sustancialmente similar a SEQ ID NO: 85, con máxima preferencia el promotor constitutivo es representado por SEQ ID NO: 85. Ver la sección "Definiciones" de la presente para más ejemplos de promotores constitutivos.
En relación a los polipéptidos PEAMT, opcionalmente se pueden utilizar una o más secuencias terminador en el constructo introducido en una planta. Preferentemente, el constructo comprende un cásete de expresión que comprende un promotor GOS2, sustancialmente similar a SEQ ID NO: 85, y el ácido nucleico que codifica al polipéptido PEAMT.
En relación a los polipéptidos FATB, debe quedar claro que la aplicabilidad de la presente invención no se restringe ni a una secuencia de ácidos nucleicos que codifica al polipéptido FATB representado por SEQ ID NO: 92, ni a la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido FATB cuando es dirigido por un promotor constitutivo.
Opcionalmente, se pueden utilizar una o más secuencias como terminador en el constructo introducido en una planta. Otros elementos reguladores pueden incluir mejoradores de la transcripción así como también de la traducción. Los expertos en el arte conocen las secuencias que pueden ser adecuadas como terminador y mejorador para utilizar en la realización de la invención. También se puede agregar una secuencia intrón a la región 5' no traducida (UTR) o en la secuencia codificadora para incrementar la cantidad de mensaje maduro que se acumula en el citosol, como se describe en la sección de definiciones. Otras secuencias control (además de las secuencias promotor, mejorador, silenciador, intrón, las regiones 3'UTR y/o 5'UTR) pueden ser elementos estabilizadores de ARN y/o proteínas. El experto en el arte conoce o puede obtener con facilidad dichas secuencias.
En relación a los polipéptidos tipo LFY, debe quedar claro que la aplicabilidad de la presente invención no se restringe ni al ácido nucleico que codifica un polipéptido tipo LFY representado por SEQ ID NO: 145, ni a la expresión de un ácido nucleico que codifica un polipéptido tipo LFY cuando es dirigido por un promotor constitutivo, o cuando es dirigido por un promotor específico de brote.
El promotor constitutivo es preferentemente un promotor de mediana intensidad, tal como un promotor GOS2, preferentemente el promotor es un promotor GOS2 del arroz. Más preferentemente, el promotor constitutivo es representado por una secuencia de ácidos nucleicos sustancialmente similar a SEQ ID NO: 149, con máxima preferencia el promotor constitutivo es representado por SEQ ID NO: 149. Ver la Tabla 2a en la sección "Definiciones" de la presente para más ejemplos de promotores constitutivos.
En relación a los polipéptidos tipo LFY, de acuerdo con otra característica preferida de la invención, el ácido nucleico que codifica un polipéptido tipo LFY está ligado operativamente a un promotor específico de brote (o específico de tejido verde). El promotor específico de brote es preferentemente un promotor protoclorofillida reductasa, más preferentemente el promotor protoclorofillida reductasa deriva del arroz, más preferentemente, el promotor protoclorofillida reductasa es representado por una secuencia de ácidos nucleicos sustancialmente similar a SEQ ID NO: 150, con máxima preferencia el promotor es representado por SEQ ID NO: 150. Los ejemplos de otros promotores específicos de brote que también se pueden usar para realizar los métodos de la invención se indican en la Tabla 2b en la sección "Definiciones" anterior.
En relación a los polipéptidos tipo LFY, opcionalmente se pueden utilizar una o más secuencias terminador en el constructo introducido en una planta. Preferentemente, el constructo comprende un cásete de expresión que comprende el promotor GOS2, o el promotor protoclorofillida reductasa, ligado operativamente al ácido nucleico que codifica al polipéptido tipo LFY.
Otros elementos reguladores pueden incluir mejoradores de la transcripción así como también de la traducción. Los expertos en el arte conocen las secuencias que pueden ser adecuadas para utilizar como terminador y mejorador en la realización de la invención. También se puede agregar una secuencia intrón a la región 5' no traducida (UTR) o en la secuencia codificadora para incrementar la cantidad de mensaje maduro que se acumula en el citosol, como se describe en la sección de definiciones. Otras secuencias control (además de las secuencias promotor, mejorador, silenciador, intrón, las regiones 3'UTR y/o 5'UTR) pueden ser elementos estabilizadores de ARN y/o proteínas. El experto en el arte conoce o puede obtener con facilidad dichas secuencias.
Los constructos genéticos de la invención también pueden incluir una secuencia de origen de replicación necesaria para mantener y/o replicar en un tipo de célula específica. Un ejemplo es cuando se requiere mantener un constructo genético en una célula bacteriana como elemento genético episomal (por ejemplo, molécula de plásmido o cósmido). Preferentemente, los orígenes de replicación incluyen, sin limitaciones, f 1— ori y colE1.
Para la detección de la transferencia exitosa de las secuencias de ácidos nucleicos usadas en los métodos de la invención y/o la selección de plantas transgénicas que comprenden estos ácidos nucleicos, es ventajoso usar genes marcadores (o genes informadores). En consecuencia, el constructo genético opcionalmente puede comprender un gen marcador seleccionare. Los marcadores seleccionares se describen con mayor detalle en la sección "Definiciones" de la presente. Los genes marcadores se pueden retirar o eliminar de la célula transgénica una vez que ya no son necesarios. Las técnicas para retirar marcadores son conocidas en el arte, las técnicas útiles se describieron anteriormente en la sección de definiciones.
Se sabe que luego de la integración estable o transitoria de las secuecias de ácidos nucleicos en las células vegetales, sólo una minoría de las células capta el ADN extraño y, si se desea, lo integra en su genoma, según el vector de expresión usado y la técnica de transfección usada. Para identificar y seleccionar estos integrantes, se introduce usualmente un gen codificador de un marcador seleccionable (tal como los descritos con anterioridad) en las células huésped junto con el gen de interés. Por ejemplo, estos marcadores se pueden usar en mutantes en los cuales estos genes no son funcionales, por ejemplo, por eliminación con métodos convencionales. Además, las moléculas de las secuencias de ácidos nucleicos que codifican un marcador seleccionable se pueden introducir en una célula huésped en el mismo vector que comprende la secuencia que codifica los polipéptidos de la invención o usados en los métodos de la invención, o sino en un vector separado. Las células que han sido transfectadas en forma estable con la secuencia de ácidos nucleicos introducida se pueden identificar, por ejemplo, mediante selección (por ejemplo, las células que han integrado el marcador seleccionable sobreviven mientras que las otras células mueren). Los genes marcadores se pueden retirar o eliminar de la célula transgénica una vez que ya no son necesarios. Las técnicas para retirar genes marcadores son conocidas en el arte, las técnicas útiles se describieron anteriormente en la sección de definiciones.
La invención también provee un método para la producción de plantas transgénicas que tienen rasgos mejorados relacionados con el rendimiento con respecto a las plantas de control, que comprende introducir y expresar en una planta cualquier ácido nucleico que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido tipo LFY, como se definieron anteriormente.
Más específicamente, la presente invención provee un método para la producción de plantas transgénicas que tienen rasgos mejorados relacionados con el rendimiento, en particular mayor rendimiento (de semilla), cuyo método comprende: (i) introducir y expresar en una planta o célula vegetal una secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido tipo LFY; y (ii) cultivar la célula vegetal en condiciones que promueven el crecimiento y desarrollo de la planta.
El ácido nucleico de (i) puede ser cualquiera de los ácidos nucleicos capaces de codificar un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido tipo LFY, como se definen en la presente.
La invención también provee un método para la producción de plantas transgénicas que tienen rasgos aumentados relacionados con el rendimiento de las semillas con respecto a las plantas de control, que comprende introducir y expresar en una planta cualquier secuencia de ácidos nucleicos que codifica un polipéptido FATB, como se definió anteriormente.
Más específicamente, la presente invención provee un método para la producción de plantas transgénicas que tienen rasgos aumentados relacionados con el rendimiento de las semillas con respecto a las plantas de control, cuyo método comprende: (i) introducir y expresar en una planta, parte de una planta o célula vegetal una secuencia de ácidos nucleicos que codifica un polipéptido FATB; y (ii) cultivar la célula vegetal, parte de una planta o planta en condiciones que promueven el crecimiento y desarrollo de la planta.
La secuencia de ácidos nucleicos de (i) puede ser cualquiera de las secuencias de ácidos nucleicos capaces de codificar un polipéptido FATB, como se define en la presente.
La secuencia de ácidos nucleicos puede ser introducida directamente en una célula vegetal o en la planta misma (incluso la introducción en un tejido, órgano o cualquier otra parte de una planta). De acuerdo con una característica preferida de la presente invención, la secuencia de ácidos nucleicos se introduce preferentemente en una planta por transformación. El término "transformación" se describe con mayor detalle en la sección "Definiciones" de la presente.
Las células vegetales modificadas genéticamente se pueden regenerar por todos los métodos conocidos por el experto en el arte. Los métodos adecuados se pueden hallar en las publicaciones antes mencionadas de S.D. Kung y R. Wu, Potrykus o Hófgen y Willmitzer.
Generalmente, después de la transformación se seleccionan células vegetales o grupos celulares para determinar la presencia de uno o más marcadores codificados por genes que se expresan en plantas cotransferidos con el gen de interés, tras lo cual el material transformado se regenera en una planta entera. Para seleccionar las plantas transformadas, el material vegetal obtenido en la transformación es, como norma, sometido a condiciones selectivas, de manera tal que las plantas transformadas se puedan distinguir de las plantas no transformadas. Por ejemplo, las semillas obtenidas de la manera antes descrita se pueden sembrar y, después del período de crecimiento inicial, son sometidas a una selección adecuada por rociado. Otra posibilidad consiste en cultivar las semillas, si corresponde después de la esterilización, en placas de agar usando un agente de selección adecuado de manera que sólo las semillas transformadas pueden crecer y convertirse en plantas. Alternativamente, las plantas transformadas se analizan para determinar la presencia de un marcador seleccionable tal como los descritos anteriormente.
Después de la transferencia y regeneración de ADN, las plantas posiblemente transformadas se pueden evaluar, por ejemplo, mediante análisis Southern, para determinar la presencia del gen de interés, la cantidad de copias y/o la organización genómica. De manera alternativa o adicional, los niveles de expresión del ADN recién introducido pueden ser monitoreados mediante análisis Northern y/o Western, siendo ambas técnicas conocidas por los expertos en el arte.
Las plantas generadas transformadas pueden ser propagadas por diversos medios, tales como por propagación clonal o técnicas de cultivo clásicas. Por ejemplo, se puede autocruzar una primera generación (o T1) de plantas transformadas y se puede seleccionar una segunda generación (o T2) de transformantes homocigotas, y las plantas T2 luego se pueden propagar adicionalmente por técnicas de cultivo clásicas. Los organismos generados transformados pueden adoptar diversas formas. Por ejemplo, pueden ser quimeras de células transformadas y células no transformadas; transformantes clónales (por ejemplo, todas las células transformadas para contener el cásete de expresión); injertos de tejidos transformados y no transformados (por ejemplo, en plantas, una raíz transformada injertada en un acodo no transformado).
La presente invención claramente se extiende a cualquier célula vegetal o planta producida por cualquiera de los métodos descritos en la presente, y a todas las partes de la planta y sus propágulos. La presente invención se extiende también para abarcar la progenie de una célula, tejido, órgano o planta entera primaria transformada o transfectada que ha sido producida por cualquiera de los métodos antes mencionados, en donde el único requisito es que la progenie exhiba las mismas características genotípicas y/o fenotípicas que las producidas por los progenitores en los métodos de acuerdo con la invención.
La invención también incluye células huésped que contienen una secuencia de ácidos nucleicos aislada que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido tipo LFY, como se definen en la presente. Las células huésped preferidas de acuerdo con la invención son células vegetales. Las plantas huésped para los ácidos nucleicos o el vector usado en el método de acuerdo con la invención, el cásete de expresión o constructo o vector son, en principio, ventajosamente todas las plantas que son capaces de sintetizar los polipéptidos usados en el método de la invención.
Asimismo, la invención también incluye células huésped que contienen una secuencia de ácidos nucleicos aislada que codifica un polipéptido FATB, como se define en la presente, ligado operativamente a un promotor constitutivo. Las células huésped preferidas de acuerdo con la invención son células vegetales. Las plantas huésped para las secuencias de ácidos nucleicos o el vector usado en el método de acuerdo con la invención, el cásete de expresión o constructo o vector son, en principio, ventajosamente todas las plantas que son capaces de sintetizar los polipéptidos usados en el método de la invención.
Los métodos de la invención se pueden aplicar ventajosamente a cualquier planta. Las plantas que son particularmente útiles en los métodos de la invención incluyen todas las plantas que pertenecen a la superfamilia Viridiplantae, en particular plantas monocotiledóneas y dicotiledóneas incluso forraje o legumbres forrajeras, plantas ornombrentales, cultivos alimenticios, árboles o arbustos. De acuerdo con una forma de realización preferida de la presente invención, la planta es una planta de cultivo. Los ejemplos de plantas de cultivo incluyen soja, girasol, cañóla, alfalfa, colza, linaza, algodón, tomate, papa y tabaco. Más preferentemente, la planta es una planta monocotlledónea. Los ejemplos de plantas monocotiledóneas incluyen caña de azúcar. Más preferentemente, la planta es un cereal. Los ejemplos de cereals incluyen arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, triticum dicoccum, espelta, sécale, triticum monococcum, tefí, milo y avena.
La invención también se extiende a las partes cosechables de una planta tales como, por ejemplo, semillas, hojas, frutas, flores, tallos, raíces, rizomas, tubérculos y bulbos, cuyas partes cosechables comprenden una secuencia de ácidos nucleicos recombinante que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido tipo LFY. La invención también se refiere a productos derivados, con preferencia derivados directamente, de una parte cosechable de dicha planta, tal como polvos o pellets secos, aceite, grasa y ácidos grasos, almidón o proteínas.
Además, la invención también se extiende a las partes cosechables de una planta que comprende una secuencia de ácidos nucleicos aislada que codifica un FATB (como se definió anteriormente) ligado operativamente a un promotor constitutivo, tales como, por ejemplo, semillas, hojas, frutas, flores, tallos, rizomas, tubérculos y bulbos. La invención también se refiere a productos derivados, con preferencia derivados directamente, de una parte cosechable de dicha planta, tal como polvos o pellets secos, aceite, grasa y ácidos grasos, almidón o proteínas.
De acuerdo con una característica preferida de la invención, la expresión modulada es expresión aumentada. Los métodos para aumentar la expresión de las secuencias de ácidos nucleicos o genes, o productos génicos, están bien documentados en el arte y se proveen ejemplos en la sección de definiciones.
Como se mencionó anteriormente, un método preferido para modular la expresión de una secuencia de ácidos nucleicos que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY, consiste en la introducción y expresión en una planta de un ácido nucleico que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY; sin embargo, los efectos de realizar el método, es decir, mejorar los rasgos relacionados con el rendimiento, también se pueden lograr utilizando otras técnicas conocidas, tales como rotulado de activación de T-ADN, TILLING, recombinación homóloga. Se provee una descripción de estas técnicas en la sección de definiciones.
La presente invención también abarca el uso de secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos tipo LFY, como se describen en la presente, y el uso de estos polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos tipo LFY para mejorar cualquiera de los rasgos antes mencionados relacionados con el rendimiento en las plantas.
Por otra parte, la presente invención también abarca el uso de secuencias de ácidos nucleicos que codifican polipéptidos FATB, como se describen en la presente, y el uso de estos polipéptidos FATB para aumentar cualquiera de los rasgos antes mencionados relacionados con el rendimiento de las semillas en las plantas, en condiciones normales de crecimiento, en condiciones de crecimiento con estrés abiótico (preferentemente condiciones de crecimiento con esters osmótico), y en condiciones de crecimiento con disponibilidad reducida de nutrientes, preferentemente en condiciones de disponibilidad reducida de nitrógeno.
En relación a los polipéptidos GS1 , las secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos tipo LFY, descritos en la presente, o los mismos polipéptidos GS1 , pueden ser utilizados en programas de reproducción en los cuales se identifica un ADN marcador que puede estar ligado genéticamente a un gen que codifica un polipéptido GS1, o un polipéptido PEAMT, o un polipéptido tipo LFY. Los ácidos nucleicos/genes, o los mismos polipéptidos GS1 , o los mismos polipéptidos PEAMT, o los polipéptidos tipo LFY, se pueden usar para definir un marcador molecular. Este ADN o proteína marcador luego se puede usar en programas de reproducción para seleccionar plantas que tienen rasgos mejorados relacionados con el rendimiento como se definen en la presente en los métodos de la invención.
En relación a los polipéptidos FATB, las secuencias de ácidos nucleicos que codifican polipéptidos FATB, descritos en la presente, o los mismos polipéptidos FATB, pueden ser utilizados en programas de reproducción en los cuales se identifica un ADN marcador que puede estar ligado genéticamente a un gen que codifica un polipéptido FATB. Las secuencias de ácidos nucleicos/genes, o los mismos polipéptidos FATB, se pueden usar para definir un marcador molecular. Este ADN o proteína marcador luego se puede usar en programas de reproducción para seleccionar plantas que tienen rasgos aumentados relacionados con el rendimiento de las semillas como se definen en la presente en los métodos de la invención.
Las variante alélicas de una secuencia de ácidos nucleicos/genes que codifica un polipéptido GS1 , o un polipéptido PEAMT, o un polipéptido FATB, o un polipéptido tipo LFY también se pueden utilizar en programas de reproducción asistidos por marcador. Tales programas de reproducción a veces requieren la introducción de una variación alélica mediante el tratamiento mutagénico de las plantas, utilizando por ejemplo mutagénesis EMS; alternativamente, el programa puede comenzar con un agrupamiento de variantes alélicas del denominado origen "natural" causadas de modo no intencional. Luego se lleva a cabo la identificación de variantes alélicas, por ejemplo, mediante PCR. Luego sigue una etapa de selección de variantes alélicas superiores de la secuencia en cuestión y que generan mayor rendimiento. Generalmente, la selección se lleva a cabo controlando el crecimiento de las plantas que contienen diferentes variantes alélicas de la secuencia en cuestión. Se puede controlar el crecimiento en un invernadero o en el campo. Otras etapas adicionales incluyen cruzar plantas en las cuales la variante alélica superior se identificó con otra planta. Esto podría utilizarse, por ejemplo, para realizar una combinación de características fenotípicas interesantes.
Las secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEA T, o polipéptidos FATB, o polipéptidos tipo LFY también se pueden utilizar como sondas para mapear genética y físicamente los genes de los cuales son parte, y como marcadores de rasgos ligados a esos genes. Tal información puede ser útil para la reproducción de plantas a fin de desarrollar líneas con los fenotipos deseados. Tal uso de las secuencias de ácidos nucleicos que codifican polipéptidos GS1, o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY, sólo requiere una secuencia de ácidos nucleicos de al menos 15 nucleótidos de longitud. Las secuencias de ácidos nucleicos que codifican polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY se pueden usar como marcadores de polimorfismos de longitud de fragmento de restricción (RFLP). Se pueden sondear Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de ADN genómico vegetal digerido por restricción con los ácidos nucleicos que codifican GS1. Los patrones de banda resultantes luego se pueden someter a análisis genético utilizando programas de computación tales como MapMaker (Lander et al. (1987) Genomics 1 : 174-181) a fin de construir un mapa genético. Además, los ácidos nucleicos se pueden usar para sondear Southern blots que contienen ADN genómico tratado con endonucleasa de restricción de un conjunto de individuos que representan los progenitores y la progenie de una cruza genética definida. Se observa la segregación de los polimorfismos de ADN y se lo utiliza para calcular la posición de la secuencia de ácidos nucleicos que codifica polipéptidos GS1 , o polipéptidos PEAMT, o polipéptidos FATB, o polipéptidos tipo LFY en el mapa genético obtenido previamente con esta población (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
La producción y uso de sondas derivadas de genes vegetales para utilizar en el mapeo genético se describen en Bernatzky and Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicaciones describen el mapeo genético de clones específicos de cADN utilizando la metodología antes indicada o variaciones de ésta. Por ejemplo, para el mapeo se puede utilizar entrecruzamiento de poblaciones F2, poblaciones retrocruzadas, poblaciones apareadas al azar, líneas isogénicas cercanas y otros conjuntos de individuos. Tales metodologías son conocidas por los expertos en el arte.
También se pueden utilizar las sondas de secuencias de ácidos nucleicos para el mapeo físico (es decir, la ubicación de secuencias en mapas físicos; ver Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, y las referencias allí citadas).
En otra forma de realización, las sondas de secuencias de ácidos nucleicos se pueden usar en el mapeo' por hibridación directa con fluorescencia in situ (FISH) (Trask (1991 ) Trends Genet. 7:149-154). Aunque los métodos actuales de mapeo FISH favorecen el uso de grandes clones (entre varios kb y varios cientos de kb; ver Laan et al. (1995) Genome Res. 5:13-20), las mejoras de la sensibilidad pueden permitir la realización del mapeo FISH con sondas más cortas.
Se pueden llevar a cabo varios métodos de mapeo genético y físico basados en la amplificación de secuencias de ácidos nucleicos mediante el uso de las secuencias de ácidos nucleicos. Los ejemplos incluyen amplificación específica de alelos (Kazazian (1989) J. Lab. Clin. Med. 11 :95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), unión específica de alelos (Landegren et al. (1988) Science 241 :1077-1080), reacciones de extensión de nucleótidos (Sokolov (1990) Nucleic acid sequence Res. 18:3671), mapeo de híbridos con radiación (Walter et al. (1997) Nat. Genet. 7:22-28) y mapeo Happy (Dear and Cook (1989) Nucleic acid sequence Res. 17:6795-6807). Para estos métodos, se usa la secuencia de una secuencia de ácidos nucleicos para diseñar y producir pares de cebadores que se utilizan en la reacción de amplificación o en las reacciones de extensión de cebadores. El diseño de dichos cebadores es conocido por los expertos en el arte. En los métodos que emplean el mapeo genético basado en PCR, puede ser necesario identificar las diferencias en las secuencias de ADN entre los progenitores del cruzamiento de mapeo, en la región que corresponde a la secuencia de ácidos nucleicos de la presente. Sin embargo, en general esto no es necesario para los métodos de mapeo.
Los métodos de acuerdo con la presente invención dan como resultado plantas que tienen rasgos mejorados relacionados con el rendimiento, o rasgos mejorados relacionados con el rendimiento de las semillas, como se describieron en la presente. Estos rasgos también se pueden combinar con otros rasgos ventajosos a nivel económico, tales como otros rasgos mejoradores del rendimiento, tolerancia a otro tipo de estrés biótico y abiótico, rasgos que modifican varias características arquitectónicas y/o características bioquímicas y/o fisiológicas. ítems 1. Un método para mejorar rasgos relacionados con el rendimiento en plantas con respecto a las plantas de control, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido citoplasmático de glutamina sintasa (GS1) tipo alga, en donde dicho polipéptido GS1 de tipo alga comprende un dominio Gln-synt_C (acceso a Pfam PF00120) y un dominio Gln-synt_N (acceso a Pfam PF03951).
. Método de acuerdo con el ítem 1 , en donde dicho polipéptido GS1 comprende uno o más de los siguientes motivos: (a) Motivo 1 , SEQ ID NO: 3; (b) Motivo 2, SEQ ID NO: 4; (c) Motivo 3, SEQ ID NO: 5, en cuyos motivos se permiten como máximo 2 faltas de coincidencia.
. Método de acuerdo con el ítem 1 ó 2, en donde dicha expresión modulada se lleva a cabo mediante la introducción y expresión en una planta de un ácido nucleico que codifica un polipéptido GS1 de tipo alga.
. Método de acuerdo con cualquiera de los ítems 1 a 3, en donde dicho ácido nucleico que codifica un polipéptido GS1 codifica cualquiera de las proteínas enumeradas en la Tabla A1 o es una porción de dicho ácido nucleico, o un ácido nucleico capaz de hibridarse con dicho ácido nucleico.
. Método de acuerdo con cualquiera de los ítems 1 a 4, en donde dicha secuencia de ácidos nucleicos codifica un ortólogo o parálogo de cualquiera de las proteínas indicadas en la Tabla A1.
Método de acuerdo con cualquiera de los ítems 1 a 5, en donde dichos rasgos mejorados relacionados con el rendimiento comprenden mayor rendimiento, preferentemente mayor biomasa y/o mayor rendimiento de las semillas con respecto a las plantas de control.
Método de acuerdo con cualquiera de los ítems 1 a 6, en donde dichos rasgos mejorados relacionados con el rendimiento se obtienen en condiciones de deficiencia de nutrientes.
Método de acuerdo con cualquiera de los ítems 3 a 7, en donde dicho ácido nucleico está ligado operativamente a un promotor específico de brote, preferentemente a un promotor protoclorofillida reductasa, con máxima preferencia a un promotor protoclorofillida reductasa del arroz.
Método de acuerdo con cualquiera de los ítems 1 a 8, en donde dicho ácido nucleico que codifica un polipéptido GS1 deriva de una planta, preferentemente de un alga, más preferentemente de la clase de Chlorophyceae, más preferentemente de la familia Chlamydomonadaceae, con máxima preferencia de Chlamydomonas reinhardtii.
Planta o parte de ésta, incluso semillas, que se pueden obtener por un método de acuerdo con cualquiera de los ítems 1 a 9, en donde dicha planta o parte de ésta comprende un ácido nucleico recombinante que codifica un polipéptido GS1.
Constructo que comprende: (i) ácido nucleico que codifica un polipéptido GS1 como se define en los ítems 1 ó 2; (ii) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (a); y opcionalmente (iii) una secuencia de terminación de la transcripción.
Constructo de acuerdo con el ítem 11 , en donde una de dichas secuencias de controls es un promotor específico de brote, preferentemente un promotor protoclorofillida reductasa, con máxima preferencia un promotor protoclorofillida reductasa del arroz.
Uso de un constructo de acuerdo con el ítem 11 ó 12 en un método para obtener plantas con mayor rendimiento, en particular mayor biomasa y/o mayor rendimiento de las semillas con respecto a las plantas de control.
Planta, parte de la planta o célula vegetal transformada con un constructo de acuerdo con el ítem 11 ó 12.
Método para la producción de una planta transgénica con mayor rendimiento, en particular mayor biomasa y/o mayor rendimiento de las semillas con respecto a las plantas de control, que comprende: (i) introducir y expresar en una planta un ácido nucleico que codifica un polipéptido GS1 como se define en el ítem 1 ó 2; y (ii) cultivar la célula Vegetal en condiciones que promuevan el crecimiento y desarrollo de la planta.
Planta transgénica con mayor rendimiento, en particular mayor biomasa y/o mayor rendimiento de las semillas, con respecto a las plantas de control, que resulta de la expresión modulada de un ácido nucleico que codifica un polipéptido GS1 como se define en el ítem 1 ó 2, o una célula de planta transgénica derivada de dicha planta transgénica.
Planta transgénica de acuerdo con el ítem 10, 14 ó 16, o una célula de planta transgénica derivada de aquella, en donde dicha planta es una planta de cultivo o una planta monocotiledónea o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, triticum dicoccum, espelta, sécale, triticum monococcum, teff, milo y avena.
Partes cosechables de una planta de acuerdo con el ítem 17, en donde dichas partes cosechables son preferentemente biomasa de brote y/o semillas.
Productos derivados de una planta de acuerdo con el ítem 17 y/o de partes cosechables de una planta de acuerdo con el ítem 8.
Uso de un ácido nucleico que codifica un polipéptido GS1 para incrementar el rendimiento, en particular para incrementar el rendimiento de las semillas y/o la biomasa de los brotes en las plantas, con respecto a las plantas de control.
Un polipéptido aislado seleccionado de: (i) una secuencia de aminoácidos representada por SEQ ID NO: 53 ó 54; (ii) una secuencia de aminoácidos que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia con la secuencia de aminoácidos representada por SEQ ID NO: 53 ó 54, (iii) derivados de cualquiera de las secuencias de aminoácidos indicadas en (i) o (i¡) anterior.
Un ácido nucleico aislado que codifica un polipéptido como se define en el ítem 22, o un ácido nucleico que se híbrida con aquél.
Un método para mejorar rasgos relacionados con el rendimiento en las plantas con respecto a las plantas de control, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido PEAMT o su homólogo que comprende un dominio de proteína que tiene, en orden creciente de preferencia, por lo menos 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% de identidad de secuencia con cualquiera de los dominios de proteína indicados en la Tabla C2.
Método de acuerdo con el ítem 23, en donde el ácido nucleico codifica un polipéptido PEAMT o su homólogo que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% de identidad de secuencia total con la secuencia de aminoácidos representada por SEQ ID NO: 58.
Método de acuerdo con el ítem 23 ó 24, en donde dicho ácido nucleico que codifica un polipéptido PEAMT o su homólogo es una porción del ácido nucleico representado por SEQ ID NO: 57, o es una porción de un ácido nucleico que codifica un ortólogo o parálogo de la secuencia de aminoácidos de SEQ ID NO: 58, en donde la porción tiene por lo menos 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 610, 620, 630, 640, 650, 660, 670, 680, 690, 700, 710, 720, 730, 740, 750, 760, 770, 780, 790, 800, 810, nucleótidos consecutivos de longitud, siendo los nucleótidos consecutivos de SEQ ID NO: 57, o de un ácido nucleico que codifica un ortólogo o parálogo de la secuencia de aminoácidos de SEQ ID NO: 58.
Método de acuerdo con cualquiera de los ítems 23 a 25, en donde el ácido nucleico que codifica un polipéptido PEAMT o su homólogo es capaz de hibridarse con el ácido nucleico representado por SEQ ID NO: 1 o es capaz de hibridarse con un ácido nucleico que codifica un ortólogo, parálogo u homólogo de SEQ ID NO: 58.
Método de acuerdo con cualquiera de los ítems 23 a 26, en donde dicho ácido nucleico que codifica un polipéptido PEAMT o su homólogo codifica un ortólogo o parálogo de la secuencia representada por SEQ ID NO: 58.
Método de acuerdo con cualquiera de los ítems 23 a 27, en donde dicha expresión modulada se lleva a cabo mediante la introducción y expresión en una planta, un ácido nucleico que codifica un polipéptido PEAMT o su homólogo.
Método de acuerdo con cualquiera de los ítems 23 a 28, en donde dichos rasgos mejorados relacionados con el rendimiento que comprende mayor rendimiento, preferentemente mayor biomasa y/o mayor rendimiento de las semillas con respecto a las plantas de control se obtienen en condiciones sin estrés.
Método de acuerdo con cualquiera de los ítems 23 a 29, en donde dichos rasgos mejorados relacionados con el rendimiento que comprende mayor rendimiento, preferentemente mayor biomasa y/o mayor rendimiento de las semillas con respecto a las plantas de control se obtienen en condiciones de estrés por sequía. Método de acuerdo con el ítem 28, 29 o 30 en donde dicho ácido nucleico está ligado operativamente a un promotor constitutivo, preferentemente a un promotor GOS2, con máxima preferencia a un promotor GOS2 del arroz.
Método de acuerdo con cualquiera de los ítems 23 a 31 , en donde dicho ácido nucleico que codifica un polipéptido PEAMT es de origen vegetal, preferentemente de una planta dicotiledónea, más preferentemente de la familia Brassicaceae, con mayor preferencia del género Arabidopsis, con máxima preferencia de Arabidopsis th allana.
Planta o parte de ésta, incluso semillas, que se pueden obtener por un método de acuerdo con cualquier ítem anterior, en donde dicha planta o parte de ésta comprende un ácido nucleico recombinante que codifica un polipéptido PEAMT o su homólogo.
Una molécula de ácido nucleico aislada que comprende por lo menos 98 % de identidad de secuencia con la SEQ ID NO: 57.
Un polipéptido aislado que comprende por lo menos 99 % de identidad de secuencia con la SEQ ID NO: 58.
Constructo que comprende: (i) un ácido nucleico que codifica un polipéptido PEAMT o su homólogo como se define en cualquiera de los ítems 23 a 27 y los ítems 34 y 35; (ii) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (a); y opcionalmente (iii) una secuencia de terminación de la transcripción.
Constructo de acuerdo con el ítem 36, en donde una de dichas secuencias de control tiene un promotor constitutivo, preferentemente un promotor GOS2, con máxima preferencia un promotor GOS2 del arroz.
Uso de un constructo de acuerdo con el ítem 36 o 37 en un método para obtener plantas que tienen rasgos alterados relacionados con el rendimiento con respecto a las plantas de control.
Planta, parte de la planta o célula vegetal transformada con un constructo de acuerdo con el ítem 36 o 37.
Método para la producción de una planta transgénica que tiene rasgos mejorados relacionados con el rendimiento con respecto a las plantas de control, que comprende: (i) introducir y expresar en una planta un ácido nucleico que codifica un polipéptido PEAMT o su homólogo como se define en cualquiera de los ítems 23 a 27 y los ítems 34 y 35; y (ii) cultivar la célula vegetal en condiciones que promuevan el crecimiento y desarrollo de la planta.
Planta transgénica que tiene rasgos mejorados relacionados con el rendimiento con respecto a las plantas de control, que resulta de la expresión modulada de un ácido nucleico que codifica un polipéptido PEAMT o su homólogo como se define en cualquiera de los ítems 23 a 27 y los ítems 34 y 35.
Planta transgénica de acuerdo con el ítem 33, 39 o 41 , o una célula de planta transgénica derivada de ésta, en donde dicha planta es una planta de cultivo o una planta monocotiledónea o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, triticum dicoccum, espelta, sécale, triticum monococcum, teff, milo y avena.
Productos derivados de una planta de acuerdo con el ítem 42.
Uso de un ácido nucleico que codifica un polipéptido PEAMT o su homólogo para alterar los rasgos relacionados con el rendimiento de las plantas con respecto a las plantas de control.
Un método para incrementar rasgos relacionados con el rendimiento de semillas en plantas con respecto a las plantas de control, que comprende incrementar la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido tioesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB), donde dicho polipéptido FATB comprende (i) un péptido de tránsito a plástido; (ii) por lo menos una hélice transmembranal; (iii) y un dominio de la familia acil-ACP tioesterasa con un acceso a InterPro IPR002864, y opcionalmente seleccionar plantas que tienen rasgos relacionados con el mayor rendimiento de las semillas. Método de acuerdo con el ítem 45, en donde dicho polipéptido FATB tiene (i) un péptido de tránsito a plástido; (ii) en orden creciente de preferencia por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con una hélice transmembranal representada por SEQ ID NO: 141 ; y que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con un dominio de la familia acil-ACP tioesterasa representada por SEQ ID NO: 140.
Método de acuerdo con el ítem 45 o 46, en donde dicho polipéptido FATB tiene en orden creciente de preferencia por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% o más de identidad de secuencia de aminoácidos con el polipéptido FATB representado por SEQ ID NO: 93 o con cualquiera de las secuencias de polipéptidos indicadas en la Tabla A3 de la presente.
Método de acuerdo con cualquiera de los ítems 45 a 47, en donde dicho polipéptido FATB es cualquier secuencia de polipéptidos que cuendo se usa en la construcción de un árbol filogenético FATs, tal como el representado en la Figura 10, se agrupa con el ciado de polipéptidos FATB que comprende la secuencia de polipéptidos representada por SEQ ID NO: 93 en vez de con el ciado de polipéptidos FATA.
Método de acuerdo con cualquiera de los ítems 45 a 48, en donde dicho polipéptido FATB es un polipéptido con actividad enzimática que consiste en hidrolizar uniones de acil-ACP tioéster, preferentemente de acil-ACP saturado (con longitudes de cadena que varía entre 8 y 18 carbonos), liberando ácidos grasos libres y proteína portadora de acilo (ACP).
Método de acuerdo con cualquiera de los ítems 45 a 49, en donde dicha secuencia de ácidos nucleicos que codifica un polipéptido FATB es representada por cualquiera de la secuencia de ácidos nucleicos SEQ ID NOs indicadas en la Tabla A3 o una porción de ésta, o una secuencia capaz de hibridarse con cualquiera de las secuencias de ácidos nucleicos SEQ ID NOs indicadas en la Tabla A3, o con un complemento de ésta.
Método de acuerdo con cualquier ítem anterior, en donde dicha secuencia de ácidos nucleicos codifica un ortólogo o parálogo de cualquiera de la secuencia de polipéptidos SEQ ID NOs indicadas en la Tabla A3.
Método de acuerdo con cualquier ítem anterior, en donde dicha expresión incrementada se lleva a cabo por una o más de: rotulado de activación de T-ADN, TILLING, o recombinación homologa.
Método de acuerdo con cualquier ítem anterior, en donde dicha expresión incrementada se lleva a cabo mediante la introducción y expresión en una planta una secuencia de ácidos nucleicos que codifica un polipéptido FATB.
Método de acuerdo con cualquier ítem anterior, en donde dicho rasgo incrementado relacionado con el rendimiento tiene una o más de: rendimiento total de las semillas incrementado por planta, cantidad total de semillas incrementada, cantidad incrementada de semillas llenas, tasa de llenado de semillas incrementada, e índice de cosecha incrementado.
Método de acuerdo con cualquier ítem anterior, en donde dicha secuencia de ácidos nucleicos está ligado operativamente a un promotor constitutivo.
Método de acuerdo con el ítem 55, en donde dicho promotor constitutivo es un promotor GOS2, preferentemente un promotor GOS2 del arroz, con mayor preferencia un promotor GOS2 representado por SEQ ID NO: 144.
Método de acuerdo con cualquier ítem anterior, en donde dicha secuencia de ácidos nucleicos que codifica un polipéptido FATB es de una planta, más preferentemente de una planta dicotiledónea, con mayor preferencia de la familia Brassicaceae, con máxima preferencia la secuencia de ácidos nucleicos es de Arabidopsis thaliana.
Plantas, partes de éstas (incluso semillas), o células de la planta que se pueden obtener por un método de acuerdo con cualquier ítem anterior, en donde dicha planta, parte o célula de ésta comprende un transgén de ácido nucleico aislado que codifica un polipéptido FATB, ligado operativamente a un promotor constitutivo.
Una secuencia de ácidos nucleicos aislada que comprende: (i) una secuencia de ácidos nucleicos representada por SEQ ID NO: 130; (ii) el complemento de una secuencia de ácidos nucleicos representado por SEQ ID NO: 130; (iii) una secuencia de ácidos nucleicos que codifica al polipéptido FATB que tiene, en orden creciente de preferencia, por lo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia de aminoácidos con la secuencia de polipéptidos representada por SEQ ID NO: 131.
Un polipéptido aislado que comprende: (i) una secuencia de polipéptidos representada por SEQ ID NO: 131 ; (ii) una secuencia de polipéptidos que tiene, en orden creciente de preferencia, por lo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia con la secuencia de polipéptidos representada por SEQ ID NO: 131 ; (iii) derivados de cualquiera de las secuencias de polipéptidos indicadas en (i) o (ii) anterior.
Constructo que comprende: (a) una secuencia de ácidos nucleicos que codifica un polipéptido FATB como se define en cualquiera de los ítems 45 a 51 ; (b) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (a); y opcionalmente (c) una secuencia de terminación de la transcripción.
Constructo de acuerdo con el ítem 61 , en donde dicha secuencia de control es un promotor constitutivo.
Constructo de acuerdo con el ítem 60, en donde dicho promotor constitutivo es un promotor GOS2, preferentemente un promotor GOS2 del arroz, con mayor preferencia un promotor GOS2 representado por SEQ ID NO: 144.
Uso de un constructo de acuerdo con cualquiera de los ítems 61 a 63, en un método para obtener plantas que tienen rasgos relacionado con el mayor rendimiento de las semillas con respecto a las plantas de control, cuyos rasgos relacionados con el mayor rendimiento de las semillas tienen una o más de: rendimiento total de las semillas incrementado por planta, cantidad total de semillas incrementada, cantidad incrementada de semillas llenas, tasa de llenado de semillas incrementada, e índice de cosecha incrementado.
Planta, parte de la planta o célula vegetal transformada con un constructo de acuerdo con cualquiera de los ítems 61 a 63.
Método para la producción de plantas transgénicas que tienen rasgos relacionados con el mayor rendimiento de las semillas con respecto a las plantas de control, que comprende: (i) introducir y expresar en una planta, parte de la planta, o célula vegetal, una secuencia de ácidos nucleicos que codifica un polipéptido FATB como se define en cualquiera de los ítems 45 a 51 ; y (ii) cultivar la célula vegetal, parte de la planta, o planta en condiciones que promuevan el crecimiento y desarrollo de la planta.
Planta transgénica que tiene rasgos relacionados con el mayor rendimiento de las semillas con respecto a las plantas de control, que resulta de la expresión incrementada de una secuencia de ácidos nucleicos que codifica un polipéptido FATB como se define en cualquiera de los ítems 45 a 51 , ligada operativamente a un promotor constitutivo, o una célula de planta transgénica o parte de planta transgénica derivada de dicha planta transgénica.
Planta transgénica de acuerdo con el ítem 58, 65 ó 67, en donde dicha planta es una planta de cultivo o una planta monocotiledónea o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo y avena, o una célula de planta transgénica derivada de dicha planta transgénica.
Partes cosechables que comprenden una secuencia de ácidos nucleicos aislada que codifica un polipéptido FATB de una planta de acuerdo con el ítem 68, en donde dichas partes cosechables son preferentemente semillas.
Productos derivados de una planta de acuerdo con el ítem 68 y/o de partes cosechables de una planta de acuerdo con el ítem 69.
Uso de una secuencia de ácidos nucleicos que codifica un polipéptido FATB como se define en cualquiera de los ítems 45 a 51 para incrementar rasgos relacionados con el rendimiento de las semillas, que comprende una o más de mayor rendimiento total de las semillas incrementado por planta, cantidad total de semillas incrementada, cantidad incrementada de semillas llenas, tasa de llenado de semillas incrementada, e índice de cosecha incrementado.
Un método para mejorar rasgos relacionados con el rendimiento en plantas con respecto a las plantas de control, que comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido tipo LFY, en donde dicho polipéptido tipo LFY comprende un dominio FLO_LFY.
Método de acuerdo con el ítem 72, en donde dicho polipéptido tipo LFY tiene por lo menos 50% de identidad de secuencia con SEQ ID NO: 146.
Método de acuerdo con el ítem 72 ó 73, en donde dicha expresión modulada se lleva a cabo mediante la introducción y expresión en una planta un ácido nucleico que codifica un polipéptido tipo LFY.
Método de acuerdo con cualquiera de los ítems 72 a 74, en donde dicho ácido nucleico que codifica un polipéptido tipo LFY codifica cualquiera de las proteínas enumeradas en la Tabla A4 o es una porción de dicho ácido nucleico, o un ácido nucleico capaz de hibrídarse con dicho ácido nucleico.
Método de acuerdo con cualquiera de los ítems 72 a 75, en donde dicha secuencia de ácidos nucleicos codifica un ortólogo o parálogo de cualquiera de las proteínas indicadas en la Tabla A4.
Método de acuerdo con cualquiera de los ítems 72 a 76, en donde dichos rasgos mejorados relacionados con el rendimiento comprenden mayor rendimiento, preferentemente mayor rendimiento de las semillas con respecto a las plantas de control.
Método de acuerdo con cualquiera de los ítems 72 a 77, en donde dichos rasgos mejorados relacionados con el rendimiento se obtienen en condiciones sin estrés. Método de acuerdo con cualquiera de los ítems 74 a 78, en donde dicho ácido nucleico está ligado operativamente a un promotor constitutivo, preferentemente a un promotor GOS2, con máxima preferencia a un promotor GOS2 del arroz.
Método de acuerdo con cualquiera de los ítems 72 a 79, en donde dicho ácido nucleico que codifica un polipéptido tipo LFY es de origen vegetal, preferentemente de una planta dicotiledónea, más preferentemente de la familia Brassicaceae, con mayor preferencia del género Arabidopsis, con máxima preferencia de Arabidopsis thaliana.
Planta o parte de ésta, incluso semillas, que se pueden obtener por un método de acuerdo con cualquier ítem anterior, en donde dicha planta o parte de ésta comprende un ácido nucleico recombinante que codifica un polipéptido tipo LFY. Constructo que comprende: (i) ácido nucleico que codifica un polipéptido tipo LFY como se define en los ítems 72 ó 73; (ii) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (a); y opcionalmente (iii) una secuencia de terminación de la transcripción.
Constructo de acuerdo con el ítem 82, en donde una de dichas secuencias de control es un promotor constitutivo, preferentemente un promotor GOS2, con máxima preferencia un promotor GOS2 del arroz.
Uso de un constructo de acuerdo con el ítem 82 ó 83 en un método para obtener plantas que tienen mayor rendimiento, en particular mayor rendimiento de las semillas con respecto a las plantas de control.
Planta, parte de la planta o célula vegetal transformada con un constructo de acuerdo con el ítem 82 ó 83.
Método para la producción de una planta transgénica que tiene mayor rendimiento, en particular mayor rendimiento de las semillas con respecto a las plantas de control, que comprende. (i) introducir y expresar en una planta un ácido nucleico que codifica un polipéptido tipo LFY como se define en el ítem 72 ó 73; y (ii) cultivar la célula vegetal en condiciones que promuevan el crecimiento y desarrollo de la planta.
Planta transgénica que tiene mayor rendimiento, en particular mayor rendimiento de las semillas, con respecto a las plantas de control, que resulta de la expresión modulada de un ácido nucleico que codifica un polipéptido tipo LFY como se define en el ítem 72 ó 73, o una célula de planta transgénica derivada de dicha planta transgénica.
Planta transgénica de acuerdo con el ítem 81 , 85 ó 87, o una célula de planta transgénica derivada de ésta, en donde dicha planta es una planta de cultivo o una planta monocotiledónea o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, triticum dicoccum, espelta, sécale, triticum monococcum, teff, milo y avena. 89. Partes cosechables de una planta de acuerdo con el ítem 88, en donde dichas partes cosechables son preferentemente semillas. 90. Productos derivados de una planta de acuerdo con el ítem 88 y/o de partes cosechables de una planta de acuerdo con el ítem 89. 91. Uso de un ácido nucleico que codifica un polipéptido tipo LFY para incrementar el rendimiento, en particular para incrementar el rendimiento de las semillas en plantas, con respecto a las plantas de control.
Descripción de las figuras A continuación la presente invención se describirá con referencia a las siguientes figuras en las cuales: La Figura 1 representa la estructura del dominio de SEQ ID NO: 2 con el dominio Gln-synt_N (PF03951) que se muestra en negrita subrayado, el dominio Gln-synt_C (PF00120) que se muestra en itálica subrayado y los motivos conservados 1 a 3 mediante la línea punteada.
La Figura 2 representa un alineamiento múltiple de secuencias de proteínas del alga GS1.
Las Figuras 3A y 3B muestran un árbol filogenético de proteínas GS1. El panel a da una vista general de proteínas GS1 (citosólica) y GS2 (cloroplástícas) en un filograma circular. El panel b muestra el agrupamiento de secuencias en el grupo del alga, con unas pocas secuencias de los grupos citosólicos y citoplásmícos control (outgroups). Los números en el árbol del panel b corresponden a los siguientes SEQ ID NOs: (1 ) SEQ ID NO: 21 , (2) SEQ ID NO: 26, (3) SEQ ID NO: 27, (4) SEQ ID NO: 10, (5) SEQ ID NO: 11 , (6) SEQ ID NO: 15, (7) SEQ ID NO: 24, (8) SEQ ID NO: 25, (9) SEQ ID NO: 12, (10) SEQ ID NO: 2, (1 1) SEQ ID NO: 16, (12) SEQ ID NO: 13, (13) SEQ ID NO: 28, (14) SEQ ID NO: 14, (15) SEQ ID NO: 9, (16) SEQ ID NO: 17, (17) SEQ ID NO: 19, (18) SEQ ID NO: 22, (19) SEQ ID NO: 30, (20) SEQ ID NO: 18, (21) SEQ ID NO: 20, (22) SEQ ID NO: 23, (23) SEQ ID NO: 29.
La Figura 4 representa el vector binario para una expresión aumentada en Oryza sativa de un Ácido nucleico que codifica GS1 bajo el control de un promotor protoclorofillida reductasa (pPCR) del arroz.
La Figura 5 representa un alineamiento múltiple de la secuencia de aminoácidos de los polipéptidos PEAMT de la Tabla A2.
La Figura 6 representa un árbol filogenético de la secuencia de aminoácidos de los polipéptidos PEAMT de la Tabla A2.
La Figura 7 representa el vector binario para una mayor expresión en Oryza sativa del ácido nucleico que codifica Arath_PEAMT_1 bajo el control de un promotor GOS2 (pGOS2) del arroz.
La Figura 8 esquemáticamente representa la vía general de la biosíntesis de varios ácidos grasos (triacilgliceroles; TAGs, sintetizados a través de la vía Kennedy) y etapas normalmente involucradas para la producción de lípidos de almacenamiento en semillas. Los polipéptidos FATB útiles para la realización de los métodos de la invención se muestran con una flecha. De acuerdo con Marillia et al. (2000) Developments in Plant Genetics and Breeding. Volume 5, 2000, Pages 182-188.
La Figura 9 representa un dibujo de un polipéptido FATB representado por SEQ ID NO: 93, que comprende las siguientes características: (i) un péptido de tránsito a plástido; (ii) por lo menos una hélice transmembranal; (iii) y un dominio de la familia acil-ACP tioesterasa con un número de acceso InterPro IPR002864.
La Figura 10 muestra un árbol filogenético de Polipéptidos FATs de diversos organismos fuente, de acuerdo con Mayer et al. (2007) BMC Plant Biology 2007. Los polipéptidos FATA y FATBA pertencen de modo muy claro a distintos ciados. El ciado FATB de polipéptidos útil para la realización de los métodos de la invención han sido marcados con un círculo, la flecha señala hacia el polipéptido FATB de Arabidopsis thalianun representado por SEQ ID NO: 93.
La Figura 11 representa el resultado gráfico del algoritmo TMpred de SEQ ID NO: 93. A partir de la predicción del algoritmo utilizando SEQ ID NO: 93, se predice una hélice transmembranal entre el péptido de tránsito (ubicado en el terminal-N del polipéptido) y el dominio de la familia acil-ACP tioesterasa con un número de acceso InterPro IPR002864 (ubicado en el terminal C del polipéptido).
La Figura 12 muestra el vector binario para una expresión incrementada en plantas de Oryza sativa de una secuencia de ácidos nucleicos que codifica un polipéptido FATB bajo el control de un promotor constitutivo del arroz.
La Figura 13 muestra un alineamiento de secuencia múltiple AlignX (de Vector NTI 10.3, Invitrogen Corporation) de los polipéptidos FATB de la Tabla A3. El péptido de tránsito plastídico de N-terminal como se previo mediante TargetP se marcó en un recuadro en SEQ ID NO: 93 (Arath_FATB), y la hélice transmembranal preista (típica de polipéptidos FATB solamente) como se previo mediante TMpred se ha marcado con un recuadro a través de los polipéptidos FATB útiles para la realización de los métodos de la invención. El IPR002864 conservado de la familia acil-ACP tioesterasa se marcó con X bajo la secuencia de consenso. Los tres residuos catalíticos altamente conservados se han marcado con un recuadro a través del alineamiento.
La Figura 14 representa la secuencia de proteína tipo LFY de SEQ ID NO: 146, con el dominio FLO_LFY que se muestra en negrita.
La Figura 15 representa un alineamiento múltiple de secuencia ClustalW 2.0.3 de varias proteínas de tipo LFY. Los asteriscos indican los aminoácidos absolutamente conservados, los dos puntos muestran residuos de aminoácidos altamente conservados y los puntos indican los aminoácidos conservados.
La Figura 16 muestra un árbol filogenético creado a partir del alineamiento de la Figura 15 con el algoritmo unión a vecinos y 1000 repeticiones bootstrap (bootstrap repetitions). Se muestran los valores bootstrap.
La Figura 17 representa el vector binario para una mayor expresión en Oryza sativa de un ácido nucleico que codifica tipo LFY bajo el control del promotor GOS2 (pGOS2) del arroz.
Ejemplos La presente invención se describirá a continuación con referencia a los siguientes ejemplos, que son solamente ilustrativos. Los siguientes ejemplos no pretenden definir completamente o limitar de otro modo el alcance de la invención.
Manipulación de ADN: a menos que se indique de otra manera, las técnicas de ADN recombinante se realizan de acuerdo con protocolos estándar descriptos en (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Coid Spring Harbor Laboratory Press, CSH, New York) o en los Volúmenes 1 y 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Los materiales y métodos estándar para el trabajo molecular en plantas se describen en Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) y Blackwell Scientific Publications (UK).
Ejemplo 1: Identificación de secuencias útiles en la invención 1.1 Glutamina Sintasa (GS1) Las secuencias (cADN de longitud completa, ESTs o genómicas) relacionadas con la secuencia de ácidos nucleicos usada en los métodos de la presente invención fueron identificadas entre aquellas conservadas en la base de datos Entrez Nucleotides en el National Center for Biotechnology Information (NCBI) usando herramientas de búsqueda de secuencias en bases de datos, tales como Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; y Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). El programa se usa para hallar regiones de similitud local entre secuencias comparando secuencias de ácidos nucleicos o secuencias de polipéptidos con bases de datos de secuencias y calculando la significancia estadística de las coincidencias. Por ejemplo, el polipéptido codificado por el ácido nucleico utilizado en la presente invención se usó para el algoritmo TBLASTN, con ajustes por defecto y se activó el filtro para ignorar secuencias de baja complejidad. El resultado del análisis se observó por comparación de a pares y se clasificó de acuerdo con el resultado de probabilidad (valor E), donde el resultado refleja la probabilidad de que ocurra un alineamiento particular al azar (cuanto menor es el valor E, más significativo es el acierto). Además de los valores E, también fueron evaluadas las comparaciones por porcentaje de identidad. El porcentaje de identidad se refiere al número de nucleótidos idénticos (o aminoácidos) entre dos secuencias de ácidos nucleicos (o polipéptidos) comparadas en una longitud particular. En algunos casos, los parámetros por defecto se pueden ajustar para modificar la exactitud de la búsqueda. Por ejemplo, el valor E puede ser aumentado para mostrar coincidencias menos exactas. De esta manera, se pueden identificar coincidencias cortas casi exactas.
La Tabla A1 proporciona una lista de secuencias de ácidos nucleicos relacionadas con la secuencia de ácidos nucleicos usada en los métodos de la presente invención Table A1 : Ejemplos de polipéptido de tipo alga GS1s: Planta fuente SEQ ID NO de ácido nucleico: SEQ ID NO de proteína: Chlamydomonas reinhardtii 133971 1 2 Aureococcus anophagefferens_20700 31 9 Chlamydomonas reinhardtiM 29468 32 10 Chlamydomonas reinhardtiM 36895 33 11 Planta fuente SEQ ID NO de ácido nucleico: SEQ ID NO de proteína: Chlamydomonas reinhardtiM 47468 34 12 Helicosporidum sp.DQ323125 35 13 Thalassiosira pseudonana_26051 36 14 Volvox carterii 103492 37 15 Volvox carterii 77041 38 16 Hordeum vulgare_TA4541 _4513 43 21 Physcomitrella patens 122526 46 24 Physcomitrella patens_146278 47 25 Pinus taeda TA26121 3352 48 26 Pinus taeda TA8958 3352 49 27 Phaedactylum tricornutum_51092 50 28 Hordeum vulgare_7728 53 55 Hordeum vulgare_7958 54 56 En algunos casos, las secuencias relacionadas se ensamblan tentativamente y se revelan públicamente por instituciones de investigación, tales como The Institute for Genomic Research (TIGR). Se utiliza la base de datos Eukaryotic Gene Orthologs (EGO) para identificar dichas secuencias relacionadas, ya sea realizando una búsqueda por palabra clave o utilizando el algoritmo BLAST con la secuencia de ácidos nucleicos o secuencia de polipéptidos de interés. Preferentemente el polipéptido de tipo alga GS1 es de origen de alga (tales como las proteínas ejemplificadas por SEQ ID NO: 2, y SEQ ID NO: 9 a 16). 1.2. Fosfoetanolamina N-metiltransferasa (PEAMT) Las secuencias (cADN de longitud completa, ESTs o genómicas) relacionadas con la secuencia de ácidos nucleicos usada en los métodos de la presente invención fueron identificadas entre aqueNas conservadas en la base de datos Entrez Nucleotides en el National Center for Biotechnology Information (NCBI) usando herramientas de búsqueda de secuencias en bases de datos, tales como Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; y Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). El programa se usa para hallar regiones de similitud local entre secuencias comparando secuencias de ácidos nucleicos o secuencias de polipéptidos con bases de datos de secuencias y calculando la significancia estadística de las coincidencias. Por ejemplo, el polipéptido codificado por el ácido nucleico utilizado en la presente invención se usó para el algoritmo TBLASTN, con ajustes por defecto y se activó el filtro para ignorar secuencias de baja complejidad. El resultado del análisis se observó por comparación de a pares y se clasificó de acuerdo con el resultado de probabilidad (valor E), donde el resultado refleja la probabilidad de que ocurra un alineamiento particular al azar (cuanto menor es el valor E, más significativo es el acierto). Además de los valores E, también fueron evaluadas las comparaciones por porcentaje de identidad. El porcentaje de identidad se refiere al número de nucleótidos idénticos (o aminoácidos) entre dos secuencias de ácidos nucleicos (o polipéptidos) comparadas en una longitud particular. En algunos casos, los parámetros por defecto se pueden ajustar para modificar la exactitud de la búsqueda, for ejemplo puede aumentarse el umbral del valor E para permitir coincidencias menos exactas. De esta manera, se pueden identificar coincidencias cortas casi exactas.
Tabla A2 provee una lista de secuencias de ácidos nucleicos y sus polipéptidos codificados ralacionados a la secuencia de ácidos nucleicos usada en los métodos de la presente invención.
Table A2: Ejemplos de polipéptidos PEAMT: 1.3. Tioesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB) Las secuencias (cADN de longitud completa, ESTs o genómicas) relacionadas con la secuencia de ácidos nucleicos usada en los métodos de la presente invención fueron identificadas entre aquellas conservadas en la base de datos Entrez Nucleotides en el National Center for Biotechnology Information (NCBI) usando herramientas de búsqueda de secuencias en bases de datos, tales como Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; y Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). El programa se usa para hallar regiones de similitud local entre secuencias comparando secuencias de ácidos nucleicos o secuencias de polipéptidos con bases de datos de secuencias y calculando la significancia estadística de las coincidencias. Por ejemplo, el polipéptido codificado por la secuencia de ácidos nucleicos de la presente invención se usó para el algoritmo TBLASTN, con ajustes por defecto y se activó el filtro para ignorar secuencias de baja complejidad. El resultado del análisis se observó por comparación de a pares y se clasificó de acuerdo con el resultado de probabilidad (valor E), donde el resultado refleja la probabilidad de que ocurra un alineamiento particular al azar (cuanto menor es el valor E, más significativo es el acierto). Además de los valores E, también fueron evaluadas las comparaciones por porcentaje de identidad. El porcentaje de identidad se refiere al número de nucleótidos idénticos (o aminoácidos) entre dos secuencias de ácidos nucleicos (o polipéptidos) comparadas en una longitud particular. En algunos casos, los parámetros por defecto se pueden ajusfar para modificar la exactitud de la búsqueda. Por ejemplo, el valor E puede ser aumentado para mostrar coincidencias menos exactas. De esta manera, se pueden identificar coincidencias cortas casi exactas.
Tabla A3 provee una lista de secuencias de ácidos nucleicos ralacionados a la secuencia de ácidos nucleicos usada en los métodos de la presente invención.
Table A3: Ejemplos de secuencias de polipéptidos FATB, y secuencias de ácidos nucleicos codificadoras: Nombre Organismo Fuente Número de SEQ ID NO SEQ ID NO acceso a la base de ácido de de datos pública nucleico: polipéptid o: Arath_FATB Arabidopsis thaliana NM_100724.2 92 93 Aqufo_FATB Aquilegia formosa x TA8354_338618 94 95 Aquilegia pubescens Arahy_FATB Arachis hypogaea EF1 17305.1 96 97 Braju_FATB Brassica júncea DQ856315.1 98 99 Brasy_FATB Brachypodium EF059989 100 101 sylvaticum Citsi_FATB Citrus sinensis TA12334_2711 102 103 Elagu_FATB Elaeis guineensis AF147879 104 105 Garma_FATB Garcinia mangostana U92878 106 107 Glyma_FATB Glycine max BE211486.1 108 109 CX703472.1 Goshi_FATB Gossypium hirsutum AF034266 1 10 1 1 1 Helan_FATB Helianthus annuus AF036565 1 12 1 13 lrite_FATB Iris tectorum AF213480 1 14 1 15 Jatcu_FATB Jatropha curcas EU106891.1 1 16 1 17 Maldo_FATB Madus domestica TA26272_3750 118 1 19 Orysa_FATB Oryza sativa NM_00106331 1 120 121 Picgl_FATB Picea glauca TA16055_3330 122 123 Popto_FATB Populus tomentosa DQ321500.1 124 125 Ricco_FATB Ricinus communis EU000562.1 126 127 Soltu_FATB Solanum tuberosum TA28470_4113 128 129 Tager_FATB Tagetes erecta Proprietary 130 131 Vitvi_FATB Vitis vinifera GSVIVT000168070 132 133 01 (Genoscope) Zeama_FATB Zea mays EE033552.2, 134 135 BQ577487.1 , AW066432.1 Zeama FATB Zea mays DV029251.1 , 136 137 II CF010081.1 Poptr_FATB Populus trichocarpa Poptr_FATB 138 139 En algunos casos, las secuencias relacionadas se ensamblan tentativamente y se revelan públicamente por instituciones de investigación, tales como The Institute for Genomic Research (TIGR). Se utiliza la base de datos Eukaryotic Gene Orthologs (EGO) para identificar dichas secuencias relacionadas, ya sea realizando una búsqueda por palabra clave o utilizando el algoritmo BLAST con la secuencia de ácidos nucleicos o secuencia de polipéptidos de interés. En otras instancias, se han creado bases de datos de ácidos nucleicos especiales para organismos determinados, tal como las creadas por Joint Genome Institute. 1.4. Tipo-Leafv (tipo-LFY) Las secuencias (cADN de longitud completa, ESTs o genómicas) relacionadas con la secuencia de ácidos nucleicos usada en los métodos de la presente invención fueron identificadas entre aquellas conservadas en la base de datos Entrez Nucleotides en el National Center for Biotechnology Information (NCBI) usando herramientas de búsqueda de secuencias en bases de datos, tales como Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403^10; y Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). El programa se usa para hallar regiones de similitud local entre secuencias comparando secuencias de ácidos nucleicos o secuencias de polipéptidos con bases de datos de secuencias y calculando la significancia estadística de las coincidencias. Por ejemplo, el polipéptido codificado por el ácido nucleico utilizado en la presente invención se usó para el algoritmo TBLASTN, con ajustes por defecto y se activó el filtro para ignorar secuencias de baja complejidad. El resultado del análisis se observó por comparación de a pares y se clasificó de acuerdo con el resultado de probabilidad (valor E), donde el resultado refleja la probabilidad de que ocurra un alineamiento particular al azar (cuanto menor es el valor E, más significativo es el acierto). Además de los valores E, también fueron evaluadas las comparaciones por porcentaje de identidad. El porcentaje de identidad se refiere al número de nucleótidos idénticos (o aminoácidos) entre dos secuencias de ácidos nucleicos (o polipéptidos) comparadas en una longitud particular. En algunos casos, los parámetros por defecto se pueden ajustar para modificar la exactitud de la búsqueda. Por ejemplo, el valor E puede ser aumentado para mostrar coincidencias menos exactas. De esta manera, se pueden identificar coincidencias cortas casi exactas.
Tabla A4 provee una lista de secuencias de ácidos nucleicos ralacionados a la secuencia de ácidos nucleicos usada en los métodos de la presente invención.
Table A4: Ejemplos de polipéptidos tipo LFY: Planta fuente SEQ ID NO SEQ ID NO de ácido nucleico: de proteína: Arabidopsis thaliana 145 146 Arabidopsis thaliana 176 151 Brassica júncea 177 152 En algunos casos, las secuencias relacionadas se ensamblan tentativamente y se revelan públicamente por instituciones de investigación, tales como The Institute for Genomic Research (TIGR). Se utiliza la base de datos Eukaryotic Gene Orthologs (EGO) para identificar dichas secuencias relacionadas, ya sea realizando una búsqueda por palabra clave o utilizando el algoritmo BLAST con la secuencia de ácidos nucleicos o secuencia de polipéptidos de interés.
Ejemplo 2: Alineamiento de secuencias útiles en la invención 2.1 Glutamina Sintasa (GS1 ) El alineamiento de secuencias de polipéptidos se efectuó usando el algoritmo de alineamiento progresivo ClustalW 2 (Larkin et al., Bioinformatics 23, 2947-2948, 2007). Los valores predeterminados son para la penalidad por apertura de brecha de 10, para la penalidad por extensión de brecha de 0, 2 y la matriz de peso seleccionada es Gonnet (si los polipéptidos están alineados). Se efectuó una edición manual menor para optimizar adicionalmente el alineamiento. La conservación de secuencias entre polipéptidos GS1 se lleva a cabo esencialmente en toda la secuencia entera y corresponde al hecho de que el dominio Gln-synt_C y el dominio Gln-synt_N abarca la secuencia de proteína completa. Los polipéptidos GS1 s están alineados en la Figura 2.
Se construyó un árbol filogenético de polipéptidos GS1 (Figuras 3A y 3B) a partir de un alineamiento utilizando un gran número de secuencias de proteína glutamina sintasa vegetal (panel a). A partir de este árbol, se puede apreciar claramente que la proteínas Glutamina Sintasa de alga forman un grupo distintivo (el ciado de tipo alga) en comparación con otras proteínas glutamina sintasa de origen vegetal. El Panel b muestra el mismo ciado de tipo alga de proteínas glutamina sintasa pero con un conjunto limitado de proteínas control (outgroup).
Las proteínas que se muestran en el panel a se alinearon utilizando MUSCLE (Edgar (2004), Nucleic Acids Research 32(5): 1792-97). Se calculó un árbol de unión a vecino usando QuickTree (Howe et al. (2002), Bioinformatics 18(1 1): 1546-7). Se indica el soporte de la ramificación principal para 100 repeticiones bootstrap. Se dibujó un filograma circular utilizando Dendroscope (Huson et al. (2007), BMC Bioinformatics 8(1 ):460). El árbol claramente muestra que las proteínas GS1 de alga forman un grupo distintivo. Las secuencias que se muestran en el panel b se alinearon usando ClustalW 2 (matriz de peso de proteína: serie Gonnet, Penalidad por apertura de brecha 10, Penalidad por extensión de brecha 0.2) y un árbol se calculó usando un algoritmo de unión a vecino con 1000 repeticiones bootstrap. Se utilizó un dendroscopio para dibujar el filograma circular. 2.2. Fosfoetanolamina N-metiltransferasa (PEAMT) El alineamiento de secuencia de polipéptidos se llevó a cabo con el algoritmo Clustal W de alineamiento progresivo (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31 :3497-3500). Los valores predeterminados son para la penalidad por apertura de brecha de 10, para la penalidad por extensión de brecha de 0,1 y la matriz de peso seleccionada es Blosum 62 (si los polipéptidos están alineados). La conservación de secuencia entre los polipéptidos PEAMT se encuentra esencialmente en la interrupción (halt) del terminal C de los polipéptidos, en donde el dominio del terminal N usualmente es más variable en la longitud de su secuencia y composición. Los polipéptidos PEAMT se alinean en la Figura 5. Lo residuos de aminoácido en las posiciones marcadas con * o : son altamente conservados en proteínas PEAMT.
Se construyó un árbol filogenético de polipéptidos PEAMT (Figura 6) usando un algoritmo de agrupamiento de unión a vecino como se provee mediante el programa Clustal W. 2.3. Tioesterasa B de proteína portadora de acilo qraso-acilo (ACP) (FATB) El alineamiento de secuencia múltiple de todas las secuencias de polipéptidos FATB en la Tabla A se llevó a cabo utilizando el algoritmo AlignX (del Vector NTI 10.3, Invitrogen Corporation). Los resultados del alineamiento se muestran en la Figura 10 de la presente invención. El péptido de tránsito a plástido N terminal como se previo con TargetP (Ejemplo 5 de la presente) se marcó con un recuadro SEQ ID NO: 93 (Arath_FATB), y la hélice transmembranal prevista (típica solamente de los polipéptidos FATB) tal como se previo con TMpred (Ejemplo 5 de la presente) se marcó con un recuadro a través de los polipéptidos FATB útiles para la realización de los métodos de la inveción. El IPR002864 conservado de la familia acil-ACP tioesterasa se marca mediante una X en la secuencia de consenso. Los tres residuos catalíticos altamente conservados se marcaron con un recuadro a través del alineamiento. 2.4. Tipo-Leafv (tipo LFY) Se llevó a cabo un alineamiento de secuencia de polipéptidos usando ClustalW 2.0.3 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31.3497-3500) con los parámetros predeterminados (alineamiento lento, matriz de similitud: Gonnet, penalidad por apertura de brecha 10, penalidad por extensión de brecha: 0.2). La conservación de secuencia entre los polipéptidos tipo LFY es esencialmente sobre toda la longitud de los polipéptidos, en donde el terminal N y el terminal C usualmente son más variables en composición y longitud de secuencia. Los polipéptidos tipo LFY se alinean en la Figura 15.
Se construyó un árbol filogenético de polipéptidos tipo LFY (Figura 16) utilizando un algoritmo de agrupamiento de unión a vecino como se provee ClustalW 2.0.3, con 1000 repeticiones bootstrap.
Ejemplo 3: Cálculo del porcentaje de identidad global entre secuencias de polipéptidos en la invención 3.1 Glutamina Sintasa (GS1 ) Los porcenajes de similitud e identidad global entre la secuencia de polipéptidos de longitud completa útil en la realización de los métodos de la invención se determinaron usando uno de los métodos disponibles en el arte, el software MatGAT (Matrix Global Alignment Tool) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka). El software MatGAT genera matrices de similitud/identidad para secuencias de ADN o proteínas sin necesidad de prealineamiento de los datos. El programa lleva a cabo una serie de alineamientos de a pares usando el algoritmo de alineamiento global Myers and Miller (con una penalidad por apertura de brecha de 12, y una penalidad por extensión de brecha de 2), calcula similitud e identidad usando por ejemplo Blosum 62 (para polipéptidos), y luego coloca los resultados en una matriz de distancia. La similitud de secuencia se muestra en la mitad inferior de la línea divisoria y se muestra la identidad de secuencia en la mitad superior de la línea divisoria diagonal.
Los parámetros utilizados en la comparación fueron: Matriz de resultados: Blosum62 Primera brecha: 12 Brecha de extensión: 2 Los resultados del análisis de software se muestran en la Tabla B1 para la similitud e identidad global a través de toda la longitud de la secuencia de polipéptidos. El porcentaje de identidad se brinda por encima de la diagonal en negrita y el porcentaje de similitud se da por debajo de la diagonal (letra normal).
El porcentaje de identidad entre las secuencias de polipéptidos GS1 de algas útiles en la realización de los métodos de la invención puede ser tan bajo como 23 % de identidad de aminoácidos en comparación con SEQ ID NO: 2 (C.reinhardtiM 33971 ). Debe tenerse en cuenta que los polipéptidos GS1 de tipo alga de plantas superiores (tales como SEQ ID NO: 21 , 24, 25, 26, 27, y 28) tienen por lo menos 41 % de identidad de secuencia cuando se analiza con MatGAT como se describió con anterioridad.
Tabla B1 : Los porcenajes de similitud e identidad global MatGAT sobre la longitud total de la secuencia de polipéptidos GS1. 3.2. Fosfoetanolamina N-metiltransferasa (PEAMT) Los porcenajes de similitud e identidad global entre la secuencia de polipéptidos de longitud total útil en la realización de los métodos de la invención determinados utilizando uno de los métodos disponibles en el arte, el software MatGAT (Matrix Global Alignment Tool) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka). El software MatGAT genera matrices de similitud/ identidad para secuencias de ADN o proteínas sin necesidad de datos de pre- alineamiento. El programa lleva a cabo una serie de alineamientos de a pares usando el algoritmo de alineamiento global de Myers and Miller (con una penalidad por apertura de brecha de 12, y una penalidad por extensión de brecha de 2), calcula la similitud e identidad usando por ejemplo Blosum 62 (para polipéptidos), y luego coloca los resultados en una matriz de distancia. La similitud de secuencia se muestra en la mitad inferior de la línea divisoria y la identidad de secuencia se muestra en la mitad superior de la línea divisoria diagonal.
Los parámetros utilizados en la comparación fueron: Matriz de resultados: Blosum62 Primera brecha: 12 Brecha de extensión: 2 Los resultados del análisis de software se muestran en la Tabla B2 para la identidad y similitud global en toda la longitud de la secuencia de polipéptidos. El porcentaje de identidad se da debajo de la diagonal en negrita y el porcentaje de similitud se da sobre la diagonal (letras normales).
El porcentaje de identidad entre la secuencia de polipéptidos PEAMT útil en la realización de los métodos de la invención puede ser tan bajo como 60,2 % identidad de aminoácidos en comparación con SEQ ID NO: 58.
Tabla B2: Los porcenajes de similitud e identidad global MatGAT sobre la longitud total of la secuencia de polipéptidos PEAMT. 3.3. Tioesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB) Los porcenajes de similitud e identidad global entre las secuencias de polipéptidos de longitud total útiles en la realización de los métodos de la invención se determinaron usando uno o más métodos disponibles en el arte, el software MatGAT (Matrix Global Alignment Tool) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka). El software MatGAT genera matrices de similitud/ identidad para secuencias de ADN o proteínas sin necesidad de pre-alineamiento de los datos. El programa lleva a cabo una serie de alineamientos de a pares usando el algoritmo de alineamiento global de Myers and Miller (con una penalidad por apertura de brecha de 12, y una penalidad por extensión de brecha de 2), calcula la similitud e identidad usando por ejemplo Blosum 62 (para polipéptidos), y luego coloca los resultados en una matriz de distancia. La similitud de secuencia se muestra en la mitad inferior de la línea divisoria y la identidad de secuencia se muestra en la mitad superior de la línea divisoria diagonal.
Los parámetros utilizados en la comparación fueron: Matriz de resultados: Blosum 62 Primera brecha: 12 Brecha de extensión: 2 Los resultados del análisis de software se muestran en la Tabla B3 para la identidad y similitud global en toda la longitud de la secuencia de polipéptidos (excluding the partial secuencia de polipéptidos).
El porcentaje de identidad entre the full length secuencia de polipéptidos útil en la realización de los métodos de la invención puede ser tan bajo como 53 % identidad de aminoácidos en comparación con SEQ ID NO: 93.
Tabla B3: Los porcenajes de similitud e identidad global MatGAT sobre la longitud total de la secuencia de polipéptidos FATB de la Tabla A3. 3.4. Tipo- leafv (tipo LFY) Los porcenajes de similitud e identidad global entre las secuencias de polipéptidos de longitud total útiles en la realización de los métodos de la Invención se determinaron usando uno o más métodos disponibles en el arte, el software MatGAT (Matrix Global Alignment Tool) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka). El software MatGAT genera matrices de similitud/ identidad para secuencias de ADN o proteínas sin necesidad de datos de pre-alineamiento. El programa lleva a cabo una serie de alineamientos de a pares usando el algoritmo de alineamiento global de Myers and Miller (con una penalidad por apertura de brecha de 12, y una penalidad por extensión de brecha de 2), calcula la similitud e identidad usando por ejemplo Blosum 62 (para polipéptidos), y luego coloca los resultados en una matriz de distancia. La similitud de secuencia se muestra en la mitad inferior de la línea divisoria y la identidad de secuencia se muestra en la mitad superior de la línea divisoria diagonal.
Los parámetros utilizados en la comparación fueron: Matriz de resultados: Blosum 62 Primera brecha: 12 Brecha de extensión: 2 Los resultados del análisis de software se muestran en la Tabla B4 para la identidad y similitud global en toda la longitud de la secuencia de polipéptidos. El porcentaje de identidad se da por encima de la diagonal y el porcentaje de similitud se da por debajo de la diagonal.
El porcentaje de identidad entre la secuencia de polipéptidos tipo LFY útil en la realización de los métodos de la invención puede ser tan bajo como 50 % identidad de aminoácidos en comparación con SEQ ID NO: 146.
Table B4: Los porcenajes de similitud e identidad global MatGAT sobre la longitud total de la secuencia de polipéptidos tipo LFY. 1 2 3 4 5 6 7 8 9 10 11 12 13 Atleafy 99,1 98,8 90,4 90,8 87,8 94,9 85,8 86,0 87,5 79,8 88,8 85.0 Q1PDG5 99,1 99,8 89,5 89,9 86,9 94,0 85,1 85,1 86,6 78,7 87,8 84,1 Q1KLS1 99,1 99,8 89,3 89,6 86,6 93,5 84,8 84,9 86,4 78,7 87,6 83,9 4. Q6XPU8 94,1 93,2 93,2 87,1 83,2 87,8 82,3 87,9 83,9 76,1 84,2 81 ,0 5. Q6XPU7 93,9 93,8 93,8 90,6 88,3 87,9 81 ,8 82,9 83,4 78,1 84,7 86,5 6. Q3ZLS6 90,3 90,2 90,2 86,6 91 ,6 85,8 85,2 86,1 84,2 81 ,0 87,8 89,9 7. Q8LSH1 96,5 95,6 95,1 92,1 91 ,4 88,8 84,8 85,1 84,7 78,7 88,4 84,7 8. Q3L2W7 88,0 88,1 88,1 85,7 86,1 90,1 87,0 83,9 82,7 79,3 90,6 86,2 9. Q3ZLR9 90,8 90,7 90,7 91 ,8 89,2 90,7 88,4 88,9 83,5 78,9 87,2 84,3 10. BOFH_BRAOB 90,6 90,5 90,5 87,3 88,0 88,4 88,4 86,7 89,9 76,1 85,0 80,8 11. Q6XPU5 85,1 84,3 84,3 82,2 84,7 88,3 84,2 85,9 85,0 82,9 82,2 78,9 12. Q3ZK20 91 ,0 9? .0 91 ,0 87,1 89,0 91 ,8 89,8 92,6 90,9 88,7 88,5 90,1 13. Q3ZK15 88,0 87,9 87,9 84,5 89,0 92,1 87,0 88,8 88,7 85,3 87,3 92,7 14. genpept7227884 78,8 79,5 79,3 76,3 76,0 77,4 77,4 76,2 78,4 77,3 76,7 77,2 74,0 15. genpeptl 23096 73,8 74,5 74,3 73,5 74,6 77,4 74,4 76,7 75,9 74,0 77,8 78,4 75,0 16. genpep.7227893 77,8 78,6 78,3 76,1 76,7 77,2 76,3 76,3 78,2 78,6 75,3 78,0 74,3 17. genpept7227894 80,2 81 ,0 80,7 77,2 77,2 77,4 77,2 75,2 77,6 79,1 74,8 77,6 74,5 18. genpept86261940 62,5 61 ,9 61 ,7 62,2 63,8 65,5 61 ,9 62,8 65,4 63,4 65,8 65,2 64,9 19. genpep.86261942 63,2 61 ,9 61 ,7 62,9 64,0 64,0 62,1 64,3 65,1 63,4 65,1 65,7 63,9 20. genpeptl 1935156 63,7 64,0 64,0 63,6 62,8 63,8 62,8 64,5 67,1 64,6 63,3 66,3 62,3 21. genpept2274790 63,9 64,5 64,5 63,6 64,5 65,5 62,1 66,7 67,3 63,1 66,8 64,9 63,6 22. genpept28974117 65,8 66,4 66,4 64,1 65,0 64,3 63,7 64,5 66,3 63,6 64,6 64,9 65,1 23. genpept289741 9 62,5 63,1 63,8 62,2 62,4 65,0 61 ,9 65,5 65,4 62,9 66,2 64,2 63,9 24. genpept27544560 62,9 62,9 62,7 61 ,6 62,9 61 ,6 60,7 61 ,0 61 ,8 63,2 58,8 60,7 60,1 25. genpept7658233 77,6 78,3 78,1 76,8 76,5 77,4 76,0 77,4 79,1 78,3 77,2 77,9 75,7 26. genpept66864715 73,6 74,3 74,0 73,2 74,6 76,7 71 ,9 73,7 76,4 74,2 76,1 75,9 73,8 14 15 16 17 18 19 20 21 22 23 24 25 26 1. Atleafy 65,5 65,0 65,8 67,3 50,3 50,7 51 ,3 51 ,5 51,9 51 ,3 49,5 64,8 65,8 2. Q1 PDG5 66,1 65,6 66,4 67,9 49,8 49,5 51 ,7 52,5 52,4 52,0 49,9 65,4 66,4 3. Q1 KLS1 65,8 65,3 66,2 67,7 49,5 49,3 51 ,7 52,5 52,4 51 ,5 49,7 65,1 66,2 4. Q6XPU8 63,9 63,7 64,0 64,7 50,2 50,1 51 ,4 51 ,2 50,5 51 ,2 49,5 63,9 63,6 5. Q6XPU7 62,8 65,0 64,5 64,3 50,6 50,5 50,8 52,0 50,0 50,2 50,0 63,5 66,7 6. Q3ZLS6 64,5 66,0 66,0 65,0 51 ,8 52,2 51 ,4 52,4 52,6 53,2 49,0 65,4 67,0 7. Q8LSH1 65,8 64,1 64,7 65,7 50,7 51 ,2 50,5 50,8 51,5 50,9 48,6 64,2 64,4 8. Q3LZW7 63,7 64,0 64,5 64,3 50,1 50,4 50,2 52,4 52,0 52,5 49,5 64,8 64,0 9. Q3ZLR9 65,4 64,6 64,6 64,6 51 ,4 51 ,9 51 ,2 52,6 53,4 51 ,8 49,8 65,3 66,2 10. BOFH_BRAOB 64,1 64,1 64,3 64,8 51 ,3 51 ,2 51 ,9 51 ,6 50,9 52,0 49,3 64,1 64,4 11. Q6XPU5 63,1 64,6 64,1 64,3 52,8 52,4 51 ,8 53,1 52,4 53,1 47,6 65,4 65,6 12. Q3ZK20 65,0 65,5 64,5 64,5 51 ,2 51 ,6 50,5 51 ,8 51 ,6 51 ,2 49,5 65,6 65,7 13. Q3ZK15 62,1 63,2 63,2 61 ,7 50,7 50,0 48,2 49,4 50,5 49,5 48,3 63,6 64,4 14. genpept7227884 76,2 89,9 89,3 55,4 55,4 55,0 55,5 55,7 55,2 49,5 89,3 72,6 15. genpeptl 23096 84,7 76,2 76,3 54,5 55,4 55,4 56,0 54,2 56,3 50,2 76,0 73,8 16. genpep.7227893 93,9 84,5 96,4 55,7 56,1 55,1 56,9 54,6 54,7 50,5 89,1 73,2 17. genpept7227894 93,3 83,4 97,6 55,9 55,2 54,1 56,5 54,2 54,4 50,3 88,0 72,4 18. genpept86261940 68,4 66,2 67,1 67,5 96,7 87,3 86,4 80,0 78,7 48,9 56,5 53,4 19. genpept86261942 68,0 66,9 67,6 67,1 98,0 88,1 85,9 ' 79,9 78,2 48,6 55,0 52,9 20. genpeptl 1935156 69,2 67,5 67,8 66,6 91 ,8 92,0 83,1 76,4 74,6 47,1 55,8 52,3 21. genpept2274790 69,2 67,7 68,8 68,0 91 ,3 90,6 88,8 82,5 80,4 50,0 56,8 54,9 22. genpept28974117 69,2 65,4 66,8 66,3 87,0 86,5 85,3 89,6 91 ,2 48,2 55,5 52,5 23. genpept28974119 68,4 68,4 67,6 66,8 85,7 85,7 84,0 87,5 94,4 48,5 55,6 54,2 24. genpept27544560 62,5 63,6 64,0 63,6 58,8 60,3 58,8 61 ,2 58,8 59,2 50,1 50,5 25. genpept7658233 93,9 84,5 93,7 93,3 67,7 67,2 68,4 69,4 68,2 69,2 62,9 73,4 26. genpept66864715 80,1 81 ,8 80,1 79,3 65,6 65,8 65,8 67,9 63,9 67,0 62,5 80,1 Ejemplo 4: Identificación de los dominios comprendidos en las secuencias de polipéptidos útiles en la invención 4.1. Glutamina Sintasa (GS1 ) La base de datos Integrated Resource of Protein Families, Domains and Sites (InterPro) es una interfaz integrada para las bases de datos de firmas usadas comúnmente para búsquedas basadas en texto y secuencias. La base de datos InterPro combina estas bases de datos, que usan diferentes metodologías y diversos grados de información biológica con respecto a proteínas bien caracterizadas para derivar firmas de proteínas. Bases de datos que colaboran incluyen SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom y Pfam, Smart y TIGRFAMs. Pfam es una gran colección de alineamientos de secuencias múltiples y modelos ocultos Markov que cubren muchos dominios y familias de proteínas comunes. Pfam se encuentra en el servidor del Sanger Institute en el Reino Unido. InterPro se encuentra en el European Bioinformatics Institute en el Reino Unido.
Los resultados del escaneo InterPro de las secuencias de polipéptidos representadas por SEQ ID NO: 2 se representan en la Tabla C1.
Table C1 : Los resultados del escaneo InterPro (números de acceso principales) de la secuencia de polipéptidos representada por SEQ ID NO: 2.
Base de Número de acceso Nombre de acceso Coordinadas datos de aminoácidos en SEQ ID NO 2 Base de Número de acceso Nombre de acceso Coordinadas datos de aminoácidos en SEQ ID NO 2 InterPro IPR008146 Glutamine synthetase, catalytic región PRODOM PD001057 Gln_synt_C 153-370 PFAM PF00120 Gln-synt C 132-381 PROSITE PS00181 GLNA ATP 264-280 InterPro IPR008147 Glutamine synthetase, beta-Grasp PFAM PF03951 Gln-synt N 36-116 PROSITE PS00180 GLNA 1 74-91 InterPro IPR014746 NGlutamine synthetase/guanido kinase, catalytic región GENE3D G3DSA:3.30.590.10 no description 135-376 PANTHER PTHR20852 GLUTAMINE SYNTHETASE 42-381 PANTHER PTHR20852:SF14 GLUTAMINE SYNTHETASE 42-381 (GLUTAMATE-AMMONIA LIGASE) (GS) 4.2. Fosfoetanolamina N-metiltransferasa (PEAMT) La base de datos Integrated Resource of Protein Families, Domains and Sites (InterPro) es una interfaz integrada para las bases de datos de firmas usadas comúnmente para búsquedas basadas en texto y secuencias. La base de datos InterPro combina estas bases de datos, que usan diferentes metodologías y diversos grados de información biológica con respecto a proteínas bien caracterizadas para derivar firmas de proteínas. Bases de datos que colaboran incluyen SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom y Pfam, Smart y TIGRFAMs. Pfam es una gran colección de alineamientos de secuencias múltiples y modelos ocultos Markov que cubren muchos dominios y familias de proteínas comunes. Pfam se encuentra en el servidor del Sanger Institute en el Reino Unido. InterPro se encuentra en el European Bioinformatics Institute en el Reino Unido.
Los resultados del escaneo InterPro de las secuencias de polipéptidos representadas por SEQ ID NO: 58 se presentan en la Tabla C2.
Tabla C2: Resultados de escaneo InterPro (números de acceso principales) de la secuencia de polipéptidos representada por SEQ ID NO: 58.
Base de Número de Nombre de acceso SEQ Coordenadas de datos acceso ID aminoácidos en NO: SEQ ID NO 58 Interpro IPR013216 Methyltransferase type 11 86 34-143 Interpro IPR013216 Methyltransferase type 11 87 263-370 Interpro IPR001601 Generic 104-144 methyltransferase Interpro IPR001601 Generic 333-371 methyltransferase Interpro IPR004033 Ub¡E/COQ5 88 239-418 methyltransferase 4.3. Tioesterasa B de proteína portadora de acilo qraso-acilo (ACP) (FATB) La base de datos Integrated Resource of Protein Families, Domains and Sites (InterPro) es una interfaz integrada para las bases de datos de firmas usadas comúnmente para búsquedas basadas en texto y secuencias. La base de datos InterPro combina estas bases de datos, que usan diferentes metodologías y diversos grados de información biológica con respecto a proteínas bien caracterizadas para derivar firmas de proteínas. Bases de datos que colaboran incluyen SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom y Pfam, Smart y TIGRFAMs. InterPro se encuentra en el European Bioinformatics Institute en el Reino Unido.
Los resultados del escaneo InterPro de las secuencias de polipéptidos representadas por SEQ ID NO: 93 se presentan en la Tabla C3.
Table C3: Resultados de escaneo InterPro de la secuencia de polipéptidos representada por SEQ ID NO: 93 InterPro Nombre de base Número de Nombre de acceso a número y de datos acceso de base base de datos nombre de integrada de datos integrda acceso integrada IPR002864 Acyl- Pfam PF01643 Acyl-ACP_TE ACP thioesterase family No IPR G3DSA: CATH G3DSA:3.10.129.10 integrated 3.10.129.10 No IPR SSF54637 Superfamily SSF54637 integrated Thioesterase/thiol ester dehydrase-isomerase 4.4. Tipo Leafv (LFY-like) La base de datos Integrated Resource of Protein Families, Domains and Sites (InterPro) es una interfaz integrada para las bases de datos de firmas usadas comúnmente para búsquedas basadas en texto y secuencias. La base de datos InterPro combina estas bases de datos, que usan diferentes metodologías y diversos grados de información biológica con respecto a proteínas bien caracterizadas para derivar firmas de proteínas. Bases de datos que colaboran incluyen SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom y Pfam, Smart y TlGRFAMs. Pfam es una gran colección de alineamientos de secuencias múltiples y modelos ocultos Markov que cubren muchos dominios y familias de proteínas comunes. Pfam se encuentra en el servidor del Sanger Institute en el Reino Unido. InterPro se encuentra en el European Bioinformatics Institute en el Reino Unido.
Los resultados del escaneo InterPro de las secuencias de polipéptidos representadas por SEQ ID NO: 146 se presentan en la Tabla C4.
Table C4: Resultados de escaneo InterPro (números de acceso principales) de la secuencia de polipéptidos representada por SEQ ID NO: 146.
Ejemplo 5: Predicción de la topología de la secuencia de polipéptidos útil de la invención 5.1. Glutamina Sintasa (GS1) TargetP 1.1 predice la ubicación subcelular de las proteínas eucariotas. La asignación de la ubicación se basa en la presencia predicha de cualquiera de las presecuencias N-terminal: péptido de tránsito a cloroplasto (cTP), péptido de direccionamiento a mitocondria (mTP) o péptido de señal de la vía secretora (SP). Los resultados sobre los cuales se basa la predicción final no son realmente probabilidades, y no agregan necesariamente a una. Sin embargo, la ubicación con el resultado más alto es la más probable de acuerdo con TargetP, y la relación entre los resultados (la clase de confiabilidad) puede ser una indicación de cuán cierta es la predicción. La clase de confiabilidad (RC) oscila entre 1 y 5, en donde 1 indica la predicción más fuerte. TargetP se encuentra en el servidor de la Universidad Técnica de Dinamarca.
Para las secuencias predichas con respecto a que contienen una presecuencia N-terminal, también se puede predecir un sitio de división potencial.
Se analizó SEQ ID NO: 2 con TargetP 1.1. El grupo de organismo "planta" se seleccionó, no se definieron cortes, y se solicitó la longitud prevista del péptido de tránsito. La localización subcelular de la secuencia de polipéptidos representada por SEQ ID NO: 2 puede ser el citoplasma o el núcleo, no se prevee ningún péptido de tránsito (localización prevista: Otro: probabilidad 0,737, clase de confiabilidad 3). Las predicciones de otros organismos generaron resultados similares: Psort: peroxisoma 0.503; citoplasma 0.450 PA-SUB: citoplasma, certeza 100% PTS1 : no dirigido al peroxisoma Se pueden usar muchos otros algoritmos para realizar dichos análisis, incluyendo: • ChloroP 1.1 residente en el servidor de la Universidad Técnica [Technical University] de Dinamarca; Protein Prowler Subcellular Localisation Predictor, versión 1.2 residente en el servidor del Institute for Molecular Bioscience, Universidad de Queensland, Brisbane, Australia; PENCE Proteome Analyst PA-GOSUB 2.5 residente en el servidor de la Universidad de Alberta, Edmonton, Alberta, Canadá; TMHMM, residente en el servidor de la Universidad Tecnológica [Technical University] de Dinamarca.
• PLOC (Park and Kanehisa, Bioinformatics, 9, 1656-1663, 2003). 5.2. Tioesterasa B de proteina portadora de acilo graso-acilo (ACP) (FATB) TargetP 1.1 predice la ubicación subcelular de las proteínas eucariotas. La asignación de la ubicación se basa en la presencia predicha de cualquiera de las presecuencias N-terminal: péptido de tránsito a cloroplasto (cTP), péptido de direccionamiento a mitocondria (mTP) o péptido de señal de la vía secretora (SP). Los resultados sobre los cuales se basa la predicción final no son realmente probabilidades, y no suman necesariamente una. Sin embargo, la ubicación con el resultado más alto es la más probable de acuerdo con TargetP, y la relación entre los resultados (la clase de confiabilidad) puede ser una indicación de cuán cierta es la predicción. La clase de confiabilidad (RC) oscila entre 1 y 5, en donde 1 indica la predicción más fuerte. TargetP se encuentra en el servidor de la Universidad Técnica de Dinamarca.
Para las secuencias predichas con respecto a que contienen una presecuencia N- terminal, también se puede predecir un sitio de clivaje potencial.
Se seleccionaron varios parámetros, tales como grupo de organismo (no planta o planta), conjuntos de corte (ninguno, conjuntos de cortes predefinidos o conjunto de cortes específicos de usuario) y el cálculo de predicción de sitios de división (sí o no). Resultados de la predicción TargetP v1. 1 : Cantidad de secuencias incógnita: 1 Predicciones de sitio de clivaje incluidas.
Utilizando redes PLANT Nombre Longit. cTP mTP SP otro Ubic. RC Lengt TP Secuencia 412 0,957 0,010 0,089 0, 144 C La localización subcelular de la secuencia de polipéptidos como se representa en SEQ ID NO: 93 es el cloroplasto, y la longitud prevista del péptido de tránsito es de 49 aminoácidos que comienzan en el terminal N (no tan confiable como la predicción de la localización subcelular en si misma, puede variar en longitud por unos pocos aminoácidos) Se pueden usar muchos otros algoritmos para realizar dichos análisis, incluyendo: ChloroP 1.1 residente en el servidor de la Universidad Técnica [Technical University] de Dinamarca; Protein Prowler Subcellular Localisation Predictor, versión 1.2 residente en el servidor del Instítute for Molecular Bioscience, Universidad de Queensland, Brisbane, Australia; PENCE Proteome Analyst PA-GOSUB 2.5 residente en el servidor de la Universidad de Alberta, Edmonton, Alberta, Canadá; TMH M, residente en el servidor de la Universidad Tecnológica [Technical University] de Dinamarca.
Un dominio transmembranal usualmente denota una sola alfa hélice de una proteína transmembranal. Se denomina "dominio" debido a que una alfa-hélice en la membrana puede plegarse de forma independiente en el resto de la proteína. Más ampliamente, un dominio transmembranal es cualquier estructura tridimensional de proteína que es estable termodinámicamente en una membrana. Esto puede ser una única alfa hélice, un complejo estable de varias alfa hélices, un tonel-beta (beta barrel) transmembranal, una beta-hélice de gramicidina A, o cualquier otra estructura.
El programa TMpred realiza una predicción de las regiones que se desprenden de la membrana y su orientación. El algoritmo está basado en el análisis estadístico de TMbase, una base de datos de las proteínas natrales transmembranales. La predicción se realiza utilizando una combinación de varias matrices de peso para obtener el resultado (K. Hofmann & W. Stoffel (1993) TMbase - A datábase of membrane spanning proteíns segments. Biol. Chem. Hoppe-Seler 374, 166). TMpred es parte de los servicios de la red European Molecular Biology (EMBnet.ch) y se mantiene en el servidor Swiss Institute of Bioinformatics.
Resultados TMpred (ver Figura 1 1 para un gráfico de los resultados) 5.3 Tipo Leafv ttipo-LFY) TargetP 1.1 predice la ubicación subcelular de las proteínas eucariotas. La asignación de la ubicación se basa en la presencia predicha de cualquiera de las presecuencias N-terminal: péptido de tránsito a cloroplasto (cTP), péptido de direccionamiento a mitocondria (mTP) o péptido de señal de la vía secretora (SP). Los resultados sobre los cuales se basa la predicción final no son realmente probabilidades, y no suman necesariamente una. Sin embargo, la ubicación con el resultado más alto es la más probable de acuerdo con TargetP, y la relación entre los resultados (la clase de confiabilidad) puede ser una indicación de cuán cierta es la predicción. La clase de confiabilidad (RC) oscila entre 1 y 5, en donde 1 indica la predicción más fuerte. TargetP se encuentra en el servidor de la Universidad Técnica de Dinamarca.
Para las secuencias predic as con respecto a que contienen una presecuencia N- terminal, también se puede predecir un sitio de clivaje potencial.
Se seleccionaron varios parámetros, tales como grupo de organismo (no planta o planta), conjuntos de corte (ninguno, conjuntos de cortes predefinidos o conjunto de cortes específicos de usuario) y el cálculo de predicción de sitios de división (sí o no). Los resultados del análisis TargetP 1.1 de la secuencia de polipéptidos como se representa en SEQ ID NO: 146 como se representa e la Tabla D. Se selecciona el grupo de organismos "vegetal", no se definen cortes y se solicita la longitud predicha del péptido de tránsito. La localización subcelular de la secuencia de polipéptidos como se representa en seq id no: 146 puede ser la mitocondria, pese a que la confiabilidad de la predicción es baja.
Tabla D: El análisis TargetP 1.1 de Atleafy como se representa en SEQ ID NO: 146, en donde Lon es la longitud de la proteína, cTP: probabilidad de péptido de tránsito a cloroplasto, mTP: probabilidad de péptido de tránsito a mitocondria, SP: probabilidad de péptido de vía de señal secretora, otro: probabilidad e otra localización subcelular, Ubic.: Ubicación prevista, RC: clase de confiabilidad, TPIen: longitud de péptido de tránsito previsto.
Nombre Long cTP mTP SP otro Ubic. RC TPIen Atleafy 424 0, 181 0,432 0,015 0,404 M 5 61 Se pueden usar muchos otros algoritmos para realizar dichos análisis, incluyendo: ChloroP 1.1 residente en el servidor de la Universidad Técnica [Technical University] de Dinamarca; Protein Prowler Subcellular Localisation Predictor, versión 1.2 residente en el servidor del Institute for Molecular Bioscience, Universidad de Queensland, Brisbane, Australia; PENCE Proteome Analyst PA-GOSUB 2.5 residente en el servidor de la Universidad de Alberta, Edmonton, Alberta, Canadá; TMHMM, residente en el servidor de la Universidad Tecnológica [Technical University] de Dinamarca.
Ejemplo 6: Ensayo relacionado con las secuencias de polipéptido útiles en la invención. 6.1 Glutamina Sintasa (GS1) Ensayo de glutamina sintasa como se comercializa por Sigma-Aldrich (modificado de Kingdon, H. S., Hubbard, J.S., and Stadtman, E.R. (1968) Biochemistry 7, 2136-2142;; Principio: ADP, generada por GS1 al sintetizar glutamina, se utiliza con fósfor (enol)piruvato y piruvato quinasa para generar piruvato y ATP. El piruvato se convirtió mediante deshidrogenasa L-láctica en L-Lactato con oxidación de ß-NADH a ß-NAD. La oxidación de NADH es seguido de forma espectrofotométrica a 340 nm a 37° C con un camino de luz de 1 cm en un tampón con pH 7.1.
Reactivos: A. 100 mM tampón Imidazol HCI, pH 7.1 a 37°C (Preparar 200 mi en agua desionizada utilizando Imidazol, Sigma Prod. No. I-0250. Ajustar a pH 7,1 a 37°C con 1 M HCI.) B. 3 M Solución de Sodio Glutamato (Glu) (Preparar 10 mi en agua desionizada usando Ácido L-Glutámico, Sal de monosodio, Sigma Prod. No. G-1626.) C. 250 mM solución de Adenosin 5'-Trifosfato (ATP) (Prepare 5 mi en agua desionizada usando Adenosin 5 -Trifosfato, Sal de disodio, Sigma Prod. No. A-5394. PREPARAR NUEVO.) D. 33 mM Solución de Fosfo(enol)piruvato (PEP) (Preparar 10 mi en agua desionizada usando Fosfo(enol)piruvato, Sal de Trisodio, Hidrato, Sigma Prod. No. P-7002. PREPARAR NUEVO.) E. 900 mM Solución de Cloruro de Magnesio (MgCI2) (Preparar 10 mi en agua desionizada usando Cloruro de Magnesio, Hexahidrato, Sigma Prod. No. M-0250.) F. 1 M Solución de Cloruro de Potasio (KCI) (Preparar 5 mi en agua desionizada usando Cloruro de Potasio, Sigma Prod. No. P- 504.) G. 1.2 M Solución de Cloruro de Amonio (NH4CI) (Preparar 5 mi en agua desionizada usando Cloruro de Amonio, Sigma Prod. No. A-4514.) H. 12.8 mM Solución de ß-Nicotinamida Adenina Dinucleótido, Forma reducida (ß-NADH) (Disolver los contenidos de un vial de 10 mg de ß-Nicotinamida Adenina Dinucleótido, Forma reducida, Sal de Disodio, Sigma Stock No. 340-110 en el volumen adecuado del Reactivo A. PREPARAR NUEVO.) I. Solución de Enzimas PK/LDH (PK/LDH) (Usar una solución de enzimas PK/LDH en 50% Glicerol, Sigma Prod. No. P-0294; contiene aproximadamente 700 unidades/ml de piruvato quinasa y 1 ,000 unidades/ml de deshidrogenase láctica. Definición Unidad de Deshidrogenasa L- Láctica: Una unidad reducirá 1 ,0 µ???? de piruvato a L-lactato por minuto a pH 7,5 a 37°C. Definición de Unidad de Piruvato Quinasa: Una unidad convertirá 1 ,0 pmol de fosfo(enol)piruvato a piruvato por minuto a pH 7.6 a 37°C.) J. Solución de Enzima Glutamina Sintetasa (Inmediatamente antes de su uso, preparar una solución que contiene 4 - 8 unidades/ml de Glutamina Sintetasa en agua desionizada fría).
Procedimiento: Preparar un cocktail de reacción utilizando una pipeta para colocar (en mililitros) los siguientes reactivos en un recipiente adecuado: Agua desionizada 20,60 Reactivo A (Tampón) 17,20 Reactivo B (Glu) 1 ,80 Reactivo C (ATP) 1 ,80 Reactivo E (MgCI2) 3,55 Reactivo F (KCI) 0,90 Reactivo G (NH4CI) 1 ,80 Mezclar mediante agitado y ajustar a pH 7,1 a 37°C con 0, 1 N HCI o 0,1 N NaOH, de ser necesario.
Colocar con una pipeta (en mililitros) los siguientes reactivos en cubetas adecuadas: Prueba Control Cocktail de Reacción 2,70 2,70 Reactivo D (PEP) 0, 10 0,10 Reactivo H (ß-NADH) 0,06 0,06 Mezclar mediante inversión y equilibrar a 37°C. Monitorear el A340nm hasta que se encuentre constante, utilizando un espectroscómetro termostático adecuado. Luego agregar: Reactivo I (PK/LDH) 0,04 0,04 Mezclar mediante inversión y equilibrar a 37°C. Monitorear el A340nm hasta que se encuentre constante, utilizando un espectroscómetro termostático adecuado. Luego agregar: Agua desionizada 0,10 Reactivo J (Solución de enzimas) 0,10 Mezclar inmediatamente mediante inversión y registrar la disminución en A340nm durante aproximadamente 10 minutos. Obtener el AA340nm/min usando la tasa lineal máxima tanto para la Prueba como para el Control.
Cálculos: (AA340nm/min Prueba - AA340nm/min Control)(3)(15) Unidades/ml enzima = — (6,22)(0,1) 3 = Volumen total (en milímetros) del ensayo 15 = Factor de conversión a 15 minutos (Definición de Unidad) 6,22 = Coeficiente de extinction milimolar de ß-NADH a 340 nm 0,1 = Volumen (en mililitros) de enzima utilizada unidades/ml enzima Unidades/mg sólido = mg sólido/ml enzima unidades /mi enzima Unidades/mg proteína = mg proteína/ml enzima Definición de unidad: Una unidad convertirá 1 ,0 µ?t??? de L-glutamato en L-glutamina en 15 minutos a pH 7,1 a 37°C.
Concentraciones del ensayo final: En una mezcla de reacción de 3,00 mi, las concentraciones finales son 34,1 mM de imidazol, 102 mM de glutamáto de sodio, 8,5 mM adenosin 5'-trifosfato, 1 , 1 mM fosfoenolpiruvato, 60 mM de Cloruro de Magnesio, 18,9 mM de Cloruro de Potasio, 45 mM de Cloruro de Amonio, 0,25 mM de ß-nicotinamida adenina dinucleótido, 28 unidades de piruvato quinasa, 40 unidades de deshidrogenasa L-láctica y 0,4 - 0,8 unidades de glutamina sintetasa. 6.2. Tioesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB) Los polipéptidos útiles en la realización de los métodos de la invención típicamente muestran actividad enzimática de tioesterasa. Existen muchos ensayos para medir tal actividad, por ejemplo, el polipéptido FATB puede expresarse en una cepa de E. coli deficiente en la absorción de ácidos grasos libres del medio. De este modo, cuando un polipéptido FATB se encuentra funcionando en este sistema, el producto de ácidos grasos libres de la reacción de tioesterasa se acumula en el medio. Al medir los ácidos grasos libres en el medio, puede identificarse la actividad enzimática del polipéptido (Mayer & Shaklin (2005) J Biol Chem 280:3621 ). También pueden llevarse a cabo los ensayos de tioesterasa relacionados a la actividad enzimática del polipéptido FATB como se describe en Voelker et al. (1992; Science 257: 72-74).
El experto en el arte se encuentra familiarizado con tales procedimientos experimentales para medir la actividad enzimática de polipéptido, incluso la actividad de un polipéptido FATB como se representa en SEQ ID NO: 93 Ejemplo 7: Clonación de la secuencia de ácidos nucleicos usada en los métodos de la invención Ejemplo 7.1 : Glutamina Sintasa (GS1 ) La secuencia de ácidos nucleicos usada en los métodos de la invención se amplificó por PCR usando como molde una biblioteca de cADN de Chlamydomonas reinhardtii personalizada (en pCMV Sport 6.0; Invitrogen, Paisley, Reino Unido). PCR se llevó a cabo usando ADN polimerasa Hifi Taq en condiciones estándar, usando 200 ng de molde en 50 µ? de una mezcla PCR. Los cebadores utilizados fueron: prm08458 (SEQ ID NO: 7; sentido, codón de inicio en negrita): 5'-ggggacaagtttgtacaaaaaagcaggctt aaacaatggccgcgggatctgtt-3' y prm08459 (SEQ ID NO: 8, inverso, complementario): 5'-ggggaccactttgtacaagaaagctgggtgctgctcctgcgcttacagaa-3', que incluyen los sitios AttB para la recombinación Gateway. El fragmento amplificado por PCR se purificó también usando métodos estándar. Luego, se realizó el primer paso del procedimiento Gateway, la reacción BP, durante el cual el fragmento de PCR se recombina in vivo con el plásmido pDONR201 para producir, de acuerdo con la terminología Gateway, un "clon de entrada", tipo pGS1. El plásmido pDONR201 se obtuvo de Invitrogen, como parte de la tecnología Gateway®.
El clon de entrada que comprende la SEQ ID NO: 1 se usó luego en una reacción LR con un vector de destino usado para la transformación de Oryza sativa. Este vector contenía como elementos funcionales dentro de los bordes de T-ADN: un marcador seleccionare vegetal; un cásete de expresión marcador controlable; y un cásete Gateway destinado a la recombinación de LR in vivo con la secuencia de ácidos nucleicos de interés ya clonada en el clon de entrada. Un promotor clorofilida reductasa (pPCR, SEQ ID NO: 6) para la expresión específica en brote se ubicó corriente ascendente con respecto a este cásete Gateway.
Después del paso de recombinación de LR, el vector de expresión resultante pPCR::GS1 (Figuras 3A y 3B) fue transformado en la cepa LBA4044 de Agrobacterium de acuerdo con métodos bien conocidos en el arte. 7.2. Fosfoetanolamina N-metiltransferasa (PEAMT) La secuencia de ácidos nucleicos usada en los métodos de la invención se amplificó por PCR usando como molde una biblioteca de cADN de plántulas de Arabidopsis thaliana personalizada (en pCMV Sport 6.0; Invitrogen, Paisley, Reino Unido). PCR se llevó a cabo usando ADN polimerasa Hifi Taq en condiciones estándar, usando 200 ng de molde en 50 µ? de una mezcla PCR. Los cebadores utilizados fueron: 5' ggggacaagtttgtacaaaaaagcaggcttaaacaatggagcattctagtgatttg-3'(SEQ ID NO: 83; sentido) y cebador 5'— ggggaccactttgtacaagaaagctgggtcagagtt ttgggataaaaaca-3' (SEQ ID NO: 84, inverso, complementario): que incluyen los sitios AttB para la recombinación Gateway. El fragmento amplificado por PCR se purificó también usando métodos estándar. Luego, se realizó el primer paso del procedimiento Gateway, la reacción BP, durante el cual el fragmento de PCR se recombina in vivo con el plásmido pDONR201 para producir, de acuerdo con la terminología Gateway, un "clon de entrada", pArath_PEAMT_1. El plásmido pDONR201 se obtuvo de Invitrogen, como parte de la tecnología Gateway®. El clon de entrada que comprende la SEQ ID NO: 57 se usó luego en una reacción LR con un vector de destino usado para la transformación de Oryza sativa. Este vector contenía como elementos funcionales dentro de los bordes de T-ADN: un marcador seleccionare vegetal; un cásete de expresión marcador controlable; y un cásete Gateway destinado a la recombinación de LR in vivo con la secuencia de ácidos nucleicos de interés ya clonada en el clon de entrada. Un promotor GOS2 de arroz (SEQ ID NO: 85) para la expresión constitutiva específica se ubicó corriente ascendente con respecto a este cásete Gateway.
Después del paso de recombinación de LR, el vector de expresión resultante pGOS2::Arath_PEAMT_1 (Figura 8) fue transformado en la cepa LBA4044 de Agrobacterium de acuerdo con métodos bien conocidos en el arte. 7.3. Tioesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB) A menos que se indique de otra manera, las técnicas de ADN recombinante se realizan de acuerdo con protocolos estándar descriptos en (Sambrook (2001 ) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) or in Volumes 1 and 2 of Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Los materiales y métodos estándar para el trabajo molecular en plantas se describen en Plant Molecular Biology Labfax (1993) by R.D.D. Croy, published by BIOS Scientific Publications Ltd (UK) and Blackwell Scientific Publications (UK).
Se amplificó la secuencia de ácidos nucleicos de Arabidopsis thaliana que codifica una secuencia FATB de polipéptidos representada por SEQ ID NO: 93 mediante PCR utilizando como molde un banco cADN construido utiliizando ARN de plantas de Arabidopsis a diferentes etapas del desarrollo. Se utilizaron los siguientes cebadores, que incluyen los sitios AttB para la recombinación Gateway, para la amplificación PCR: prm08145: 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggtgg ccacctctgc-3' (SEQ ID NO: 142, sentido) y prm08146: 5'-ggggaccactttgtacaaga aagctgggttttttcttacggtgcagttcc-3' (SEQ ID NO: 143, inverso, complementario). Se llevó a cabo PCR utilizando una polimerasa de ADN Hifi Taq en condiciones estándar. Se amplificó un fragmento PCR de la longitud esperada (incluyendo sitios attB) y también se purificó usando métodos estándar. Luego, se realizó el primer paso del procedimiento Gateway, la reacción BP, durante el cual el fragmento de PCR se recombina in vivo con el plásmido pDONR201 para producir, de acuerdo con la terminología Gateway, un "clon de entrada". El plásmido pDONR201 se obtuvo de Invitrogen, como parte de la tecnología Gateway®.
El clon de entrada que comprende la SEQ ID NO: 92 se usó luego en una reacción LR con un vector de destino usado para la transformación de Oryza sativa. Este vector contenía como elementos funcionales dentro de los bordes de T-ADN: un marcador seleccionare vegetal; un cásete de expresión marcador controlable; y un cásete Gateway destinado a la recombinación de LR in vivo con la secuencia de ácidos nucleicos de interés ya clonada en el clon de entrada. Un promotor GOS2 de arroz (SEQ ID NO: 144) para la expresión constitutiva se ubicó corriente ascendente con respecto a este cásete Gateway.
Después del paso de recombinación de LR, el vector de expresión resultante pGOS2::FATB (Figura 12) fue transformado en la cepa LBA4044 de Agrobacterium de acuerdo con métodos bien conocidos en el arte. 7.4. Tipo Leafv (tipo-LFY) La secuencia de ácidos nucleicos usada en los métodos de la invención se amplificó por PCR usando como molde una biblioteca de cADN de plántulas de Arabidopsis thaliana personalizada (en pC V Sport 6.0; Invitrogen, Paisley, Reino Unido). PCR se llevó a cabo usando ADN polimerasa Hifi Taq en condiciones estándar, usando 200 ng de molde en 50 µ? de una mezcla PCR. Los cebadores utilizados fueron: prm4841 (SEQ ID NO: 147; sentido, codón de inicio en negrita): 5'-ggggacaagtttgtacaaaaaagcaggc ttaaacaatggatcctgaaggtttcac-3' y prm4842 (SEQ ID NO: 148; inverso, complementario): 5'-ggggaccactttgtacaagaaagctgggtaaccaaactagaaacgcaagt -3', que incluyen los sitios AttB para la recombinación Gateway. El fragmento amplificado por PCR se purificó también usando métodos estándar. Luego, se realizó el primer paso del procedimiento Gateway, la reacción BP, durante el cual el fragmento de PCR se recombina in vivo con el plásmido pDONR201 para producir, de acuerdo con la terminología Gateway, un "clon de entrada", tipo-pLFY. El plásmido pDONR201 se obtuvo de Invitrogen, como parte de la tecnología Gateway®.
El clon de entrada que comprende la SEQ ID NO: 145 se usó luego en una reacción LR con un vector de destino usado para la transformación de Oryza sativa. Este vector contenía como elementos funcionales dentro de los bordes de T-ADN: un marcador seleccionare vegetal; un cásete de expresión marcador controlable; y un cásete Gateway destinado a la recombinación de LR in vivo con la secuencia de ácidos nucleicos de interés ya clonada en el clon de entrada. Un promotor GOS2 de arroz (SEQ ID NO: 5 para la expresión constitutiva se ubicó corriente ascendente con respecto a este cásete Gateway. En una forma de realización alternativa, se utilizó un promotor específico de brote (PCR, promotor protoclorofilida reductasa, SEQ ID NO: 150).
Después del paso de recombinación de LR, el vector de expresión resultante pGOS2::tipo-LFY (Figura 16) fue transformado en la cepa LBA4044 de Agrobacterium de acuerdo con métodos bien conocidos en el arte.
Ejemplo 8: Transformación de la planta Transformación del arroz El Agrobacterium que contenía el vector de expresión se usó para transformar plantas de Oryza sativa. Se quitaron las cáscaras de las semillas secas maduras del cultivar de arroz japonés Nipponbare. Se llevó a cabo la esterilización incubando durante un minuto en 70% de etanol, seguido por 30 minutos en 0,2% de HgCI2, seguido por 6 lavados de 15 minutos con agua destilada estéril. Las semillas estériles se hicieron germinar luego en un medio que contenía 2,4-D (medio de inducción de callos). Después de incubación en la oscuridad durante cuatro semanas, se extrajeron callos derivados del escutelo, embriogénicos, y se propagaron en el mismo medio. Después de dos semanas, los callos se multiplicaron o propagaron por subcultivo en el mismo medio durante otras 2 semanas. Las piezas de callos embriogénicos fueron subcultivadas en medio fresco 3 días antes del cocultivo (para estimular la actividad de división celular).
La cepa LBA4404 de Agrobacterium que contenía el vector de expresión se usó para el cocultivo. Se inoculó Agrobacterium en un medio AB con los antibióticos apropiados y se cultivó durante 3 días a 28°C. Luego se recogieron las bacterias y se suspendieron en un medio de cocultivo líquido a una densidad (OD60o) de aprox. 1. La suspensión se transfirió luego a una placa de Petri y se sumergieron los callos en la suspensión durante 15 minutos. Los tejidos de los callos luego se secaron en un papel de filtro y se transfirieron a un medio de cocultivo solidificado, y se incubaron durante 3 días en la oscuridad a 25 °C. Los callos cocultivados se cultivaron en un medio que contenía 2,4-D durante 4 semanas en la oscuridad a 28 °C en presencia de un agente de selección. Durante este período, se desarrollaron islas de callos resistentes que crecían rápidamente. Después de transferir este material a un medio de regeneración e incubación a la luz, se liberó el potencial embriogénico y se desarrollaron brotes en las siguientes cuatro a cinco semanas. Se retiraron los brotes de los callos y se incubaron durante 2 a 3 semanas en un medio que contenía auxina desde el cual se transfirieron al suelo. Se cultivaron brotes endurecidos en condiciones de alta humedad y días cortos en un invernadero.
Aproximadamente 35 transformantes de arroz TO independientes fueron generados para una construcción. Los transformantes primarios fueron transferidos de una cámara de cultivo de tejidos a un invernadero. Después de un análisis de PCR cuantitativo para verificar el número de copias del inserto de T-ADN, sólo se conservaron las plantas transgénicas de copia simple que presentan tolerancia al agente de selección para cosechar la semilla T1. Las semillas se cosecharon luego de tres a cinco meses después del transplante. El método dio transformantes de locus simple en una proporción de más de 50 % (Aldemita y Hodges 1996, Chan et al. 1993, Hiei et al. 1994).
Transformación de maíz La transformación de maíz (Zea mays) se realiza con una modificación del método descripto por Ishida et al. (1996) Nature Biotech 14(6): 745-50. La transformación es dependiente del genotipo en el maíz y sólo genotipos específicos pueden ser transformados y regenerados. La línea endogámica A188 (Universidad de Minnesota) o los híbridos con A188 como progenitor son buenas fuentes de material dador para la transformación, pero también se pueden usar exitosamente otros genotipos. Las espigas son cosechadas de la planta de maíz aproximadamente 1 1 días después de la polinización (DAP) cuando la longitud del embrión inmaduro es de aprox. 1 a 1 ,2 mm. Los embriones inmaduros son cocultivados con Agrobacterium tumefaciens que contiene el vector de expresión, y las plantas transgénicas son recuperadas a través de organogénesis. Los embriones extraídos son cultivados en un medio de inducción de callos, luego medio de regeneración de maíz, que contiene el agente de selección (por ejemplo, imidazolinona, pero se pueden usar varios marcadores de selección). Las placas de Petri son incubadas a la luz a 25 °C durante 2-3 semanas, o hasta que se desarrollan brotes. Los brotes verdes son transferidos de cada embrión al medio de enraizamiento de maíz e incubados a 25 °C durante 2-3 semanas, hasta que se desarrollan las raíces. Los brotes con raíces son transplantados a suelo en el invernadero. Las semillas T1 son producidas de plantas que exhiben tolerancia al agente de selección y que contienen una sola copia del inserto de T-ADN.
Transformación de trigo La transformación de trigo se realiza con el método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. El cultivar Bobwhite (disponible de CIMMYT, México) se usa comúnmente en la transformación. Los embriones inmaduros son cocultivados con Agrobacterium tumefaciens que contiene el vector de expresión, y las plantas transgénicas se recuperan a través de organogénesis. Después de la incubación con Agrobacterium, los embriones se cultivan in vitro en medio de inducción de callos, luego medio de regeneración, que contiene el agente de selección (por ejemplo, imidazolinona pero se pueden usar varios marcadores de selección). Las placas de Petri se incuban a la luz a 25 °C durante 2-3 semanas o hasta que se desarrollan brotes. Los brotes verdes son transferidos desde cada embrión al medio de enraizamiento e incubados a 25 °C durante 2-3 semanas, hasta que se desarrollan las raíces. Los brotes con raíces son transplantados a suelo en el invernadero. Las semillas T1 son producidas de plantas que exhiben tolerancia al agente de selección y que contienen una sola copia del inserto de T-ADN.
Transformación de soja La soja es transformada de acuerdo con una modificación del método descrito en la patente U.S. 5.164.310 de Texas A&M. Diversas variedades de soja comercial pueden ser transformadas con este método. El cultivar Jack (disponible de la Illinois Seed foundation) se usa comúnmente para la transformación. Las semillas de soja son esterilizadas para sembrar in vitro. El hipocotilo, la radícula y un cotiledón son extraídos de plántulas de siete días. El epicotilo y el cotiledón restante se cultivan adicionalmente para desarrollar nodulos axilares. Estos nodulos axilares son extraídos e incubados con Agrobacterium tumefaciens que contiene el vector de expresión. Después del tratamiento de cocultivo, los explantes se lavan y se transfieren al medio de selección. Los brotes regenerados son extraídos y colocados en un medio de alargamiento de los brotes. Los brotes no más largos que 1 cm son colocados en medio de enraizamiento hasta que se desarrollan raíces. Los brotes con raíces son transplantados a suelo en el invernadero. Las semillas T1 son producidas de plantas que exhiben tolerancia al agente de selección y que contienen una sola copia del inserto de T-ADN.
Transformación de colza/canola Los pecíolos cotiledonarios e hipocotilos de plántulas de 5-6 días se usan como explantes para el cultivo de tejido y se transforman de acuerdo con Babic et al. (1998, Plant Cell Rep 17: 183-188). El cultivar comercial Westar (Agriculture Canadá) es la variedad estándar usada para la transformación, pero también se pueden usar otras variedades. Las semillas de cañóla son esterilizadas en superficie para sembrar in vitro. Los explantes de pecíolos de cotiledones con el cotiledón unido son extraídos de las plántulas in vitro e inoculados con Agrobacterium (que contiene el vector de expresión) sumergiendo el extremo cortado del explante del pecíolo en la suspensión bacteriana. Los explantes son cultivados luego durante 2 días en medio MSBAP-3 que contiene 3 mg/l BAP, 3 % de sacarosa, 0,7 % de Phytagar a 23 °C, 16 hs de luz. Después de dos días de cocultivo con Agrobactenum, los explantes de pecíolos son transferidos a medio MSBAP-3 que contiene 3 mg/l BAP, cefotaxima, carbenicilina o timentina (300 mg/l) durante 7 días, y luego cultivados en medio MSBAP-3 con cefotaxima, carbenicilina o timentina y agente de selección hasta la regeneración de los brotes. Cuando los brotes tienea 5 - 10 mm de longitud, se cortan y se transfieren a medio de alargamiento de brotes (MSBAP-0.5, que contiene 0,5 mg/l BAP). Los brotes de aprox. 2 cm de longitud son transferidos al medio de enraizamiento (MS0) para la inducción de raíces. Los brotes con raíces son transplantados a suelo en el invernadero. Las semillas T1 son producidas de plantas que exhiben tolerancia al agente de selección y que contienen una sola copia del inserto de T-ADN.
Transformación de alfalfa Se transforma un clon regenerador de alfalfa (Medicago sativa) usando el método de (McKersie et al., 1999 Plant Physiol 119: 839-847). La regeneración y la transformación de alfalfa dependen del genotipo y por lo tanto se requiere una planta regeneradora. Se han descrito métodos para obtener plantas regeneradoras. Por ejemplo, éstas pueden ser seleccionadas del cultivar Rangelander (Agriculture Canadá) o cualquier otra variedad de alfalfa comercial como describieron Brown DCW y A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, la variedad RA3 (Universidad de Wisconsin) ha sido seleccionada para usar en el cultivo de tejidos (Waiker et al., 1978 Am J Bot 65:654-659). Los explantes de pecíolos son cocultivados, durante la noche, con un cultivo de Agrobacterium tumefaciens C58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) o LBA4404 que contiene el vector de expresión. Los explantes son cocultivados durante 3 días en la oscuridad en medio de inducción SH que contiene 288 mg/L de Pro, 53 mg/L de tioprolina, 4,35 g/L de K2S04 y 100 pm de acetosiringinona. Los explantes se lavan en medio Murashige-Skoog de media concentración (Murashige and Skoog, 1962) y se colocan en placas en el mismo medio de inducción SH sin acetosiringinona pero con un agente de selección adecuado y antibiótico adecuado para inhibir el crecimiento de Agrobacterium. Después de varias semanas, los embriones somáticos se transfieren a medio de desarrollo BOÍ2Y que no contiene reguladores del crecimiento, ni antibióticos y 50 g/L de sacarosa. Los embriones somáticos se germinan subsiguientemente en medio Murashige-Skoog de media concentración. Las plántulas con raíces se transplantan a macetas y se cultivan en un invernadero. Las semillas T1 son producidas de plantas que exhiben tolerancia al agente de selección y que contienen una sola copia del inserto de T-ADN.
Transformación de algodón El algodón se transforma utilizando Agrobacterium tumefaciens de acuerdo con el método descrito en US 5.159.135. Las semillas de algodón se esterilizan en su superficie en 3% de solución de hipoclorito de sodio durante 20 minutos y se lavan con agua destilada con 500 pg/ml de cefotaxima. Luego se transfieren las semillas al medio SH con 50pg/ml de benomil para su germinación. Se extraen los hipocotilos de las plántulas que tienen de 4 a 6 días, se los corta en trozos de 0,5 cm y se los coloca en 0,8% de agar. Se utiliza una suspensión de Agrobacterium (aprox. 108 células por mi, diluidas a partir de un cultivo de toda la noche transformado con el gen de interés y marcadores de selección adecuados) para inocular los explantes de hipocotilos. Luego de 3 días a temperatura ambiente y luz, los tejidos se transfieren a un medio sólido (1 ,6 g/l de Gelrite) con sales Murashige and Skoog con vitaminas B5 (Gamborg et al., Exp. Cell Res. 50:151-158 (1968)), 0,1 mg/l de 2,4-D, 0,1 mg/l de 6-furfurilaminopurina y 750 pg/ml de MgCL2, y con 50 a 100 pg/ml de cefotaxima y 400-500 pg/ml de carbenicilina para eliminar las bacterias residuales. Se aislan las líneas celulares individuales luego de dos a tres meses (con subcultivos cada cuatro a seis semanas) y se cultivan adicionalmente en un medio selectivo para la amplificación de tejido (30°C, fotoperíodo de 16 hs). Posteriormente, los tejidos transformados se cultivan adicionalmente en un medio no selectivo durante 2 a 3 meses para que se generen embriones somáticos. Los embriones de aspecto saludable de al menos 4 mm de longitud se transfieren a tubos con un medio SH en vermiculita fina, suplementado con 0,1 mg/l de ácido indol acético, 6 furfurilaminopurina y ácido giberélico. Los embriones se cultivan a 30°C con un fotoperíodo de 16 hs, y los plantines en la etapa de 2 a 3 hojas se transfieren a macetas con vermiculita y nutrientes. Las plantas se vuelven más resistentes y posteriormente se las transfiere al invernadero para su cultivo adicional.
Ejemplo 9: Procedimiento de evaluación fenotípica 9.1 Preparación de la evaluación Se generaron aproximadamente 35 transformantes de arroz T0 independientes. Los transformantes primarios fueron transferidos de una cámara de cultivo de tejidos a un invernadero para el cultivo y la cosecha de la semilla T1. Se retuvieron seis eventos, de los cuales la progenie de T1 segregó 3:1 para la presencia/ausencia del transgen. Para cada uno de estos eventos, se seleccionaron aproximadamente 10 plántulas T1 que contenían el transgen (hetera- y homocigotas) y aproximadamente 10 plántulas T1 que no tenían el transgen (nulicigotas) monitoreando la expresión del marcador visual. Las plantas transgénicas y los nulicigotas correspondientes fueron cultivados lado a lado en posiciones al azar. Las condiciones del invernadero eran de días cortos (12 horas de luz), 28°C a la luz y 22°C en la oscuridad y una humedad relativa de 70%. Las plantas cultivadas en condiciones sin estrés se regaron a intervalos regulares para asegurar que el agua y los nutrientes no fueran limitantes y para satisfacer las necesidades de las plantas para completar su crecimiento y desarrollo.
Se valuaron adicionalmente otros cuatro eventos siguiendo el mismo procedimiento de evaluación que para la generación T2pero con más individuos por evento. Desde la etapa de siembra hasta la etapa de madurez, las plantas se pasaron varias veces a través de una cámara de imágenes digitales. En cada punto de tiempo se tomaron imágenes digitales (2048x1536 pixeles, 16 millones de colores) de cada planta desde por lo menos 6 ángulos diferentes.
Control de sequía Se cultivan plantas de semillas T2 en suelo de macetas en condiciones normales hasta que se aproximan a la etapa de emerger. Luego son transferidas a una sección "seca" en donde no se realiza irrigación. Se insertan sondas de humedad en macetas elegidas al azar para monitorear el contenido de agua del suelo (SWC). Cuando el SWC se encuentra por debajo de ciertos umbrales, las plantas se vuelven a regar automáticamente en forma continua hasta que se alcanza un nivel normal nuevamente. Luego las plantas se transfieren de nuevo a condiciones normales. El resto del cultivo (maduración de la planta, cosecha de las semillas) es igual que para las plantas que no crecen en condiciones de estrés abiótico. Los parámetros de crecimiento y rendimiento se registran como se detalló para el crecimiento en condiciones normales.
Control de eficiencia del uso de nitrógeno Se cultivaron plantas de arroz de semillas T2 en suelo de macetas en condiciones normales excepto por la solución de nutrientes. Las macetas fueron regadas desde el transplante hasta la maduración con una solución de nutrientes específica que contenía un contenido reducido de N nitrógeno (N), usualmente entre 7 y 8 veces menor. El resto del cultivo (maduración de la planta, cosecha de las semillas) fue igual que para las plantas que no crecieron con estrés abiótico. Los parámetros de crecimiento y rendimiento se registran como se detalló para el crecimiento en condiciones normales.
Control de estrés por sal Se cultivan plantas en un sustrato hecho de fibras de coco y argex (proporción 3 a 1). Se usa una solución de nutrientes normal durante las dos primeras semanas luego de transplantar las plántulas al invernadero. Después de las dos primeras semanas, se agregan 25 mM de sal (NaCI) a la solución de nutrientes, hasta que se cultivan las plantas. Luego se miden los parámetros relacionados con las semillas. 9.2 Análisis estadístico: Prueba F Se usó ANOVA (análisis de variantes) de dos factores como un modelo estadístico para la evaluación general de las características fenotípicas de la planta. Se llevó a cabo una prueba F en todos los parámetros medidos de todas las plantas de todos los eventos transformados con el gen de la presente invención. La prueba F se llevó a cabo para controlar un efecto del gen sobre todos los eventos de transformación y para verificar un efecto general del gen, también conocido como efecto global del gen. El umbral de significancia para un efecto global del gen verdadero se fijó a un nivel de probabilidad de 5% para la prueba F. Un valor de prueba F significativo indica un efecto del gen, lo que significa que no es sólo la simple presencia o posición del gen la que causa las diferencias del fenotipo.
Debido a que se llevaron a cabo dos experimentos con eventos que se superponían, se realizó un análisis combinado. Esto es útil para controlar la coherencia de los efectos sobre los dos experimentos y, sí éste es el caso, acumular evidencia de ambos experimentos para aumentar la confianza en la conclusión. El método usado fue un enfoque de modelo mixto que tiene en cuenta la estructura de niveles múltiples de los datos (es decir, experimento - evento - segregantes). Los valores P se obtuvieron comparando la prueba de relación de probabilidad con las distribuciones de chi cuadrado. 9.3 Parámetros medidos Medición de parámetros relacionados con la biomasa Parámetros medidos Medición de parámetros relacionados con la biomasa Desde la etapa de siembra hasta la etapa de madurez, las plantas se pasaron varias veces a través de una cámara de imágenes digitales. En cada punto de tiempo se tomaron imágenes digitales (2048x1536 píxeles, 16 millones de colores) de cada planta desde por lo menos 6 ángulos diferentes.
Se determinó el área aérea de la planta (o biomasa del follaje) contando el número total de píxeles en las imágenes digitales de las partes aéreas de las plantas discriminadas del fondo. Este valor se promedió para las fotos tomadas en el mismo punto de tiempo desde los diferentes ángulos y se convirtió a un valor de superficie física expresado en mm cuadrados por calibración. Los experimentos muestran que el área aérea de la planta medida de este modo se correlaciona con la biomasa de las partes aéreas de la planta. El área aérea es el área medida en el punto de tiempo en el cual la planta había alcanzado su máxima biomasa de follaje. El vigor temprano es el área aérea de la planta (plantín) tres semanas posteriores a la germinación. Se determinó el vigor temprano contando el número total de píxeles de las partes aéreas de la planta discriminado del fondo. Este valor se promedió para las fotos tomadas en el mismo punto de tiempo desde diferentes ángulos y se convirtió en un valor de superficie física expresado en mm cuadrados por calibración. Los resultados relacionados con el vigor temprano descriptos más abajo son para plantas tres semanas posteriores a la germinación.
Medición de parámetros relacionados con la semilla Las panículas primarias maduras fueron cosechadas, contadas, embolsadas, marcadas con códigos de barras y luego secadas durante tres días en un horno a 37°C. Luego las panículas fueron trilladas y todas las semillas fueron recogidas y contadas. Las cáscaras llenas se separaron de las vacías usando un dispositivo de soplado de aire. Las cáscaras vacías fueron descartadas y la fracción restante se contó nuevamente. Las cáscaras llenas se pesaron en una balanza analítica. Se determinó el número de semillas llenas contando el número de cáscaras llenas que permaneció después del paso de separación. Se midió el rendimiento total de semillas pesando todas las cáscaras llenas cosechadas de una planta. Se midió el número total de semillas por planta contando el número de cáscaras cosechadas de una planta. El índice de Cosecha (Hl) en la presente invención se define como la proporción entre el rendimiento total de semilla y el área aérea (mm2), multiplicado por el factor 106. La tasa de llenado de semilla como se define en la presente invención es la proporción (expresada como un porcentaje %) de la cantidad de semillas llenas con respecto a la cantidad total de semilla (o ramillete [floreí ).
Ejemplo 10: Resultados de la evaluación fenotípica de las plantas transgénicas 10.1 Glutamina Sintasa (GS1 ) Se cultivaron plantas de arroz de semillas T2 en tierra para macetas en condiciones normales excepto por la solución de nutrientes. Las macetas se regaron desde el transplante hasta la maduración con una solución de nutrientes específica que tiene un contenido de nitrógeno N reducido (N), usualmente entre 7 a 8 veces menos. El resto del cultivo (maduración de la planta, cosecha de la semilla) fue el mismo que para las plantas no cultivadas en condiciones de estrés abiótico. Los parámetros de crecimiento y rendimiento se registraron como se detalló para el crecimiento en condiciones normales.
Los resultados de la evaluación de plantas de arroz transgénicas que expresaban un ácido nucleico GS1 en condiciones de deficiencia de nutrientes se presentan a continuación en la Tabla E1. Se observó un incremento de más del 5 % para el rendimiento total de semillas, cantidad de semillas llenas, tasa de llenado, cantidad total de semillas, e índice de cosecha. Estos aumentos se confirmaron en un experimento subsiguiente.
Tabla E1: Adicionalmente, se verificó un aumento en la biomasa (2 líneas positivas de 4, aumento general del 13%) y en el vigor temprano (3 líneas positivas de 4, aumento general del 28%). 10.2. Fosfoetanolamina N-metiltransferasa (PEAMT) A continuación de presentan los resultados de la evaluación de las plantas de arroz transgénico que expresan el ácido nucleico Arath_PEAMT_1 en condiciones sin estrés. Se observó un aumento de por lo menos 5 % en el rendimiento total de semillas, tasa de llenado de semilla, cantidad de flores por panículo e índice de cosecha (Tabla E2).
Tabla E2. Resultados de la evaluación fenotípica en condiciones sin estrés.
Las plantas de semillas T2 se cultivaron en tierra para macetas en condiciones normales hasta que alcanzaron la etapa de espigado. Luego se las transfirió a una sección "seca" en donde se detuvo la irrigación. Se insertaron sondas de humedad en macetas seleccionadas al azar para monitorear el contenido de agua en la tierra (SWC). Cuando el SWC cayó por debajo de ciertos umbrales, las plantas fueron regadas nuevamente de forma automática y continua hasta alcanzar otra vez el nivel normal. Luego las plantas se transfirieron nuevamente a condiciones normales. El resto del cultivo (maduración de la planta, cosecha de la semilla) fue igual que para las plantas que no crecieron en condiciones de estrés abiótico. Los parámetros de crecimiento y rendimiento se registraron del mismo modo descrito para las condiciones normales.
A continuación se presentan los resultados de la evaluación de las plantas de arroz transgénico que expresan un ácido nucleico PEAMT en condiciones de estrés por sequía. Se observó un incremento para el total de peso de semilla, cantidad de semillas llenas, tasa de llenado, índice de cosecha y peso de mil granos (Tabla E3). Se observó un incremento de por lo menos 5 % para el área aérea (ÁreaMax; biomasa verde), vigor al momento de emerger (vigor temprano), y de 2,5% para peso de mil granos.
Tabla E3. Resultados de la evaluación fenotípica en un control de sequía. 10.3. Tioesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB) Se presentan a continuación los resultados de la evaluación de las plantas de arroz transgénicas de generación T1 y T2 que expresan la secuencia de ácidos nucleicos que codifica un polipéptido FATB representada por SEQ ID NO: 93, bajo el control del Promotor GOS2 constitutivo, y cultivadas en condiciones de crecimiento normal.
Hubo un aumento significativo en el vigor temprano, en la biomasa aérea, en el total de rendimiento de semilla por planta, en la cantidad total de semillas, en la cantidad de semillas llenas, en la tasa de llenado de semillas, y en el índice de cosecha de las plantas transgénicas en comparación con los correspondientes nulicigotas (controles), como se muestra en la Tabla E4 Tabla E4: Los resultados de la evaluación de las plantas de arroz transgénicas de generación T1 y T2 que expresan la secuencia de ácidos nucleicos que codifica un polipéptido FATB como se representa por SEQ ID NO: 93, bajo el control del promotor GOS2 para la expresión constitutiva. 10.4. Tipo Leafv (tipo-LFY) Las plantas de arroz transgénicas que expresan un ácido nucleico tipo-LFY en condiciones sin estrés mostraron mayor rendimiento de las semillas. Las plantas que expresaron Atleafy bajo control del promotor constitutivo o del promotor específico de brote presentaron un aumento en uno o más de los siguientes parámetros: tasa de llenado, índice de cosecha, peso de mil granos, flores por panículo.

Claims (1)

  1. Un método para mejorar rasgos relacionados con el rendimiento en plantas con respecto a las plantas de control, caracterizado porque comprende modular la expresión en una planta de un ácido nucleico que codifica un polipéptido citoplasmático de glutamina sintasa (GS1 ) tipo alga, en donde dicho polipéptido GS1 tipo alga comprende un dominio Gln-synt_C (acceso a Pfam PF00120) y un dominio Gln-synt_N (acceso a Pfam PF03951 ). Método de acuerdo con la reivindicación 1 , caracterizado porque dicho polipéptido GS1 comprende uno o más de los siguientes motivos: (i) Motivo 1 , SEQ ID NO: 3; (ii) Motivo 2, SEQ ID NO: 4; (iii) Motivo 3, SEQ ID NO: 5, en cuyos motivos se permiten como máximo 2 faltas de coincidencia. Método de acuerdo con la reivindicación 1 ó 2, caracterizado porque dicha expresión modulada se lleva a cabo mediante la introducción y expresión en una planta un ácido nucleico que codifica un polipéptido GS1 tipo alga. Método de acuerdo con cualquiera de las reivindicaciones 1 a 3, caracterizado porque dicho ácido nucleico que codifica un polipéptido GS1 codifica cualquiera de las proteínas enumeradas en la Tabla A o es una porción de dicho ácido nucleico, o un ácido nucleico capaz de hibridarse con dicho ácido nucleico. Método de acuerdo con cualquiera de las reivindicaciones 1 a 4, caracterizado porque dicha secuencia de ácidos nucleicos codifica un ortólogo o parálogo de cualquiera de las proteínas indicadas en la Tabla A. Método de acuerdo con cualquiera de las reivindicaciones 1 a 5, caracterizado porque dichos rasgos mejorados relacionados con el rendimiento comprenden mayor rendimiento, preferentemente mayor biomasa y/o mayor rendimiento de las semillas con respecto a las plantas de control. Método de acuerdo con cualquiera de las reivindicaciones 1 a 6, caracterizado porque dichos rasgos mejorados relacionados con el rendimiento se obtienen en condiciones de deficiencia de nutrientes. Método de acuerdo con cualquiera de las reivindicaciones 3 a 7, caracterizado porque dicho ácido nucleico está ligado operativamente a un promotor específico de brote, preferentemente a un promotor protoclorofillida reductasa, con máxima preferencia a un promotor protoclorofillida reductasa del arroz. Método de acuerdo con cualquiera de las reivindicaciones 1 a 8, caracterizado porque dicho ácido nucleico que codifica un polipéptido GS1 es de origen vegetal, preferentemente de una alga, más preferentemente de la clase de Chlorophyceae, con mayor preferencia de la familia Chlamydomonadaceae, con máxima preferencia de Chlamydomonas reinhardtü. Planta o parte de ésta, incluso semillas, que se pueden obtener por un método de acuerdo con cualquiera de las reivindicaciones 1 a 9, en donde dicha planta o parte de ésta comprende un ácido nucleico recombinante que codifica un polipéptido GS1. Constructo caracterizado porque comprende: (i) ácido nucleico que codifica un polipéptido GS1 como se define en las reivindicaciones 1 ó 2; (ii) una o más secuencias de control capaces de dirigir la expresión de la secuencia de ácidos nucleicos de (i); y opcionalmente (iii) una secuencia de terminación de la transcripción. Constructo de acuerdo con la reivindicación 11 , caracterizado porque una de dichas secuencias de control es un promotor específico de brote, preferentemente un promotor protoclorofillida reductasa, con máxima preferencia un promotor protoclorofillida reductasa del arroz. Uso de un constructo de acuerdo con la reivindicación 11 ó 12, en un método para obtener plantas que tienen mayor rendimiento, en particular mayor biomasa y/o mayor rendimiento de las semillas con respecto a las plantas de control. Planta, parte de la planta o célula vegetal, caracterizada porque ha sido transformada con un constructo de acuerdo con la reivindicación 1 1 ó 12. Método para la producción de una planta transgénica que tiene mayor rendimiento, en particular mayor biomasa y/o mayor rendimiento de las semillas con respecto a las plantas de control, caracterizado porque comprende: introducir y expresar en una planta un ácido nucleico que codifica un polipéptido GS1 como se define en la reivindicación 1 ó 2; y cultivar la célula vegetal en condiciones que promuevan el crecimiento y desarrollo de la planta. Planta transgénica caracterizada porque tiene mayor rendimiento, en particular mayor biomasa y/o mayor rendimiento de las semillas, con respecto a las plantas de control, que resulta de la expresión modulada de un ácido nucleico que codifica un polipéptido GS1 como se define en la reivindicación 1 ó 2, o una célula de planta transgénica derivada de dicha planta transgénica. Planta transgénica de acuerdo con la reivindicación 10, 14 ó 16, o una célula de planta transgénica derivada de ésta, caracterizada porque dicha planta es una planta de cultivo o una planta monocotiledónea o un cereal, tal como arroz, maíz, trigo, cebada, mijo, centeno, triticale, sorgo, triticum dicoccum, espelta, sécale, triticum monococcum, teff, milo y avena. Partes cosechables de una planta de acuerdo con la reivindicación 17, caracterizada porque dichas partes cosechables son preferentemente biomasa de brote y/o semillas. Productos caracterizados porque son derivados de una planta de acuerdo con la reivindicación 17 y/o de partes cosechables de una planta de acuerdo con la reivindicación 18. Uso de un ácido nucleico que codifica un polipéptido GS1 , caracterizado poque es para incrementar el rendimiento, en particular para incrementar el rendimiento de las semillas y/o biomasa de brote en plantas, con respecto a las plantas de control. Un polipéptido aislado caracterizado porque s seleccionado de: (i) una secuencia de aminoácidos representada por SEQ ID NO: 53 ó 54; (ii) una secuencia de aminoácidos que tiene, en orden creciente de preferencia, por lo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia con la secuencia de aminoácidos representada por SEQ ID NO: 53 ó 54, (iii) derivados de cualquiera de las secuencias de aminoácidos indicadas en (i) ó (¡i) anterior. Un ácido nucleico aislado caracterizado porque codifica un polipéptido como se define en la reivindicación 22, o un ácido nucleico que se híbrida con éste. RESUMEN Un método para mejorar varias características de crecimiento de las plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica una GS1 (Glutamina Sintasa 1). También plantas que tienen expresión modulada de una secuencia de ácidos nucleicos que codifica una GS1 , donde dichas plantas tienen características de crecimiento mejoradas con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. Además, un método para mejorar varios rasgos relacionados con el rendimiento de las plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido PEAMT (Fosfoetanolamina N- metiltransférasa). También plantas que tienen expresión modulada de una secuencia de ácidos nucleicos que codifica un PEAMT, donde dichas plantas tienen rasgos mejorados relacionados con el rendimiento con respecto a las correspondientes plantas de tipo silvestre u otras plantas de control. La invención también provee secuencias de ácidos nucleicos que codifican PEAMT desconocidas hasta el momento. Asimismo, un método para incrementar varios rasgos relacionados con el rendimiento de las semillas de plantas mediante el incremento de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un polipéptido tjoesterasa B de proteína portadora de acilo graso-acilo (ACP) (FATB). También plantas que tienen mayor expresión de una secuencia de ácidos nucleicos que codifica un polipéptido FATB, donde dichas plantas tienen rasgos aumentados relacionados con el rendimiento de las semillas con respecto a las plantas de control. La invención también se refiere a secuencias de ácidos nucleicos, constructos de secuencias de ácidos nucleicos, vectores y plantas que contienen dichas secuencias de ácidos nucleicos. Por otra parte, un método para mejorar varias características de crecimiento de las plantas mediante la modulación de la expresión en una planta de una secuencia de ácidos nucleicos que codifica un tipo LFY (tipo LEAFY). La invención también provee constructos que son útiles en los métodos de la invención.
MX2010012720A 2008-06-20 2009-06-10 Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas. MX2010012720A (es)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
EP08158684 2008-06-20
US7468608P 2008-06-23 2008-06-23
US7471208P 2008-06-23 2008-06-23
EP08158760 2008-06-23
US7585008P 2008-06-26 2008-06-26
US7578408P 2008-06-26 2008-06-26
EP08159081 2008-06-26
EP08159085 2008-06-26
PCT/EP2009/057190 WO2009153208A1 (en) 2008-06-20 2009-06-10 Plants having enhanced yield-related traits and a method for making the same

Publications (1)

Publication Number Publication Date
MX2010012720A true MX2010012720A (es) 2010-12-14

Family

ID=41057261

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2010012720A MX2010012720A (es) 2008-06-20 2009-06-10 Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas.

Country Status (10)

Country Link
US (2) US20110099669A1 (es)
EP (2) EP2711424A3 (es)
CN (2) CN103834683A (es)
AR (1) AR072284A1 (es)
AU (1) AU2009259433A1 (es)
BR (1) BRPI0914777A2 (es)
CA (1) CA2724993A1 (es)
DE (1) DE112009001459T5 (es)
MX (1) MX2010012720A (es)
WO (1) WO2009153208A1 (es)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008339968A1 (en) * 2007-12-20 2009-07-02 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same
BR112012018108A2 (pt) 2010-01-22 2015-10-20 Bayer Ip Gmbh combinações acaricidas e/ou inseticidas de ingredientes ativos
US9265252B2 (en) 2011-08-10 2016-02-23 Bayer Intellectual Property Gmbh Active compound combinations comprising specific tetramic acid derivatives
CN104334731A (zh) * 2012-04-02 2015-02-04 巴斯夫植物科学有限公司 具有一种或多种增强的产量相关性状的植物和其生产方法
CN102718853B (zh) * 2012-06-26 2015-04-01 中国农业科学院棉花研究所 陆地棉GhLFY蛋白及其编码基因与应用
BR112015023192A8 (pt) * 2013-03-15 2018-01-02 Solazyme Inc Tioesterases e células para a produção de óleos personalizados
US9783836B2 (en) 2013-03-15 2017-10-10 Terravia Holdings, Inc. Thioesterases and cells for production of tailored oils
ES2772123T3 (es) 2014-07-24 2020-07-07 Corbion Biotech Inc Variantes de tioesterasas y métodos de uso
CN107208103A (zh) 2014-09-18 2017-09-26 泰拉瑞亚控股公司 酰基‑acp硫酯酶及其突变体
CN107949567B (zh) * 2015-04-23 2021-08-13 深圳华大生命科学研究院 三种芋螺毒素肽、其制备方法及应用
CN105695558A (zh) * 2016-03-10 2016-06-22 北京中科唯新生物医学研究所有限公司 一种磷脂酰乙醇胺n-甲基转移酶酶活力检测试剂盒
CN105586385A (zh) * 2016-03-10 2016-05-18 北京中科唯新生物医学研究所有限公司 一种磷脂酰乙醇胺n-甲基转移酶酶活力检测方法
EP3850087A4 (en) * 2018-09-14 2022-08-03 Chuanxin Sun RICE PLANT MATTER RESISTANT TO BIOTIC STRESS
US11223521B2 (en) * 2018-10-10 2022-01-11 Sony Group Corporation Setting up a new television linked with an existing television
CN110714013B (zh) * 2019-09-29 2022-08-16 南京农业大学 大豆E2泛素结合酶基因GmUBC1的应用
US20220403406A1 (en) * 2019-11-01 2022-12-22 Syngenta Crop Protection Ag Weed control methods and related compositions and plants
CN111206035B (zh) * 2020-02-17 2021-12-28 河南科技学院 调节目的植物叶片衰老进程的基因及方法及其在棉花作物上的应用
CN112048488B (zh) * 2020-09-11 2022-05-10 四川农业大学 一种提升高温胁迫下水稻抽穗期结实率的OsPEAMT2基因及其蛋白和应用
CN114107234B (zh) * 2021-11-15 2024-01-26 科稷达隆(北京)生物技术有限公司 具有草铵膦抗性的谷氨酰胺合成酶突变体、重组基因、重组载体及其应用

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
JP2996995B2 (ja) 1988-06-01 2000-01-11 ザ テキサス エイ アンド エム ユニヴァーシティ システム 茎頂による植物の形質転換方法
WO1993022443A1 (en) 1992-04-24 1993-11-11 Sri International In vivo homologous sequence targeting in eukaryotic cells
DE69333937T2 (de) 1992-06-29 2006-08-31 Gene Shears Pty. Ltd. Nukleinsäuren und sie verwendende verfahren zur bekämpfung viraler pathogene
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
JPH08503853A (ja) 1992-11-30 1996-04-30 チューア,ナム−ハイ 植物における組織−及び発生−特異的な発現を付与する発現モチーフ
JPH09505461A (ja) 1993-07-22 1997-06-03 ジーン シェアーズ プロプライアタリー リミティド Dnaウィルスリボザイム
WO1995014098A1 (en) 1993-11-19 1995-05-26 Biotechnology Research And Development Corporation Chimeric regulatory regions and gene cassettes for expression of genes in plants
PT733059E (pt) 1993-12-09 2001-03-30 Univ Jefferson Compostos e metodos para mutacoes dirigidas ao local em celulas eucarioticas
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
AU718082B2 (en) 1995-10-06 2000-04-06 Plant Genetic Systems N.V. Seed shattering
US7390937B2 (en) 1996-02-14 2008-06-24 The Governors Of The University Of Alberta Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof
GB9607517D0 (en) 1996-04-11 1996-06-12 Gene Shears Pty Ltd The use of DNA Sequences
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
GB9720148D0 (en) 1997-09-22 1997-11-26 Innes John Centre Innov Ltd Gene silencing materials and methods
JP5015373B2 (ja) 1998-04-08 2012-08-29 コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガニゼイション 改良表現型を得るための方法及び手段
US6764851B2 (en) 1998-06-26 2004-07-20 Iowa State University Research Foundation, Inc. Materials and methods for the alteration of enzyme and acetyl CoA levels in plants
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
KR100455617B1 (ko) 1999-07-22 2004-11-06 독립행정법인농업생물자원연구소 단자엽 식물의 초신속 형질전환 방법
CA2379498C (en) 1999-08-26 2012-12-18 Basf Plant Science Gmbh Plant gene expression, controlled by constitutive plant v-atpase promoters
US6979732B1 (en) * 2000-03-15 2005-12-27 University Of Florida Polynucleotide compositions encoding S-adenosyl-L-methionine:phosphoethanolamine N-methyltransferase and methods for modulating lipid biosynthesis in plants
CN1164751C (zh) * 2001-07-06 2004-09-01 中国科学院遗传研究所 磷酸乙醇胺n-甲基转移酶基因及其应用
US7235710B2 (en) 2003-01-21 2007-06-26 Cropdesign N.V. Regulatory sequence
EP2180055B1 (en) 2003-02-04 2011-10-19 CropDesign N.V. Rice promoters
WO2004087929A2 (en) * 2003-03-31 2004-10-14 Cropdesign N.V. Plants having improved growth characteristics and a method for making the same
US20060041961A1 (en) * 2004-03-25 2006-02-23 Abad Mark S Genes and uses for pant improvement
EP1818404A3 (en) * 2004-03-25 2008-01-02 Monsanto Technology LLC Genes and uses for plant improvement
EP2599869A3 (en) * 2006-06-15 2013-09-11 CropDesign N.V. Plants having enhanced yield-related traits and a method for making the same
JP2009543561A (ja) 2006-07-14 2009-12-10 コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガニゼイション イネの脂肪酸組成の改変
EP2054516B1 (en) * 2006-08-02 2014-01-08 CropDesign N.V. Plants having improved characteristics and a method for making the same
EP1911847A1 (en) * 2006-10-09 2008-04-16 Genoplante-Valor Improvement of the kernel productivity of maize through the modulation of glutamine synthetase activity

Also Published As

Publication number Publication date
US20110099669A1 (en) 2011-04-28
AU2009259433A1 (en) 2009-12-23
CN103834683A (zh) 2014-06-04
US20140189910A1 (en) 2014-07-03
WO2009153208A1 (en) 2009-12-23
DE112009001459T5 (de) 2011-09-29
CN102066569A (zh) 2011-05-18
AR072284A1 (es) 2010-08-18
EP2711424A3 (en) 2014-05-14
EP2711424A2 (en) 2014-03-26
BRPI0914777A2 (pt) 2015-08-04
EP2297327A1 (en) 2011-03-23
CA2724993A1 (en) 2009-12-23

Similar Documents

Publication Publication Date Title
US20140189910A1 (en) Plants having enhanced yield-related traits and a method for making the same
US20150232874A1 (en) Plants having enhanced yield-related traits and a method for making the same
US20100199380A1 (en) Plants having enhanced yield-related traits and a method for making the same
US20110041210A1 (en) Plants Having Enhanced Yield-Related Traits and a Method for Making the Same
AU2009209600B2 (en) Plants having increased yield-related traits and a method for making the same
MX2011002675A (es) Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas.
CN101855355A (zh) 具有提高的产量相关性状的植物和用于制备该植物的方法
EP2297192A1 (en) Plants having enhanced yield-related traits and a method for making the same by overexpressing a polynucleotide encoding a tfl1-like protein
MX2011000778A (es) Plantas con caracteristicas modificadas de crecimiento y un metodo para obtenerlas.
MX2009001177A (es) Plantas con caracteristicas mejoradas y un metodo para producirlas.
EP2467394A1 (en) Plants having enhanced yield-related traits and a method for making the same
MX2013009749A (es) Plantas que tienen rasgos relacionados con rendimiento mejorado y metodos para producir los mismos.
MX2012015038A (es) Plantas que tienen mejores rasgos relacionados con el redndimiento y un metodo para producirlas.
MX2013000576A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
EP2240009A2 (en) Plants having enhanced yield-related traits and a method for making the same
US8704043B2 (en) Plants having increased yield-related traits and a method for making the same
MX2013005236A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
MX2013008086A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
MX2014006326A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
MX2012009524A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
MX2012010635A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
MX2012009522A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
MX2012009971A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.

Legal Events

Date Code Title Description
FA Abandonment or withdrawal