MX2007011542A - Alteracion del tamano del embrion/endospermo vegetal durante el desarrollo de la semilla. - Google Patents

Alteracion del tamano del embrion/endospermo vegetal durante el desarrollo de la semilla.

Info

Publication number
MX2007011542A
MX2007011542A MX2007011542A MX2007011542A MX2007011542A MX 2007011542 A MX2007011542 A MX 2007011542A MX 2007011542 A MX2007011542 A MX 2007011542A MX 2007011542 A MX2007011542 A MX 2007011542A MX 2007011542 A MX2007011542 A MX 2007011542A
Authority
MX
Mexico
Prior art keywords
seq
plant
acid sequence
embryo
sequence
Prior art date
Application number
MX2007011542A
Other languages
English (en)
Inventor
Hajime Sakai
Nobuhiro Nagasawa
Original Assignee
Du Pont
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Du Pont filed Critical Du Pont
Publication of MX2007011542A publication Critical patent/MX2007011542A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

Se describen los fragmentos de acido nucleico aislado y construcciones recombinantes que comprenden tales fragmentos utiles para alterar el tamano del embrion/endospermo durante el desarrollo de la semilla junto con un metodo para controlar el tamano del embrion/endospermo durante el desarrollo de la semilla en plantas usando tales construcciones recombinantes.

Description

ALTERACIÓN DEL TAMAÑO DEL EMBRION/ENDOSPERMO VEGETAL DURANTE EL DESARROLLO DE LA SEMILLA Campo de la Invención La presente invención está relacionada al campo de reproducción y genética de plantas y, en particular, se relaciona a construcciones recombinantes útiles para alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla . Antecedente de la Invención La elucidación de cómo es regulado genéticamente el tamaño de un embrión en desarrollo es importante porque el volumen final del endospermo como un órgano de almacenamiento de almidón y proteínas es afectado por el tamaño del embrión en cultivos de cereales. Los investigadores han encontrado que los genes implicados en el tamaño del embrión contribuyen a la regulación del desarrollo del endospermo. La investigación de estos genes es importante para la agricultura porque los endospermos de cereal son la dieta en fibra en muchos paises. Los mutantes de arroz, los cuales tienen raices y radiculos diferenciados normalmente y ya sea embriones reducidos o alargados cuando se comparan con el arroz tipo silvestre, fueron identificados a principios de los años noventas en plantas obtenidas a partir del cultivo Taichung 65 que se sometió a mutación con metil-nitrosourea. Las Ref. : 185985 plantas mutantes que exhiben un embrión alargado son designadas mutantes de embrión gigante (ge) mientras que las plantas que exhiben un embrión más pequeño son designadas mutantes de embriones reducidos (re) (Kitano et al. 1993, Plant J. 3:607-610; Hong et al. in 1995, Dev. Genet. 16:298-310) . Los fenotipos de cada uno de los mutantes de embriones reducidos son designados reí , re2 y re3 a pesar de que los genes responsables para estos fenotipos no han sido caracterizados. Una mutación en un locus diferente es responsable para el fenotipo mutante. El análisis fenotipico de las plantas mutantes ge y re llevan a la teoría que el tamaño del embrión puede ser determinado por la interacción entre los genes específicos a embriones y genes específicos a endospermo que regulan el desarrollo del endospermo (Hong et al. (1996) Development 122:2051-2058). El fenotipo del tamaño del embrión reducido de las plantas mutantes re2 está asociado con el alargamiento del tamaño del endospermo sin alterar el tamaño de la semilla total. Este fenotipo es potencialmente útil para mejorar la calidad del cereal por incrementar la cantidad del tejido del endospermo, el cual es rico en almidón y otros nutrientes. Por otra parte, la reducción del tamaño del embrión en la semilla tiene un beneficio potencial para algunos procesos de molienda, en donde los tejidos embriónicos son considerados como desecho, tales como en la producción del etanol. Sumario de la Invención En una primera modalidad, la invención se refiere a un polinucleótido aislado el cual comprende: (a) una secuencia de ácido nucleico la cual codifica un polipéptido implicado en alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla, el polipéptido el cual tiene por lo menos 80% de identidad de secuencia de aminoácidos, en base al método Clustal V de alineación, cuando se compara con una secuencia de aminoácidos seleccionada del grupo el cual consiste de SEQ ID NO:37, 39, 41, 43, 45, 47, 49, 51, y 53; o (b) una secuencia de ácido nucleico indicada en la SEQ ID NO: 25 en donde la secuencia comprende por lo menos una de las siguientes modificaciones: (i) el nucleótido 271 es un residuo T en lugar de una C; (ii) el nucleótido 110 es un residuo T en lugar de una G; o (iii) el nucleótido 75 es eliminado; o (c) una secuencia de ácido nucleico indicada en la SEQ ID NO. 34 en donde (i) los nucleótidos 4473 a 4829 corresponden a un primer exón, y (ii) los nucleótidos 5661 a 6110 corresponden a un segundo exon, y además en donde los nucleótidos de (c) (i) y/o (c) (ii) codifican un polipéptido implicado en alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla, (d) una secuencia de ácido nucleico indicada en la SEQ ID No: 34 ó 72; o (e) el complemento total de (a), (b) , (c) , (d) o SEQ ID NO:34: o (f) todo o parte de una región no codificante o codificante del polinucleótido aislado el cual comprende las secuencias de (a), (b) o SEQ ID NO: 34 para uso en co-supresión o supresión antisentido de secuencias de ácido nucleico endógeno que codifican los polipéptidos implicados en alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla . En una segunda modalidad, la invención se relaciona a una construcción de ADN recombinante la cual comprende el polinucleótido aislado de la invención enlazado operablemente a por lo menos una secuencia regulatoria. En una tercera modalidad, la invención se relaciona a una planta la cual comprende en su genoma la construcción del ADN recombinante de la invención asi como también cualesquiera semillas obtenidas a partir de tal planta y aceite obtenido a partir de tales semillas. También de interés son el tejido vegetal o células vegetales transformados los cuales comprenden la construcción de ADN recombinante de la invención. En una cuarta modalidad, la invención se relaciona a un método para alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla en una planta el cual comprende : (a) transformar las células vegetales o el tejido vegetal con la construcción de ADN recombinante de la invención; (b) regenerar las plantas transgénicas a partir de las células vegetales o tejido vegetal transformados de (a); (c) tamizar las plantas transgénicas de (b) para semillas que tienen un tamaño de embrión/endospermo alterado en base a la comparación del tamaño de embrión/endospermo de semillas obtenidas a partir de las plantas no transformadas. En una quinta modalidad, la invención se relaciona a un método para mapear las variaciones genéticas relacionadas para controlar el tamaño del embrión/endospermo y/o alterar el fenotipo de aceite en plantas el cual que comprende : (a) cruzar dos variedades vegetales; y (b) evaluar las variaciones genéticas con respecto a (i) una secuencia de ácido nucleico seleccionada del grupo el cual consiste de la SEQ ID NO: 25, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 y 72; o (ii) una secuencia de ácido nucleico que codifica un polipéptido seleccionado del grupo el cual consiste de la SEQ ID NO:26, 29, 31, 33, 37, 39, 41, 43, 45, 47, 49, 51 y 53; en las plantas de progenie que resultan del cruce de la etapa (a) en donde la evaluación es hecha usando un método seleccionado del grupo que consiste de análisis RFLP (por sus siglas en inglés) (polimorfismo de longitud del fragmento de restricción) , análisis SNP (polimorfismo de nucleótido sencillo) y análisis a base de PCR. En una sexta modalidad la invención se relaciona a un método de reproducción molecular para controlar el tamaño de embrión/endospermo y/o alterar el fenotipo del aceite en plantas el cual que comprende: (a) cruzar dos variedades vegetales; y (b) evaluar variaciones genéticas con respecto a (i) una secuencia de ácido nucleico seleccionada del grupo que consiste de las SEQ ID N0:25, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 y 72; o (ii) una secuencia de ácido nucleico que codifica un polipéptido seleccionado del grupo el cual consiste de SEQ ID NO: 26, 29, 31, 33, 37, 39, 41, 43, 45, 47, 49, 51 y 53; en plantas de progenie que resultan del cruce de la etapa (a) en donde la evaluación es hecha usando un método seleccionado del grupo que consiste del análisis de RFLP, análisis de SNP y análisis a base de PCR. Breve Descripción de las Figuras La invención puede ser más totalmente entendida a partir de la siguiente descripción detallada y los dibujos anexos y listado de secuencia que forman una parte de esta solicitud. Las Figuras 1A-1D muestran una alineación de las secuencias de nucleótido obtenidas por el tipo silvestre RE2 (SEQ ID NO:25), y mutantes re2-2 (SEQ ID NO: 28), re2-2 (SEQ ID NO: 30), y re2-3 (SEQ ID NO: 32). Los cambios en la secuencia de nucleótidos son indicados por una estrella debajo de la alineación y por un cuadro alrededor de los nucleótidos en esa posición. Los números en el lado izquierdo de la alineación indican la posición del nucleótido. La Figura 2 muestra una alineación de las secuencias de aminoácido obtenidas por polipéptidos a partir de la proteina RE2 del tipo silvestre (SEQ ID NO:26) t proteina mutante re2-l (SEQ ID NO: 29) y proteina mutante re2-2 (SEQ ID NO: 31) . Los cambios en la secuencia de aminoácidos son indicados por una estrella debajo de la alineación y por un cuadro alrededor de los aminoácidos en esa posición. Como se observa en la Figura 2, el alelo mutante re2-l tiene una isoleucina en el aminoácido 93 en lugar de la treonina altamente conservada; alelo mutante re2-2 tiene una fenilalanina en lugar de la cisteina conservada en el aminoácido 37. La eliminación de un nucleótido en la posición 75 en el alelo mutante re2-3 produce un cambio de estructura que resulta en un polipéptido de 127 aminoácidos para la proteina mutante re2-3 (indicada en la SEQ ID NO: 33) es decir muy diferente que una codificada por el gen RE2 del tipo silvestre o genes mutantes re2-l o re2-2. Los números en el lado izquierdo de la alineación indican la posición de aminoácidos . Las Figuras 3A-3C representan la alineación Clustal V obtenida para las secuencias de aminoácidos a partir de la proteina RE2 del tipo silvestre (SEQ ID NO: 26), la proteina O. sativa la cual tiene el No. identificador general de NCBI 18652509 (SEQ ID NO:27), la proteina del dominio 18 LOB A. thaliana la cual tiene el No. Identificador General de NCBI 17227164 (SEQ ID NO:54), y las secuencias de aminoácidos de los polipéptidos codificados por los clones de maiz ceflf .pk001.f4:fis (SEQ ID NO: 37), cpflc . pk006. dl8a : fis (SEQ ID NO: 39), cpilc . pk005. al2fis (SEQ ID NO:41), y crln.pk0028.h3a:fis (SEQ ID NO:43), clon de Euphorbia lagascae clon ee | lc . pk003. blO : fis (SEQ ID NO:45), clon de columbine eavlc.pk003. c9 (SEQ ID NO: 7), clon de guar Ids3c.pk011. jll:fis (SEQ ID NO:49), clon de frijol de soya sdrlf .pk005.d21.f : fis (SEQ ID N0:51) y el clon de trigo wdrlf .pk002. | 10:fis (SEQ ID NO: 53). El programa usa las rayas para maximizar la alineación. Un asterisco (*) debajo de la alineación indica los aminoácidos conservados entre todas las secuencias. El bloque C, un bloque GAS, y motivos conservados de cierre de leucina son mostrados en cuadros. Los números en el lado izquierdo de la alineación indican la posición de la aminoácidos. Listado de secuencias Las siguientes descripciones de secuencias y listados de secuencias anexos a la presente cumplen con las reglas que gobiernan las descripciones de secuencia de nucleótidos y/o aminoácidos en solicitudes de patente como indican en 37 C.F.R. § 1.821-1.825. SEQ ID NO:l es la secuencia de nucleótidos del cebador de oligonucleótido CIO 6-3 usado para amplificar el marcador de CAPS CIO 7.7 para identificar el locus re2. SEQ ID NO: 2 es la secuencia de nucleótidos del cebador de oligonucleótido CIO 6-4 usado para amplificar el marcador de CAPS CIO 7.7 para identificar el locus re2. SEQ ID NO: 3 es la secuencia de nucleótidos del cebador de oligonucleótido CIO 15.9-1 usado para amplificar el marcador de CAPS CIO 15.9 para identificar el locus re2. SEQ ID NO : 4 es la secuencia de nucleótidos del cebador de oligonucleótido CIO 15.9-2 usado para amplificar el marcador de CAPS CIO 15.9 para identificar el locus re2. SEQ ID NO: 5 es la secuencia de nucleótidos del cebador de oligonucleótido C10-7.7 2 HPYIVF usado para amplificar el marcador de CAPS CIO 7.7 Hpy. SEQ ID NO: 6 es la secuencia de nucleótidos del cebador de oligonucleótido C10-7.7 2 HPYIVF usado para amplificar el marcador de CAPS CIO 7.7 Hpy. SEQ ID NO: 7 es la secuencia de nucleótidos del cebador de oligonucleótido 11.5 HpyV usado para amplificar el marcador de CAPS CIO 11.5. SEQ ID NO: 8 es la secuencia de nucleótidos del cebador de oligonucleótido CIO 11.5-9 usado para amplificar el marcador de CAPS CIO 11.5. SEQ ID NO: 9 es la secuencia de nucleótidos del cebador de oligonucleótido CIO 11-5 usado para amplificar el marcador de CAPS CIO 11.0. SEQ ID NO: 10 es la secuencia de nucleótidos del cebador de oligonucleótido 11 HinfR usado para amplificar el marcador de CAPS CÍO 11.0. SEQ ID NO: 11 es la secuencia de nucleótidos del cebador de oligonucleótido 9.6 DralF usado para amplificar el marcador de CAPS CÍO 9.6.
SEQ ID NO: 12 es la secuencia de nucleótidos del cebador de oligonucleótido 9.6 DralR usado para amplificar el marcador de CAPS CIO 9.6. SEQ ID NO: 13 es la secuencia de nucleótidos del cebador de oligonucleótido E08 93KF usado para amplificar el marcador de CAPS E08 93K. SEQ ID NO: 14 es la secuencia de nucleótidos del cebador de oligonucleótido E08 93KF usado para amplificar el marcador de CAPS E08 93K. SEQ ID NO: 15 es la secuencia de nucleótidos del cebador de oligonucleótido E08 46KF usado para amplificar el marcador de CAPS E08 46K. SEQ ID NO: 16 es la secuencia de nucleótidos del cebador de oligonucleótido E08 46KF usado para amplificar el marcador de CAPS E08 46K. SEQ ID NO: 17 es la secuencia de nucleótidos del cebador de oligonucleótido K08 21KF usado para amplificar el marcador de CAPS K08 21K. SEQ ID NO: 18 es la secuencia de nucleótidos del cebador de oligonucleótido K08 21KR usado para amplificar el marcador de CAPS K08 21K. SEQ ID NO: 19 es la secuencia de nucleótidos del cebador de oligonucleótido K08 46KF usado para amplificar el marcador a base de SNP K08 46K. SEQ ID NO: 20 es la secuencia de nucleótidos del cebador de oligonucleótido K08 46KR usado para amplificar el marcador a base de SNP K08 46K. SEQ ID NO: 21 es la secuencia de nucleótidos del cebador de oligonucleótido LOB-82F usado para amplificar el primer exon (exon 1) del gen del tipo silvestre RE2 o gen mutante re2 a partir del ADN genómico. SEQ ID NO: 22 es la secuencia de nucleótidos del cebador de oligonucleótido L0B-R1 usado para amplificar el primer exon (exon 1) del gen del tipo silvestre RE2 o gen mutante re2 a partir del ADN genómico. SEQ ID NO: 23 es la secuencia de nucleótidos del cebador de oligonucleótidos LOB-F2 usado para amplificar el segundo exon (exon 2) del gen del tipo silvestre RE2 o gen mutante re2 a partir del ADN genómico. SEQ ID NO: 24 es la secuencia de nucleótidos del cebador de oligonucleótido LOB-R2 usado para amplificar el segundo exon (exon 2) del gen del tipo silvestre RE2 o gen mutante re2 a partir del ADN genómico. SEQ ID NO: 25 es la secuencia de nucleótidos de la estructura de lectura abierta del gen RE2 de arroz del tipo silvestre identificada en la presente solicitud. SEQ ID NO: 26 es la secuencia de aminoácidos de la proteina RE2 de arroz del tipo silvestre derivada de traducir los nucleótidos 1 a 807 de la SEQ ID NO:25. SEQ ID NO: 27 es la secuencia de aminoácidos de la proteina de arroz de función desconocida encontrada en la base de datos NCBI como la versión AAL77143.1 la cual tiene el No. identificador general de NCBI 18652509. La SEQ ID NO: 28 es la secuencia de nucleótidos obtenida por el gen re2-l del alelo mutante. La SEQ ID NO: 29 es la secuencia de aminoácidos de una proteina de alelo mutante re2-l obtenida por traducir los nucleótidos 1 a 807 de la SEQ ID NO:28. La SEQ ID NO: 29 es la secuencia de aminoácidos de una proteina de alelo mutante re2-l obtenida por traducir los nucleótidos 1 a 807 de la SEQ ID NO:28. La SEQ ID NO: 30 es la secuencia de nucleótidos obtenida por el gen re2-2 del alelo mutante. La SEQ ID NO: 31 es la secuencia de aminoácidos de una proteina de alelo mutante re2-2 obtenida por traducir los nucleótidos 1 a 807 de la SEQ ID NO:30. La SEQ ID NO: 32 es la secuencia de nucleótidos obtenida por el gen re2-3 del alelo mutante. La SEQ ID NO: 33 es la secuencia de aminoácidos de una proteina de alelo mutante re2-3 obtenida por traducir los nucleótidos 1 a 378 de la SEQ ID NO:32. La SEQ ID NO: 34 es la secuencia de nucleótidos del fragmento BamH I de aproximadamente 9 Kb a partir de RE2G4 el cual comprende la región de codificación del gen del tipo silvestre RE2. Los nucleótidos 1 a 4472 son 5' del codon de iniciación ATG, los nucleótidos 4473 a 4829 corresponden al primer exon, los nucleótidos 4830 a 5660 corresponden a un intrón, y los nucleótidos 5661 a 6110 corresponden al segundo exón. Los nucleótidos 6111 a 6113 forman un codon de terminación. La SEQ ID NO: 35 es la secuencia de nucleótidos del vector pML18 usado para subclonar el fragmento BaMH I de aproximadamente 9 Kb de RE2G4 el cual comprende la región de codificación del gen del tipo silvestre RE2 de arroz. La SEQ ID NO: 36 es la secuencia de nucleótidos la cual comprende el inserto de ADNc total en el clon ceflf . pkOOl . f4 : fis que codifica un homólogo de proteina RE2 de maiz putativo. La SEQ ID NO: 37 es la secuencia de aminoácidos deducida de un homólogo de la proteina RE2 de maiz putativo derivado de los nucleótidos 76 a 851 de la SEQ ID NO: 36. La SEQ ID NO: 38 es la secuencia de nucleótidos la cual comprende el inserto de ADNc total en el clon cpflc . pk006. dl8a : fis que codifica un homólogo de proteina RE2 del maiz putativo. La SEQ ID NO: 39 es la secuencia de aminoácidos deducida de un homólogo de proteina RE2 de maiz putativo derivado de los nucleótidos 151 a 804 de la SEQ ID NO: 38. La SEQ ID NO: 40 es la secuencia de nucleótidos la cual comprende el inserto de ADNc total en el clon cpilc . pk005. al2 : fis que codifica un homólogo de proteina RE2 del maiz putativo. La SEQ ID NO: 41 es la secuencia de aminoácidos deducida de un homólogo de proteina RE2 de maiz putativo derivado de los nucleótidos 81 a 854 de la SEQ ID NO: 40. La SEQ ID NO: 42 es la secuencia de nucleótidos la cual comprende el inserto de ADNc total en el clon crin. pk0028. h3a : fis que codifica un homólogo de proteina RE2 del maiz putativo. La SEQ ID NO: 43 es la secuencia de aminoácidos deducida de un homólogo de proteina RE2 de maiz putativo derivado de los nucleótidos 158 a 658 de la SEQ ID NO: 42. La SEQ ID NO: 44 es la secuencia de nucleótidos la cual comprende el inserto de ADNc total en el clon eellc. pk003. blO : fis que codifica un homólogo de proteina RE2 de Euphorbia. La SEQ ID NO: 45 es la secuencia de aminoácidos deducida de un homólogo de proteina RE2 de Euphorbia putativo derivado de los nucleótidos 71 a 823 de la SEQ ID NO: 4. La SEQ ID NO: 46 es la secuencia de nucleótidos la cual comprende una porción del inserto de ADNc en el clon eavlc .pk003. c9 que codifica un fragmento de un homólogo de proteina RE2 de columbine putativo. La SEQ ID NO: 47 es la secuencia de aminoácidos deducida de un fragmento de un homólogo de proteina RE2 de columbine putativo derivado de los nucleótidos 2 a 382 de la SEQ ID NO:46. La SEQ ID NO: 48 es la secuencia de nucleótidos la cual comprende el inserto de ADNc total en el clon lds3c . pkOll . j 11 : fis el cual codifica un homólogo de proteina RE2 de guar putativo. La SEQ ID NO: 49 es la secuencia de aminoácidos deducida de un homólogo de proteina RE2 de guar putativo derivado de los nucleótidos 146 a 898 de la SEQ ID NO: 48. La SEQ ID NO: 50 es la secuencia de nucleótidos la cual comprende el inserto de ADNc total en el clon sdrlf .pk005. d21. f : fis el cual codifica un homólogo de proteina RE2 de frijol de soya putativo. La SEQ ID NO: 51 es la secuencia de aminoácidos deducida de un homólogo de proteina RE2 de frijol de soya putativo derivado de los nucleótidos 971 a 1609 de la SEQ ID NO:50. La SEQ ID NO: 52 es la secuencia de nucleótidos la cual comprende el inserto de ADNc total en el clon wdrlf . pk002.110 : fis el cual codifica un homólogo de proteina RE2 de trigo putativo. La SEQ ID NO: 53 es la secuencia de aminoácidos deducida de un homólogo de proteina RE2 de trigo putativo derivado de los nucleótidos 80 a 640 de la SEQ ID NO: 52. La SEQ ID NO: 54 es la secuencia de aminoácidos de la proteina del dominio 18 de LOB de Arabidopsis thaliana la cual tiene el No. Identificador General de NCBI 17227164. La SEQ ID NO: 55 es la secuencia de aminoácidos de consenso incluida en el bloque C de los homólogos de proteina RE2. La SEQ ID NO: 56 es la secuencia de aminoácidos del motivo en la terminación N del bloque GAS de 49 aminoácidos de los homólogos de proteina RE2. La SEQ ID NO: 57 es la secuencia de aminoácidos del motivo en la terminación C del bloque GAS de 49 aminoácidos de los homólogos de proteina RE2. La SEQ ID NO: 58 es la secuencia de aminoácidos del motivo de cierre Leucina de los homólogos de proteina RE2. La SEQ ID NO: 59 es la secuencia de nucleótidos del cebador de oligonucleótidos Cpi Bbsl F usado para amplificar el gen RE2 de Zea mays genómico. La SEQ ID NO: 60 es la secuencia de nucleótidos del cebador de oligonucleótidos Cpi Bbsl F usado para amplificar el gen RE2 de Zea mays genómico. La SEQ ID NO: 61 es la secuencia de nucleótidos del fragmento genómico el cual codifica un homólogo de proteina RE2 de maiz obtenido por amplificar una biblioteca genómica de maiz con cebadores Cpi Bbsl F y Cpi Bbsl R. Los nucleótidos 79 a 429 corresponden al primer exón, los nucleótidos 430 a 1363 corresponden a un intrón, y los nucleótidos 1364 a 1783 corresponden al segundo exón. La SEQ ID NO: 62 es la secuencia de nucleótidos del cebador de oligonucleótido RE2 pro Bst 2F usado para amplificar una porción de la región 5' del gen 0sRE2. La SEQ ID NO: 63 es la secuencia de nucleótidos del cebador de oligonucleótido RE2 PRO Bst 2F usado para amplificar una porción de la región 5' del gen 0sRE2. La SEQ ID NO: 64 es la secuencia de nucleótidos del plásmido RE2Pro el cual comprende una porción de la región promotora del gen OsRE2. La SEQ ID NO: 65 es la secuencia de nucleótidos del cebador de oligonucleótido RE2 TERM Xbal R usado para amplificar un fragmento de 780 pb de la región terminadora 3' a partir del gen OsRE2. La SEQ ID NO: 66 es la secuencia de nucleótidos del cebador de oligonucleótido RE2 TERM EcoBspml usado para amplificar un fragmento de 780 pb de la región terminadora 3' a partir del gen OsRE2. La SEQ ID NO: 67 es la secuencia de nucleótidos del plásmido RE2TERGEM el cual comprende una porción de la región terminadora del gen 0sRE2. La SEQ ID NO: 68 es la secuencia de nucleótidos del cebador de oligonucleótidos que puede ser usado para identificar los homólogos RE2 a partir de otras especies de plantas.
La SEQ ID NO: 69 es la secuencia de nucleótidos del cebador de oligonucleótidos que puede ser usado para identificar los homólogos RE2 a partir de otras especies. La SEQ ID NO: 70 es la secuencia de nucleótidos del cebador de oligonucleótidos que puede ser usado para identificar los homólogos RE2 a partir de otras especies de plantas . La SEQ ID NO: 71 es la secuencia de nucleótidos de la "sonda del segundo exon RE2" usado para tamizar los ADNC que codifican una proteina de RE2 La SEQ ID NO: 72 es la secuencia de nucleótidos del clon RE2 cDNa Cl, el clon de ADNc más largo identificado el cual codifica una proteina de RE2. El listado de secuencia contiene el código de una letra para caracteres de secuencia de nucleótido y el código de tres letras para aminoácidos como se define en conformidad con los estándares de IUPAC-IUBMB descritos en Nucleic Acids. Res. 13:3021-3030 (1985) y en el Biochemical J. 219 (No. 2) 345-373 (1984) los cuales son incorporados en la presente para referencia. Los símbolos y formatos usados para el nucleótido y los datos de secuencia de aminoácidos y nucleótidos cumplen con las reglas indicadas en 37 C.F.R. § 1.822. Descripción detallada de la invención La descripción de todas las referencias, patentes y solicitudes de patente citadas en la presente son incorporadas en la presente para referencia. Los términos "fragmento de ácido nucleico aislado" y "polinucleótido aislado" son usados intercambiablemente en la presente. Estos términos se refieren a un polímero de ARN o ADN que es de cadena sencilla o doble, opcionalmente que contiene bases de nucleótido no naturales o alteradas. Un fragmento de ácido nucleico aislado en la forma de un polímero de ADN puede estar comprendido de uno o más segmentos de ADNc, ADN genómico o ADN sintético. Los nucleótidos (usualmente encontrados en su forma 5'-monofosfato) son referido por su única letra de designación como sigue: "A" para adenilato o deoxiadenilato (para ARN o ADN, respectivamente) , "C" para citidilato o deoxicitidilato, "G" para guanilato o deoxiguanilato . "U" para uridilato, "T" para deoxitimidilato, "R" para purinas (A o G) , "Y" para pirimidinas (C o T) , "K" para G o T, "H" para A o C o T, "I" para inosina, y "N" para cualquier nucleótido. Se ha reportado que el gen de limite de órgano latera (LOB, por sus siglas en inglés) en Arabidopsis tiene un papel potencial en el desarrollo de órgano lateral. Ver Shuai et al., (2002), Plant Phys. 129, 747-761. Shuai et al. encontró la expresión del gen LOB en la base de los órganos laterales en los brotes y raices de Arabidopsis. De hecho, 23 miembros de la familia del dominio LOB (LBD) de genes son X encontrados para exhibir patrones de expresión en los tejidos de raiz de Arabidopsis. La proteina del dominio 18 de LOB es considerada como que está en el grupo de la clase I de la familia de genes especifico a planta de proteina de dominio de limite de órgano lateral (LOB) . Las proteínas de dominio LOB de la Clase I contienen un bloque C, un bloque GAS, y un motivo de cierre de leucina (Shuai, B. et al., 2002, Plant Phys. 129:747-761). De esta forma, se espera que una proteina RE2 de Oryza sativa y sus homólogos puedan también contener un bloque C, un bloque GAS, y un motivo de cierre de leucina. Las secuencias de consenso de estos motivos son identificados usando una alineación de Clustal V y se indican en la Figura 3. Las Figuras 3A-3C representan la alineación de Clustal V obtenida por las secuencias de aminoácidos a partir de la proteina RE2 del tipo silvestre (SEQ ID NO: 26), la proteina de O. Sativa la cual tiene el No. identificador general de NCBI 18652509 (SEQ ID NO:27), la proteina del dominio 18 LOB de A. thaliana la cual tiene el No. identificador general de NCBI 17227164 (SEQ ID NO:54), y las secuencias de aminoácido de los polipéptidos codificados por los clones de maiz ceflf . pkOOl . f4 : fis (SEQ ID NO:37), cpflc.pk006.dl8a:fis (SEQ ID NO:39), cpilc . pk005. al2 : fis (SEQ ID N0:41), y crin . pk0028. h3a : fis (SEQ ID NO:43), clon eellc. pk003.bl0: fis de Euphorbia lagascae (SEQ ID NO:45), clon eavlc.pk003. c9 (SEQ ID NO:47) de columbine, clon de guar Ids3c.pk011. jll.fis (SEQ ID NO:49), clon de frijol de soya sdrlf.pk005.d21. fifis (SEQ ID NO:51) y el clon de trigo wdrlf .pk002.110:fis (SEQ ID NO:53). El programa usa rayas para maximizar la alineación. Un asterisco (*) debajo de la alineación indica los aminoácidos conservados entre todas las secuencias. El bloque C, un bloque GAS, y motivos conservados de cierre de leucina son mostrados en cuadros. Se ha descubierto en la presente invención que una sola mutación de un gen de arroz que codifica un miembro de una familia de proteina de dominio LOB de la clase I puede llevar a la alteración del tamaño de embrión/endospermo durante el desarrollo de la semilla. El gen asociado con el fenotipo de embrión reducido es nombrado embrión reducido 2 ( RE2) . El silenciamiento o inhibición de este gen llevar a una reducción del tejido embriónico, de esta forma, resultando en un tamaño de embrión más pequeño y un tamaño de endospermo concomitantemente más grande. La reducción del tamaño de embrión resultará en semillas que tienen una cantidad reducida de componentes tales como aceites. Por otra parte, la sobre expresión de este gen puede llevar a un incremento de tejido embriónico, de esta forma, resultando en un tamaño de embrión más grande y un tamaño de endospermo concomitantemente más pequeño.
El término "RE2" italizado y con comillas como se usa en la presente se refiere a un locus genético capaz de expresar una proteina de embrión 2 reducido. Las letras italizadas y minúsculas Ue2" como se usan en la presente se refieren a una forma mutada de RE2. Las itálicas no son usadas cuando se refieren a una proteina o polipéptido codificado por el locus genético. De esta forma, el término en mayúsculas "RE2" como se usa en la presente se refiere a una proteina del tipo silvestre, y "re2" en minúsculas como se usa en la presente se refiere a una proteina mutante. Como se nota anteriormente, el polinucleótido aislado RE2 de arroz es identificado en la presente solicitud usando mapeo de alta fidelidad de ADN obtenido a partir de las plantas mutantes ( re2) del embrión 2 reducido. Estas plantas mutantes producen grano que tiene un fenotipo de embrión pequeño. Los términos "££ de Oryza sa tiva" , OsRE2" y " RE2 de arroz" son usados intercambiablemente en la presente. Estos términos se refieren a un polinucleótido aislado de arroz del tipo silvestre y cuya secuencia se indica en la presente solicitud. El polinucleótido aislado RE2 de arroz es el polinucleótido que, cuando muta, es responsable para un embrión 2 reducido o re2 , el fenotipo como se ejemplifica por Hong et al. (1996, Development 122:2051-2058). El arroz mutante que exhibe el fenotipo re2 tiene un tamaño de embrión reducido y un tamaño de endospermo alargado.
Los términos "subfragmento que es funcionalmente equivalente" y "subfragmento funcionalmente equivalente" son usados intercambiablemente en la presente. Estos términos se refieren a una porción o subsecuencia de un fragmento de ácido nucleico aislado en el cual la capacidad para alterar la expresión de genes o producir un cierto fenotipo es retenido ya sea si codifica o no el fragmento o subfragmento una enzima activa. Por ejemplo, el fragmento o subframento puede ser usado en el diseño de construcciones de ADN recombinantes para producir el fenotipo deseado en una planta transformada. Las construcciones de ADN recombinantes pueden ser diseñadas para uso en co-supresión o antisentido por enlazar un fragmento de ácido nucleico o subfragmento del mismo, ya sea si codifica o no una enzima activa, en la orientación apropiada con relación a una secuencia de promotor vegetal. Los términos "homología", "homólogo", "substancialmente similar" y "substancialmente correspondiente" se usan intercambiablemente en la presente. Se refieren a fragmentos de ácido nucleico en donde los cambios en uno o más bases de nucleótido no afectan la capacidad del fragmento de ácido nucleico para mediar la expresión de genes o producir un cierto fenotipo. Estos términos también se refieren a modificaciones de los fragmentos de ácidos nucleicos de la presente invención tales como eliminación o inserción de uno o más nucleótidos que no alteran substancialmente las propiedades funcionales del fragmento de ácido nucleico resultante con relación al fragmento no modificado, inicial. Es por lo tanto entendido, como aquellos expertos en la técnica lo apreciarán, que la invención comprende más de las secuencias de ejemplo especificas . Un "homólogo" puede ser un segundo gen en el mismo tipo de planta o en un tipo de planta diferente que tiene una secuencia de nucleótido que es funcionalmente idéntico a una secuencia en el primer gen. Se cree que, en general, los homólogos comparten un pasado evolucionarlo común. El término "homólogo de RE2" se refiere a un polinucleótido aislado el cual codifica un polipéptido de dominio LOB de la clase 1 obtenido a partir de las especies vegetales, diferentes al arroz, que funciona en una forma similar a aquella del polinucleótido aislado de RE2 de arroz y que, cuando muta, exhibe un fenotipo de embrión reducido. Los polinucleótidos aislados de maiz, Euphorbia lagascae, columbina, guar, frijol de soya, y trigo descritos en la presente parecen codificar tales polipéptidos, es decir, estos polipéptidos son miembros de una familia de proteina de dominio LOB de la clase I, tienen un movitov similar a C, un motivo similar a GAS, y un motivo similar a cierre de leucina, y son útiles para alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla. Una investigación de bases de datos de GenBank y Du Pont usando la secuencia de genes RE2 de arroz o la secuencia de polipéptido RE2 no cubre un número de polinucleótidos aislados a partir de plantas que parecen ser homólogos. Los homólogos de RE2 parecen comprender aquellos polinucleótidos aislados de plantas, diferentes al arroz, los cuales parecen codificar un polipéptido que comparte secuencia y/o similitud funcional al polipéptido codificado por el polinucleótido aislado de RE2 de arroz. Se cree que tal polinucleótido puede comprender un subgrupo de los polinucleótidos que codifican los polipéptidos de la familia de dominio LOB de la clase I, y que la alteración en la expresión de este polipéptido puede afectar el tamaño de embrión/endospermo. "Identidad de secuencia" o "identidad" en el contexto de secuencias de ácido nucleico o de polipéptido se refiere a las bases de ácido nucleico o residuos de aminoácido en las dos secuencias que son las mismas cuando se alinean para la correspondencia máxima sobre una ventana de comparación especifica. De esta forma, el "porcentaje de identidad de secuencia" se refiere al valor determinado por comparar dos secuencias óptimamente alineadas sobre una ventana de comparación, en donde la porción de la secuencia de polinucleótido en la ventana de comparación puede comprender adiciones o eliminaciones (es decir, espacios) como se compara con la secuencia de referencia (la cual no comprende adiciones o eliminaciones) para alineación óptima de las dos secuencias. El porcentaje es calculado por determinar el número de posiciones en las cuales la base de ácido nucleico idéntica o residuo de aminoácidos idéntica ocurre en ambas secuencias para producir el número de posiciones acopladas, dividiendo el número de las posiciones acopladas por el número total de las posiciones en la ventana de comparación y multiplicando los resultados por 100 para producir el porcentaje de identidad de secuencia. Los ejemplos útiles de las identidades de porcentaje de secuencia incluyen, pero no se limitan a, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% ó 95%, o cualquier porcentaje entero de 55% a 100%. Estas identidades pueden ser determinadas usando cualesquiera programas descritas en la misma. Las alineaciones de secuencia y por ciento de identidad o cálculos de similitud pueden ser determinadas usando una variedad de métodos de comparación diseñados para detectar las secuencias homologas incluyendo, pero no limitado a, el programa Megaling del suite de computación bioinformáticos LASARGENE (DNASTAR Inc., Madison, Wl ) . La alineación múltiple de las secuencias son realizadas usando el método Clustal V de alineación (Higgins, D.G. y Sharp, P.M. (1989) Comput. Appl. Biosci. 5:151-153; Higgins; D.G. et al. (1992) Comput. Appl. Biosci 8:189-191) con los parámetros de default (GAP PENALTY=10, GAP LENGTH PENALTY =10) . Los parámetros de default para alineaciones de modo de par y cálculo de por ciento de identidad de secuencias de proteínas usando el método Clustal son KTUPLE=1, GAP PENALTY=3, WINDOW=5 y DIAGONALS SAVED=5. Está bien entendido por un experto en la técnica que muchos niveles de identidad de secuencia son útiles para identificar los polipéptidos, a partir de otras especies vegetales, en donde tales polipéptidos tienen la misma función o actividad o similares. Ejemplos útiles de por ciento de identidades incluyen pero no se limitan a, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% ó 95%, o cualquier porcentaje entero de 55% a 100%. En efecto, cualquier identidad de aminoácido entero a partir de 50%-100% puede ser útil para describir la presente invención. También, de interés es cualquier complemento total o parcial de este fragmento de nucleótido aislado. Se cree que otra forma de identificar los genes que son homólogos al gen de RE2 de arroz es por tamización por hibridización. Es posible hibridizar el ADNc en 60°C con una sonda derivada del gen RE2 de arroz y lavar en condiciones de astringencia media (5 x SSPE, 0.5% de SDS en 65°C seguido por lx SSPE, 0.5 xSDS en 65°C). Para protocolos de hibridización general, ver Ausubel et al. 1993, "Current Protocols in Molecular Biology" John Wiley & Sons, USA, o Sambrook et al. 1989. Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press. Una sonda apropiada con una secuencia única puede ser extraída, por ejemplo, a partir de la parte del exon 1 del gen RE2. El exon 1 del gen RE2 tiene regiones de identidad de secuencia entre las secuencias de nucleótido de RE2 de maiz y arroz. Los cebadores de oligoncleótido útiles en tamizaciones de hibridización pueden tener las secuencias descritas en la SEQ ID NO: 68, SEQ ID NO: 69, o SEQ ID NO: 70, por ejemplo. Los cebadores de oligonucleótido que tienen las secuencias indicadas en la SEQ ID NO: 68, SEQ ID NO: 69, o SEQ ID NO: 7 tienen las secuencias indicadas como sigue: SEQ ID NO: 68 5 ' -GCATCTTCGCGCCCTACTTCGACTCGG-3 ' SEQ ID NO:69 5'- GCACAAGGTGTTCGGCGCCAGCAACGTGTCCAAGC-3' SEQ ID NO: 70 5 ' -CCGCGACCCCGTCTACGGCTGCGTCGCCCACCTC-3' Los clones de ADN o ADNc genómicos que dan señales significantes pueden ser aislados y su origen cromosomal analizado usando los marcadores CAPS o marcadores a base de SNP similares a aquellos descritos en la presente solicitud. Los fragmentos de ADN los cuales contienen el homólogo de región al gen RE2 de arroz pueden además ser subclonados y secuenciados. Los polipéptidos codificados por estos polinucleótidos deben tener el bloque C, bloque GAS terminación N y terminación C y las secuencias de consenso de cierre Leu descritas en el Ejemplo 6 y como se indica en la SEQ ID NO: 55 a 58. "Gen" se refiere a un fragmento de ácido nucleico que expresa una proteina especifica, la cual incluye secuencias regulatorias que preceden (5 ' -secuencias no codificantes) y que siguen a la secuencia de codificación (3+ secuencias no codificantes) . "Gen nativo" se refiere a un gen como se encuentra en la naturaleza con sus propias secuencias regulatorias. "Construcción de ADN recombinante" se refiere a una combinación de fragmentos de ácido nucleico que no son normalmente encontrados juntos en la naturaleza. Por consiguiente, una construcción de ADN recombinante puede comprender secuencias regulatorias y secuencias de codificación que son derivadas de diferentes fuentes, o secuencias regulatorias y secuencias de codificación derivadas de la misma fuente, pero dispuestas en una forma diferente que la normalmente encontrada en la naturaleza. Un gen "extraño" se refiere a un gen no encontrado normalmente en el organismo huésped, pero que se introduce en el organismo huésped por transferencia de genes. Los genes extraños pueden comprender genes nativos insertados en un organismo no nativo, o construcciones de ADN recombinantes. Un "transgen" es un gen que ha sido introducido en el genoma por un procedimiento de transformación. La "secuencia de codificación" se refiere a una secuencia de ADN que codifica una secuencia de aminoácidos específicos. Las "secuencias regulatorias" se refieren a secuencias de nucleótido ubicadas corriente arriba (5' secuencias no codificantes), dentro o corriente abajo (3' secuencias no codificantes) de una secuencia de codificación, y las cuales influyen e la transcripción, procesamiento o estabilidad de ARN, o traducción de la secuencia de codificación asociada. Las secuencias regulatorias pueden incluir, pero no se limitan a, promotores, secuencias lider de traducción, intrones, y secuencias de reconocimiento de poliadenilación. "Promotor" se refiere a una secuencia de ADN que es capaz de controlar la expresión de una secuencia de codificación o ARN funcional. La secuencia promotora consiste de elementos corriente arriba proximales y distales, los últimos elementos con frecuencia se refieren a incrementadores. Por consiguiente un "incrementador" es una secuencia de ADN la cual puede estimular la actividad del promotor y puede ser un elemento innato del promotor o un elemento heterólogo insertado para incrementar el nivel o especificidad de tejido de un promotor. Las secuencias del promotor pueden también ser ubicadas dentro de las porciones transcritas de genes y/o corriente abajo de las secuencias transcritas. Los promotores pueden ser derivados de diferentes promotores encontrados en la naturaleza, o incluso comprenden segmentos de ADN sintéticos. Es entendido por aquellos expertos en la técnica que diferentes promotores pueden dirigir la expresión de un fragmento de ácido nucleico asilado en diferentes tejidos o tipos celulares, o en diferentes etapas del desarrollo, o en respuesta a diferentes condiciones ambientales. Los promotores los cuales provocan un fragmento de ácido nucleico aislado para ser expresado en la mayoría de los tipos celulares en la mayoría de las veces son comúnmente referidos como "promotores constitutivos". Los promotores nuevos de varios tipos útiles en las plantas celulares están siendo constantemente descubiertos; pueden ser encontrados numerosos ejemplos en la compilación por Okamuro y Goldberg, (1989) Biochemistry of Plants 15:1-82. Se reconoce además que ya que en la mayoría de los casos, los limites exactos de secuencias regulatorias no han sido completamente definidos, los fragmentos de ADN de alguna variación pueden tener actividad de promotor idéntico. Ejemplos específicos de los promotores que pueden ser útiles para expresar los fragmentos de ácido nucleico de la invención incluyen, pero no se limitan a, el promotor de oleosina (publicación del PCt W099/65479) , publicado el 12 de Diciembre de 1999) , el promotor de maiz 27 KD (Ueda et al (1994) Mol. Cell. Biol.. 14:4350-4359), el promotor de ubiquitin (Christensen et al (1992) Plant Mol. Biiol. 18:675-680), el promotor de SAM sintetasa (Publicación del PCT WO00/37662, publicado el 29 de Junio de 2000), el CaMV 35S (Odell et al (1985) Nature 313:810-812), y el promotor descrito en la publicación del PCT WO 02/099063 publicado el 12 de Diciembre de 2002. Un "intrón" es una secuencia de intervención en un gen que no codifica una porción de la secuencia de proteina. De esta forma, tales secuencias son transcritas en el ARN pero son entonces escindidas y no se traducen. El término es usado también para las secuencias de ARN escindidas. Un "exon" es una porción de la secuencia de un gen que es transcrito y se encuentra en el ARN mensajero maduro derivado del gen, pero no es necesariamente una parte de la secuencia que codifica el producto de gen final. La "secuencia lider de traducción" se refiere a una secuencia de ADN ubicada entre la secuencia promotora de un gen y la secuencia de codificación. La secuencia de lider de traducción está presente en la corriente superior del ARNm totalmente procesado de la secuencia de inicio de traducción. La secuencia del lider de traducción puede afectar el procesamiento de la transcripción primaria a ARNm, estabilidad de ARNm o eficiencia de traducción. Ejemplos de secuencias lider de traducción han sido descritos (Turner, R. And Foster, G.D. (1995) Molecular Biotechnology 3:225).
Las "secuencias no codificantes 3'" se refieren a las secuencias de ADN ubicadas corriente abajo de una secuencia de codificación e incluyen secuencias de poliadenilación y otras secuencias que codifican las señales regulatorias capaces de afectar el procesamiento de ARNm o expresión de genes. La señal de poliadenilación está usualmente caracterizada por afectar la adición de tractos de ácido poliadenilico al extremo 3' del precursor de ARNm. El uso de diferentes secuencias no codificantes 3' diferentes es ejemplificado por Ingelbrecht et al. (1989) Plant Cell 1:671-680. La "transcripción de ARN » se refiere al producto el cual resulta de la transcripción catalizada por ARN polimerasa de una secuencia de ADN. Cuando la transcripción de ARN es una copia complementaria perfecta de la secuencia de ADN, es referido como la transcripción primaria o puede ser una secuencia de ARN derivada de procesamiento post transcripcional de la transcripción primaria y es referida como el ARN maduro. El "ARN mensajero" (ARNm) se refiere al ARN que está sin intrones y que puede ser traducido a la proteina por la célula. "ADNc" se refiere a un ADN que es complementario a y sintetizado a partir del templado de ARNm usando la transcriptasa inversa enzimática. El ADNc puede ser de cadena sencilla o convertido en la forma de doble cadena usando el fragmento Klenow de la ADN polimerasa I. ARN "antisentido" se refiere a la transcripción de ARN que incluye el ARNm y puede ser traducido a la proteina dentro de una célula o in vitro. "ARN antisentido" se refiere a una transcripción de ARN que es complementaria a todo o parte de una transcripción primaria objetivo o ARNm y que bloquea la expresión de un fragmento de ácido nucleico aislado objetivo (Patente de los Estados Unidos de Norteamérica NO. 5,107,065). La complementaridad de un ARN antisentido puede ser cualquier parte de la transcripción de gen especifica, es decir, en la secuencia no codificante 5', la secuencia no codificante 3', intrones, o la secuencia de codificación. "ARN funcional" se refiere a ARN antisentido, ARN ribosimal, u otro ARN que puede no ser traducido pero aún tiene un efecto en los procesos celulares. Los términos "complemento" y "complemento inverso" son usados intercambiablemente en la presente con respecto a las transcripciones de ARNm, y son entendidas para definir el ARN antisentido del mensaje. El término "ARN endógeno" se refiere a cualquier ARN el cual es codificado por cualquier secuencia de ácido nucleico presente en el genoma del huésped antes a la transformación con la construcción recombinante de la presente invención, ya sea si se encuentra en forma natural o no se encuentra en forma natural, es decir, introducido por medios recombinantes, mutagénesis, etc. El término "que no se encuentra en forma natural" significa artificial, no consistente con lo que es encontrado normalmente en la naturaleza. El término "enlazado operablemente" se refiere a una asociación de secuencias de ácido nucleico sobre un fragmento de ácido nucleico sencillo de tal forma que la función de uno es regulado por el otro. Por ejemplo, un promotor es enlazado operablemente con una secuencia de codificación cuando es capaz de regular la expresión de aquella secuencia de codificación (es decir, que la secuencia de codificación está bajo el control transcripcional del promotor) . Las secuencias de codificación pueden ser enlazadas operablemente a las secuencias regulatorias en una orientación sentido o antisentido. En otro ejemplo, las regiones de ADN complementarias de la invención pueden ser enlazadas operablemente, ya sea directa o indirectamente, 5' al ARNm objetivo, o 3' al ARNm objetivo, o dentro del ARNm objetivo, o una primera región complementaria es 5' y su complemento es 3' al ARNm objetivo. La tecnología de cosupresión constituye la materia objeto de la Patente de los Estados Unidos de Norteamérica No. 5,231,020, la cual es concedida a Jorgensen et al. el 27 de Julio de 1999. El fenómeno observado por Napoli et al en petunia es referido a "cosupresión" ya que la expresión de tanto el gen endógeno y el transgen introducido son suprimidos (para observaciones ver Vaucheret et al., Plant J. 16:651-659 (1998); y Gura, Nature 404:804-808 (2000)). Las construcciones de cosupresión en plantas previamente ha sido diseñada por enfocar la sobre expresión de una secuencia de ácido nucleico la cual tiene homología a un ARNm endógeno, en la orientación sentido, lo cual resulta en la reducción de todo el ARN el cual tiene homología a la secuencia sobreexpresada (ver Vaucheret et al. (1998) Plant J 16:651-659; y Gura (2000) Nature 404:804-808). La eficiencia total de este fenómeno es baja, y el grado de la reducción de ARN es ampliamente variable. El trabajo reciente ha descrito el uso de estructuras de "hairpina" que incorporan todo o parte, de una secuencia que codifica el ARNm en una orientación complementaria que resulta en una estructura de "circuito de hélice" potencial para el ARN expresado (Publicación del PCT WO 99/53050 publicado el 21 de Octubre de 1999) . Esto incrementa la frecuencia de cosupresión en las plantas transgénicas recuperadas. O "silenciamiento" de secuencias de codificación de ARNm proximal (Publicación del PCT WO No 98/36083 publicado el 20 de Agosto de 1998) . Ambos fenómenos co supresores no han sido elucidados mecánicamente, aunque la evidencia genética reciente ha empezado a esclarecer esta situación compleja (Elmayan et al. (1998) Plant Cell 10:1747-1757). Además de la cosupresión, la tecnología antisentido ha sido usada también para bloquear la función de genes específicos en células. El ARN antisentido es complementario al ARN normalmente expresado, y presumiblemente inhibe la expresión de genes por interactuar con la cadena de ARN normal. Los mecanismos por los cuales la expresión de un gen especifico son inhibidos por ya sea el ARN antisentido o sentido están en camino de ser entendidos. Sin embargo, las frecuencias de obtener el fenotipo deseado en una planta transgénica puede variar con el diseño de la construcción, el gen, la resistencia y especificidad de su promotor, el método de transformación y la complejidad de los eventos de inserción de transgen (Baulcombe, Curr. Biol. 12(3):R82-84 (2002); Tang et al., Genes Dev. 17(l):49-63 (2003); Yu et al., Plant Cell. Rep. 22 ( 3) : 167-174 (2003)). La cosupresión y la inhibición antisentido son también referidos como "silenciamiento de genes", "silenciamiento de genes post-transcripcional" (PTGS), interferencia de ARN o ARNi. Ver por ejemplo la Patente de los Estados Unidos de Norteamérica No. 6,506,559. Los microARN (miRNA por sus siglas en inglés) son ARN regulatorios pequeños que controlan la expresión de genes. Los miRNA enlazan a regiones de ARN objetivos e inhiben su traducción y, de esta forma, interfieren con la producción del polipéptido codificado por el ARN objetivo. Los miRNA pueden ser diseñados para ser complementarios a cualquier región del ARN de secuencia objetiva incluyendo la región no traducida 3', región de codificación, etc, los miRNA son procesados a partir de precursores de ARN altamente estructurados que son procesados por la acción de una ribonucleasa III nombrada DICER. Mientras que el mecanismo exacto de la acción de miRNA es desconocido, parece que funcionan regulando la expresión del gen objetivo. Ver, por ejemplo, la Publicación de Patente de los Estados Unidos de Norteamérica NO. 2004/0268441 Al la cual es publicada el 20 de diciembre de 2004. El término "expresión", como se usa en la presente, se refiere a la producción de un producto final funcional, que puede ser ARNm o traducción de ARN en un polipéptido. "Inhibición antisentido" se refiere a la producción de transcripciones de ARN antisentido capaces de suprimir la expresión de la proteina objetivo. La "co-supresión" se refiere a la producción de transcripciones de ARN con sentido capaces de suprimir la expresión de genes extraños o endógenos idénticos o substancialmente similares (Patente de los Estados Unidos de Norteamérica No. 5,231,020). "Sobreexpresión" se refiere a la producción de un producto final funcional en organismos transgénicos que exceden los niveles de producción cuando se comparan con la expresión de aquel producto final funcional en un organismo normal, del tipo silvestre o no transformado. "Transformación estable" se refiere a la transferencia de un fragmento de ácido nucleico en un genoma de un organismo huésped, el cual incluye tanto genomas nucleares y de los organelos lo cual resulta en herencia estable genéticamente. En contraste, "transformación temporal" se refiere a la transferencia de un fragmento de ácido nucleico en el núcleo, u organelo el cual contiene ADN, de un organismo huésped el cual resulta en la expresión de genes sin integración o herencia estable. Los organismos huésped los cuales contienen los fragmentos de ácido nucleico transformados son referidos como organismos "transgénicos". El método preferido de transformación celular de arroz, maiz y otras monocotiledóneas es usar tecnología de transformación de "pistola de genes" o partícula acelerada (Klein et al. (1987) Nature (Londres) 327:70-73; Patente de los Estados Unidos de Norteamérica No. 4,945,050) o un método mediado por Agrobacterium (Ishida Y. Et al. (1996) Nature Biotech. 14:745-750) . El término "transformación" como se usa en la presente se refiere a tanto transformación estable y transformación temporal. El ADN recombinante estándar y técnicas de clonación moleculares usadas en la presente son bien conocidas en la técnica y son descritas más totalmente en Sambrook, J. , Fritsch, E.F. and Maniatis, T. Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, 1989 (posteriormente en la presente "Sambrook"). El término "recombinante" se refiere a una combinación artificial de dos segmentos separados diferentes de secuencia, por ejemplo por sintesis química o por la manipulación de segmentos aislados de ácidos nucleicos por técnicas de modificación genética. "PCR" o "Reacción de cadena polimerasa" es una técnica para la sintesis de grandes cantidades de segmentos de ADN específicos, consiste de una serie de ciclos repetitivos (Perkin Elmer Cetus Instruments, Norwalk, CT) . Tipicamente, el ADN de doble cadena es desnaturalizado por calor, los dos cebadores complementarios a los limites 3' del segmento objetivo son destemplados en baja temperatura y después extendidos en una temperatura intermedia. Un grupo de estas tres etapas consecutivas es referida como un ciclo. La reacción de cadena polimerasa ("PCR" por sus siglas en inglés) es una técnica poderosa usada para amplificar millones de ADN de duplicados, por replicación repetida de un templado, en un corto periodo de tiempo. (Mullis et al. (1986) Cold spring Harbor Symp. Quant . Biol.. 51:263-273; Erlich et al. Solicitud de Patente Europea 50,424; Solicitud de Patente Europea 84,796; Solicitud de Patente Europea 258,017; Solicitud de Patente Europea 237,362; Mullis, Solicitud de Patente Europea 201,184, Mullis et al Patente de los Estados Unidos de Norteamérica NO. 4,683,194). El proceso utiliza grupos de oligonucleótidos sintetizados in vitro para cebar la sintesis de ADN. El diseño de los cebadores es dependiente de las secuencias de ADN que serán analizadas. La técnica es realizada a través de muchos ciclos (usualmente 20-50) de fusión del templado en temperatura alta, permitiendo a los cebadores destemplar las secuencias complementarias dentro del templado y entonces replicar el templado con ADN polimerasa. Los productos de reacciones PCR son analizados por separación en geles de agarosa seguido por tinción con bromuro de etidio y visualización con transiluminación con UV. Alternativamente, los dNTP radioactivos pueden ser agregados al PCR con el fin de incorporar etiquetas en los productos. En este caso los productos de la PCR son visualizados por exposición del gen a película de rayos X. La ventaja agregada de radioetiquetar los productos de la PCR es que los niveles de productos de amplificación individuales pueden ser cuantificados . Los términos "construcción recombinante", "construcción de expresión" y "construcción de expresión recombinante" son usados intercambiablemente en la presente. Estos términos se refieren a una unidad funcional de material genético que puede ser insertado en el genoma de una célula usando metodología estándar bien conocida para un experto en la técnica. Tal construcción puede ser usada por si misma o puede ser usada junto con el vector. Si se usa un vector entonces la elección del vector es dependiente del método que será usado para transformar las plantas huésped como es bien conocido para aquellos expertos en la técnica. Por ejemplo, un vector de plásmido puede ser usado. El técnico experto está bien consciente de los elementos genéticos que deben estar presentes en el vector con el fin de transformar, seleccionar y propagar exitosamente las células huésped que comprenden cualquiera de los fragmentos de ácido nucleico aislados de la invención. El técnico experto también reconocerá que diferentes eventos de transformación independientes resultarán en diferentes niveles y patrones de expresión (Jones et al. (1985) EMBO J.4 : 2411-2418 ; De Almeida et al. (1989) Mol. Gen. Genetics 218:78-86), y de esta forma que eventos múltiples deben ser tamizados con el fin de obtener lineas que exhiben el nivel y patrón de expresión deseado. Tal tamización puede ser llevada a cabo por análisis Souther de ADN, análisis Northern de expresión de ARNm, análisis Western de expresión de proteínas, o análisis fenotipicos. "Motivos" o "subsecuencias" se refieren a regiones relativamente cortas conservadas de ácidos nucleicos o aminoácidos que comprenden parte de una secuencia más larga. Por ejemplo, se espera que tales subsecuencias conservadas, tales como aquellas ejemplificadas en SEQ ID NO: 49,50, 52 y 52, puedan ser importantes para funcionar y puedan ser usadas para identificar nuevos homólogos de las proteínas del dominio LOB clase I implicadas en controlar el tamaño del embrión/endospermo en plantas. Se espera que algunos o todos los elementos puedan ser encontrados en un homólogo de RE2. También, se espera que uno o dos de los aminoácidos conservados en cualquier motivo dado pueda diferir en un homólogo RE2 verdadero. De esta forma, en un aspecto, esta invención se relaciona a un polinucleótido aislado el cual comprende: (a) una secuencia de ácido nucleico que codifica un polipéptido implicado en alterar el tamaño de embrión/endospermo durante el desarrollo de la semilla, el polipéptido que tiene por lo menos 80% de identidad de secuencia de aminoácidos, en base al método Clustal V de alineación, cuando se compara con una secuencia de aminoácido seleccionada del grupo el cual consiste de SEQ ID NO:37, 39, 41, 43, 45, 47, 49, 51 y 53; ó (b) una secuencia de ácido nucleico indicada en la SEQ ID NO: 25 en donde la secuencia comprende por lo menos una de las siguientes modificaciones: (i) el nucleótido 271 es un residuo T en lugar de C; (ii) el nucleótido 110 es un residuo T en lugar de G; o (iii) el nucleótido 75 es eliminado; o (c) una secuencia de ácido nucleico indicada en la SEQ ID NO: 34 en donde (i) los nucleótidos 4473 a 4829 corresponden a un primer exón, y (ü) los nucleótidos 5661 a 6110 corresponden a un segundo exón, y además en donde los nucleótidos de (c) (i) y/o (c) (ii) codifican un polipéptido implicado en alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla, (d) la secuencia de ácido nucleico indicada en la SEQ ID NO: 34 ó 72; o (e) el complemento total de (a) , (b) , (c) , (d) o SEQ ID NO: 34 o (f) todo o parte de una región no codificante o codificatne del polinucleótido aislado el cual comprende las secuencias de (a), (b) o SEQ ID NO: 34 para uso en cosupresión o supresión antisentido de secuencias de ácido nucleico endógeno que codifican polipéptidos implicados en alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla . También de interés son las construcciones de ADN recombinantes que comprenden un polinucleótido aislado el cual comprende cualquiera de las secuencias de nucleótidos descritas en la presente enlazadas operablemente en una orientación con sentido o antisentido a por lo menos una secuencia regulatoria. Tales construcciones pueden entonces ser usadas para transformar plantas, tejido vegetal o células vegetales. Los métodos de transformación son bien conocidos por aquellos expertos en la técnica y son descritos anteriormente. Cualquier planta, dicotiledónea o monocotiledónea puede ser transformada con tales construcciones de ADN recombinantes. Ejemplos de monocotiledóneas incluyen, pero no se limitan a, maiz, trigo, arroz, sorgo, mijo, centeno, palma, lili, Alstroemeria , centeno, y avena. Ejemplos de dicotiledóneas incluyen, pero no se limitan a, frijol de soya, colza, girasol, cañóla, uva, guayule, columbine, algodón, tabaco, chícharos, frijoles, lino, cártamo, y alfalfa. El tejido vegetal incluye tejidos diferenciados o indiferenciados o plantas, incluyendo pero no limitados a, raices, cortezas, brotes, hojas, polen, semillas, tejido tumoral, y varias formas de células y cultivo tales como células sencillas, protoplasma, embriones, y tejido calloso. El tejido vegetal puede estar en la planta o en órgano, tejido o cultivo celular. El término "órgano vegetal" se refiere a tejido vegetal o grupo de tejidos que constituyen una parte morfológica y funcionalmente distinta de una planta. El término "genoma" se refiere a lo siguiente: 1. El complemento entero de material genético (genes y secuencias no codificantes) está presente en cada célula de un organismo, o virus u organelo. 2. Un grupo completo de cromosomas heredados como una unidad (haploide) de un progenitor. El término "integrado establemente" se refiere a la transferencia de un fragmento de ácido nucleico en el genoma de un organismo huésped o célula que resulta en herencia genéticamente estable. También dentro del alcance de esta invención están semillas obtenidas a partir de tales plantas transformadas y aceite obtenido a partir de estas semillas. En otro aspecto, esta invención se relaciona a un método para alterar el tamaño de embrión/endospermo durante el desarrollo de la semilla en una planta el cual comprende: (a) transformar las células vegetales o tejido vegetal con la construcción de ADN recombinante de la invención; (b) regenerar las plantas transgénicas a partir de las células vegetales o tejido vegetal transformados de (a); (c) tamizar las plantas transgénicas de (b) para semillas que tienen un tamaño de embrión/endospermo alterado en base a una comparación de tamaño de embrión/endospermo de semillas obtenidas a partir de plantas no transformadas.
La regeneración, desarrollo y cultivo de plantas a partir de transformantes de protoplasma vegetales sencillos o partir de varias explantas transformadas es bien conocido en la técnica (Weissbach and Weissbach, En: Methods for Plant Molecular Biology, (Eds), Academic Press, Inc. San Diego, Ca, (1988)) . Este proceso de regeneración y crecimiento incluye tipicamente las etapas de selección de células transformadas, cultivar aquellas células individualizadas a través de las etapas usuales de desarrollo embriónico a través de la etapa de planta con raiz. Los embriones y semillas transgénicos son similarmente regenerados. Los brotes de raices transgénicas resultantes son después de esto plantados en un medio de crecimiento vegetal apropiado tal como la tierra. Preferentemente, las plantas regeneradas son auto polinizadas para proporcionar las plantas transgénicas homocigotas. De otra forma, el polen obtenido a partir de las plantas regeneradas es cruzado a plantas de crecimiento de semillas de lineas agronómicamente importantes. Inversamente, el polen a partir de plantas de estas lineas importantes es usado para polinizar las plantas regeneradas. Una planta transgénica de la presente invención la cual contiene un polipéptido deseado es cultivado usando métodos bien conocidos para los expertos en la técnica. Hay una variedad de métodos para la regeneración de plantas a partir del tejido vegetal. El método particular de regeneración dependerá del tejido vegetal de partida y las especies vegetales particulares a ser regeneradas. Los métodos para transformar las dicotiledóneas, primariamente usando Agrobacteri um tumefaciens , y obtener plantas transgénicas han sido publicados para algodón (Patente de los Estados Unidos de Norteamérica No. 5,004,863, Patente de los Estados Unidos de Norteamérica No. 5,159,135, Patente de los Estados Unidos de Norteamérica No. 5,518,908); frijol de soya (Patente de los Estados Unidos de Norteamérica NO. 5,569,834; Patente de los Estados Unidos de Norteamérica 5,416,011, McCabe et al. (1988) BioITechnology 6:923, Christou et al. (1988) Plant Physiol. 87 : 671-674) ; Brassica (Patente de los Estados Unidos de Norteamérica No. 5,463,174); cacahuate (Cheng et al. (1996) Plant Cell rep. 15:653-657, McKently et al. (1995) Plant Cell Rep. 14:699-703); papaya y chícharos (Grant et al. (1995) Plant Cell Rep. 15:254-258) . La transformación de monocotiledóneas que usan electroporación, bombardeo de particulas y Agrobacterium ha sido también reportada. La transformación y regeneración de plantas han sido logradas en aspárragos (Bytebier et al., Proc. Nati. Acad. Sci. (USA) (1987) 84:5354); cebadao (Wan and lemaux (1994) Plant Physiol. 104:37), Zea mays (Rhodes et al. (1988) Science 240 :204, Gordon-Kamm et al (1990) Plant Cell 2 : 603-618, Fromm et al. (1990) BioITechnology 8 :833 ; Koziel et al (1993) BioITechnology 11 :194, Armstrong et al. (1995) Crop Science 35:550-557); avena (Somers et al. (1992) BioITechnology 10 :15 89) ; pasto de huerto frutal (Horn et al. (1988) Plant Cell Rep. 7:469); arroz (Toriyama et al. (1986) Theor. Appl. Genet. 205:34, Part et al. (1996) Plant Mol. Biol. 32:1135-1148; Abedinia et al. (1997) Aust. J. Plant Physiol. 24:133-141; Zhang and Wu (1988) Theor. Appl. Genet. 76:835; Zhang et al. (1988) Plnat Cell rep. 7:379; Battraw and Hall (1992) Plant Sci. 86:191-202; Christou et al. (1991) Bio/Technology 9:957); centeno (De la Pena et al. (1987) Nature 325:274); caña de azúcar (Bower and Birch (1992) Plant J. 2:409); festuca alta (Wang et al. (1992) Bio/Technology 10:691), y trigo (Vasil et al. (1992) Bio/Technology 10:667; Patente de los Estados Unidos de Norteamérica NO. 5,631,152). "Planta" incluye la referencia a plantas enteras, órganos vegetales, tejidos vegetales, semillas y células vegetales y progenie de las mismas. Las células vegetales incluyen, sin limitación, células a partir de semillas, cultivos en suspensión, embriones, regiones meristemáticas, tejido de callo, hojas, raices, brotes, gametófitos, esporofitos, polen y microesporas. "Progenie" comprende cualquier generación subsecuente de una planta. "planta transgénica" incluye la referencia a una planta la cual comprende dentro de su genoma un polinucleótido heterólogo. Preferentemente, el polinucleótido heterólogo es integrado establemente dentro del genoma de tal forma que el polinucleótido es pasado en las generaciones sucesivas. El polinucleótido heterólogo puede ser integrado en el genoma solo o como parte de una construcción de ADN recombinante . Los ensayos para expresión de genes basados en la expresión temporal de construcciones de ácido nucleico. clonados han sido desarrollados por introducir las moléculas de ácido nucleico en células vegetales por tratamiento de polietilenglicol, electroporación, o bombardeo de particulas (Marcotte et al., Nature 335:454-457 (1988); Marcotte et al., Plant Cell 1:523-532 (1989); McCarty et al., Cell 66:895-905 (1991); Hattori et al., Genes Dev. 6:609-618 (1992); Goff et al., EMBO J: 9:2517-2522 (1990)). Los sistemas de expresión temporales pueden ser usados para diseccionar funcionalmente las construcciones de fragmento de ácido nucleico aislados (ver generalmente, Maliga et al, Methods in Plant Molecular Biology, Cold Spring Harbor Press (1995)). Es entendido que cualquiera de las moléculas de ácido nucleico de la presente invención pueden ser introducidas en una célula vegetal en una forma permanente o temporal en combinación con otros elementos genéticos tales como vectores, promotores, incrementadores etc. Además de los procedimientos discutidos anteriormente los materiales recurso estándar los cuales describen las condiciones especificas y procedimientos para la construcción, manipulación y aislamiento de macromoléculas (por ejemplo, moléculas de ADN, plásmidos, etc), generación de organismos recombinantes y tamizado y aislamiento de clones (ver por ejemplo, Sambrook et al., Molecular Cloning: a Laboratory Manual, Cold Spring Harbor Press (1989); Maliga et al., Methods in Plant Molecular Biology, Cold Spring Harbor Press (1995); Birren et al., Genome Análisis: Detecting Genes, 1, Cold Spring Harbor, New York (1998); Birren et al., Genome Análisis: Analyzing DNA, 2, Cold Spring Harbor, New York (1998); Plant Molecular Biology: A Laboratory Manual, eds, Clark, Springer, New York (1997) son bien conocidos. En otro aspecto, esta invención se relaciona a un método para mapear las variaciones genéticas relacionadas con el control del tamaño de embrión/endospermo durante el desarrollo de la semilla y/o alterar los fenotipos de aceite en plantas el cual comprende: (a) cruzar dos variedades vegetales; y evaluar las variaciones genéticas con respecto a una secuencia de ácido nucleico seleccionada a partir del grupo el cual consiste de SEQ ID NO: 25, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 51 y 72; o una secuencia de ácido nucleico que codifica un polipéptido seleccionado del grupo el cual consiste de SEQ ID NO: 26, 29, 31, 33, 37, 39, 41, 43, 45, 47, 49, 51, y 53; en plantas progenie que resultan del cruce de la etapa (a) en donde se hace la evaluación usando un método seleccionado del grupo el cual consiste de análisis RFLP, análisis SNP y análisis a base de PCR. Los términos "mapear la variación genética" o "mapear la variabilidad genética" son usadas intercambiablemente y definen el proceso de identificar cambios en secuencia de ADN, ya sea a partir de causas naturales o inducidas, dentro de una región genética que se diferencia entre lineas vegetales diferentes, cultivos, variedades, familias, o especies. La variabilidad genética en un locus particular (gen) debido a incluso cambios base menores pueden alterar el patrón de fragmentos de digestión de enzima de restricción que pueden ser generados. Las alteraciones patogénicas para el genotipo pueden ser debidas a eliminaciones o inserciones dentro del gen que es analizado o incluso substituciones de nucleótido sencillas que pueden crear o eliminar un sitio de reconocimiento de enzima de restricción. El análisis de polimorfismo de longitud de fragmento de restricción (RFLP por sus siglas en inglés) toma ventaja de esto y utiliza un análisis Southern blotting con una sonda que corresponde al fragmento de ácido nucleico aislado de interés.
De esta forma, si un polimorfismo (es decir, una variación que ocurre comúnmente en un gen o segmento de ADN, también, la existencia de varias formas de un gen (alelos) en la misma especie) crea o destruye un sitio de escisión de endonucleasa de restricción, o si resulta en la pérdida o inserción de ADN (por ejemplo polimorfismo de repetición aleatoria de nucleótido variable (VNTR por sus siglas en inglés)), alterará el tamaño o perfil de los fragmentos de ADN que son generados por digestión con aquella endonucleasa de restricción. Como tal, los individuos que poseen una secuencia variante pueden ser distinguidos a partir de aquellos que tienen la secuencia original por análisis de fragmento de restricción. Los polimorfismos que pueden ser identificados en esta forma son nombrados "polimorfismos de longitud de fragmento de restricción: ("RFLP"). Los RFLP han sido usados ampliamente en análisis genéticos de humanos y vegetales (Glassberg, UK Solicitud de Patente 2135774; Skolnick et al, Cytogen, Cell Genet. 32:58-67 (1982); Botstein et al, Ann. J. Hum. Genet. 32:314-331 (1980); Fischer et al (Solicitud de PCT WO 90/13668; Uhlen, Solicitud de PT WO 90/11369) . Un atributo central de "polimorfismos de nucleótido sencillos" o "SNP" es que el sitio del polimorfismo está en un nucleótido sencillo. Los SNP tienen ciertas ventajas reportadas sobre RFLP o VNTR. Primero, SNP son más estables que otras clases de polimorfismos. Su velocidad de mutación espontánea es aproximadamente 10"9 (Kornberg, DNA Replication, W.H. Freeman & Co., San Francisco, 1980), aproximadamente, 1,000 veces menos frecuente que VNTR (Patente de los Estados Unidos de Norteamérica 5,679,524). Segundo, los SNP ocurren en mayor frecuencia, y con mayor uniformidad que RFLP y VNTR. Como SNP resultan de variación de secuencia, nuevos polimorfismos pueden ser identificados por secuenciación aleatoria de moléculas genómicas o de ADNc. Los SNP pueden también resultar de eliminaciones, mutaciones de punto e inserciones. Cualquier alteración de base sencilla, cualquiera que sea la causa, puede ser un SNP. La frecuencia mayor de SNP significa que pueden ser más fácilmente identificados que las otras clases de polimorfismos. Los SNP pueden ser caracterizados usando cualquiera de una variedad de métodos. Tales métodos incluyen la secuenciación directa o indirecta del sitio, el uso de enzimas de restricción donde los alelos respectivos del sitio crean o destruyen un sitio de restricción, el uso de sondas de hibridización especifico a alelo, y el uso de anticuerpos que son específicos para las proteínas codificadas por los diferentes alelos del polimorfismo o por cualquier otra interpretación bioquímica. Los SNP pueden ser secuenciados por una variedad de métodos. Dos métodos básicos pueden ser usados para secuenciación de ADN, el método de terminación de cadena de Sanger et al., Proc. Nati. Acad. Sci. (U.S.A) 74: 5463-5467 (1977), y el método de degradación químico de Maxam y Gilbert, Proc. Nati. Acad. Sci. (U.S.A), 74: 560-564 (1977) . Adicionalmente, las mutaciones de un solo punto pueden ser detectadas por técnicas de PCR modificadas tales como la reacción de cadena ligasa ("LCR") y análisis de polimorfismos conformacionales de una sola cadena de PCR ("PCR-SSCP") . La técnica PCR puede también ser usada para identificar el nivel de expresión de genes en muestras extremadamente pequeñas de material, por ejemplo, tejidos o células a partir de un cuerpo. La técnica es nombrada PCR de transcripción inversa ("RT-PCR"). En otra modalidad, esta invención se relaciona a un método de cultivo molecular para obtener el tamaño de embrión/endospermo alterado durante el desarrollo de semilla y/o fenotipos de aceite alterados en plantas que comprenden: (a) cruzar dos variedades vegetales; y (b) evaluar variaciones genéticas con respecto a: (i) una secuencia de ácido nucleico seleccionada del grupo el cual consiste de SEQ ID NO: 25, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 Y 72; o una secuencia de ácido nucleico que codifica un polipéptido seleccionado del grupo el cual consiste de SEQ ID NO: 26, 29, 31, 33, 37, 39, 41, 43, 45, 47, 49 51 y 53; en plantas progenie que resultan de la cruza de la etapa (a) en donde se hace la evaluación usando un método seleccionado del grupo el cual consiste de análisis RFLP, análisis SNP y análisis a base de PCR. El término "reproducción molecular" define el proceso de rastrear marcadores moleculares durante el proceso de reproducción. Es común para los marcadores moleculares para ser enlazados a características fenotipicas que son deseable. Siguiendo la segregación del marcador molecular o rasgo genético, en lugar de clasificar un fenotipo, el proceso de cultivo puede ser acelerado por hacer crecer unas cuantas plantas y eliminar por inspección de ensayo o visual la variación fenotipica. Los marcadores moleculares útiles en este proceso incluyen, pero no se limitan a, cualquier marcador útil para identificar las variaciones genéticas de mapa mencionadas previamente, asi como también cualesquiera genes enlazados cercanamente que exhiben sintenia entre las especies vegetales. El término "sintenia" se refiere a la conservación de colocación de genes/orden en cromosomas entre los diferentes organismos. Esto significa que dos o más loci genéticos, que pueden o no pueden ser cercanamente enlazados, son encontrados en el mismo cromosoma entre las diferentes especies. Otro término para sintenia es "colinearidad de genoma" . EJEMPLOS La presente invención es además definida en los siguientes Ejemplos, en los cuales partes y porcentajes están en peso y los grados son Celsius, a menos que se establezca otra cosa. Debe ser entendido que estos Ejemplos, mientras que indican modalidades preferidas de la invención, son dados por la forma de ilustración solamente. A partir de la discusión anterior y estos Ejemplos, un experto en la técnica puede suponer las características esenciales de esta invención, y sin alejarse del espíritu y alcance de las mismas, pueden hacer varios cambios y modificaciones de la invención para adaptarla a varios usos y condiciones. De esta forma, varias modificaciones de la invención además de aquellas indicadas y descritas en la presente serán aparentes para aquellos en la técnica a partir de la descripción mencionada anteriormente. Tales modificaciones son también propuestas para estar dentro del alcance de las reivindicaciones anexas. La descripción de cada referencia indicada en la presente es incorporada en la presente por referencia en su totalidad. Ejemplo 1 Mapeo del locus RE2 de Oryza sativa para un cromosoma sencillo La identificación del cromosoma el cual comprende el locus de RE2 de Oryza sa tiva es realizada usando los marcadores de secuencia polimórfica amplificada escindida (marcadores CAPS) . El locus RE2 de Oryza sa tiva comprende el polinucleótido que, cuando muta, es responsable para un embrión 2 reducido o re2, fenotipo mutante como se ejemplifica por Hong et al. (1996, Development 122:2051-2058) . Los granos de arroz mutantes que exhiben el fenotipo re2 muestran un tamaño de embrión reducido y un tamaño de endospermo incrementado. Los marcadores de CAPS que cubren el genoma de arroz total son desarrollados y, como se indica posteriormente, son usados, para identificar la porción del cromosoma que comprende el locus de RE2 de Oryza sa tiva . Desarrollo de marcadores de CAPS El mapeo del locus RE2 para un cromosoma sencillo requiere primero desarrollar los marcadores de CAPS que cubren el genoma de arroz total. Los marcadores de CAPS son desarrollados como sigue. Los grupos de cebador de oligonucleótido son diseñados en base a una información de secuencia genómica de arroz disponible en la base de datos NCBI. La información con relación a la posición de las secuencias en los cromosomas de arroz es recuperada a partir de los sitios web del programa de investigación de genoma de arroz (RGP por sus siglas en inglés) , Tsukuba, Japón o Clemson University Genomics Institute, Clemson, SC. Los grupos de cebador de oligonucleótido son usados para amplificar las porciones de ADN genómico preparado a partir de arroz Indica (cv.
Kasalth) , Japóni ca (cv. Taichung 65) y Japónica (cv. Kinmaze) . Se digieren los fragmentos amplificados con endonucleasas de restricción y polimorfimos identificados entre estos tres tipos de arroz silvestres como sigue. Se prepara el ADN genómico a partir de hojas de los tres cultivos de arroz como sigue. Una pieza de 3 gramos a partir de la cuchilla de hojas es molido usando un mortero y pistilo y suspendido en 8 ml de amortiguador de extracción de ADN (0.1 M de ácido etilendiamintetraacético (EDTA), 1% de N-lauroilsarcosina, 100 µg/ml de proteinaza K) . La muestra suspendida es incubada en 50°C por 1 hora, y los residuos son removidos por centrifugación en 3,400 rpm por 15 minutos usando una centrifuga RT-7 Plus (Sorvall®) y transfiriendo el sobrenadante a un tubo fresco. Se precipita el ADN por agregar 2 volúmenes de etanol al 100% y separado por centrifugar en 10,000 rpm por 15 minutos en 4°C usando una centrifuga RC-5B (Sorvall®) . El granulo de ADN es resuspendido en 8 ml de TE (100 mM tris, 1 mM EDTA) y se vuelve a precipitar con 16 ml de etanol al 100%. Después de la separación del granulo de ADN por centrifugación, se vuelve a suspender en 3.7 ml de TE, se agregan 50 µl de bromuro de etidio 10 mg/ml, se lleva el volumen hasta 4 ml con TE, y se agregan 4.4 g de CsCl. Se transfiere la solución a un tubo OptiSeal™ (Beckman) y se centrifuga por 16 horas en 52,000 rpm en 25°C usando un roto NVT65.2 en una centrifuga L8-M (Beckman) . Después de la centrifugación se visualiza la banda de ADN usando una lámpara de UV y 500 µl se remueven usando una aguja de calibre 18 en una jeringa de 1 ml . Se transfiere la banda de ADN a un tubo de 1.5 ml y se remueve el bromuro de etidio por agregar 500 µl de isopropanol saturado con amortiguador 20 X SSPE y centrifugar en 14,000 rpm por 30 segundos usando una centrifuga 5415C (Eppendorf) y descargar la fase de isopropanol. La remoción del bromuro de etidio es realizada por repetir la adición de isopropanol y centrifugación 6 veces. El ADN es entonces precipitado por agregar 100 µl de TE y 500 µl de etanol al 100% y separados por centrifugar en 14,000 rpm por 15 minutos. El granulo de ADN recuperado es resuspendido en 400 µl de TE y 40 µl de NaOAC 3M. Se precipita el ADN una vez más con la adición de 1 ml de etanol al 100%, separado por centrifugación en 14,000 rpm por 15 minutos, enjuagado con 500 µl de etanol al 70%, secado y resuspendido en agua a una concentración de 10 ng/µl. El ADN genómico es amplificado usando los grupos de cebador de oligonucleótido designados anteriormente usando las siguientes condiciones de PCR. Se realizan las amplificaciones en reacciones de 30 µl que contienen 1 µl de ADN preparado anteriormente (en 10 ng/µl de concentración), 2 µl de 2.5 mM de dNTP, 2 µl de MgCl2 25 mM, 10 pmoles de cada cebador, 0.3 µl de Amplitaq gold (Perkin elmer, Wellsley, MA) y 3 µl de amortiguador 10X PCR.
Se realiza la amplificación de ADN por calentar las reacciones en 95°C por 10 minutos seguido por 40 ciclos de 94°C por 30 segundos, 56°C por 30 segundos, y 72°C por 30 segundos. La terminación de las reacciones de amplificación es realizada por calentar las reacciones en 72°C por 5 minutos . Los fragmentos de ADN amplificados son entonces digeridos con las endonucleasas de restricción que tienen 4 ó 5 sitios de reconocimiento de bases. Las digestiones de la endonucleasa de restricción son realizadas en 15 µl de reacciones de digestión que contienen 2 µl de ADN amplificado, 1.5 µl de amortiguador de reacción 10X, y 0.5 µl de enzima de restricción. Las reacciones de digestión son incubadas por 1 hora en ya sea 37 °C o en 60°C dependiendo de la endonucleasa de restricción. Los productos de ADN son cargados en un gel de agarosa al 2.5% y separada por electroforesis para analizar los polimorfismos. La comparación de los marcadores de CAPS desarrollados para arroz Japónica e Indi ca permiten el desarrollo de los marcadores 26 CAPS para arroz del tipo silvestres. Mapeo del Locus RE2 de Oryza sativa para un cromosoma sencillo El enlace entre los marcadores CAPS obtenidos para arroz del tipo silvestre y aquellos obtenidos para plantas mutantes re2 es entonces analizado. Se preparan los marcadores de CAPS con ADN genómico a partir de plantas de arroz Japóni ca F3 cuyas semillas F2 muestran fenotipo re2 y son comparados con los marcadores de CAPS preparados anteriormente. Dos marcadores en el cromosoma 10 (marcadores CIO.7.7 y CIO 15.9) muestran la co-segregación con el fenotipo re2-l y son identificados como sigue. Las plantas que exhiben el fenotipo mutante re2 son obtenidos por cruzar una planta mutante Japóni ca cv. Taichung 65 la cual muestra el fenotipo mutante re2-l con una planta de Kasalath de cultivo Indica y clasificar el fenotipo del embrión de semillas maduras F2 usando un microscopio de disección. Veinte y ocho (28) de semillas que muestran fenotipo mutante re2 son esterilizadas y se sembradas en la tierra. Se extra el ADN genómico a partir de las hojas de estas 28 plantas mutantes re2 de F3 como sigue. Las muestras de hoja, que pesan 300 mg, son molidas a un polvo en nitrógeno liquido que usa un mortero y pistilo. Cada muestra es entonces suspendida en 750 µl de amortiguador de extracción que contiene NaCl 1.5 , EDTA 0.2 M, tris 1M y CTAB al 3% (bromuro de cetitrimetilamonio) y se lleva a vórtex. Se remueven las proteínas por agregar 50 µl de cloroformo a las muestras, agitar por 20 minutos, centrifugar brevemente en una microfuga, y decantar el sobrenadante, el cual contiene el ADN, en un nuevo tubo. Se precipita el ADN genómico por agregar 300 µl de isopropanol, se mezcla por vórtex rápido, y se permite que precipite la fase acuosa. El granulo, el cual contiene el ADN, es recuperado en H20 y usado en reacciones de amplificación como sigue. El marcador CIO 7.7 es amplificado usando los cebadores de oligonucleótido CIO 6-3 y CIO 6-4. Los cebadores de oligonucleótido CIO 6-3 y CIO 6-4 son desarrollados como se describe anteriormente, tienen las secuencias de nucleótido indicadas en la SEQ ID NO: 1 y SEQ ID NO: 2, respectivamente, y tienen las secuencias indicadas como sigue: SEQ ID NO: 1: 5 ' -TAGCAGCTGGGAAGAACAACATG-3 ' SEQ ID NO: 2: 5 ' -CGTGCACCACGTAACGTTAAGC-3 ' Se observa el polimorfismo en el marcador CAPS CIO 7.7 cuando se digiere el ADN amplificado con la endonucleasa de restricción Dde I, cargada en gel de agarosa al 2.5%, y separada por electroforesis. La comparación de marcadores CAPS CIO 7.7 permite la identificación de 4 puntos de interrupción de recombinación entre el ADN preparado a partir de plantas del tipo silvestre que se obtienen de plantas mutantes re2. El marcador CIO 15.9 es amplificado usando los cebadores de oligonucleótidos CIO 15.9-1 y CIO 15.9-2. Los cebadores de oligonucleótidos CIO 15.9-1 y CIO 15.9-2 son desarrollados como se describe anteriormente, tienen las secuencias de nucleótidos indicadas en la SEQ ID NO: 3 y SEQ ID NO: 4, respectivamente, y tienen las secuencias indicadas como sigue: SEQ ID NO: 3: 5 ' -CAGGGTTGTGTAAGGATCGTTG-3 ' SEQ ID NO: 4: 5 ' -GATCATCGTGTAGTACCAGGAC-3 ' Se observa el polimorfismo en el marcador CAPS CIO .9 cuando se digiere el ADN amplificado con la endonucleasa de restricción Msp 1. Esta digestión produce bandas adicionales en la base Indica (Kasalath) . La comparación del marcador CIO 15.9 preparada a partir de ADN obtenida a partir de plantas del tipo silvestre con el marcador CIO 15.9 preparado a partir de ADN obtenido a partir de las plantas mutantes re2 permite la identificación de 4 puntos de interrupción de la recombinación diferente a unos identificados con el marcador CAPS CIO 7.7. Como se explica anteriormente, la comparación de los marcadores CAPS preparados a partir de ADN obtenido a partir de arroz del tipo silvestre y que se obtiene de plantas de arroz F3 cuya semilla F2 muestra el fenotipo re2 permite la identificación de 4 puntos de interrupción de recombinación en el marcador CAPS CIO 7.7 y 4 puntos de interrupción de recombinación diferentes en el marcador CAPS CIO 15.9. Estos resultados indican que el locus RE2 el cual contiene el polinucleótido que cuando muta es responsable para el fenotipo mutante re2 mapea a una región en el cromosoma 10 flanqueado por los marcadores CIO 7.7 y CIO 15.9.
Ejemplo 2 Clonación a base del gen RE2 de Oryza sativa En el Ejemplo 1 el locus RE2, el cual comprende el gen RE 2 , es mapeado a una región en el cromosoma 10 flanqueado por los marcadores CIO 7.7 y CIO 15.9. Este ejemplo describe la clonación del gen RE 2 a partir de plantas recombinantes F2 producidas por cruzar una planta mutante re2-l { Japóni ca cv Taichung 65) con un cultivo Indica , Kasalath usando los marcadores CAPS como sigue. Las semillas F2 obtenidas a partir de las plantas Fl auto fertilizadas son tamizadas para el fenotipo mutante re2 para obtener las poblaciones para clonar el gen RE2. Las semillas (308) que exhiben un fenotipo mutante re2 son germinadas en medio Ms el cual contiene gelrita al 0.3% y se incuba en una cámara de crecimiento por 3 semanas con un ciclo de 16 horas de luz/8 horas de oscuridad. Cuando las plantas en las placas están en una etapa de tercera hoja, 5-10 mm de la punta de la hoja se remueve y se usa para amplificación de ADN. Se llevan a cabo las reacciones de amplificación PCR directa como se describe en Klimyuk et al. (1993 Plant J. 3:493-494) con una modificación de extender el tiempo de ebullición de la muestra a 4 minutos después de la etapa de neutralización. Brevemente, se recolecta el tejido de la hoja en un vial estéril el cual contiene 40 µl de NaOH 0.25 M y se incuba 30 segundos en un baño de agua de ebullición. Se neutralizan las muestras por agregar 40 µl de HCl 0.25 M y 20 µl de Tris-HCl 0.5M, pH 8.0 el cual contiene Nonidet P-40 al 0.25% (v/v) y ebullición por unos 4 minutos adicionales. Se usan las muestras del tejido inmediatamente para amplificación o almacenados en 4°C hasta que sea necesario. Cada 30 µl de reacción de amplificación contiene 10 pmoles de cada cebador, 2 µl de dNTP 2.5 mM, 2 µl de MgCl2 25 M, 1 µl de extracto de hoja, 0.3 µl de oro Amplitaq (Perkin Elmer), y 3 µl de amortiguador de PCR. El ciclizador térmico es fijado a 95°C por 10 minutos, seguido por 40 ciclos de 94°C por 4 minutos, 50°C por 30 segundos, y 72°C por 30 segundos seguido por calentamiento en 72 °C por 5 minutos . El ADN obtenido a partir de 44 de estas 308 plantas recombinantes F2 contienen puntos de interrupción entre los marcadores CAPS CÍO 7.7 y CÍO 15.9 y son identificados usando marcadores CAPS CÍO 7.7 Hpy, CÍO 11.5, CÍO 11.0, CÍO 9.6, E08 93K, y E08 46K los cuales son desarrollados como sigue. El marcador CÍO 7.7 Hpy es amplificado usando los cebadores de oligonucleótidos C10-7.7 2 HPYIVF y C10-7.7 2 HPYIVR son desarrollados como se describe en el Ejemplo 1, tienen las secuencias de nucleótidos indicadas en la SEQ ID NO: 5 y SEQ ID NO: 6, respectivamente, y tienen las secuencias indicadas como sigue: SEQ ID NO: 5: 5 ' -ATTGTCGTGTGACAGCGC-3 ' SEQ ID NO: 6: 5 ' -CCGCAATTAATATTCCGAGC-3 ' Se observa el polimorfismo en el marcador CAPS CIO 7.7 Hpy cuando se digiere el ADN amplificado con la endonucleasa de restricción HPYCH4 IV. El marcador CIO 11.5 es amplificado usando los cebadores de nucleótidos 11.5 HpV y CIO 11.5-9. Los cebadores de oligonucleótidos 11.5 HpyV y CIO 11.5-9 son desarrollados como se describe en el Ejemplo 1, tienen las secuencias de nucleótidos indicadas en la SEQ ID NO: 7 y SEQ ID NO: 8, respectivamente, y tienen las secuencias indicadas como sigue : SEQ ID NO: 7: 5 ' -AAAGTGTGGTAGGTGTCATCCAGTTG-3 ' SEQ ID NO: 8: 5 ' -GCCACATGATCATCCACTACCAATG-3 ' Se observa el polimorfismo en el marcador CIO 11.5 CAPS cuando se digiere el ADN amplificado con la endonucleasa de restricción HpyCH4 V. Se amplifica el marcador CIO 11.0 usando los cebadores de oligonucleótido CIO 11-5 y 11 HinfR. Los cebadores de oligonucleótido CIO 11-5 y 11 HinfR son desarrollados como se describen en el ejemplo 1, tienen las secuencias de nucleótido indicadas en la SEQ ID NO: 9 y SEQ ID NO: 10, respectivamente, y tienen las secuencias indicadas como sigue: SEQ ID NO: 9: 5 ' -CTTTTTCCGACCCACATGAAGGT-3 ' SEQ ID NO: 10: 5 ' -TACAAACGCTCCTAAACCACCATGT-3 ' Se observa el polimorfismo en el marcador CAPS CIO 11.0 cuando el ADN amplificado es digerido con la endonucleasa de restricción Hinf. I. Se amplifica el marcador CIO 9.6 usando los cebadores de oligonucleótido 9.6 DralF y 9.6 DralR. Los cebadores de oligonucleótido 9.6 DralF y 9.6 DralF son desarrollados como se describe en el Ejemplo 1, tienen las secuencias de nucleótido indicadas en la SEQ ID NO: 11 y SEQ ID NO: 12, respectivamente, y tienen las secuencias indicadas como sigue: SEQ ID NO: 11: 5 ' -TTTGGGTGCATTAAAGTGGACCA-3 ' SEQ ID NO: 12 5 ' -GGGGTAATTCGGATGACCATG-3 ' Se observa el polimorfismo en el marcador CAPS CIO 9.6 cuando se digiere el ADN amplificado con la endonucleasa de restricción Dral. Se amplifica el marcador E08 93K usando los cebadores de oligonucleótido E08 93K y E08 93Kr. Los cebadores de oligonucleótido E08 93K y E08 93KR son desarrollados como se describe en el Ejemplo 1, tienen las secuencias de nucleótido indicadas en la SEQ ID NO: 13 y SEQ ID NO: 14, respectivamente, y tienen las secuencias indicadas como sigue: SEQ ID NO: 13: 5 ' -CTCATAGCCCGCCTAGCCTCATAG-3 ' SEQ ID NO: 14: 5 ' -GAAGCAGAGAAACTCCAACCTGG-3 ' Se observa el polimorfismo en el marcador CAPS E08 93K cuando se digiere el ADN amplificado con la endonucleasa de restricción HpyCH4V. Se amplifica el marcador E08 46K usando los cebadores de oligonucleótido E08 46KF y E08 46KR. Los cebadores de oligonucleótido E08 46KF y E08 46KR son desarrollados como se describe en el Ejemplo 1, tienen las secuencias de nucleótidos indicadas en la SEQ ID NO: 15 y SEQ ID NO: 16, respectivamente, y tienen las secuencias indicadas como sigue: SEQ ID NO: 15: 5 ' -GTTCATAGGTGCCAAATTTGGGTG-3 ' SEQ ID NO: 16: 5 ' -CACAAGTAACCCAATGCCCAAAC-3 ' Se observa el polimorfismo en el marcador CAPS E08 46K cuando se digiere el ADN amplificado con la endonucleasa de restricción Rsa I . El análisis de puntos de interrupción de recombinación identifica 6 puntos de interrupción de recombinación entre el ADN obtenido a partir de las plantas mutantes re2 y marcador CAPS E08 93K y 3 puntos de interrupción de recombinación entre el ADN obtenido a partir de plantas mutantes re2 y el marcador CAPS CIO 9.6. La información con relación a la posición de la secuencias de los marcadores CAPS en los cromosomas de arroz es recuperada a partir de sitios de web del Rice Genome Research Program (programa de investigación del genoma de arroz RGP por sus siglas en inglés), Tsukuba, Japón, o la Clemson University Genomics Institue, Clemson, SC. Esta información revela que las secuencias para los marcadores CAPS E08 93K y CIO 9.6 son derivados de dos clones BAC de traslape, OSJNBa0050E08 y OSJNBb0042K08 , que cubre 190 Kb en el cromosoma de arroz 10. Por lo menos 10 genes son encontrados en esta región. Un marcador CAPS adicional, K08 21K, y un marcador a base de polimorfismo de nucleótido sencillo (a base de SNP) son generados y son derivados de BAC 0SJNBb0042K08 y mapeado 25 Kb aparte. El marcador K08 21K es amplificado usando los cebadores de oligonucleótido K08 21KF y K08 21KR. Los cebadores de oligonucleótido K08 21KF y K08 21KR son desarrollados como se describe en el Ejemplo 1, tienen las secuencias de nucleótido indicadas en la SEQ ID NO: 17 y la SEQ ID NO: 18, respectivamente, y tienen las secuencias indicadas como sigue: SEQ ID NO: 17: 5 ' -GTTCACCCATTAGTGATGCCTGG-3 ' SEQ ID NO: 18: 5 ' -GTTCACTCGATAAGAGCAATCGAAC-3 ' Se observa el polimorfismo en el marcador CAPS K08 21K cuando se digiere el AND amplificado con la endonucleasa de restricción Taq I . El marcador a base de SNP K08 46K es amplificado usando los cebadores K08 46KF y K08 46KR. Los cebadores de oligonucleótido K08 46KF y K08 46KR son desarrollados como se describe en el Ejemplo 1, tienen las secuencias de nucleótido indicadas en la SEQ ID NO: 19 y la SEQ ID NO:20, respectivamente, y tienen las secuencias indicadas como sigue : SEQ ID NO: 19: 5 ' -GTTATGTTGCACACCTCCAGTAGTTAC-3 ' SEQ ID NO: 20: 5 ' -GTCAAGCCTGCTGTTACCCTTTAAG-3 ' Los productos de ADN amplificados son purificados usando un equipo de purificación PCR Qiagen (Qiagen, Valencia, CA) y 100 ng de cada ADN purificado es usado para secuenciación directa. De 9 puntos de interrupción de recombinación 3 se encuentran en el marcador K08 21K y 1 se encuentra en el marcador K08 46K que confina el gen RE2 a una región de 25 Kb entre estos dos marcadores. Esta región de 25 Kb contiene el ADN correspondiente a dos genes putativos. Un gen es OSJNBb0042K08.8 que es predecible para codificar una proteina similar a miosina y es encontrada en la base de datos NCBI como la versión AAL77142.1 la cual tiene el No. de Identificador General de NCBI 18652508. El otro gen es OSJNBb0042K08.9 que se predice codifica una proteina de función desconocida y es encontrada en la base de datos NCBI como la versión AAL77143.1 la cual tiene el no. de identificador general de NCBI 18652509. Las regiones que corresponden a estos dos genes son secuenciadas en ADN genómico obtenido a partir de alelos de mutantes re2-l , re2-2 y re2-3 para identificar el gen RE2. La amplificación del exon 1 es realizada usando los cebadores de oligonucleótidos LOB-82F y LOB Rl y la amplificación del exon2 es realizada usando los cebadores de oligonucleótidos LOB F2 y LOB R2. Los cebadores de oligonucleótidos LOB-82F, LOB Rl, LOB F2 Y LOB R2 tienen las secuencias de nucleótidos indicadas en la SEQ ID NO: 21, SEQ ID NO:22, SEQ ID NO:23 y SEQ ID NO:24, respectivamente y tienen las secuencias indicadas como sigue: SEQ ID NO: 21: 5 ' -GTCAAGCCTGCTGTTACCCTTTAAG-3 ' SEQ ID NO: 22: 5 ' -CCACCATGACGAACATCTAAATG-3 ' SEQ ID NO: 23: 5 ' -GTATAGCTCCCAACCATTTCTCCTC-3 ' SEQ ID NO: 24: 5 ' -CCAACATCACCATCATCGTCTTC-3 ' Se llevan a cabo las reacciones de amplificación usando las mismas condiciones que son usadas para las amplificaciones del marcador CAPS en el Ejemplo 1 excepto que 20 ng de ADN son usados por reacción y la temperatura de destemplado es 55°C. Los productos de ADN amplificados son clonados en el vector p-GEM T easy (Promega, Madison, Wl) y, por cada reacción de amplificación, se prepara el ADN de plásmido a partir de por lo menos 4 colonias independientes usando un equiipo Qiagen miniprep (Qiagen, Valencia, CA) . Los plásmidos son secuenciados usando los cebadores de secuenciación hacia adelante e inversos M13. No se encuentra mutación en la porción de ADN correspondiente al gen que codifica la proteina similar a miosina, pero se encuentran las mutaciones en la región que codifica la proteina desconocida. Esto significa que el gen RE2 tiene la secuencia encontrada en el NCBI que tiene la etiqueta de locus OSJNBb0042K08.9 que se predice para codificar una proteina de la función desconocida y se encuentra en la base de datos NCBI como la versión AAL77143.1 que tiene el no. de identificador general de NCBI 18652509. La secuencia de nucleótidos del gen RE2 de Oryza sa tiva es indicada en la SEQ ID NO: 25 y la secuencia de aminoácidos deducida a partir de los nucleótidos de traducción 1 a 807 de la SEQ ID NO: 25 es indicada en la SEQ ID NO:26. Los nucleótidos 808-810 de la SEQ ID NO:25 corresponden a un codón de detención. La secuencia de nucleótidos indicada en la SEQ ID NO: 25 es la misma como se encuentra en la base de datos NCBI que tiene la etiqueta de locus OSJNBb0042K08.9 que es predecible para codificar una proteina de función desconocida. La secuencia de aminoácidos indicada en la SEQ ID NO: 26 es la misma como aquella para la proteina de función desconocida encontrada en la base de datos NCBI como la versión AAL77143.1 que tiene el No. Identificador General de NCBI 18652509 que es indicada en la SEQ ID no:27. Identificación de Mutaciones responsables para un fenotipo re2 Se determinan las mutaciones en el gen RE2 responsable para el fenotipo re2 por comparar las secuencias de nucleótidos obtenidas para ADN a partir de arroz del tipo silvestre con las secuencias de nucleótido obtenidas por ADN a partir de arroz que exhibe un fenotipo re2. Tres alelos mutantes re2 son identificados y etiquetados re2-l , re2-2 y re2-3. La secuencia de nucleótidos obtenida por el alelo mutante re2-l es indicada en la SEQ ID NO: 28 y la secuencia de aminoácidos obtenida por traducir los nucleótidos 1 a 807 de la SEQ ID NO:28 es indicada en la SEQ ID NO: 29. Los nucleótidos 808 a 810 de la SEQ ID NO:28 corresponden a un codón de detención. La secuencia de nucleótidos obtenida por el alelo mutante re2-2 es indicada en la SEQ ID NO: 30 y la secuencia de aminoácidos obtenida por traducir los nucleótidos 1 a 807 de la SEQ ID NO: 30 es indicada en la SEQ ID NO-.31. Los nucleótidos 808 a 810 de la SEQ ID NO:30 corresponden al codón de detención. La secuencia de nucleótidos obtenida por el alelo mutante re2-3 es indicada en la SEQ ID NO: 32 y la secuencia de aminoácidos obtenida por traducir los nucleótidos 1-378 de la SEQ ID NO: 32 es indicada en la SEQ ID NO:33. Los nucleótidos 379 a 381 de la SEQ ID NO: 32 corresponden a un codón de detención. Las Figuras 1A-1C muestran una alineación de las secuencias de nucleótido obtenidas por las regiones de codificación de RE2 del tipo silvestre (SEQ ID NO: 25) y mutantes re2-l (SEQ ID NO:28), re2-2 (SEQ ID NO:30) y re2-3 (SEQ ID NO: 32) . Los cambios en la secuencia de nucleótidos son indicados por una estrella debajo de la alineación y por un cuadro alrededor de los nucleótidos en esa posición. Como se observa en la Figura 1, el alelo mutante re2-l tiene un residuo T en el nucleótido 279, el alelo mutante re2-2 tiene un residuo T en el nucleótido 110, y el alelo mutante re2-3 tiene C en el nucleótido 75 eliminado. Estos cambios de nucleótido resultan en cambios en la secuencia de aminoácidos . La Figura 2 muestra una alineación de las secuencias de aminoácidos obtenidas por la proteina RE2 del tipo silvestre (SEQ ID NO:26), y proteínas mutantes re2-l (SEQ ID NO:29) Y re2-2 (SEQ ID NO:31). Los aminoácidos que cambian entre el tipo silvestre y mutante son indicados por un cuadro alrededor de los aminoácidos que son diferentes en esa posición. Como se observa en la Figura 2, la proteina del alelo mutante re2-l tiene una isoleucina en el aminoácido 93 en lugar de la treonina altamente conservada, la proteina re2-2 de alelo mutante tiene una fenilalanina en lugar de la cisteina conservada en el aminoácido 37. La eliminación de un nucleótido en la posición 75 en el gen re2-3 de alelo mutante produce un cambio de estructura que resulta en un polipéptido de 127 aminoácidos (indicado en la SEQ ID NO: 33) que comparte la identidad con los primeros 25 aminoácidos de la proteina RE2 del tipo silvestre pero cuyos 102 aminoácidos restantes comparten poca o nada de homología con la proteina RE2 del tipo silvestre o proteínas mutantes re2-l o re2-2. Ejemplo 3 Confirmación de la función del gen E2 de Oryza sativa La confirmación funcional de la identidad del gen RE2 de Oryza sa tiva identificado en el Ejemplo 2 es realizada usando la complementación genética. Las células de callo de arroz derivadas del tipo silvestre y plantas mutantes re2 son transformadas con un fragmento de ADN genómico que comprenden el gen RE2. El restablecimiento del tamaño del embrión de las células mutantes re2 transformadas con el fragmento de ADN genómico que comprende el gen RE2 confirma que el gen RE2 de Oryza sa tiva identificado en el Ejemplo 2 es el único objetivo de mutaciones que dan origen al fenotipo re2. La clonación del fragmento genómico el cual comprende el gen RE 2 del tipo silvestre y la transformación en células de arroz son realizadas como sigue. Un fragmento de ADN genómico el cual contiene el gen RE2 de Oryza sa tiva del tipo silvestre es obtenido a partir de una biblioteca de ADN genómica de arroz lambda (Stratagene) como sigue. La biblioteca genomica es tamizada usando una sonda de ADN obtenida usando cebadores LOB F2 (SEQ ID NO:23) y LOB R2 (SEQ ID NO:24) que, como se indica en el Ejemplo 2, anterior, puede ser usado para amplificar el exon 2 del gen RE2. De 8 clones identificados, un clon, nombrado RE2G4, contiene un inserto de 15 Kb el cual comprende un fragmento de aproximadamente 9 Kb flanqueado por dos sitios de BamH I y que comprende el gen RE2. Uno de los sitios BamH I es ubicado 4472 pb corriente arriba del codón de iniciación ATG en el gen RE2 y el otro es ubicado 3089 pb corriente abajo del codón de terminación del gen RE2. Los nucleótidos 4473 a 4829 corresponden al primer exón, los nucleótidos 4830 a 5660 corresponden a un intrón, y los nucleótidos 5661 a 6110 corresponden a un segundo exón. Los nucleótidos 6111 a 6113 forman un codón de terminación. La secuencia de nucleótido de este fragmento BamH I de aproximadamente 9 Kb es indicado en la SEQ ID NO: 34. El fragmento BamH I de 9 Kb aproximadamente el cual comprende la región de codificación RE2 (indicado en la SEQ ID NO: 34) es removido del clon RE2G4 por digestión con BamH I y se subclona en el sitio BamH I del vector de transformación pML18 para producir el vector OsRE2pML18. El vector de transformación pML18 es derivado del vector comercialmente disponible pGEM9z (obtenido a partir de Gibco-BRL el cual es apropiado por Invitrogen, Carisbad, CA) y es modificado por agregar un cásete para expresar el gen de higromicina fosfotransferasa bacteriano. El gen de higromicina fosfotransferasa bacteriano confiere resistencia al antibiótico usado como marcador seleccionable para transformación de arroz. Un fragmento Sal I, el cual contiene un cásete el cual comprende el promotor de virus de mosaico de coliflor 35S, el cual maneja la expresión del gen de higromicina fosfotransferasa bacteriano, seguido por los nucleótidos 848 a 1550 del extremo 3' del gen de nopalina sintasa, se inserta en el sitio Sal I del vector pGEM9z para producir pMLld. La secuencia de nucleótido de pML18 es indicada en la SEQ ID NO: 35. El vector OsRE2pML18 es introducido en el callo derivado de plantas de arroz del tipo silvestre y de plantas mutantes re2 usando una pistola Biolistic PDS-1000/He (BioRAD Laboratories, Hercules, CA) y la técnica de bombardeo de particulas (Klein et al, (1987) Nature (Londres) 327:70-73) como sigue. Los cultivos de callo embriogénico derivados de escutelo de germinación de semillas de arroz son usadas como material de origen para experimentos de transformación. Este material es generado por germinar las semillas de arroz estériles en medio N6-2,4D (sales N6, vitaminas N6, 2.0 mg/l de 2,4-D, 100 mg/L de mio-inositol, 300 mg/L de mg/l de ácidos casamino, y 2.7 g/l de prolina) en la oscuridad en 27-28°C. El callo embriogénico que prolifera a partir del escutelo de los embriones es entonces transferido a medio N6-2,4D fresco. Se mantienen los cultivos del callo por subcultivo de rutina en intervalos de dos semanas y se usa para transformación dentro de 4 semanas de iniciación. La regeneración, desarrollo, y cultivo de plantas a partir de los transformantes de protoplasto vegetal sencillo o de varias explantas transformadas es bien conocido en la técnica (Wweissbach and Weissbach, In: Methods for Plant Molecular Biology, (Eds), Academic Press, Inc. San Diego, CA, )1988)). Se prepara el callo para transformación por disponer piezas de callo de 0.5-1.0 mm aproximadamente 1 mm aparte en un área circular de aproximadamente 4 cm en diámetro en el centro de un circulo de papel Whatman #541 colocado en el medio CM y se incuba en la oscuridad en 27-28°C por 3-5 dias. El vector OsRE2pML18 es introducido en las células de callo del tipo silvestre y las células de callo de arroz mutante re2 usando una pistola Biolistic PDS-1000/He (BioRAD Laboratories, Hercules, CA) . La transformación de callo mutante con el vector OsRE2pML18 produce 16 plantas transgénicas de las cuales 7 plantas transgénicas producen semillas. La semilla T2 a partir de 6 plantas muestra un tipo silvestre para el fenotipo mutante re2 segregando en una proporción 3:1. El restablecimiento del fenotipo del tipo silvestre en plantas mutantes re2 por el vector OsRE2pML18 indica que el fragmento de ADN genómico de arroz de 9,203 pb presente en el vector OsRE2pML18 es capaz de complementar una mutación re2. Esto confirma que el gen RE2 de Oryza sativa tiene la secuencia encontrada en NCBI que tiene la etiqueta de locus OSJNBb0042K08.9 que es predicho para codificar una proteina de función desconocida encontrada en la base de datos NCBI como la versión AAL77143.1 que tiene el No. identificador General de NCBI 18652509. Estos resultados también indican que el fragmento de ADN genómico de arroz de 9,203 pb en el vector OsRE2pML18 usado en estas transformaciones e indicado en la SEQ ID NO: 34 contiene el juego completo de elementos regulatorios requeridos para complementación apropiada de un fenotipo mutante re2 e implica alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla. Ejemplo 4 Composición de bibliotecas de ADNc: Aislamiento y secuenciación de clones de ADNc que codifican polipéptidos implicados en alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla Se identifica la secuencia de gen RE2 de Oryza sativa en el Ejemplo 2 y su función es confirmada en el Ejemplo 3 como que está implicado en alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla. La identificación de genes a partir de otros cultivos implicados en alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla es indicada en los Ejemplos 4 y 5. Los ADNc que codifican los homólogos de polipéptido a la proteina RE2 de arroz son identificados por tamizar electrónicamente la base de datos propietaria de DuPont usando el análisis BLAST (Basic Local aligment Search Tool: Altschul et al. (1993) J. Mol. Biol. 215:403-410). Los clones derivados de las bibliotecas de ADNc que representan ARNm de varios tejidos de maiz ( Zea maize) , Euphorbia lagascae, columbina ( Aquilegia vulgaris ) , guar ( Cyamopsis tetragonoloba ) , arroz ( Oryza sa tiva ) , frijol de soya ( Glycine max) , y trigo ( Tri ticum aestivum) son identificados como que codifican homólogos a la proteina RE2 de arroz. Las bibliotecas son preparadas como se describe posteriormente. Las características de las bibliotecas son descritas en la Tabla 1. Tabla 1 Bibliotecas de Maiz, Euphorbia lagascae, Columbina, Guar, Arroz, Frijol de soya y Trigo Biblioteca Tejido Clon ceflf Oreja fertilizada total de cef1. pkOOl . f4 : fis maiz 3 a 12 dias después de la polinación cpflc BMS recolectado de maiz cpflc. pk006. dl8a : fis tratado con químicos relacionados con la sintesis de proteina1 cpilc BMS recolectado de maiz cpilc. pk005. al2 : fis tratado con químicos relacionados con la sintesis de compuesto bioquímico1 crin Raiz de maiz a partir de 7 crin. pk0028. h3a : fis siembras de 7 dias de edad3 eellc Semillas de desarrollo de eellc . pk003. blO : fis Euphorbia lagascae eavlc Semillas de desarrollo de eavlc . pk003. c9 columbina lds3c Semillas de guar cosechadas lds3c . pkOll . j 11 : fis 32 dias después de la floración sdrlf Raiz de 10 dias de edad de sdrlf . pk005. d21. f : fis frijol de soya 10 wdrlf Raiz de desarrollo total de wdrlf . pk002.110 : fis trigo 1Quimicos usados incluyen cloranfenicol, ciclohexamida, ácido aurintricarboxilico. 2Quimicos usados incluidos sorbitol, egosterol, taxifolina, metotrexato, D-manosa, D-galactosa, ácido alfa-maino adipico, ancimidol. 3Esta biblioteca es normalizada esencialmente como se describe en la Patente de los Estados Unidos de Norteamérica No. 5,482,845. Las bibliotecas de ADNc que representan los ARNm a partir de los tejidos descritos en la Tabla 1 son preparadas en los vectores Uni-ZAPtm XR de acuerdo al protocolo del proveedor (Stratagene Cloning Systems, La Jolla, CA) . La conversión de las bibliotecas Uni-ZAP™ XR en las bibliotecas de plásmido se realiza de acuerdo al protocolo proporcionado por Stratagene. Ante la conversión, los insertos de ADNc son contenidos en el vector de plásmido pBluescript. Los insertos de ADNc a partir de colonias bacterianas escogidos aleatoriamente que contienen plásmidos pBluescript recombinantes son amplificados por medio de la reacción de cadena polimerasa usando los cebadores específicos para secuencias de vector que flanquean las secuencias de ADNc insertadas o ADN de plásmido son preparados a partir de células bacterianas cultivadas. Los ADN de inserto amplificados o ADN de plásmido son secuenciados en reacciones de secuenciación de cebador de tinte para generar las secuencias de ADNc parcial (etiquetas de secuencia expresadas o "EST (por sus siglas en inglés)", ver Adams, M. D. et al., (1991) Science 252:1651). La EST resultante es analizada usando un secuenciador fluorescente Modelo 377 de Perkin elmer. Los datos de la secuencia de inserto completa (FIS por sus siglas en inglés) son generados utilizando un protocolo de transposición modificado. Los clones identificados para FIS son recuperados a partir de las provisiones de glicerol archivados como colonias sencillas, y los ADN de plásmido son aislados por medio de lisis alcalina. Se hacen reaccionar los templados de ADN aislados con el vector cebado con oligonucleótidos hacia delante e inversos M13 en una reacción de secuenciación a base de PCR y se carga en los secuenciadores automatizados. La confirmación de la identificación de clon se realiza por la alineación de secuencia a la secuencia EST original a partir de la cual la solicitud FIS es hecha. Se trasponen los templados confirmados por medio del equipo de trasposición Primer Island (PE Applied Biosystems, Foster City, CA) , lo cual se basa en el elemento que se transpone de Saccharomyces cerevisiae Tyl (Devine and Boeke (1994) Nucleic Acids Res. 22:3765-3772). El sistema de transposición in vitro coloca los sitios de enlace únicos aleatoriamente a través de una población de moléculas de ADN grandes. El ADN transpuesto es entonces usado para transformar las células electrocompetentes DH10B (Gibco BRL/Life Technologies, Rockville, MD) pr medio de electroporación. El elemento transpuesto contiene un marcador seleccionable adicional (nombrado DHFR; Fling and Richards (1983) Nucleic Acids Res. 11:5147-5158), permitiendo la selección dual en placas de agar de solamente aquellos subclones que contienen el transposon integrado. Los subclones múltiples son seleccionados aleatoriamente a partir de cada reacción de transposición, los ADN de plásmido son preparados por medio de lisis alcalina, y los templados son secuenciados (mezcla de ReadyReaction del terminador de tinte ABI Prism) hacia fuera del sitio de evento de transposición, utilizando cebadores únicos específicos para los sitios de enlace dentro del transposon. Se recolectan los datos de secuencia (ABI Prism Collections) y se ensamblan usando Phred and Phrap (Ewing et al. (1998) Genome Res. 8:175-185; Ewing and Green (1998) Genome Res 8:186-194). Phred re lee los datos de secuencia ABI, re-nombra las bases, asigna los valores de calidad, y escribe los nombres de las bases y valores de calidad en archivos de salida editables. Phrap es un programa de ensamble de secuencia que usa los valores de calidad asignados por Phred para incrementar la exactitud de las continuidades de secuencia ensamblada. Los ensambles son vistos usando el editor de secuencia Consed (Gordon et al. (1998) Genome Re 8:195-202). Ejemplo 5 Identificación y Caracterización de los clones de ADNc que codifican homólogos putativos de la proteina RE2 de Oryza sativa Los clones que contienen los insertos de ADNc que codifican los homólogos de polipéptidos para proteina RE2 de arroz son identificados por realizar investigaciones BLAST (Basic Local alignment Search Tool; Altschul et al. (1993) J.
Mol. Biol.. 215:403-410) para similitud a secuencias contenidas en la base de datos de propiedad de Du Pont. Las secuencias identificadas son también comparadas, usando BLAST, a la base de datos de Genbank Se realiza la búsqueda BLASTX para identificar los ADNc que codifican las proteínas similares a aquellas codificadas por el gen RE2. BLASTX compara la traducción, en todas las seis estructuras de lectura, de las secuencia de cuestión de nucleótidos a una base de datos de proteina. Como se menciona en el Ejemplo 2, el gen RE2 de Oryza sa tiva tiene la secuencia encontrada en la base de datos NCBI que tiene la etiqueta de locus OSJNBb0042K08.9 que es predicha para codificar una proteina de función desconocida encontrada en la base de datos NCBI como la versión AAL77143.1 la cual tiene un no identificador general de NCBI 18652509. De esta forma, los polipéptidos codificados por los ADNc identificados en la búsqueda BLASTX son similares a la proteina de función desconocida encontrada en la base de datos NCBI como la versión AAL77143.1 que tiene el no. identificador general de NCBI 18652509. La investigación BLASTX usando las secuencias de nucleótidos a partir de los clones enlistados en la Tabla 1 revela que los polipéptidos codificados por estos ADNc tienen similitud a la proteina de Oryza sa tiva que tiene el No. de identificador general de NCBI 18652509 y la proteina 18 del dominio LOB de Arabidopsis tha liana la cual tiene un no. identificador General de NCBI 17227164. Se indican en la Tabla 1 los resultados de BLASTX para EST individuales ("EST") o para las secuencias de los insertos de ADNc totales que comprenden los clones de ADNc indicados ("FIS") . Tabla 2 Resultados de BLAST para secuencias que codifican homólogos de polipéptidos a proteina RE2 de O. sativa y proteina de dominio 18 de LO de A. thaliana Clon aa Estatus Clasificación plog SEQ ID BLAST NO. 18652509 17227164 Rice RE2 26 FIS >180.00 73.70 ceflf .pk001.f4:fis 37 FIS 58.00 58.30 cpflc.pk006.dl8a:fis 39 FIS 36.00 38.22 coilc.pk005.al2:fis 41 FIS 60.70 58.15 crln.pk0028.h3a: fis 43 FIS 34.22 34.40 eellc. pk003.bl0:fis 45 FIS 59.05 69.40 eavlc.pk003.c9 47 EST 47.00 51.70 Ids3c.pk011, jllifis 49 FIS 53.10 56.40 sdrlf .pk005.d21.f:fis 51 FIS 39.15 41.10 wdrf .pk002,1110:fis 53 FIS 36.30 33.70 Los datos indicados en la Tabla 3 presentan el por ciento de identidad, calculado usando el método Clustal V de alineación, de las secuencias de aminoácidos indicadas en la SEQ ID NO: 26, 37, 39, 41, 43, 45, 47, 49, 51 y 53 con la proteina de Oryza sa tiva la cual tiene el No. identificador General de NCBI 18652509 (indicado en la SEQ ID NO:27) y la proteina del dominio 18 de LOB de Arabidopsis thaliana (No. de identificador general de NCBI 17227164, indicado en la SEQ ID NO:54) . Tabla 3 Por ciento de identidad de las secuencias de aminoácidos deducidas a partir de las secuencias de nucleótidos de clones de ADNc que codifican los polipéptidos homólogos de RE2 de O. sativa putativos aa SEQ ID Porciento de identidad a NO. 18652509 17227164 Rice RE2 26 100.00 49.6 ceflf .pk001.f4:fis 37 59.1 59.9 cpflc.pk006.dl8a:fis 39 38.5 40.4 cpilc, pk005.al2:fis 41 57.8 52.7 crln.pk0028.h3a: fis 43 45.8 47.6 eellc. pk003.bl0:fis 45 53.4 58.6 eavlc,pk003.c9 47 79.2 85.4 Ids3c,pk011, jll:fis 49 41.8 47.4 sdrlf .pk005.d21.f:fis 51 40.8 42.3 wdrlf .pk002,110:fis 53 43.9 41.2 Los cálculos de alineaciones de secuencia y por ciento de identidad son realizados usando el programa Megalign del suite de cómputo LASERGENE bioinformatics (DNASTAR Inc., Madison, Wl). La alineación múltiple de las secuencias es realizada usando el método Clustal V de alineación (Higgins, D.G. y Sharp, P.M (1989) Comput. Appl. Biosci. 5:151-153; Higgins, D.G. et al. (1992) Comput. Appl. Biosci. 8:189-191) y los parámetros de default (GAP PENALTY=10, GAP LENGTH PENALTY=10) . Los parámetros de default para alineaciones de forma de pares usando el método Clustal V son KTUPLE 1, GAP PENALTY=3, WINDOW=5 y DIAGONALS SAVED=5. Las alineaciones de secuencia y clasificaciones BLAST y probabilidades indican que los fragmentos de ácido nucleico que comprenden los clones de ADNc instantáneos codifican los polipéptidos con homología a la proteina RE2 de O. sa tiva y la proteina de dominio 18 de LOB de A . thaliana . Ejemplo 6 Estructura de la proteina RE2 de Oryza sativa y sus homólogos putativos Como se indica en la Tabla 3, la secuencia de aminoácidos del polipéptido RE2 (SEQ ID NO: 26) indicada en el Ejemplo 2, anterior, para ser capaz de complementar un fenotipo mutante re2 es idéntica a la proteina de Oryza sa tiva la cual tiene el No. Identificador general de NCBI 18652509 (SEQ ID NO:27) y tiene la similitud de secuencia a la proteina del dominio 18 de LOB de Arabidopsis thaliana la cual tiene el No. identificador general de NCBI 17227164 (indicado en la SEQ ID NO:54). La proteina del dominio 18 LOB es considerada para pertenecer al grupo de la clase I de la familia de genes especifico a plantas de proteina del dominio limite de órgano lateral (LOB por sus siglas en inglés) . La proteina del dominio LOB clase I contiene un bloque C, bloque GAS, y un motivo de cierre de leucina (Shua, B. et al., 2002, Plant Phys. 129:747-761). De esta forma, se espera que la proteina RE2 de Oryza sativa y sus homólogos también contengan un bloque C, un bloque GAS, y un motivo de cierre de leucina. Las secuencias de consenso de estos motivos son identificados usando una alineación de Clustal V y son indicados en la Figura 3A-C. c Las Figuras 3A-3C representan la alineación de Clustal V obtenida para las secuencias de aminoácidos a partir de la proteina RE2 de arroz del tipo silvestre (SEQ ID NO:26), la proteina de O. sa tiva la cual tiene un No. identificador general de NCBI 18652509 (SEQ ID NO: 27), la proteina del dominio 18 de LOB de A . thaliana que tiene el no. identificador general de NCBI 17227164 (SEQ ID NO:54), y las secuencias de aminoácido de los polipéptidos codificados por clones de maiz ceflf . pkOOl . f4 : fis (SEQ ID NO:37), cpflc-pk006.dl8a:fis (SEQ ID NO:39), cpilc . pk005. al2 : fis (SEQ ID NO:41), y crin . pk0028. h3a : fis (SEQ ID NO:43), clon eellc. pk003. blO : fis de Euphorbia lagascae (SEQ ID NO:45), clon eavlc.pk003.c9 de columbina (SEQ ID NO: 47), clon Ids3c.pk011. llifis de guar (SEQ ID NO:49), clon de frijol de soya sdrlf . pk005. d21. f : fis (SEQ ID NO:51) y clon wdrlf .pk002.110:fis de trigo (SEQ ID NO:53). El programa usa rayas para maximizar la alineación. Un asterisco (*) debajo de la alineación indica aminoácidos conservados entre todas las secuencias. El bloque C, un bloque GAS, y motivos conservados de cierre de leucina son indicados en cuadro. La tabla 4 indica la posición de los aminoácidos del bloque C, bloque gas, y dominios de aminoácido conservado con cierre de leucina en la SEQ ID NO:26, 54, 37, 39, 41, 43, 45, 47, 49, 51 y 53. Los aminoácidos en cada dominio son indicados en la Figura 1 y la secuencia de consenso para cada dominio descrita posteriormente en la tabla. Tabla 4 Ubicación de los dominios conservados en RE2 de Oryza sativa y sus homólogos putativos SEQ ID NO: Bloque C Bloque Gas Cierre de Extremo N Extremo C Leu 26/27 33-54 63-74 103-111 116-134 54 37-58 67-78 107-115 120-138 37 34-55 64-75 104-112 117-135 39 24-45 54-65 94-102 107-125 41 32-53 62-73 102-110 115-133 43 24-45 44-55 84-92 97-115 45 30-51 60-71 100-108 113-131 47 22-33 62-70 75-93 49 20-41 50-61 90-98 103-121 51 16-37 46-57 86-94 99-117 53 12-33 42-53 82-90 95-113 En las siguientes secuencias de consenso los aminoácidos son indicados con su código de una letra, posiciones donde más de un aminoácido es encontrado en esa posición son indicados en paréntesis y los aminoácidos separados por un guión. Una X es usada en casos donde en una cierta posición cualquier aminoácido puede estar presente. Los aminoácidos que comprenden el bloque C, terminación N y terminación C del bloque GAS, y el cierre Leu identificados aqui como sigue: La secuencia de consenso de bloque C encontrada en los homólogos de RE2 es indicada en la SEQ ID NO: 55 y corresponde a: SEQ ID NO:55: PCGACKFLRR (K/R) C (V/Q/A) X (G/D/E) C (V/L) FAP (Y/H) F El bloque GAS tiene 49 aminoácidos que tienen una secuencia de consenso de terminación N indicada en la SEQ ID NO: 56 y una secuencia de consenso de terminación C indicada en la SEQ ID NO: 57. SEQ ID NO: 56 FAA (V/I ) HKVFGASN SEQ ID NO:57: RDP(V/I) ( F/Y) GCV (A/S) La secuencia de consenso para el dominio de cierre de leucina es indicado en la SEQ ID NO: 58 y corresponde a: SEQ ID NO:58: LQ(Q/H)QV(A/V/G)XLQX(E/Q) (L/V) X (Y/Q/H) (L/A/V) (Q/K/R )X(H/Q/Y) (L/V) El bloque C, terminación N y termianción C del bloque GAS, y las secuencias de consenso del cierre Leu indicadas anteriormente son indicadas en una alineación Clustal V de polipéptidos similares a RE2 de Oryza sa tiva , de esta forma, deben estar presentes en cualquier polipéptido el cual tiene la misma función de alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla como el polipéptido de RE2 de Oryza sa tiva . Ejemplo 7 Clonación y secuenciación de un fragmento genómico el cual codifica un homólogo de RE2 putativo de maiz y preparación de una construcción de ADN recombinante para plantas mutantes re2 complemento Se amplifica el fragmento de ADN genómico que codifica un homólogo de RE2 de maiz a partir de una biblioteca genómica de maiz, se clona y se secuencia. Entonces, la porción de ADN a partir del ATG iniciador al codon terminador del fragmento que codifica el homólogo RE2 de maiz es usada para reemplazar la porción de ADN a partir del ATG iniciador al codon terminador el cual codifica la proteina RE2 de arroz en el vector 0sRE2pML 18 como sigue. Clonación y secuenciación de un fragmento genómico el cual codifica un homólogo de E2 de maiz El polinucleótido en el clon cpilc . pk005. al2 de ADNc es identificado en el Ejemplo 5 como que codifica un polipéptido con similitud a la proteina RE2 de Oryza sa tiva . Un fragmento genómico el cual comprende la estructura de lectura abierta en el clon cpilc. pk005. al2 es amplificado a partir de la biblioteca genómica de maiz (Stratagene, No. de catálogo 946102) usando cebadores de oligonucleótido Cpi Bbsl F y Cpi Bsal R. Los cebadores de oligonucleótido Cpi Bbsl F y Cpi Bsal R son diseñados en base a la secuencia del clon cpilc. pk005.al2, son indicados en la SEQ ID N0:59 y SEQ ID NO: 60, respectivamente, y tienen las secuencias indicadas como sigue: SEQ ID NO: 59: 5 ' -GAAGACCAATGAGCGCTGGCGGCGGCAGCAG-3' SEQ ID NO:60: 5'- GGTCTCCTCATCTTGAGTGTGGCGGCGGGTGCTC-3' Se realiza la amplificación usando las condiciones sugeridas por el fabricante de la biblioteca. El producto de ADN amplificado el cual comprende un gen homólogo de RE2 de maiz es nombrado ZmRE2 ORF, es clonado en el vector pGEM-T-easy, y es secuenciado. La secuencia de nucleótido obtenida para ZmRE2 ORF es indicada en la SEQ ID NO: 61. Los nucleótidos 79 a 429 corresponden al primer exon, nucleótidos 430 a 1363 corresponden a un intrón, y nucleótidos 1364 a 1784 corresponden al segundo exon, y los nucleótidos 1785 a 1787 corresponden a un codon de detención. A. Preparación de una construcción de ADN recombinante que codifica un homólogo RE2 de maiz putativo Se prepara una construcción de ADN recombinante en la cual un fragmento de ADN genómico que codifica un homólogo de RE2 de maiz presente en el ZmRE2 ORF es usado para reemplazar la región de codificación RE2 de Oryza sa tiva en el vector OsRE2pML18 (preparado en el Ejemplo 3, anterior) . La construcción quimérica resultante comprende el fragmento de ADN genómico el cual codifica un homólogo RE2 de maiz (referido como ZmRE2 ORF) rodeado por las secuencias corriente arriba del ATG iniciador y corriente abajo del codón de terminación a partir del vector OsRE2pML18. Esta construcción quimérica es preparada por amplificar porciones corriente arriba del ATG iniciador y corriente abajo de la señal de terminación en el vector OsRE2pML18, agregar estas porciones al vector pGEM-T-easy el cual contiene ZmRE2 ORF y entonces reemplazar la secuencia de codificación RE2 de Oryza sativa con este fragmento quimérico en el vector OsRE2pMLl8 como sigue: B. Amplificación de un fragmento 5' del gen RE2 de O. sativa en el vector Se amplifica una porción del fragmento 5' de ADN del ARG iniciador en el vector OsRE2pML18 usando los cebadores de oligonucleótido RE2 pro Bst 2F y RE2 PRO R Bbs. Los cebadores de oligonucleótido RE2 pro Bst 2F y RE2 PRO R Bbs son indicados en la SEQ ID NO: 62 y SEQ ID NO: 63, respectivamente, y tienen las secuencias indicadas como sigue : SEQ ID NO:62: 5'- CACCATCATGTCAGTGTGCCAATACGCTAAACTTAGAAGA-3' SEQ ID NO: 63: 5 ' -GAAGACGCTCATTCTTGGAATGAGCCCCCA-3 ' El fragmento amplificado comprende una porción del promotor RE2 de Oryza sa tiva y es clonado en pGEM-T-easy (Promega) para crear RE2PRO de plásmido cuya secuencia es indicada en SEQ ID NO: 64. C. Preparación de una quimera la cual comprende los fragmentos amplificados en A y B anterior La digestión del vector pGEM-T-easy el cual contiene ZmRE2 ORF (preparado en A anterior) con Bbs I y Aat II produce un fragmento de 1760 pb. La endonucleasa de restricción Bbs I corta el vector pGEM-T-easy el cual contiene ZmRE2 ORF inmediatamente corriente arriba del iniciador ATG y Aat II corta en el vector, corriente abajo del codon de detención de maiz. RE2PRO de plásmido es digerido con Bbs I el cual corta inmediatamente arriba del iniciador ATG, y con Sal I el cual corta en la región de clonación múltiple del vector. El fragmento de 4316 obtenido a partir de RE2PR0 de plásmido es ligado al fragmento de 1760 pb obtenido a partir del vector pGEM-T-easy el cual contiene ZmRE2 ORF por introducir los fragmentos en células competentes de DH10B (Invitrogen). El plásmido resultante contiene una porción de la región promotora de RE2 de Oryza sa tiva enlazada operablemente al primer codon del fragmento genómico que codifica un homólogo RE2 de maiz en ZmRE2 ORF. D. Amplificación de un fragmento 3' del gen RE2 de O. Sativa en el vector OsRE2pML18 Se amplifica una porción del fragmento de ADN 3' de la señal de terminación en el vector OsRE2pMI18 usando los cebadores de oligonucleótido RE2 TERM Xbal R y RE2 TERM EcoBspml. Los cebadores de oligonucleótido RE2 TERM Xbal R y RE2 TERM EcoBspml son indicados en SEQ ID NO: 65 y SEQ ID NO: 66, respectivamente, y tienen las secuencias indicadas como sigue: SEQ ID NO:65: 5'- GTAAAAGGATCTAGACACCTGGCTCTAGCCTCCAAGTA-3' SEQ ID NO:66: 5'- TGGAGCGAATTCACCTGCCAAGATGATCCTCCTCACTGTGTGTGATCATC-3' El producto de ADN amplificado el cual comprende una porción de la región terminador RE2 de Oryza sativa es clonada en el vector pGEM9z para producir pRE2TERGEM cuya secuencia es indicada en la SEQ ID NO: 67.
E . Adición del fragmento amplificado en D anterior a la quimera C anterior Las secuencias 3 ' de mai z de la señal de terminación son reempla zadas para secuencias de arroz como sigue . Se digiere el plásmido pRE2TERGEM con Xba I y Eco Rl para remover un fragmento de 758 pb que contiene solamente las secuencias a partir de la región de terminación del gen RE 2 de arroz . Este fragmento de 758 pb es clonado en el vector pGEM7 que ha sido digerido con Xba I y Eco Rl para producir el plásmido RE2TERMpGEM7 . El plásmido RE2TERMpGEM7 es digerido con Bsp Hl y Eco Rl y un fragmento de aproximadamente 3.7 Kb es recuperado . La quimera preparada en C, anterior, es digerida con Bsa I y Eco Rl para remover el fragmento el cual comprende una porción de la región promotora RE3 de Oryza sativa enlazada operablemente al fragmento genómico que codifica un homólogo RE2 de maiz . Estos dos fragmentos son ligados para formar una porción del promotor RE2 de arroz enlazado operablemente al fragmento genómico que codifica un homólogo de RE2 de maiz enlazado operablemente a una porción de la región de terminador RE2 de arroz .
F . Preparación de un vector el cual comprende un fragmento genómico el cual codifica un homólogo de RE2 de maiz bajo el control del promotor y terminador RE2 de Oryza sativa Un vector el cual comprende el fragmento genómico que codifica el homólogo RE2 de maiz baj o el control regiones de promotor y terminador RE2 de Oryza sativa es ensamblada a partir del vector OsRE2pML18 y el fragmento quimérico preparado en la parte E anterior, como sigue. El vector OsRE2pML18 y el fragmento quimérico preparado en la parte E anterior son digeridos con las endonucleasas de restricción Bst EII y SaxAI . La digestión del vector OsRE2pML18 remueve la región de codificación RE2 de Oryza sativa y porciones del promotor y regiones de terminador a partir del vector OsRE2pML18 el cual deja un fragmento de ADN de 12.1 kb . La digestión del fragmento preparado en la parte E anterior, produce un fragmento de 3.1 Kb el cual comprende un fragmento el cual codifica un homólogo RE2 de maiz entre las porciones del promotor RE2 de Oryza sativa y las regiones terminadoras. El ligamiento de los fragmentos de 12.1 y 3.1 kb producen un vector el cual comprende un fragmento el cual codifica un homologo de RE2 de maiz bajo el control del promotor y terminador de RE2 de Oryza sativa. El vector el cual comprende la estructura de lectura abierta del homologo RE2 de maiz bajo el control de regiones de promotor y terminadoras de RE 2 de Oryza sativa es nombrado ZmRE2pML18. Ejemplo 8 Complementación genética de planta mutante re2 de arroz con un homólogo de RE2 de maiz La confirmación de la función del homólogo RE2 de maiz, identificado en el Ejemplo 5 anterior, es realizado usando la complementación genética. Las células de callo de arroz derivadas de las plantas mutantes re2 de arroz son transformadas con el vector ZmRE2pML18 preparado como se describe en el Ejemplo 7 anterior. Las transformaciones son realizadas usando una pistola Biolistic PDS-1000/He y la técnica de bombardeo de particulas como en el Ejemplo 3 anterior . La transformación de las células mutantes re2-l con el vector ZmRE2pML18 produce 14 plantas transgénicas. Trece de estas catorce plantas producen semillas de las cuales diez plantas producen semillas que tienen apariencia del tipo silvestre. Algunas de las semillas producidas por estas diez plantas tiene un fenotipo del tipo silvestre y algunas tienen un fenotipo mutante re2. La proporción de las semillas que tienen una apariencia del tipo silvestre a semillas que tienen un fenotipo mutante re2 varia en cada planta. Aproximadamente 25% a 70% de las semillas obtenidas a partir de plantas mutantes de re2-l individuales transformadas con el vector ZmRE2pML18 tienen una apariencia del tipo silvestre. El restablecimiento de una apariencia del tipo silvestre en semillas a partir de plantas regeneradas a partir de las células mutantes re2 transformadas con el vector el cual comprende el fragmento el cual codifica el homólogo de RE2 de maiz indica que el homólogo RE2 de maiz, codificado por ZmRE2 (SEQ ID NO: 61), es capaz de complementar una mutación re2. Estos resultados sugieren que el homólogo RE2 de maiz realiza la misma función en maiz como la proteina RE2 de arroz realiza en el arroz. Ejemplo 9 Identificación de un clon de ADNc que codifica OsRE2 Un clon de ADNc que codifica 0sRE2 es identificado por tamizar una biblioteca de ADNc de fago de arroz usando una sonada especifica a RE2. Se prepara la biblioteca de ADNc de fago a partir del ARN total extraído a partir de desarrollar semillas de arroz cosechadas 2-5 dias después de la polinación como sigue. Se extrae el ARN total usando un reactivo Triazol® el cual contiene fenol y tiocianato de guanidina (Life Technologies, Inc., Rockville, Md) . Se purifica el ARNm poli (a) a partir del ARN total usando los equipos de purificación de ARNm los cuales consisten de columnas de giro de oligo (dT) -celulosa (Amersham Pharmacia Biotech Inc. Piscataway. El ADNc es sintetizado usando 5.5 µg de ARNm poli (a) y equipos de sintesis de ADNc (Stratagene, La Jolla, CA) siguiendo el protocolo del fabricante con la excepción de usar la transcriptasa inversa de Superscript ® (Life Technologies, Inc.) en la primera etapa de transcriptasa inversa de virus de leucemia de murino Moloney. El ADNc es fraccionado en tamaño usando las columnas de fracción de tamaño de ADNc BRL (GIBCO-BRL) . Las fracciones 1 a 13 son precipitadas, resuspendidas y ligadas con el 1 µg de vector Uni-ZAP XR siguiendo las instrucciones del fabricante. Después de la incubación por dos dias en 4°C se empaca el ADN ligado usando el extracto de empaque Gigapack III Gold® (Stratagene) , La Jolla, CA) . El titulo de la bibliteca resultante es aproximadamente 7.8 x 105 unidades formadoras de placa por ml (pfu/ml) . Se amplifica la biblioteca de fago de ADNc siguiendo las instrucciones del fabricante y se obtienen 150 ml de biblioteca de ADNc de fase. La biblioteca amplificada tiene un titulo de 5.5 x 108 pfu/ml. Se realiza el tamizado para el ADNc de RE2 siguiendo los protocolos estándar bien conocidos por aquellos expertos en la técnica (Ausubel et al. 1993, Current Protocols in Molecular Biology" John Wiley & Sons, Usa, o Sambrook et al. 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press). Brevemente, se colocan en placas 1.0 x 106 pfu, se transfieren a membranas de nylon, y se someten a hibridización con segunda sonda de exon RE2 etiquetado radioactivamente. La secuencia de nucleótido de la segunda sonda de exon RE2 es mostrada en la SEQ ID NO: 71. Siguiendo la hibridización se exponen las membranas a película donde aproximadamente una placa positiva es detectada por 100,000 placas. Ocho placas que dan una señal positiva son aisladas después de una segunda vuelta de tamizado. Se prepara el ADN de fago lambda a partir de 8 placas, se convierte en el ADN de plásmido, y se secuencia. Seis de los ocho clones contienen una secuencia de ADNc que codifica OsRE2. Uno de estos seis clones, Cl ADNc RE2, tiene un 5 'UTR que extiende 196 nucleótidos corriente arriba del codón de inicio ATG predicho a partir de la secuencia genómica. La secuencia de nucleótido del clon Cl de ADNc RE2 es mostrado en la SEQ ID NO: 72. Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (19)

  1. REIVINDICACIONES Habiéndose descrito la invención como antecede se reclama como propiedad lo contenido en las siguientes reivindicaciones : 1. Un polinucleótido aislado caracterizado porque comprende comprende: a) una secuencia de ácido nucleico la cual codifica un polipéptido implicado en alterar el tamaño de embrión/endospermo durante el desarrollo de semillas, el polipéptido que tiene por lo menos 80% de identidad de secuencia de aminoácidos, en base al método Clustal V de alineación, cuando se compara con una secuencia de aminoácidos seleccionada del grupo el cual consiste de SEQ ID NO: 37, 39, 41, 43, 45, 47, 49, 51 y 53; o b) una secuencia de ácido nucleico indicada en la SEQ ID NO: 25 en donde la secuencia comprende por lo menos una de las siguientes modificaciones: (i) el nucleótido 271 es un residuo T en lugar de un C; (ii) el nucleótido 110 es un residuo T en lugar de G; o (iii) el nucleótido 75 es eliminado; o c) una secuencia de ácidos nucleicos indicada en la SEQ
  2. ID NO: 34 en donde (i) los nucleótidos 4473 a 4829 corresponden a un primer exón, y (ii) los nucleótidos 5661 a 6110 corresponden a un segundo exón, y además en donde los nucleótidos de (c) (i) y/o (c) (ii) codifican un polipéptido implicado en alterar el tamaño del embrión/endospermo durante el desarrollo de semillas; o d) una secuencia de ácido nucleico indicada en la SEQ ID NO; 72 o e) un complemento total de (a) , (b) , (c) , (d) o SEQ ID NO:34 o f) todo o parte de una región no codificante o codificante del polinucleótido aislado el cual comprende las secuencias de (a), (b) , (c) , (d) , (e) o SEQ ID NO: 34 para uso en la co-supresión o supresión antisentido de secuencias de ácido nucleico endógenas que codifican los polipéptidos implicados en alterar el tamaño del embrión/endospermo durante el desarrollo de la semilla. 2. El polinucleótido aislado de conformidad con la reivindicación 1, caracterizado porque' la identidad de secuencia de aminoácidos es por lo menos 85%.
  3. 3. El polinucleótido aislado de conformidad con la reivindicación 1, caracterizado porque la identidad de secuencia de aminoácido es por lo menos 90%.
  4. 4. El polinucleótido aislado de conformidad con la reivindicación 1, caracterizado porque la identidad de secuencia de aminoácidos es por lo menos 95.
  5. 5. El polinucleótido aislado de conformidad con la reivindicación 1, caracterizado porque la identidad de secuencia de aminoácidos es por lo menos 100%.
  6. 6. El polinucleótido aislado de conformidad con la reivindicación 1, caracterizado porque la secuencia de nucleótidos corresponde a cualquiera de las secuencias de nucleótido indicadas en la SEQ ID NO:34, 36, 38, 40, 42, 44, 46, 48, 50, 52 y 72.
  7. 7. Una construcción de ADN recombinante caracterizada porque comprende el polinucleótido aislado de conformidad con cualquiera de las reivindicaciones 1-6 enlazado operablemente a por lo menos una secuencia regulatoria.
  8. 8. Una planta caracterizada porque comprende en su genoma la construcción de ADN recombinante de conformidad con la reivindicación 7.
  9. 9. Las semillas y progenie de las mismas obtenidas a partir de la planta de conformidad con la reivindicación 8.
  10. 10. El aceite caracterizado porque es obtenido a partir de las semillas de conformidad con la reivindicación 9.
  11. 11. La planta de conformidad con la reivindicación 8, caracterizada porque la planta es seleccionada del grupo el cual consiste de arroz, maiz, sorgo, mijo, centeno, frijol de soya, cañóla, trigo, cebada, avena, frijoles y nueces.
  12. 12. El tejido vegetal o células vegetales transformados caracterizadas porque comprenden la construcción de ADN recombinante de conformidad con la reivindicación 7.
  13. 13. El tejido vegetal o células vegetales transformados de conformidad con la reivindicación 12, caracterizados porque la planta se selecciona del grupo el cual consiste de arroz, maiz, sorgo, mijo, centeno, frijol de soya, cañóla, trigo, cebada, avena, frijoles y nueces.
  14. 14. Un método para alterar el tamaño del embrión/endospermo durante el desarrollo de semillas en una planta caracterizado porque comprende: (a) transformar las células vegetales o tejido vegetal con la construcción de ADN recombinante de conformidad con la reivindicación 7; (b) regenerar las plantas transgénicas a partir de las células vegetales o tejido vegetal transformados de ( a ) ; (c) obtener semillas y progenie de los mismos a partir de plantas transgénicas de (b) las cuales tienen el tamaño de embrión/endospermo alterados en base a una comparación de tamaño de embrión/endospermo de semillas obtenidas a partir de plantas no transformadas .
  15. 15. El método de conformidad con la reivindicación 14, caracterizado porque la planta se selecciona del grupo el cual consiste de arroz, maiz, sorgo, mijo, centeno, frijol de soya, cañóla, trigo, cebada, avena, frijoles y nueces.
  16. 16. Un método para mapear las variaciones genéticas relacionadas a controlar el tamaño del embrión/endospermo y/o alterar el fenotipo de aceite en plantas caracterizado porque comprende : (a) cruzar dos variedades vegetales; y (b) evaluar las variaciones genéticas con respecto a (i) una secuencia de ácido nucleico seleccionada del grupo el cual consiste de la SEQ ID NO: 25, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 y 72; o (ii) una secuencia de ácido nucleico que codifica un polipéptido seleccionado del grupo el cual consiste de la SEQ ID NO:26, 29, 31, 33, 37, 39, 41, 43, 45, 47, 49, 51 y 53; en las plantas de progenie que resultan del cruce de la etapa (a) en donde la evaluación es hecha usando un método seleccionado del grupo que consiste de análisis RFLP, análisis SNP y análisis a base de PCR.
  17. 17. El método de conformidad con la reivindicación 16, caracterizado porque la planta es seleccionada del grupo el cual consiste de arroz, maiz, sorgo, mijo, centeno, frijol de soya, cañóla, trigo, cebada, avena, frijoles y nueces
  18. 18. Un método de reproducción molecular para controlar el tamaño del embrión/endospermo y/o alterar el fenotipo de aceite en plantas caracterizado porque comprende: (a) cruzar dos variedades vegetales; y (b) evaluar las variaciones genéticas con respecto a (iii) una secuencia de ácido nucleico seleccionada del grupo el cual consiste de la SEQ ID NO: 25, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 y 72; o (iv) una secuencia de ácido nucleico que codifica un polipéptido seleccionado del grupo el cual consiste de la SEQ ID NO:26, 29, 31, 33, 30, 32, 34, 36, 38, 40, 42, 44 y 46; en las plantas de progenie que resultan del cruce de la etapa (a) en donde la evaluación es hecha usando un método seleccionado del grupo que consiste de análisis RFLP, análisis SNP y análisis a base de PCR.
  19. 19. La planta de conformidad con la reivindicación 18, caracterizada porque la planta es seleccionada del grupo el cual consiste de arroz, maiz, sorgo, mijo, centeno, frijol de soya, cañóla, trigo, cebada, avena, frijoles y nueces.
MX2007011542A 2005-03-23 2006-03-21 Alteracion del tamano del embrion/endospermo vegetal durante el desarrollo de la semilla. MX2007011542A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US66451205P 2005-03-23 2005-03-23
PCT/US2006/010530 WO2006102491A2 (en) 2005-03-23 2006-03-21 Alteration of plant embryo/endosperm size during seed development

Publications (1)

Publication Number Publication Date
MX2007011542A true MX2007011542A (es) 2007-10-19

Family

ID=36694427

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2007011542A MX2007011542A (es) 2005-03-23 2006-03-21 Alteracion del tamano del embrion/endospermo vegetal durante el desarrollo de la semilla.

Country Status (6)

Country Link
US (2) US7582817B2 (es)
EP (1) EP1869189A2 (es)
AU (1) AU2006226975A1 (es)
CA (1) CA2602345A1 (es)
MX (1) MX2007011542A (es)
WO (1) WO2006102491A2 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112008001044T5 (de) * 2007-05-03 2010-09-02 Basf Plant Science Gmbh Pflanzen mit verbesserten Ertragsmerkmalen und Verfahren zu ihrer Herstellung
GB201501941D0 (en) 2015-02-05 2015-03-25 British American Tobacco Co Method
CN108707685B (zh) * 2018-04-16 2022-04-01 张家口市农业科学院 与谷子分蘖数性状相关的snp标记及其检测引物和应用
CN108642198B (zh) * 2018-04-16 2022-04-01 张家口市农业科学院 一种与谷子分蘖数性状相关的snp标记及其检测引物和应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4956282A (en) * 1985-07-29 1990-09-11 Calgene, Inc. Mammalian peptide expression in plant cells
US7365185B2 (en) * 2000-07-19 2008-04-29 Monsanto Technology Llc Genomic plant sequences and uses thereof

Also Published As

Publication number Publication date
WO2006102491A2 (en) 2006-09-28
CA2602345A1 (en) 2006-09-28
US20090217412A1 (en) 2009-08-27
EP1869189A2 (en) 2007-12-26
AU2006226975A1 (en) 2006-09-28
US7582817B2 (en) 2009-09-01
WO2006102491A3 (en) 2007-03-08
US20060218674A1 (en) 2006-09-28

Similar Documents

Publication Publication Date Title
EP1412375B1 (en) Alteration of oil traits in plants
JP4177881B2 (ja) 種子発生期における胚/内乳のサイズの改変
US20130326720A1 (en) Altering root structure during plant development
WO2007067960A2 (en) The or gene and its use in manipulating carotenoid content and composition in plants and other organisms
US7582817B2 (en) Alteration of plant embryo/endosperm size during development
EP2617831A2 (en) Plants with altered root architecture, related constructs and methods involving genes encoding leucine rich repeat kinase (llrk) polypeptides and homologs thereof
WO2004067723A2 (en) Floral development genes
AU2002310288A1 (en) Alteration of embryo/endosperm size during seed development
US20100199369A1 (en) Alteration of Plant Embryo/Endosperm Size During Seed Development
US8153860B2 (en) Alteration of embryo/endosperm size during seed development
EP1208204B1 (en) Plant reproduction proteins
EP2343967A1 (en) NOVEL At1g67330 GENE INVOLVED IN ALTERED NITRATE UPTAKE EFFICIENCY

Legal Events

Date Code Title Description
FA Abandonment or withdrawal