MX2013010197A - Promotores para regular la expresion en plantas. - Google Patents

Promotores para regular la expresion en plantas.

Info

Publication number
MX2013010197A
MX2013010197A MX2013010197A MX2013010197A MX2013010197A MX 2013010197 A MX2013010197 A MX 2013010197A MX 2013010197 A MX2013010197 A MX 2013010197A MX 2013010197 A MX2013010197 A MX 2013010197A MX 2013010197 A MX2013010197 A MX 2013010197A
Authority
MX
Mexico
Prior art keywords
nucleic acid
expression
sequence
plant
sequences
Prior art date
Application number
MX2013010197A
Other languages
English (en)
Inventor
Josef Martin Kuhn
Holger Schultheiss
Julia Verena Hartig
Linda Patricia Loyall
Elke Duwenig
Marc Saric
Maarten Hendrik Stuiver
Oliver Oswald
Original Assignee
Basf Plant Science Co Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Plant Science Co Gmbh filed Critical Basf Plant Science Co Gmbh
Publication of MX2013010197A publication Critical patent/MX2013010197A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8225Leaf-specific, e.g. including petioles, stomata
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8237Externally regulated expression systems
    • C12N15/8239Externally regulated expression systems pathogen inducible
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Communicable Diseases (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Developmental Biology & Embryology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Virology (AREA)
  • Botany (AREA)
  • Environmental Sciences (AREA)

Abstract

Se proveen moléculas de ácido nucleico aisladas capaces de regular expresión en plantas, así como casetes de expresión, vectores y plantas transgénicas comprendiendo los mismos.

Description

PROMOTORES PARA REGULAR LA EXPRESIÓN EN PLANTAS CAMPO DE LA INVENCIÓN La presente invención se refiere a moléculas de ácido nucleico aisladas capaces de regular la expresión en plantas asi como casetes de expresión, vectores y plantas transgéni.cas que comprenden las mismas.
ANTECEDENTES DE LA INVENCIÓN La manipulación de plantas para alterar y/o mejorar las características fenotípicas (tales como productividad, calidad o resistencia a peste) requiere la expresión de genes heterologos en tejidos vegetales. Dicha manipulación genética depende de la. disponibilidad de un medio para impulsar y controlar la expresión de genes según se requiera. Por ejemplo, la manipulación genética depende de la disponibilidad y uso de promotores adecuados que sean efectivos en plantas y que regulen la expresión de genes para así dar el efecto(s) deseado en la planta transgénica. Para numerosas aplicaciones en biotecnología de plantas, es ventajoso un perfil de expresión específico de tejido, ya que efectos benéficos, de expresión en un tejido pueden tener desventajas en otros. Por ejemplo, los promotores que impulsan la expresión en la epidermis vegetal, tales como promotores preferenciales de epidermis o específicos de epidermis son útiles para expresar genes que previenen que patógenos tales como hongos o bacteria infecten una planta a través de la epidermis. Es ventajoso tener la elección de una variedad de diferentes promotores, de modo que el promotor más adecuado se puede seleccionar para un gen, construcción, célula, tejido, planta o medio ambiente particular. Además, el interés en aumento por transformar plantas con múltiples unidades de. transcripción de planta (PTU) y los problemas potenciales asociados con el uso de moléculas reguladoras comunes para estos propósitos ameritan tener una variedad de moléculas promotoras disponibles.
Por lo tanto, hay una necesidad constante en la técnica por la identificación de moléculas novedosas que se puedan usar para la expresión de transgenes seleccionados en plantas económicamente importantes. De esta manera, un objetivo de la presente invención es proveer casetes de expresión de transgenes nuevos y alternativos en varios tejidos de plantas, por ejemplo, en la epidermis. La presente invención resuelve el objetivo.
BREVE DESCRIPCIÓN DE LA INVENCIÓN Una primera modalidad de la invención se refiere a una molécula de ácido nucleico aislada capaz de regular expresión en plantas seleccionada de la lista que comprende una molécula descrita por SEC ID NO: 1 , 2, 3, 4, 5, 6·, 7, .8, 9, 10, 11, 12, 13, 14, 15, Í6, 17, 18, 19, 20, 21, 22, 23, 24, 25, i ' 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, i , 74, 75, 76, 77, 78, 79, 80, 81 , 82, 83, 84, 85, 86, 87, 88 u 89, y un fragmento de por lo menos 250 bases consecutivas de una molécula descrita por cualquiera de SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u 89, y ! una molécula de nucleótido de por lo menos 250 bases consecutivas con una identidad de secuencia de por lo menos 60% a una molécula de nucleótido reguladora de transcripción descrita por cualquiera de SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, .79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u 89, y ? ' ¦ . I una molécula de nucleótido con una identidad de secuencia de por lo menos 60% de una molécula de nucleótido reguladora de transcripción descrita por cualquiera de SEC. ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u 89, y una molécula de nucleótido de por lo menos 250 bas.es capaz de hibridar bajo condiciones equivalentes a hibridación en 7% de dodecil sulfato de sodio (SDS), 0.5 M NaP04, 1 mM EDTA a 50°C con lavado en 0.1 X SSC, 0.1% SDS a 50°C a una molécula de nucleótido reguladora de transcripción descrita por cualquiera de SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 , Í3, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41,, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u ·¦ 89, o el complemento de la misma; una molécula de nucleótido de por lo menos 250 bases capaz de hibridar bajo condiciones equivalentes a hibridación en 7% de dodecil sulfato de sodio (SDS), 0.5 M NaP04l 1 mM EDTA a 50°C con lavado en 0.1. X SSC, 0.1% SDS a 50°C a un ácido nucleico que comprende 250 o más nucleótidos consecutivos de una molécula de nucleótido reguladora de transcripción describa por cualquiera de SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, .47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, . 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u 89, o el complemento dé la misma; vii) una molécula de nucleótido que es el complemento o , complemento invertido de cualquiera de las secuencias de nucleótido previamente mencionadas bajo i) a vi).
En otra modalidad, las moléculas de ácido nucleico aisladas teniendo una secuencia comb se definió antes bajo i), ¡i), jii), iv), v), vi) y vii) son capaces de impulsar expresión constitutiva en plantas, o expresión en epidermis de planta o mesofilo. En otra modalidad, la expresión derivada de las moléculas de ácido nucleico aisladas como se definió antes bajo i), ii), iii), iv), v), vi) y vii) es inducible en epidermis de planta y/o mesofilo por infección de patógeno, por ejemplo, por infección con un hongo.
En una modalidad preferida, las moléculas de ácido nucleico aisladas capaces de regular la expresión en plantas teniendo una secuencia como se definió antes bajo ii) comprenden un promotor mínimo, preferiblemente el promotor mínimo de la molécüla de ácido nucleico aislada respectiva.
La molécula de ácido nucleico aislada se puede obtener o es. obtenible de ADN genómico vegetal a partir de un gen (por ejemplo, de ADN genómico vegetal) codificando un polipéptido que comprende una secuencia de aminoácido que tiene por lo menos 80% de homología de secuencia de aminoácido a un polipéptido seleccionado a partir del grupo descrito por SEC ID NO: 221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 253 y 255.
La molécula de ácido nucleico aislada se puede obtener o es obtenible a partir de ADN genómico vegetal a partir de un gen que tiene por lo menos 80% de identidad de secuencia a una molécula de ácido nucleico seleccionada a partir del grupo descrito por SEC ID NO: 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252 y 254.
En una modalidad, las moléculas de ácido nucleico teniendo una secuencia como se especificó antes capaces de modificar la transcripción en una planta, o parte de la misma, por ejemplo, en una célula vegetal. Más específicamente, las moléculas de ácido nucleico aisladas teniendo una secuencia como se especificó antes, son capaces de modificar la transcripción constitutivamente, en la epidermis y/o mesofilo de una planta o una célula vegetal derivada de dicho tejido. :, Es también una modalidad de la invención que nos ocupa que las moléculas de ácido nucleico aisladas como se definió antes teniendo las secuencias especificadas bajo ii), iii), iv), y), vi) y vii) tienen sustancialmente la misma actividad reguladora de transcripción como la molécula de nucleótido reguladora de ¦¦ ¦ ¦ i ' transcripción correspondiente descrita por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 2, .13, 14, 5, 16, 17 y 18 que se derivan de las mismas.
Preferiblemente, la molécula de ácido nucleico aislada se i r selecciona a partir del grupo de moléculas descritas por SEC ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34', 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u 89 o cualquier homólogo o fragmento de la misma. Más. pjreferible, la molécula de nucleótido reguladora de transcripción se selecciona a partir del grupo de moléculas que consiste de: i) una molécula descrita por SEC ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, '88 u 89, y ii) un fragmento de por lo menos 250 bases consecutivas, preferiblemente por lo menos 300 bases consecutivas, más preferible por lo menos 400 bases consecutivas, incluso más preferible por lo menos 500 bases consecutivas, muy preferible por lo menos 750 bases consecutivas de una molécula descrita por cualquiera de SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56,· 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u 89, y una molécula de nucleótido de por lo menos 250 bases consecutivas, preferiblemente por lo menos 300 bases consecutivas, más preferible por lo menos 400 bases consecutivas, incluso más preferible por lo menos 500 bases consecutivas, muy preferible por lo menos 750 bases consecutivas con una identidad de secuencia de pjor lo menos 60%, 65% o 70%, preferiblemente por lo menos 75%, 80% u 85%, más preferible por lo menos 90% o 95%, incluso más preferible por lo menos 96% o 97%, muy preferible por lo menos 98% o 99% a una molécula de nucleótido reguladora de transcripción descrita por cualquiera de SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69; 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, . 87, 88 u 89, y una molécula de nucleótido con una identidad de secuencia de por lo menos 60%, 65% o 70%, preferiblemente por lo menos 75%, 80% u 85%, más preferible por lo menos 90% o 95%, incluso más preferible por lo menos 96% o 97%, muy preferible por lo menos 98% o 99% a una molécula de ác do nucleico aislada capaz de regular expresión en plantas descrita por cualquiera de SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 1.2, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42,. 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u 89, y una molécula de nucleótido de por lo menos 250 bases, preferiblemente por lo menos 300 bases, más preferible por lo menos 400 bases, incluso más preferible por lO jinenos 500 bases, muy preferible por lo menos 750 bases capaz de hibridar bajo condiciones equivalentes a hibridación en 7% de dod.ecil sulfato de sodio (SDS), 0.5 M NaP04, 1 mM EDTA a ,50°C con lavado en 0.1 X SSC, 0.1% SDS. a 50°C, más deseable en 7% SDS, 0.5 M NaP04, 1 mM EDTA a 50°C con lavado en 0.1 X SSC, 0.1% SDS a 65°C a una molécula de ácido nucleico aislada capaz de regular expresión en plantas descrita por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62,, 63, 64.,.65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 8.0, 81, 82, 83, 84, 85, 86, 87, 88 u 89, o el complemento de la misma; una molécula de nucleótido de por lo menos 250 bases, preferiblemente por lo menos 300 bases, más preferible por lo menos 400 bases, incluso más preferible por lo menos 500 bases, muy preferible por lo menos 750 bases, capaz de hibri.dar bajo condiciones equivalentes a hibridación en 7% de dodecil sulfato de sodio (SDS), 0.5 M NaP04, 1 m EDTA a 50°C con lavado en 0.1 X SSC, 0.1% SDS a 50°C, más deseable en 7% SDS, 0.5 M NaP04, 1 mM EDTA a -50°C con lavado en 0.1 X SSC, 0.1% SDS a 65°C a un ácido nucleico que comprende 250, preferiblemente por lo menos 300, más preferible por lo menos 400, incluso más preferible por lo menos 500, muy preferible por lo menos 750 nucleótidos consecutivos de una molécula de ácido nucleico aislada capaz de regular expresión en plantas descrita por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 1¾, 20, 2.1, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, , 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83., 84, 85, 86, 87, 88 u 89, o el complemento de la misma; una molécula de ácido nucleico aislada capaz de regular expresión en plantas que es el complemento o complemento invertido de cualquiera de las moléculas de ácido nucleico previamente mencionadas bajo i) a vi).
En una modalidad preferida, las moléculas de ácido nucleico aisladas capaces de regular expresión en plantas teniendo una secuencia como se definió antes bajo ii) comprenden un promotor mínimo, preferiblemente el promotor mínimo de la molécula de ácido nucleico respectiva.
Otra modalidad de la invención es un cásete de expresión para regular expresión en plantas que comprende a) por lo menos una molécula de ácido nucleico aislada capaz de regular expresión en plantas como se definió antes, . y funcionalmente ligado a la misma b) por lo menos una molécula de ácido nucleico que es heteróloga en relación a dicha molécula de nucleótido reguladora de transcripción que se debe expresar en una planta o parte de la misma.
La molécula de nucleótido heteróloga a expresarse en una planta o parte de la misma además de preferencia se liga operativamente a intrones, teniendo efectos potenciadores . de expresión, NEENAs (WO2011023537, WO2011023539) , regiones no traducidas 5' y 3', terminación de transcripción y/o señales de poliadenilación. Las regiones 3' no traducidas son adecuadas para estabilizar expresión y estructura de mARN. Esto puede resultar en presencia prolongada del mARN y así niveles , dé expresión mejorados. Las señales de terminación y poliadenilación son adecuadas para estabilizar expresión de mARN (por ejemplo, por estabilización de la transcripción de ARN y por tanto el nivel de ARN) para asegurar longitud de transcripción de mARN constante y prevenir transcripción de revisión. Especialmente en construcciones de expresión de multigenes , esto es un aspecto importante. Además, la terminación correcta de transcripción se liga a la re-iniciación de transcripción a partir de la secuencia de nucleótido 5' reguladora que resulta en niveles de expresión mejorados. Las señales antes mencionadas puede ser cualquier señal funcional en plantas y, por ejemplo, se pueden aislar de genes vegetales, genes de virus vegetal u otros patógenos vegetales. Sin embargo, en una modalidad preferida, las regiones 3' no traducidas, señales de terminación de transcripción y poliadenilación. son de los genes empleados como la fuente para los promotores de esta invención.
Las moléculas reguladoras de expresión de la invención se ¦pueden utilizar para expresar cualquier clase de molécula de ácido nucleico. Por ejemplo, la expresión de la molécula de ácido nucleico puede resultar en expresión de una proteína, o expresión de un AR anti-sentido, ARN de sentido o doble cadena. Preferiblemente, la expresión de la molécula de ácido nucleico confiere á la planta un rasgo agronómicamente valioso.
Otra modalidad de la invención se refiere a un vector que comprende una molécula de ácido nucleico aislada o u:n cásete de expresión de la invención. Todavía otra modalidad de la invención se refiere a una célula huésped transgénica u organismo no humano que comprende un cásete de expresión o un vector de la invención. Todavía otra modalidad de la invención se refiere a' una planta transgénica o célula vegetal que comprende un cásete de expresión o un vector de la invención. Preferiblemente, dicha planta o célula vegetal es de una planta dicotiledónea, preferiblemente de la familia Fabacea, más preferible del género Glycine, muy preferible la especie Glycine max.
Otra modalidad de la invención es un método para la producción de un cásete de expresión como se definió antes o un vector como se definió antes que comprende los pasos de a. proveer una molécula de ácido nucleico aislada capaz de regular expresión en plantas como se definió antes y b. funcionalmente ligando dicha molécula de ácido nucleico aislada a por lo menos una molécula de ácido nucleico heteróloga a dicha molécula de ácido nucleico aislada.
Una modalidad adicional de la invención es un método para la producción de una planta transgénica que comprende los pa$os de a. proveer un cásete de expresión como se definió antes o un vector como se definió antes y b. transformar dicho cásete de expresión o vector en una planta o célula vegetal y c. regenerar una planta a partir de dicha parte de planta transformada o célula vegetal.
Una modalidad adicional de la invención es un método para proveer un cásete de expresión que comprende una molécula de ácido nucleico aislada capaz de regular expresión en planta que comprende los pasos de ¡i a) aislar una primera molécula de ácido nucleico a partir de ADN genómico vegetal usando por lo menos 15 bp consecutivos, preferiblemente por lo menos 20 bp consecutivos de una secuencia descrita por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 ó 18 ó 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252 y 254 y b) funcionalmente ligando la primera molécula de ácido nucleico, obtenida en el paso a) a por lo menos una molécula de ácido nucleico adicional heteróloga a dicha primera molécula de ácido nucleico..
DEFINICIONES Se debe entender que esta invención no se limita a la metodología particular, protocolos, líneas celulares, especies o géneros de plantas, construcciones, y reactivos descritos cómo tales. También se debe entender que la terminología usada en' la presenté es para el propósito de describir sólo modalidades particulares, y no pretende limitar el alcance de la presente invención, qué se limitará sólo por las reivindicaciones anexas. Cabe señalar que como se usa en la presente y en las reivindicaciones anexas, las formas, en singular de "un", "y" y "el" incluyen la referencia en plural a menos que el contexto claramente dicte lo contrario. De esta manera, por ejemplo, la referencia a "un vector" es una referencia a uno o más vectores e incluye equivalentes de los mismos conocidos a aquellos expertos en la técnica, y así sucesivamente.
El. término "aproximadamente" se usa en la presente para significar aproximadamente,, casi, alrededor de, o en la región de. Cuando el término "aproximadamente" se usa en conjuntó con un rango, numérico, modifica ese rango al extender los límites arriba y debajo de los valores numéricos establecidos. En general, el término ''aproximadamente" se usa en la presente para modificar un valor numérico arriba y debajo del valor mencionado por una yarianza de 20 por ciento, preferiblemente 10 por ciento arriba o abajo (mayor o menor).
Como se usa en la presente, la palabra "o" significa cualquier miembro de una lista particular y también incluye cualquier combinación de miembros de esa lista.
El término "gen" se usa ampliamente para referir a cualquier segmento de ácido nucleico asociado con una función biológica; De esta manera, los genes incluyen secuencias codificadoras y/o las moléculas reguladoras requeridas para su expresión. Por ejemplo, gen se refiere a un fragmento de ácido nucleico que expresa mARN o ARN funcional, o codifica una proteína específica, y que incluye moléculas reguladoras. Los genes también incluyen segmentos de ÁDN no expresados que, por ejemplo, forman secuencias de reconocimiento para otras proteínas. Los genes se pueden obtener a partir de una variedad de fuentes, incluyendo clonar a partir de una fuente de interés o sintetizar a partir de información de secuencia conocida o predicha, y puede incluir secuencias diseñadas para tener parámetros deseados.
El término gen "nativo" o "tipo silvestre" se refiere a un gen •que está presente en el genoma de una célula no transformada, es decir, una célula que no tiene una mutación conocida.
Un "gen marcador" codifica un rasgo que se puede seleccionar o explorar.
El término "gen quimérico" se refiere a cualquier gen que contiene 1) secuencias de ADN, incluyendo secuencias reguladoras y codificadoras, que no se ligan funcionalmente juntas en naturaleza, o 2) secuencias codificando partes de proteínas que no se juntan de manera natural, o 3) partes de promotores que no se juntan de manera natural.
Por consiguiente, un gen quimérico puede comprender moléculas reguladoras y codificadoras que se derivan de diferentes fuentes, o comprenden moléculas reguladoras, y secuencias codificadoras derivadas de la misma fuente, pero distribuidas en una manera diferente de aquella encontrada en la naturaleza.
Un "transgen" se refiere a un gen que ha sido introducido en el genoma por transformación y se mantiene establemente. Los transgenes pueden incluir, por ejemplo, genes que son heterólogos u homólogos a los genes de una planta particular a transformarse. Adicionalmente, los transgenes pueden comprender genes nativos insertados en un organismo no nativo, o genes quiméricos. El término "gen endógeno" se refiere a un gen nativo en su ubicación natural en el genoma de un organismo. Un gen "extraño" se refiere a un gen no encontrado normalmente en el organismo huésped pero que se introduce por transferencia de genes.
Un "oligonucleótido" correspondiente a una secuencia de nucleótido de la invención, por ejemplo, para usarse en reacciones de sondeo o amplificación, puede ser aproximadamente 30 o menos nucleótidos en longitud (por ejemplo, 9, 12, 15, 18, 20, 21, 22, 23 ó 24, o cualquier número entre 9 y 30). En general, los cebadores específicos son ascendentes o 14 nucleótidos en longitud. Para especificidad óptima y efectividad en costo, se pueden preferir cebadores de 16 a 24 nucleótidos. Aquellos expertos en la técnica son bien versados en el diseño de cebadores para usar procesos como PCR. Si se requiere, el sondeo se puede hacer con fragmentos de restricción entera del gen descrito en la presente que puede ser 100's o incluso 1000's de nucleótidos en longitud.
Los términos "polipéptido", "péptido", "oligopéptido'', "producto de gen", "producto de expresión" y "proteína" se usan dé manera intercambiable en la presente para referir a un polímero u oligómero de residuos de aminoácido consecutivos. Como se usa en la presente, el término "secuencia de aminoácido" o una "secuencia de polipéptido" se refiere a una lista de abreviaciones, letras, caracteres o palabras representando residuos de aminoácido. Los aminoácidos pueden ser referidos en la presente por sus símbolos-. de tres letras comúnmente conocidos o por los símbolos de una letra recomendados por la comisión IUPAC-IUB Biochemical Nomenclature Commission. Las abreviaciones usadas en la presente son códigos convencionales de una letra para los aminoácidos: A, alanina; B, asparagina o ácido aspártico; C, cisteína; D, ácido aspártíco; E, glutamato, ácido glutámico; F, fenilalanina; G, glicina; H, histidina; I, isoleucina; K, lisina; L, leucina; M, metionina; N, asparagina; P, prolina; Q, glutamina; R, arginina; S, serina, T, treonina; V, valina; W, triptófano; Y, tirosina; Z, glutamina o ácido glutámico (ver. L. Stryer, Biochemistry, 1988, W. H. Freeman and Company, Nueva York). La letra "x" como se usa en la presente dentro de una secuencia de aminoácido puede significar cualquier residuo de aminoácido.
"Secuencia codificadora" se refiere a una molécula de ADN o ARN que codifica una molécula de aminoácido específica y excluye las secuencias no codificadoras. Puede constituir una, "secuencia codificadora no interrumpida", es decir, carente de un intrón, tal como en un cADN o puede incluir uno o más intrones unidos por uniones de empalme apropiadas. Un "intrón" es una molécula de ARN que está contenido en la transcripción primaria, pero que es ejiminada a través de corte y re-ligadura del ARN dentro de la célula para crear el mARN maduro que se puede traducir en una próteína.
Lós términos "marco de lectura abierta" y "ORF" se refieren a la ¦secuencia de aminoácido codificada entre la iniciación de traducción y codones de terminación de una secuencia codificadora. Los términos "codón de iniciación" y "codón de terminación"" se refieren a una unidad de tres nucleótidos adyacentes ('codón') en una secuencia codificadora que especifica iniciación y terminación de cadena, respectivamente, de síntesis de proteína (traducción de mARN).
Un "ARN funcional" se refiere a un ARN anti-sentido, microARN, siARN, ribozima u otro ARN que no se traduce., . El término "transcripción de ARN" se refiere al producto que resulta de transcripción catalizada con ARN . polimerásá de una molécula de ADN. Cuando la transcripción de ARN es una copia complementaria perfecta de la molécula de ADN, es referida como la transcripción primaria o puede ser una molécula de ARN derivada de procesamiento post-transcripcional de la transcripción primaria y es referida como el ARN maduro. "ARN mensajero" (mARN) se refiere al ARN que es sin intrones y que se puede traducir en proteína por la célula. "cADN" se refiere a un ADN de una cadena o doble cadena que es complementario a y derivado de mARN.
"Molécula de ácido nucleico aislada capaz de regular expresión", "molécula, de nucleótido reguladora de transcripción", "molecular reguladora", o "moléculas reguladoras adecuadas", cada una. se refiere a moléculas de nucleótido que influyen en la transcripción, procesamiento de ARN o estabilidad, o traducción de las moléculas de nucleótido asociadas (o funcionalmente ligadas) a transcribirse. La molécula de nucleótido reguladora de transcripción puede tener varias localizaciones con respecto a las moléculas de nucleótido a transcribirse. La molécula de nucleótido reguladora de transcripción se puede ubicar ascendente (secuencias 5' no codificadoras), dentro, o descendente (secuencias 3' no •codificadoras) de la molécula a transcribirse (por ejemplo, una secuencia codificadora): La molécula de nucleótido reguladora de •transcripción se puede seleccionar a partir del grupo que comprende potenciadores, promotores, secuencias líderes de traducción, intrones, secuencias 5' no traducidas, secuencias 3' no traducidas y. secuencias de señal de poliadenilación. Estos incluyen moléculas naturales y sintéticas así como moléculas, que pueden ser una i combinación de moléculas sintéticas y naturales: Como se señaló antes, el término "molécula de nucleótido reguladora de transcripción" no se limita a promotores. Sin embargo, preferiblemente una molécula de nucleótido reguladora de transcripción de la invención comprende por lo menos una molécula promotora (por ejemplo, una molécula localizada ascéndente del inicio de transcripción de un gen capaz de inducir transcripción de las moléculas descendentes). En una modalidad preferida, la molécula de nucleótido reguladora de transcripción de la invención comprende la molécula promotora del gen correspondiente y -opcionalmente y preferiblemente - la región 5' nativa no traducida de dicho gen. Además, la región 3' no traducida y/o región de pol'iaden ilación de dicho gen también se puede emplear. Como se usa en la presente, el término "cis-elemento" o "motivo promotor" se refiere a un elemento regulador de transcripción cis-actuando que confiere un aspecto del control global de expresión de gen. Un cis-elemento puede funcionar para unir factores de transcripción, factores de proteína trans-actuando que regulan la transcripción. Algunos cis-elementos unen más de un factor de transcripción, y los factores de transcripción pueden interactuar con diferentes afinidades con más de un cis-elemento. Los promotores de la presente invención contienen de manera deseable cis-elemehtos. que confieren o modulan expresión de genes. Se pueden identificar cis-elementos por un número de técnicas, incluyendo análisis de omisión, es decir, omitiendo uno o más nucleótidos del extremo 5' o interno a un promotor; análisis de proteína de unión de ADN usando huella de ADNasa I, interferencia de metilación, ensayos de movilidad-cambio de electroforesis, huella genómica in vivo por PCR mediada por ligación, y otros ensayos con encionales; o por análisis de' similitud de secuencia de ADN con motivos de cis-elemento conocidos por métodos de comparación de secuencia de ADN convencionales. La estructura fina de un cis-elemento además se puede estudiar por mutágénesis (o sustitución) de úno o más nucleótidos o por otros métodos convencionales. Se pueden obtener cis-elementos por síntesis química o por aislamiento de promotores que incluyen dichos elementos, y se pueden sintetizar con nucleótidos de flanqueo adicionales que contienen sitios de enzima de restricción útiles para facilitar manipulación posterior.
"Secuencia 5' no codificadora" o "secuencia 5' no traducida." o "-región" se refiere a una secuencia de una molécula de nucleótido ubicada 5' (ascendente) a la secuencia codificadora. Está presente en el mARN completamente procesado ascendente del codón de iniciación y puede afectar el procesamiento de la transcripción primaria a mARN, estabilidad de mARN ó eficiencia de traducción.
"Secuencia 3' no codificadora" o "secuencia 3' no traducida" o "-región" se refiere a una secuencia de una molécula de nucleótido ubicada 3' (descendente) a una secuencia codificadora e incluyen secuencias de señal de poliadenilación y otras secuencias codificando señales reguladoras capaces de afectar el procésamiento de mARN o expresión de genes. La señal de poliadenilación usualmente se caracteriza al afectar la adición de rasgos de ácido poliaden ílico al extremo 3' del precursor de mARN.. El uso de diferentes secuencias 3' no codificadoras se ejemplifica por Ingelbrecht y otros, 1989.
El término "secuencia líder de traducción" se refiere a una porción de secuencia de ADN de un gen entre el promotor y secuencia codificadora que se transcribe en ARN y está presente e el mARN completamente procesado ascendente (5') del codón de inicio de traducción. La secuencia líder de traducción puede afectar el procesamiento de la transcripción primaria a mARN, estabilidad de mARN o eficiencia de traducción.
"Péptido de señal" se refiere a la extensión terminal, de amíno de un polipéptido, que se traduce en conjunto con el polipéptido que forma un péptido precursor y que es requerido ara su entrada en la vía secretoria. El término "secuencia de señal" se refiere a una secuencia de nucleótido que codifica el péptido de señal El término "péptido de tránsito" como se usa en la presente se refiere a parte de un polipéptido expresado (preferiblemente a la extensión terminal de amino. de un polipéptido), que se traduce en conjunto con el polipéptido que forma un péptido precursor y que se requiere para su entrada en un organelp celular (tales como los plástidos (por ejemplo, cloroplastos) o mitocondria). El término "secuencia de tránsito" se refiere a una secuencia de nucleótido que codifica el péptido de tránsito.
"Promotor" se refiere a una molécula de nucleótido, usualménte. ascendente (5') a su secuencia codificadora, que controla la expresión de la secuencia codificadora al proveer el reconocimiento para ARN polimerasa y otros factores requeridos para transcripción propia. "Promotor" incluye un promotor mínimo que es una secuencia de ADN corta comprendida de una caja TATA y otras secuencias que sirven para especificar el sitio de iniciación de transcripción, al cual se agregan elementos reguladores para control de expresión. "Promotor" también se refiere a una molécula de nucleótido que incluye un promotor mínimo más elementos reguladores que sea capaz de controlar la expresión de una secuencia codificadora o ARN funcional. Este tipo de molécula promotora consiste de elementos próximos y ascendentes más distantes, los últimos elementos a menudo referidos como potenciadores. Por consiguiente, un "potenciador" es una molécula de ADN, que puede, estimular actividad promotora y puede ser un elemento innato del promotor o un elemento heterólogo insertado para potenciar él nivel o especificidad de tejido de un promotor. Es capaz de operar en amba orientaciones (normales o volteadas), y es capaz de funcionar incluso cuando se mueve ascendente o descendente a. partir del promotor. Ambos potenciadores y otros elementos promotores, ascendentes unen proteínas de unión de ADN específicas de secuencia que median sus efectos. Los promotores se pueden derivar en su totalidad de un gen nativo, o componerse de diferentes elementos, derivados de diferentes promotores encontrados en naturaleza, o incluso ser comprendidos de segmentos de ADN sintéticos. Un promotor también puede contener secuencias de ADN que están involucradas en la unión de factores de proteína, que controlan la efectividad de iniciación de transcripción en respuesta a condiciones fisiológicas o de desarrollo. Un experto en la técnica conoce métodos para hacer un promotor unidireccional en bidireccional y métodos para usar el complemento o complemento invertido de una secuencia promotora para crear un promotor teniendo la misma especificidad promotora como la secuencia original. Dichos métodos, por ejemplo, son descritos para promotores constitutivos así como inducibles por Xie y otros (2001) i "Biodirectionalization of polar promoters iri plantas" nature biotechnology 19 páginas 677-679. Los autores describen que es suficiente agregar un promotor mínimo en el extremo 5' principal de cualquier promotor dado para recibir un promotor que controla la expresión en ambas direcciones con la misma especificidad promotora.
El "sitio de iniciación" es la posición que rodea el , primer nucleótido que es parte de la secuencia transcrita, que también . se define como posición +1. Con respecto a este sitio, se enumeran todas las otras secuencias del gen y sus regiones controladoras. Las secuencias descendentes (es decir, más secuencias codificadoras de .proteína en la dirección 3') se denominan positivas, mientras que las secuencias ascendentes (en su mayoría las regiones controladoras en la dirección 5') se denominan negativas.
Los elementos promotores, en particular un elemento TATA, que son inactivos o que han reducido en gran manera la ¡actividad promotora en ausencia de activación ascendente son referidos como "promotores mínimos o de núcleo". En presencia de un factor de transcripción adecuado, el promotor mínimo funciona para permitir transcripción. Un "promotor mínimo o de núcleo" de esta manera consiste sólo de todos los elementos básales necesarios para iniciación de transcripción, por ejemplo, una caja TATA y/o un iniciador.
"Expresión constitutiva" se refiere a expresión usando un promotor constitutivo o regulado. "Expresión condicional" y "regulada" se refieren a expresión controlada por un promotor regulado.
"Promotor constitutivo" se refiere a un promotor que es capaz de expresar el marco de lectura abierta (ORF) que controla en todo o casi todo los tejidos vegetales durante todas o casi todas las etapas de -desarrollo de la planta. Cada uno de los elementos activadores de transcripción no exhiben una especificidad de tejido absoluta, pero median la activación de transcripción en la mayoría de las partes de planta a un nivel de por lo menos 1% del nivel alcanzado en la parte de la planta en donde la transcripción es más activa.
"Promotor regulado" se refiere a promotores que dirigen expresión de genes no constitutivamente, pero en una manera regulada de manera temporal y/o espacial, e incluye promotores tanto específicos de tejido como inducibles. Incluye moléculas naturales y sintéticas así como moléculas que pueden ser una combinación de moléculas sintéticas y naturales. Diferentes promotores pueden dirigir la expresión de un gen en tejidos o tipos celulares diferentes, o en diferentes etapas de desartroílo, o en respuesta a diferentes condiciones ambientales. Promotores nuevos de varios tipos útiles eri células vegetales están siendo descubiertos constantemente, se pueden encontrar ejemplos numerosos én la compilación por Okamuro y otros (1989). Los promotores regulados típicos útiles en plantas incluyen, pero no se limitan a promotores inducibles con seguro, promotores derivados del sistema inducible con tetraciclina, promotores derivados de sistemas inducibles con salicilato, promotores derivados de sistemas inducibles con alcohol, promotores derivados de sistema inducible con glucocorticoide, promotores derivados de sistemas inducibles con patógeno, y promotores derivados de sistemas inducibles con ecdisoma.
"Promotor específico, de tejido" se refiere a promotores regulados que no son expresados en todas las células vegetales sino sólo en uno o más tipos celulares en órganos específicos (tales como hojas o semillas), tejidos específicos (tales como epidermis, tejido verde, embrión o cotiledón), o tipos celulares específicos (tales como parénquima de hoja o células de almacenamiento de semilla). Estos también incluyen promotores que son temporalmente regulados, tal como en embriogénesis temprana o tardía, durante la maduración de fruta en expansión de hoja en semillas o fruta en desarrollo, en hoja completamente diferenciada, o al comienzo de senectud.
"Promotor inducible" se refiere a aquellos promotores regulados que sé pueden encender en uno o más tipos celulares o que causan expresión aumentada sobre un estímulo externo, tal como un químico, luz, hormona, estrés o un patógeno.
"Ligado operativamente" o "f uncionalmente ligado" se refiere de preferencia a la asociación de moléculas de ácido nucleico en un único fragmento de ácido nucleico, de modo que la función de uno es afectada por la otra. Por ejemplo, una molécula de ADN reguladora se dice ser "operativamente ligada" o "asociada con" uña molécula de ADN que codifica para un ARN o un polipéptido si las dos moléculas se sitúan de modo que la molécula de AD reguladora afecta la expresión de la molécula de ADN codificadora (es decir, que la secuencia codificadora o ARN funcional está bajo el control de transcripción del promotor). Las secuencias codificadoras se pueden operativamente ligar a moléculas reguladoras en orientación de sentido o anti-sentido.
"Expresión" se refiere a la transcripción y/o traducción de un gen endógeno, ORF o porción del mismo, o un transgen en plantas. Por ejemplo, en el caso de construcciones anti-sentido, la expresión se puede referir a la transcripción del ADN anti-sentido solamente. Además, la expresión se refiere a la transcripción y acumulación estable de ARN sentido (mARN) o funcional. La expresión también se puede referir a la producción de proteína.
"Expresión específica" es la expresión de productos de genes, que se limita a uno o pocos tejidos' vegetales (limitación ' espacial) y/o a una o pocas etapas en desarrollo de planta (limitación temporal). Se reconoce que difícilmente existe una verdadera especificidad: los promotores preferiblemente parecen encenderse en algunos tejidos, mientras que en otros tejidos sólo puede haber poca o ninguna actividad. Este fenómeno es conocido como expresión con f.ugas. Sin embargo, con expresión específica en esta invención preferiblemente se quiere decir expresión en uno o pocos tejidos vegetales.
El "patrón de expresión" de un promotor (coVi o sin poténciador) es el patrón de niveles de expresión, que muestra dónde en la planta y en cuál etapa en desarrollo la transcripción inicia por dicho promotor. Los patrones de expresión de una serie de promotores se dice son complementarios cuando el patrón de expresión de un promotor muestra poco traslape con el patrón de expresión del otro promotor. El nivel de expresión de un promotor se puede determinar al medir la concentración de 'estado estable' de un mARN .reportero, transcrito estándar. Ésta medición es indirecta ya que la concentración del mARN reportero es dependiente no sólo de su velocidad de síntesis, sino también de la velocidad con la cual el mARN es degradado. Por lo tanto, el nivel de estado estable es el producto de velocidades de síntesis y velocidades de degradación. La velocidad de degradación no obstante puede ser considerada para proceder a una velocidad fija cuando las moléculas transcritas son idénticas, y de esta manera este valor puede servir como uria medida de velocidades de síntesis. Cuando los promotores son comparados en esta manera, las técnicas disponibles a aquellos expertos en la técnica son análisis de S1-ARNsa de hibridación, northerh blots y RT-PCR competitivo. Esta lista de técnicas de ninguna forma representa todas las técnicas disponibles, sino más bien describe procedimientos comúnmente usados para analizar la actividad de transcripción y niveles de expresión de mARN. El análisis de puntos de inicio de transcripción en prácticamente todos los promotores ha revelado que usualménte no hay una sola base en la cual inicie la transcripción, sino una serie más o menos agrupada de sitios de iniciación, cada uno de los cuales justifica algunos puntos de inicio del mARN. Ya que esta distribución varía de promotor a promotor, las secuencias del mARN reportero en cada una de las poblaciones ¦ i ¦ diferiría entre sí. Ya que cada especie de mARN es más o menos propensa a degradación, ninguna única velocidad de degradación se puede esperar para mARNs reporteros diferentes. Se ha mostrado para varias moléculas promotoras eucarióticas que la, secuencia rodeando el sitio de iniciación ('iniciador') juega un rol importante en determinar el nivel de expresión de ARN dirigido por ese promotor específico. Esto incluye también parte de las secuencias transcritas. La fusión directa de promotor a moléculas reporteras por lo tanto conduciría a niveles sub-óptimos de transcripción. Un procedimiento comúnmente usado para analizar patrones de expresión y niveles es a través de íá determinación del nivel de 'estado estable' de acumulación de proteína en una célula. Los candidatos comúnmente usados para el gen reportero, conocidos a aquellos expertos en la técnica son geta-glucuronidasa (GUS), cloranfenicol aceti transferasa (CAT) y proteínas con propiedades fluorescentes, tal como proteína fluorescente verde (GFP) de Aequora victoria. En principio, no obstante, muchas más proteínas son adecuadas para esté propósito, siempre y cuando la proteína no interfiera con funciones de planta esenciales. Para la cuantif icación y determinación de localización, un número de herramientas es adecuado. Sistemas de detección pueden ser prontamente creados o están disponibles que se basan,, por ejemplo, en detección y cuantif icación inmunoquímica, enzimática, fluorescente. Los niveles de proteína pueden ser determinados en extractos de tejido vegetal o en .tejid.o intacto usando análisis in situ de expresión de proteína. En general, líneas transformadas individuales con una construcción reportera de promotor quimérico variarán en sus niveles de expresión del gen reportero. También se observa con frecuencia el fenómeno que dichos transformadores no expresan ningún producto detectable (ARN o proteína). La variabilidad en expresión comunmente se atribuye a 'efectos de posición', aunque los mecanismos moleculares por debajo de esta inactividad usualmente.no son claros.
"Sobre-expresión" se refiere al nivel de expresión en células u organismos transgénicos que excede niveles de expresión en células u organismos normales o no. transformados (no transgénicos).
"Inhibición anti-sentido" se refiere a la producción de transcripciones de ARN anti-sentido capaces de suprimir la expresión: de proteína a partir de un gen endógeno o un transgen.
"Silencio de genes" se refiere a supresión dependiente de homología de genes virales, transgenes o genes nucleares endógenos. El silencio de genes puede ser transcripcional, cuando la supresión se debe a transcripción disminuida de los genes afectados, o post-transcripcionales, cuando la supresión se debe a movimiento aumentado (degradación) de especie de ARN homologa a los genes afectados (English 1996). El silencio de genes incluye silencio de . genes inducido por virus (Ruiz y otros, 1998).
Los términos "molécula de ADN heteróloga", "segmento de ADN exógena" o "ácido nucleico heterólogo", como se usa en la presente, cada uno se refiere a una molécula que se origina de una fuente extraña a la célula huésped particular o, de ser de la misma fuente, se modifica de su forma original. De esta manera, un gen heterólogo en una célula huésped incluye un gen que es endógeno a la célula huésped particular pero se ha modificado a través de, por ejemplo, el uso de movimiento de ADN. Los términos también incluyen múltiples copias que ocurren de manera no natural de una molécula de ADN que ocurre de manera natural. De esta manera, los térrninos se refieren a un segmento de ADN que es extraño o heterólogo a la célula, u homólogo a la célula pero en una posición dentro del ácido nucleico de célula huésped en donde el elemento no se éncuentra ordinariamente. Se expresan segmentos de ADN exógenos para producir polipéptidos : exógenos. Un molécula de ADN "homóloga" es una molécula de ADN que se asocia de manera natural con una célula huésped en donde se introduce.
"Homólogo a" en el contexto de identidad de secuencia de ¦ huele ót¡ do se refiere a la similitud entre las secuencias-de nucleótido de- dos moléculas de ácido nucleico o entre las secuencias de aminoácido de dos moléculas de proteína. Se proveen estimados de dicha homología por hibridación de ADN-ADN o ADN-ARN bajo condiciones dé rigor como se entiende bien por aquellos expertos en la técnica (como se describe en Haines y Higgins (eds.), Nucleic Acid Hybridization, IRL Press, Oxford, U.K.), o por la comparación de similitud de secuencia entre dos ácidos nucleicos o proteínas.
El término "sustancialmente similar" o "similar" se .refiere a secuencias de nucleótido o aminoácido que representan equivalentes u ortólogos funcionales y/o estructurales de secuencias de Arabidopsis thaliana o Glycine max descritas en la presente.
En el sentido más amplio, el término "sustancialmente similar" o "similar" cuando se usan en la presente con respectó a una secuencia de nucleótido significa que la secuencia de nucleótido es parte de un gen que codifica un polipéptido teniendo sustancialmente la misma estructura y función como un polipéptido codificado por un ? gen para la secuencia de nucleótido dé referencia, por ejemplo, la secuencia de nucleótido comprende un promotor a partir de un gen que es el ortólogo del gen que corresponde a la secuencia de nucleótido de referencia, así como secuencias promotoras que estructuralmente se relacionan a las secuencias promotoras ejemplificadas en particular en la presente, es decir, las secuencias promotoras sustancialmente similares hibridan al complemento de las secuencias promotoras . ejemplificadas en la presente bajo condiciones de rigor altas o muy altas. Por ejemplo, las secuencias de nucleótido alteradas, que simplemente reflejan la degeneración del código genético pero no obstante codifican secuencias de aminoácido que son idénticas a una secuencia de a mi no ácido particular son sustancialmente similares a las secuencias particulares. El término "sustancialmente similar" también incluye secuencias de nucleótido en donde la secuencia se ha modificado, por ejemplo, para optimizar la expresión en particular células, así 1 como secuencias de nucleótido codificando un polipéptido, variante teniendo una o más sustituciones de aminoácido relativas al polipéptido (no modificado) codificado por la secuencia de referencia, la cual sustitución(es) no altera la actividad del polipéptido variante relativo al polipéptido no modificado.
En su sentido más amplio, el término "sustancialmente similar." o "similar" cuando se usa en la presente con respecto a polipéptido o ácidos nucleicos significa que el polipéptido o ácido nucleico tiene sustancialmente la misma estructura o función como el polipéptido de referencia. Además, secuencias de aminoácido o ácidos nucleicos que son sustancialmente similares a una secuencia particular son aquellas en donde la identidad global de aminoácido o ácido nucleico es por lo menos 90% o más a las secuencias instantes. Las . ' ' I' ' . - '' modificaciones que resultan en secuencias de nucleótido o aminoácido equivalentes están bien dentro de la experiencia de rutina en la técnica. El porcentaje de identidad de secuencia. de aminoácido o ácido nucleico entre el polipeptido o ácido; nucleico sustancialmente similar o referencia es por lo menos 90% o más, por ejemplo, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, hasta . por lo menos 99%, en donde el polipéptido de referencia es un polipéptido codificado por un gen con un promotor que tiene cualquiera de SEC ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51,, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, .73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u 89, una secuencia de nucleótido que comprende un marco de lectura abierta comprendido en SEC ID NOs: 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252 ó 254, que codifica un polipéptido descrito por SEC ID NOs: 221, 223, 225, 227, 229, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247,. •249, 251, 253 ó 255. Una indicación que dos polipéptidos son sustancialmente similares entre sí, aparte de tener sustancialmente la misma función, es que un agente, por ejemplo, un anticuerpo, que específicamente se une a uno de los polipéptidos, también se une específicamente al otro.
Las comparaciones de secuencia se pueden llevar a cabo usando un algoritmo de alineación de secuencia (ver,, por ejemplo, Waterman (1995)). El programa local S, versión .1.16, preferiblemente se usa con los siguientes parámetros: compatibilidad: 1, penalidad por incompatibilidad: 0.33, penalidad de hueco abierto: 2, penalidad de hueco extendido: 2.
Además, una secuencia de nucleótido que es "sustanciálmente similar" o "similar" a una secuencia de nucleótido de referencia se dice ser "equivalente" a la secuencia de nucleótido de referencia. El experto en la técnica reconoce que secuencias de nucleótido equivalentes abarcadas por esta invención también se pueden definir por su habilidad de hibridar, bajo condiciones bajas, moderadas y/o estrictas (por ejemplo, 0.1 X SSC, 0.1% SDS, 65°C), con las secuencias de nucleótido que están dentro del alcance literal de las ? presentes reivindicaciones.
Lo que se quiere decir por "sustanciálmente la misma actividad" o "la misma actividad" cuando se usan en referencia a un fragmento de polinucleótido o un homólogo es que el fragmento u homólogo tiene al menos 90% o más, por ejemplo, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, hasta por lo menos 99% de la actividad reguladora de expresión del polinucleótido de longitud completa.
"Gen diana" se refiere a un gen en el replicón que expresa la secuencia codificadora diana deseada, ARN funcional o proteína. E¡ gen diana no es esencial para replica de replicón. Adicii'onalmente, los genes diana comprenden genes no virales nativos insertados en un organismo no nativo, o genes quiméricos, y estarán bajo el control de secuencias reguladoras adecuadas. De esta manera, las secuencias reguladoras en el gen diana pueden provenir de cualquier fuente, incluyendo el virus. Los genes diana pueden incluir secuencias codificadoras que son heterólogas u homologas a los genes de una planta particular a transformarse. Sin embargo,, los genes diana no incluyen genes virales nativos. Los genes diana típicos incluyen, pero no se limitan a, genes que codifican, una proteína estructural, una proteína de almacenamiento de semilla, una. proteína que transporta resistencia a herbicida, y una proteína que transporta resistencia a insecto. Las proteínas codificadas por. genes diana son conocidas como "proteínas extrañas". La expresión de un gen diana en una planta típicamente producirá un rasgo de planta alterada.
El término "rasgo de planta alterada" significa cualquier cambio, fenotípico o genotípico en una planta transgénica relativa al huésped de planta de tipo silvestre o no transgénico.
"Gen de réplica" se refiere a un gen que codifica uña proteína de réplica viral. Además del ORF de la proteína de réplica, el gen de réplica también puede contener otro ORF(s) traslapante o no traslapante, como se encuentran en secuencias virales en naturaleza. Aunque no son esenciales para réplica, estos , ORFs adicionales pueden potenciar la réplica y/o acumulación, de ADN viral. Ejemplos de dichos ORFs adicionales son AC3 y ÁL3 en ACMV y TGMV geminivirus, respectivamente.
"Gen de réplica trans-actuando quimérico" se refiere a un gen de réplica en donde la secuencia codificadora de una proteína de réplica está bajo el control de un promotor de planita regulado diferente de aquél en el gen de réplica viral nativo, o un gen de réplica viral nativo modificado, por ejemplo, en donde una secuencia(s) de sitio específico se inserta en la región 5' transcrita . pero no traducida. Dichos genes quiméricos también incluyen inserción de los sitios conocidos de proteína de réplica viral.
"Cromosómicamente-integrado" se refiere a la integración de un gen extraño o construcción de ADN en el ADN huésped por enlaces covalentes. En donde los genes no son "cromosómicamente integrados" se pueden "expresar transitoriamente". La expresión transitoria de un gen se refiere a la expresión de un gen que no, está integrado en el cromosoma huésped sino funciona independientemente, ya sea como parte de un plásmido que autónomamente replica o cásete de expresión, por ejemplo, o como parte de otro sistema biológico tal como un virus.
El término "transformación" se refiere a la transferencia de un fragmento de ácido nucleico en el genoma de una célula huésped, resultando en herencia genéticamente estable. Las células huésped que contienen los fragmentos de ácido nucleico transformados son referidos como células "transgénicas", y organismos que comprenden, células transgénicas son referidas como "organismos transgénicos". Ejemplos de métodos de transformación de plantas y células vegetales incluyen transformación mediada por Agrobacterium (De Blaere 1987) y tecnología de bombardeo de partícula (US 4, 945,050). Plantas enteras se pueden regenerar a partir de células transgénicas por métodos bien conocidos al experto en la técnica (ver, por ejemplo, Fromm 1990).
"Transformado", "transgénico" y "recombinante" se rpfieren a un organismo huésped tal como una bacteria o una planta en donde una molécula de ácido nucleico heterólogo se ha introducido. La;molécula de ácido nucleico se puede integrar establemente en el genoma conocido por lo general en la técnica y se describen (Sambrook 1989; Innis 1995; Gelfand 1995; Innis & Gelfand 1999)., Métodos conocidos de PCR incluyen, pero no se limitan a, métodos que usan cebadores en par, cebadores anidados, cebadores individuales específicos, cebadores específicos de gen, cebadores específicos de vector, cebadores parcialmente incompatibles y similares. Por ejemplo, plantas "transformadas", "transformantes" y "transgénicas" o. calli han pasado por el proceso de transformación y contienen un gen I extraño integrado en su cromosoma. El término "no transformadas" se refiere a plantas normales que no han pasado por el proceso de transformación.
"Transitoriamente transformadas" se refiere a célulafs en donde transgenes y ADN extraño se han introducido (por ejemplo, por dichos métodos como transformación mediada por Agrobacterium o bombardeo biolístico), pero no seleccionados para mantenimiento estable.
"Establemente transformados" se refiere a células qué se han seleccionado y regenerado en un mecanismo de selección después de la transformación.
• "Expresión transitoria" se refiere a expresión en células en donde se introduce un virus o un transgen por infección viral o por dichos métodos como transformación mediada por Agrobacterium, electroporación , o bombardeo biolístico, pero no seleccionado para su mantenimiento estable.
"Genéticamente estable" y "heredable" se refieren a elementos genéticos cromosómicamente integrados que se mantienen de forma estable en la planta y son. heredados establemente por progenie a. través de generaciones sucesivas.
"Transformante primario" y "generación T0" se refieren a plantas transgénicas que son de la misma generación genética como el tejido que se transformó al inicio (es decir, que no ha pasado por meiosis y fertilización desde la transformación).
"Transformantes secundarios" y "las generaciones T1, T2, T3, ¡i etc." se refieren a plantas transgénicas derivadas de transformantes primarios a través de uno o más ciclos meióticos y de fertilización. Se pueden derivar por auto-fertilización de transformantes primarios o secundarios o cruces de transformantes primarios o secundarios con otras plantas transformadas o no transformadas.
Tipo silvestre: El término "tipo silvestre", "natural" u "origen natural" significa con respecto a un organismo, polipéptido, o secuencia de ácido nucleico, que dicho organismo está ocurriendo de manera natural o disponible en por lo menos un organismo que ocurre de manera natural que el hombre no cambia, muta o de lo contrario manipula.
Los términos "genoma" o "ADN genómico" se refiere a la información genética heredable de un organismo huésped. Dicho ADN genómico comprende el ADN del núcleo (también referido como ÁDN cromosómico), sino también el ADN de los plástidos (por ejemplo, cloroplastos) y otros organelos celulares (por ejemplo,, mitocondria). Preferiblemente, los términos genoma o ADN genómico se refieren al ADN cromosómico del núcleo.
El término "ADN cromosómico" o "secuencia de ADN cromosómico" se debe entender como el ADN genómico del núcleo celular independiente del estado de ciclo celular. Por lo tanto, el ADN cromosómico se puede organizar en cromosomas o cromátidos, se pueden condensar o desenrollar. Una inserción en el ADN cromosómico se puede demostrar y analizar por varios métodos conocidos en la técnica como, por ejemplo, análisis de reacción en cadena de polimerasa (PCR), análisis de Southern blot, hibridación in si tu de fluorescencia (FISH), y PCR in situ.
El término "ácido nucleico" se refiere a desoxiribonucleótidos o ribonucleótidos y polímeros de los mismos en forma de una cadena o doble cadena, compuestos de monómeros (nucleótidós.) que contienen un azúcar, fosfato y una base, que es una purina o pirimidina. A menos que específicamente esté limitado, 'el término abarca ácidos nucleicos que contienen análogos conocidos de nucleótidós naturales, que tienen propiedades de unión similares como el ácido nucleico de referencia y se metabolizan en una manera similar a nucleótidós que ocurren de manera natural. A menos que se indique lo contrario, una secuencia de ácido nucleico particular también abarca de forma implícita variantes modificados de forma conservadora de los mismos (por ejemplo, sustituciones de codón degeneradas) y secuencias complementarias así como la Secuencia explícitamente indicada. De manera especifica, se pueden lograr sustituciones de codón degeneradas al generar secuencias en donde la tercera posición de uno o más codones seleccionados (o todos) se sustituye con residuos de base mixta y/o desoxinosina (Batzer .1991 ; Ohtsuka 1985; Rossolini 1994). Un "fragmento de ácido nucleico" es una fracción de una molécula de ácido nucleico dada. En plantas superiores, ácido desoxiribonucleico (ADN) es el material genético, mientras que el ácido ribonucleico (ARN) está involucrado en la transferencia de información contenida dentro de ADN en proteínas. El término "secuencia de nucleótido" se refiere a un polímero de ADN o ARN que puede ser de una cadena o doble cadena, opcionalmente . conteniendo bases de nucleótido sintéticas, no naturales o alteradas capaces de incorporación en polímeros de ADN o ARN. Los términos "ácido nucleico" o "secuencia de ácido nucleico" también se pueden usar de forma intercambiable con gen, cADN, ADN y ARN codificado por un gen.
La. invención abarca composiciones de ácido nuclejco o proteína aislados o sustancialmente purificados. En el contexto de la presente invención, una molécula de ADN "aislada" o "purificada" o un polipéptido "aislado" o "purificado" es una molécula de ADN o polipéptido que, por la mano del hombre, existe aparte de su medio ambiente nativo y por tanto no es un producto de naturaleza. Una molécula o polipéptido de ADN aislado puede existir en una forma purificada o puede existir en un medio ambiente no nativo tal como, por ejemplo, una célula huésped transgénica. Por ejemplo, una molécula o proteína de ácido nucleico "aislado" o "purificado", o porción biológicamente activo del mismo, está sustancialmente libre de otros material celular, o medio de cultivo cuando se produce por técnicas recombinantes, o sustancialmente libre de precursores químicos u otros químicos cuando se sintetizan químicamente. Preferiblemente, un ácido nucleico "aislado" está libre de. secuencias (preferiblemente secuencias codificadoras de protéíria) que flanquean de manera natural al ácido nucleico (es decir, secuencias ubicadas en los extremos 5' y 3' del ácido nucleico) 'en . el ADN genómico del organismo del. -cual se deriva el ácido nucleico. Por ejemplo, en varias modalidades, la molécula de ácido nucleico aislada puede contener menos de aproximadamente 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb, o 0.1 kb de secuencias de nucleótido que flanquean de manera natural la molécula de ácido nucleico en ADN genómico de la célula de la cual se deriva el ácido nucleico. Una proteína que está sustancialmente libre de material celular incluye preparaciones de proteína o polipéptido teniendo menos de aproximadamente 30%, 20%, 10%, 5% (en peso seco) de. proteína contaminante. Cuando la proteína de la invención, o porción biológicamente activa de la misma, se produce de forma recombinante, preferiblemente medio de cultivo representa, menos de aproximadamente 30%, 20%, 10% o 5% (en peso seco) de precursores químicos o químicos de no proteína de interés. Las secuencias de nucleótido de la invención incluyen' tanto las secuencias que ocurren de manera natural como formas mutantes (variantes). Dichos variantes seguirán poseyendo la actividad deseada, es decir, la actividad promotora o la actividad del producto codificado por el marco de lectura abierto de la secuencia de nucleótido no variante.
El término "variante" u "homólogo" con respecto a una secuencia (por ejemplo, una secuencia de pol ipéptido o ácido nucleico tal como - por ejemplo - una molécula de nucleótido reguladora de transcripción de la invención) debe significar secuencias sustancialmente similares. Para secuencias dé nucleótido que comprenden un marco de lectura abierto, las variantes, incluyen aquellas secuencias que, debido a la degeneración del código genético, codifican la secuencia de aminoácido idéntico de la proteína nativa. Los variantes alélicos que ocurren de manera natural tales como estos se pueden identificar con el uso de técnicas de biología molecular bien conocidas, como, por ejemplo, con reacción en cadena de polimerasa (PCR) y técnicas de hibridlación. Las secuencias de nucleótido variantes también incluyen secuencias de nucleótido sintéticamente derivadas, tales como aquellas generadas, por ejemplo, al usar mutagénesis dirigida en sitio y para marcos de lectura abiertos, codifican la proteína nativa, así como aquellas que codifican un polipéptido teniendo sustituciones de aminoácido relativas a la proteína nativa. En general, los variantes de secuencia de nucleótido de la invención tendrán por lo menos 40, 50, 60.a 70%, por ejemplo, preferiblemente 71%, 72%, 73%, 74%, 75%,? 76%, 77%, 78%. a 79%, en general por lo menos 80%, por ejemplo,, 81%-84%, por lo menos 85%, por ejemplo, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% a 98% y 99% identidad de secuencia de nucleótido a la secuencia de nucleótido nativo (tipo silvestre o endógeno).
"Cásete de expresión" como se usa en la presente significa una secuencia de ADN capaz de dirigir expresión dé una secuencia de nucleótido particular en . una célula huésped apropiada,- que comprende un promotor ligado operativamente a una secuencia de nucleótido de interés, que - opcionalmente - se liga a señales de terminación y/u otros elementos reguladores. Un cásete de expresión también puede comprender secuencias requeridas para traducción propia de la secuencia de nucleótido. La región codificadora usualmente codifica para ARN o un ARN no traducido, en la dirección de sentido o anti-sentido. El cásete de expresión que comprende la secuencia de nucleótido de interés puede ser quimérico, lo que significa que por lo menos uno de sus componentes es heterólogo con respecto a por lo menos uno de sus demás componentes. El cásete de expresión también puede ser uno, que esté ocurriendo de manera natural pero se ha obtenido en una forma recombinánte. útil para expresión heteróloga. Un cásete de expresión se puede ensamblar extracelularmente por completo (por ejemplo, por técnicas de clonación recombinantes). Sin embargo, un cásete de expresión, también se puede ensamblar usando en parte componentes endógenos. Por ejemplo, un cásete de expresión se puede obtener al colocar '(o insertar) una secuencia promotora ascendente de una secuencia endógena, que por tanto se liga funcionalmente y controla por dichas secuencias promotoras. Asimismo, una se.cuencia de ácido nucleico a expresarse se puede colocar (o insertar) descendente de una secuencia promotora endógena así formando un cásete de expresión. La expresión de la secuencia de nucléótido en el cásete de expresión puede estar bajo el control de un promotor 'constitutivo o de un promotor inducible, que inicia la transcripción solamente cuando la célula huésped está expuesta a algunos estímulos externos particulares. En el caso de un organismo multicelular, el promotor también puede ser específico a un tejido u órgano particular o etapa de desarrollo. En una modalidad preferida, dichos casetes de expresión comprenderán la región de iniciación de transcripción de la invención ligada a una secuencia de nucléótido de interés. Dicho cásete de expresión preferiblemente se provee con una pluralidad de sjtios de restricción para inserción del gen de interés para estar bajo la regulación de transcripción dé las regiones reguladoras. El cásete de expresión adicionalmente puede contener genes marcadores que se pueden seleccionar. El cásete incluirá en la dirección 5'-3' de transcripción, una región de iniciación de transcripción y traducción, una secuencia de ADN de interés, y una región de terminación de transcripción y traducción funcional en 47 · ,; . ·-' plantas. La región de terminación puede ser nativa con la región de. iniciación de transcripción, puede ser nativa con la secuencia de ÁDÑ de interés, o se puede derivar de otra fuente. Regiones de terminación convenientes están disponibles del plásmiido Ti o A. tumefaciens, tales como las regiones de terminación de octapina sintasa y nopalina sintasa y otras descritas más adelante (ver también Guerineau 1991; Proudfoot 1991; Sanfacon 1991; ó.gen 1990; Munroe 1990; Bailas 1989; Joshi 1987).
"Vector" es definido para incluir, entre otras cosas, cualquier plásmido, cósmido, fago o vector binario de AgrobacteriUm en forma lineal o circular de doble o una cadena que puede ser o no auto-transmisible o movilizable, y que puede transformar huésped •procariótico o eucariótico por integración en el genoma celular o existen extracromosómicamente (por ejemplo, plásmido de réplica autónomo con un origen de réplica).
Específicamente se incluyen vectores transportadores por los cuales se quiere decir un vehículo de ADN capaz, naturalmente o por diseño, de réplica con dos organismos huéspedes diferentes, que se pueden seleccionar a partir de actinomicetes y especies relacionadas, bacteria y eucarióticos (por ejemplo, planta superior, células de mamífero, levadura u hongo).
Preferiblemente, el ácido nucleico en el vector está bajo el control de, y operativamente ligado a, un promotor apropiado u otros elementos reguladores para transcripción en una célula huésped tal como una célula microbiana, por ejemplo, bacteriana o vegetal. El vector puede ser un vector de expresión bi-funcional que funciona en múltiples huéspedes. En el caso de ADN genómico, esto puede contener su propio puede estar bajo el control de un promotor apropiado u otros elementos reguladores para expresión en la célula huésped. .
"Vectores de clonación" típicamente contienen uno o un número pequeño de sitios de reconocimiento de endonucleasa de restricción en donde, se pueden insertar secuencias de ADN extraño en un modo determinable sin pérdida de funciona biológica esencial del vector, así como un gen marcador que es adecuado para usarse en la identificación y selección de células transformadas con el vector de. clonación. Los genes marcadores típicamente incluyen genes que proveen resistencia a tetraciclina, resistencia de higsromicina o resistencia a ampicilina.
Una "planta transgénica" es una planta que tiene una o más células vegetales que contienen un vector de. expresión o construcción de expresión recombinante.
"Tejido vegetal" incluye tejidos o plantas diferenciadas y no diferenciadas, incluyendo, pero sin limitación a, raíces, tallos, brotes, hojas, polen, semillas, tejido de tumor y varias formas de células y cultivo tales como células individuales, protoplasto, embriones y tejido de callo. El tejido vegetal puede estar en plantas o en cultivo de órgano, tejido o célula.
Los siguientes términos se usan para describir las relaciones de secuencia entre dos o más ácidos nucleicos o polinucleótidos: (a) "secuencia de referencia", (b) "ventana de comparación", (c) "identidad de secuencia", (d) "porcentaje de identidad de secuencia" y (e) "identidad sustancial". (a) Como se usa en la presente, "secuencia de referencia" es una secuencia definida usada como una base para comparación de secuencia. Una secuencia de referencia puede ser una sub- ' serie o la entidad de una secuencia especificada; por ejemplo, como un segmento de un cADN de longitud completa o secuencia de genes o secuencia de ácido nucleico aislado capaz de regular expresión en plantas, preferiblemente el cADN completo o secuencia de genes o secuencia de ácido nucleico aislado capaz de regular expresión en plantas es lá secuencia de referencia. (b) Como se usa en la presente, "ventana de comparación" hace referencia a un segmento contiguo, y especificado de una secuencia de polinucleótido, en donde la secuencia de polinucleótido en la ventana de comparación puede comprender adiciones u omisiones (es decir, huecos) en comparación con la secuencia de referencia (que no comprenden adiciones u omisiones) para alineación óptima de las dos secuencias. Por lo general, la ventana de comparación es por lo menos 20 nucleótidos contiguos en longitud, y opcionalmente puede ser 30, 40, 50, 100 o más. En una modalidad preferida, la ventana de comparación definiendo la homología de secuencia tonsiste de la secuencia de búsqueda entera. Aquellos expertos en la técnica entienden que evitar una alta similitud a unía Secuencia de referencia debido a. inclusión de huecos en la secuencia de polinucleótido, una penalidad de hueco típicamente se introduce y se sustrae a partir del número de compatibilidades. Métodos de alineación de secuencias para comparación son bien conocidos en la técnica. De esta manera, la determinación de identidad de porcentaje entre cualquiera dos secuencias se puede lograr usando un algoritmo matemático. Ejemplos no limitantes, preferidos de dichos algoritmos matemáticos son el algoritmo de Myers y Miller, 1988; el algoritmo de homología , local de Smith y otros 1981 ; el algoritmo de alineación de homología de Needleman y Wunsch 1970; el método de ! búsqueda por similitud de Pearson y Lipman 1988; el algoritmo de Karlin y Altschul, 1990, modificado como en Karlin y Altschul, 1993.
Se pueden utilizar implementaciones de computadora de estos algoritmos matemáticos para comparación de secuencias para determinar identidad de secuencia. Dichas implementaciones incluyen, pero no se limitan a: CLUSTAL en el programa PC/Gene (disponible de Intelligenetics, Mountain View, California); el programa ALIGN (Versión 2.0) y GAP, BESTFIT, BLAST, FASTA y TFASTA en el paquete de software Wisconsin Genetics, versión 8 (disponible de Genetics Computer Group (GCG), 575 Science Drive, Madison, Wis., EUA). Alineaciones que usan estos programas se pueden realizar usando los parámetros previamente . establecidos. El programa CLUSTAL está bien descrito (Higgins 1988, 1989; Corpet 1988; Huang 1992; Pearson 1994). El programa ALIGN se basa en el algoritmo de Myers y Miller, supra. Los programas BLAST de Altschul y otros, 1990, se basan en el algoritmo de Karlin. y Altschul, supra. Preferiblemente se realizan múltiples alineaciones (es decir, de más de 2 secuencias) usando el algoritmo Clustal W (Thompson 1994; por ejemplo, en el software VectorNTI™, versión 9; Invitrogen Inc.) con la matriz de medición BLOSUM62MT2 con los ajustes pre-éstáblecidos (penalidad de abertura de hueco 15/19, penalidad de extensión de hueco 6.66/0.05; rango de penalidad de separación de hueco 8; % de identidad para retraso de alineación 40; usando huecos específicos de residuo y huecos de residuo hidrof ílicos). í ' ' ' El software para realizar análisis BLAST está públicamente disponible a través del Centro Nacional para Información de Biotecnología (http://www.ncbi.nlm.nih.gov/). Este algoritmo involucra primero identificar pares de secuencia de alta medición (HSPs) al identificar palabras cortas de longitud W en la secuencia de búsqueda, que igualan o satisfacen, alguna calificación T de umbral con valor positivo al alinearse con una palabra de la misma longitud en una secuencia de base de datos. T es referido como el umbral de calificación de palabra vecina (Altschul 1990). Estos golpes de palabra vecinos iniciales actúan como semillas para iniciar búsquedas por encontrar HSPs más largos que los contienen. Los golpes de palabra entonces se extienden en ambas direcciones sobre cada secuencia tanto como se pueda aumentar la calificación de alineación acumulativa. Las calificaciones acumulativas se calculan usando, para secuencias de nucleótido, los parámetros M (calificación de premio para un par de residuos de compatibilidad; siempre > 0) y N (calificación de penalidad para residuos incompatibles; siempre <0). Para secuencias de aminoácido, se usa matriz de medición para calcular la calificación acumulativa: La extensión de los golpes de palabra en cada dirección se detiene cuando la calificación de alineación acumulativa cae por la cantidad X de su valor logrado máximo, la calificación acumulativa da cero o menos debido a la acumulación de una o más alineaciones de residuo de calificación negativa, o se alcanza el final de cualquier secuencia.
Además de calcular la identidad de secuencia de porcentaje, el algoritmo BLAST también realiza un análisis estadístico de la similitud entre dos secuencias (ver, por ejemplo, Karlin & Altschul (1993). Una medida de similitud provista por e| algoritmo BLAST es la probabilidad de suma más pequeña (P(N)), que provee una indicación de la probabilidad por la cual una compatibilidad entre dos secuencias de nucleótido o aminoácido ocurriría al azar. Por ejemplo, una secuencia .de ácido nucleico de prueba es considerada similar a una secuencia de referencia si la probabilidad de ! suma más pequeña en una comparación dé la secuencia de ácido nucleico de prueba a la secuencia de ácido nucleico de referencia es menos de aproximadamente 0.1, más preferible menos de aproximadamente 0.01 y muy preferible menos de aproximadamente 0.001.
Para obtener alineaciones ahuecadas para propósitos de comparación, BLAST ahuecado (en BLAST 2.0) se puede utijizar como se describe en Altschul y otros 1997. Alternativamente, PSI-BLAST (en BLAST 2.0) se puede usar para realizar una búsqueda repetida que detecta relaciones distantes1 entre moléculas. Ver Altschul y otros, supra. Al utilizar BLAST, BLAST ahuecado, PSI-BLAST, se pueden usar parámetros previamente establecidos de los programas respectivos (por ejemplo, BLASTN para secuencias de nucleótido, BLASTX para proteínas). El programa BLASTN (para secuencias de nucleótido) usa como ajustes previamente establecidos una longitud de palabra (W) de 11, una expectación (E) de 10, un corte de 100, M = 5, N = -4, y una comparación de ambas cadenas. Para secuencias de aminoácido, el programa BLASTP usa como ajustes previamente establecidos una longitud de palabra (W) de 3, una expectación (E) de 10, y la matriz de calificación BLOSUM62 (ver Henikoff & Henikoff, í 1989). Ver http://www.ncbi.nlm.nih.gov. La alineación se puede también realizar manualmente por inspección.
Para propósitos de la presente invención, comparación de secuencias de nucleótido para determinación de identidad de secuencia de porcentaje a las secuencias promotoras descritas en la presente se hace preferiblemente usando él programa BlastN (versión 1.4.7 o más) con sus parámetros previamente establecidos o cualquier programa equivalente. Por "programa equivalente" se pretende cualquier programa de comparación de secuencia que, para cualquiera dos secuencias en cuestión, genera una alineación teniendo compatibilidades de( residuo de nucleótido o aminoácido idénticas y una identidad dé secuencia de porcentaje idéntica en. comparación con la . alineación correspondiente generada por el programa preferido.
Como se usa en la presente, "identidad de secuencia" o "identidad" en el contexto de dos secuencias de ácido nucleico o polipéptido hace referencia a los residuos en las dos secuencias que son las mismas cuando se alinean para correspondencia máxima sobre una ventana de comparación especificada. Cuando el porcentaje de identidad de secuencia se usa en referencia a proteínas, es reconocido que posiciones de residuo que no son idénticas a menudo difieren por sustituciones de aminoácido conservadoras, en donde residuos de aminoácido se sustituyen por otros residuos de aminoácido con propiedades químicas similares (por ejemplo, carga o hi'drof obici.dad) y por tanto no cambian las propiedades funcionales de la molécula. Cuando secuencias difieren en sustituciones conservadoras, la identidad de secuencia de porcentaje se puede ajustar hacia arriba para corregir la naturaleza conservadora de la sustitución. Secuencias que difieren por dichas sustituciones conservadoras se1 dice tienen "identidad dé secuencia" o "similitud". Medios para hacer este ajuste son bien conocidos a aquellos expertos en la técnica. Típicamente, esto involucra calificar una sustitución. conservadora como una compatibilidad parcial en vez de completa, así aumentando la identidad de secuencia de porcentaje. De esta manera, por ejemplo, en donde un aminoácido idéntico es dado una calificación dé 1 y una sustitución no conservadora es dada una calificación de cero, una sustitución conservadora es dada una calificación entre cero y 1. La calificación de sustituciones conservadoras es calculada, por ejemplo, como se ¡mplementa en el programa PC/GENE (Intelligenetics, Mountain View, California). . .
Como se usa en la presente, "porcentaje de identidad de secuencia" significa el valor determinado al comparar dos secuencias óptimamente alineadas sobre una ventana de comparación, preferiblemente la búsqueda completa o secuencia de referencia como se define por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 1 , 15, 16, .17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74., 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u 89, en donde la porción de la secuencia de poiinucleótido en la ventana de comparación puede comprender adiciones u omisiones (es decir, huecos) en comparación con la secuencia de referencia (que no comprende adiciones u omisiones) para alineación óptima de las dos secuencias. El porcentaje es calculado al determinar el número dej posiciones al cual la base de ácido nucleico idéntica o residuo de aminoácido ocurre en ambas secuencias para producir el número de posiciones igualadas, dividiendo el número de posiciones igualadas por el número total de posiciones en la ventana de comparación, y multiplicando el resultado por. 100 para producir el porcentaje de identidad de secuencia, (i) El término "identidad sustancial" de secuencias de poiinucleótido significa que un poiinucleótido comprende una secuencia que tiene por lo menos 90%, 91%, 92%, 93% o 94%, y muy preferible por lo menos 95%, 96%, 97%, 98% o 99% identidad de secuencia, en comparación con una, secuencia de referencia usando uno de los programas de alineación descritos usando parámetros estándar. Un experto en la técnica reconocerá que estos valores se pueden ajustar de forma apropiada para determinar identidad correspondiente de proteínas codificadas por dos secuencias de nucleótido al considerar degeneración de codón, similitud de aminoácido, posicionamiento de marco de lectura, y similares. La identidad, sustancial de secuencias de aminoácido para estos propósitos normalmente significa identidad de secuencia de por lo. menos 90%, 95% y muy preferible por lo menos 98%.
Otra indicación de que las secuencias de nucleótido son sustancialmente idénticas es si dos moléculas hibridan entre sí bajo condiciones rigurosas (ver más adelante). En general, se seleccionan condiciones rigurosas a aproximadamente 5°C menores que el punto de fundición térmico (T ) para la secuencia específica a una resistencia iónica definida y pH. Sin embargo, las condiciones rigurosas abarcan temperaturas en el rango de alrededor de 1°C a aproximadamente 20°C, dependiendo del grado deseado de rigor como es calificado- en . la presente. Los ácidos nucleicos que no hibridan entre sí bajo condiciones rigurosas todavía son sustancialmente idénticos si los polipéptidos que codifican son sustancialmente idénticos. Esto puede ocurrir, por ejemplo, cuando una copia de un ácido nucleico es creado usando la degeneración de codón máxima permitida por el código genético. Una indicación que dos secuencias de ácido nucleico son sustancialmente idénticas es cuando el polipéptido codificado por el primer ácido nucleico es inmunológicamente reactivo con el polipéptido codificado por el segundo ácido nucleico. (ü) El término "identidad sustancial" en el contexto de un péptido indica que un péptido comprende una secuencia con al menos 90%, 91%, 92%, 93% o 94%, o incluso más preferible 95%, 96%, 97%, 98% o 99%, identidad de secuencia a la secuencia de referencia sobre una ventana de comparación especificada. Preferiblemente, se realiza alineación óptima usando el algoritmo de alineación de homología de Needleman y Wunsch (1970). Una indicación que dos secuencias de péptido son sustancialmente idénticas es que un péptido es inmunológicamente reactivo con anticuerpos elevados contra el segundo péptido. De esta manera, un péptido es sustancialmente idéntico al segundo péptido, por ejemplo, en donde los dos péptidos difieren sólo por una sustitución conservadora.
Para comparación de secuencia, típicamente una* secuencia actúa como una secuencia de referencia con la cual se comparan secuencias de prueba. Cuando se usa un algoritmo de comparación de secuencia, secuencias de prueba y referencia se introducen . en una computadora, de ser necesario se diseñan coordenadas de sub-secuencia, y se diseñan parámetros de programa de algoritmo de. secuencia. El algoritmo de comparación de secuencia entonces . . i calcula la identidad de secuencia de porcentaje para la secuencia(s) de prueba relativa a la secuencia de referencia, con basé en los parámetros de programa designados. Las secuencias de referencia de la invención son definidas por las secuencias comprendidas en el protocolo de secuencia, preferiblemente SEC ID NO: 1, 2,. 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 1.5, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 y 89, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252 y 254, 221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253 y 255. Preferiblemente, la secuencia de referencia comprende la secuencia completa como se define por SEC D NO: 1, 2, 3, 4, 5, 6, 7, 8,.9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58,'. 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 u 89 ó 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252 ó 254, 221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253 ó 255, más preferible la secuencia de referencia consiste de la secuencia completa como se define por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77,.78, 79, 80, 81, 82, 83, 84, 85, 86, 8.7, 88 u 89, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252 ó 254, 221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253 0 255.
Como se señaló antes, otra indicación que dos secuencias de ácido nucleico son sustancialmente idénticas es que las dos moléculas hibridan entre sí bajo condiciones rigurosas. La frase "hibridar específicamente a" se refiere a la unión, duplicación o hibridación de una molécula sólo a una secuencia d nucleótido particular bajo condiciones rigurosas cuando la secuencia está présente en una mezcla compleja (por ejemplo, celular total) ADN o ARN. "Une sustancialmente" se refiere a hibridación complementaria entre un ácido nucleico de sonda y un ácido nucleico diana y abarca incompatibilidades menores que se pueden acomodar al reducir el rigor del medio de hibridación para lograr la detección deseada de la secuencia de ácido nucleico diana.
"Condiciones de hibridación rigurosas" y "condiciones de lavado de hibridación rigurosas" en el contexto de experimentos, de hibridación de ácido nucleico tal como hibridación Southern y Northern son dependientes de secuencia, y son diferentes bajo parámetros ambientales diferentes. La Tm es la temperatura (bajo resistencia iónica definida y pH) a la cual 50% de la secuencia diana híbrida a una sonda perfectamente igualada. La especificidad típicamente es la función de lavados de post-hibridación, los factores críticos siendo la resistencia iónica y temperatura de la solución de lavado final. Para híbridos de ADN-ADN, la Tm se puede aproximar a partir de la ecuación de Meinkoth y Wah'l, 1984: ¦ i; . . ¦ ' Tm = 81,..5°C + 16.6 (log10 M) + 0.41 (%GC) + 0.61 (% forma) - 500/L en donde M es la molaridad de cationes monovalentes, %GC es el. porcentaje de nucleótidos de guanosina y citosina en el ADN, % de forma es el porcentaje de formamida en la solución de hibridación, y L es la longitud del híbrido en pares base. Tm se reduce por aproximadamente 1°C para . cada 1% de incompatibilidad,; de esta manera, Tm, hibridación, y/o condiciones de lavado se pueden ajustar para hibridar a secuencias de la identidad deseada. Por ejemplo, si se buscan secuencias con >90% de identidad, la T^, se puede disminuir 10°C. Por lo general, se seleccionan condiciones rigurosas a aproximadamente 5°C menores que el punto de fundición térmico I para la secuencia específica y su complemento a una resistencia i iónica definida y pH. Sin embargo, condiciones severamente rigurosas puede n utilizar una hibridación y lo lavado a 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10°C menor que el punto de fundición térmico I; condiciones moderadamente rigurosas pueden utilizar una hibridación y/o lavado a 6, 7, 8, 9 ó 10°C menor que el punto de fundición; térmico I; condiciones de bajo rigor pueden utilizar una hibridación' y/o lavado a 11, 12, 13, 14, 15 ó 20°C menor que el punto de fundición térmico I. Usando la ecuación, composiciones de hibridación y lavado, y T deseada, aquellos expertos en la técnica entenderán que variaciones en el rigor de soluciones de hibridación y/o lavado se describen inherentemente. Si el grado deseado de incompatibilidad resulta en una T de menos de 45°C (solución acuosa) o 32°C (solución de formamida), se prefiere aumentar la concentración de SSC de modo que se puede usar una temperatura más alta. Una guía extensa a la hibridación de ácidos nucleicos se encuentra en Tijssen, 1993. En general, se seleccionan condiciones de hibridación y lavado altamente rigurosas a aproximadamente 5°C menores que el punto de fundición térmico Tm para la secuencia específica a una resistencia iónica definida y pH.
Un ejemplo de condiciones de lavado altamente rigurosas es 0.15 M NaCI a 72°C durante aproximadamente 15 minutos. Un ejemplo de condiciones de lavado rigurosas es un lavado de 0.2 X SSC a 65°C durante 15 minutos (ver, Sambrook, infra, para una descripción de regulador de SSC). A menudo, un lavado de alto rigor es precedido por un lavado de bajo rigor para eliminar señal de sonda de antecedentes. Un lavado de rigor medio de ejemplo para un dúplex de, por ejemplo, más de 100 nucleótidos, es 1 X SSC a 45°C durante 15 minutos. Un lavado de bajo rigor de ejemplo para un dúplex de, más de 100 nucleótidos, es 4 a 6 X SSC a 40°C durante 15 minutos. Para sondas cortas (por ejemplo, aproximadamente 10 a 50 nucleótidos), condiciones rigurosas típicamente involucran concentraciones de sal de menos de aproximadamente 1.5 M, más preferible aproximadamente 0.01 a 1.0 M, concentración iónica de Na (u otras sales) a pH 7.0 a 8.3, y la temperatura típicamente es por lo. menos aproximadamente 30°C y por lo menos aproximadamente 60°C para sondas largas (por ejemplo, >50 nucleótidos). También se pueden lograr condiciones rigurosas con la adición de! agentes desestabilizantes tal como formamida. En general, una relación de señal a ruido de 2 X (o más) que aquella observada para una sonda no relacionada en el ensayo de hibridación particular indica detección de una hibridación específica. Ácidos nucleicos que no hibridan entre sí bajo condiciones rigurosas todavía son sustancialmente idénticas si las proteínas que codifican son sustancialmente idénticas. Esto ocurre, por ejemplo, cuando una copia de un ácido nucleico es creado usando la degeneración de codón máxima permitida por el código genético.
Se seleccionan condiciones muy rigurosas para ser iguales a la Tm para una sonda particular. Un ejemplo de condiciones rigurosas para hibridación de ácidos nucleicos complementarios que tienen más de 100 residuos complementarios en un filtro en un 'Southern o Northern blot es 50% formamida, por ejemplo, hibridación en 50 •formamida, 1 NaCI, 1% SDS a 37°C, y un lavado en 0.1 x SSC a 60 a 65°C. Las condiciones de bajo rigor ejemplares incluyen hibridación con una solución reguladora de 30 a 35% formamida, 1 NaCI, 1% SDS (dodecilsulfato de sodio) a 37°C, y un lavado en 1 X a 2 X SSC (20 X SSC = 3.0 M NaCI/0.3 M citrato de trisodio) a 50 a 55°C. Condiciones de rigor moderado ejemplares incluyen hibridación en 40 a 45% formamida, 1.0 M NaCI, 1% SDS a 37°C, y un lavado en 0.5 X I X SSC a 55 a 60°C.
Los siguientes son ejemplos de seríes de condiciones de hibridación/lavado que se pueden usar para clonar secuencias de nucleótido ortólogas que son sustancialmente idénticas a secuencias de nucleótido de referencia de la presente invención: una secuencia de nucleótido de referencia híbrida de preferencia a la secuencia de nucleótido de referencia en 7% dodecilsulfato de sodio (SDS), 0.5 M ÑaP04, 1 mM EDTA a 50°C con lavado en 2 X SSC, 0.1% SDS a 50°C, de manera más deseable en 7% dodecilsulfato de Sodio (SDS), 0.5 M NaP04, 1 mM EDTA a 50°C con lavado en 1 x SSC, 0.1% SDS a 50°C, de manera más deseable todavía en 7% dodecilsulfato de sodio (SDS), 0.5 M NaP04, 1 mM EDTA a 50°C con lavado en 0,5 X SSC, 0.1% SDS a 50°C, preferiblemente en 7% dodecilsulfato de sodio (SDS), 0.5 M NaP04l 1 mM EDTA a 50°C con lavado en 0:1 X SSC, 0.1% SDS a 50°C, más preferible en 7% dodecilsulfato de sodio (SDS), 0.5 m NaP04, 1 mM EDTA a 50°C con lavado en 0.1 X SSC, 0.1% SDS a 65°C.
· "Barajado de ADN" es un método para introducir mutaciones o redistribuciones, preferiblemente de manera aleatoria, en una molécula de ADN o para generar intercambios de secuencias de ADN entre dos o más moléculas de ADN, preferiblemente de manera aleatoria. La molécula de ADN resultante de barajado de ADN es una molécula de ADN barajada que es una molécula de ADN que ocurre de manera no natural derivada de por lo menos una molécula de ADN de plantilla. El ADN barajado codifica de preferencia un polipéptido variante modificado con respecto al polipéptido codificado por el . ADN de plantilla, y pueden tener una actividad biológica alterada con respecto al polipéptido codificado por el ADN de plantilla.
"Molécula dé ADN recombinante" es una combinación, de secuencias de ADN que se une juntas usando tecnología de ADN recombinante y procedimientos usados para unir secuencias de ADN como se describe, por ejemplo, en Sambrook y otros, 1989.
La palabra "planta" se refiere a cualquier planta, en .particular a plantas agronómicamente útiles (por ejemplo, plantas de semilla), y "célula vegetal" es una unidad estructural y fisiológica de la planta, que comprende una pared celular pero también puede referirse a un pro'toplasto. La célula vegetal puede estar en la forma de una sola célula aislada o una célula cultivada, o como una parte de unidad organizada superior tal como, por ejemplo, un tejido vegetal, o un órgano de planta diferenciado en una estructura que está presente en .cualquier etapa de un desarrollo de planta. Dichas estructuras incluyen uno o más órganos vegetales incluyendo, pero sin limitación a, fruta, brote,, tallo, hoja, pétalo de flor, etc. Preferiblemente, el término "planta" incluye plantas enteras, órganos/estructuras vegetativos de brote (por ejemplo, hojas, tallos y tubérculos), raíces, flores y órganos/estructuras florales (por ejemplo, brácteas, sépalos, pétalos, estambres, carpelos, anteras u óvulos), semillas (incluyendo embrión, endosperma y cubierta de semilla) y frutas (el ovario maduro), tejidos vegetales (por ejemplo, tejido vascular, tejido molido, y similares) y células (por ejemplo, células de estomas, zigotos, tricomas y similares), y progenie de los mismos. La clase de plantas que se puede usar en el método de la invención por lo general es tan amplio como la clase de plantas superiores e inferiores disponibles para técnicas de transformación, incluyendo angiospermas (plantas monocotiledóneas y dicotiledóneas), gimnospermas, heléchos y algas multicelulares. Incluye plantas de una variedad de niveles de ploiplodía, incluyendo aneuploide, p o I i p I o i de , diploide, haploide y heizigoto. Dentro del alcance de la invención se incluyen todos los géneros y especies de plantas superiores e inferiores del reino vegetal. Además, se incluyen las plantas maduras, semilla, brotes y semilleros, y partes, material de propagación (por ejemplo, semillas y fruta) y cultivos, por ejemplo, cultivos celulares, derivados de los mismos. Se prefieren plantas y materiales de planta de las siguientes familias de planta: Amaranthaceae, Brassicaceae, Carophyllaceae, Chenopodiaceae, Compositae, Cucurbitaceae, Labiatae, Leguminosae, Papilionoideae, Liliaceae, Linaceae, Malvaceae, Rosaceae, Saxifragaceae, Scrophulariaceae, Solanaceae, Tetragoniaceae. Las plantas anuales, perenes, monocotiledóneas y dicotiledóneas son organismos' huésped preferidos para la generación de plantas transgénicas. El uso del sistema de recombinación, o método de conformidad con la invención además es ventajoso en todas las plantas ornamentales, silvicultura, fruta o árboles ornamentales, flores, flores de corte, arbustos o césped. Dicha planta puede incluir, pero no se deben limitar a, briofitas tales como, por ejemplo, Hepaticae (hepáticas) y Musci (musgo); pteridofitas tales como heléchos, musgo club; gimnospermas tales como coniferos, cicas, ginkgo y Gnetaeae, algas tales como Chlorophyceae, Phaeophpyceae, Rhodophyceae, Myxophyceae, Xanthophyceae, Bacillariophyceae (diatomeas) y Éuglenophyceae. Plantas para los propósitos de la invención pueden comprender las familias de la Rosaceae tal como rosa, Ericaceae tal como rododendrones y azáleas, Euphorbiaceae tales como poinsetias y crotones, Caryophyllaceae tal como claveles, Solanacéae tales como petunias, Gesneriaceae tal como violeta africana, Balsaminacea tal como "touch-me-not", Orchidaceae tales como orquídeas, Iridaceae tales como gladiolas, iris, fresias, azafranes, Compositae tal como caléndula, Geraniaceae tal como geranio, Liliaceae tal como Drachaena, Moraceae tal como ficus, Araceae tal como filodendrón y muchos otros. Las plantas transgénicas de conformidad con la invención además se seleccionan en particular a partir de plantas de cosecha dicotiledóneas tales como, por ejemplo, de las familias de las Leguminosae tales como chícharo, alfalfa y soya; la familia de Umbelliferae, en particular el género Daucus (muy en particular la especie carota (zanahoria)) y Apium (muy en particular la especie graveolens var. Dulce (apio)) y muchos otros;, la familia de las Solanacéae, en particular el género Lycopersicon , muy en particular la especie escu/enfum (tomate) y el género Solanum, muy en particular la especie tuberosum (papa) y melongena (berenjena), tabaco y. muchos otros; y el género Capsicum, muy en particular la especie annum (pimienta) y muchos otros; la¡ familia de los Leguminosae, en particular el género Glyicine, muy en particular la especie max (soya) y muchos otros; y la familia de. los Cruciferae, en particular el género Brassica, muy en particular la especie napus (colza oleaginosa), campestris (betabel), olerácea cv Tastie (col), olerácea cv Snowball Y (coliflor) y olerácea cv Emperor (brócoli); y el género Arabidopsis, muy en particular la especie thaliana y muchos otros; la familia de los Compositae, en particular el género Lactuca, muy en particular la especie sativa (lechuga) y muchos otros. Las plantas transgénicas de conformidad con la invención sé pueden seleccionar entre plantas de cosecha monocóti ledóneas, tales como, por ejemplo, cereales tales como trigo, cebada, sorgo y mijo, centeno, triticale, maíz, arroz o avena, y caña. Se prefieren más árboles tales como manzano, pera, membrillo, ciruela* cereza, durazno, nectarina, chabacano, papaya, mango y otras especies leñosas incluyendo árboles coniferos y de hoja caduca tales como álamo, pino, secuoya, cedro, roble, etc. En especial se prefieren Arabidopsis thaliana, Nicotiana tabacum, colza oleoginosa, soya, maíz, trigo, Linum usitatissimum (linaza), Camelina sativa, Brassica júncea, papa y tagetes.
"Aumento significativo" es un aumento que es más grande que el margen de error inherente en la técnica de medición, preferiblemente un aumento por aproximadamente 2 veces o. más.
"Significativamente menos" significa que la reducción es más grande que el margen de error inherente en la técnica de medición, preferiblemente una reducción por aproximadamente 2 veces o más.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La presente invención de esta manera provee moléculas de ácido nucleico aisladas que comprenden una secuencia de nucleótido de planta que dirige transcripción en epidermis de un fragmento de ácido nucleico operativamente ligado en una planta o parte de la misma.
La presente invención además provee moléculas de ácido nucleico aisladas que comprenden una secuencia de nucleótido de planta que dirige transcripción en epidermis de un fragmento de ácido nucleico operativamente ligado en una planta ó parte del mismo sobre inducción por un patógeno, preferiblemente un patógeno fúngico.
La presente invención provee además moléculas de ácido nucleico aisladas que comprenden una secuencia de nucleótido de planta que dirige transcripción constitutiva de un fragmento de ácido nucleico operativamente ligado en una planta o parte de la misma.
La presente invención provee además moléculas de ácido ¦i nucleico aisladas que comprenden una secuencia de nucleótido de planta, que dirige transcripción específica de mesofilo o preferible de mesofilo de un fragmento de. ácido nucleico operativamente ligado en una planta o parte de la misma.
Lá presente invención provee además moléculas de ácido nucleico aisladas que comprenden una secuencia de nucleótido de planta que dirige transcripción específica de mesofilo y epidermis o preferible de me.sofilo y epidermis de un fragmento de ácido nucleico operativamente ligado en una planta o parte de la misma sobre inducción por un patógeno, preferiblemente un patógeno fúngico.
Además, la presente invención provee casetes de expresión transgénicos para regular expresión en epidermis de planta, expresión inducible en epidermis de planta y/o expresión de mesofilo o constitutiva que comprende a) : por lo menos una molécula de nucleótido reguladora de transcripción derivada de cualquiera de los géneros Glycine max descritos por el lugar de genoma Glycine max i de GenBank Glymal.1 g14950, Glyma 14g06680, Glym:aÓ2g47670, • Glyma14g02930, Glymal 7g27610, Glymal 3g44640, Gíyma08g37270, Glyma04g40860.1 , GlymaOI g33070.2, Glyma15g05820.1 , GlymaOI g42660.1 , Glymal 7g14320 o . Glyma01g01510.1 o sus genes ortólogos y funcionalmente ligados a los mismos b) por lo menos una molécula de ácido nucleico que es heterologa en relación a dicha molécula de nucleótido reguladora de transcripción.
Además, la presente invención provee casetes dé expresión transgénicos para regular expresión en mesofilo 'dé planta comprendiendo por lo menos una molécula de nucleótido reguladora de transcripción derivada de cualquiera de los géneros Arabidopsis thaliana descritos por el lugar de geno.ma Arabidopsis thaliana de GenBank At1g49750, At3g62410, At1 g61520, At1g303080 o At1g65490 o sus genes ortólogos y f uncionalmente ligados a los mismos por lo menos una molécula de ácido nucleico que es h,eteró|oga en relación a dicha secuencia de nucleótido reguladora de transcripción.
"Transcripción específica de tejido" en el contexto de esta invención significa la transcripción de una molécula de ácido nucleico por una molécula de ácido nucleico reguladora de transcripción en una manera que la transcripción de dicha molécula de ácido nucleico en dicho tejido contribuyen a más de 90%, preferiblemente más de 95%, más preferible más de 99% de la cantidad entera del ARN transcrito de dicha molécula de ácido nucleico en la planta entera durante cualquiera de su etapa en desarrollo. Las moléculas de nucleótido reguladoras de transcripción descritas específicamente en la presente son consideradas como moléculas de nucleótido reguladoras de transcripción específicas de tejido.
"Transcripción preferencial de tejido" en el contexto de esta invención significa la transcripción de una molécula de ácido nucleico por una molécula de ácido nucleico reguladora de transcripción en una manera que la transcripción de dicha secuencia de ácido nucleico en dicho tejido contribuye a más de 50%, preferiblemente más de 70%, más preferible más de 80% de la cantidad entera del ARN transcrito a partir de dicha secuencia de ácido nucleico en la planta entera durante cualquiera de su.etapa en desarrollo. "sustancialmente la misma actividad reguladora de transcripción" en el contexto de esta invención significa la transcripción de una molécula de ácido nucleico por una molécula de ácido nucleico reguladora de transcripción que es un fragménto o un homólogo o una variante de cualquiera de SEC ID NO: 1, 2:, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 ó 18 tiene la misma transcripción específica de tejido o preferencial de tejido ya que la molécula de ácido nucleico reguladora de transcripción se deriva de y tiene por lo menos 50%, preferiblemente por lo menos 60%,. más preferible por lo menos 80% o 90%, incluso más preferible por lo menos 95%, muy preferible la misma resistencia de expresión ya que la molécula de ácido nucleico reguladora de transcripción.
Preferiblemente una molécula de ácido nucleico reguladora de transcripción de la invención comprende por lo menos una secuencia promotora del gen respectivo (por ejemplo, una secuencia localizada ascendente del inicio de transcripción del gen respectivo capaz de inducir transcripción de las secuencias descendentes). Dicha molécula de ácido nucleico reguladora de transcripción puede comprender la secuencia promotora de dichos genes, pero además puede comprender otros elementos tales como la secuencia 5' no traducida, potenciador, intrones, etc. Preferiblemente, dicha secuencia promotora dirige transcripción de un segmento de ácido nucleico operativamente ligado en una epidermis de planta o célula. de epidermis de planta, por ejemplo, un ADN de planta ligado que. comprende un marco de lectura abierto para un gen estructural o regulador.
Como se especificó antes en la sección de DEFINICIÓN, las identidades entre secuencias de nucleótido se miden preferiblemente por el programa BLASTN usando parámetros previamente establecidos con una longitud de palabra (W) de 11, una expectación (E) de 10, un corte de 100, M = 5, N = -4, y una comparación de ambas cadenas. Para medir identidad entre secuencias de aminoácido, el programa BLASTP se usa con parámetros pre-establecidos con una longitud de palabra (W) de 3, una expectación (E) de 10, y la matriz de calificación BLOSUM62 (ver Henikoff & Henikoff, 1989). Se usa la versión 1.4.7 del programa BLAST o posterior.
Preferiblemente, dicho homólogo o fragmento de dicha secuencia de nucleótido aislado (por ejemplo, las secuencias especificadas bajo ¡i), iii), iv), v), vi) y vii) anterior) es capaz de modificar la transcripción en una célula u organismo vegetal, más preferible dicho homólogo o fragmento (por ejemplo, las secuencias especificadas bajo ¡i), iii), iv), v) y vi) anteriores) tiene sus la misma actividad reguladora de transcripción como ya molécula de nucleótido reguladora de transcripción descrita por SEC ID ÑO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 ó 1.8. Preferiblemente, el homólogo o fragmento (por ejemplo, las secuencias especificadas bajo iv) o v) anteriores) es hibridar bajo condiciones rigurosas (es decir, condiciones rigurosas medianas, más preferible altamente rigurosas) con la secuencia diana especificada.
Preferiblemente, la molécula de nucleótido reguladora de ¦transcripción empleada en los casetes de expresión de la invención se selecciona a partir de moléculas que consisten dé moléculas descritas por SEC ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29,: 30, 31, 32, : 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, /48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 y 89 o cualquier homólogo o fragmento de la misma. Más preferible, la molécula de nucleótido reguladora de transcripción empleada en el cásete de expresión de la invención se selecciona a partir de moléculas que consiste de i) la molécula descrita por SEC ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, i9, 20, 21, 22, 23, 24, 25, 26, 27, 28,. 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61 , 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76,.77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 y 89, y un fragmento de por lo menos 250 bases consecutivas, preferiblemente por lo menos 300 bases consecutivas, más preferible por lo menos 400 bases consecutivas, incluso más preferible por lo menos 500 bases consecutivas, muy preferible por lo menos 750 bases consecutivas de una molécula descrita por cualquiera de SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58,.59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 y 8? y una secuencia de nucleótido de por lo menos 250 bases consecutivas, preferiblemente por lo menos 300 bases consecutivas, más preferible por lo menos 400 bases consecutivas, incluso más preferible por lo menos 500 bases consecutivas, muy preferible por lo menos 750 bases consecutivas con una identidad de secuencia de por lo menos 60%, 65% o 70%, preferiblemente por lo menos 75%, .80% u 85%, más preferible por lo menos 90% o 95%, incluso más preferible por lo. menos 96% o 97%, muy preferible por. lo menos 90% o 99%, a una molécula de nucleótido reguladora de transcripción descrita por cualquiera de SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, .21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, .47, 48, 49, 50, 51, 52^ 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85,.86, 87, 88 u 89, y una molécula de nucleótido teniendo una identidad de secuencia de por lo menos 60%, 65%, 70%, 75% u 80%, preferiblemente por lo menos 85%, más preferible por lo menos 90% o 95%, incluso más preferible 96% o 97%, muy preferible por lo menos 98% o 99% a una molécula de ácido nucleico, aislada capaz de regular expresión en plantas descrita por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, .62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 y 89, y una molécula de nucleótido de por lo menos 250 bases, preferiblemente por lo menos 300 bases, más preferible por lo menos 400 bases, incluso más preferible por lo menos 500 bases, muy preferible por lo menos 750 bases capazrde hibridar. preferiblemente bajo condiciones equivalentes a hibridación en 7% dodecilsulfato de sodio (SDS), 0.5 NaP04, 1 mM EDTA a 50°C con lavado en 0.1 X SSC, 0.1% SDS a 50°C, de manera más deseable en 7 SDS, 0.5 M NaP04, 1 mM EDTA a 50°C con lavado en 0.1 X SSC, 0.1% SDS a 65°C a una molécula de ácido nucleico aislada capaz de regular expresión en plantas descrita por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44., 45, 46, 47, 4.8, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 y 89, o el complemento de la misma; una molécula de nucleótido de por lo menos 250 bases, preferiblemente por lo menos 300 bases, más preferible por lo menos 400 bases, incluso más preferible por lo menos 500 bases, muy preferible por lo menos 750 bases capaz de hibridar preferiblemente bajo condiciones equivalentes a hibridación en 7% dodecilsulfato de sodio (SDS), 0.5 M NaP04, 1 mM EDTA a 50°C con lavado en 0.1 X SSC, 0.1% SDS a 50°C, de manera más deseable en 7% SDS, 0.5 M NaP04, 1 mM EDTA a 50°C con lavado en 0.1 X SSC, 0.1% SDS a 65°C a un ácido1 nucleico que comprende por lo menos 250, preferiblemente por lo menos 300, más preferible por lo menos 400, incluso más preferible por lo menos 500, muy preferible por lo menos 750 nucleótidos consecutivos de una molécula de ácido nucleico aislada capaz de regular expresión en plantas descrita por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,: 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 y 89, o el complemento de la misma; y i i ) una molécula de ácido nucleico aislada capaz de regular expresión en plantas que es el complemento o complemento invertido de cualquiera de las moléculas de ácido nucleico previamente mencionadas bajo i) a vi).
Preferiblemente, dicho homólogo o fragmento de la molécula de nucleótido reguladora de transcripción a emplearse en el cásete de expresión de la invención (por ejemplo, las secuencias especificadas bajo ¡i), Mi), iv), v), vi) y y i i ) anteriores) es capaz de modificar la transcripción en una célula u organismo vegetal, más preferible dicho homólogo o fragmento (por ejemplo, las secuencias bajo ii), ¡ii), iv), V) y vi) anteriores) tiene sustancialmente la misma actividad reguladora de transcripción como la molécula de nucleótido reguladora de transcripción descrita por SEC ID NO: i, 2; 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17 y 18. Preferiblemente,, el homólogo o fragmento (por ejemplo, las secuencias especificadas bajo iii) anteriores) tiene una identidad de secuencia de por lo menos 60% o 65%, preferiblemente por lo menos 70%, 75% u 80%, . más preferible por lo menos 90% . o 95%, muy preferible por lo menos 97%, 98% o 99% a una secuencia descrita por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17 y 18. Preferiblemente, los homólogos o fragmentos (por ejemplo, las secuencias especificadas bajo i ) o vi) -anteriores) se hibridan bajo condiciones rigurosas' (es decir, condiciones de preferencia medianamente rigurosas, más preferible altamente rigurosas) con la secuencia diana especificada.
En las aplicaciones US 61/419895 y EP 10.193800.9, se describen métodos para la producción de dichos homólogos teniendo el mismo patrón de expresión como la secuencia de referencia como se define por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 y 18.
Los homólogos o fragmentos de la molécula de, nucleótido reguladora de transcripción de la invención (por ejemplo, la secuencia descrita por cualquiera de SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8', 9, 10, 11, 12, 13, 14, 15, 16, 17 y 18) se puede obtener o es obtenible de ADN genómico vegetal de un gen que está codificando una secuencia de aminoácido teniendo por lo menos 90% de identidad de secuencia de aminoácido, más preferible por lo menos. 90% o 95%, muy preferible por lo menos 97% o 98% identidad de secuencia de aminoácido, a un polipéptido como se describe por SEC ID NO: 221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251 , 253 y 255.
La actividad de una molécula de nucleótido reguladora de transcripción es considerada equivalente si se inicia transcripción en los mismos tejidos como es por la molécula de referencia. Dicho perfil de expresión es demostrado preferiblemente usando genes reporteros operativamente ligados a dicha molécula de nucleótido reguladora de transcripción. Genes reporteros preferidos (Sc.henborn 1999) en este contexto son proteína verde fluorescente (GFP) (Chui 1996; Leffel 1997), cloranfenicol transferasa, luciferasa (Millar 1992), beta-glucoronidasa o beta-galactosidasa. En especial, se prefiere beta-glucoronidasa (Jefferson 1987).
Aparte de esta actividad reguladora de transcripción de un homólogo o fragmento equivalente funcional de la molécula de nucleótido reguladora de transcripción puede variar de la actividad de su secuencia origen, en especial con respecto al nivel de expresión. Este nivel de expresión puede ser mayor o rruenor que el nivel de expresión de la secuencia origen. Ambas derivaciones. pueden ser ventajosas dependiendo de la secuencia de ácido nucleico de interés a expresarse. Se prefieren dichas secuencias, equivalentes funcionales, que - en comparación con su secuencia origen - no se deriva del nivel de expresión de dicha secuencia origen por más de 50%, preferiblemente 25%, más preferible 10% . (como será juzgado preferiblemente pro expresión de mARN o proteína (por ejemplo, gen reportero) expresión). Además, se prefieren secuencias equivalentes que demuestran una expresión aumentada en comparación con su secuencia origen, preferiblemente un aumento por al menos 50%, más preferible por al menos 100%, muy preferible por al menos 500%.
Preferiblemente, un equivalente funcional de la molécula de nucleótido reguladora de transcripción de la invención se puede obtener o es obtenible de ADN genómico vegetal de un gen expresando un mARN descrito por un cADN que comprende una secuencia que es sustancialmente similar y preferiblemente tiene por-.-. lo menos 90%, preferiblemente por lo menos 92% o 95%, más preferible por lo menos 96% o 97%, muy preferible por \o> menos 99% identidad de secuencia a una secuencia descrita por cualquiera de SEC ID NOs: 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 250, 252 y 254. Preferiblemente, dicha molécula de nucleótido reguladora de transcripción exhibe actividad promotora en los mismos tejidos como la molécula de referencia como se define por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14,. 15, 16, 17 y 18.
Dicho equivalente funcional de la molécula de rrucleótido reguladora de transcripción se puede obtener de otras especies de planta. al usar las secuencias promotoras de Arabidopsis thaliana o Glycine max descritas en la presente como sondas para seleccionar genes estructurales homólogos en otras plantas por hibridación bajo condiciones de hibridación baja, moderadas' o rigurosas. Las regiones de las secuencias promotoras de la presente invención que se conservan entre especies también se podrían usar como cebadores de PCR para amplificar un segmento de una especie diferente de Arabidopsis thaliana, o Glycine max, y ese. segmento usado como una sonda de hibridación (la última s propuesta •permitiendo mayor selección de rigor) o en un ensayo, de transcripción para determinar actividad promotora. Además, las secuencias promotoras se podrían emplear para identificar secuencias estructuralmente relacionadas en una base de datos usando algoritmos de computadora.
Más específicamente, con base en las secuencias de ácido nucleico de la presente invención, se pueden identificar o aislar ortólogos a partir de el genoma de cualquier organismo deseado, preferiblemente de otra planta, de acuerdo con técnicas bien conocidas con base en su similitud de secuencia a las secuencias de ácido nucleico de Arabidopsis thaliana, o Glycine max, por ejemplo, hibridación, PCR o comparaciones de secuencia generadas por computadora. Por ejemplo, toda o una porción de una secuencia de ácido nucleico particular de Arabidopsis thaliana o Glyciné max se usa como una sonda que híbrida selectivamente a otras secuencias de genes presentes en una población de fragmentos de ADN geriómicos o fragmentos de cADN (es decir, genotecas genómicas o de cADN) de un organismo de fuente elegida. Además, genotecas genómicas y de cADN) de un organismo de fuente elegido. Además, genotecas adecuadas genómicas de cADN se pueden preparar a partir de cualquier célula o tejido u organismo. Dichas técnicas incluyen selección, de hibridación de genotecas de ADN en placa (ya sean placas o colonias; ver, por ejemplo, Sambrook 1989) y amplificación por PCR usando cebadores de oligpnucleótido preferiblemente correspondiendo a dominios de , secuencia conservados entre polipéptido relacionado o subsecuencias de las secuencias de nucleótido provistas en la presente (ver, por ejemplo, Innis 1990). Estos métodos en particular son bien adecuados al. aislamiento de secuencias de genes de organismos relacionados cercanamente al organismo del cual se deriva la secuencia d sonda.
La aplicación de éstos métodos usando las secuencias Arabidopsis thaliana o Glycine max como sondas es bien adecuada para el aislamiento de secuencias de genes a partir de cualquier organismo de fuente, preferiblemente otras especies de planta. En una propuesta de PCR, se pueden diseñar cebadores de oligonucleótido para usarse en reacciones de PCR para amplificar secuencias de ADN correspondientes a partir de cADN o ADN genómico extraído de cualquier planta de interés. Los métodos para diseñar cebadores de PCR y clonación de PCR en general son conocidos en la técnica.
En técnicas de hibridación, todo o parte de una secuencia, de nucleótido conocida se usa como una sonda que selectivamente híbrida a otras secuencias de nucleótido correspondientes presentes en una población de fragmentos de ADN genómicos clonados o fragmentos de cADN (es decir, genotecas genómicas o de cADN) a partir de un organismo elegido. Las sondas de hibridación pueden ser fragmentos de ADN genómicos, fragmentos de cADN, fragmentos de ARN, u otros oligonucleótidos, y se pueden marcar con un grupo detectable tal como 32p, o cualquier otro marcador detectable. De. esta manera, por ejemplo, se pueden hacer sondas para hibridación al etiquetar oligonucleótidos sintéticos basados en la secuencia de la invención. Métodos para la preparación de sondas para hibridación y para construcción de cADN y genotecas genómicas en general son conocidos en la técnica y se describen en Sambrook y otros (1989). En general, secuencias que hibridan a las secuencias descritas en la presente tendrán por lo menos aproximadamente 50% a - 70% . e incluso aproximadamente 80%, 85%, 90%, 95% a 98% o más identidad con las secuencias descritas. Es decir, la similitud, de secuencia de secuencias puede variar, compartiendo al menos , aproximadamente 50% a 70%, e incluso aproximadamente 80%, 85%, 90%, 95% a 98% de similitud de secuencia.
Las moléculas de ácido nucleico de la invención también se pueden identificar, por ejemplo, por una búsqueda de bases de datos . conocidas para polipéptidos codificadores de genes teniendo una identidad de secuencia de aminoácido especificada o ADN teniendo una identidad de secuencia de nucleótido especificada. Métodos de alineación de secuencias para comparación son bien conocidos en la té cnica y se describen antes en la presente.
Por tanto, las. moléculas de ácido nucleico aisladas de la invención incluyen los ortólogos de las secuencias. Arabidopsis thaliana o Glycine max descritas en la presente, es decir, las secuencias de nucleótido correspondientes en organismos diferentes, de Arabidopsis thaliana o Glycine max incluyendo, pero sin limitación á, plantas diferentes de Arabidopsis thaliana o Glycine max, •preferiblemente plantas dicotiledóneas, por ejemplo, alfalfa, girasol, . semilla de colza, algodón, cacahuate, tabaco o betabel, pero también plantas de cereal tales como maíz, trigo, centeno, césped, sorgo, mijo, caña, cebada y plátano. Un gen ortólogo es un gen ¾a partir de una especie diferente que codifica un producto que tiene la misma o similar función, por ejemplo, catalizando la misma reacción .como un producto codificado por un gen a partir de un organismo de referencia. De esta manera, un ortólogo incluye polipéptidos teniendo menos de, por ejemplo, 50% identidad de secuencia de aminoácido, pero el cual ortólogo codifica un polipéptido que tiene la misma o similar función. Se pueden emplear bases de datos tal como GenBank para identificar secuencias relacionadas a las secuencias Arabidopsis thaliana o Glycine max, por ejemplo, ortólogos , en otras plantas cotiledóneas. Alternativamente, técnicas , de ADN recombinante tales como hibridación o PCR se pueden emplear para identificar secuencias relacionadas con las secuencias Arabidopsis thaliana o Glycine max o clonar las secuencias equivalentes de diferentes ADNs.
Las secuencias de nucleótido reguladoras de transcripción de la invención o sus equivalentes funcionales se pueden obtener o aislar a partir de cualquier planta o fuente de no planta, o producirse sintéticamente por medios puramente químicos. Las . fuentes preferidas incluyen, pero no se limitan a, las plantas definidas en la sección DEFINICIÓN anterior.
De esta manera, otra modalidad preferida de la invención se refiere a un método para identificar y/o aislar una molécula de nucleótido reguladora de transcripción caracterizada porque dicha identificación y/o aislamiento utiliza una molécula de ácido nucleico codificando . un polipéptido que comprende una secuencia como se describe por SEC ID NO: 221, 223, 225, 227, 229, 231, 233, 235, .237, 239, 241, 243, 245, 247, 249, 251, 253 y 255, o una parte de dicha secuencia de ácido nucleico. Se prefieren moléculas de ácido nucleico que comprenden secuencias de ácido nucleico descrito por o comprendiendo cualquiera de SEC ID NO. 220, 222, 224, 226, 228, 2.30, 232, 234, 236, 238, 240, 242, 244, 246, 258, 250, 252 y 254 o partes de las mismas. "Parte" en este contexto significa una secuencia de ácido nucleico de por lo menos 15 nucleótidos consecutivos, preferiblemente por lo menos 25 nucleótidos consecutivos, más preferible por lo menos 50 nucleótidos consecutivos.
El método para identificación y/o aislamiento se puedejbasar en (pero no se limita a) los métodos descritos antes tal como reacción en cadena de polimerasa, hibridación o selección de base de datos. Preferiblemente, este método de la invención se basa en una reacción en cadena de polimerasa, en donde dicha secuencia de ácido nucleico o su parte se utiliza como cebador de oligqnucleótido. El experto en la técnica conoce varios métodos para ampliar y aislar el promotor de un. gen que inicia a partir de parte de su secuencia codificadora (tal como, por ejemplo, parte de un cÁDN). Dichos, métodos pueden incluir, pero no se limitan a, método tal como PCR ("iPCR") o "PCR entrelazado asimétrico térmico" ("TAIL PCR").
De esta manera, otra modalidad de la invención se refiere a un método para proveer o producir un cásete de expresión transgénico para expresión heteróloga 'en- plantas comprendiendo los pasos de: I. aislar una molécula de nucleótido reguladora de transcripción de un gen vegetal que utiliza por lo menos una secuéncia de ácido nucleico que comprende cualquiera de SEC ID NO: .220, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252 y 254, q una parte de por lo menos 15, preferiblemente por lo menos 20 nucleótidos consecutivos de dicha secuencia de ácido nucleico, y II. funcionalmente ligando dicha molécula de nucleótido reguladora de transcripción a otra molécula de nucleótido de interés, que sea heteróloga en relación a dicha molécula de nucleótido reguladora de transcripción.
Todavía otra modalidad de la invención se refiere a un método para proveer un cásete de expresión transgénico para expresión que comprende los pasos de: I. aislar una molécula de nucleótido reguladora de transcripción que utiliza por lo menos una molécula de ácido nucleico o una parte de la misma, en donde dicha molécula está codificando una proteína que comprende cualquiera de SEC ID NO: 221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253 y 255,. o una parte de por lo menos .15 nucleótidos consecutivos de los mismos, y II. funcionalmente ligando dicha molécula de nucleótido reguladora de transcripción a otra molécula de nucleótido de interés, que sea heteróloga en relación a dicha molécula1 de nucleótido reguladora de transcripción.
Preferiblemente, la molécula de ácido nucleico empleada para el aislamiento comprende por lo menos 15 nucleótidos consecutivos, preferiblemente por lo menos 25 nucleótidos consecutivos, más preferible por lo menos 50 nucleótidos consecutivos de una molécula •de ácido nucleico que comprende una secuencia descrita por cualquiera de SEC ID NO: 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252 y 254. Preferiblemente, el aislamiento de la molécula de nucleótido reguladora de transcripción se realiza por . una reacción en cadena de pólimerasa utilizando dicha secuencia de ácido nucleico como un cebador. La ligadura operable se puede realizar por método de clonación estándar conocido en la técnica tal como clonación mediada por ligación o clonación mediada por recombinación.
Preferiblemente, las secuencias de nucleótido reguladoras de transcripción y promotores de la invención incluyen un estiramiento consecutivo de aproximadamente 250 bases consecutivas, preferiblemente por lo menos 300 bases consecutivas, más preferible por lo menos 400 bases consecutivas, incluso más preferible por lo menos 500 bases consecutivas, muy preferible por lo menos 750 bases consecutivas, de cualquiera de SEC ID NOs: 1, 2, 3; 4, 5, 6, 7¡ 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 y 18, o los ortólogos prómotores de los mismos, que incluyen la región promotora mínima.
Preferiblemente, las secuencias de nucleótido reguladoras de transcripción y promotores de la invención incluyen un estiramiento consecutivo de aproximadamente 250 bases consecutivas, preferiblemente por lo menos 300 bases consecutivas, más preferible por lo menos 400 bases consecutivas, incluso más preferible por lo menos 500 bases consecutivas, muy preferible por lo menos 750 bases consecutivas, de cualquiera de SEC ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 y 18, o los ortólogos promotores de los mismos, que incluyen la región promotora mínima. En una modalidad particular de la invención, dicho estiramiento consecutivo de aproximadamente 250 bases consecutivas, preferiblemente por lo menos 300 bases consecutivas, más preferible por lo menos 400 bases consecutivas, incluso más preferible por lo menos 500 bases .consecutivas, muy preferible por lo menos 750 bases consecutivas, tiene al menos 50% o 60%, preferiblemente por lo menos 70% u 80%, más preferible por lo menos 90%, incluso más preferible por lo menos 95% o 97%, muy preferible 98% o 99%, identidad .de secuencia de ácido nucleico con un estiramiento consecutivo correspondiénte de aproximadamente 250 bases consecutivas, preferiblemente por lo menos 300 bases consecutivas, más preferible por lo menos 400 bases consecutivas, incluso más preferible por lo menos 500 bases consecutivas, muy preferible por lo menos 750 bases consecutivas, de cualquiera de SEC ID NOs: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 y 18 o los ortólogos promotores de las mismas, que incluyen la región promotora mínima. El estiramiento antes definido de nucleótidos contiguos comprende de preferencia uno o más motivos promotores seleccionados a partir del grupo que consiste de caja TAJA, caja GC, caja CAAT y un sitió de inicio de transcripción.
Las secuencias de nucleótido reguladoras de transcripción de •la invención o sus equivalentes funcionales son capaces dé impulsar expresión de una secuencia codificadora en una célula diana, en particular en una célula vegetal. Las secuencias promotoras y métodos descritos en la presente son útiles en regular expresión, respectivamente, o cualquier secuencia de nucleótido heterólogo en una planta huésped o parte de la misma a fin de variar el fenotipo de esa planta. Estos promotores se pueden usar con combinaciones de potenciador, elementos ascendentes, y/o secuencias activadoras a partir de las regiones 5' flanqueantes de genes estructurales expresables de planta. Dé manera similar, el elemento ascendente se puede usar en combinación con varias secuencias promotoras de planta.
Las secuencias de nucleótido reguladoras de transcripción y. promotores de la invención son útiles para modificar el fenotipo de una planta. Varios cambios en el fenotipo de una planta transgénica son deseables, es decir, modificar la composición de ácido graso en una. planta, alterando el contenido de aminoácido de Una planta, alterando un mecanismo de defensa de patógeno de una planta, y similares. Estos resultados se pueden lograr al proveer expresión de productos heterólogos o expresión aumentada de productos endógenos en plantas. Alternativamente, los resultados se pueden lograr al proveer una reducción de expresión de uno o más productos endógenos, en particular enzimas o cofactores en la planta. Estos cambios resultan en una alteración en el fenotipo de la planta transformada.
Por lo general, las secuencias de nucleotido reguladoras de transcripción y promotores de la invención se pueden . emplear para expresar un segmento de ácido nucleico que se liga operativamente a dicho promotor tal como, por ejemplo, un marco de lectura abierto,, o una porción del mismo, una secuencia anti-sentido, una .secuencia codificando una secuencia de ARN de doble cadena, o un transgen en plantas.
Una ligadura operable - por ejemplo - puede comprender una distribución secuencial de |a molécula de nucleotido reguladora de transcripción de la invención (por ejemplo, una secuencia como se describe por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, .30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, .76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 y 89) con una secuencia de ácido nucleico a expresarse, y -opcjonalmente - elementos reguladores adicionales tales como, por ejemplOj elementos de terminación de poliadenilación o transcripción, potenciadores, intrones, etc., en una manera que la molécula de nucleotido reguladora de transcripción puede, cumplir, su función en el. proceso de expresar la secuencia de. ácido huóleico de interés bajo las condiciones apropiadas. El término "condiciones apropiadas" significa preferiblemente la presencia del cásete de expresión en una célula vegetal. Se prefieren distribuciones, en donde la secuencia de ácido nucleico de interés a expresarse se coloca descendente (es decir, en la dirección 3') de la molécula de nucleótido reguladora de transcripción de la invención en una manera, que ambas secuencias se ligan covalentemente. Secuencias opcionalmente adicionales se pueden insertar entre las dos secuencias. Dichas secuencias pueden ser, por ejemplo, entrelazador o múltiples sitios de clonación. Además, se pueden insertar secuencias codificando partes de proteínas de. fusión (en caso de que una proteína de fusión de la proteína codificada por el ácido nucleico de interés se debe expresar). Preferiblemente, la distancia entre la secuencia de ácido nucleico de interés a expresarse y la molécula de nucleótido reguladora de transcripción de la invención es no más de 200 pares base, preferiblemente no más de 100 pares base, más preferible no más de 50 pares base.
Una ligadura operable en relación a cualquiera cásete de expresión o de la invención se puede realizar por varios' métodos conocidos en la técnica, comprendiendo tanto procedimiento in vitro como in vivo. De esta manera, un cásete de expresión de la invención o un vector que comprende dicho cásete de expresión se puede realizar usando recombinación estándar y técnicas de clonación bien conocidas en la técnica (ver, por ejemplo, Maniatis 1989; Silhavy 1984; Ausubel 1987).
Un easete de expresión también se puede ensamblar al insertar una molécula de nucleótido reguladora de transcripción de la invención (por ejemplo, una secuencia como se describe por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38/ 39, 40, 41 , 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 , 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, y, 89) en el genoma vegetal. Dicha inserción resultará en una ligadura operable a una secuencia de ácido nucleico de interés que como tal ya existió en el genoma. Por la inserción, el ácido nucleico de interés se expresa en una manera debido a las propiedades reguladoras de transcripción de la secuencia de nucleótido reguladora de transcripción. La inserción puede ser dirigida o al azar. Preferiblemente, la inserción es dirigida y realizada, por ejemplo, por recombinación homologa. Por este procedimiento, se puede intercambiar un promotor natural contra la molécula de nucleótido. reguladora de transcripción de la invención, asi modificando el perfil de expresión de un gen endógeno. La molécula de nucleótido reguladora de transcripción también se puede insertar en una manera, que se expresa mARN anti-sentido de un gen endógeno, así induciendo silencio de genes.
Similar, una secuencia de ácido nucleico de interés a expresarse se puede insertar en un genoma de planta que comprende la molécula de nucleótido reguladora de transcripción en su ambiente genómico natural (es decir, ligado a su gen natural) en una manera que la secuencia insertada, se liga operativamente a la secuencia de nucleótido reguladora de transcripción, así formando un cásete de expresión de la invención.
El cásete de expresión se puede emplear para numerosos propósitos de expresión tal como, por ejemplo, expresión de una proteína, o expresión de un ARN anti-sentido, ARN sentido o doble cadena. Preferiblemente, expresión de la secuenciaí .de ácido nucleico confiere a la planta un rasgo agronómicamente valioso.
El marco, de lectura abierta a ligarse a la molécula, de nucleótido reguladora de transcripción de la invención se puede obtener a partir de un gen de resistencia a insectos, un gen de resistencia a enfermedad tal como, por ejemplo, un gen de resistencia a enfermedad bacteriana, un gen de resistencia a enfermedad fúngica, un gen de resistencia viral, un gen de resistencia a enfermedad de nematodo, un gen de resistencia a herbicida, un gen que afecta la composición o calidad dé grano, un gen de utilización de nutriente, un gen de reducción de micotoxina, un gen de esterilidad masculina, un gen marcador seleccionable, un gen . marcador tamizable, un marcador seleccionable negativo, un marcador seleccionable positivo, un gen que afecta características agronómicas de planta, es decir, producción, habilidad dé aguantar, y similares, o un medio ambiente o gen de resistencia a; estrés, es decir, uno o más genes que confieren resistencia o tolerancia a herbicida, resistencia o . tolerancia a insectos, resistencia, o tolerancia a enfermedad (viral, bacteriana, fúngica, omicete o nematodo), tolerancia o resistencia a estrés (como se ejemplifica por resistencia o tolerancia a sequía, calor, frío, congelación, humedad excesiva, estrés por sal, o estrés oxidativo), rendimientos aumentados, contenido de alimento y maquillaje, apariencia física, esterilidad masculina, sequía, habilidad a resistir, prolificacia, propiedades de almidón o cantidad, cantidad y calidad! dé aceite, composición de aminoácido o proteína, y similares. Por "resistente" se quiere decir una planta, que exhibe sustancialménté ningún cambio fenotípico como una consecuencia de administración . de agente, infección con un patógeno, o exposición a estrés. Por "tolerante" se quiere decir una planta, que, aunque puede exhibir algún cambio fenotípico como una consecuencia de infección, no tiene una capacidad reproductiva sustancialménté disminuida o metabolismo sustancialménté alterado.
Las secuencias de nucleótido reguladoras de expresión especificadas antes opcionalmente se pueden ligar operativamente a otras secuencias reguladoras adecuadas, por ejemplo, una secuencia términadora de transcripción, operador, sitio de unión a represor, sitio de unión de factor de transcripción y/o un potenciador.
La presente invención provee además un vector recombínante que contiene el cásete de expresión de la invención, y células huésped que comprenden el cásete de expresión o vector, por ejemplo, comprendiendo un plásmido. El cásete de expresión o vector puede aumentar el genoma de una planta transformada o se puede mantener extra-cromosómicamente. El cásete de expresión o vector de la invención puede estar presente en el núcleo, cloroplasto, mitocondria y/o plástido de las células de la planta. Preferiblemente, el cásete de expresión o vector de la invención está comprendido en el ADN crompsómico del núcleo de planta. La presente invención también provee una planta transgénica preparada por este método, una semilla de dicha planta y plantas de progenie de dicha planta incluyendo híbridos y engendrados por endogamia. El cásete de expresión se puede ligar operativamente a un gen estructural, el marco de lectura abierta del mismo, o una porción del mismo. El cásete de expresión puede comprender además un plásmido de Ti y estar contenido en una célula Agrobacterium tumefaciens; se puede llevar a cabo en una micropartícula, en donde la micropartícula es adecuada para transformación balística de una célula vegetal; p puede estar contenida en una célula vegetal o protoplasto. Además, el cásete de expresión o vector puede estar contenido en una planta transformada o células de la misma, y la planta puede ser un dicotiledón o monocotiledón. En particular, la planta puede ser una planta dicotiledónea. Las plantas transgénicas preferidas son maíz transgénico, soya, cebada, alfalfa, girasol, cañóla, soya, . algodón, cacahuate, sorgo, tabaco, betabel, arroz, trigo, centeno, césped, mijo, caña, tomate o papa.
La invención también provee un método para cultivo de plantas, por ejemplo, para preparar una planta transgénica fértil cruzada. El método comprende una planta transgénica fértil que cornprende un cásete de expresión particular de la invención consigo mismo o con una segunda planta, por ejemplo, uno carente del cásete de expresión particular, para preparar la semilla de una planta transgénica fértil cruzada que comprende el cásete de expresión particular. La semilla entonces se planta para obtener una planta transgénica fértil cruzada. La planta puede ser un monócotiledón o un dicotiledón. En una modalidad particular, la planta es una planta, dicotiledónea. La planta transgénica fértil cruzada puede tener el cásete de expresión particular heredada a través de un , pariente hembra o a través de un pariente macho. La segunda planta puede ser una planta endogámica: El transgénico fértil cruzado puede ser un híbrido. También se incluyen dentro de la presenté invención ? semillas de cualquiera de estas plantas transgénicas fértiles cruzadas.
, Las secuencias de nucleótido reguladoras de transcripción de la invención comprenden además secuencias que son complementarias a uno (en lo sucesivo secuencia "de prueba") que híbrida bajo condiciones rigurosas con una molécula! de ácido nucleico como se describe por SEC ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50. 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88 y 89, tal como ARN que se transcribe a partir de la molécula de ácido nucleico. Cuando se realiza hibridación bajo condiciones rigurosas, la molécula de prueba o ácido nucleico de la invención preferiblemente es soportada, por ejemplo, en una membrana o chip de ADN. De esta manera, una molécula de prueba o ácido nucleico desnaturalizada de la invención preferiblemente se une primero a un soporte y se realiza, hibridación durante un periodo especifico de tiempo a una temperatura de, por ejemplo, entre 55 y 70°C, en solución salina regulada con eitrato de doble resistencia (SC) conteniendo 0.1% SDS seguido por enjuagar el soporte a la misma temperatura pero con un regulador que tiene una concentración de SC reducida. Dependiendo del grado de rigor requerido, dichos reguladores de concentración reducida típicamente son SC de una resistencia conteniendo 0.1% SDS, SC de media resistencia conteniendo 0.1% SDS y resistencia de una décima parte conteniendo 0.1% SDS. Más preferible, se lleva a cabo hibridación bajo condiciones de alto rigor (como se definió antes).
Se puede usar casi cualquier composición de ADN para entregar células vegetales recipientes, por ejemplo, células dicotiledóneas, para finalmente producir plantas transgénicas fértiles de conformidad con la presente invención. Por ejemplo, se pueden emplear segmentos de ADN o fragmentos en la forma de vectores y plásmidos, o segmentos de ADN lineal o fragmentos, en algunas instancias sólo conteniendo sólo el elemento de ADN a expresarse en la planta, y similares. La construcción de vectores, que se puede emplear en conjunto con la presente invención, será conocida a aqüellos expertos en vista de la presente descripción (ver, por ejemplo, Sambrook 1989; Gelvin 1990).
La secuencia de nucleotido de interés ligada a una o más secuencias de nucleotido reguladoras de transcripción de la invención, por ejemplo, puede codificar un ARN ribosómicol un ARN anti-sentido o cualquier otro tipo de ARN que no se traduce en proteína. En otra modalidad preferida de la invención, dicha secuencia de nucleotido de interés se traduce en un producto de proteína. La molécula de nucleotido reguladora de transcripción y/o secuencia de nucleotido de interés ligada a la misma puede ser de origen homólogo o heterólogo con respecto a la 1 planta a transformarse. Una molécula de ADN recombinante para introducción en células vegetales incluye que se ha derivado o aislado de cualquier fuente, que se puede caracterizar posteriormente en cuanto a estructura, tamaño y/o función, químicamente alterada, 5 yi después introducida en plantas. Un ejemplo de una secuencia de nsucleótido o segmento de interés "derivado" de una fuente, sería una secuencia de nucleotido o segmento que se identifica como un fragmento útil dentro de un organismo dado, y que después se sintetiza químicamente en forma esencialmente pura. Un ejemplo de dicha secuencia de nucleotido o segmento de interés "aislado" de una fuente, sería secuencia de nucleotido o segmento que se extirpa o elimina de dicha fuente por medio químico, por ejemplo, por el uso de endonucleasas de restricción, de modo que se puede manipular más, por ejemplo, amplificar, para usarse en la invención^ por la metodología de ingeniería genética. Dicha secuencia de nucleótido o fragmento es comúnmente referido como "recombinante".
Por lo tanto, una secuencia de nucleótido útil, segmento o fragmento de interés incluye ADN completamente sintético, ADN semi-sintético, ADN aislado de fuentes biológicas, y ADN derivado de ARN introducido. En general, el ADN introducido no es originalmente residente en el genotipo de planta que es el recipiente del ADN, pero está dentro del alcance de la invención para aislar un, gen. de un fenotipo de planta dado, y para posteriormente introducir múltiples .copias del gen en el mismo genotipo, por ejemplo, para potenciar producción de un producto de gen dado tal cómo una proteína de almacenamiento o una proteína que confiere tolerancia o resistencia de déficit de agua.
La molécula de ADN recombinante introducido incluye, pero no se limita a, ADN de genes vegetales, y genes no vegetales tales como aquellos de bacteria, levaduras, animales o virus. El ADN introducido puede incluir genes modificados, porciones de genes o genes quiméricos, incluyendo genes del mismo o diferente genotipo. Él término "gen quimérico" o "ADN quimérico" es definido como un gen o secuencia de ADN o segmento que comprende por lo menos dos secuencias de ADN o segmentos de especies que no combinan ADN bajo condiciones naturales, o las cuales secuencias de ADN o segmentos se colocan o ligan en una manera que no ocurre de forma natural en el genoma nativo de planta no transformada.
La molécula de ADN recombinante introducida usada para transformación en la presente puede ser circular o lineal, de doble cadena o una cadena. Por lo general, el ADN está en la forma de ADN quimérico, tal como ADN plásmido que también puede contener regiones codificadoras flanqueadas por secuencias reguladoras, que promueven la expresión del ADN recombinante presente en la planta resultante. Por lo general, la molécula de ADN recombinante introducida será relativamente pequeña, es decir, menos de aproximadamente 30 kb para minimizar cualquier susceptibilidad a degradación física, química o enzimática que es conocida por aumentar conforme el tamaño de la molécula de nucleótido aumenta. . Como se señaló antes, el número de proteínas, transcripciones de ARN o mezclas de los mismos, que se introduce en el genoma vegetal, preferiblemente se pre-selecciona y define, por ejemplo, se pueden formar de uno a aproximadamente 5-10 dichos productos del ADN introducido.
Se conocen dos métodos principales para el ^control de expresión, viz.: sobre-expresión y baja-expresión. La sobre-, expresión se puede lograr, por inserción de uno o más de una copia extra del gen seleccionado. Sin embargo, no es sabido para plantas y su progenie, originalmente transformadas con uno o más copia extra de una secuencia de nucleótido, exhibir los efectos de baja-expresión así como sobre-expresión. Para baja-expresión hay dos métodos principales, que son comúnmente referidos en la técnica como "regulación descendente anti-sentido" y "regulación descendente de sentido" (regulación descendente de sentido también es referida como "co-supresión"). En general, estos procesos son referidos como "silencio de genes". Ambos de estos métodos conducen a una inhibición de expresión del gen diana.
Obtener niveles suficientes de expresión transgénica en los tejidos vegetales apropiados es un aspecto importante en la producción de cosechas producidas genéticamente. La expresión de secuencias de ADN heterólogas en un huésped de: planta es: dependiente de la presencia de un promotor operativamente ligado que es funcional dentro del huésped vegetal. La elección de la-secuencia promotora determinará cuándo y dónde dentro del organismo se expresa la secuencia de ADN heteróloga.
Específicamente se contempla por los inventores que uno podría mutar un promotor para potencialmente mejorar la utilidad de los elementos para la expresión de transgenes en plantas. La mutagénesis de estos elementos se puede llevar a cabo en secuencias promotoras aleatorias y mutadas seleccionadas para la actividad en un procedimiento de prueba-por-error. Alternativamente, secuencias particulares que proveen el promotor con características de, expresión deseables, o el promotor con actividad mejoradora de expresión, se podrían identificar y éstas o secuencias similares introducidas en las secuencias vía mutación. Además seí contempla que uno podría mutar estas secuencias a fin de potenciar, su expresión de transgenes en una especie particular.
Los medios para mutar un segmento de ADN codificando una secuencia promotora de la presente invención son bien conocidos a a.quellos expertos en la técnica. Como se indica, se pueden hacer modificaciones a elemento promotor u otro regulador por procedimientos de mutagénesis aleatoria o específica de sitio. El elemento promotor y otro reguiador se pueden modificar al alterar su estructura a través de la adición u omisión de uno o más nucleótidos de la secuencia que codifica las secuencias no modificadas correspondientes.
Se puede realizar mutagénesis de conformidad con cualquiera de las técnicas conocidas en la técnica, tales como, y sin limitación a, .sintetizar un oligonucleótido que tiene una o más mutaciones dentro de la secuencia de una región reguladora particular. En particular, la mutagénesis específica de sitio es una técnica útil en la preparación de mutantes promotores, a través de mutagénesis específica del ADN fundamental. La técnica provee además una habilidad lista de preparar y probar variantes de secuencia, por ejemplo, incorporando una o más de las consideraciones anteriores, al introducir uno o más cambios de secuencia de nucleótido en el ADN. La mutagénesis específica de sitio permite la producción de mutantes a través del uso de secuencias de oligonucleótido específicas que codifican la secuencia de ADN de la -mutación deseada, así como un número suficiente de nucleótidos adyacentes, para proveer una secuencia cebadora de suficiente . tamaño y complejidad de secuencia para formar un dúplex estable en ambos lados de la unión de omisión siendo atravesada. Típicamente, se prefiere un cebador de aproximadamente 17 a alredédór de 75 nucleótidos o más en longitud, con aproximadamente 10 a alrededor de-25 o más residuos en ambos lados de la unión de . la secuencia siendo alterada.
En general, la técnica de mutagénesis específica de sitio es bien conocida en la técnica, como se ejemplifica por varias publicaciones. Como se apreciará, la técnica típicamente, emplea un vector de fago, que exhibe en una forma de una cadena o doble cadena. Los vectores típicos útiles en mutagénesis específica de sitio incluyen vectores tales como el fago M13. Estos fagos están comercialmente disponibles y su uso en general es bien conocido a aquellos expertos en la técnica. Los plásmidos de doble cadena también se emplean en rutina en mutagénesis dirigida de sitio, la cual elimina el paso de transferir el gen de interés de un plásmido a un fago.
En general, de conformidad con la misma se realiza mutagénesis. dirigida de sitio primero al obtener un vector de una cadena o al fundir aparte dos cadenas de un vector de doble cadena qué incluye dentro de su secuencia una secuencia de AD qué codifica el promotor. Se prepara un cebador de oligónucleótidó portando la secuencia mutada deseada, en general sintéticamente. Este cebador entonces es templado con el vector de una, cadena, y sometido a enzimas polimerizantes de ADN tal como fragmento de E. coli polimerasa I Klenow, a fin de completar la síntesis de la cadéna portando mutación. De esta manera, se forma un heterodúplex en donde una cadena codifica la secuencia no mutada original y la segunda cadena porta la mutación deseada. Este vector de heterodúplex entonces se usa para transformar o transfectar células apropiadas, tales como células E. coli, y se seleccionan células que incluyen vectores recombinantes portando la distribución de secuencia mutada. Entonces se puede aislar ADN de vector de estas células y usado para transformación de planta. Se elaboró un esquema de selección genética por Kunkel y otros (1987) para enriquecer clones que incorporan oligonucleótidos mutágénicos. Alternativamente, el uso de PCR con enzimas termoestables comercialmente disponibles tal como Taq polimerasa se puede usar ? para incorporar cebador de oligonucleótido mutagénico en un fragmento de ADN amplificado que entonces se puede clionar. en un vector de clonación o expresión apropiado. Los procedimientos de mutagénesis mediados por PCR de Tomic y otros (1990) y Upender y otros (1995) proveen dos ejemplos de dichos protocolos. Un PCR que emplea una ligasa termoestable además de una polimerasa termoestable también se puede usar para incorporar un oligonucleótido mutagénico fosforilado en un fragmento de ADN 1 amplificado que entonces se puede clonar en un vector de clonación o expresión apropiado. El procedimiento de mutagénesis descrito por Michael (1994) provee un ejemplo de dicho protocolo.
La preparación de variantes de secuencia de los segmentos de ADN codificadores de promotor usando mutagénesis dirigida de sitio se provee como un medio de producir especies potencialmehte útiles y no debe ser limitante, ya que hay otras maneras en donde se pueden obtener variantes de secuencia de secuencias de ADN. Por ejemplo, vectores recom binantes codificando la secuencia promotora deseada se pueden tratar con agentes mutagénicos, tal como hidroxilamina, para obtener variantes de secuencia.
Como se usa en la presente, el término "procedimiento de mutagénesis dirigida con oligonucleótido" se refiere a procedimientos dependientes de plantilla y propagación mediada por vector que resultan en un aumento en la concentración de una molécula de ácido nucleico específica relativa a su concentración inicial, o en un alimento en la concentración de una señal detectable, tal como amplificación. Como se usa en la presente, el término "procedimiento de mutagénesis dirigida con oligonucleótido" también se debe referir a un proceso que involucre la extensión dependiente de plantilla de una molécula cebadora. El término proceso dependiente de plantilla se refiere a síntesis de ácido nucleico de una molécula dé ARN o ADN en donde la secuencia de la cadena recién sintetizada de ácido nucleico es dictáda por las reglas bien conocidas de par base complementario (ver, por ejemplo, Watson y Rarnstad, 1987). Típicamente, las metodologías mediadas por vector involucran la introducción del fragmento de ácido nucleico en un vector de ADN o. ARN, la amplificación clonal del vector, y la recuperación del fragmento de ácido nucleico amplificado. Ejemplos de dichas metodologías .son provistos por la patente de E.U.A. No. 4,237,224.
Un número de procesos dependientes de plantilla están disponibles para amplificar las secuencias diana de interés presentes en una muestra, dichos métodos siendo bien conocidos en la técnica y específicamente descritos en la presente más adelante.
En donde se ha aislado un clon que comprende un promotor de conformidad con la presente invención, uno puede desear delimitar las regiones promotoras esenciales dentro del clon. Un medio eficiente dirigido para preparar promotores mutados depende de la identificación de elementos reguladores putativos dentro de la secuencia promotora. Esto se puede iniciar por comparación con secuencias promotoras conocidas por expresarse en manera específica de tejido o única en desarrollo. Secuencias que . son compartidas entre promotores con patrones de expresión similares, son probables candidatos para la unión de factores de transcripción y de esta manera probablemente son elementos que confieren patrones . de expresión. Se puede lograr confirmación de estos elementos reguladores putativos por análisis de omisión de cada región reguladora putativa seguido por análisis funcional de ..cada construcción de omisión por ensayo de un gen reportero, que se fija funcionalmente a cada construcción. Como tal, una vez provista una secuencia promotora, cualquiera de un número de müt.antes de omisión diferentes del promotor de partida se podría preparar prontamente.
Fragmentos funcionalmente equivalentes de una molécula de nucleótido reguladora de transcripción de la invención también se puede obtener al eliminar u omitir secuencias no esenciales sin omitir la esencial. Estrechar la molécula de nucleotido reguladora de transcripción a sus elementos mediadores de transcripción esenciales se puede realizar in vitro por mutaciones de omisión de prueba-y-error, o en sillico usando rutinas de búsqueda de elemento promotor. Las regiones esenciales para actividad promotora, a menudo, demuestran montones de ciertos elementos promotores conocidos. Dicho análisis se puede realizar usando algoritmos de computadora disponibles tal como PLACE ("Plant Cis-acting Regulatory DNA' Elemente"; 'Higo 1999), la base de datds BIOBASE "Transfac" (Biologische Datenbanken GmbH, Braunschweig; Wingender 2001.) o la base de datos PlantCARE (Lescot 2002).
Un método para producir dichas moléculas de ácido nucleico reguladoras con secuencias mutadas regulando. la misma especificidad de expresión como la secuencia o referencia origen, por ejemplo, se define en US 61/419895 y EP 10193800.9.
Preferiblemente, fragmentos equivalentes funcionales de una de las secuencias de nucleótido reguladoras de transcripción de la invención comprende por lo menos 250 pares base, preferiblemente por lo menos 300 pares base, más preferible por o menos 400 pares base, incluso más preferible 500 pares base, muy preferible 750 pares base de una molécula de nucleótido reguladora de . transcripción como se d escribe por SEC ID NO: .1 , 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 o 18. Más preferible, este fragmento inicia a partir de el extremo 3' de las secuencias indicadas. .
En especial se prefieren fragmentos equivalentes de secuencias de nucléótido reguladoras de transcripción, : que se obtienen al omitir la región codificando la región 5' no traducida del mARN, así sólo proveyendo la región promotora (no transcrita). La región 5' no traducida se puede determinar con facilidad por métodos conocidos en la técnica (tal como análisis de 5.'-RACE). Por consiguiente, algunas de las secuencias de nucléótido reguladoras de transcripción de la invención son fragmentos equivalentes de otras secuencias.
Un cásete de expresión de la invención puede comprender más elementos reguladores. El término en este contexto debe ser entendido en un significado amplio que comprende ; todas las secuencias, que pueden influir en la construcción o función del cásete de expresión. Elementos reguladores, por ejemplo, pueden ? modificar la transcripción y/o traducción en organismo procariótico o eucariótico. En una modalidad preferida, el cásete de expresión de la invención comprendió descendencia (en dirección 3') de la secuencia de ácido nucleico a expresarse una secuencia de terminación de transcripción y - opcionalmente elementos reguladores opcionales -cada uno operativamente ligado a la secuencia de ácido nucleico a expresarse (o la secuencia de nucléótido reguladora de transcripción).
Elementos reguladores adicionales pueden comprender promotor adicional, promotores mínimos o elementos promotores, que pueden modificar las propiedades reguladoras de expresión. Por ejemplo, la expresión se puede hacer dependiendo dé ciertos factores de estrés tales como estrés de agua, abscisina (Lam 1991) b estrés por calor (Schoffl 1989). Se pueden emplear más promotores adicionales o elementos promotores, que pueden realizar expresión en otros organismos (tal como E.coli o Agrobacterium). Dichos . elementos reguladores se pueden encontrar en las secuencias promotoras o bacteria tal como amy y SP02 o en las secuencias promotoras de promotoras de levadura u hongos (tales corrió ADC1, MFa, AC, P-60, CYC1 , GAPDH, TEF, rp28 y ADH).
Además, se contempla que los promotores que combinan. , elementos de más de un promotor puede ser útil. Por ejemplo, ÜS 5,491,288· describe combinar un promotor de virus Cauliflower Mosaic con un promotor de histona. 'De. esta manera, los elementos a partir de los promotores descritos en la presente se pueden combinar con. elementos de otros promotores. Promotores que son útiles para expresión transgénica de planta incluyen aquellos- que son inducibles, virales, sintéticos, constitutivos (Odell 1985), temporalmente regulados, espacialmente regulados, específicos de tejido y temporalmente regulados espacial.
En donde se desea expresión en tejidos u órganos específicos, se pueden usar promotores específicos de tejido. En contraste, en donde se desea expresión de genes en respuesta a un estímulo, los promotores inducibles son los elementos reguladores de elección. Dichos promotores inducibles adicionalmente pueden ser específicamente expresados de tejido u órgano y/o inducidos. En donde se desea expresión continua a lo largo de las células de una planta, se utilizan promotores constitutivos. Se pueden incluir secuencias reguladoras adicionales ascendentes y/o descendentes de la secuencia promotora de núcleo en construcciones de expresión de vectores de transformación para provocar niveles variantes de expresión de secuencias de nucleótido heterólogas en una planta transgénica.
Una variedad de secuencias reguladoras de transcripción 5' y . 3' están disponibles para usarse en la presente invención. Los terminadores de transcripción son responsables por la terminación de transcripción y poliadenilación de mARN correcta. Lá secuencia de ADN reguladora no traducida 3' incluye de preferencia de alrededor de 50 a aproximadamente 1,000, más preferible de •alrededor de 100 a aproximadamente 1,000, pares base de nucleótido y contiene secuencias de terminación de transcripción y traducción de planta. Los terminadores de transcripción apropiados y aquellos que son conocidos por funcionar en plantas incluyen el terminador CaMV 35S, el terminador tml, el terminador de nopalina sintasa, el terminador pea rbcS E9, el terminador para la transcripción 11 del gen octopina sintasa de Ag obacterium tumefaciens, y el extremo 3' de los genes inhibidoresi I ó II de proteasa de papa o tomate, aunque otros elementos 3' conocidos a aquellos expertos en la técnica también se pueden emplear. Alternativamente, uno podría también usar una coixina gamma, oleosina 3 u otro terminador del género Coix. i' Elementos 3' preferidos incluyen aquellos del gen nopalina sintasa de Agrobacterium tumefaciens (Bevan 1983), el terminador para la transcripción T7 del gen octopina sintasa de Agrobacterium tumefaciens, y el extremo 3' de los genes inhibidores I ó II de proteasa de papa o tomate.
Ya que la secuencia de ADN entre el sitio de iniciación de transición y el comienzo de la secuencia codificadora, es decir, la secuencia líder no traducida, puede influir la expresión de genes, uno también puede desear emplear una secuencia líder particular. Se contemplan secuencias líderes preferidas para incluir aquellas, que incluyen secuencias, predichas por dirigir expresión óptima del gen fijado, es decir, incluir una secuencia líder de consenso preferida, que puede aumentar o mantener la estabilidad de mARN y prevenir iniciación inapropiada de traducción. La elección de dichas secuencias será conocida a aquellos expertos en la técnica en vista de la presente descripción. Serán muy preferidas las secuencias que se derivan de genes que se expresan altamente en plantas.
Los elementos reguladores preferidos también ¡incluyen la región 5' no traducida, intrones y la región 3' no traducida de genes. Dichas secuencias que se ha descubierto potencian la expresión de genes en plantas transgénicas incluyen secuencias de intrón (por ejemplo, de Adh , bronzel, actinl, actin2 (WO 00/760067), u otros intrones de planta como se describe en WO20¿11/023537, WO2011/023539, WO2006/094976.
Elementos reguladores preferidos adicionales son secuencias potenciadoras o secuencias de poliadenilacion.
La secuencia de nucleótido heteróloga a expresarse además de preferencia se liga operativamente a regiones 3' no traducidas, señal de terminación de traducción y/o poliadenilacion. Regiones 3' no traducidas son adecuadas para estabilizar expresión y estructura de mARN. Esto puede resultar en presencia prolongada del mARN y así niveles de expresión mejorados. Señales de terminación y poliadenilacion son adecuadas para estabilizar expresión de mARN, para asegurar longitud de transcripción de mARN constante y prevenir transcripción completa. En especial, en construcciones de expresión de multigenes, ésta es una característica importante. Además, la terminación correcta de transcripción se liga a . reiniciación de transcripción a partir de la secuencia 5' de nucleótido reguladora resultando en niveles de expresión mejorados. Las señales antes mencionadas pueden ser cualquier señal funcional en plantas y, por ejemplo, se pueden aislar de genes vegetales, genes de virus vegetal u otros patógenos vegetales. Sin embargo, en una modalidad preferida, las regiones 3' no traducidas, señales de terminación de transcripción y. poliadenilacion. son de los genes empleados como la fuente para los promotores de esta invención.
Las secuencias de poliadenilacion preferidas son aquellas de genes vegetales o genes de T-ADN de poliadenilacion (tales como, por ejemplo, las secuencias terminadoras de genes de OCS (octopina sintása) o NOS (nopalina sintasa)).
Ejemplos de potenciadores incluyen elementos del promotor CaMV 35S, genes de octopina sintasa (Ellis y otros, 1987), el gen de arroz actina I, el gen de deshidrogenasa de alcohol de maíz (Callis 1987), el gen encogido I de maíz (Vasil 1989), elemento TMV Omega (Gallie 1989) y promotores de eucariotes no vegetales (por ejemplo, . levadura; Ma 1988). Vectores para usarse de conformidad con la presente invención se pueden construir para incluir el elemento 'potenciador oes. Este elemento primero fue identificado como un potenciador palindrómico de 16 bp del gen de octopina sintasa (oes) de ultilano (Ellis 1987), y está presente en por lo menos 10 otros promotores (Bouchez 1989). El uso de un elemento potenciador, tales como los elementos oes y en particular múltiples copias del elemento, actuarán para aumentar el nivel de transcripción de promotores adyacentes al aplicarse en el contexto de transformación de planta.
Un cásete de expresión de la invención (o un vector derivado del mismo) puede comprender elementos funcionales adicionales, que se deben entender en el sentido amplio como todos los elementos, que influyen en la construcción, propagación, ó función de un cásete de expresión o un vector o un organismo transgénico comprendiéndolos. Dichos elementos funcionales pueden incluir origen de réplicas (para permitir réplica en bacteria; para el ORI de pBR322 o el P15A ori; Sambrook 1989), o elementos requeridos para transferencia de T-ADN de Agrobacterium (tal como, por ejemplo, el borde izquierdo y/o derecho del T-ADN).
Finalmente, los segmentos de ADN más deseables para introducción en, por ejemplo, un genoma dicotiledóneo, pueden ser. genes homólogos o familias de genes que codifican un rasgo deseado (por ejemplo, rendimiento aumentado por acre, resistencia fúngica) y que se introducen bajo el control de promotores novedosos o potenciadores-, etc., o quizá incluso promotores homólogos o específicos de tejido (por ejemplo, de raíz, collar/vaina, espiral, tallo, pepita u hoja) o elementos de control, De hecho, se concibe que un uso particular de la presente invenció será la expresión de un . gen en la epidermis o mesofilo o inducible en la epidermis y/o mesofilo.
Adicionalmente, se pueden construir y emplear vectores en la focalización intracelular de un producto de gen especificó dentro de las células de una planta transgénica o en dirigir una proteína al medio ambiente extracelular. Esto por lo general logrará al unir una secuencia de ADN codificando una secuencia de péptido de tránsito o señal transportará la proteína en un destino intracelular o extracelular particular, respectivamente, y entonces será eliminado de forma post-traducción. Los péptidos de tránsito o señal actúan al facilitar el transporte de proteínas a través de membranas intracelulares, por ejemplo, vacuola, vesícula, plástido y membranas de mitocondria, mientras que los péptidos de señal dirigen proteínas a través de la membrana extracelular.
Un ejemplo particular de dicho uso se refiere a la dirección de gen de resistencia a herbicida, tal como el gen EPSPS, a un organelo particular tal como el cloroplasto en vez del citoplasma. Esto se ejemplifica por el uso del péptido de tránsito RBCS que •confiere focalización de proteínas específica de plástido. Además., se propone que puede ser deseable focalizar ciertos genes responsables por esterilidad masculina a la mitocondria, o focalizar genes para resistencia a organismos fitopatogénicos a los espacios extracelulares, o para focalizar proteínas al vacuola.
Al facilitar el transporte de la proteína en compartimentos dentro y fuera de la célula, estas secuencias pueden aumentar la acumulación de producto de genes protegiéndolos de degradación proteolítica. Estas secuencias también permiten secuencias de mARN adicionales de genes altamente expresados a fijarse a la secuencia codificadora de los genes. Ya que mARN siendo traducido por ribosomas es más estable que mARN desnudo, la presencia de mARN que se puede traducir frente al gen puede aumentar la estabilidad .global de la transcripción de mARN del gen y así aumentar la 'síntesis del producto de genes. Ya que las secuencias de tránsito y señal usualmente son eliminadas de forma post-traducción del producto de traducción inicial, el uso de estas secuencias permite la adición, de secuencias extra traducidas que quizá no aparezcan en el polipéptido final. La focalización de ciertas proteínas .puede ser deseable a fin de potenciar la estabilidad de la prpteina (US 5,545,818).
Puede ser útil focalizar ADN por sí mismo dentro de ,una célula. Por ejemplo, puede ser útil focalizar ADN introducido al< núcleo ya que esto puede aumentar la frecuencia de transformación. Dentro del núcleo en sí, sería útil focalizar un gen a fin de lograr integración específica de sitio. Por ejemplo, sería útil tener un gen introducido a través de reemplazo de transformación un gen existente en la célula. Otros elementos incluyen aquellos que se pueden regular por agentes endógenos o exógenos, por ejemplo, por proteínas de dedo de zinc, incluyendo proteínas de dedo de zinc que ocurren de manera natural o proteínas de dedo de zinc quiméricas (ver, por ejemplo, US •5,789,538, WO 99/48909; WO 99/45132; WO 98/53060 ;. WO 98/53057; WO 98/53058; WO 00/23464; WO 95/19431; y WO 98/54311 ) o factores de transcripción de tipo myb. Por ejemplo, una proteína de dedo de zinc quimérica puede incluir secuencias de aminoácido, que unen a una secuencia de ADN específica (el dedo de zinc) y secuencias de aminoácido que activan (por ejemplo, secuencias GAL 4) o reprime la transcripción de las secuencias ligodas a la secuencia de ADN específica. ! Uno de los objetos de la presente invención es proveer moléculas de ADN recombinantes que comprenden una secuencia de nucleótido de conformidad Con la invención operativamente ligada a un segmento de nucleótido de interés.
Un segmento de nucleótido de interés es brillante de los mercados comerciales e intereses de aquellos involucrados en el desarrollo de la cosecha. Las cosechas y mercados de cambios de ínteres, y como naciones en desarrollo abriendo mercados mundiales, nuevas cosechas y tecnologías también; surgirán.
¦Además, como el entendimiento de rasgos y características agronómicos tales como rendimiento y aumentó de hetérosis, la elección de genes para transformación por consiguiente cambiará. Las categorías generales de nucleótidos de interés incluyen, por ejemplo, genes involucrados en información, tales como dedos, de zinc, aquéllos involucrados en comunicaciones, tales como quinasas, y aquellos involucrados en trabajo doméstico, tal como proteínas de choque de calor. Las categorías más específicas de transgenes, por ejemplo, incluyen genes codificando rasgos importantes para agronómicos, resistencia a insectos, resistencia a enfermedad, resistencia a herbicida, esterilidad, características de grano y productos comerciales. Lo genes de interés incluyen, en general, aquellos involucrados en almidón, aceite, carbohidrato, o. metabolismo de nutriente, así como aquellos que afectad-tamaño de grano, carga de sacarosa, proteínas de dedo de zinc, ver, por ejemplo, US 5,789,538, WO 99/48909; WO 99/45132; WO 98/53060; WO. 98/53057; WO 98/53058; WO .00/23464; WO 95/19431; y WO 98/54311 , y similares.
Un experto en la técnica reconoce que el nivel de expresión y regulación de . un transgen en una planta puede variar significativamente de línea a línea. De esta manera, uno tiene que probar varias líneas para encontrar una con el nivel de expresión y regulación deseada. Una vez identificada una líneia con la especificidad de regulación deseada de un transgen Cre : quimérico, se puede cruzar con líneas portando diferentes replicones inactivos o transgen inactivo para activación.
Otras secuencias, que se pueden ligar al gen de interés, que codifica un polipéptido, son aquellas que pueden focalizar a un organelo específico, por ejemplo, a la mitocondria, núcleo o plástido, dentro de la célula vegetal. La focalización se puede lograr al proveer el polipéptido con una secuencia de péptido de focalización apropiada, tal como un. péptido de señal secretor (para secreción o pared celular o focalización de membrana, un péptido de; tránsito de. plástido, un péptido de tránsito de cloroplasto, por ejemplo, la •proteína de unión a/b de clorofilo, un péptido diana de mitocondria, un péptido de focalización de vacuolo, o un péptido de focalización nuclear y similares. Por ejemplo, la sub-unidad pequeña de péptido de tránsito de carboxilasa de bifosfato de ribulosa, el péptido de tránsito EPSPS o el péptido de tránsito de sintasa de ácido dihidrodipicolínico se puede usar, por ejemplo, de secuencias de focalización de organelo de plástido (ver WO 00/12732). Los plá'stidos son una clase de organelos de planta derivados de proplástidos e incluyen cloroplastos, leucoplastos, amiloplastos y cromoplastos. Los plástidos son sitios principales de biosíntesis en plantas. Además de la fotosíntesis en el cloroplasto, los plástidos son también sitios de biosíntesis de lipido, reducción de nitrato a amonio, y almacenamiento de almidón. Y aunque los plástidos contienen su propio genoma circular, la mayoría de las proteínas localizadas a los plástidos se codifican por el genoma nuclear y son importadas en el organelo desde el citoplasma.
Los transgenes usados con la presente invención a menudo serán genes que dirigen la expresión de una proteína particular o producto de polipép.tido, pero también pueden ser segmentos de ADN no expresables, por ejemplo, transposones tal como Ds que no dirigen su propia transposición. Como se usa en la presente, "un gen expresabie" es cualquier gen que es capaz de ser transcrito en AR.N (por ejemplo, mARN, ARN anti-sentido, etc.) o traducido en una proteína, expresado como un rasgo de interés, o similares, etc., y no está limitado a genes marcadores que se pueden seleccionar, tamizar o no seleccionar. La. invención también contempla que, en donde un gen expresabie que no necesariamente es un gen marcador se emplea en combinación con un gen marcador, uno puede emplear los genes separados en los mismos o diferentes segmentos de ADN para transformación. En el último caso, los vectores diferentes son entregados concurrentemente a células recipientes para maximlz.ar la co-transformación.
La elección de los segmentos de ADN particulares a entregarse a las células recipientes a menudo dependerán del propósito de la transformación. Uno de los propósitos principales de transformación de plantas de cosecha es agregar algunos rasgos comercialmente deseables, agronómicamente importantes a la planta. Dichos rasgos incluyen, pero no se limitan a, resistencia o tolerancia a herbicida; resistencia o tolerancia a insectos; resistencia o. tolerancia a enfermedad (viral, bacteriana, fúngica, nematodo); tolerancia y/o resistencia a estrés, como se ejemplifica por resistencia o tolerancia a sequía, calor, enfriamiento, congelación, humedad excésiva, estrés por sal; estrés oxidativo; rendimientos aumentados; contenido de alimento y maquillaje; apariencia física; esterilidad masculina; .sequía; habilidad de aguantar; prolificacia; propiedades de almidón; cantidad y calidad de aceite; y similares. Uno puede desear incorporar uno o más genes confiriendo cualquier rasgo o rasgos deseables, tales como, por ejemplo, un gen o genes codificando resistencia a patógeno.
En ciertas modalidades, la presente invención contempla la transformación de una célula recipiente con más de un transgen ventajoso. Dos o más transgenes se pueden suministrar en, un único caso de transformación usando vectores codificando transgénes distintos, o usando un solo vector incorporando dos' o más secuencias codificadoras de genes. Por ejemplo, los plásmídos portando las unidades de expresión bar y aroA eri cualquier orientación convergente, divergente o colineal, son consideradas como particularmente útiles. Más combinaciones preferidas son aquellas de un gen de resistencia a insectos, tal como, un gen t, junto con un gen inhibidor de proteasa tal como pinll, o el uso de bar en combinación con cualquiera de los genes anteriores. Desde luegoi cualquiera dos o más transgenes de cualquier descripción, tales como aquellos confiriendo herbicida, insecto, enfermedad (viral, bacteriana, fúngica, nematodo) o resistencia a sequía, esterilidad masculina, sequía, habilidad de soportar, prolificacia, propiedades de almidón, cantidad o calidad de aceite, o aquellos aumentando rendimiento o calidad nutricional se pueden emplear según se desee.
EJEMPLOS Materiales y Métodos Generales A menos que se indique lo contrario, químicos y reactivos en los ejemplos se obtuvieron de Sigma Chemical Company (St. Louis, MO), endonucleasas de restricción fueron de New England Biolabs {Beverly, MA) o Roche (Indianapolis, IN), oligonucleótidos se sintetizaron por MWG Biotech Inc. (High Point, NC), y otfas enzimas modificadoras o equipos con respecto a bioquímicos y ensayos biológicos moleculares fueron de Clontech (Palo Alto, CA), Pharmacia Biotech (Piscataway, NJ), Promega Corporation (Madison, Wl), o Stratagene (La J o 11 a , CA). Se obtuvieron materiales para cultivo celular de Gibco/BRL (Gaithersburg, MD) o DIFCO (Detroit, MI). Los pasos de clonación se llevaron a cabo para los propósitos de la presente invención, tales como, por ejemplo, · cortes de restricción, electroforesis de gel de agarosa, purificación de fragmentos de ADN, transferencia de ácidos nucleicos a niitrocelulosa y membranas de nylon, fragmentos de ADN de unión, transformación de células E. coli, bacteria en crecimiento, fagos en multiplicación y análisis de secuencia de ADN recombinante, se llevan a cabo como se describe por Sambrook (1989). La secuenciación de moléculas de ADN recombinante se lleva a cabo usando secuenciador de ADN de fluorescencia de láser ABI siguiendo el método de Sanger (Sanger .1977).
Ejemplo 1: Identificación y validación de promotores a partir de I soya putativamente confiriendo expresión constitutiva o expresión en epidermis de una planta 1.1 Identificación de promotores putativamente confiriendo expresión o expresión en epidermis Se llevó a cabo un análisis de perfil de expresión^ de gen de soya por un proveedor comercial de tecnología de¡ expresión comparativa AFLP (Keygene N.V., P.O. Box 216, 6700. AE Wageningen, Los Países Bajos) usando muestras de ARN de 3 tejidos de soya generados por BASF (Tabla 1). Se seleccionaron bandas de AFLP para expresión constitutiva en todos los tejidos y expresión en epidermis. j Tabla 1: Muestras de soya para filtro AFLP hai = horas después de infección; ASR = Roya de Soya Asiática 1.2 Identificación de los genes correspondientes a bandas AFLP Se usaron secuencias "Expressed Sequence Tag" (EST) de bandas AFLP como búsqueda para BLASTN buscando contra una base de datos de secuencia de soya. Los genes correspondientes se enlistan en la tabla 2.
Tablas 2: Resumen sobre genes correspondientes para promotores G. Max confiriendo expresión constitutiva y expresión en la epidermis 1.3 Confirmación de patrón de expresión específica de alelo usando reacción en cadena de transcriptasa-polimerasa invertida cuantitativa (qRT-PCR) A fin de confirmar los patrones de expresión nativos de los genes de soya identificados en una manera específica de alelo, se realizó PCR de transcripción invertida cuantitativa (qRT-PCR) usando ARN total aislado de los mismos materiales como se usaron para el perfil de expresión AFLP (Tabla 1).
Se diseñaron cebadores para qRT-PCR con base en las secuencias de los fragmentos EST aislados usando el paquete de software Vector NTI (Invitrogen, Carlsbad, CA, USA). Se diseñaron cebadores para distinguir alelos individuales del gen candidato en el genoma de soya, tetraploide. Los cebadores para qRT-PCR se enlistan en la tabla 3. El gen de tubulina sirvió como un control para propósitos de normalización.
Tabla 3: Secuencias cebadoras para qRT-PCR Se realizó qRT-PCR usando QuantiTect Kit (Qiagen, Hilden, Alemania) y SYBR Green qPCR aster Mix (Roche Diagnostics, Mannheim, Alemania) en un Roche LightCycler (Roche Diágnostics, Mannheim, Alemania). Se sintetizó cADN usando 800 ng de ARN total y 1 µ? transcriptasa invertida en un volumen de 20 µ?. El cADN se diluyó con 60 µ? de ARNsa agua libre a un volumen final dé 80 µ?. 4 µ? de cADN diluido se usó en una reacción de PCR de 10 µ? de conformidad con las instrucciones del fabricante. Las condiciones de .cicla je de temperatura fueron las siguientes: Desnaturalizar a 95°C durante 2 minutos, y 45 ciclos a 95°C durante 10 segundos y 60°C durante 20 segundos y 72°C durante 20 segundos para amplificación. Después del ciclo final de la amplificación, se llevó a cabo análisis de curva de disociación para verificar que la amplificación ocurrió específicamente y no se generó producto de dímero cebador durante el proceso de amplificación. Se usó el gen de tubulina (secuencias cebadoras en tabla 3) como un gen de referencia endógeno para normalizar el cálculo usando el método de valor comparativo Ct (ciclo de umbral). El valor DeltaCt se obtuvo al sustraer el valor Ct de gen de tubulina del valor Ct del gen candidato respectivo, y la cantidad de transcripción relativa (nivel de expresión) , del gen candidato se expresó como 2"DeltaCt.. 1.4 Identificación de la región promotora Para propósitos de identificación promotora, la secuencia ascendente del codón de inicio de los genes identificados' se. definió como el promotor respectivo. Para caracterizar estas regiones promotoras, se realizaron análisis 5'RACE PCR usando cebadores listados en la Tabla 4.
Tabla 4: Secuencia cebadora para 5'RACE PCR 1.5 Aislamiento de la región promotora por amplificación de PCR Las regiones promotoras de los genes respectivos se aislaron vía PCR genómico usando los siguientes cebadores específicos de secuencia (tabla 5): Los promotores putativamente confiriendo expresión constitutiva o expresión en la epidermis amplificados con éstos pares cebadores se enlistan en la tabla 6.
Además, omisiones 5' de los promotores se hacen al usar diferentes cebadores 5' en combinación con el mismo cebador de óligonucleótido 3'. Los promotores resultantes son indicados por su respectiva longitud en pares base (cp. Tabla 6) y los pares cebadores correspondientes para PCR enlistados en la tabla,5.
Los promotores son bioinformáticamente analizados con Matlnspector Professional 8.0.4, Lanzamiento agosto de 2010 (Genomatix Software GmbH; Munich, Alemania) para sitios de unión de factor de transcripción. Las regiones libres de motivas de núcleo son permutadas y las secuencias de ácido nucleico resultantes se sintetizan. Los principios para generar promotores permutados que retienen sus especificidades de tejido respectivas se describen en EP10193800.9 y US61/419895. Las secuencias resultantes son indicadas por el identificador original del gen correspondiente seguido por "_perm" (cp. Tabla 6).
Tabla 5: Secuencias cebadoras para amplificación de PCR de promotores putativamente confiriendo expresión constitutiva o expresión en Tabla 6: Resumen sobre promotores G. max confiriendo expresión constitutiva y expresión en la epidermis 1.6 Clonación de elementos promotores en el contexto de un cásete de gen reportero GUS Para facilitar sub-clonación, se modificaron - elementos promotores por la adición de Kpnl+Acc61l sitios de enzima de restricción en su extremo 5' y sitios Pacl + Ncol en su extre¡mo 3'. , Usando el sistema Multisite Gateway System (Invitrogen, Carlsbad, CA, USA), se ensamblaron casetes de prómotor::gen reportero en construcciones binarias para transformación; de planta. Los promotores de Glycine max respectivos (con el prefijo p- denotando promotor) se usaron en la construcción de gen reportero, y se utilizó secuencia codificadora de betagiucoronidasa (GUS) como proteína reportera para análisis histo-químico posterior.
Se generó un vector ENTR/A conteniendo la secuencia codificadora de betagiucoronidasa seguido por el terminador de tra'nscripción de t-nos nopalina sintasa (Genbank V00087J. Se clonaron promotores Glycine max usando los sitios de enzima de restricción (ver arriba) agregados por amplificación de PCR en cualquier extremo. Clones positivos pENTR/A pasaron por análisis posterior para asegurar exactitud.
El pENTR/B y pENTR/C no contuvieron ningún elemento adicional. Al realizar una recombinacion específica de sitio (reacción LR), el pENTR/A , pENTR/B y pENTR/C creados se combinaron con el vector de destinación pSUN (derivado de pSUN) de acuerdo con los fabricantes (Invitrogen, Carlsbad, CA, USA) manual ultisite Gateway. Las reacciones produjeron vectores binarios LJK291, LJK296, LJK303, LJK304, LJK305 (cp. Tabla 7) con el promotor Glycine max . respectivo, la secuencia codificadora c-GUS y el terminador t-nos, con moléculas promotoras teniendo el prefijo p-, secuencias codificadoras teniendo el prefijo c-, y moléculas terminadoras teniendo el prefijo t-.
L tabla 7 muestra un resumen sobre construcciones de gen reportero con elementos promotores putativamente confiriendo expresión constitutiva o expresión en la epidermis.
Tabla 7: Resumen sobre construcciones de gen reportero G. max con promotores confiriendo expresión constitutiva o expresión en la epidermis 1.7 Generación de plantas de soya transgénicas (protocolo enmendado de acuerdo con WO2005/121345; Olhoft y otros, 2007) Se hizo germinación de semilla de soya, propagación A, rizogenes y preparación de explanta de meristema axilar e inoculaciones como se describió previamente (WO2Ó05/121345; Olhoft y otros, 2007) con la excepción de que LJK291, LJK296, LJK303, LJK304, LJK305 (cp. Ejemplo 1.6) cada uno contuvo un gen AHAS mutado impulsado por el promotor PcUbi4-2 de ubiquitin de perejil, mediando tolerancia a herbicidas de imidazollnona para selección. 1.8 Evaluación promotora en soya transgénica • Patrones y niveles de expresión impulsados por los promotores constitutivos y promotores putativamente confiriendo expresión en la epidermis medidos usando análisis histo-químico GUS siguiendo un protocolo conocido en la técnica (Jefferson 1987).. Se ensayó expresión GUS en el siguiente tejido vegetativo y reproductivo para los promotores constitutivos en varias etapas en desarrollo: 1) superficie de hoja 2) raíz 3) tallo 4) sección de tallo 5) ' meristema 6) peciolos 7) flores 8) capullo 9) embrión 10) capa de semilla 11) bolsa de semilla de silicua 12) extremo de silicua Se ensayó la expresión en la epidermis en vistas y superficies de superficie de hoja con base en evaluación visual del manchado de GUS. LJK291 y LJK296 mostraron expresión constitutiva en todos los tejidos analizados. LJK303, LJK304 y LJK305 mostraron expresión fuerte en la epidermis de hoja inferior y partes de la capa esponjosa de mesofilo así como algo de expresión de antecedentes en etapas reproductivas de la planta y por tanto se pueden considerar, como promotores preferenciales de epidermis. Los promotores permutados y las versiones omitidas 5' de los promotores muestran los mismos patrones de expresión como los promotores origínales de: los cuajes se derivan.
Los resultados son indicados en la tabla 8.
Tabla 8: Perfiles de expresión de promotores constitutivos y promotores confiriendo expresión en la epidermis c c O sin manchado de GUS; + manchado de GUS mínimo; manchadode GUS mediano; +++ manchado de GUS fuerte; n.d. sin análisis Ejemplo 2: Identificación y validación de promotores inducibles con patógeno a partir de soya 2.1 Identificación de transcripciones inducibles con patógeno por AFLP Se seleccionaron bandas AFLP de la tabla 1 para expresión inducible con patógeno en epidermis o tanto mesofilo como epidermis. 2.2 Identificación de los genes correspondientes a bandas AFLP Se usaron secuencias "Expressed Sequence Tag" (EST) de bandas AFLP como búsqueda para BLASTN buscando contra una base de datos de secuencia de soya. Los genes correspondientes.se enlistan en la tabla 9. 2.3 Identificación de transcripciones inducibles con patógeno por microdistribución Además de la identificación de ESTs por AFLP, se realizó un experimento dé microdistribución en triplicado para las muestras 3 y 5-8 de la tabla 1, que identificaron los siguientes genes: GlymaOI g33070.2; GlymaOI g42660.1 (cp. Tabla 9).
Tabla 9: Resumen sobre genes correspondientes para promotores G. max confiriendo expresión inducible con patógeno 2.4 Confirmación de patrón dé expresión específico de alelo usando reacción en cadena de transcriptasa-polimerasa invertida cuantitativa (qRT-PCR) A fin de confirmar los patrones de expresión nativos de genes de soya en una manera específica de alelo de ambas propuestas de AFLP y microdistribución, se realizó PCR de transcripción invertida cuantitativa (qRT-PCR) usando ARN total aislado de los mismos materiales como se usaron para el perfil de expresión de: AFLP y el experimento de microdistribución (cp. Tabla 1).
Se diseñaron cebadores para qRT-PCR con bas en las secuencias de los fragmentos de EST aislados o en datos de microdistribución usando el paquete de software Vector NTI. (Invitrogen, Carlsbad, CA, USA). Se diseñaron cebadores para distinguir alelos individuales del gen candidato en el genoma de soya tetraploide. Se enlistaron cebadores para qRT-PCR en la tabla 0. El gen de tubulina sirvió como un control para propósitos de normalización (cp. Tabla 3). > Tabla 10: Secuencias cebadoras para qRT-PCR Se realizó qRT-PCR usando QuantiTect Kit (Qiagen, Hilden, Alemania) y SYBR Green qPCR Master Mix (Roche Diagnostics, Mannheim, Alemania) en un Roche LightCycler (Roche Diagnostics, Mannheim, Alemania). Se sintetizó cADN usando 8.00 ng de ARN total y 1 µ? transcriptasa invertida en un volumen de 20 µ?. El cADN se diluyó con 60 µ? de reacción de PCR de conformidad con instrucciones del fabricante. Las condiciones de ciclaje de temperatura fueron las siguientes: Desnaturalizar a 95°C durante 2 minutos, y 45 ciclos a 95°C durante 10 segundos y 60oC> durante 20 segundos y 72°C durante 20 segundos para amplificación. Después del ciclo final de la amplificación, se llevó a cabo el análisis de curva de disociación para verificar que la amplificación ocurrió específicamente y no se generó producto de dimero cebador durante el proceso de amplificación. El gen de tubulina (secuencias cebadoras en la tabla 2) se usó como un gen de referencia endógeno para normalizar el cálculo usando el método de valor comparativo Ct (ciclo de umbral). Se obtuvo el valor DeltaCt al sustraer el valor de Ct de gen de tubulina del valor de Ct del gen candidato respectivo, y la cantidad de transcripción relativa (nivel de expresión) del gen candidato se expresó como 2'DeltaCt. 2.5 Identificación de la región promotoras Para propósitos de identificación de promotor, la secuencia ascendente del codón de inicio de los genes identificados se definió como los promotores respectivos. Para caracterizar estas regiones promotoras, se realizaron análisis 5' RACE PCR usando los cebadores enlistados en la tabla 11.
Tabla 11: Secuencias cebadoras para 5' RACE PCR 2.6 Aislamiento de la región promotora por amplificación de PCR Las regiones promotoras de los genes respectivos se aislaron vía PCR genómico usando los siguientes cebadores específicos de secuencia (tabla 12).
Los promotores putativamente confiriendo, expresión inducible con patógeno amplificados con estos pares de cebador se enlistan en la tabla 13.
Además, omisiones 5' de los promotores se hacen al usar diferentes cebadores 5' en combinación con el mismo cebador de oligonucleótido 3'. Los promotores resultantes son indicados por su respectiva longitud en pares base (cp. Tabla 13) y los pares cebadores correspondientes para PCR se enlistan en la tabla 12.
Los promotores son bioinformáticamente analizados con Matl nspector profesional 8.0.4, Lanzamiento Agosto de . 2010 (Genomatix Software GmbH; Munich, Alemania) para sitios de Unión de factor de transcripción. Las regiones libres de motivos dé núcleo son permutadas y las secuencias de ácido nucleico resultantes se sintetizan. Los principios para generar promotores permutados que retienen sus especificidades de tejido respectivas se describen en EP10193800.9 y US61/419895. Las secuencias resultantes son indicadas por el identif icador original del gen correspondiente seguido por "_perm" (cp. Tabla 13).
Tabla 12. Secuencias cebadoras para am lificación de PCR de promotores inducibles con patógeno Tabla 13: Resumen sobre promotores G. max confiriendo expresión inducible con patógeno 2.7 Clonación de elementos promotores en el contexto de un cásete de gen reportero de GUS Para facilitar la sub-clonación, se modificaron elementos promotores por la adición de sitios de enzima de restricción Kpnl y Acc65l en su extremo 5' y sitios Pací y Ncol en su extremo 5'.
Usando el sistema Multisite Gateway (Invitrogen, Carlsbad, CA, USA), los casetes de promotor: :gen reportero se ensamblaron en construcciones binarias para transformación de planta. Los promotores Glycine max respectivos (con el prefijo p- dénotando promotor) se usaron en la construcción de gen reportero, y se utilizó secuencia codificadora de beta-glucoronidasa (GUS) como proteína reportera para análisis histo-químico posterior.
Se generó un vector ENTR/A que contiene la secuencia codificadora de beta-glucoronidasa seguido por el terminador de. transcripción de t-nos nopalina sintasa (Genbank V00087). Se clonaron promotores Glycine max usando los sitios de enzima de. restricción (ver arriba) agregados por amplificación de PCR en su extremo. Clones pENTR/A positivos pasaron por análisis de secuencia para asegurar exactitud.
Los pENTR/B y pENTR/C no contuvieron ningún elemento adicional. Al realizar una recombinación específica de sitio (reacción LR), los pENTR/A, pENTR/B y pENTR/C creados se combinaron con el vector de destinación pSUN (derivado de pSUN) de conformidad con los fabricantes (Invitrogen, Carlsbad, CA, USA) manual Multisite Gateway. Las reacciones produjeron vectores binarios LJK306, LJK331, LJK334, LJK358, LJK360, LJK361, LJK363, LJK372 (cp: Tabla 14) con el promotor Glycine max respectivo,, la secuencia codificadora de GUS c-GUS y el terminador t-nos, con moléculas promotoras teniendo el prefijo p-, secuencias codificadoras teniendo el prefijo c-, y moléculas terminadoras teniendo el pref ij ó La tabla 14 muestra un resumen sobre construcciones de gen reportero con elementos promotores putativamente confiriendo expresión inducible con patógeno.
Tabla 14: Resumen sobre construcciones de gen reportero G. max con promotores que confieren expresión inducible con patógeno 2.8 Generación de plantas de soya transgénicas (protocolo enmendado de acuerdo con WO2005/121345; Olhoft y otros, 2007) Se hizo germinación de semilla de soya, propagación, preparación de explanta de meristema axilar y A. rhizogehes como se. describió previamente (WO2005/121345; Olhoft y otros, 2007) con la excepción de que las construcciones LJK306, LJK331 , LJK334, LJK358, LJK360, LJK361, LJK363, LJK372 (cp. Ejemplo 2.7) cada uno. contuvo un gen AHAS mutado impulsado por el. promotor de ubiquitin de perejil PcUb¡4-2, mediando tolerancia a herbicidas de imidazolinona para selección. 2.9 Evaluación de promotor en soya transgénica Se midieron patrones de expresión y niveles impulsados por los promotores iriducibles putativamente con patógeno usansdo análisis histoquímico de GUS siguiendo un protocolo conocido en. la técnica (Jefferson 1987). Se condujo transformación de soya usando un ¦sistema de transformación mediado por Agrobacterium .
El hongo oxidado es un aislado silvestre dé Brasil. Las plantas se inocularon con P. pachyrhizi.
A fin de obtener material de espora apropiado para la inoculación, hojas .de soya que se habían infectado con oxidación 15-20 días antes, se tomaron 2-3 días antes de la inoculación y se transfirieron a placas de agar (1% agar en H20). Las hojas se colocaron con.su lado superior en el agar, que permitieron crecer al hongo . a través del tejido y producir esporas muy jóvenes. Para la solución de inoculación, las esporas tiraron las hojas y se agregaron a una solución de Tween-H20. El conteo de esporas se realizó bajo un microscopio de luz por medio de una cámara de.coriteó Thoma. Para la inoculación de las plantas, se agregó la suspensión de espora en un frasco de aspersión operado con aire comprimido y se aplicó uniformemente en las plantas o las hojas hasta que la superficie de hoja se humedece bien. Para ensayos macroscópicos, se ' usó una densidad de espora de 1 -5x 105 sporas/ml. Para microscopía, se usó una densidad de >5 x 105 sporas/ml. SLa's plantas inoculadas se colocaron durante 24 horas en una cámara de invernadero oscurecido con un promedio de 22°C y >90% de humedad de aire. El siguiente cultivo se realizó en una cámara con un promedio de 25°G y 70% de humedad de aire durante 48 horas.
La expresión de GUS para promotores inducibles con;patógeno putativamente confiriendo expresión en la epidermis o en mesofilo y epidermis se ensayó en vistas y secciones de superficie de hoja, con basé en inspección visual. Todos los promotores mostraron habilidad dé inducir por oxidación de soya, ya sea de manera preferencial en .. . i la epidermis o tanto en epidermis o mesofilo. Los promotores permutados y las versiones omitidas 5' de los promotores muestran •los mismos patrones de expresión como los promotores originales de los cuales se derivan.
Los resultados son indicados en la tabla 15., Tabla 15: Perfiles de expresión de promotores inducibles con patógeno 0 sin manchado de GUS; + manchado de GUS mínimo; manchado de GUS mediano; +++ manchado de GUS fuerte; n.d. sin análisis Ejemplo 3: Promotores A. thaliana putativamente confiriendo expresión en tejido verde 3.1 Aislamiento de las regiones promotoras de A. thaliana putativamente confiriendo expresión en tejido verde de plantas por amplificación de PCR Elementos promotores de A. thaliana putativamente confiriendo expresión en tejido verde de plantas se amplificaron por PCR usando los cebadores enlistados en la tabla 21. Preferencialmente, la región clonada abarcó 1-2 kb ascendente del sitio de inicio de transcripción o- hasta el codón de paro del marco de lectura abierto previo. Los genes correspondientes se enlistan en la tabla 22. Las secuencias promotoras correspondientes se enlistan en la tabla 23.
Además, omisiones 5' de los promotores se hacen , al usar diferentes cebadores 5' en combo con el mismo cebador de oligonucleótido.3'. Los promotores resultantes están indicados por su longitud respectiva en pares base (cp. Tabla 23) y, los pares cebadores correspondientes para PCR se enlistan en la tabla 21.
Los promotores son bioinformáticamente analizados con Matlnspector profesional 8.0.4, Lanzamiento Agosto de 2010 (Genomatix Software GmbH; Munich, Alemania) para sitios de unión de factor de transcripción. Las regiones libres de motivos de núcleo son permutadas y las secuencias de ácido nucleico resultantes se sintetizan. Los principios para generar promotores permutados que retienen sus especificidades de tejido respectivas se describen en EP 10193800.9 y US61/419895. Las secuencias resultantes . son indicadas por el identificádor original del gen correspondiente seguido por "_perm" (cp. Tabla 23).
Tabla 21: Secuencias cebadoras para amplificación de PCR. Promotores de A. thaliana putativamente confiriendo expresión en tejido verde de plantas Tabla 22: Resumen sobre genes correspondientes para promotores de A. thaliána confiriendo expresión en tejido verde de plantas Tabla 23: Resumen sobre promotores de A. thaliana confiriendo expresión en tejido verde de plantas 3.2 Clonación de elementos promotores en el contexto de un cásete de gen reportero GFP Para facilitar sub-clonación, se agregaron los siguientes sitios de restricción en los extremos del elemento promotor (tabía 24): .
Tabla 24: Sitios de enzima de restricción para clonar promotores de A. thaliana putativamente confiriendo expresión en tejido verde de plantas Usando el sistema Multisite Gateway (Invitrogen, Carlsbad, CA, USA), se ensamblaron casetes de promotor: :gen reportero en construcciones binarias para transformación de . planta: Los promotores respectivos de Arabidopsis thaliana (con el prefijo . p-denotando promotor) se usaron en la construcción de gen reportero,, y secuencia codificadora dé proteína fluorescente verde (c-AcGFP1; Clontech Laboratories Inc., Mountain View, CA, USA) se utilizó como pro.teína reportera para análisis microscópico de fluorescencia posterior.
Se generó un vector ENTR/A conteniendo la secuencia codificadora de proteína, fluorescente verde seguido por el terminador de t-OCS agrobacteria (Genbank DQ005456). Se clonaron promotores de Arabidopsis thaliana usando los sitios dé enzima de restricción (ver arriba) agregados por amplificación de RCR en otro extremo, Clones positivos pENTR/A pasaron por análisis posterior i para asegurar exactitud. > El pENTR/B y pENTR/C no contuvieron ningún elemento adicional. Al realizar una recombinación específica de sitio (reacción LR), los pENTR/A, pENTR/B y pENTR/C creados se combinaron con el Vector de destinación pSUN (derivado de pSUN) de acuerdo con los fabricantes (Invitrogen, Carlsbad, CA, USA) Manual Multisite Gateway. Las reacciones produjeron vectores binarios LJK186, LJK189, LJK190, LJK192 y LJK193 (cf tabla 25); con el promotor respectivo de Arabidopsis thaliana, la secuencia codificadora de proteína fluorescente verde c-AcGFP1 y el terminador t-OCS, con moléculas promotoras teniendo el prefijo p-, secuencias codificadoras teniendo el prefijo c-, y moléculas terminadoras teniendo el prefijo t-.
Tabla 25: Construcciones de gen reportero GFP para promotores de A. thaliana putativamente confiriendo expresión en tejido verde de plantas 3.3 Prueba de los promotores A. thaliana putativamente confiriendo expresión en tejido verde de plantas en soya transgénica Patrones de expresión y niveles impulsados por los promotores putativamente confiriendo expresión en tejido verde de plantas se midieron usando análisis de GFP. Se realizó análisis con el. microscopio Leica DM5000B y la cámara DFC490 con los siguientes ajustes: Saturación 1.01 ; Ganancia 1; Exposición 2.1 segundos; filtro de GFP; L5; Excitación 480740nm; Espejo dicromático; 505nm¡ filtro de supresión: 527/30nm.
Los tres elementos promotores en los vectores LJK 189, LJK 190 y LJK 192 mostraron expresión mediana a fuerte con base en análisis visual exclusivamente en la capa e mesofilo de' hojas y de esta manera se puede clasificar específico de me:sofilo. Los elementos promotores correspondientes a LJK186 y LJK193 confirieron expresión preferencial en la capa de mesofilo de hojas así como expresión débil en el tejido verde del brote y de esta manera se puede clasificar preferencial de mesofilo. Los promotores permutados y las versiones omitidas 5' muestran los mismos patrones de expresión como los promotores originales de los cuales se derivan.
Los resultados se enlistan en la tabla 26.
Tabla 26: Perfiles de expresión de promotores confiriendo expresión en el tejido verde de plantas Ó sin manchado de GUS; + manchado de GUS mínimo; manchado de GUS mediano; +++ manchado de GUS fuerte; n.d. sin análisis Tabla 27: Resumen de promotores de la invención y homólogos y fragmentos correspondientes de los mismos p-Glyma17g27610_1889bp 35 P-Glyma17g27610_1889bp_perm 36 p-Glyma17g27610_500bp 37 p-Glyma17g27610L1Q00bp 38 p-Glyma17g27610_1500bp p-Glyma 13g44640_1047 bp 39 p-Glyma13g44640_1047bp_perm 40 p-Glyma13g44640_500bp 41 p-Glyma13g44640_700bp \ 42 p-Glyma13g44640_1.000bp p-Glyma08g37270_2043bp 43 p-Glyma08g37270_20,43bp_perm 44 p-Glyma08g3727oL500bp 45 p-Glyma08g37270^_1 OOObp . " 46 p-Glyma08g37270_1500bp p-Gl ma04g40860.1_1917bp 47 P-Glyma04g40860.1_1917bp_perm 48 p-Glyma04g40860.;il_500bp 49 p-Glyma04g40860.1_1000bp 50 p-Glyma04g40860.1_1500bp . p-Glyma01 g 33070.2_1921 bp 51 p-Glyma01g33070.2_1921bp_perm 52 p-Glyma01g33070.2_500bp 53 p-Glyma01g33070.2_1000bp 54 p-Glyma01g33070.2_1500bp p-Glyma15g05820.1_1393bp 55 p-Glyma15g 05820.1_1393bp_perm 56 p-Glyma15g05820.1_500bp 57 p-Glyma15g05820.1_700bp 58 P-Glyma15g05820.1_1000bp P-Glyma01g42660.1_1948bp 59 p-Glyma01 g 42660.1_1948bp^perm 60 p-Glyma01g42660.1_500bp 61 p-Glyma01g42660.1_1000bp 62 p-Glyma01g42660.1^1500bp P-Glyma17g14320_1607bp 63 p-Glyma17g 14320_1607 bp_perm 64 p-Glyma17g14320_500bp 65 p-Glyma17g14320 000bp 66 P-Glyma17g14320_1500bp P-Glyma01g01510.1_2016bp 67 p-Glyma01 g 0 510.1_2016bp_perm 68 p-Glyma01g01510.1_500bp 69 p-Glyma01g015.10.1_1000 bp 70 p-GlymaO1gO151O.1,_15O0bp p-mes-At1 g30380_1970bp 71 es-At1g30380_1970 p_pe 72 p-mes-At1 g30380_500bp 73 -mes-At1g30380j1000bp 74 -mes-A.t1g30380_1500bp p-mes-AMg49750_1922bp 75 p-mes-At1 g49750_1922bp_perm 76 p-mes-At1 g49750_500bp 77 p-mes-At1 g49750_ OQObp

Claims (13)

REIVINDICACIONES
1.- Una molécula de ácido nucleico aislada capaz dé regular expresión en plantas seleccionadas a partir de la Ifsta¦ que comprende í) una secuencia descrita por SEC ID NO: 3, 27, 28, 29 ó 30 y ii) un fragmento de por lo menos 250 bases consecutivas de una . molécula descrita por cualquiera de SEC ID NO: .3, 27, 28, 29 ó 30 y ii¡) una molécula de nucleótido con una identidad de secuencia de por lo menos 60% a una molécula de nucleótido reguladora de transcripción descrita por cualquiera de SEC ID 8, 29 ó 30, y iv) una molécula de nucleótido de por lo menos 250 bases consecutivas con una identidad de secuencia de por lo menos 60% a una molécula de nucleótido reguladora de transcripción descrita por cualquiera de SEC ID NO: 3, 27, 28, 29 ó 30, y v) una molécula de nucleótido de por lo menos 250 bases capaces de hibridar bajo condiciones equivalentes a hibridación en 7% dodecilsulfato de sodio (SDS), 0.5 M NaP04, 1. mM EDTA a 50°C con lavado en 0.1 X SSC, 0.1% X SSC, 0.1%. SDS a 50°C a una molécula de nucleótido reguladora de transcripción descrita por cualquiera de SEC ID NO: 3, 27, 28, 29 ó 30, o el complemento de la misma; vi) una molécula de nucleótido de por lo menos 250 bases capaces de hibridar bajo condiciones equivalentes a hibridación en 7% dodecilsulfato de sodio (SDS), 0.5 M NaP04, 1 mM EDTA a . 50°C con lavado en 0.1 X SSC, 0.1% X SSC, 0.1% SDS a 50°C a ácido nucleico comprendiendo 250 o más nucleótidos consecutivos de una molécula de nucleótido reguladora de transcripción descrita por cualquiera de SEC ID NO: 3, .27, 28, 29 ó 30, o el complemento de la misma; vi i) una molécula dé nucleótido que es el complemento o complemento invertido de cualquiera de las secuencias de nucleótido previamente mencionadas bajo i) a vi).
2. - La molécula de ácido nucleico aislada de conformidad con la reivindicación 1, en donde la molécula de ácido nucleico aislada : . 'i es obtenible a partir de ADN genómico vegetal a partir, de un gen codificando un polipéptido que comprende una secuencia de aminoácido que tiene al menos 80% de homología de secuencia de aminoácido a un polipéptido descrito por SEC ID NO: 225.;
3. - La molécula de ácido nucleico aislada de conformidad con la reivindicación 1, en donde la molécula de ácido nucleico aislada és obtenible a partir de ADN genómico vegetal a partir de un gen que tiene por lo menos 80% de identidad de secuencia a una molécula de ácido nucleico descrita por SEC ID NO: 224.
4. - La molécula de ácido nucleico aislada de conformidad con cualquiera de las reivindicaciones 1 a 3, en donde las secuencias especificadas bajo ii), iii), iv), v), vi) y vii) de conformidad con. la reivindicación 1 son capaces de modificar transcripción' en una planta o parte de la misma.
5..- La molécula de ácido nucleico aislada de conformidad con. cualquiera de las reivindicaciones 1 a 4, en donde I a s > secuencias especificadas bajo ii), iii), iv), v), vi) y vii) de conformidad con la reivindicación 1 tienen sustancialménte la misma actividad reguladora de transcripción como la secuencia de nucleótido reguladora de transcripción descrita por SEC ID NO: 3.
6. - Un cásete de expresión para regular expresión ep plantas que comprende a) por lo menos una molécula de ácido nucleico aislada capaz de regular expresión en plantas como se define en cualquiera de las reivindicaciones 1 a 5, y funciónalmente ligada al mismo b) por lo menos una molécula de ácido nucleico que es heteróloga en relación a dicha molécula de ácido nucleico aislada capaz. de regular expresión en plantas.
7. - Un vector que comprende una molécula de ácido nucleico aislada de conformidad con cualquiera de las reivindicaciones 1 a 5 o un cásete de expresión de conformidad con la reivindicación 6.
8. - Una célula huésped transgénica u organismo no humano que comprende una secuencia de ácido nucleico aislado de conformidad con cualquiera de las reivindicaciones 1 a 5, un cásete de expresión de conformidad con la reivindicación 6, o un vector de conformidad con la reivindicación 7.
9. - Una planta transgénica o célula vegetal que comprende una secuencia de ácido nucleico aislado de conformidad con cualquiera de las reivindicaciones 1 a 5, un cásete de expresión de conformidad con la reivindicación 6 o un vector de conformidad con la reivindicación 7.
10. - La planta transgénica o célula vegetal de conformidad con: la reivindicación 9, en donde dicha planta o célula vegetal es de una planta dicotiledónea.
11. - Un uso de una molécula de ácido nucleico aislada de conformidad con cualquiera de las reivindicaciones 1 a 5, un cásete de expresión de conformidad con la reivindicación 6, o un vector de conformidad con la reivindicación 7 para regular expresión en una planta o una célula vegetal.
12. - Un método para la producción de un cásete de expresión . de conformidad con la reivindicación 6 o vector de conformidad con la reivindicación 7 que comprende los pasos de a. proveer una molécula de ácido nucleico aislada de conformidad , con cualquiera de las reivindicaciones 1 a 5 y b. funcionalmente ligar dicha molécula de ácido nucleico aislada de conformidad con cualquiera de las reivindicaciones 1 a 5 a una molécula de ácido nucleico heteróloga a dicha molécula de ácido nucleico aislada.
13. - Un método para la producción de una planta transgénica que comprende los pasos de proveer un cásete de expresión de conformidad ¡ con la reivindicación 6 o un vector de conformidad con la reivindicación 7 y transformar dicho cásete de expresión o vector en una parte de planta o célula vegetal y regenerar una planta de dicha parte de planta transformada o célula vegetal. RESUMEN DE LA INVENCIÓN Se proveen moléculas de ácido nucleico aisladas capaces de regular expresión en plantas, asi como casetes de expresión, vectores y plantas transgénicas comprendiendo los mismos.
MX2013010197A 2011-03-18 2012-03-15 Promotores para regular la expresion en plantas. MX2013010197A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161453970P 2011-03-18 2011-03-18
PCT/IB2012/051239 WO2012127373A1 (en) 2011-03-18 2012-03-15 Promoters for regulating expression in plants

Publications (1)

Publication Number Publication Date
MX2013010197A true MX2013010197A (es) 2013-09-26

Family

ID=46878690

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2013010197A MX2013010197A (es) 2011-03-18 2012-03-15 Promotores para regular la expresion en plantas.

Country Status (8)

Country Link
US (2) US9624499B2 (es)
EP (3) EP2686430B1 (es)
CN (2) CN105838717A (es)
AU (3) AU2012232776B2 (es)
BR (1) BR112013023789A2 (es)
CA (1) CA2828196A1 (es)
MX (1) MX2013010197A (es)
WO (1) WO2012127373A1 (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013149801A1 (en) 2012-04-05 2013-10-10 Basf Plant Science Company Gmbh Fungal resistant plants expressing hydrophobin
BR112015007209B1 (pt) 2012-11-13 2022-09-27 Basf Plant Science Company Gmbh Método de prevenção, redução ou retardo de infecção por phakopsora em plantas de soja, construção de vetor recombinante, método de produção de plantas transgênicas de soja e método de cultivo de plantas resistentes a ferrugem
US9957522B2 (en) 2012-11-13 2018-05-01 Basf Plant Science Company Gmbh Fungal resistant plants expressing CASAR
EP2970405B1 (en) * 2013-03-15 2018-09-12 Bayer Cropscience LP Constitutive soybean promoters
US20160237445A1 (en) * 2013-10-21 2016-08-18 E. I. Du Pont De Nemours And Company Soybean pip1 promoter and its use in constitutive expression of transgenic genes in plants
EP3253780A1 (en) 2015-02-04 2017-12-13 Basf Plant Science Company GmbH Method of increasing resistance against soybean rust in transgenic plants by increasing the scopoletin content
KR101793328B1 (ko) * 2015-07-03 2017-11-03 씨제이제일제당 (주) L-라이신 생산능을 갖는 미생물 및 이를 이용한 l-라이신 생산 방법
EP3054014A3 (en) 2016-05-10 2016-11-23 BASF Plant Science Company GmbH Use of a fungicide on transgenic plants
UY37733A (es) * 2017-05-24 2019-01-02 Bayer Cropscience Lp Promotor inducible por roya fúngica
CN114107233B (zh) * 2021-10-27 2024-01-09 武汉合生科技有限公司 佛术烯的合成酶基因和高产菌株以及用途

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4237224A (en) 1974-11-04 1980-12-02 Board Of Trustees Of The Leland Stanford Jr. University Process for producing biologically functional molecular chimeras
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
FR2673642B1 (fr) 1991-03-05 1994-08-12 Rhone Poulenc Agrochimie Gene chimere comprenant un promoteur capable de conferer a une plante une tolerance accrue au glyphosate.
CA2681922C (en) 1994-01-18 2012-05-15 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US5545818A (en) 1994-03-11 1996-08-13 Calgene Inc. Expression of Bacillus thuringiensis cry proteins in plant plastids
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
AU746454B2 (en) 1998-03-02 2002-05-02 Massachusetts Institute Of Technology Poly zinc finger proteins with improved linkers
WO2000012732A2 (en) 1998-08-28 2000-03-09 Pioneer Hi-Bred International, Inc. Organelle targeting sequences
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6429357B1 (en) 1999-05-14 2002-08-06 Dekalb Genetics Corp. Rice actin 2 promoter and intron and methods for use thereof
US8541653B2 (en) 2004-06-07 2013-09-24 Basf Plant Science Gmbh Transformation of soybean
EP1666599A3 (en) * 2004-12-04 2006-07-12 SunGene GmbH Expression cassettes for mesophyll- and/or epidermis-preferential expression in plants
EP2045327B8 (en) 2005-03-08 2012-03-14 BASF Plant Science GmbH Expression enhancing intron sequences
ES2308869B2 (es) * 2005-04-22 2010-10-27 Universidad Politecnica De Valencia Gen ocp3 de arabidopsis thaliana y su mutacion recesiva ocp3, y su uso como regulador de la resistencia en plantas a enfermedades producidas por patogenos fungicos necrotroficos.
US9029636B2 (en) * 2008-02-05 2015-05-12 Monsanto Technology Llc Isolated novel nucleic acid and protein molecules from soy and methods of using those molecules to generate transgenic plants with enhanced agronomic traits
CN106947762B (zh) 2009-08-31 2020-06-23 巴斯夫植物科学有限公司 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
EP2473610B1 (en) 2009-08-31 2017-07-19 BASF Plant Science Company GmbH Regulatory nucleic acid molecules for enhancing constitutive gene expression in plants
CN101914534B (zh) * 2010-05-05 2012-12-19 东北农业大学 幼苗及种子特异表达型大豆GmPLPA基因启动子及其应用
EP2649180A4 (en) 2010-12-06 2014-05-21 Basf Plant Science Co Gmbh PROCESS FOR PRODUCING SYNTHETIC PROMOTERS WITH DEFINED SPECIFICITY

Also Published As

Publication number Publication date
AU2012232776A1 (en) 2013-09-12
CA2828196A1 (en) 2012-09-27
CN105838717A (zh) 2016-08-10
US20170183675A1 (en) 2017-06-29
EP3342859A1 (en) 2018-07-04
EP2686430A4 (en) 2014-09-17
EP2686430A1 (en) 2014-01-22
US20140007289A1 (en) 2014-01-02
EP3434781A3 (en) 2019-03-06
BR112013023789A2 (pt) 2017-06-13
AU2016253639A1 (en) 2016-11-24
WO2012127373A1 (en) 2012-09-27
EP3434781A2 (en) 2019-01-30
AU2016253639B2 (en) 2018-05-10
EP2686430B1 (en) 2018-06-06
CN103429740B (zh) 2016-06-15
CN103429740A (zh) 2013-12-04
AU2018204938A1 (en) 2018-07-26
US9624499B2 (en) 2017-04-18
AU2012232776B2 (en) 2016-08-04

Similar Documents

Publication Publication Date Title
US9624499B2 (en) Promoters for regulating expression in plants
CA2598307C (en) Expression cassettes for seed-preferential expression in plants
CA2596600A1 (en) Expression cassettes for regulation of expression in monocotyledonous plants
US7902423B2 (en) Expression cassettes for seed-preferential expression that utilize the promoter from a flax tonoplast intrinsic protein gene
US8519114B2 (en) Constitutive expression cassettes for regulation of plant expression
EP2166098B1 (en) Constitutive expression cassettes for regulation of plant expression
AU2005237151B2 (en) Expression cassettes for guard cell-preferential expression in plants
CA2607263A1 (en) Expression cassettes for seed-preferential expression in plants
WO2006089911A2 (en) Expression cassettes for seed-preferential expression in plants
WO2006125749A2 (en) Expression cassettes for seed-preferential expression in plants
CA2602156A1 (en) Expression cassettes for seed-preferential expression in plants
WO2006131490A1 (en) Expression cassettes for seed-preferential expression in plants
WO2006136579A2 (en) Expression cassettes for seed-preferential expression in plants
WO2006131477A1 (en) Expression cassettes for seed-preferential expression in plants

Legal Events

Date Code Title Description
FA Abandonment or withdrawal