PT1571219E - Sequências reguladoras de plantas para o controlo selectivo de expressão de genes - Google Patents

Sequências reguladoras de plantas para o controlo selectivo de expressão de genes Download PDF

Info

Publication number
PT1571219E
PT1571219E PT05010470T PT05010470T PT1571219E PT 1571219 E PT1571219 E PT 1571219E PT 05010470 T PT05010470 T PT 05010470T PT 05010470 T PT05010470 T PT 05010470T PT 1571219 E PT1571219 E PT 1571219E
Authority
PT
Portugal
Prior art keywords
sequences
plant
dna
sequence
promoter
Prior art date
Application number
PT05010470T
Other languages
English (en)
Inventor
Timothy W Conner
Iris Tzafrir
Original Assignee
Monsanto Technology Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Monsanto Technology Llc filed Critical Monsanto Technology Llc
Publication of PT1571219E publication Critical patent/PT1571219E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Botany (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Developmental Biology & Embryology (AREA)
  • Pregnancy & Childbirth (AREA)
  • Reproductive Health (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

DESCRIÇÃO
SEQUÊNCIAS REGULADORAS DE PLANTAS PARA O CONTROLO SELECTIVO DE EXPRESSÃO DE GENES
ÂMBITO DA INVENÇÃO A presente invenção tem pòr objecto o isolamento e a utilização : de moléculas de ácidos nucleicos para o' controlo da expressão de genes em plantas, especificamente novos promotores de plantas.
ANTECEDENTES DA INVENÇÃO
Um, dos objetivos da engenharia genética das plantas é produzir plantas cõm caracteristicas ou traços importantes sob o ponto de vista agronómico.· Recentes avanços na engenharia ' genética têm fornecido as ferramentas necessárias para transformar plantas .para conter e. expressar, genes estranhos (Kahl et al. (1995) World Journal of Microbiology and Biotechnology 11: 449-460) ..Os traços ou as; qualidades particularmente desejáveis dé interesse para á engenharia’ genética das plantas podem incluir, mas não se limitam à resistência a insectos e a outras pragas e agentes causadores de doenças, tolerância, a herbicidas, estabilidade melhorada, rendimento ou tempo de vida, tolerâncias ambientais e intensificações nutricionais. Os avanços tecnológicos na transformação.e regeneração de plantas permitiram que os investigadores rétirassem partes do ADN, tal como um gene ou genes de. uma fonte heteróloga ou uma fonte natural,' mas modificada, para ter qualidades diferentes ou melhoradas e incorporar o ADN exógeno no genoma das plantas. O gene ou.os genes podem então ser expresso(s) na célula da planta de moso 1 a que elas apresentem a(s) característica(s) ou traço(s) adíciona-do(s). Numa abordagem, a expressão de um novo gene que' não é normalmente expresso numa planta ou tecido vegetal em particular pode conferir um efeito fenotípico desejado. Numa outra abordagem, a transcrição. de um gene ou de parte de um gene numa orientação anti-paralela. pode produzir um efeito desejável evitando ou inibindo a expressão de um gene endógeno.. .
Os promotores de plantas isolados são úteis para modificar as plantas através da- engenharia genética para elas terem as caracteristicas fenotipiças desejadas. Para produzir uma tal planta transgénica,. introduz-se na célula da. planta um vector que inclui uma sequência heteróloga de genes que confere o fenótipo desejado- quando expressa na planta. 0 vector também inclui um promotor de planta que está ligado operacionalmente à sequência heteróloga de genes, frequentemente um promotor normalmente não' associado com o gene heterólogo. 0 vector é depois introduzido numa célula de planta para produzir uma. célula da. planta. transformada e a célula da planta transformada é regenerada numa planta transgénica. O1· promotor controla a expressão da sequência de ADN introduzida à qual o promotor está ligado ' operacionalmente e, dessa forma,'· afecta; a característica desejada conferida pela sequência de ADN. . Uma vez que o promotor é um elemento regulador 5' que representa uma parte integral na expressão total de, um gene ou de .genes, pode ser vantajoso ter uma variedade de promotores para trabalhar a expressão de gene de modo que. o gene ou os' genes sejam transcritos, eficazmente no momento certo durante o crescimento e.o desenvolvimento da planta, na localização óptima na planta e na quantidade necessária para produzir o efeito ' desejado. Num caso, por exemplo, a 2 expressão constitutiva de ura produto de gene pode ser benéfica numa localização da planta, mas menos benéfica noutra parte da planta. Noutros casos, pode ser benéfico ter um produto de gene produzido em um certo estádio de desenvolvimento da planta ou em resposta a certos estímulos ambientais ou químicos. 0 desenvolvimento comercial de germoplasma geneticamente melhorado tem também avançado para o estádio de introduzir múltiplos traços em plantas· de colheita., também conhecido como um processo de aglutinar genes. Nesta abordagem, os múltiplos genes que conferem diferentes características de interesse podem ser introdu-zidos numa planta. É importante, ao introduzir os múltiplos genes numa planta, que cada gene seja regulado ou controlado para a expressão óptima e que os elementos reguladores sejam diversos, para reduzir o potencial de morbidez do gene que pode sér causado pela recombinação de sequências homólogas. À luz desta e doutras considerações, é óbvio que o controlo óptimo de expressão de. genes e a diversidade de'elementos reguladores são importantes na biotecnologia de plantas.’
As sequências reguladoras próprias devem estar presentes na localização apropriada com respeito à sequência de ADN de interesse, para o ADN recentemente inserido ser transcrito e assim, se desejado, traduzido para uma proteína na célula da planta. Estas sequências reguladoras incluem, mas não se limitam a um promotor, um líder não traduzido 5' e uma sequência 3' de poliadenilação. A capacidade de seleccionar os tecidos para os quais se pode transcrever tal ADN estranho e o tempo durante o cresci-mento da planta para obter a transcrição de tal ADN estranho são também possíveis através da escolha de sequências de promotor apropriadas que controlam a transcrição destes genes.
Uma variedade de diferentes tipos ou classes de promo- 3 tores pode ser utilizada para a engenharia genética das plantas. Os promotores podem ser classificados com base na variação ou na especificidade do tecido. Por exemplo, os promotores referidos como promotores constitutivos são capazes de transcrever eficazmente sequências de ADN .operacionalmente ligadas e expressar as ditas sequências de ADN em múltiplos tecidos. Os promotores intensificados em tecidos ou específicos de tecido podem ser encontrados, a montante e ligados operacionalmente às sequências de ADN normalmente transcritas em· níveis mais elevados em certos tecidos vegetais ou especificamente .em certos tecidos de plantas. Outras classes de promotores podem incluir, mas não se limitam a promotores indutíveis que podem ser accionados por estímulos externos tais como agentes químicos, estímulos de desenvolvimento ou estímulos ambientais. Assim, os diferentes tipos de promotores desejados podem ser obtidos isolando as regiões reguladoras 5' a montante das sequências de ADN que estão transcritas e expressas de uma maneira constitutiva, intensificada no tecido ou indutivel.
Os avanços tecnológicos de sequenciação de alto rendimento e da bioinformática. têm fornecido ferramentas, moleculares adicionais'' para a descoberta de promotores. As células, tecidos, ou órgãos- da planta que são alvos particulares, num estádio específico de desenvolvimento ou sob' condições químicas, ambientais ou fisiológicas particulares, podem ser utilizados, como material fonte para isolar o ARNm e construir bibliotecas- de ADNc. As bibliotecas de ADNc são rapidamente sequenciadas e as sequências expres-sas são catalogadas eletronicamente. Utilizando um software de análise de sequências, podem-se analisar milhares de sequências num curto período de tempo e podem-se comparar com sequências de bibliotecas de ADNc seleccionadas. A combinação de processos laboratoriais e de subtracção com base em 4 computador, permite aos investigadores digitalizar e comparar as bibliotecas de ADNc e identificar as sequências com o perfil de expressão desejado. Por exemplo, as sequências expressas preferencialmente num tecido podem ser identificadas comparando uma biblioteca de ADNc de um tecido com as bibliotecas de ADNc de outros tecidos e "subtraindo" eletronicamente as sequências comuns para encontrar as sequências somente expressas no tecido alvo de interesse. A sequência intensificada do tecido pode ser utilizada como uma sonda ou um iniciador para clonar. o ADNc de comprimento completo correspondente. Uma biblioteca genómica da planta alvo pode· então ser utilizada para isolar o.gene correspondente e os elementos. reguladores associados, incluindo as sequências de promotores.
As múltiplas sequências· de promotores que conferem um perfil de expressão desejado, tais como promotores embrio-génicos ou intensificados no tecido do calo ou os promotores específicos podem ser isoladas por comparação selectiva de bibliotecas do tecido embriogénico alvo. ou do tecido do calo de ADNc com bibliotecas de ADNc não alvo ou de base tais como bibliotecas de tecidos de folhas e de raízes para encontrar as regiões reguladoras 5' associadas com as sequências expressas nessas bibliotecas alvo. As sequências de promotores isoladas podem ser utilizadas para regular selecti-vamente a expressão de qualquer gene ligado operacionalmente e providenciam a diversidade de elementos reguladores adicionais num vector de expressão de planta nos processos dé aglutinação de genes. A patente WO 98/37184 descreve o promotor LEC1. 0 promotor estava activo em estados muito precoces do desenvolvimento do embrião. A patente WO 93/05164 descreve promotores específicos 5 dos calos...
SUMÁRIO DA INVENÇÃO A presente invenção tem por objectosequências de ácidos nucleicos que compreendem sequências reguladoras localizadas a montante da terminação 5' das sequências de codificação de estrutura de ADN de planta que são transcritas em tecido embriogénico e que se mostram na SEQ ID N°: 38.
Num aspecto, a presente invenção tem. por objecto sequências de ácidos nucleicos que compreendem umá sequên-cia seleccionada no grupo que consiste na SEQ ID N°: 38. ou quaisquer fragmentos, regiões ou elementos cis da sequência que sejam capazes de regular a transcrição de sequências de ADN ligadas operacionalmente. A presente invenção também tem por objecto sequências de ácidos nucleicos que compreendem uma sequência da SEQ ID N°: 38 que são promotores. .
Outro aspecto da presente invenção diz. respeito à utilização de pelo menos um elemento cis ou um seu fragmento ou região das sequências de promotores 5' descritas que podem ser combinadas para criar novos promotores ou utilizadas numa nova combinação com outra sequência reguladora heteróloga para criar um promotor quimérico capaz de regular, a transcrição de uma sequência de ADN ligada operacionalmente.
Portanto.,, a presente invenção tem. por objecto a utilização da sequência de ácidos nucleicos descrita na SEQ ID N°: 38 ou qualquer fragmento,' região ou elementos cis das sequências descritas que são capazes de regular a transcrição de uma sequência de ADN quando operacionalmente ligada à 6 sequência de ADN. Portanto, a presente invenção não apenas abrange a sequência tal como descrita na SEQ I.D N°: 38, mas também inclui quaisquer derivados truncados ou de eliminação ou seus fragmentos ou regiões que são capazes de funcionar independentemente como promotores, incluindo elementos cis que são capazes de funcionar como sequências reguladoras em conjunto com uma ou. mais sequências regula-doras quando operacionalmente ligadas a uma sequência capaz de transcrição.. A presente invenção abrange assim um novo promotor ou um promotor quimérico-ou híbrido, que compreende .uma....sequência de ácido nucleico como descrita na SEQ ID N°: 38. Os promotores quiméricos ou híbridos podem consistir em fragmentos de qualquer comprimento, regiões, ou elementos cis da sequência .descritas na SEQ ID N°: 38 combinados com qualquer outro promotor de comprimento completo ou ura promotor minimamente activo sob o ponto de vista da transcrição. Por exemplo, uma sequência de promotores seleccionada da SEQ ID N°: 38 pode ser combinada com um CaMV ' 35Ξ ou outro promotor para construir um novo promotor quimérico. Um promotor mínimo pode ser. também utilizado em combinação, com as sequências de ácidos nucleicos da presen-te invenção. Um novo promotor também compreende qualquer promotor construído por engenharia das sequências, de ácidos nucleicos descritas na SEQ ID N°: 38 ou qualquer fragmen-to, região ou elemento cis das sequências descritas de uma maneira suficiente para transcrever uma sequência de ADN operacionalmente ligada,.
Outro aspecto da presente invenção diz respeito à capacidade da sequência de promotor da SEQ ID N°: 38 ou os seus fragmentos, regiões ou elementos .cis para regular a transcrição de sequências capazes dé transcrição, operacionalmente ligadas em tecidos embriogénicos ou de calo. Os 7 fragmentos, regiões ou elementos eis da SEQ ID N°: 38 que são capazes de regular a transcrição de . sequências de ADN operacionalmente ligadas em certòs tecidos podem ser isolados das sequências de ácidos nucleicos descritas na SEQ ID N°: 38 e utilizadada para construir por engenharia genética novos promotores que conferem uma expressão embriogénica intensificada ou uma expressão' do calo intensificada das sequências de ADN operacionalmente liga-das ou em combinação com outras sequências reguladoras heterólogas. A presente invenção.também abrange estruturas de ADN que compreendem a sequência descrita na SEQ ID N.°: 38 ou quaisquer dos seus ^ fragmentos, regiões ou elementos cis, incluindo novos promotores gerados utilizando as . sequências descritas ou qualquer fragmentos, regiões ou elementos cis das sequências descritas. A presente invenção também inclui quaisquer células, e plantas transgénicas contendo o. ADN descrito na sequência coforme se mostra na SEQ ID N°: 38 ou quaisquer dos seus fragmentos,.regiões ou elementos cis. A presente invenção também tem por objecto um processo de regular a transcrição de uma sequência dé ADN compreendendo a ligação operacional da sequência de ADN a qualquer ácido nucleico compreendendo todo ou qualquer fragmento, região ou elemento cis de uma sequência da SEQ ID N°: 38.
Noutro enquadramento, a presente invenção tem por objecto um processo de conferir expressão embriogénica ou intensificada no tecido de calo ou especifica, por meio da ligação operacional de uma sequência da SEQ ID N°: 38 ou qualquer fragmento, região ou elemento cis das sequências descritas, a qualquer sequência de ADN capaz de ser 8 transcrita. Os fragmentos, regiões, ou elementos cis dos promotores descritos como se mostra na SEQ ID N°: 38 que são capazes de conferir uma expressão intensificada em tecidos embriogénicos ou do calo para ligar operacional-mente as sequências de ADN, podem ser construídos por engenharia genética e utilizados independentemente em novas combinações incluindo multímeros ou derivados truncados- e os novos promotores podem ser operacionalmente ligados a uma sequência de ADN capaz de transcrição. Os fragmentos, regiões e elementos cis descritos das sequências descritas que são capazes de conferir uma expressão intensificada em tecidos embriogénicos ou do calo às sequências de ADN operacionalmente ligadas, podem ser utilizados em combina-ção com um promotor heterólogo incluindo.um promotor mínimo para criar um promotor quimérico ou híbrido. A presente invenção também tem por objecto um processo de produzir uma planta transgénica introduzindo na célula de uma planta uma estrutura de ADN que compreende: (i) um promotor compreendendo um ácido nucleico que compreende uma sequência, da SEQ ID N°: 38. ou os seus fragmentos, regiões ou elementos cis e ligada operacionalmente ao promotor, (ii) uma sequência de ADN capaz de transcrição e (iii) uma região não traduzida de 31. A presente invenção também tem por objecto um processo de isolamento de pelo menos uma sequência reguladora 5' de um perfil de expressão desejado de uma planta alvo de interesse, avaliando uma colecção de. sequências de ácidos- nucleicos de MSEs derivada de pelo menos uma biblioteca de ADNc preparada a partir de um tipo de célula de planta de interesse, comparando as sequências de EST de pelo menos uma biblioteca de ADNc da planta alvo e pelo menos uma biblioteca de ADNc não alvo de MSEs de um tipo de célula de planta diferente, 9 subtraindo as sequências de EST comuns encontradas em ambas as bibliotecas alvo e não alvo, projetando os iniciadores específicos do gene dos MSEs restantes após as subtracções que são representativas das sequências expressas marcadas e isolando pelo menos uma sequência de flanqueio e reguladora de 5' correspondente, que inclui pelo menos uma sequência-de promotores de uma biblioteca genómica preparada da planta alvo utilizando os iniciadores específicos do gene. 0 antecedente e outros aspectos da presente invenção tornar-se-ão mais claros a partir da descrição detalhada que se segue e dos desenhos em anexo. A presente invenção inclui uma lista de sequências -da qual faz parte a SEQ ID N°: 38 da presente invenção.
BREVE DESCRIÇÃO DOS DESENHOS A'Figura 1 é um mapa de plasmido de pMON19469 A Figura 2 é um mapa de plasmido de pMON39721 A Figura 3 é um mapa de plasmido de pMON51002 A Figura 4 é um mapa de plasmido de pMQN51008 A Figura 5 é um mapa de plasmido de pMON51001 A Figura 6 é um mapa de plasmido de pMQN51009 A Figura 7 é um mapa de plasmido de pMON51003 Ã Figura 8 é um mapa de plasmido de pMON51010 0 plasmido pMON19469 é um vêctor de expressão que-consiste nos seguintes componentes genéticos: P-CaMV.35S é o promotor para. o ARN 35S de CaMV contendo uma duplicação em tandem da região -90 a -300 (Patente de invenção norte-americana N° 5.322.938); o intrâo I-Zm.Hsp70 é a sequência de intervenção da proteína de choque térmico de milho como descrita nas patentes de invenção norte-americanas. U.S. N°s 10 5.593.874 e 5.859.347; Ec.GUS:l é a região de codifi-cação para a beta-glicuronidase de E. coli; I-AGRTU.nos é o sinal de terminação do gene de nopalina'sintase; ori-M13 e ori^pUC são origens de replicação; AMP é a região de codificação para selecção de' ampicilina.. 0 plasmido pMON-39721 é um vector de transformação de planta- de borda dupla (bordas de T-DNA direita (BD) e esquerda (BE)) consistindo nos seguintes componentes genéticos: P-CaMV.35S é o promotor de. CaMV 35S (patente de invenção norte-americana Q.S. N° 5.352.605); AGRTU.nptII é a sequência de codificação de Agrobacterium tumefaciens gue confere resistência ao' antibiótico de canamicina; T-AGRTU. nos é a sequência de terminação 3' do gene de nopalina sintase isolado de Agrobacterium tumefaciens; ori322 e oriV são origens de replicação; aad é a sequência de codificação que confere resistência a antibióticos de espectinomicina e estreptomicina. 0 plasmido pMON51002 é um vector de expressão que consiste nos seguintes componentes genéticos: ZM-70025861 é o promotor para a expressão intensificada por embrião de Zea mays de. uma biblioteca genómica de embriões de Zea mays; o intrão I-Zm.Hsp70 é a sequência de intervenção da proteína de choque térmico de milho como descrita nas patentes de invenção norte-americanas U.S. . N°s 5.593.874- e. 5.859.347; Ec.GUS:l é a região de codificação para beta-glicuronidase de E. coli; T-AGRTU.nos é o sinal de terminação do gene de nopalina sintase; ori-Ml3 e ori-pUC são origens de replicação; AMP é a. região de codificação para a selecção de amplicili.na, 0 plasmido pMON51008 é um vector de transformação de planta de borda dupla,, bordas de T-ADN direita (BD) e 11 esquerda (BE), consistindo nos seguintes componentes genéticos: ZM-70025861 é o promotor para a expressão intensificada por embrião de Zea mays de uma biblioteca genómica de embriões de Zea mays; o intrão I-Zm.Hsp70 é a sequência de intervenção da proteína de choque térmico de milho como descrita nas patentes de invenção norte-americanas U.S. N°s 5.593.874 e 5.859.347 aqui incorporadas por referência na sua totalidade; Ec.GUS:l é a região de codificação para beta-glicuronidase de E. coli; T-AGRTU.nos é o sinal de terminação do gene de nopalina sintase;.P-CaMV.35S é o promotor de CaMV 35S (patente de invenção norte-americana U.S. N° 5.352.605); AGRTU. nptll é a sequência de codificação' de Agrobacterium tumefaciens que· confere. resistência 'a antibiótico de .cana.micina; T-AGRTU.nos é a sequência de terminação 3' do gene' de nopa-lina. sintase isolado dè Agrobacterium tumefaciens; orí.322 e oriV sad origens de replicação;. aad é a sequência de " codificação . que confere resistência a antibióticos de espectinomicina e estreptomicina. 0 plasmido pMONSlOOl é um .vector de expressão que consiste nos seguintes componentes ..genéticos; ZM-7Q0267629 é o promotor para a expressão intensificada' por embrião de Zea mays de uma biblioteca genómica de embriões de Zea mays; o intrão I-Zm.Hsp70 é a sequência de intervenção da proteína de choque térmico de milho como descrita nas patentes de invenção norte-americana U.S. N°s 5.593.874 e 5.859.347; Ec.GUSrl é a região de codificação para beta-glicuronidase de E. coli; T-AGRTU.nos é o sinal de terminação do gene de nopalina sintase; ori-M13 e ori-pUC são origens de replicação; AMP é a região de codificação para selecção de arnpici-lina. O plasmido pMON5'1009 é. um vector de transformação de planta de borda dupla, bordas de T-ADN direita. (BD) e' 12 esquerda (BE), consistindo nos seguintes componentes genéticos: ZM-700267629 é o promotor para a expressão intensificada por embrião de. Zea mays de umâ biblioteca genómica de embriões de Zea mays; o intrão I-Zm.Hsp7Q é a sequência de intervenção da proteína de choque térmico de milho como descrita nas patentes U.S. N°s '5.593.874 e 5.859.347); Ec.GUS:l é a região de codificação para beta-glicuronidase de E. coli; Τ-AGRTU.nos é o sinal de terminação . do gene de nopalina sintase; P-CaMV.35S é o promotor de CaMV 35S (patente U.S. N° 5.352.605); AGRTU.nptII é a sequência de codificação de Agrobacterium . tumefacíens que confere resistência a antibiótico de' çanamicina; T-AGRTU.nos é a sequência de terminação 3' do gene de nopalina sintase isolado. , de, Agrobacterium tumefaciens;' o.ri322 e oriV são origens,de replicação;. aad é a sequência de codificação- que confere resistência a antibióticos de espectinomicina, e estreptorr.icina. . O plasmido- pMON51003 é um· vector de expressão que consiste, nos seguintes componentes genéticos: ZM-700263'624 é o promotor para a expressão intensificada por embrião de Zea mays de uma biblioteca genómica de- embriões de Zea mays; o intrão I-Zm.Hsp70 é a sequência de1 intervenção da proteina de choque.: térmico de milhó como descrita nas patentes de invenção norte-americanas U.S. N°s 5.593.874 e 5.859.347); Ec.GUS:l é a região de, codificação para beta-glicuronidase de E. coli; T-AGRTU.nos é o sinal de terminação do gene de nopalina sintase;, ori-MÍ3 e orí^pUC .são origens de replicação; AMP é a região de codificação para selecção de amplicilina. ..... 0 plasmido pMONSlOlO é um vector de transformação de planta- de borda dupla, bordas ..de'. T-ADN direita (BD) e esquerda ' (BE), consistindo nos seguintes componentes 13 genéticos: ZM-700263624 é o promotor para a expressão intensificada por embrião de Zea mays de. uma biblioteca genómica de embrião de Zea mays; o intrâo I-Zm.Hsp70 é a sequência de intervenção da proteina de choque térmico de milho como descrita nas patentes de invenção norte-americanas U.S. N°s 5.593.874 e 5.859.347; Ec.GUS:l é a região de codificação para beta-glicuronidase de E. coli; T-AGRTU.nos é o sinal de terminação do gene de nopalina sintase; P-CaMV.35S é o promotor de CaMV 35Ξ (patente de invenção norte-americana U.S. N° 5.352.605); AGRTU.nptil é a sequência de codificação de Agrobacterium tumefaciens que confere resistência a antibiótico de canamicina.; T-AGRTU.nos é a sequência de terminação 3' do gene de nopali-na sintase isolado de Agrobacterium tumefaciens; ori322 e oriV são origens de replicação; aad é a sequência de codificação que confere resistência a antibióticos de espectinomicina e estrepto-micina.
DESCRIÇÃO DETALHADA DA INVENÇÃO
Os genes de interesse (GDI) que conferem tolerância a um herbicida ou antibiótico,, gene de pro.teina insecticida, genes de resistência à doença, genes que afectam o· cresci-mento, metabolismo ou desenvolvimento da planta, produção de óleo e óleos modificados e, genes que codificam proteínas farmacêuticas, por exemplo, são considerados como aspectos da presente invenção. Tais composições e' processos descri-tos aqui. podem ser utilizados com respeito.a qualquer planta que pode ser geneticamente modificada pelos pro-cessos de biotecnologia das plantas. As composições e processos presentes descrevem as sequências de ADN úteis ,para a expressão de produtos transgénicos em embriões de plantas e em sementes de plantas. ... 14
As definições e processos que se seguem são dados para melhor definir a presente invenção e para guiar os especialistas na prática da. presente invenção.. A menos que seja referido doutro modo, os termos são para ser enten-didos de acordo com o uso convencional dado pelos especia-listas na matéria. Utiliza-se a nomenclatura para as bases de ADN, como estabelecidas em 37 CFR § 1.822. Utiliza-se a nomenclatura padrão de uma a três letras, para os resíduos de aminoãcidos. "(Sequência de) ácidos nucleicos" ou. "(sequência de) polinucleótido" refere-se a.ADN ou ARN de estrutura helicoidal simples ou dupla de origem genómica oú sinté-tica, isto é, a um polímero de bases de desoxirribonucléótido ou de .ribonucleótido,. respectivamente, lido da ' extremidade. ,5' (a montante ou ascendente) . para a extre-midade 3T (a jusante ou descendente). 0 ácido nucleico pode representar a estrutura helicoidal, num sentido . (paralela) ou no sentido inverso (anti-sentido ou anti-parâlela). "Natural" refere-se a uma sequência de ácido nucleico de ocorrência natural (de "tipo selvagem"). . Sequência "heteróloga" refere-se a uma sequência . que se origina numa fonte ou espécie estranha ou, se da mesma fonte, é modificada da sua forma original.
Uma sequência de ácidos nucleicos "isolada" está praticamente separada ou purificada de outras sequências de ácidos nucleicos às quais os ácidos nucleicos estão normalmente associados na célula do organismo em que o ácido nucleico ocorre naturalmente, isto é, outro ADN cromossómico ou extracromossómico. O termo abrange ácidos nucleicos que são bioquimicamente purificados de modo a que eliminem praticamente os ácidos nucleicos e outros compo-nentes 15 celulares contaminantes. 0 termo também abrange ácidos nucleicos recombinantés. e ácidos nucleicos quimica-mente sintetizados. A expressão .'"praticamente purificado", como., se utiliza, aqui, refere-se a uma molécula separada de praticamênte de . todas as outras moléculas normalmente associadas com ela' no seu estado natural. Mais preferen-cialmente, uma molécula praticamente purificada é a espécie predominante presente numa preparação. Uma molécula praticamente purificada pode ser mais do que 60 % livre, preferencialmente' 75 % livre, mais preferenciàlmente 90. % .livre de outras moléculas (excluindo o. dissolvente) presentes na mistura natural. O. termo - " praticamente purificado" não pretende, abranger moléculas presentes no seu estado natural. ....
Uma primeira sequência de ácidos nucleicos, apresenta "identidade substancial" com . uma sequência de ácidos nucleicos de referência se, quando optimamente alinhada. (com inserções ou eliminações de nucleótidos apropriadas totalizando menos, do que.20 por cento da,sequência de referência em relação à janela de comparação) com os outros ácidos nucleicos (ou com' a sua estrutura helicoidal complementar), haja pelo menos cerca de 75 % de identidade da sequência de nucleótidos, preferenciàlmente pelo. menos cerca de 80 % de identidade, mais preferenciàlmente pelo menos cerca' de 85 % de identidade e mais preferenciàlmente pelo menos cerca de 90 % de identidade numa.janela de com-paração de pelo menos 20 posições de nucleótidos, preferen-cialmente pelo menos 50 posições de nucleótidos, mais preferenciàlmente pelo menos 100 posições de nucleótidos e o mais preferencial todo. o comprimento do primeiro ácido nucleico. Ό alinhamento óptimo das sequências para o alinhamento de uma janela de comparação pode ser realizado pelo algoritmo de homologia local de Smith and Waterman Adv. Appl. Math 2: 482, 1981; pelo algoritmo de. 16 alinhamento de homologia de Needleman e Wunsch, J. Mol- Biol. 48: 443, 1970; pela pesquisa pelo processo de similaridade de Pearson e L-ipman, Proc. Natl. Acad. Sei EUA 85: 2444, 1988; preferencialmente por implementações computadorizadas des-tes algoritmos (GAP, BESTFIT, FASTA e TFASTA} no Wisconsin Genetics Software Package, versão 7.0, Genetics Computer Group, 575 Science Dr., Madison, WI. O ácido ·nucleico de referência pode ser uma molécula de comprimento completo ou uma parte de uma molécula mais longa. Alternativamente, os dois ácidos, nucleicos terão uma identidade substancial se um hibridar com o outro em condições severas, como defi-nido a seguir. .
Uma primeira sequência de ácidos nucleicos- está "opera— cionalmente ligada" a uma segunda sequência de ácidos nucleicos quando as sequências estiverem dispostas de modo que a primeira sequência de ácidos nucleicos afecte a fun-ção da'segunda sequência de ácidos nucleicos. Preferen-cialmente, as duas sequências, são parte de uma molécula de ácido .nucleico continua simples e mais preferencialmente estão adjacentes. Por exemplo, um promotor está operacio-nalmente ligado a um gene se o promotor regula ou medeia a transcrição do gene.numa célula.
Um ácido nucleico "recombinante" é constituído por uma combinação artificial de dois segmentos separados da sequência, por exemplo, por. síntese química ou.pela manipulação de segmentos, isolados de ácidos nucleicos por técnicas de engenharia genética. As técnicas para a manipulação de ácido nucleico são bem-conhecidas (ver, por exemplo, Sambrook et al., 1989 e Ausubel et al., 1992). Os processos para a síntese química de ácidos nucleicos são debatidos, por exemplo, em Beaucage e Carruthers, Tetra. Letts. 22: 1859-1862, 1981, e Matteucci et al. , J- Am. Chem. Soc, 103: 3185, 17 1981· A síntese química de ácidos nucleicos pode ser executada, por exemplo, em sintetizadores de oligonucleótido, automatizados, comerciais.
Uma "sequência de ácido nucleico sintética" pode ser construída e quimicamente sintetizada por expressão intensificada em células hospedeiras particulares e para os propósitos de clonagem. em vectores apropriados. As células hospedeiras apresentam muitas vezes um padrão preferido de uso de codão (Murra et al., 1989). Os ADNs sintéticos construídos para intensificar a expressão num hospedeiro particular devem, portanto, reflectir o padrão de utiliza-ção do codão na célula hospedeira. Há programas de computador disponíveis para estes fins incluindo, mas não se limitando aos programas "BestFit" ou "Gap" do Sequence Analysis Software Package, Genetics Computer Group, Inc., University of Wisconsin Biotechnology Center,. Madison., WI. 53711. "Amplificação" de ácidos nucleicos ou "reprodução 'de., ácidos nucleicos" refere-se à produção de cópias adicionais de uma sequência de ácidos nucleicos e realiza-se utilizan-do tecnologias, de reacção em -.cadeia de polimerase (RCP). Conhece-se. uma variedade, de processos· de amplificação na técnica e estão descritas, inter alia,· nas patentes de invenção norte-americanas' U.S.. N°s 4.683.195 e 4.,683.202 e em Protocolos de., RCP:. A Guide to Methods and Applications, ed. . Innis et al.., Academic Press, San Diego, 1990. Na RCP, um iniciador refere^se a um oligonucleótido curto de sequência definida’ que é anelado com umâ matriz de ADN para iniciar a rea.cção em cadeia de polimerase. "Transformado", "transfectado" ou "transgénico" refe-re-se a uma célula, . tecido, órgão ou. organismo no . qual foi introduzido um ácido nucleico estranho, .'tal como· um vector 18 recombinante. Preferencialmente,, o ácido nucleico é integrado no ADN genómico da célula receptora, tecido,. órgão ou organismo de modo' que o ácido nucleico introduzido seja herdado pela progenia subsequente. Uma célula ou organismo "transgénico" ou "transformado" também inclui a progenia da célula.' ou do organismo e a progenia produzida por um programa de linhagem utilizando uma tal planta "transgénica" cõmo uma origem num cruzamento e apresentando um fenótipo alterado resultando da presença de uma estrutura ou vector recombinante 0 termo "gene" refere-se ao ADN cromossómico, ADN de plasmido, ADNc, ADN sintético ou outro ADN que codifica um, péptido, polipeptido, proteína, ou molécula. de ARN e regiões de flanqueio da sequência de codificação, envolvidas na regulação da expressão. Alguns genes podem ser transcritos no ARNm e traduzidos nos polipéptidos (geries estruturais); outros genes podem ser transcritos no.ARN (por exemplo, ARNr, ARNt); e outros tipos de função do gene como regula-dores de expressão {genes reguladores). "Expressão" de um gene refere-se- à transcrição de um gene para produzir o ARNm correspondente e a tradução deste ARNm para produzir o produto:de gene correspondente, isto é, um péptido,. polipéptido ou proteína. A expressão do gene é controlada' ou regulada por; elementos reguladores incluin-do elementos reguladores 5' tais como promotores. "Componente genético" refere-se a qualquer sequência de ácido nucleico ou elemento genético ' que pode. também , ser um componente ou parte de um vector de expressão·. Exemplos de componentes genéticos incluem, mas não se limitam às regiões dos promotores, lideres, não traduzidos 5', intrões, genes, regiões· não traduzidas 3' e outras sequências'reguladoras ou 19 sequências que afectam a transcrição ou a trandução de uma ou mais das sequências de ácidos nuclei-cos. ,As expressões "estrutura de ADN recombinante",· "vector recombinante", "vector de expressão" ou "cassete de expressão" referem-se a qualquer agente tal como ura plasmido, vírus, CAB (cromossoma artificial bacteriano) , sequência de replicação de ' forma autónoma, fagos ou sequência de nucleótidos de ADN ou ARN de estrutura helicoidal simples ou de estrutura helicoidal dupla linear ou circular capaz. de integração genómica . ou replicação autónoma, derivada de qualquer fonte, compreendendo uma molécula de ADN em que uma ou mais sequências · de ADN foram ligadas de .uma maneira funcionalmente'operativa, "Complementar"' refere-se á associação natural de sequências de ácidos nucleicos mediante emparelhamentó. das bases (pares A-G-T com a· sequência complementar T-C-A). A complementaridade entre duas moléculas de estrutura helicoidal simples pode ser parcial, se apenas alguns dos pares de ácidos.nucleicos forem complementares; ou completa, se todos os pares de bases forem complementares. 0 grau de complementaridade afecta a eficácia e a resistência de reacções de hibridação e amplificação. '··.' "Homologia" refere-se ao nível de similaridade entre sequências de ácidos nucleicos ou de aminoácidos em termos de percentagem de identidade posicionai de nucleótidos ou de aminoácidos,. respectivamente, isto é, similaridade ou identidade, de sequência. Homologia também se refere ao conceito de propriedades funcionais similares entre dife-rentes ácidos nucleicos ou proteínas. "MSEs" ou Marcadores, de Sequência Expressa, são sequên- 20 cias curtas de clones aleatoriamente seleccionadas de uma biblioteca de ADNc (ou ADN complementar} que são representativas das inserções de ADNc destes clones aleatoriamente seleccionados (McCombie, et . al., Nature Genetics., 1: 124, 1992, Kurata, et al., Nature Genetics, 8:365, 1994; Okubo, et al.', Nature Genetics, 2: 173, 1992) . A expressão "Northern elecrónica" refere-se a uirta análise de:sequência com base em computador que permite que as sequências de. múltiplas bibliotecas de ADNc sejam comparadas eletronicamente com base nos parâmetros identificados pelo investigador incluindo a abundância em populações de MST em- múltiplas bibliotecas de ADNc, ou exclusivamente em grupos de MST de uma ou mais combinações de bibliotecas. "Sub-determinação" refere-se a um processo de comparar sequências de ácidos nucleicos de diferentes ou múltiplas fontes que podem ser utilizdas para avaliar o- perfil de expressão das. sequências de ácidos' nucleicos que reflecte a .actividade de transcrição do gene e a estabilidade da mensagem num tecido em particular, em um tempo particular ou sob condições particulares. "Promotor" refere-se a uma sequência de ácidos nucleicos localizada a. montante ou 5'' com um .codão inicial translacional de uma estrutura de leitura aberta' (oú região de codificação de proteína) de um gene e que está envolvida no, reconhecimento ' e na ligação de. ARN polimerase II è de outras proteínas, (factores de transcrição de acção trans) para iniciar, a transcrição. Um "promotor de planta" é um promotor natural ou não natural que, é funcional em células da planta. Os promotores' constitutivos são funcionais na,maior parte ou em todos os tecidos de uma planta durante o 21 desenvolvimento . da planta. Os. promotores específicos de tecidos, órgãos ou células são expressos apenas ou predo-· minarttemente num tecido, órgão ou tipo celular' particular, respectivamente. No lugar de ser expresso "especificamente" num dado tecido, órgão ou tipo celular, . um promotor .pode apresentar expressão "intensificada", isto é, um nível rnais alto de expressão, numa parte (por exemplo, tipo celular,, tecido ou órgão)' da planta comparada' com outras partes da planta. Os promotores temporariamente regulados são funcionais apenas ou predominantemente durante certos períodos do desenvolvimento da planta ou em certas horas do dia, tal como, : por exemplo, no caso de genes associados ao ritmo circadiano. Os promotores indutíveis expressam· selectivamente uma Sequência de ADN ligada-. operacionalmente em resposta à presença de. um estímulo endógeno ou exógeno-, por- exemplo, por compostos químicos (indutores' químicos), ou. em resposta aos sinais ambientais, hormonais, químicos e/ou de desenvolvimento. Os promotores indutíveis. ou regulados incluem, por exemplo, promotores regulados por. luz, calor,, tensão, inundação "ou seca, fito-hormonas, ferimentos ou produtos químicos tais como etanol, jásmonato, ácido salicíçlico ou protectores.
Qualquer promotor de planta pode ser utilizado como. uma sequência reguladora 5' para a expressão de regulação de um gene ou de genes particulares. Um promotor preferido pode ser um promotor de ARN polimerase II de plantas. Os promotores de ARN polimerase II de plantas, como aqueles de outros' euca-riotos superiores, têm estruturas complexas e compreendem vários elementos distintos. Um tal elemento é a caixa TATA ou caixa Goldberg-Hogness, que é requerida para a expressão correcta e precisa de genes eucarióticos in vitro, iniciação eficaz de transcrição in vivo. A caixa TATA é normalmente posicionada aproximadamente a -25 a -35, ou seja, 25 a 35 22 pares de base (pb) a montante (5'} do sitio de iniciação da transcrição, ou sitio cúpula, que é definida como a posição +1 (Breathnach e Chambon, Ann, Rev. Biochem. 50: 349-383, 1981; Messing et al, .em: Genetic Engineering of Plants, Kosuge et al., eds., páginas 211-227, 1983).Outro elemento comum,: a caixa CCAAT, está localizado entre -70 e -100 pb. Nas plantas, a caixa CCAAT pode ter uma sequência, diferente de consenso da sequência funcionalmente análoga de promotores de mamíferos (o análogo vegetal foi. denominado por "caixa AGGA" para a diferenciar de sua contraparte. em animais? Messing et al., em: Genetics Engineering of.Plants, Kosuge et al., eds, páginas 211-227, 1983) . Além disso, virtualmente
todos os promotores incluem sequências ou intensificadores de activação adicionais a. montante (Benoist e Chambon, Nature 290: . 304-310, 1981; Gruss et al.,. Proc, Acad. Sei. EUA 78:943-947, 1981; e Khcury e G.rus.s, Cell 27:313-314, 1983) estendendo^se ao redor de -1-00; pb até -1.000 pb ou mais a montante do sítio de iniciação da. transcrição.
Quando fundidos com sequências heterólogas' de ADN, tais promotores. normalinente fazem com que a sequência fundida seja transcrita de uma . maneira que é similar à da sequência de gene com a·' qual o promotor está normalmente associado. Os. fragmentos de promotores que incluem sequências reguladoras podem ser adicionados, (por exemplo, fundidos· com· a extremidade ·5'; ou inseridos dentro de um promotor activo tendo as suas próprias sequências reguladoras' parciais ou completas (Fluhr et al., Science, 232 : 1106-1112', 1986;. Ellis et al., EMBO J. 6: 11-16, 1987;' Strittmatter e Chua,· Proc.
Nat. Acad. Sei. EUA.84: 8986-8990,, 1987; Poulsen e Chua, Mol. Gen. Genet. 214: 16-23, 1988; Cornai et al., Plant Mol. Biol. 15: 373-381, 1991}.,' Alternativamente, as sequências reguladoras heterólogas podem ser. adicionadas à' região a montante de 5' de um promotor original truncado, inactivo, 23 por exemplo, um promotor incluindo apenas o núcleo. TATA, e algumas vezes, os elementos de CCAAT (Fluhr et al., Science 232: 1106-1112, 1986; Strittmatter e Chua, Proc. Nat. Acad. Sei. EUA 84: 8986-8990, 1987; Aryan et al., Mol, Gen. Genet. 225: 65-71, 1991) .
Os promotores compreendem normalmente "elementos reguladores , transcricionais de acção cis", distintos, múltiplos ou simplesmente "elementos cis"cada um destes podendo conferir um aspecto .diferente do controlo total de expressão do gene (Strittmatter e Chua, Proc. Nat. Acad. Sei. EUA 84: 8986-8990, 1987; Ellis et al. , EMBO J. 6: 11-16, 1987; Ber.fey et al., EMBO J. 9: 1677-1684, 1990). Os. "elementos cis" ligam factores de proteína de acção trans que regulam a transcriçãov Alguns elementos cis ligam mais do que um factor e os. factores de transcrição de ação trans podem interagir com diferentes afinidades com mais do que, um elemento cis (Johnson e McKnight, Ann. Rev. Biochem. 58: 799-839, 1989). Os .factores de transcrição da planta, elementos cis correspondentes e análise de sua interaeção estão debatidos, por exemplo, em: Martin, Curr. Opinions Biotech. 7: 130-138, 1996; Murai> .em: Methods in Plant Biochemistry and Molecular Biology, Dashek, ed., CRC Press, 1997, páginas ,397-422; e Methods in Plant Molecular,Biology, Maliga et al., eds.,' Cold Spring Rarbor Press, 1995,. páginas' 233-300. As sequências promotoras da presente invenção podem conter "elementos cis" que podem regular â expressão do. gene. .
Os elementos cis podem ser identificados por várias técnicas, incluindo a análise de eliminação, isto é, eliminando um ou mais nucleótidos da extremidade 5' ou interno a um promotor; análise de proteína de ligação de ADN utilizndo a impressão digital de ADNase I, interferên-cia de metilação, ensaios de alteração de mobilidade por 24 eletroforese, impressão genómica in vivo mediante RCP mediada por ligação e Outros ensaios convencionais; ou por similaridade de'sequências com.motivos de elemento cís conhecidos mediante processos convencionais de comparação de sequência. A estrutura fina de um elemento cis pode ser também estudada por mutagénese (ou substituição) de um ou mais nucleõtidos ou por outros processos convencionais. Ver, por exemplo, Methods in Plant Biochemistry and Molecular Biology, Dashek, ed., CRC Press, 1997, páginas 397-422; e Methods in Plant Molecular Biology, Maliga et ai., eds., Cold Spring Harbor Press, 1995, páginas 233-300.
Os elementos cís podem ser obtidos por síntese química· ou. por clonagem de promotores que incluem tais. elementos e-podem ser sintetizados com sequências de flanqueio adicionais que contêm .sítios· ' de enzimas de restrição , úteis para· facilitar a manipulação subsequente. Num enguadrair.er.-tc,. os promotores são constituídos por "elementos reguladores trans-criçionais de acçãb cís" distintos, múltiplos ou simplesmente, "elementos cís", cada um dos quais pode regular um aspecto diferente do controle total de expressão, de genes (Strittmatter e Chua, Proc. Nat. Acad. Sei. EUA 84: 8986- 8990, 1987.;, Ellis et al., EMBO J. 6:· 11-16, 1987; Benfey et al., ÈMBO J. 9: 1677-1684, 1990). Por exemplo, as combinações de regiões de elementos cís ou fragmentos do promotor 35S podem apresentar padrões de expressão específicos de tecido (ver patente de invenção norte-americana U.S. N° 5.097.025). Num enquadramento, as regiões de sequência compreendendo "elementos cis" das sequências de ácidos nucleicos da SEQ ID N°38. podem sér identificadas utilizando programas de computador desenhados especificamente . para identificar elementos cis, domínios ou motivos dentro das sequências por uma comparação çom elementos cis conhecidos ou podem ser utilizados para alinhar múltiplas sequências reguladoras de 25 .5' para identi-ficar novos elementos cis. A presente invenção inclui elementos cis da SEQ ID' N°: 38 ou homólogos.de elementos cis conhecidos para efectuar a regulação de gene.que apresentam homologia com as sequências de ácidos nucleicos· da presente , invenção'. Um certo número desses elementos são conhecidos da literatura,, tal como ' os elementos que são regulados por numerosos factores tais como luz, calor ou tensão; elementos que. são. regulados ou induzidos por patogénios ou produtos químicos e similares. Tais elementos podem regular positiva òu negativamente a expressão do gene, dependendo das condi-ções Exemplos de elementos cisincluem mas não se limitam' a elementos responsivos ao oxigénio (Cowen et ai.., J. Biol. Chem. 268 (36) :. 26904,.,. 1993) , elementos reguladores da luz (ver, por exemplo, Bru.ce e Quaill, Plant Cell 2 (11)': 1081, ' 1990 e
Bruce et' al., EMBO J'. '10: .3015, 1991), um elemento cis responsivo ao tratamento com jasmonato de meti.lo {Beaudoin e . Rothsteiri, Plant Mol. Biol.. 33:835, 1997), elementos sensíveis ao ácido salicílico (Strange et al., Plant J. 11: 1.315, 1997), element-os responsivos ao choque térmico (Pelham et al., Trends Genet. 1: 31, 1985); elementos responsivos a ferimento e tensão abiótica (Loace et al., Proc. Natl. Acad. Sçi. E.U.A. 89: 9230, 1992,; Mhi.ri et al., Plant-Mol. Biol. 33: 257, 1997), elementos de baixa temperatura (Baker et al., Plant Mol. Biol. 24: 701, 1994; Jiang' et al., Plant Mol.
Biol. 30: 679, 1996; Nordin et al., Plant Mol. Biol. 21: 641, 1993; Zhou et al., J. Biol. Chem. 267: 2351.5, 1992) e elementos responsivos à seca (Yamaguchi et al., Plant Cell, 6: 251-264, 1994; Wang et al., Plant Mol. Biol. 28: 605, 1995; Bray E. A. Trends in Plant Science 2: 48, 1997). A presente invenção, portanto, abrange regiões, domínios, fragmentos ou "elementos cis". das moléculas de ácido 26 nucleioo descritas e os fragmentos de ácidos nuclei-cos podem incluir qualquer região contígua das sequências descritas. As regiões do promotor da presente invenção, tal como se mostra na SEQ . ID. N°: 38 podem conter um ou mais elementos reguladores.incluindo mas não se limitando a "elementos cis" ou domínios que são capazes de regular a transcrição de sequências de ADN.ligadas operacionalmente em sementes e tecidos de plantas das sementes de plantas. Os tecidos de sementes de plantas incluem o embrião constituído por células embriónicas e tecido de embrião tais como o escutelo, o endoesperma, a aluerona e o revestimento da semente.
Os promotores de planta podem incluir promotores produzidos através da manipulação de promotores conhecidos para produzir promotores; sintéticos, quiméricos ou híbri-dos. Tais promotores pòdem combinar elementos cis de um ou mais promotores,, por .exemplo, adicionando uma sequência reguladora heteróloga a um promotor activo com as suãs próprias sequências reguladoras parciais ou completas (Ellis et al., EMBO J. 6:. 11-16, ,1987; Strittmatter e Chua, Proc. Nat. Acad.· Sei. USA 84: 8986-8990, 1987; Poulsen· e Chua, Mol. Gen. Genet. 214:15-23, 1988;. Cornai et al. , Plant. Mol. Biol. 15:373381, 1991). Os promotores quiméricos também'têm sido desenvolvidos adicionando Uma sequência reguladora heteróloga na região a montante de 5" de um promotor truncado, inactivo, isto. é, um promotor que inclui apenas o núcleo TATA e, opcionalmente, os elementos CCAAT (Fluhr et al., Science 232: 1106-1112, 1986; Strittmatter e Chua, Proc. Nat. Acad. Sei.. USA 84: 8986-8990, 1987; Aryan et al·., Mol. Gen. Genet. 225: 65-71, 1991). 0 desenho, construção e utilização de promotores quiméricos ou híbridos compreendendo pelo menos um c.os elementos cis da SEQ ID N°: 38 para regular a expressão dé sequências de ácidos nucleícos ligadas operacíonalmente, estão dessa forma abrangidos pela presente invenção. 27
As sequências promotoras, fragmentos, regiões ou elementos cis da SEQ ID N°: 38 são capazes de transcrever as sequências de ADN no tecido embriogénico e, portanto, podem regular selectivamente a expressão dos genes nestes tecidos. As sequências promotoras que regulam a expressão dos genes preferencialmente em tecidos embriogénicos têm utilidade na transformação e na expressão selectiva de genes nos tecidos maternos. Por exemplo, os promotores intensificados do embrião podem estar operacionalmente ligados aos marcadores classificáveis tais como GUS ou PFV. Estes genes repórteres codificam para β-glicuronidase e proteína verde fluorescente, respectivamente e, quando operacionalmente ligados às sequências reguladoras 5' da presente invenção, podem fornecer uma indicação do potencial de transformação de tecidos embriogénicos e para optimizar os parâmetros de transformação e de regeneração. As sequências reguladoras 5' da presente invenção podem também ser utilizadas para a transcrição selectiva de qualquer gene ou de genes de interesse incluindo, mas não se limitando aos genes para intensificar os traços de qualidade das sementes. O advento da técnica genómica, que compreende técnicas moleculares e de bioinformática, resultou na sequenciação rápida e análises de um grande número de amostras de ADN de um vasto número de alvos, incluindo, mas não se limitando a espécie de plantas de importância agronómica. Para identificar as sequências de ácidos nucleicos da presente invenção a partir de uma base de dados ou colecção de sequências de ADNc, a primeira etapa envolve a construção de bibliotecas de ADNc a partir de tecido marcados específicos de plantas de interesse. Em resumo, as biblio-tecas de ADNc são primeiro construídas a partir destes tecidos que são colhidos num estádio de desenvolvimento particular, ou sob condições 28 ambientais particulares. Identificando os genes diferencialmente expressos nos tecidos das plantas em diferentes estádios de desenvol-vimento ou sob diferentes condições, as sequências reguladoras correspondentes daqueles genes podem ser identificadas e isoladas. A visualização da imagem transcrita permite a identificação de sequências preferidas de tecido com base na visualização da imagem específica das sequências de ácidos nucleicos de uma biblioteca de ADNc. Por imagem transcrita, tal como se utiliza aqui, entende-se uma análise que compara a abundância dos genes expressos em uma ou mais bibliotecas. Os clones contidos dentro da biblioteca de ADNc são sequenciados e as sequências são comparadas com as sequências das bases de dados publicamente disponíveis. Os processos com base em computador permitem ao investigador formular perguntas que comparam sequências das múltiplas bibliotecas. O processo permite uma rápida identificação de clones de interesse, comparado com os processos de subtracção de hibridação convencionais conhecidos pelos especialistas na matéria.
Utilizando metodologias convencionais, as bibliotecas de ADNc podem ser construídas a partir do ARNm (ARN mensageiro) de um dado tecido ou organismo usando iniciadores de poli dT e transcriptase inversa (Efstratiadis, et al. , Cell 7: 279, 1976; Higuchi, et al., Proc. Natl. Acad. Sei. (Ε,υ.Α.) 73: 3146, 1976; ManiatlS, et al., Cell 8: 163, 1976; Land et al., Nucleic Acids Res. 9: 2251, 1981; Okayama, et al., Mol. Cell. Biol. 2: 161, 1982; Gubler, et al., Gene 25: 263, 1983).
Podem utilizar-se vários processos para obter estruturas de ADNc de comprimento completo. Por exemplo, pode-se utilizar transferase terminal para adicionar caudas homopo-liméricas de resíduos dC aos grupos hidroxilo 3' livres (Land, et al., Nucleic Acids Res. 9: 2251, 1981). Esta cauda 29 pode então ser hibridada por um poli dG ol.igo que pode actuar como um iniciador para a síntese de ADNc da segunda estrutura helicoidal de comprimento completo. Okayama e Berg, reportam um processo para obter estruturas de ADNc de comprimento completo. Este processo tem sido simplificado utilizando iniciadores-adaptadores sintéticos que têm tanto caudas, homopoliméricas para iniciar a síntese das primeira e segunda estruturas helicoidais e sítios de restrição para a clonagem nos plasmidos (Coleclough, et· al., Gene 34: 305, 1985) e vectores bacteriófagos (Krawinkel, et al., Nucleic Acids Res. 14: 1913, 1986; e Han, et al., Nucleic Acids Res. 15: 6304, 1987) .
Estas estratégias podem ser acopladas com estratégias adicionais para isolar populações raras de ARNm. Por exemplo, uma célula típica de mamífero contém entre 10.000 e 3.0.000 sequências diferentes de ARNm. Davidson, Gene Activity in Early Development, 2a ed., Academic Press, Nova Iorque, 197 6. O número de . clones requerido para alcançar uma dada probabilidade de que um ARNm de baixa abundância- esteja presente numa biblioteca de ADNc é N = (In (1-P))/(ln(1-1/n) ) em que N representa o número de clones requerido,. P representa . a probabilidade desejada e 1/n é a proporção fraccional do ARNm total que é representada por um ARNm raro simples (.Sambrook, et al.,1989) .
Um processo para enriquecer as preparações de ARNm para sequências de interesse é o de fraccioná-la por dimensão. . Um tal. processo consiste em fraccionar mediante eletroforese através de um gel de âgarose (Pennica, et al. , Nature 301: 214, 1983). Outro desses processos' emprega a centrifugação com um gradiente de sacarose na presença de um agente, ' tal como hidróxido de metilmercúrio, ·. que desnatura a estrutura secundária' no ARN (Schw-einfest, et al., Proc.' Natl. Acad.. 30
Sei. (E.U.A.) 79: 4997-5000, 1982).
Um processo frequentemente adoptado . consite em cons- truir bibliotecas de ADNc igualizadas ou normalizadas (Ko, Nucleic Acids Res. 18; 5705, 1990; Patanjali, S. R. et al., Proc. Natl. Acad. Sei. (E.U.A.) 88: 1943, 1991}. Normal-mente, a população dé ADNc é normalizada por hibridação subtractiva. Schmid, et al., J. Neurochem. 48: 307, 1987; Fargnoli, et al., Anal. Biochem. 187: 364, 1990; Travis, et al., Eroc. Nad. Acad. Sei (E.U.A.) 85: 1696, 1988; Kato, Eur. J. Neurosci. 2 : 704, 1990; e Schweinfest, et al., Genet.
Anal. Tech. Appl. 7: 64, 1990). A subtraeção . repre-sénta outro processo para reduzir a população de' certas sequências nà ' biblioteca de ADNc (Swaroop, et al., Nucleic Acids Res. 19: 1954,' 1991) . Podem construir-se bibliotecas normalizadas utilizando o procedimento de· Soares- (Soares et al., .Proc. Natl.. Acad. Sei. (E.U.A.) 91: 9228, 1994). Esta abordagem.é desenvolvida para. reduzir a variação.inicial em 10.000 vezes nas frequências de ADNc individuais para alcançar, abundâncias' dentro de uma'ordem· de magnitude ao mesmo tempo mantendo a complexidade da sequência total.da'biblioteca.. No processo de normalização, a prevalência de clones. de. ADNc de alta abundância diminui.drasticamente, os· clones com abundância de nível médio não são relativamente afectados e os clones para transcriptos raros são eficazmente aumentados com abundância.
Os MSEs podem ser sequenciados por vários processos. Dois processos básicos podem ser utilizados para a sequen-ciação de ADN, o processo de terminação de cadeia- de Sanger et al·., Proc. Natl. Acad. Sei. (E.U.A.) 74 : 5463, 1977 e o processo de degradação quimica de Maxam e Gilbert, Proc. Nat. Acad. Sei. (E.U.A.) 74: 560, 1977. A automação e as vantagens na tecnologia tais como " a .substituição de radioísótopos com séquenciação com base em . fluorescência .31 reduziram o esforço requerido para sequenciar o ADN (Craxton, Methods, 2: 20, 1991; Ju et al., Proc. Natl. Acad. Sei. (E.U.A.) 92: 4347, 1995; Tabor e Richardson, Proc. Natl. Acad. Sei. (E.U.A.) 92: 6339, 1995). Os sequenciadores automatizados estão disponíveis em vários fabricantes, por exemplo, Pharmacia Biotech, Inc., Piscataway, Nova Jersey (Pharmacia ALF), LI-COR, Inc., Lincoln, Nebraska (LI-COR 4.000) e Millipore, Bedford, Massachusetts (Millipore BaseStation).
Os MSEs mais longos do que 150 pb têm-se mostrado úteis para pesquisas de similaridade e mapeamento (Adams, et al., Science 252: 1651, 1991). As sequências de EST normalmente variam de 150-450 bases. Esta é a extensão de informação da sequência que é por rotina confiavelmente gerada usando dados de sequência de operação simples. Tipicamente, apenas os dados de sequência de operação simples são obtidos da biblioteca de ADNc, Adams, et al., Science 252: 1651, 1991. A sequenciação de operação simples automatizada resulta normalmente num erro de aproximada-mente 2-3% ou numa taxa com uma ambiguidade de base. (Boguski, et al., Nature .Genetics, 4: 332, 1993) . 'As bases de dados de EST foram construídas ou parcialmente construídas a partir de, por ; exemplo, C. elegans (McCombrie, et al., Nature Genetics 1: 124, 1992), linha de células do fígado humano HepG2 . (Okubo, et al., Nature Genetics 2: 173, 1992); ARN de cérebro humano (Adams, et al.,
Science 252: 1651, 1991; Adams, et al., Nature 355: : 632, 1992) ; Arabidopsis, (Newman, et al. ., Plant Physiol. 106: 1241, 1994); e arroz (Kurata, et al., Nature Genetics 8 : 365, 1994) . A presente invenção usa MSEs isolados de várias bibliotecas preparados a partir de um tecido embriogénico de milho ou de calo como uma ferramenta para a identificação de 32 sequências promotoras associadas com genes expressos nestes tecidos desejados que facilitam o isolamento das sequências reguladoras 5’ tais como promotores que regulam os genes.
As análises de sequência com base em computador podem ser utilizadas para identificar sequências expressas de forma diferencial, incluindo mas não se limitando àquelas sequências expressas num tecido, comparadas com outro tecido. Por exemplo, um conjunto diferente de sequências pode ser observado, a partir do 'ADNc isolado, de tecido, de planta., isolado de tecido de raiz versus tecido de folha. Conse-quentemente, as sequências podem ser comparadas com bibliotecas de ADNc preparadas a partir de plantas crescidas, em diferentes condições ambientais ou fisiológicas. Uma vez que as sequências preferidas são identificadas, a partir da biblioteca de ADNc de interesse, os clones genómicos podem ser..isolados a partir de uma biblioteca genómica preparada a partir do tecido de plantas, e as, sequências reguladoras correspondentes incluindo mas não se limitando a sequências reguladoras 5',. que podem ser iden-tifiçadas e isoladas.
Num enquadramento preferido, as sequências de marcadores de sequências expressas (MSE) de uma variedade de bibliotecas de ADNc são catalogadas numa base de dados de sequências. Ests base de dados é utilizado para identificar alvos de promotores de um tecido particular de interesse. A selecção de marcadores de sequências expressas para o subsequente isolamento do promotor está reflectida na presença de uma ou mais sequências entre os MSEs representativos de . uma amostragem aleatória de uma biblioteca individual de ADNc ou de uma colecção de bibliotecas de ADNc. Por exemplo, a identificação de sequências regulado-ras que regulam a expressão de transcriptos era tecido embriogénico ou de calo é conduzida identificando MSEs encontrados em 33 bibliotecas de ADNc preparadas a partir de tecido embriogéni-co ou de calo e ausentes ou em fraca abundância noutras bibliotecas de ADNc na base de dados. As derivações de EST identificadas são depois avaliadas por abundância relativa dentro da biblioteca e avalia-se o perfil de expressão para um dado MSE. Por abundância, tal como se utiliza aqui, deve enteder-se o número de vezes que um clone ou um grupo de clones aparece numa biblioteca. As sequências que são intensificadas ou que estão em grande abundância num tecido ou num órgão específicos que representam um perfil de expressão alvo, são identificadas desta maneira e os iniciadores podem ser construídos a partir das sequências,de MSE identificadas. Pode-se utilizar unia abordagem à base.de RCP para amplificar, as regiões de flanqueio de uma biblioteca genómica de plantas alvo de interesse. Vários processos são conhecidos pelos especialistas da técnica para amplificar sequências de ADN. não conhecidas adjacentes a uma região de núcleo de sequência conhecida. Os processos incluem,, mas não se limitam a .RCP inversa (RCPI), RCP de vectores, RCP em forma de Y e processos de rastreio do genoma.
Num enquadramento preferido, o ADN genómico ligado a um adaptador é submetido a um ciclo de amplificação primá-rio de RCP com um iniciador específico de gene e um. iniciador que se une à sequência do adaptador. 0 produto de PCR é a seguir utilizado como a matriz para um ciclo de inclusão de. amplificação de PCR com um segundo iniciador específico do gene e um segundo adaptador. OS fragmentos resultantes da reacção de RCP.de inclusão são depois isolados, purificados e subclo-nados num vector apropriado. Os fragmentos são sequencíados e os sítios iniciais de translação podem ser identificados quando o MSE for deriva-do de um ADNc truncado. Os fragmentos podem ser clonados em vectores de expressão de plantas como fusões transcrici-onais ou translacionais com um gene 34 repórter tal como β-glicuronidase (GUS). As estruturas podem ser ensaiadas em análises transientes e subsequentemente as regiões regula-doras 5' são operacionalmente ligadas aos outros genes e às sequências reguladoras de interesse num vector adequado de transformação da planta e as plantas transformadas são ana-lisadas quanto à expressão do(s) gene(s) de interesse por qualquer número de processos conhecidos dos especialistas na técnica.
Qualquer planta pode ser seleccionada para a identificação de genes é sequências reguladoras. Exemplos de alvos de planta adequados para o isolamento de genes e sequências reguladoras podem incluir, mas não se limitam a Acádia, alfafa, maçã, damasco, Arabidopsis, alcachofra, rúcula, espargos, abacate, banana, cevada, feijões, beterraba, amora-preta, mirtilo, bróculos, couve de Bruxelas, repolho, canola, cantalupo, cenoura, aipim, mandioca, . mamona, ..couve-flor, aipo, cereja, chicória, coentro, citrinos, Clementinas, cravo, coco, café, milho, algodão, pepino, abeto de Douglas, beringela, endivia, escarola, eucalipto, funcho, figos, alho, cabaça, uva, toranja, espécie de melão, "jicama", kiwi, alface, alho pbrro, limão, lima, espécie' de pinheiro da América do Norte (Pinnus taeda), linhaça, manga, melão, cogumelo, nectarina, noz, aveia, óleo de palma, colza de semente oleaginosa, quiabo, azeitona, cebola, laranja, uma planta ornamental, palma, mamão, salsa, pastinaca, ervilha, pêssego, amendoim, pêra, pimenta, caqui, pinheiro, abacaxi, bananeira, ameixa, romã, álamo, batata, abóbora, marmelo, pinheiro de Monterrei, "radiscchio", rabanete, semente de colza, .framboesa, arroz, centeio, sorgo, pinheiro do Sul, soja,. espinafre, moranga, morango, beterraba açucareira, cana-de-açúcar, girassol, batata doce, goma doce, tangerina, chã, tabaco, tomate, "triticale”, relva, nabo., videira, melancia, trigo, inhames e curgetes. Alvos de planta 35 particularmente preferidos podem incluir milho, algodão, soja e trigo.
As moléculas de ácido nucleico da presente invenção são isoladas de milho {Zea mays). A planta de milho desenvolve aproximadamente 20 - 21 folhas, tornas-se macias aproximada-mente 65 dias pós emergência e amadurece aproximadamente 125 dias pós emergência. As plantas de milho normais seguem um padrão geral de desenvolvimento, mas o intervalo de tempo entre os diferentes estágios e a morfologia variam entre diferentes híbridos, condições de desenvolvimento e ambientais . Há vários estágios identificáveis no desenvolvimento da planta de milho. Os estágios são definidos como estágios vegetativos (V) e reprodutivos (R). As subdivisões dos estágios V são numericamente designadas como VI, V2, V3, etc. até V(n) onde (n) representa o último estágio da folha antes de formar o pendão (VT) e o primeiro estágio V é o estágio de emergência (VE) . Por exemplo, VE é a emergência do solo de uma folha de broto, VI representa a primeira folha verdadeira, V2 representa a segunda folha, etc. Os estágios reprodutivos incluem o primeiro aparecimento de seda até à semente madura e são representados como segue: RI é a parte sedosa, R2 representa o cobrimento de folhas, R3 representa o estágio leitoso, R4 é o estágio de pasta, R5 é o estágio ao dente e R6 ê a maturidade fisiológica (ver, por exemplo, Ritchie SW et al. (1986) How a Corn Plant Develops, lowa State University of Science and Technology Cooperative Exension Service, Ames, IA 48: 1-21).
Qualquer tipo de tecido vegetal pode ser utilizado como um tecido alvo para a identificação de genes e sequências reguladoras associadas incluindo mas não se limitando a 36 sequências promotoras. Para a presente invenção, utiliza-se tecido de milho. Mais preferencialmente, tecidos embriogé— nicos de milho ou de calo de milho são os tecidos alvo para a identificação de sequências promotoras. As bibliotecas de ADNc de milho são construídas a partir de tecido embrionário isolado de milho, vinte e um dias após a polinização (21-DAP.) e trinta dias após a polinização (13-DAP) e tecido de calo de milho do Tipo II.
Qualquer processo qge permita uma comparação diferencial entre os diferentes tipos ou classes de sequências pode ser utilizado para isolar os genes ou as sequências reguladoras de interesse. Por exemplo, num processo de uma abordagem de triagem diferencial, pode-se. preparar uma biblioteca de ADNc, a partir ARNm de um tecido particular, num hospedeiro bacteriófago, utilizando um kit de elonagem comercialmente disponível. As placas são espalhadas em placas contendo camadas de um hospedeiro bacteriano tal como E. coli para gerar placas de bacteriófagos. Cerca de 105-106 placas podem ser suspensas apenas em membranas de ligação de ADN. As membranas duplicadas são sondadas utilizando sondas geradas de ARNm dos tecidos alvo e não alvo ou de um tecido antecedente. As sondas são marcadas para facilitar a detecção depois da hibridação e desenvolvimento. As placas que hibri-dam com as sondas.derivadas de tecidos alvo mas não hibridam com as sondas derivadas de tecido não alvo que apresentam um padrão diferencial desejado de.'expressão podem ser seleccio-nadas para análise posterior. As bibliotecas de ADN genómico podem também ser preparadas a partir de uma espécie seleccionada por diges-tão parcial com uma enzima de restrição e seleccionando o tamanho dos fragmentos de ADN dentro de um intervalo de dimensão particular. 0 ADN genómico pode ser. clonado num vector adequado incluindo mas não se limitando a um bacteriófago e preparado usando um kit 37 adequado como anteriormente descrito (ver, por exemplo, Stratagene, La Jolla, CA ou Gibco BRL Gaithersburg, MD).
As técnicas de hibridação diferencial, tal como descritas,. são bem conhecidas pelos especialistas na matéria e podem ser utilizadas para isolar uma classe desejada de sequências. Por classes de sequências, como aqui utilizado, entende-se sequências que podem ser agrupadas com base num identificador comum incluindo, mas não se limitando a sequências isolados de. um tipo de tecido da planta alvo comum, .de uma biblioteca comum ou de uma planta comum. Num enquadramento preferido, as sequências de interesse são identificadas com base nas análises de sequências e no exame de uma colecção dé diversas sequências de ADNc de diversas de bibliotecas de tipos de tecido diferentes. 0 processo descrito fornece um exemplo de um processo de triagem diferencial com. base nas análises de sequência, electrónica de MSEs. de.· planta'derivados de diversas bibliotecas de ADNc. Vários dos processos utilizados para avaliar a expressão de genes baseiam-se na medição do nivel de. ARNm numa amostra de órgão, tecido ou célula. Os processos típicos incluem mas não se limitam a manchas de ARN, en-saios de proteção de ribonucleáse· e TI-RCP. Noutroenqua-dramento preferido, utilizasse: um processo' de alto rendimento onde as sequências .reguladoras são' identificadas a partir de um processo de realização do perfil da transcrição. 0 desenvolvimento da tecnologia de microarranjo de ADNc ! permite a monitorização sistemática de perfis de expressão de genes para milhares .de genes (Schena et a'1. , Science, 270: 467, 1995) . Esta tecnologia com base. em fragmentos de ADN arranja milhares de sequências de ADNc numa superfície de suporte.. Estes arranjos são simulta-neamente hibridados com um múltiplo de , sondas de ADNc marcadas preparadas a partir de amostras de ARN de dife- 38 rentes tipos de célula e de tecidos, permitindo a análise comparativa directa da expressão. Esta tecnologia foi primeiro demonstrada analisando 48 genes de Arabidapsis para a expressão diferencial em raízes e brotos (Schena et al, Science, 270: 467, 1995). Mais recentemente, os perfis de expressão de mais do que 1400 genes foram monitorizados utilizando microensaios de ADNc (Ruan' et al, The Plant Journall5: 821, 1998). Os microensaios fornecem um processo de rendimento alto, quantitativo e reprodutível para analisar, a expressão dos genes e caracterizar a função ' de gene. 0 processo ,.de perfilagem do transcripto utilizando microensaios, fornece assim outra ferramenta valiosa para o isolamento de sequências reguladoras- tais como promotores associados com aqueles genes. ·'. A presente invenção utiliza análises de sequências de rendimento alto para formar a fundação da identificação rápida corri base no computador, de sequências de'interesse. Os especialistas na matéria estão atentos aos recursos disponíveis para às análises de sequências. As comparações de sequências podem ser empreendidas'determinando a similaridade da sequência de ensaio ou de exame com sequências em bancos de dados publicamente disponíveis ou particulares ("análise de similaridade") ou pesquisando certos motivos ("análise de sequência intrínseca") (por exemplo, elementos cis) (Coulson, Trends in Biotechnology, 12: 76, 1994; Birren, et al., Genome Analysis, 1: 543, 1997).
As sequências de nucleótidos fornecidas na SEQ ID N°: 38 ou os seus fragmentos ou os seus complementos ou uma sequência de nucleótidos pelo menos 90 % idêntica, preferencialmente 95 % idêntica, ainda mais preferencial-mente 99% ou 100% idêntica à sequência dada na SEQ ID ,N°:· 38 ou os seus fragmentos ou os seus complementos podem ser- "providencia- 39 dos" numa variedade de meios para facilitar a sua utilização. 'Um tal meio pode também providenciar um. seu sub-conjunto numa' forma que permite a um especialista na matéria examinar as sequências.
Numa aplicação deste enquadramento, póde-se registar uma sequência de nucleótidos da presente invenção num meio legível em computador. Tal como se utiliza aqui, "meio legível em computador" refere-se a qualquer meio que possa ser lido e a que se possa aceder directamente por meio de um computador. Tais meios - incluem, mas não se limitam a: meios de armazenagem magnética, tais como discos flexíveis, discos rígidos, meios de armazenagem e fita magnética; meios de armazenagem óptica tais como CD-ROM; meios de armazenagem electrónicos tais como RAM e .ROM; e híbridos destas categorias tais como meios de armazenagem' magnéticos/ópticos. Um especialista na técnica pode facilmente apreciar como qualquer um dos meios legíveis por computador presentemente conhecidos pode ser utilizado para criar- um produto, compreendendo um meio legível por computador tendo nele registada uma sequência de nucleótidos da presente invenção.
Fornecendo uma ou mais sequências de nucleótidos da presente invenção, os especialistas na. técnica podem, por rotina, aceder à informação de sequências para uma variedade de propósitos. As sequências podem ser analisadas, por. vários processos tais como mediante a análise das,sequências sem a. ajuda de um software desenvolvido para esse efeito. 0 software de computador está também publi-camente disponível o que permite a um especialista na técnica avaliar a informação da sequência fornecida num meio legível em computador. Exemplos de bases de dados públicas podem incluir, mas não se' limitam à Base- de Dados de ADN do Japão (DDBJ) (http://www.ddbj.nig.ac.jp/); Genebank 40 (http://www.ncbi.nlm.nih.gov./ web/Genbank/Index.html); e ao Banco de Dados Europeu de Sequências de Ácidos Nucleicos do Laboratório de Biologia Molecular (EMBL) (http:// www.ebi.ac.uk/ebi_docs/embl_db.html) ou as suas versões. Vários algoritmos de pesquisa diferentes têm sido desenvolvidos, incluindo, mas não se limitando ao conjunto de programas referidos como programas de BLAST. Existem cinco implementações de BLAST, três desenvolvidas para exames de sequências de nucleótidos (BLASTN, BLASTX e TBLASTX) e duas desenvolvidas para exames de sequências de proteínas (BLASTP e TBLASTN) (Coulson, Trends in Biotechnology, 12: 76-80, 1994; Birreh, et al., Genome Analysis, 1: 543, 1997).
Quaisquer- programas desenvolvidos para pesquisar elementos também têm utilidade'- na presente invenção. Os programas de análise de sequências desenvolvidos para pesqui-sar elementos podem ser utilizados para a- identificação de elementos cis. Os programas de computador preferidos podem incluir mas não se limitam a MEME,. SIGNAL SCAN e GENESCAN. Meme é um programa que identifica elementos conservados (quer ácidos nucleicos quer péptidos) num grupo de sequências não alinhadas. Meme guarda estes elementos como um conjunto de perfis. Estes perfis podem ser utilizados para pesquisar uma base de dados de sequências. Um algori-tmo de MEME (versão 2.2) pode sér encontrado na versão 10.0 do pacote de GCG; MEME (T. Bailey e CA. El.kan, Machine Learning,. 21 (1-2) : 51- 80, 1995 e o endereço do website é o seguinte: (http://www.sdsc.edu/MEME/meme/website/ COPYRIGHT. html. ) . 0 SignalScan é um programa que identi
fica elementos conhecidos nas sequências, de ensaio utilizando a informação de outras bases de dados de elementos (Prestridge, D. S., CABI0S 7, 203-206 (1991) . A informação de SignalScan na versão 4.0 está disponível no website que se segue: http://biosci.cbs.umn.edu/software/sigscan.html. O 41 site ftp para o Signal Scan é
ftp://biosci.cbs.umn.edu/software/sigscan.html. As bases de dados. utilizadas com Signal Scan incluem PLACE (http://www.ADN.affrc.go.ip/htdocs/PLACE (Higo et al., Nucleic Acids; Research 27 (1): 297-300 (1999) e TRANSFAC (Heinemeye, X. et al., Nucleic Acid Research 27 (1): 318-322) que pode ser encontrado no seguinte website: http://transfac.gbf.de/. 0 GeneScan é outro programa adequado para a pesquisa de elementos (Burge·, C e Karlin, S. J. Mol. Biol. 268, 78-94 (1997) e a informação da versão 1.0 está disponível no. .seguinte website: http://gnomic.stanford.edu/GENESCANW.html. Tal como se utiliza aqui, "um elemento estrutural alvo" ou "elemento alvo" refer'e-se. a qualquer sequência ou combinação 'racionalmente seleccionadas de sequências, em que a(s) sequência(s) se escolhem com base numa configuração, tridimensional que é formada na dobra do elemento alvo. Há uma variedade de elementos alvo conhecida dos especialistas na técnica. Os elementos alvo da proteína incluem mas não se limitam a sítios activos enzimáticos é sequências de sinais. Os elementos alvos preferidos da presente invenção devem incluir mas não se limitam a sequências de promotores, elementos de eis, estruturas semelhantes a um gancho de cabelo e outros elementos de expressão como sequências de ligação de proteína.
Tal como se utiliza aqui, "meios.de pesquisa",' refere-se a um ou mais programas que são implementados num sistema com base em computador para comparar uma sequência alvo ou elementos estruturais alvo com a informação da sequência armazenada no meio de armazenagem de dados. Tais meios de pesquisa são utilizados para identificar fragmentos ou regiões das sequências da presente invenção que ligam uma sequência' alvo particular ou um elemento alvo. Também, as 42
sequências múltiplas podem ser comparadas para identificar regiões ou elementos comuns que possam ser responsáveis por funções especificas.: Por exemplo, os elementos eis ou os domínios de. sequências que conferem um perfil de expressão específico podem ser identificados quando as regiões de promotores múltiplos de classes semelhantes de promotores estiverem alinhadas e forem analisadas através de certos pacotes de software. A presente invenção também tem por objecto sistemas, particularmente sistemas com base em computador, que contêm a informação dé sequências aqui descrita. Tal como utili-zado aqui, um "sistema com base em computador" refere-se aos meios de hardware, meios de software e meios de armazenamento de dados para analisar a informação de se-quências de nucleótidos da presente invenção.. Os meios de hardware mínimos dos. sistemas , com base em computador da presente invenção compreendem uma unidade de .processamento central (CPU), meios de. entrada, meios de saída e .meios de armazenamento de dados. Os especialistas na técnica podem apreciar que qualquer tipo de sistemas com base em computador disponível é' adequado para uso na presente invenção e de modo que os programas forneçam um meio eficaz para a análise de dados da sequência comparada com análise por inspeção das sequências sem a ajuda dos sistemas com base em computador..
As SEQ ID N°s: 6-35 são iniciadores desenvolvidos a partir das sequências de ADNc identificadas a partir das .comparações de sequências com base em computador. Estas sequências são utilizadas para expandir a sequência de ácidos nucleicos utilizando "as técnicas' de amplificação por reacção em cadeia de polimerase (PCR) (ver, por exemplo', Mull-is. et al., Cold . Spring Harbor. Symp. Quant. Biol. 51: 263., 1986; . 43
Erlich, et al., Pedido de Patente, de invenção Europeia 50.424; Pedido de Patente de invenção Europeia. 84.796, Pedido de Patente de invenção Europeia. 258.017, Pedido de Patente de invenção Europeia. 237.362; Mullis, Pedido de Patente de invenção Europeia. 201.184; Mullis, et al., Patente de invenção, norte-americana U.S. N° 4.683.202; Erlich, patente de invenção norte-americana U.S. N° 4.582.788; e Saiki, et al., Patente de invenção norte-americana U.S. N° 4.683.194). Vários processos de amplificação por PCR são conhecidos dos especialistas na técnica e são utilizados para identificar sequências de ácidos nucleicos adjacentes a uma sequência conhecida. Por exemplo, processos de RCP inversa (RCPI) foram descritos para ampliar sequências de ADN desconhecidas, adjacentes a uma região do núcleo, da sequência conhecida. Outros processos também estão disponíveis como RCP por captura (Lagerstrom M., et al., PCR Mèthods Applic. '1;· 111, 1991,. e PCR de triar (Parker, JD et al., Nucleic Acids Res 19: 3055, 1991). Vários fabricantes também desenvolveram kits com base em modificações destes processos com â finalidade de identificar sequências de interesse. Avanços técnicos incluindo melhorias no desenvolvimento do iniciador e do adaptador, melhorias na enzima de polimerase e capacidades do termociclizador facilitaram processos mais rápidos e eficazes para isolar as sequências de interesse. . Num enquadramento preferido, as sequências de flan-queio que contêm os elementos reguladores 5' da presente invenção são isoladas utilizando um processo de triar o genoma (Universal GenomeWalker™ Kit, CLONTECH Laboratories, Inc., Paio, Alto, CA). Em resumo, o ADN genómico purificado é submetido-a uma digestão pela enzima de restrição que produz fragmentos de ADN genómicos com extremidades que estão ligadas aos adaptadores de GenomeWalker™. Os inicia-dores de 44
GenomeWalker™ são utilizados junto com os inicia-dores específicos de gene em duas reações consecutivas de RCP (reações de RCP primárias, e de inclusão) para produzir produtos de RCP que contêm as sequências reguladoras de 5' que são subsequentemente clonadas e sequenciadas.
Além do seu uso na modulação da expressão de genes, as sequências promotoras da presente invenção também têm utilidade como sondas ou iniciadores em experiências de hibri-dação de ácidos nucleicos. As sondas e os iniciadores de ácidos nucleicos da presente invenção podem hibridizar, em condições severas, com uma sequência de ADN alvo. A expressão "condições de hibridação severas" é definido como as condições sob as quais uma sonda ou um iniciador hibrida especificamente com uma sequência alvo e não com sequências não alvo, como se pode determinar empiricamente. A ex-pressão "condições severas" é funcionalmente referida em relação, à hibridação de uma sonda de ácido nucleico com um ácido nucleico alvo (isto é, com uma sequência particular de ácidos nucleicos de interesse) pelo- procedimento de hibridação especifico debatido em Sambrook et al., 1989, em 9.52-9.55. Ver também Sambrook et al., 1989 em 9.47-9.52, 9.56-9.58; Kanehisa, 'Nucl. Acids Res. 12: 203-213, 1984; e Wetmur e Davídson, J. Mol. Biol. 31: 349-370, 1968. As- condições severas apropriadas que promovem a hibridação de ADN são, por exemplo, 6,0 x cloreto de sódio/citrato de sódio (SSC) a cerca de 45 °C, seguido de uma lavagem com 2,0 x SSC a 50 °C, são conhecidas pelos especialistas na técnica ou podem ser encontrados em Current Protocols in Molecular Biology, John Wiley & Sons, N. Y, 1989, 6.3.1-6.3.6. Por exemplo, a concentração de sal na etapa de lava-gem pode ser seleccionada a partir de uma severidade baixa de cerca de 2,0 x SSC a 50 °C até a uma severidade alta de cerca de 0,2 x SSC a 50 °C. Além disso, a temperatura na etapa de lavagem pode 45 ser aumentada desde condições de baixa severidade à temperatura ambiente, de cerca de 22 °C, até a condições de severidade elevada, a aproximadamente 65 Tanto a temperatura como o sal podem variar ou a tem-peratura ou a concentração do sal podem ser mantidas constantes enquanto a outra variável vai variando.
Por exemplo, a hibridação utilizando sondas ou iniciadores de ADN ou de ARN pode ser executada a 65 °C em 6x SSC, 0,5 % SDS, 5 x Denhardfs, 100 pg/mL de ADN não especifico (por .exemplo, ADN de esperma de salmão submetido a ultra-sons) com lavagem com 0,5 x SSC, 0,5 % SDS a 65 °C, para severidade elevada.
Considera-se que condições de hibridação de severidade mais baixa tais como menor hibridação e/ou temperaturas de lavagem· mais baixas podem ser usadas para identificar sequências relacionadas tendo um grau mais baixo de similaridade de sequências se a especificidade de ligação da sonda ou do iniciador à(s) sequência(s) alvo for preser-vada. Consequentemente, as sequências de nucleótidos da presente invenção podem ser utilizadas pela sua capacidade de, selectivamente, formarem moléculas duplex com alon-gamentos complementares de fragmentos de ADN. A detecçâo de segmentos de ADN através da hibridação é bem conhecida pelos especialistas na técnica e dessa forma, dependendo da aplicação visada, será desejável utilizar condições de hibridação variáveis para alcançar graus diferentes de selectividade da sonda face à sequência alvo e o processo de escolha dependerá dos resultados desejados.
As sequências de ácidos nucleicos na SEQ ID N°: 38 e qualquer uma das suas variantes são capazes de hibridar com outras sequências de ácidos nucleicos em condições de seve- 46 ridade apropriadamente seleccionadas. Tal como se utiliza aqui, diz-se que duas moléculas de ácido nucleico são capazes de hibridar especificamente uma com outra se as duas moléculas forem capazes de formar uma estrutura de ácido nucleico de filamento duplo anti-paralelo. Diz-se que uma molécula de ácido nucleico é o "complemento" de outra molécula de ácido nucleico se elas apresentarem uma complementaridade completa. Tal como se utiliza aqui, diz-se que as moléculas apresentam "complementaridade completa" quando cada nucleótido de . uma das moléculas é complementar de um nucleótidos da outra. Diz-se que' as duas moléculas são "complementarmente mínimas" se elas puderem hibridar uma com a outra com uma estabilidade suficiente para permitir que elas permaneçam ligadas .uma .à outra pelo menos em condições convencionais de "baixa severidade". Similar-mente, as moléculas dizem-se "complementares" se elas pude-rem hibridar uma com a outra com uma estabilidade suficien-te para lhes permitir que permaneçam unidas uma à outra em condições convencionais de "alta severidade". As condições convencionais de severidade- estão descritas pôr Sambrook, et al., Molecular Cloning, A Laboratory Manual, 2 a Ed., Cold Spring Harbor Press, Cold Spring Harbor, Nova Iorque, 1989 e por Haymes et al., Nucleic Acid Hybridization, A Practical Approach, IRL Press, Washington, DC, 1985.
Num enquadramento preferido, a sequência de ácidos nu-cleicos, SEQ ID N°: 38 ou um fragmento, região, elemento cis ou oligómeros destas sequências, podem ser utilizados em ensaios de hibridação de outros tecidos de plantas para identificar genes intimamente relacionados ou homólogos e sequências reguladoras associadas. Estes ensaios incluem mas não se. limitam a ensaios de hibridação Southern ou Northern em qualquer substrato, que inclui, mas não se limi-ta a um tecido de planta apropriadamente preparado, celulo-se, nylon ,47 ou um filtro de combinação, um fragmento ou uma lâmina de vidro. Tais metodologias são. bem conhecidas na técnica e estão disponíveis em um kit ou preparação que pode ser fornecida por vendedores comerciais. É claro que os fragmentos também podem ser obtidos através de outras técnicas como' por sintetização directa do fragmento por meios químicos, como é normalmente praticado utilizando um sintetizador automatizado de oligonucleóti-dos. Os fragmentos também podem ser obtidos por aplicação da tecnologia de .reprodução de ácidos nucleicos, tal como a tecnologia de PCR™ (reacçãò em cadeia de polimerase) através de técnicas de ADN recombinante geralmente conhe-cidas por especialistas na técnica da biologia molecular. No que respeita à amplificação de uma sequência alvo de ácidos nucleicos (por exemplo, por RCP) utilizando um par de iniciadores de amplificação particulares, "condições de RCP severas" referem-se às condições que permitem que o par de iniciadores hibríde somente com a sequência de ácidos nucleicos à- qual se pode ligar um iniciador que comporta a sequência do tipo .selvagem correspondente (ou o seu complemento) e preferencialmente para produzir um produto de amplificação único.
Um fragmento de um ácido nucleico, tal como se utili-za aqui, refere-se a qualquer parte do ácido nucleico que não tem o comprimento completo. ' Um fragmento pode também compreender pelo menos um comprimento mínimo capaz de hibridar especificamente com um ácido nucleico original, em condições de hibridação severas, como' acima definido. A extensão de um tal fragmento mínimo é preferencialmente de pelo menos 8 nucleótidos contínuos, mais preferencialmente 15 nucleótidos contínuos, ainda mais preferencialmente pelo menos 20 nucleótidos contínuos e mais preferencialmente pelo 48 menos 30 nucleótidos contínuos de uma sequência de ácidos nucleicos natural.
As sequências de ácidos nucleicos da presente invenção podem também ser utilizadas como sondas e iniciadores. As sondas e os iniciadores dos ácidoa nucleicos podem ser preparadas com base numa sequência original de genes. Uma "sonda" é um ácido nucleico isolado ao qual está ligada uma molécula de marcação ou repórter detectável convencional, por exemplo, um isótopo radioactivo, ligando, agente qui-mioluminescente ou enzima. Os "iniciadores" são ácidos nucleicos isolados que estão ligados a uma hélice de ADN alvo complementar, por hibridação do ácido nucleico para formar um híbrido entre o iniciador e a hélice de ADN alvo, depois estendido ao longo . da hélice de ADN alvo por meio de uma polimerase, por exemplo, uma polimerase de ADN. Os pares de iniciadores podem ser usados para amplificação de uma sequência, de ácidos nucleicos, por exemplo, pela reacção em cadeia de polimerase (RCP) ou outros processos convencionais de amplificação de ácidos nucleicos.
As sondas e os iniciadores têm em geral 15 nucleótidos ou mais de comprimento, preferencialmente 20 nucleótidos ou mais, mais preferencialmente 25 nucleótidos, e mais preferencialmente 30 nucleótidos ou mais. Tais sondas e iniciadores hibridiam especificamente com uma sequência natural de ADN ou de ARN alvo, em condições de hibridação de alta severidade e que hibridam especificamente com uma sequência original alvo, de outras espécies, em condições de severidade mais baixa. Preferencialmente, as sondas e os iniciadores, de acordo com a presente invenção, têm simila-^ridade da sequência' completa com a sequência natural, embora as sondas que diferem da sequência original e que retenham a capacidade de hibridar com as sequências origi-nais alvo possam ser construídas por 49 processos convencio-nais. Os processos para preparar e utilizar as sondas e os iniciadores estão descritos, por exemplo, em Molecular Cloning: A Laboratory Manual, 2a ed., vol. 1-3, ed. Sambrook et al., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989 (doravante, "Sambrook et al-, 1989"); Current Protocols in Molecular Biology, ed. Ausubel et al., Greene Publishing and Wiley-Interscience, Nova Iorque, 1992 (com atualizações periódicas) (doravante, "Ausubel et al-, 1992); e Innis et al·., RCP Protocols: A Guide to Methods and Applications, Academic Press, San Diego, 1990. Os pares de iniciadores de RCP podem ser deri-vados de uma sequência conhecida, por exemplo, utilizando programas de computador desenhados com esse fim tal como o Primer (Versão 0,5, ©. 1991, Whitehead Instituite for Biomedical R.esearch, Cambridge, MA). Os iniciadores e as sondas com base nas sequências de promotores naturais aqui descritas podem ser utilizados para confirmar e, se necessário, para modificar as sequências descritas, por processos convencionais, por exemplo, por re-clonagem e re-sequenciação.
Num outro enquadramento, as sequências de nucleótidos dos promotores aqui descritos podem ser modificadas. Os especialistas na técnica podem criar moléculas de ADN que têm variações na sequência de nucleótidos. As sequências de nucleótidos da presente invenção, como se mostra na SEQ ID N°: 38 podem ser modificadas ou alteradas para melhorar as suas caracteristicas de controlo. Um processo preferido de alteração de uma sequência de ácidos nucleicos consiste em usar RCP para modificar nucleótidos seleccionados ou regiõ-es de sequências. Estes processos são conhecidos pelos especialistas na técnica. As sequências podem ser modificadas, por exemplo, mediante inserção, eliminação ou substituição de sequências matriz, num processo de modificação de ADN com base em RCP. As "variantes" de moléculas de ADN são 50 moléculas de ADN contendo alterações em que um ou mais nucleótidos, de uma sequência original, são eliminados, adicionados e/ou substituídos, preferencialmente ao . mesmo tempo, mantendo praticamente a função de promotor. No caso de um fragmento promotor, a "variante" de ADN . pode incluir alterações que afectam a transcrição de um promotor mínimo ao qual ele está operacionalmente ligado. As variantes de moléculas de ADN podem ser produzidas, por exemplo, median-te técnicas de mutagénese do ADN padrão ou sintetizando quimicamente a molécula variante de ADN ou uma parte desta.
Num outro enquadramento, as sequências de nucleótidos, como se mostra na SEQ ID N° : 38 incluem sequências de qualquer comprimento que são capazes de regular uma sequência de ADN operacionalmente ligada. Por exemplo, as sequências tal- como a descrita na' SEQ ID N°: 38 podem ser truncadas ou, eliminadas e ainda mantêm a capacidade de regular a transcrição de uma sequência de ADN ligada operaci-onalmente. Num enquadramento relacionado, um elemento cis das sequências descritas pode conferir uma especificidade particular tal como conferir uma maior expressão de .sequências de ADN operacionalmente ligadas em tecidos embriogé-nicos ou do calo e, portanto, é também capaz de regular a transcrição. Consequentemente, quaisquer fragmentos da sequência, partes ou regiões das sequências descritas podem ser utilizados como sequências reguladoras, incluindo, mas não se limitando a elementos ou motivos cis. Por exemplo, um ou mais pares de bases podem ser eliminados da extremi-dade 5' ou da 3' de uma sequência de promotores, para produzir um promotor "truncado". Um ou mais pares de bases podem ser também inseridos, eliminados ou substituídos internamente com. uma sequência de promotores. Os promotores podem ser construídos de modo que os fragmentos do promotor ou os seus estejam operacionalmente ligados, por exemplo, colocando um tal fra- 51 gmento a montante de um promotor mínimo. Um promotor mínimo ou básico é uma parte do ADN que é capaz de captar e ligar-se ao mecanismo de transcrição básico. Um exemplo do mecanismo de transcrição básica em células eucarióticas é o complexo de polímero II de ARN e suas proteínas adicionais. Os componentes enzimáticos do mecanismo de transcrição básica são capazes de iniciar e de alongar a transcrição de um dado gene, utilizando um. promotor mínimo ou básico. Quer dizer, não há nenhuma adição de sequências de acção cis na região do promotor que- seja capaz de captar e de, ligar factores de transcrição que modulam a transcrição, por exemplo, intensificam, reprimem, tornam a transcrição dependente de hormonas, etc. As substituições, eliminações, inserções ou qualquer combina-ção destas podem ser combinadas para produzir uma estrutura final.
Os. ácidos nucleicos. naturais ou sintéticos, de acordo com a presente invenção,, podem ser incorporados nas estruturas de ácidos nucleicos recombinantes, normalmente, estruturas de ADN, capazes de se introduziro e replicar numa célula hospedeira. Num enquadramento preferido, as sequências de nucleótidos da presente invenção, tal como se mostra na SEQ ID . N°: 38 ou os seus fragmentos, variantes ou derivados são incorporadss numa cassete de vector de expressão que inclui as regiões do promotor da presente invenção ligadas operacionalmente a um componente genético tal como um gene marcador seleccionável, rastreável ou classificável. As sequências de ácidos nucleicos da presen-te invenção descritas, estão, de preferência, operacional-mente ligadas a um componente genético tal como um ácido nucleico que confere uma característica desejável associada à morfologia, fisiologia, crescimento e desenvolvimento da planta, rendimento, intensificação nutricional, resistência a doenças ou a pragas ou tolerância ambiental ou química. Estes 52 componentes genéticos, tais como os genes marcadores ou os genes agronómicos de interesse podem funcionar na identificação de uma célula de planta ou de uma planta transformadas ou podem produzir um produto de utilidade agronómica. As sequências de promotores da presente invenção podem ser. utilizadas para regular a expressão de qual-quer sequência capaz de transcrição, operacionalmente ligada. As sequências capazes de transcrição, operacionalmente ligadas, particularmente preferidas, podem incluir mas não se limitam àquelas sequências que são preferencialmente expressas em tecido(s) embriogénicos(s) ou de calos.
Num enquadramento .preferido, um componente genético produz um produto que serve como um dispositivo de selecção e funciona num tecido' de planta regenerável para produzir um composto que pode conferir, ao tecido da planta,, resistência a um composto de alguma, forma tóxico. Os genes de interesse para se utilizarem como um marcador seleccionável,. rastreável ou classificável podem incluir, mas não se limitam a. GUS (região de codificação para beta-glicuronidase), PFV (sequência de codificação para proteína verde fluorescente), LUX (região de codificação para luciferase) ou genes de tolerância a antibióticos ou a herbicidas. Exemplos de transposões e genes de resistência a antibióticos associados incluem os transposões Tns (bla) , Tn5 (nptll), Tn.7 (dhfr) , penicilinas, canamicina (e neomi-cina, G418, bleomicina); metotrexato (e trimetoprim); clo-ranfenicol; canamicina e tetraciclina.
As características úteis para marcadores seleccionáveis em plantas foram esboçadas num relatório sobre o uso de microorganismos (Advisory Committee on Novel Foods and Processes, Julho de 1994). Icluem a selecção severa com um número de mínimo de tecidos não transformados, grande núme-ro de casos de transformação independente sem interferência 53 significativa com a regeneração, aplicação a um grande número de espécies e disponibilidade de um ensaio para classificar os tecidos no que respeita à presença do marcador. Vários genes marcadores seleccionáveis são conhecidos na técnica e vários marcadores de resistência a antibió-ticos satisfazem estes critérios, incluindo aqueles que são resistentes a canamicina (nptll), higromicina B {aph IV) e gentamicina {aac3 e aacC4). Genes marcadores selecci-onáveis dominantes úteis incluem genes que codificam genes de resistência a antibióticos (por exemplo, resistentes a higromicina, canamicina, bleomicina, G418, estreptomicina ou espectinomicina); e genes resistentes a herbicidas (por exemplo, fosfinotricina acetiltransferase). Uma estratégia útil para a selecção de transformantes para a resistência a herbicidas está descrita, por exemplo, em Vasil, Cell Culture and Somatic Cell Genetics of Plants, Vols. I-III, Laboratory Procedures and Their Applications Academic Press, Nova Iorque, 1984. Os genes marcadores seleccionáveis particularmente preferidos para uso na presente invenção são genes que conferem resistência a compostos tais como canamicina e herbicidas como glifosato (Della-Cioppa et al·., Bio/Technology 5 (6), 1987, patente de invenção norte-americana U.S. 5.463.175, patente de invenção norte-americana U.S. 5.633.435). Também podem ser implementados outros dispositivos de selecção e podem ainda cair dentro do âmbito da presente invenção.
Para a prática da presente invenção, utilizam-se as composições e processos convencionais para preparar e usar os vectores e as células hospedeiras, como debatido, inter alia, em Sambrook et al., 1989). Num enquadramento preferido, a célula hospedeira é uma célula de planta. Vários vectores adequados para a transfecção estável de células de plantas ou 54 para o estabelecimento de plantas transgénicas foram descritos, por exemplo, em Pouwels et al-, Cloning Vectors: A Làboratory Manual, 1985, sup. 1987); Weissbach e Weissbach, Methods for Plant Molecular Biology, Academic Press, 1989; Gelvin et al., Plant Molecular Biology Manual, Kluwer Academic Publishers, 1990; e R. R. D. Croy, Plant Molecular Biology LabFax, BIOS Scientific Publishers, 1993. Por exemplo, os vectores de expressão de plantas podem incluir um ou mais genes de plantas clonados sob o controle de transcrição de sequências reguladoras 5' e 3T. Também podem incluir um marcador seleccionável, como descrito, para seleccionar células hospedeiras que contenham a estrutu-ra. Tais vectores de expressão de plantas também contêm uma região reguladora de promotores (por exemplo, uma região reguladora que controla a expressão indutivel ou constitutiva, regulada de forma ambiental ou do desenvolvimento ou expressão especifica de células ou de tecidos), um. sítio de partida do início da transcrição, um sítio de ligação de ribosoma, um sinal de processamento de ARN, um sítio de terminação de transcrição e um sinal de poliadenilaçâo. Outros tipos de sequências reguladoras visados como componentes genéticos num vector de expressão incluem, mas não se limitam a uma sequência líder não traduzida que pode ser acoplada com o promotor. Num enquadramento- particularmente preferido, a célula hospedeira é uma célula de planta e o vector de expressão da planta compreende uma região de promotor como descrito na SEQ ID N°: 38. Os vectores de expressão de plantas podem também compreender sequências adicionais que incluem, mas não se limitam a sítios de enzimas de restrição que são úteis para os propósitos de clonagem. Vários promotores têm utilidade para a expressão de genes de plantas para qualquer gene de interesse que in-clui, 55 mas não se limita a marcadores seleccionáveis, marca-dores classificáveis, genes para tolerância a pragas, tole-rância a doenças, intensificações nutricionais e qualquer outro gene de interesse agronómico. Exemplos de promotores constitutivos úteis para a expressão de genes de plantas incluem mas não se limitam a promotor de vírus de mosaico de couve-flor (CaMV) 35S que confere expressão constitutiva de alto nível na maioria dos tecidos de plantas {ver, por exemplo, Odel et al., Nature 313: 810, 1985), incluindo monocotiledóneas (ver, por exemplo, Dekeyser et al., Plant Cell 2: 591, 1990; Terada e Shimamoto, Mol. Gen. Genet. 220: 389, 1990); o promotor de nopalina sintase (An et al., Plant Physiol. 88: 547, 1988) e o promotor de octopina sintase (Fromm et al., Plant Cell 1: 977, 1989) e o promotor de vírus de mosaico de escrofulária (VME) (Patente de invenção norte-americana U. S. n°. 5.378.619 é um vector de transformação de planta de borda dupla, bordas de ADN-T . direita (BD) e esquerda (BE), consistindo nos seguintes componentes genéticos: ZM-700267629 é o promotor para a expressão intensificada de embrião Zea mays isolado de uma biblioteca genómica de embriões Zea mays; o intrão I-Zm.Hsp70 é a sequência de intervenção da proteína de choque térmico de milho como descrita nas patentes de invenção norte-americanas U.S. N°s 5.593.874 e 5.859.347, aqui incorporadas como referência na sua totalidade; Ec.GUS:l é a região de codificação para beta-glicuronidase a partir de. E. coli; T-AGRTU.nos é o sinal de terminação do gene de nopalina sintase; P-CaMV.35S é o promotor de CaMV 35S (patente de invenção norte-americana U. S. n°. 5.352.605 aqui incorporada como referência na sua totalidade) .
Uma variedade de promotores de gene de plantas que são regulados em resposta aos sinais ambientais, hormonais, químicos e/ou de desenvolvimento que podem ser utilizados para a expressão de um gene operacionalmente ligado em 56 células de plantas, incluindo promotores regulados por (1) calor (Callis et al., Plant Physiol. 88: 965, 1988), (2) luz (por exemplo, promotor de rbcS-3A de ervilha, Kuhlemeier et al. , Plant Cell 1: 471, 198 9; promotor de rbcS de milho, Schaffner e Sheen, Plant Cell 3: 997, 1991; ou promotor de proteína de ligação de clorofila a/b, Simpson et al., EMBO J. 4: 2723, 1985), (3) hormonas, como um ácido abcísico (Marcotte et al., Plant Cell 1: 969, 1989), (4) ferimento (por exemplo, wunl, Siebertz et al., Plant Cell 1: 961, 1989); ou (5) substâncias químicas como jasmonato de metilo, ácido salicílico ou protectores. Também pode ser vantajoso empregar (6) promotores especí-ficos de órgãos (por exemplo, Roshal et al., EMBO J. 6: 1155, 1987; Schernthaner et al., EMBO J. 7: 1249, 1988; Bustos et al., Plant .Cell 1:. 839, 1989). Os promotores da presente invenção são promotores de plantas intensificados por células embriónicas intensificadas e por tecidos embri-ogénicos que podem ser operacionalmente ligados a qualquer gene de interesse num vector de expressão.
Os vectores de expressão de plantas podem incluir os sinais de tratamento de ARN, por exemplo, intrões, que podem estar posicionados a montante ou a jusante de uma sequência de codificação de polipéptido no transgénio. Além disso, os vectores de expressão podem incluir sequências reguladoras adicionais da região não traduzida 3' dos genes de plantas (Thornburg et al., Proc. Natl. Acad. Sei. EUA 84: 744 (1987); An et al., Plant Cell 1: 115 (1989), por exemplo, uma região terminadora 3' para aumentar a esta-bilidade do ARNm do ARNm, tal como a região terminadora PI-II de batata ou as regiões terminadoras 3' de octopina ou nopalina sintase. As regiões não traduzidas 5' de um ARNm podem representar um papel importante na iniciação da tradução e podem também ser um componente genético num vector de expressão de plantas. Por exemplo, as sequências líderes 5' não traduzidas derivadas de 57 genes de proteína de choque térmico demonstraram intensificar a expressão de gene em plantas (ver, por exemplo, a patente de invenção norte-americana U.S. N° 5.362.865 aqui incorporada totalmente como referência). Estas sequências reguladoras adicionais a montante e a jusante podem ser derivadas de uma fonte que é original ou heteróloga no que respeita aos outros elementos presentes no vector de expressão.
As sequências promotoras da presente invenção são utilizadas para controlar a expressão de genes em, células de plantas. Mais preferencialmente, as sequências de promoto-res são utilizadas piara controlar a expressão de genes em sementes de planta. Ainda mais preferencialmente, as sequências de promotores são utilizadas para controlar a expressão em embriões de plantas. As sequências de promotores descritas são componentes genéticos que fazem parte de véctores usados na transformação de plantas. As sequências de promotores da presente invenção podem ser utilizadas com qualquer plasmido ou vector adequado de transformação de plantas que contém um marcador seleccionável ou rastreável e elementos reguladores associados, como descrito, em conjunto com um ou mais ácidos nucleicos expressos de uma maneira suficiente para conferir um traço particular desejável. Exemplos de genes estruturais adequados de interesse agronómico, visados pela presente invenção, podem incluir, mas não se limitam a um ou mais genes para a tolerância a insectos, como B.t., tolerância a pragas como genes para o controle da doença fúngica, tolerância a herbicidas tal como genes que conferem tolerância a glifosato e genes para melhorias de qualidade como do rendimento, intensificações nutricionais tal como vitamina, óleo e composição de amino-ácidos, tolerâncias ambientais ou de tensão ou quaisquer alterações desejáveis na fisiologia, crescimento, desenvolvimento, morfologia ou produto (s) da planta. 58
Alterhativamente, as sequências de codificação de ADN podem, afectar estes fenótipos codificando uma molécula de ARN não traduzivel. que causa a inibição pretendida da expressão de um gene endógeno, por exemplo, por via de me-canismos mediados por anti-paralelo ou co-supressão (ver, por exemplo, Bird et al., Biotech. Gen. Engin. Rev. 9: 207,1991). 0 ARN também pode ser uma molécula de ARN catalítica (isto é, uma ribozima) tratado por engenharia genética para clivar um produto de ARNm endógeno desejado {ver, por exemplo, Gibson e Shillitoe, Mol. Biotech. 7: 125, 1997). Assim, qualquer gene que produz uma proteína ou um ARNm que expressa um fenótipo ou uma mudança de morfologia de interesse é útil para a prática da presente invenção.
Para além dos elementos ou das sequências reguladores localizados a montante {5') ou dentro de uma sequência de ADN, existem sequências . (3') a jusante que afectam a expressão do gene e assim o termo sequência reguladora, tal como utilizado aqui, refere-se a qualquer sequência de nucleótidos localizada a montante, dentro ou a jusante da sequência de ADN que controla, medeia ou afecta a expressão de um produto de gene em conjunto com o aparelho de síntese de proteínas das células.
As sequências de promotores da presente invenção podem ser modificadas, por exemplo, para a expressão noutros sistemas de plantas. Noutra abordagem, novos promotores quiméricos ou híbridos podem ser desenvolvidos ou construídos por vários processos. Muitos promotores contêm sequências a montante que activam, aumentam ou definem a resistência e/ou a especificidade do promotor (Atchison, Ann. Rev. Cell Biol. 4: 127, 1988). Os genes de ADN-T contêm, por exemplo, caixas "TATA" definindo o sítio de iniciação da transcrição e outros elementos a montante localizados a 59 ♦«f montante dos níveis do sítio de iniciação de transcrição que modulam os níveis de transcrição (Gelvin, In Transgenic Plants, (Kung, S.-D. e Us,R., eds), San Diego: Academic Press, páginas 49-87, 1988) . Um outro promotor quimérico combinou um trímero do activador de octopina sintase (ocs) com o activador de manopina sintase (mas) mais o promotor e reportou um aumento na expressão de um gene repórter (Min Ni et al., The Plant Journal 7: 661, 1995). As sequências reguladoras a montante, da presente invenção, podem ser utilizadas para a construção de tais promotores quiméricos ou híbridos. Os processos para a construção de variantes de promotores da presente invenção incluem, mas não se limitam a combinar elementos de controle de diferentes promotores ou a duplicar partes ou regiões de um promotor (ver, por exemplo, as patentes de invenção norte-americanas U.S. 5.110.732 e 5.097.025). Os especialistas na técnica estão familiarizados com os materiais de fonte padrões que descrevem as condições e procedimentos específicos da produção, manipulação e isolamento de macromoléculas (por exemplo, moléculas de ADN, plasmidos, .etc), geração de organismos recombinantes e a triagem e isolamento de genes, (ver, por exemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, 1989; Mailga et al., Methods in Plant Molecular Biology, Cold Spring Harbor Press, 1995; Birren et al., Genome Analysis: volume 1, Analyzing ADN, (1997); volume 2, Detecting Genes, (1998); volume 3, Cloning Systems, (1999), volume 4, Mapping Genomes, (1999), Cold Spring Harbor, Nova Iorque).
As sequências promotoras da presente invenção podem ser incorporadas num vector de expressão utilizando marca-dores rastreáveis e classificáveis, tal como descrito e en-saiado em análises transientes que fornecem uma indicação de expressão de genes em sistemas de plantas estáveis. Os pro- 60 cessos de ensaios da expressão dos genes em ensaios transientes são conhecidos pelos especialistas na técnica. A expressão transiente de genes marcadores foi reportada usando uma variedade de plantas, tecidos e sistemas forne-cedores de ADN. Por exemplo, os tipos de análises transi-entes podem incluir, mas não se limitam à libertação di-recta do gene através de eletroporação ou bombardeamento de partículas de tecidos em qualquer ensaio de planta tran-siente utilizando qualquer espécie de planta de interesse. Tais sistemas transientes podem incluir, mas não se limitam a protoplastos a partir de culturas de suspensão em trigo (Zhou et al., Plant Cell Reports 12: 612, 1993), eletro-poração de protoplastos de folha de trigo (Sethi et al., J. Crop Sei. 52: 152, 1983), eletroporação de protoplastos preparados a partir de tecido de milho (Sheen, J. The Plant Cell 3: 225, 1991) ou bombardeamento de partículas de tecidos específicos de interesse. A presente invenção abrange o uso de qualquer sistema de expressão transiente para avaliar as sequências reguladoras ligadas operacionalmente aos genes repórteres seleccionados, genes marcadores ou genes agronómicos de interesse. Exemplos de tecidos de planta visados para ensaiar em meio transiente por meio de um sistema apropriado de libertação, podem incluir, mas não se limitam a tecidos de base de folhas, calos, cotiledóneas, raízes, endoesperma, tecido embriogénico, tecido floral, pólen e tecido epidérmico.
Qualquer marcador classificável ou rastreável pode ser usado num ensaio de transientes. Os genes marcadores preferidos para as análises de transientes dos promotores ou das sequências reguladoras 5' da presente invenção, incluem' um gene de GUS (sequência de codificação para beta-glicuronida-se) ou um gene de PFV (sequência de codificação para proteína fluorescente verde). Os vectores de expressão que contêm as 61 sequências reguladoras 51 operacionalmente ligadas a um gene marcador são difundidos para os tecidos e os tecidos são analisados por mecanismos apropriados, con-soante o marcador. As análises quantitativas ou qualita-tivas são utilizadas como uma ferramenta para avaliar o perfil de expressão potencial das sequências de promotor quando operacionalmente ligadas aos genes de interesse agronómico em plantas estáveis. Por fim, as sequências reguladoras 5' da presente invenção são directamente incorporadas nos vectores adequados de expressão de transformação da planta com as sequências reguladoras 5" operacionalmente ligadas aos marcadores seleccionáveis e aos genes de interesse, transformadas em plantas e as plantas estavelmente transformadas e a sua progenia são analisadas no que respeita aô perfil de expressão desejado conferido pelas sequências reguladoras 5'. Os especialistas na té-cnica estão cientes dos vectores adequados para a transfor-mação da planta. Os vectores adequados podem incluir mas não se limitam a Ti-plasmidos desarmado para processos mediados por Agrobacterium. Estes vectores podem conter um marcador de resistência, bordas de 1-2 ADN-T e origens de replicação para E. coli e Agrobacteriumr em conjunto com um ou mais genes de interesse e regiões reguladoras associa-das. Os especialistas na técnica estão cientes que, para processos mediados por várias estirpes de Agrobacterium, estão disponíveis estirpes e processos. Essas estirpes po-dem incluir, mas não se limitam a estirpes de Agrobacterium C58, LBA4404, EHA101 e EHA105. As estirpes particularmente preferidas são estirpes de Agrobacterium tumefaciens. Ou-tros sistemas de libertação de ADN para a transformação de plantas são também conhecidos pelos especialistas na té-cnica e incluem, mas não se limitam a bombardeamento com partículas de tecidos seleccionados de plantas. Outros sistemas de libertação de ADN para a transformação de plantas são também conhecidos pelos 62 especialistas na técnica e incluem, mas não se limitam a bombardeamento com partículas de tecidos seleccionados de plantas, em geral optimizados para o hospedeiro particular da planta com in-teresse.
Exemplos de ácidos nucleicos que podem ser introduzidos pelos processos abrangidos pela presente invenção incluem, por exemplo, sequências de ADN ou genes de outras espécies ou mesmo genes ou sequências que se originam ou estão presentes nas mesmas espécies, mas são incorporados em células receptoras através de processos de engenharia genética em vez das técnicas clássicas de reprodução ou de criação. No entanto, o termo exógeno também se refere aos genes, que não estão normalmente presentes na célula que está a ser transformada ou talvez simplesmente não esteja presente na forma, estrutura, etc., como se verificou no segmento ou gene de ADN em transformação nos ou genes que estão normalmente presentes ainda que se deseje, por exemplo, tê-los sobre-.expressos. Dessa forma, o termo gene ou ADN "exógeno" é suposto referir-se a qualquer gene ou segmento de ADN que seja introduzidos numa célula recepto-ra, independentemente de poder já estar presente um gene similar nessa tal célula.. 0 tipo de ADN incluído no ADN exógeno pode incluir ADN que já está presente na célula da planta, ADN de outra planta, ADN de um organismo diferente ou ADN gerado externamente, tal como uma sequência de ADN contendo uma mensagem anti-paralela de um gene ou uma sequência de ADN que codifica uma versão sintética ou modificada de um gene.
Os vectores de transformação de plantas que contêm as sequências promotoras da presente invenção podem ser introduzidos nas plantas por qualquer processo de transformação de plantas. Existem vários processos para introduzir sequências de ADN em células de planta e são bem conhecidos na técnica. 63
Processos adequados incluem mas não se limitam a infecção bacteriana, vectores cromossómicos artificiais bacterianos binários, libertação directa de ADN (por exem-plo por meio de transformação mediada por PEG, absorção de ADN mediada por dissecaçâo/inibição, eletroporação, agita-çâo com fibras de carboneto de silício e aceleração de partículas revestidas com ADN (revisto em Potrykus, Ann. Rev. Plant Physio'1. Plant Mol. Biol., 42: 205, 1991).
Os processos para transformar especificamente plantas dicotiledóneas utilizam principalmente Agrobacterium tumefaciens. Por exemplo, as plantas transgénicas rereren-ciadas incluem, mas não se limitam a algodão (patentes de invenção norte-americanas U.S. N°s. 5.004.863; 5.159.135; 5.518.908, patente de invenção WO 97/43430), soja (patentes de invenção norte-americanas U.S. N°s. 5.569.834; 5.416.011; McCabe et al., Bio/Technology, 6: 923, 1988; Christou et al., Plant Physiol., 87: 671, 1988); brassicas (patente de invenção norte-americana U.S. N°. 5.463.174) e amendoim (Cheng et al., Plant Cell Rep., 15: 653, 1996).
Processos similares foram reportados na transformação de plantas monocotiledóneas. A transformação e regeneração de plantas utilizando estes processos foi descrita para várias colheitas incluindo mas não se limitando a espargos (Asparagus offcinalis; Bytebier et al., Proc. Natl. Acad. Sei. E.U.A., 84: 5345, 1987); cevada (Hordeum vulgarae; Wan and Lemaux, Plant Physiol., 104: 37, 1994); milho (Zea mays; Rhodes, C. A., et al·., Science, 240: 204, 1988; Gordon-Kamm, et al., Plant Cell, 2: 603, 1990; Fromm, et al., Bio/Technology, 8: 833, 1990; Koziel, et al., Bio/Technology, 11: 194, 1993); aveia (Avena sativa; Somers, et al., Bio/Technology, 10: 1589, 1992); ervas de .pomar (Dactylis glomerata; Horn, et al., Plant Cell Rep., 7 : 469, 1988); 64 arroz (Oryza sativa, incluindo as variedades japonica e indica, Toriyama, et al., Bio/Technology, 6: 10, 1988; 2hang, et al-, Plant Cell Rep., 7: 379, 1988; Luo e Wu, Plant Mol. Biol. Rep., 6: 165, 1988; Zhang e Wu, Theor. Appl. Genet., 76: 835, 1988; Christou, et al. , Bio/Technology, 9: 957, 1991); sorgo (Sorghum bicolor; Casas, A. M., et al., Proc. Natl. Acad. Sei. E.U.A., 90: 11212, 1993); cana-de-açúcar (Saccharum spp.; Bower e Birch, Plant J., 2: 409, 1992); capim-gordura (Festuca arundinacea; Wang, Z. Y. et al., Bio/Technology, 10: 691, 1992); relva (Agrostis palustris;
Zhong et al., Plant Cell Rep., 13: 1, 1993); trigo (Triticum aestivum; Vasil et al., Bio/Technology, 10: 667, 1992; Weeks T., et al. , Plant Physiol., 102: 1077, 1993; Becker, et al., Plant, J. 5: 299, 1994) e alfafa (Masoud, S. A., et al., Transgen. Res., 5: 313, 1996). É óbvio para os especialistas na técnica que se podem utilizar várias metodologias de transformação que podem ser modificadas para a produção de plantas transgénicas estáveis de várias colheitas com interesse.
As plantas transformadas são analisadas para detectar a presença dos genes de interesse e o nível e/ou o perfil de expressão conferidos pelas sequências promotoras da presente invenção. Os especialistas na técnica estão cientes dos numerosos processos disponíveis para a análise de plantas transformadas. Utiliza-se uma variedade de processos para avaliar a expressão de gene e determinar se o(s) gene(s) introduzido(s) está(ão) integrado(s), funcionando apropriadamente e herdaram o que se esperava. Para a presente invenção, os promotores podem ser avaliados determinando os niveis de expressão de genes aos quais os promotores estão operacionalmente ligados. Uma avaliação preliminar da função do promotor pode ser determinada por um processo de ensaio transiente que usa genes repórteres, mas uma avaliação de 65 promotor mais definitiva pode ser determinada a partir da análise de plantas estáveis. Os processos para a análise de plantas incluem, mas não se limitam a análises de mancha de Southern ou Northern, processos à base de RCP, análises bioquímicas, processos de rastreio de fenótipos, avaliações de campo e ensaios de imunodiagnóstico.
Os processos da presente invenção que incluem mas não se limitam à preparação de bibliotecas de ADNc, preparação de bibliotecas genómicas, sequenciação, análise de sequências, tecnologias de RCP, produção de vectores, ensaios transientes e processos de transformação de plantas são bem conhecidos pelos especialistas na técnica e são realizados utilizando técnica padrões ou modificações destas.
Os exemplos que se seguem são incluídos para demons-trar os enquadramentos preferidas da presente invenção. Deve ser entendido pelos especialistas, na técnica que as técnicas descritas nos exemplos que se seguem representam técnicas descobertas pelos requerentes para operar bem na prática da presente invenção.
EXEMPLOS
Seleccionam-se vários tecidos e estágios de desenvolvimento de plantas para a preparação das bibliotecas de milho. Os especialistas na técnica estão cientes das variações na selecção e preparação de tecidos que ocorrem da forma como se prepara a amostra de tecido para o outro. A seguir indicam-se as condições para as bibliotecas alvo. EXEMPLO 1 66
Utiliza-se tecido de embrião de milho de treze dias após a polinização (13-DAP) (biblioteca SATMON033) ou vinte e um dias após a polinização (21-DAP) (biblioteca SATMON017) como o material fonte para as bibliotecas de ADNc de embrião-13-DAP ou embrião-21-DAP, respectivamente. As bibliotecas são geradas a partir do milho (DK604, Dekalb Genetics, Dekalb, Illiniois E.U.A.)· As sementes são plan-tadas a uma profundidade de cerca de 3 cm em terra em vazos de 5,08-7,62 cm (2"-3") contendo meio de crescimento Metro 200 e são transplantadas para potes maiores de 25,4 cm (10") contendo a mesma terra após 2-3 semanas. Aplica-se fertilizante Peters 15-16-17 cerca de 3 vezes por semana após a transplantação, numa intensidade de 15 ppm N. 2-3 vezes durante a vida da planta desde a transplantação até ao florescimento. Adiciona-se um total de cerca de 900 mg de Fe a cada pote duas a três vezes durante o ciclo de vida da planta, desde a transplantação até ao florescimento. As plantas de milho desenvolvem-se em estufas em ciclos de 15 h dia/9 h noite. A temperatura de dia é de aproximadamente 26,66 °C (80 °F) e a temperatura durante a noite é de aproximadamente 21,11 °C (70 °F). A iluminação suplementar é fornecida por lâmpadas de vapor de sódio de 1000 W.
As plantas de milho seleccionadas estão além do estágio V10 e os brotos da espiga prontos para fertilização são colocadas dentro de um saco de papel antes da emergência de barbas para reter o pólen. Treze dias após a polinização (13-DAP) ou vinte e um dias após a polinização (21-DAP) , as espigas são tiradas e os grãos colhidos das espigas. Cada grão é dissecado no embrião e no endoesperma e a camada de aleurona é removida. Após a dissecação, os embriões são congelados em azoto liquido e armazenados a -80 °C até à preparação do ARN. 67
Para a preparação da biblioteca de calo do tipo II de Hl II de regeneração (SATMON025), preparam-se pratos de Petri contendo meio de iniciação de calos. 0 meio contém sais de N6 e vitaminas, 3% de sacarose, 2,3 g/litro de prolina, 0,1 g/litro de hidrolisado de caserna, 2 mg/litro de 2,4-D, 15,3 mg/litro de AgN03 e 0,8% de Bacto-Agar e o meio é ajustado para um pH de 6,0 antes de ser submetido â autoclave. Nos dias 9-11 após a polinização, selecciona-se uma espiga com embriões imaturos medindo aproximadamente 1-2 mm de comprimento. As palhas e barbas são removidas e a espiga quebra-se em partes iguais e coloca-se numa solução de Clorox/Tween 2 0 que se submete à autoclave,. A espiga é lavada com água desionizada e extrai-se cada embrião do grão. Os embriões intactos são colocados em contacto com o meio, com o escutelo virado para cima. Colocam-se vários embriões em cada uma das placas e as placas são incubadas no escuro a 25 °C (todos os ingredientes do meio estão co-mercialmente disponíveis e a maior parte é adquirida à Sigma Chemical Co. St. Louis, MO). 0 tecido do calo friável, de tipo II, formado é transferido para o meio descrito sem AgN03 e sub-cultivado nos dias 7-10. Cerca de 4 semanas após o isolamento do embrião, o calo é escavado das placas e congelado em azoto liquido. 0 tecido colhido é armazenado a -80 °C até à preparação do ARN.
Purifica-se o ARN do tecido colhido usando reagente Trizol disponível na Life Technologies (Gaithersburg, Maryland) praticamente como recomendado pelo fabricante. Purifica-se Poli A + ARN (ARNm) utilizando pérolas magnéticas de oligo dT, praticamente como recomendado pelo fabricante (Dynabeads, Dinal Corporation, Lake Success, Nova Iorque). 68 A construção de bibliotecas de ADNc é bem conhecida na técnica e existem várias estratégias de clonagem. Vários kits de construção de bibliotecas de ADNc estão comercial-mente disponíveis. Utiliza-se o Superscript™ Plasmid System para a síntese de ADNc e o Plasmid Cloning (Gibco BRL, Life Technologies, Gaithersburg, MD), seguindo as condições sugeridas pelo fabricante.
As bibliotecas de ADNc são colocadas em placas em agar BL contendo os antibióticos apropriados para a selecção e são incubadas a 37 °C durante o tempo suficiente para permitir o desenvolvimento de colónias individuais. As co-lónias simples são individualmente colocadas em cada cavidade de uma placa de microtitulação de 96 cavidades contendo líquido BL incluindo antibióticos selectivos. As placas são incubadas durante a noite a aproximadamente 37 °C com agitação suave para promover o desenvolvimento das culturas. 0 ADN do plasmido é isolado de cada clone utilizando kits de isolamento de plasmidos da Qiaprep, utili-zando as condições recomendadas pelo fabricante (Qiagen Inc., Santa Clara, CA).
Os clones de ADN de plasmidos matriz são utilizados para a subsequente sequenciação. Para a sequenciação, utiliza-se o kit de ABI PRISM dRhodamine Terminator Cycle Sequencing Ready Reaction com AmpliTaq® ADN Polymerase, FS (PE, Applied Biosystems, Foster City, CA). EXEMPLO 2
Os promotores são identificados a partir de uma base de dados de sequências de EST derivadas de bibliotecas de ADNc preparadas a partir de vários tecidos de milho inclu-indo células embriónicas e ARNms embriogénicos intensifi-cados de tecido e intensificados de tecidos de calos. As sequências 69 são também utilizadas como sequências de exame face ao banco de dados GenBank que contém sequências previ-amente identificadas e anotadas e pesquisadas por regiões de homologia utilizando os programas BLAST. A selecção de marcadores de sequências expressos (MSEs) para isolamento subsequente do promotor é um reflexo da presença de uma ou mais sequências entre os MSEs representativos de uma amostragem aleatória de uma biblioteca de ADNc individual ou de uma colecção de bibliotecas de ADNc. Para identificar as sequências reguladoras que regulam a expressão de transcrições no embrião de milho, executa-se uma função de sub-estabelecimento, solicitando todos os MSEs encontrados nas bibliotecas do embrião alvo e ausentes ou em menor abundância noutras bibliotecas de EST não alvo no banco de dados. Os MSEs candidatos resultantes sãó submetidos a uma função electrónica do northern em que se evidencia o perfil dé expressão do putativo tecido e os niveis de abundância numa biblioteca para EST. Identificam-se os MSEs alvo com o perfil de expressão de tecido e a abundância desejados e criam-se os iniciadores específicos de gene com base nas sequências de EST identificadas. A classificação do pro-duto refere-se à corespondência em BLAST entre um clone de EST de interesse e uma sequência do GenBank. A abundância percentual refere-se ao número de vezes que os membros de um grupo de sequências expressas relacionadas aparecem numa biblioteca donde deriva MSE. Pode-se realizar o número de exames que se entender para se obter os MSEs desejados e dependerá do banco de dados de MSE e dos programas de computador disponíveis para análise das sequências. Para a presente invenção, as sequências são identificadas pela selecção dos valores desejados para a abundância relativa, severidade e/ou pontuação do produto. Para as sequências promotoras das SEQ ID N°s: 36-51, selecciona-se uma abundância alvo > 1 com uma base < 0, uma severidade > 50 e uma pontuação do produto de á 100. 70
As IDs de clones para as sequências MSE de interesse que representam os ADNcs com o perfil de expressão desejado são identificadas com base nestes exames de banco de dados. 0 quadro 1 fornece uma informação de ID do clone de base' (MSE), fontes de bibliotecas e informação de identificações do GenBank (gi) para os MSEs utilizados para o isolamento subsequente das sequências de promotor das SEQ ID N°s: 36-51. A anotação da sequência é listada para as IDs do clone com base numa pesquisa de BLAST do GenBank com um corte de valor p de 10“8. A informação é submetida à alteração à medida que novas sequências são submetidas aos bancos de dados de sequências. As anotações para os MSEs estão listadas como se segue com a informação, da anotação entre parêntesis:. Clone 700614347 (gene de proteína especifica de embrião de Oryza sativa subsp. Indica (Ose731) cds completo); Clone 700257959 (ARNm de proteína semelhante a globulina' Oryza sativa, clone Ose709, cds parcial); Clone 700265029 (ARNm de de 1-fosfato sintase de mio-inositol de Zea mays, cds completo); Clone 700321659 (ARNm de Zea mays para o grupo de proteína de 3 Lea MGL3); Clone 700616085 (gene de proteína específica de embrião (Ose 731) de Oryza sativa subsp. Indica, cds completo). QUADRO 1. Informação Resumida Do Promotor (Apenas a SEQ ID n° 38 faz parte da presente invenção) SEQ ID N° ID do clone Fonte da biblioteca Identificação do GenBank (gl) 71 36 700264271 Embrião, 21-DAP Nenhuma 37 700265872 Embrião, 21-DAP Nenhuma 38 700263624 Embrião, 21-DAP Nenhuma 39 700267629 . Embrião, 21-DAP Nenhuma 40 700258061 Embrião, 21-DAP Nenhuma 41 700614347 Embrião, Embrião, 21-DAP 21-DAP g4105 691 42 .700257959 Embrião, 21-DAP g4097099 43 700265029 Embrião, 21-DAP g3108052 44 700266438 Embrião, 21-DAP Nenhuma 45 700259522 Embrião, 21-DAP Nenhuma 46 700321659 com calo G444044 51 700266176 Embrião, 21-DAP Nenhuma 47 700257969 Embrião, 21-DAP Nenhuma 48 700613864 Embrião, 13-DAP Nenhuma 50 700260279 Embrião, 21-DAP Nenhuma EXEMPLO 3
As bibliotecas genómicas são preparadas a partir de ADN de milho (a partir de milho híbrido .Fr27 x FrMol7) isolado utilizando um protocolo de purificação com CsCl de acordo com Ausubel et al., 1992 ou por um processo de purificação de CTAB (Rogers e Bendich, Plant Mol. Biol., 5: 69 (1985). Os reagentes estão comercialmente disponíveis (por exemplo, na Sigma Chemical Co., St. Louis, MO). As bibliotecas são preparadas de acordo com as instruções do fabricante (GENOME WALKER, é uma marca registada dos CLONTECH Laboratories, Inc, Paio Alto, CA) . Em reacções separadas, o ADN genómico é submetido à digestão de uma enzima de restrição durante a noite, a 37 °C com uma endo-nuclease de terminação abrupta: EcoRV, Seal, Dral, PvuII ou StuI (CLONTECH Laboratories, Inc. Paio Alto, CA) . As mistu-ras reaccionais são extraídas no seio de fenol:clorofór-mio, o etanol precipita e faz-se uma nova suspensão no seio de tampão de Tris-EDTA. Os fragmentos 72 de ADN genómico terminados abruptamente, purificados, são depois ligados aos adaptadores da'GenomeWalker™ e faz-se uma ligação dos fragmentos de ADN resultantes aos adaptadores, de acordo com o protocolo do fabricante. As sub-bibliotecas de GenomeWalker™ são transformadas em aliquotas e armazenadas a -20 °C. O ADN genómico ligado ao adaptador de GenomeWalker™ (anterior) é submetido a um ciclo primário de amplificação de RCP com um iniciador 1 específico do gene (IEGl) e um iniciador que une à sequência do adaptador, iniciador 1 do adaptador (AP1) na SEQ ID N°: 1. Uma aliquota diluída (1:50) da reacção de RCP primária é utilizada como o ADN de entrada para um ciclo de inclusão de amplificação de RCP com o iniciador 2 específico do gene (IEG2) e o iniciador do adaptador (AP2) mostrado na SEQ ID N°: 2, ou 0 iniciador 3 do adaptador (AP3) mostrado na SEQ ID N°: 3. As tempe-raturas de junção do iniciador primário de Genome Walker (APl) e do iniciador de inclusão . (AP2) são 59 °C e 71 °C, respectivamente. Em geral, os iniciadores específicos do gene são criados para ter as seguintes características: 26-30 nucleótidos de comprimento, teor de GC de 40-60 % com temperaturas resultantes para a maior parte dos iniciadores específicos do gene na faixa alta de 60 °C ou· cerca de 70 °C. A polimerase de Taq utilizada é a Amplitaq Gold™, disponível na Perkin-Elmer Biosystems (Branchbury, Nova Jérsei). Vários instrumentos de ciclo de temperatura e- kits de reagentes estão comercialmente disponíveis em vários fabricantes para executar as experiências de RCP e incluem os disponíveis na PE Biosystems (Foster City, CA) , Strategene (La. Jolla, CA) e MJ Research Inc. (Watertown, MA). No seguimento de uma reacção de RCP primária, retira-se uma aliquota (10-15 μΐ) para análise em gel de agarose. Cada aliquota desconhecida é amplificado a partir de 5 bibliotecas sub-genómicas e de um 73 controle negativo (sem ADN).
Os componentes de RCP e as condições estão indicados a seguir: RCP PRIMÁRIA:
Componente Quantidade/volume requerido . i μι 1 μΐ (100 pmole) 1 μΐ 1 μΐ
Aliquotâ da sub-biblioteca
Iniciador 1 especifico do gene
Iniciador 1 de GenomeWalker®1 Adaptador (AP1)
Mistura de dNTP (10 mM de cada dNTP) DMSO 2,5 μΐ (ou 2-5% da concentração final) 10X tampão de RCP (contendo MgCl2) 5 μΐ (concentração final de IX)
Amplítaq Gold®1 0,5 μΐ Água destilada Para um volume da reacção final de 50 μΐ
Condições de reacção para a RCP primária:
A. 9 minutos a 95°C B. 94°C durante 2 segundos, 70°C durante 3 minutos, repetir o ciclo de 94°C/ 70°C para um total de 7 vezes C. .94 °C durante 2 segundos, 65°C durante 3 minutos; repetir o ciclo de 94°C/ 65°C para um total de 36 vezes D. 65°C durante 4 minutos como uma extensão final E. 10°C durante uma incubação alargada. RCP DE INCLUSÃO (reacção de RCP secundária)
Componente Quantidade/volume requerido 74 1 μΐ
Diluição 1:50 da reacção de RCP primária 1 μ1' (100 pmol) 1 μΐ 1 μΐ 1 μΐ 2,5 μΐ
Iniciador 2 especifico do gene Iniciador 2 ou 3 de GenomeWalker™
Adaptador (AP2 ou AP3)
Mistura de dNTP (10 mM de cada dNTP)
DMSO 10X tampão de RCP (contendo MgCl2) 5 μΐ (concentração final de IX)
Amplitaq Gold™ 0,5 μΐ Água destilada para um volume final da reacção de 50 μΐ
Condiçoes de reacção para RCP de inclusão:
A. 9 minutos a 95°C B. 94°C durante 2 segundos, 70°C durante 3 minutos, repetir ciclo de 94°C/ 70°C para um total de 5 vezes C. 94°C durante 2 segundos, 65°C durante 3 minutos; repetir ciclo de 94°C/ 65°C para um total de 24 vezes D. 65°C durante 4 minutos como uma extensão final E. 10°C durante uma incubação alargada .
Para o isolamento da sequência de promotores combina-se a SEQ ID N°: 36 (Clone 700264271), SEQ ID N° : 1 (A) com a SEQ ID N°: 6 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 2 com a SEQ ID N°: 7 nma reacção secundária de RCP.
Para o isolamento da sequência de promotores combina-se a SEQ ID N°: 37 (clone ID 700265872), SEQ ID N°: 1 com a SEQ ID N°: 8 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a, SEQ ID N°: 2 com a SEQ ID N°: 9 numa reacção secundária de RCP. 75
Para o isolamento da sequência de promotores SEQ ID N°: 38 (clone ID 700263624), SEQ ID N°: 1 é combinada com SEQ ID N°: 10 na reacção de PCR primária. Para a reacção de PCR de inclusão SEQ ID N°: 2 é combinada com SEQ ID N°; 11 em uma reacção de PCR secundária.
Para o isolamento da sequência de promotores combinam-se as SEQ ID N°: 39 (clone ID 700267629), SEQ ID N°: 1 com a SEQ ID N°: 12 na reacção primária de RCP. Para a reacção· de inclusão de RCP combina-se a SEQ ID N.°: 1 é combinada com a SEQ ID N°: 13 numa reacção secundária de RCP.
Para o isolamento da sequência de promotores combinam-se as SEQ ID N°: 40 (clone ID 700258061), SEQ ID N°: 1 com a SEQ ID N°: 14 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 2 com SEQ ID N°: 15 numa reacção secundária de RCP.
Para o isolamento da sequência de promotores combinam-se as SEQ ID N°: 41 (clone ID 700614347), SEQ ID N°: 1 com aSEQ ID N°: 16 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 2 com a SEQ ID N°: 17 numa reacção secundária de RCP.
Para o isolamento da sequência de promotores combinam-se as SEQ ID N°: 42 (clone ID 700257959), SEQ.ID N°: 1 com a SEQ ID N°: 18 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 2 com a SEQ ID N°: 19 numa reacção secundária de RCP.
Para o isolamento da sequência de promotores combinam-se as SEQ ID N°: 43 (clone ID 700265029), SEQ ID N°: 1 com a SEQ ID N°: 20 na reacção de primária de RCP. Para a reacção de 76 inclusão de RCP combina-se a SEQ ID N°: 2 com a SEQ ID N°: 21 numa reacção secundária de RCP.
Para o isolamento de sequência de promotores combinam-se as SEQ ID N°: 44 (clone ID 700266438), SEQ ID N°: 1 com a SEQ ID N°: 22 numa reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 2 com a SEQ ID N°: 23 numa reacção secundária de RCP.
Para o isolamento de sequência de promotores combinam-se as SEQ ID N°: 45 {clone ID 700259522), SEQ ID N°: 1 com a SEQ ID : 24 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 2 com a SEQ ID N°: 25 numa reacção secundária de RCP.
Para o isolamento de sequência de promotores combinam-se as SEQ ID N°: 46 (clone ID 700321659), SEQ ID N°: 1 com a SEQ ID N°: 26 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 2 com a SEQ ID N°: 27 numa reacção secundária de RCP.
Para o isolamento de sequência de promotores combinam-se as SEQ ID N°: 47 (clone ID 700257969), SEQ ID N°: 1 com a SEQ ID N°: 28 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 2 com a SEQ ID N°: 29 numa reacção secundária de RCP.
Para o isolamento de sequência de promotores combinam-s.e as SEQ ID N°: 48 (clone ID 700613864), SEQ ID N°: 1 com a SEQ ID N°: 30 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 2 com a SEQ ID N°: 31 numa reacção secundária de RCP.
Para o isolamento de sequência de promotores combinam-se 77 as SEQ ID N° : 49 (clone ID 700260279-PvuII), SEQ ID N°: 1 com a SEQ ID N°: 32 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 3 com a SEQ ID N°: 33 numa reacção secundária de RCP.
Para o isolamento de sequência de promotores combinam-se as SEQ ID N°: 50 (clone ID 700260279-DraI da biblioteca), SEQ ID N°: 1 com a SEQ ID N°: 32 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 3 com a SEQ ID N°: 34 numa reacção secundária de RCP.
Para o isolamento de sequência de promotores combinam-se as SEQ ID N°: 51 (clone ID 700266179), SEQ ID N°: 1 com a SEQ ID N°: 34 na reacção primária de RCP. Para a reacção de inclusão de RCP combina-se a SEQ ID N°: 3 com a SEQ ID N°: 35 numa reacção secundária de RCP. EXEMPLO 4
Os fragmentos de ADN resultantes da amplificação de RCP de inclusão são isolados e purificados em gel. Submete-se uma aliquota de 40 μΐ da RCP secundária a eletroforese num gel de agarose. O fragmento de ADN do produto da RCP secundária é purificado em gel de agarose utilizando o kit BIO101 Geneclean II (Midwest Scientific, Valley Park, MO) seguindo as condições sugeridas pelo fabricante. O ADN purificado é ligado ao vector pGEM-T Easy (pGEM-T Easy Vector SystemI, Promega Corp., Madison, WI) seguindo as condições recomendadas pelo fabricante. Uma aliquota da reacção de ligação é transformada num hospedeiro adequado de E. coli tal como DH10B e as células são colocadas em placas num meio de selecção (para DH10B, 100 μg/ml de carbenicilina). Os transformantes bacterianos são seleccionados, desenvolvidos em cultura líquida e o ADN do plasmido isolado utilizando um 78 kit comercialmente disponível tal como o kit Qiaprep Spin Microprep (Qiagen Corp., Valência, CA). 0 plasmido purificado contendo o tamanho de inserção previsto, com base na análise da enzima de restrição são sequenciados utilizando o processo de terminador de corante em ambas as direções utilizando os iniciadores M13 para frente e em sentido inverso que exibidos na SEQ ID N°: 4 (iniciador para a frente M13) e SEQ ID N°: 5 (iniciador inverso M13). As enzimas de restrição utilizadas também estão comercialmente disponíveis em vários fabricantes (por exemplo, Boehringer Mannheim (Indianapolis, IN). A região de contorno 5' que contém a sequência de promotores é determinada e mostrada nas SEQ ID N°s:' 36-51. A construção por engenharia genética dos sítios de restrição para clonar os fragmentos de promotor nos vectores adequados é normalmente feita utilizando processos de RCP conhecidos dos especialistas na técnica. EXEMPLO 5
Para as análises de expressão transientes, clonaram-se fragmentos de promotor em vectores de expressão. Se um codão inicial (AUG) de um gene de promotor alvo é identificado, o fragmento de promotor é clonado num vector, como se mostra na Figura 1 (pMON19469) em lugar do elemento genético P-CaMV.35S. Se não for identificado nenhum AUG, o fragmento de promotor é clonado num vector de expressão modificado para facilitar as fusões translacionais com um gene repórter como GUS ou PFV.
As estruturas de expressão são ensaidas num ensaio de planta transiente. Vários ensaios estão disponíveis e são conhecidos pelos especiaçistas na técnica. Para um ensaio histoquímico sobre a actividade de GUS, os embriões são colhidos 13-DAP e colocados num meio de cultura tal como meio de MS (Physiologia Plantarum 15: 473 (1962)}, junto com calos 79 embriogénicos do Tipo II. Para analisar os promotores num ensaio transiente, fatias de endoesperma de grãos de 13-DAP e segmentos de folha de etiolada de mudas de 14 dias após germinação (DAG) são bombardeados com ADN do vector de expressão utilizando um aparelho de disparo de partículas adequado (ver, por exemplo, Christou et al., Plant Physiol., 87: 671 (1989); Klein et al., Proc. Natl. Acad. Sei. USA, 85: 4305 (1988); Ye,G.-N., et al., Plant Mol. Biol., 15: 809 (1990). Cada vector de expressão é bombardeado em duas placas independentes. Deixa-se os tecidos recuperarem durante 48 horas e depois são coradòs com X-Gluc (β-D-glicuronídeo de 5-bromo-4-cloro-3-indoílo) para detectar a expressão do gene de GUS nos tecidos de interesse (Jefferson et al., EMBO J., 6: 3901 (1987). EXEMPLO 6
Para a transformação de uma planta estável as sequências de promotor são clonadas num vector de transformação de planta como se mostra na Figura 2 (pMON39721) e transformadas numa colheita alvo de interesse por meio de um sistema de libertação apropriado, tal como a transformação mediada por Agrobacterium' (ver, por exemplo, patentes de invenção norte-americanas U.S. N°s 5.569.834, 5.416.011, 5.631.152, 5.159.135 è 5.004.863 todas elas aqui incorporadas como referência na sua totalidade) ou processos de bombardeamento de partículas (ver, por exemplo, Pedidos de Patentes de invenção WO 92/15675, WQ 97/48814 e Pedido de Patente de invenção Europeia 586.355 e Patentes de invenção norte-americanas U.S. N°s 5.120.657, 5.503.998, 5.830.728 e 5.015.580, todas elas aqui incorporadas como referência, na sua totalidade) . O fragmento de Notl de pMON51002 (Figura 3) que inclui a 80 expressão de accionamento do promotor Zm.700258061(SEQ ID N°: 40) do gene de Ec.GUS foi isolado e clonado no sitio de Notl do vector de transformação de planta pMON39721 (Figura 2) para gerar pMON51008 (Figura 4) para transformação estável de milho. 0 fragmento de Notl de pMONSlOOl (Figura 5) que inclui a expressão de accionamento do promotor Zm.700263629 (SEQ ID N°: 39) do gene de Ec.GUS foi isolado e clonado no sitio de Notl do vector de transformação de planta pMON39721 para gerar pMON51009 (Figura 9) para transformação estável de milho. O fragmento de Notl de pMON51003 (Figura 7), que inclui a expressão de acciona-mento de promotor Zm.700262624 (SEQ XD N°: 38) do gene de Ec.GUS foi isolado e clonado no sitio de Notl do vector de transformação de planta pMON39721 para gerar pMQN51010 (Figura 8) para transformação estável de milho. Foram utilizados na construção destas estruturas de transformação de plantas (Sambrook et al., 1989) processos bem conhecidos na técnica da biologia molecular, como a digestão de endonuclease, purificação de fragmento de ADN, ligação, transformação de bactéria, selecção de antibióticos, purificação de plasmido. As estruturas de transformação de plantas foram transferidas para Agrobacterium tumefaciens por um procedimento de união' triparental (Ditta et al. Proc. Natl. Acad. Sei. EUA 77: 7347 (1980).
Utilizou-se a Agrobacterium tumefaciens (estirpe ABI) e fez-se uma cultura em meio liquido de BE (50 mL de meio por 250 mL de frasco) contendo 100 mg/L de canamicina, 50 mg/L de espectinomicina e 25 mg/L de cloramfenicol (Sigma Aldrich, St. Louis, MO) durante aproximadamente 24 horas (num agitador giratório a 150-160 rpm) a 21° C. A cultura foi agitada a menos de 3400 rpm e re-colocada em suspensão em meio liquido AB (a DO foi ajustada para 0,2 a 660 nm) contendo Η o nivel de espectinomicina e canamicina utiliza-do para BE, além de 200 jlM de acetossiringona (AS; utiliza-do para a indução de 81 virulência) num frasco de 250 mL. Depois de uma cultura durante 15-16 horas nas mesmas condições que a cultura BE, a suspensão de agrobacterium foi colhida e lavada em H de meio MS VI contendo AS e centrifugada novamente antes da ressuspensão em ^ de meio MS PL (também contém o mesmo nível de AS). A concentração final de Agrobacterium foi de cerca de 1 x 109 cfu/mL (que é igual a uma DO de 1,0 as 660).
Um híbrido triplo de milho (Pa91 x H99) foi utilizado para a transformação nas experiências dos requerentes. Embriões imaturos de milho com um tamanho de 0,5 mm a 2,0 mm foram assepticamente colhidos e imersos em H de meio líquido MS PL contendo Agrobacterium e 200 μΜ de AS durante 30 minutos. Os embriões imaturos foram secos num pedaço de papel antes de serem colocados em ^ de meio de co-cultura MS contendo 3,0 mg/L de 2,4-D, 200 μΜ de acetosiringona, 2% de sacarose, 1% de glicose, 12 mM de prolina e 20 μΜ de nitrato de prata e fez-se uma cultura a 23°C durante 2 ou 3 dias. Os embriões foram então transferidos para um meio de retardamento 15AA de macro e micro sais de 15AA, 1 mg/L de 2,4-D, 12 nM de prolina e 500 mg/L de carbenicilina e fez-se uma cultura a 27° C durante 5 dias. Os embriões foram transferidos para o primeiro meio de selecção contendo meio 15AA contendo 1,0 mg/L de 2,4-D, 12 mM de prolina, 750 mg/L de carbenicilina e 50 mg/L de paromomicina e fez-se uma cultura durante 2 semanas a 27° C. Então os embriões foram transferidos para o mesmo meio mas contendo um nível mais elevado de agentes de selecção (100 mg/L de paromomicina) durante 2 semanas antes de transferir estes embriões para o meio contendo 200 mg/L de paromomicina por uma ou duas vezes mais de selecção. Os calos seleccionados foram trazidos para o meio de regeneração MS 6BA-durante cerca de 2 semanas antes de movê-los para o meio MS OD em bandejas para plantas e 82 culturas em ambiente luminoso. Seleccionaram-se as plantinhas com o desenvolvimento de raizes e brotos vigorosos e colocaram-se no solo onde enrijeceram durante 7 dias antes de colocação na estufa.
As plantas transgénicas da estufa foram cruzadas com H99 e os seus embriões imaturas foram colhidos nos dias 13 e 21 após a polinização para ensaios de actividade de coloração de GUS (quadro 2) e MUG (quadro 3). Os ensaios de coloração de GUS dos tecidos de plantas transgénicas (Jefferson et al., EMBO J. , 6: 3901 (1987)} forneceram uma análise qualitativa dos promotores intensificados por embriões de milho da presente invenção, para determinar o padrão de expressão em folha de milho, raiz, embrião, endoesperma e tecidos, de cobertura da semente. Expressão de GUS das sequências de promotor da invenção presente não foi detectada em folhas e não foi detectada frequentemente em tecidos de raiz. A expressão de GUS foi detectada em sementes, especialmente nos embriões da semente. Estes promotores apresentam expressão intensificada em sementes e tecidos associados com semente relativamente à expressão em raizes, folhas ou outros tecidos vegetativos.
Quadro 2. Actividade qualitativa de GUS em extractos de tecido de milho transqénico
Zm.700258061 Zm.700267629 Zm.700263624 pMON51008 pMON51009 pMON51010
Actividade de GUS em folha Actividade de GUS em raiz Actividade de GUS em embrião 15% + / 85% * 18% + / 82% * 16%+/ 84% + . + + 83 parte de aleurona + outra parte -+/- +
Actividade de GUS parte de aleurona + em endoesperma outra parte -
Actividade de GUS + /-no revestimento da semente + actividade de GUS detectada actividade de GUS não-detectável +/- inconclusivo ou negativo * tecido de raiz de algumas plantas é positivo
Os ensaios de MUG forneceram uma análise quantitativa da expressão de embriões e do endoesperma nas sementes transgénicas. A proteína total foi extraída de 10 embriões e 10 endoespermas dissecados de cada meia espiga de uma planta de milho transgênica. O controle negativo PHxA/CK de tipo selvagem avaliado 13 dpp. O ensaio de MUG utilizou 500 μΐ de tampão de extracção de GUS adicionado aos tecidos e os tecidos foram moídos com um almofariz de teflon em tubo de "Eppendorf" de 1,5 mL e foram centrifugados a 10K RPM durante 5 minutos a 4 graus (Beckman GS-1SR). 400 μΐ de sobrenadante foram transferidos para uma nova placa de 95 cavidades fundas. Os extractos são congelados em gelo seco e armazenados a -8 0 até à sua utilização. 0 ensaio de MUG consistiu em gerar uma curva padrão dê actividade com uma diluição em série de umbeliferona de 4-metilo (SIGMA M1381) de 31,2 pmoles a 2000 pmoles. Adicionou-se 5 μΐ de cada extracto a uma placa de 96 cavidades , de fundo achatado (Falcon 3872) em duplicado após a planta ser pré-lida para suprimir a base. Adicionou-se 200 μΐ de uma solução de ensaio de GUS (0,1 M de KP04, pH 7,8, EDTA 1,0 mM, 5% de glicerol, DTT 10,0 mM, glicuronídeo de umbeliferila de 4-metilo 2mM Fluka 69602) a cada cavidade e misturada com as amostras por meio de uma pipeta. A placa foi lida cineticamente em F-max 84 (Dispositivos Moleculares) a 37 °C com um par de filtros: excitação-355/emissão-460. Uma leitura típica consiste em 21 leituras em 3 intervalos mínimos e durou 1 hora. A actividade de GUS (pmol/min/^g de proteína) foi calculada com base nos resultados de MUG e nos resultados de proteína de cada amostra. A proteína total foi avaliada utilizando um kit de ensaio de proteínas da Bio-Rad. Utilizaram-se diluições em série da proteína de BAS de 0,05 mg/mL a 0,5 mg/mL para a curva padrão. Adicionou-se em duplicado, à placa de 96 cavidades de fundo achatado (Falcon), 1,5 μΐ de extractos.
Adicionou-se 200 ul de corante diluído e misturou-se com as amostras. A absorbância a 595 nm foi medida num Spectromax 250 (Dispositivos Moleculares) à temperatura ambiente, após 5
min de incubação à temperatura ambiente. A análise de MUG demonstrou que os promotores isolados pela expressão da invenção descrita antes em tecido de semente de milho e diferencialmente em tecidos de embriões e endoesperma. As linhas de milho transformadas independentes podem ser seleccionadas na população de plantas transformadas com os promotores da presente invenção que expressam em diferentes estágios de desenvolvimento de embriões e do endoesperma na semente. 85
Quadro 3. Proteína de ensaio de MUG/piaol/min/Vg
Estrutura Promotor Planta# Embrião/ 13dpp Endoesperma/ 13dpp Embrião 21dpp Endoesperma/ 21dpp pMON 51008 700258061 312811 50,4 . 0 0, 3 0,1 s12822 23,3 0 S12823 0, 4 0,1 8, 6 0,3 s1282 4 0 0 s 12829 2,7 0 19,1 0, 6 S12832 0,2 0 46, 9 2,4 . S 12834 9,8 0,3 S12836 5,4 1,4 12 0,3 s 12826 0,9 0 210 0 S12828 1,9 0 135,9 0 S12833 6, 6 0,2 135,5 132,9 s12813 72,2 . 2,7 0,8 0,5 S12835 6,7 0,2 66,2 1,8 pMON51009 700267629 S13745 ' 0 1 S13746 0,9 0 20, 3 1,1 S13747 0 0,2 0,7 0,9 S13750 0 0,1 S13752 0 0 S13753 0 o - S13754 0 0 S13755 0 0 0 0 86
Construção (continuação)
Planta# Embrião/ 13dpp Endoesperma/ 13dpp Embrião/ 21dpp Endoesperma/ 21dpp S13756 0 0 S13757 0,2 0,2 S13759 1,6 0 1,2 S13760 0 0 0 S13761 0 s137 63 0 0 0 0 S13764 0 0 S13766 0 0 S13767 0 0 S13768 0 0 S13811 0, 6 S13813 0 0 S13814 0 1,4 S13815 0 0,3 313816 0,7 0, 6 S13817 0 2,7 S13818 0,8 . 0 5,2 S13819 3,8 0 S13820 0,1 0,4 S13821 0 0,1 87
Construção Promotor Planta# Embrião/ Endoesperma/ Embrião/ Endoesperma/ 13dpp 13dpp 21dpp 2idpp PMON51010 700263624 S13769 0 0 S13770 0 0 S13771 0 0 S13772 0 0 sl3 773 5,6 0 S13774 0 0 S13775 0 0 S13776 6,4 S13777 0 0 6, 6 S13778 0 0 S13779 0 0 '27,3 1,0 S13780 3,3 0 S13781 0 0 S13782 0 0 S13783 0 0 5, 4 S13785 0,.5 2,3 0 S13786 3,6. S13789 0 0 S13791 0. 0 S13792 2,8 0 23,4 0 S13793 0 0 5 S13794 0 0 4,3 S13795 0 3, 8 0 S13797 0 0 4,1 0 S13799 0 0 S13801 1,8 0 5,9 S13802 0 0 47,5 6,1 S13805 0 0 5,1 S138Q6 0 0 S13807 0 0 sl3809 0 0 S13810 0 0 S13826 0 0 S13827 0,4 0 5 0 S13823 0 0 0,4 0 PhxA/CK 0 0 88
Um grande número de sistemas e processos de transformação e de regeneração está disponível e é bem conhecido pelos especialistas na técnica. As plantas estavelmente transformadas e a sua progenia são subsequentemente analisadas no que respeita à expressão do gene em tecidos de interesse por vários processos moleculares, de imunodia-gnóstico, bioquímicos e/ou de avaliação de campo, conhe-cidos pelos especialistas na técnica. EXEMPLO 7
Os elementos reguladores de actuação de cls para a regulação do próprio promotor podem ser identificados por vários meios. Num processo, realiza-se uma análise de eliminação para remover as regiões do promotor e os fragmentos de promotor resultantes são avaliados no que respeita à actividade do promotor.· Os fragmentos de ADN são considerados necessários para a regulação do promotor se a actividade do promotor truncado for alterada comparada com o fragmento do promotor original. Por meio destas análises de eliminação, pequenas regiões de ADN podem-se identificar que são necessárias para a regulação positiva ou negativa da transcrição. Os elementos da sequência de promotores podem ser também identificadas e novos promotores construídos para conter estes elementos cis para modular a expressão de sequências operacionalmente ligadas capazes de transcrição. Ver, por exemplo, as patentes de invenção norte-americanas U.S. N° 5.223.419, 4.990.607, e 5.097.025.
Uma abordagem alternativa consiste em procurar sequências similares entre os promotores com perfis de expressão similares. Os promotores com padrões de sobreposição de actividade podem ter mecanismos reguladores comuns. Vários programas de computador podem ser utilizados para identi- 89 ficar elementos de sequência conservados entre os promotores, incluindo mas não se limitando a MEME, SIGNAL SCAN ou GENE SCAN. Estes elementos podem representar sítios de ligação para factores de transcrições que agem para regular os promotores. Uma vez identificados os elementos da sequência, pode-se avaliar a sua função. Por exemplo, as sequências de elementos podem ser eliminadas do promotor para determinar se o elemento é necessário para a função do próprio promotor. Alternativamente, o elemento pode ser adicionado a um promotor mínimo para ensaiar se ele é suficiente para a transcrição activa. Os elementos reguladores negativos e suspeitos podem ser ensaiados quanto à sua suficiên-cia adicionando a um promotor activo e buscando uma redução na actividade promotora. Alguns elementos reguladores de acção de cis podem requerer outros elementos para funcio-nar. Portanto, múltiplos elementos podem ser ensaiados em várias combinações por vários processos conhecidos pelos especialistas na técnica.
Uma vez identificados os elementos de promotores funcionais, os elementos promotores podem ser modificados ao nível dos nucleótidos para afectar a ligação da proteína. As modificações podem causar uma afinidade de ligação mais alta ou mais baixa que pode afectar o nível de transcrição daquele promotor.
Os elementos do promotor podem actuar de uma forma directa ou em sinergia para afectar a actividade geral do promotor. A este respeito, os elementos do promotor de diferentes regiões reguladoras 5' podem ser colocados em tandem para se obter um promotor com um espectro diferente de expressão ou com um nível maior de expressão. Além disso, um elemento do promotor pode ser multimerizado para elevar os 90 níveis de expressão especificamente no padrão afectado por aquele elemento do promotor.
Os processos técnicos necessários para produzir os vectores de expressão contendo os novos elementos reguladores 5' desenvolvidos são conhecidos pelos especialistas na técnica. Os promotores tratados por enge4nharia genética são enaiados em vectores de expressão e transientemente analisados por ligação operacional dos novos promotores ao gene repórter adequado tal como GUS e analisando em um ensaio da planta transiente. Os novos promotores estão operacionalmente ligados a um ou mais genes de interesse e incorporados num vector de transformação de plantas em conjunto com um ou mais elementos reguladores adicionais e transformados numa planta alvo de interesse por um sistema de libertação de ADN ' adequado. As plantas estavelmente transformadas e a progenia subsequente são avaliadas por vários dos processos moleculares, dê imonudiagnóstico, bioquímicos, fenotipicos ou' processos de campo adequados para avaliar a(s) característica(s) agronómica(s) desejada(s).
Seguindo os processos aqui descritos, os especialistas na técnica de biologia molecular de plantas podem isolar as sequências do promotor de ADN que são capazes de regular a transcrição de uma sequência de ADN heteróloga operacionalmente ligada às sequências de promotor. Estes promotores são úteis para aumentar a expressão de transgénios em sementes de planta, tecidos embriogénicos de plantas e tecidos de calos de plantas em relação aos níveis de expressão destes promotores que podem direcionar as outras células e tecidos de plantas, como raízes e folhas. As moléculas de ADN que são as sequências de promotores da presente invenção compreendem vários elementos com actuação cis que podem ser isolados e fundidos com moléculas' de ADN conhecidas de sequências de 91 promotores para criar uma sequência de promotores híbridos.. Estes promotores híbridos terão padrões de expressão diferentes dos das sequências conhecidas de promotores e das sequências de promotores isoladas pelos processos da presente invenção. Promotores bem conhecidos que funcionam em plantas incluem, mas não se limitam a promotores do vírus de mosaico de couve-flor 35S e 19S, promotor de vírus de . mosaico de escrofulária 35S, promotor de vírus baciliforme de cana-de-açucar e outros promotores de vírus de plantas, promotores de actina tais como promotores de actina de arroz e promotores de actina de Arabidopsis e promotores de ubiquitina de plantas. Estes promotores têm sequências mínimas que foram identificadas para a transcrição directa em células de planta transgé-nicas. Estas sequências mínimas são componentes dos promo-tores híbridos com elementos de acção cls das moléculas de ÂDN da presente invenção.
LISTAGEM DE SEQUÊNCIAS <110> Monsanto Technology LLÇ <120> Sequências Reguladoras de Plantas para o Controle Selectivo da Expressão de Genes <130> REN-001-EP-DIVI <140> US 60/151.892 <141> 1999-09-01 <160> 51 <170> Patentin versão 3.0 <210 1 ' <211> 22. 92
<212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <400> 1 gtaatacgac tcactatagg gc 22 <210> 2 <211> 19 <212> ADN. <213> Sequência Artificial <220> <223> Iniciador. <400> 2 actatagggc acgcgtggt. 19 <210> 3 <211> 30 . · <212> . ADN <213> Sequência Artificial <220> <223> Iniciador <400> 3 agggcaagct tggtcgacgg cccgggctgg 30 <210> 4 <211> 23 <212> ADN <213> Sequência Artificial <22 0> <22 3> Iniciador <400> 4 cggcagggtt ttcccagtca cga 23 <210> 5 <211> . 24 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <40 0> 5 agcggataac aatttcacac agga 24 <210> 6 <211> 27 <212> adn' <213> Sequência Artificial <220> <223> Iniciador <400> 6 cagaaag.cct ccattcctta tcaggca ' 27 <210> 7 <211> 27 <212> ADN <213> Sequência Artificial <22 Q> <223> Iniciador <4 00> 7 . cgagaggaag tgcctggcgt aatcaaa 27 <210> 8 <211> 26 <212> ADN <213> <220> Sequência Artificial <223> Iniciador <400> 8 gctcatcaga gttgccgtcg ttgcta, 26 <210> 9 ' <211> 44 <212> ADN <213> Sequência Artificial <22 0> <223> .iniciador <400> · 9 cgcggatcca gatctactcg tctgacccat ccgttatcac tccg 44 <210> 10 <211> 2 6 <212> ADN <213> Sequência Artificial <2 2 0 > <223> iniciador < 4 C Ο > 10 agtgaggcga tccattcacg cgccta 26 <210> 11 <211> 26 <212> ADN <213> Sequência Artificial <220> <223>.. iniciador <400> 11 ; gatcgcttgc actctctgcc. tctctg 2 6 <210> 12 <211> 27 <212> ADN <213> Sequência Artificial <220> <223> Iniciador <400> 12'·· tctccccgca aggcgcgtat ctgatga 27· <210> 13 ; <211> 42 <212> ' ADN <213> Sequência Artificial <22 0> <223> Iniciador 13 <4 00> 42 cgGggatcca gatctggcgc gtcggggcac cggccggcgc ag <210> 14 <211> 27 <212> ADN <213> Sequência Artificial <220> <223> Iniciador < 4 0 0 > 14 ttgccgaccc ctccttcacc ttctcct 27 <210> ' 15 <211> 27 <212> ADN <213> Sequência Artificial <220> <223> iniciador <4 00> . 15 tgtccttcgc cttcaccttc gctgtct 27 <210> 16 <211> 26 <212> ADN <213> ' Sequência Artificial <220> <223> Iniciador <400> 16. ggaatctcca cgttctggca cgacga 26 <210> 17 <211> 26 <212> ADN <213> Sequência Artificial <220> <223> Iniciador. <400> 17 tgtctctcgc aaagtcgcaa tgtctg 26
<210> 18 <211> 28 <2.1 2> ADN <213> Sequência Artificial <22 0> <223>' Iniciador <400 18 tgaggctgga cggtttgatc tcccactt 28 <210> 19 <211> 42 <212> ADN <213> Sequência Artificial <220> <223> Iniciador <400> 19 cgcggatcca gatctgaaga agaagaaccc gagtcgccac cc 42 20 <210> <211> 29 <212> ADN <213> Sequência Artificial <22 0> <223> Iniciador <400> 20 agctctcgat gaacatcttg cctttcctc 29 <210> 21 <211> 43 . <212> ADN <213>. Sequência Artificial <22 0>. <22 3> Iniciador <4 00> 21 cgcggatcca gatctgaatg.gaatgcgaag cgaggtagcg age 43 <210> . 22 <211> 2 9 <212> ADN <213> Sequência Artificial <220> <223> Iniciador <4 00> 22 acgacacctc tcgccatagc aaactctcc 29
<210> 23 <211> 44 <212> ADN 99 <213> Sequência Artificial <220>. <223> Iniciador <4 00> 23 cgcggatcca gatctcattc atctgatcca tccgtcacca ctcc 44 <210> 24 <211> 27 <212> ADN <213> Sequência Artificial <220> <223> Iniciador <400> 24 . ggagatgtgg ttgagcgcca tcatcgg. 27 <210> 25 <211> 27 <212> ADN ' <213> :Sequência Artificial <220> <223> .Iniciador <400> . 25 ágtctcagtc ctggcctctt tggggtg 27 <210 26 <211> 30 <212> ADN <213> Sequência Artificial 100 <22 0> <22 3> Iniciador <400> 26 caaátcactc ggagaaagaa atatgcttgg <210 > 27 <211> 29 <212> ADN <213> Sequência Artificial <220> <223> Iniciador < 4 0 0 > 27 ggctactact gactgtgacg atggtgctc <210> 28 <211> 27 <212> ADN <213> Sequência Artificial <220> <223> Iniciador <400> 28 ccagaagcag gaggaggacg aagaagg <210> 29 <211> 26 <212> ADN <213> Sequência Artificial <220> <22 3> Iniciador <400> 29 gaaacgaact ccagagcttg ccgagg 26 <210> 30 <211> 27 <212> .ADN <213> Sequência Artificial <220> <223> Iniciador <400> 30- acaagacgat tcccagacaa gggacca 27 <210> 31 <211> 2 6 <212> AON : <213> Sequência Artificial <220> <223> iniciador <4 00> 31 gcccacacct cacggcatcc atattt 26 <210> 32 <211> 29 <212> ADN <213> Sequência Artificial <220> <223> Iniciador 102 32 <400> acgagcgcca cttgtcttga acttgttgg 29 <210> 33 <211> 41 <212> ADN <213> Sequência Artificial <220> <223> Iniciador <400> 33 . cgcggatcca.gatctagcgc gaactgccgg cggcgctgct c 41 <210> 34 <21'1> 27
<212> ADN <213> Sequência Artificial <220>. <223> . Iniciador <400> 34 gtcggttaga ccgaacaaaa attcagc 27 <210> 35 <211> 43 <212> ADN <213> Sequência Artificial <220> <223> ' Iniciador <400> 35 103 43 cgcggatcca gatctgtcgg ttagaccgaa caaaaattca gcc <210> 36 <211> 654
<212> ADN <213> Zea mays <400> 36 ctgcccatcg tcgcgcgccg gaggcccgac ggccgaggat ggtccttcgt gtgggacgac 60 gactcgytty tgctccagct ccgcgacggc attcccgagg atatggaggt gytcttcgtc 120 ggytccctcc gcgccgatgt ccccgtagcc . gagcaggacg aggtgtcgca ggcgttgctc • 180 gaccggttcc gytgcgcgcc ggtcttcctc cctgaccgcc tcaacgaccg cttctaccac 240 ggcttctgca agcgccaact ctggcctctg ttccactaca tgctcccctt ctcctcatcc 300 gcgtccgccg ccggcaccac ctcttcctcc tccgccgcca cttgcaacgg tcgcttcgaç 360 cgcagcgctt gggaggcgta cgtgctcgcc aacaagttct tcttcgagaa ggtcgtcgag 420 gtaatcaacc cggaggatga ctacgtttgg gttcacgact accatetcat ggcgctgcct 480 accttcctcc gccgctgctt caaccgcctc cgcatcggat tcttcctcca cakccccttc 540 ccctcgtccg agatctaccg caccctccct gttcgggagg agatactcaa ggcgctgòtc 600 aactgtgaçc . taattggctt ccacactttt . gattacgcca ggcacttcct ctcg 654 <210>' 37 . <211> 277 <212> ADN <213> Zea mays <400> 37 . ctgggacgac ggttcgtgag' cg:actttccc atatacgatg gccgtggctc cggcgcccgc 60 ctcgtcgctc gcttgcaggg agtcactgtc caaatcggca gctcgcacta gctagtcagc 120 atcgtcttcg aggccgagag gt&gttaaat gtatgcatgc atgcatgtag tatatatata 180 atgcatgtgc gattcattca ttggttcatC gtcgtctgca ggcttaaggg ctccacgctg 240 ctcaccaacg gagtgataac ggatgggtca gacgagt 277' <210> 38 <211> 476 <212> ADN <213> Zea <400> .38 104 aaaaaatata gtttctaaac tagcccttag aagatactta aataagtatt gtttcttatt 60 tttacgggat gctatgcgga ggggtctact acacatattt actatctcat ctcccatttt 120 attctatatt atatatatat aaatttgcaa acattgttat acatcgtcat ttccagtgag 180 acacagcggt cgtgtcatca gaaaagcgga cacgcgtçgc gtcgcgaggc caggtgggtt 240 atgcacggac ctgctatgct agccatgctc caggctccag ctccacccgt ccaccgactt 300 ctcttctcaa cgagactgcg tcctcaccat gcacgacgac acgtgcgatg ccatcacaca 360 tccacactca cctgttgcct ctatatccac cgccccaccg ccgtagcacc agaaagaaat 420 gtacagtcta cagtctacac acaagctgac cagagaggca gagagtgcaa gcgatc 476 <210> 39 <211> 344 <212> ADN <213> Zea mays <4 00> 39 ' atcaggttag . actaacttcc tttctctgtt atgcatatgc atgtgtgtat gccttttgat 60 ttcttggtat gatggaataa tcaggggtgg atctgcaccc tgaaccaccc tgtcgtggcc 120 cagggtttga tccatgtaat cctttataag tctatttaat çcagtataaa atgacttagá 180 taaaaggtag agaagaaàat ttagtgccga gctaccaagg caccttcttt attccgtcct 240 tgctcagtca cacctcgctc tcgctcactc tcgccgtccg. cacagccgct catcgtctcc 300 cactgcctgc cctctccctg cgccggccgg tgccccgacg cgoc 344 <210> 40 <211> 547 <212> ADN <213> Zea mays <400> 40 aaaaattttt tagtctaaac gtgattttac ttctgtttaa gtttaagggc taaawtaaaa 60 aaaaattcgg cagaagaaac tacgcgcgga cagagaaata cgatcggcca agccgtatac 120 ggagacgtgg cgtgatcctc tcagcacagc attccctagg tggtggtgat gtctgccttc 180 accactatca gatttgcaca cgcagccacg caggacatct gctacagggc acgcggcggc 240 tcagaacgaa gctacgagca cagcgaggtc gccacctcac ggtgcgacgt gcagctccag 300 ctgctcaccg accactgcat gtcgcccacg taagattcaa ccagtccgcc actccaagat. 360 ccaagactcc. agagaccggc cggcctggcc gctagctttt atatacttcc ggcagccatg 420 caccctcatg tccagcatat cgacgcagag tcgcagtcgc agcacacact gaattctctt 480 tagctagcta agagarggta gccacaccaa gacaggatge agacarcgaa ggtgaaggçg 540 105 547 aaggaca <210> 41 <211> 856 <212> ADN <213> Zea mays <400> 41 actttagtta gggttcggtc tttaattctt ttgctgggca gcagtaaacg gagatgagaa 60 gcgcgagctg atcattgttg ccattctgtg caacgaagct aggggaccaa tgctgactcg 120 cacgagggca tagttgctga tggtcataga cgacgcgttc acttaaaata ataaagaatt 180 ataaattgtt gtcataagtc. gtgcagccta atataggaga gtgcggcatt gctgtagcta 240 attaagagag tattccggtc atgcttgagc ttggagaatt tttgaggscc cgttcgcttg. 300 gagagtcgga gatttttgag ggcccgtttc gcttgcacaa tawtaaacaa agatttgttc 350 tagctcatcc aaatctatat aaattaaaga agtaattcgg ttaggaatca atccaagagc 4Z0 tctaattctt aaaaaccgaa cagggcctga gttgtttgtc tagacgacat tatctgatta 480 agttattttç atcttcaatt tcaaatgtga tctarcagca taaaacttgt tgtctgacag 540 atatttgact tccacacggg ccacagctca attacaaaca tacttcaaac atcaggcaga 600 ggcagagcac- taycagcatt cgctacgtgg cggtgggcag cagtggccag cacattcgac · 660 aactyçcacg gatcccgtac tacttcaaac acgtatcgct tccagaatcc agagtcacac 720 gtgtgcagct gcatgaaccc agctcactcc cttaagaaca gctcgacgct cacctgtcta 780 gtctagctcg tgcatgccgc' cctgagcgcc actgcacaga cgcgcagaga eagacattgc 840 gactttgcga gagaca 856 <210> 42 <211> 1137 <212> ADN ' ; <213> Zea mays <400 42 106 ctgcaçggat gcggccgagt gcggcagcac agcagcgcgc gcgcgctcca catcgccttc 60 gctagttcgc tccgccacgt acgcggcccg gcctccacct ggcggcgcgc atggctgcga 120 ccctcgccgc gccacctett eatatacgct geagctcgec tcgaaccctc gcatcgaacg 160 cacactcgca ctcgcacgta caccacacta gttaccacag acgacgggcg ccatgaaagt 240 cceggtgctt cttctcctgg tctccctgtg cttctcgctc gcgctcgcgt ggcaaacgga 300 cacggaatcg ggctcaggca ggccgtaeca ctacggcgag gagagtttcc ggcactggac 360 gcgctcccgg cagggccggt tcagggtgct ggaacggttc acccacgagc tgctggagga 420 cgccgtcggc aactaccgcg tcgccgagct ggaggcegcg ecgcgegegt tcctgcagcc 480 cagccactac gatgccgacg aggtgatgtt cgtgaaggaa ggcgagggcg tcatcgtgct 540 gctccgcggc gggaagaggg agtcgttctg egtcagggag ggcgacgtca fcggtcatccc 600 cgcgggcgcc gtcgtgtact cggccaacac gcaccagtcg gagtggttcc gcgtcgtctt 660 gctcctcagc cocgtcgtct ccacgtctgg acgcttcgag gttcgctttg cttctcgtgc 720 tttaatcttg catgcaaata gatggaggtg acggaaactt ctgttctctt cgtgatttcg 780 gcaggagttc ttccccatcg gaggcgagag ccccgagtcc ttcctcagcg tcttcagcga 840 cgacgttatc caggcgtcgt tcaacgtatg catgcccttc atcgtcctca cggccgggtt 900 tcttctctta tacatcgatt tttcgctagc tagctagcaa actaacccag atttgaacac 960 gaccatgcat gtgtoctaga ctcgccggga ggagtgggag aaagtgttcg agaagcagag 1020 caagggggag atcacgacgg cgtccgagga acagatccgg gagctgagca ggtcctgctc 1080 acgtggtggc cgcagcagcc gcagcgaggg tggcgactcg ggttcttctt cttcaga 1137 <21Q> 43 <211> 753 <212> ADN <213> '/.ea mays <400> 43 atcacfcacag tttataatgc ttcagttttc gaatactaca atatccaata cataaaggtg 60 tttgggaaaa actttggttg agaccaatca gccagagcgg gaccaagctg tcgctctctt 120 tacagagaa^aactttggtg agaccaaagt tttcaaaact gcaaaacaag.tacagtattt ISO acaatattat~agtttagtat acagaaattt cagataaatt fctcaaacacc tcaaaatata 240 taataccaca gtattactca atactataat attactataa tactacagaa aaactttgtt 300 ctcaaacacc tettccatcg gtatgtcctc cgtcatcccg aaagccttca ttcggctcgc 360 tgtcttcttt ctatcgctca caacacaacc atagcccaca ggccgccggc ggccgccagc 420 cgacgtcctc ccatfctegct ccccctcctc cgctgcggtc gagcaaaagt tccggccatc 480 cggcaatccc cccgcacccg gcggttcaaa ccgtatcttt ctgacctgac gcggctacga 540 cgtcgctcct coggtccctt cgatccggtg gggtcçgttt ctttcaagcg cggcctcgct 600 ggccgccteg tggcagtgac egtcgaaccc tctataaatc ccgtgccccg agcacccttc 660 ctcgatcaca caacccaaag cagccacage agcctccttc ctcctctcac tctcgctcgc 720 gctgcgctcg ctacctcgct togcattcca ttc 753 <'210> 44 <211> 684 <212> ADN <213> Zea mays 107 <400> 44 gtgttgtcca aactggacat cagacaagca cgacaatgac aggcgttcgc caagtgtacg 60 tacaggagac 9aacac9aca agtagcaccg tcctggccga gagcccgtca tgctcatgca 120 tgcatgctga tcatctcgat aaatatacag cagagagctg agctacgtac acaaacaaga 180 agcttgcatt gttcgtttgc tcgatcgttg cagataatgg agaaccctgc tccgagtatc 240 gtagcgcccc ccattgccgc acctgtatca gcgaacttca gcagactcgc cttccgcaac 300 ctgtacatcc gacggacggg tccagacagc agggagatgg tgactgtgga gggaagaaga 360 ggctctagtg atcagacagg cgacatgagg tacgtgagtg acttccccgt ctacgatggc 420 cgtggctccg acgccgtcct ggtggctcgc gtgcagggcg tcacaaccac gttcgggaac 480 tccaactagt tcttcaccgt cgccttcgag gccggcaggt tcttcgttta gacagatata 540 tagctagata gatgctagct tgtggttcat atatagcaga tagatatatg catccgccat 600 tgatcgtcca tcytcatcga tcagcaggct caagggctcc acgctcctta ccgaaggagt 660 ggtgacggat ggatcagatg aatg 684 <210> 45 <211> 1025 <212> ADN <213> Zea mays <400> 45- . actccgtact tctaaagggt gggttattta tgtatatggt ccttgcgtta' cggagtttga 60 ataaacaaaa acaaaaaaat atatagatgá ataaacaaat cagtcacáaa aacaaaaaaa 120 a.tctagatga gaaataaâtc tggacggaca aatcagcaac ataaacaaaa aatatggaca 180 acaaaaaaca aatttgtgac aaagacaaaa aagaaaacta ttaaacgccc accatgagac 240 ttgaacccac aacctcaagg. ttaaaaacct tatactctac.cgactaagct. agatgagttt 300 tgtcattaca tattcgagct,cggcggcata gatcttggcg ccgagctcgg tgccacgttg 360 gcgccacgtc. gtctaggttg tgccagcgca acacgttctt cggcgtcata gcctatggcg 420 ccgagatgtg ttacctcggc gctataggct atgacgccga gtaaa.gggtç caaaagtgãc 480 attaaaattt tttaaggtct aaacgtgaat ttttttcaga gaaacggaca aaatacaaaa 540 agttcgggcg catgcatggg tggggtgacg gtggçgctcg caactcagta actcacacgt 600 gçccgetcgg actcaagggg ctggggcacg ggcatgggca tgggcgcatg gcatgcctgc 660 aagcagagtg tagcagacgg cgtcagcacg ccaccttggc cgcttggcgg ccacacggtg 720. ccgacctgac aggggcgcgc gctctcgagt cccagtccca ggctactgcc gtggcgggcc 780 ttacggccgc cacgtcggcc gaggccaccc atocatgcaa gcggcgcatg ggaacgtggc 840 attccggcgc gacggcacga ccgcgctccc gcgccatgcg tcacggtcac gtgcacgcag 900 agccccgctc gccttctata ggtagcgccg cgcgggtggc gtcgcttctg gtctgtggcg 960 gatcggatcg acacccàgcc agcgcgtgga gagtagaaca ccccaaagag gccaggactg 1020 108 46 46 1025 910
ADN agact <210> <211> <212> <213> Zea mays 46 <400> aaatttgtgc ccttagtttt agtggtgtgc tcacatataa cctcagtegt gtttttttct 60 cagctgtgct cacatacgag cacgtacaat gagactgaca aaegagcgtg aatgggtagg 120 gagttttgtt ggagatacga ataattacac aaatcgtata aaatacggat gcCaagttta 180 atagggtgat tgtfcaaagtt ggtctaagtg gataaagcag ctcaatagta gaaccgaggc 240 aaccccggtg aagaaaacaa gcgctcgata agcgcatgta tgggcatggg tgcaccgtgc 300 âtgtccaggc cacctggage tcgctcgcgc gtattgctcc actccaecgc atcaccacca 360 ccaagtggca tgcatatcga gcagagggaa accacatcca acttgtactc gatcgccact 420 gtcgacattt ccetatcgtc cgtctgaacc gatcaacagg tgatgagatc gatcgtgatc 480 gtcatctggt accgttcgtg caccatcgcg tcgagacgag agcaacgcac tegatttgta 540 ctccactact agttcttccg gccggcctac gggttctctc tcaaacgtgg cgagtgcctt 600 gcacatggtg gtggtccggt gaccagctga ccgacgecta tgggcgtgcg cgcgcgcgaa 660 tcagctccat cgacatgggc aggcttcgcg aaggtacgga ccfccgtgaca caacacagcg 720 cgtggcgtgt cctttctacg tggccgtcat gtgggaggct gggagcccgg ccacgctacg 780 tggcccgggg actgcctcgc tgctgctgct tataaatatt ccccgctgga aaagccçcca 840 gccatcatca gtagctagct gttcgaagct ttcagccgat cgagoaccat cgtcacagtc 900 agtagtagcc . 910 <210> 47 <211> 734 <212> ADN <213> Zea mays <400> 47 actcggcaaa gágaccgctg gcgatgtaca gttcgccgaa cgttctttgc caagtgttac 60 actcggcaaa tcttttgccg agtgtaaaat arcctttgcc gagtgtctga gacacatgge 120 aaaggagctg attccggtag tgatgtatta cttgtgatca ttttggagat gaagagaggc 180 cactaatget tcattttgaa tgtttgtgtc actatttgtt tttcttcagc ttcattttga 240 tccgattcaa aaagaaaagt tttattttga taaaactcta acattttgta tttttgtttg 300 tctaatgtgc agttgaagaa gcgcatgavc cgkttaagag gaagcstaga aagatgaggc 360 agargtcaag tacacatcga gggagatyca vrggrgtgtcc ccgccarcca ttgcsttgga 420 ttgccytgcy ggkgtagtac aaacagttte attttccytt gcgtggtckt gggcccamam 480 cgtcgtcstg twtaacmaag cggctcawkc araccaacac gcggsgartc ccarcgctty 540 109 caraagcawta mcgccgccyc ytycamatka rgsktyaatt caargsgccc aatgcaactc €00 ccttttctct tgtccctgtc ctttcogoaa cagagcttgt gagcttgacc agcgagaggc 660 gagtggctag gacctaggcc tccgatcoat gcaggtccct gtgggtttcc tcggcaagct 720 ctggagttcg tttc <210> 48 <211> 1129 <212> ADN <213> Zea mays <220> <221> caracteristicas várias <222> (1) . . (1129) . Λ . ro CM CM V N = qualquer nucleótido <400> 48 cctctttçct ttagaggggg aatacaatta tatgtcttgc ttaccttcaa tgcttgctga 60 atcaagatct ctgtaatgtg ctaccatyct attttaactt aggggacagt atgatccagc 12Ό cttatgggCt ggcaaagtgg gcaatagttg gcgtacaact gacgacataa cggatacatg 180 gaaaaggtaa cccátgttct tttcagagga aaaaagagat agaacattag ctctgttgat 240 gtgctctcaa actgacttat ttatgtatct ggtgaaaaca agcatgacag acattgctga 300 taagaacaac aagtgggcat catatgctgg acctggtggt tggaatggta attatgttag 360 tgatgagttc aagctgtctg caatttgctg tgctttgtgg agctgttcag tatactgtta 420 ctctgttatt. gaacct.ctgc ttttctgcag acccagatat gctggaagta ggcaatggtg 480 acatgacctt aacagagtat cggctcacat tttagcatat gggytctcat gaaggtaagt 540 tttcactgar aãttggaccc gatgttgtat gktcatattt tgagtaagga ggtttgacca 600 angagttttg aaaattaaaa actgtagttc attgaagatg atggttggca tgtaagtatt 660 acagttattg attctccact tactgatgtt acatttggat gcgagaaagg agatatccta 720 ctcntaatgg gttaactgct accttatata ctgttgtgct tcaggcçcct ctattaattg . 780 gctgtgatgt cagaaacatg acttctgaaa caatggaaat actgagcaac aãagaagtaa 840 ttcaagtaaa ccaaggtatt attctgattc ttctttcgga gagaacatgt tatcctggtt 900 tagtatcaca ggctacaaaa atatgttttt acatagaaac tgacaacctt cttatttttg 960 tatataattt cccaacatat cttatatggc agaacaattt aaattcgtaa- tgctcatata 1020 atcacataaa ctcttgagtt gcatgtgttt tattttctgc agatcctctt ggagttcaag 1080 gaagaaaaat tttaggacaa ggaaaatatg gatgccgtga ggtgtgggc 1129 <210> 49 110 <211> 571 <212> ADN <213> Zea mays <220> <221> características várias <222> (1)..(571) <223> Ν = qualquer nucleótido <400> 49 tnacagaatg atcaaantgg attttgnatt gatcaagggg gnaagtgttn caattttttt 60 gttgaccaat ccaaaggggc tcgacgaaat acattccfcaa agggacacae ccctagggca 120 agcttggtcg acggcccggg ctggtataag tctgtcttcc cfcgcaataaa gegaatacaa 180 cttgccattc tctcgagtct cgttttcact gcgctttaac aagagctaaa aagtgcgaga 240 ccgcgagaga aatccagcag gtgtacgtac gtaaagcgag agtcgacgcg tgggcgcgge 300 agacgcgagc ctcccgccac gttggcctcg ttcccgcgcc acgcggccac gcctgcctgc 360 ctcctcacct tgtttatatg cctcgcgcct ccctcaccgt gccaatgcca tgcgcgcgct 420 actgcatctg cggctcatca atccgtgcag tcccagagca ccccgtcttc ccgctactcc 480 cgcaagggeg ctcgtcgctt ccttctccgg ggcgtggcag gcaccttctg gtagagcgag 540 agcgagagca gcgccgccgg cagttcgcgc t 571 <210> 50 <211> 579 <212> ADN <213> Zea mays <400> 50 aaatattaga tactactgat aaaaaagata aacaccatta gctatattac caccctctcc 60 aactgttttc tgaactaatt gtaaatgggc ccatagtgta gtcgtcaagc atggaggccc 120 gctcgaccga cctcctcgat cgctcaaatt tggaaacagc ggttgctact gaccggggtg 180 agtgctgcgt tgttggcgac tgccctgttt tttaatggat tcagtgagag ctaaaaagtg 240 cgagactgcg agagaaatcc agcaggtgta cgtscgtaaa gcgagagtcg acgcgtgggc 300 gcggcagacg cgagcctccc gccacgttgg cctcgttccc gcgccacgcg gccacgcctg 360 cctgctocta ccttgtttat atgcctcgcg cctcctcacc gtgccaatgc catgcgcgcg 420 ctactgcatc tgcggctcat caatccgtgc agtcccagar cáccccgtct tcccgctact 480 cccgcaaggg cgctcgtcgc tttccttctt ccggggcgtg gcaaggcacc tttttggtaa 540 aagcgagagc caagagcagc gccgccggca gttcgcgct S79 <210> 51 <211> 193 111
<212> ADN <213> Zea mays <400> 51 ctgtttcagg catatctgcc acctcggtca catgccgtcc gccacgtcga gaccgcgagc 60 tccatacgtg tcacgcgcag ccattcccga cgtctccggt gccgtgtttt aaagaacgcg 120 ccgtagcgca gcgcactgcg ccactcatct gatgccgtaa cacaaggctg aatttttgtt 180 cggtctaacc gac 193
Lisboa, 24 de Julho de 2008 112

Claims (11)

  1. REIVINDICAÇÕES 1. Molécula de ADN isolada, caracterizada pelo facto de com preender um polinucleótido com pelo menos 80 .% de identidade com a sequência de nucle.ótidos SEQ ID N°: 38.
  2. 2. Molécula de ADN isolada, de.acordo com a reivindicação 1, caracterizada pelo facto de compreender ainda uma segunda molécula de ADN não associada normalmente à dita molécula de ADN isolada.
  3. 3. Molécula de ADN isolada, de acordo com a reivindicação 2, carcterizada pelo facto, de o. polinucleótido ser um promotor hibrido. ' '
  4. 4. Molécula de ADN isolada, de acordo com a reivindicação 3, carcaterizada. pelo facto de compreender ainda uma sequência promotora mínima.
  5. 5. Molécula de ADN isolada, de acordo com a reivindicação 1, carcaterizada pelo facto de o referido polinucleótido ser caracterizada pela SEQ ID N°: 38.
  6. 6. Estrutura de ADN recombinante, carcaterizada pelo facto de compreender um polinucleótido, tal como referido na reivindicação 1,' em que o referido polinucleótido isolado está operacionalmente ligado a um segundo polinucleótido. codificando uma proteína de interesse e uma região, não-traduzida 3'.
  7. 7. Estrutura de ADN recombinante, de. acordo, com a reivindi cação 6, caracterizada pelo facto de o referido polinu-cleótido ser caracterizado pela SEQ ID N°: 38. 1
  8. 8. Planta monocotiledónea transgénica ou célula de planta monocotiledónea, carcaterizada pelo facto de compreender a estrutura de ADN. recombinante de acordo com a reivindicação 5.
  9. 9. Planta transgénica, de acordo com a reivindicação 8, caracterizada pelo facto de a referida planta ser milho.
  10. 10. Processo de produção de uma planta monocotiledónea transgénica, carcaterizado pelo facto de compreender: {i) a introdução, numa célula de planta monocotiledónea, de uma estrutura de ADN compreendendo: (a)' um promotor compreendendo um polinuclè.ótido com uma identidade com a sequência nucleotidica de pelo menos 80 % com a SEQ. ID N°: 38, estando o referido promotor ligado operacionalmente a (b) um segundo polinucleótidos e (c.) uma região não-traduzida 3'; (ii) a selecção da dita célula da planta; e (iii) a regeneração da dita célula de planta numa planta.
  11. 11. Processo de acordo com a reivindicação 10, caracterizado pelo facto de o referido polinucleótido ser caracterizadò pela SEQ ID N°: 38. Lisboa, 24 de Julho de 2008 2
PT05010470T 1999-09-01 2000-08-30 Sequências reguladoras de plantas para o controlo selectivo de expressão de genes PT1571219E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US15189299P 1999-09-01 1999-09-01

Publications (1)

Publication Number Publication Date
PT1571219E true PT1571219E (pt) 2008-08-04

Family

ID=22540689

Family Applications (2)

Application Number Title Priority Date Filing Date
PT05010470T PT1571219E (pt) 1999-09-01 2000-08-30 Sequências reguladoras de plantas para o controlo selectivo de expressão de genes
PT00957927T PT1214402E (pt) 1999-09-01 2000-08-30 Sequencias reguladoras de plantas para o controlo selectivo de expressao de genes

Family Applications After (1)

Application Number Title Priority Date Filing Date
PT00957927T PT1214402E (pt) 1999-09-01 2000-08-30 Sequencias reguladoras de plantas para o controlo selectivo de expressao de genes

Country Status (13)

Country Link
US (3) US6506565B1 (pt)
EP (2) EP1214402B1 (pt)
CN (1) CN1387572B (pt)
AR (2) AR025485A1 (pt)
AT (2) ATE295880T1 (pt)
AU (1) AU6947700A (pt)
BR (1) BR0013728B1 (pt)
DE (2) DE60039079D1 (pt)
DK (1) DK1571219T3 (pt)
ES (2) ES2241644T3 (pt)
HK (1) HK1050715A1 (pt)
PT (2) PT1571219E (pt)
WO (1) WO2001016307A2 (pt)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE482279T1 (de) * 1999-12-02 2010-10-15 Dow Agrosciences Llc Mip synthase promotor aus mais
US20050223438A1 (en) * 2002-03-22 2005-10-06 Hiroshi Otsuki Functional plant, promoter to be used for producing the functional plant and method of using the same
US20040121360A1 (en) * 2002-03-31 2004-06-24 Hagai Karchi Methods, platforms and kits useful for identifying, isolating and utilizing nucleotide sequences which regulate gene exoression in an organism
US7078234B2 (en) * 2002-12-18 2006-07-18 Monsanto Technology Llc Maize embryo-specific promoter compositions and methods for use thereof
AU2004219858B2 (en) * 2003-03-12 2009-01-08 Evogene Ltd. Nucleotide sequences regulating gene expression and constructs and methods utilizing same
CA2519912A1 (en) 2003-03-28 2004-10-14 Monsanto Technology Llc Regulatory regions that promote early plant seed enhanced transcription
US7541166B2 (en) * 2003-09-19 2009-06-02 Microfluidic Systems, Inc. Sonication to selectively lyse different cell types
US7112723B2 (en) 2004-07-28 2006-09-26 Applied Biotechnology Institute Globulin 2 regulatory region and method of using same
US7309589B2 (en) * 2004-08-20 2007-12-18 Vironix Llc Sensitive detection of bacteria by improved nested polymerase chain reaction targeting the 16S ribosomal RNA gene and identification of bacterial species by amplicon sequencing
AU2005285015B2 (en) * 2004-09-13 2010-11-18 Monsanto Technology Llc Promoter molecules for use in plants
CN101056975A (zh) 2004-09-14 2007-10-17 孟山都技术有限公司 用于植物的启动子分子
EP1791962B1 (en) * 2004-09-24 2012-04-25 Monsanto Technology, LLC Promoter molecules isolated from brassica napus for use in plants
JP2008518626A (ja) * 2004-11-05 2008-06-05 アメリカ合衆国 血中で宿主遺伝子発現バイオマーカーを使用する感染症臨床表現型及びその他の生理学的状態の診断及び予後
JP2008532492A (ja) * 2005-02-11 2008-08-21 カラマズー・ホールディングス・インコーポレイテッド ゼアキサンチンの過剰蓄積を示すトウガラシ属品種およびそこから得られる産物
US8592662B2 (en) 2005-02-11 2013-11-26 Kalamazoo Holdings, Inc. Capsicum variety exhibiting a hyper-accumulation of zeaxanthin and products derived therefrom
JP5769698B2 (ja) 2009-03-30 2015-08-26 モンサント テクノロジー エルエルシー 遺伝子組換えイネ事象17314およびその使用方法
CN115927326A (zh) * 2013-03-14 2023-04-07 孟山都技术公司 植物调控元件和其用途
JP6692751B2 (ja) 2013-11-26 2020-05-13 イーアンドビー テクノロジーズ エルエルシー 新規カベオリンモジュレーターを使用する自己免疫および/または炎症疾患の治療

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
US5322938A (en) 1987-01-13 1994-06-21 Monsanto Company DNA sequence for enhancing the efficiency of transcription
GB9118759D0 (en) * 1991-09-02 1991-10-16 Univ Leicester Recombinant dna
US5593874A (en) 1992-03-19 1997-01-14 Monsanto Company Enhanced expression in plants
FR2712302B1 (fr) 1993-11-10 1996-01-05 Rhone Poulenc Agrochimie Eléments promoteurs de gènes chimères de tubuline alpha.
IN1997CH00924A (en) * 1996-05-03 2005-03-04 Syngenta Mogen Bv Regulating metabolism by modifying the level of trehalose-6-phosphate
WO1997044448A1 (en) * 1996-05-17 1997-11-27 Pioneer Hi-Bred International, Inc. Promoter elements conferring root-preferred gene expression
US5955361A (en) 1996-11-20 1999-09-21 Pioneer Hi-Bred International, Inc. P gene promoter constructs for floral-tissue preferred gene expression
EP0977836A4 (en) * 1997-02-21 2002-10-16 Univ California "COTYLEDON1 HARDWOOD" TYPE GENES AND USES THEREOF
AU5489099A (en) 1998-08-20 2000-03-14 Pioneer Hi-Bred International, Inc. Seed-preferred promoters
WO2000012733A1 (en) 1998-08-28 2000-03-09 Pioneer Hi-Bred International, Inc. Seed-preferred promoters from end genes
WO2001019976A2 (en) 1999-09-16 2001-03-22 Monsanto Technology Llc Plant regulatory sequences for control of gene expression

Also Published As

Publication number Publication date
US6506565B1 (en) 2003-01-14
HK1050715A1 (en) 2003-07-04
CN1387572A (zh) 2002-12-25
PT1214402E (pt) 2005-08-31
EP1214402B1 (en) 2005-05-18
DE60039079D1 (de) 2008-07-10
WO2001016307A3 (en) 2001-12-06
US20060123511A1 (en) 2006-06-08
EP1571219B1 (en) 2008-05-28
ATE397083T1 (de) 2008-06-15
US20030131375A1 (en) 2003-07-10
ATE295880T1 (de) 2005-06-15
EP1214402A2 (en) 2002-06-19
ES2308332T3 (es) 2008-12-01
US7563945B2 (en) 2009-07-21
DE60020251T2 (de) 2006-05-11
DK1571219T3 (da) 2008-08-25
CN1387572B (zh) 2010-05-05
WO2001016307A2 (en) 2001-03-08
BR0013728A (pt) 2002-05-07
BR0013728B1 (pt) 2012-10-02
EP1571219A3 (en) 2006-02-22
AU6947700A (en) 2001-03-26
AR089780A2 (es) 2014-09-17
AR025485A1 (es) 2002-11-27
DE60020251D1 (de) 2005-06-23
EP1571219A2 (en) 2005-09-07
US7034204B2 (en) 2006-04-25
ES2241644T3 (es) 2005-11-01

Similar Documents

Publication Publication Date Title
US7563945B2 (en) Plant regulatory sequences for selective control of gene expression
US8735655B2 (en) DNA molecules from maize and methods of use thereof
US8378171B2 (en) Plant regulatory sequences for selective control of gene expression
US9243260B2 (en) Fiber selective promoters
US6645765B1 (en) Plant regulatory sequences for control of gene expression
BR112014016767A2 (pt) molécula de ácido nucleico isolada, cassete de expressão, vetor, célula de planta, planta, semente transgênica, método para expressão de um polinucleotídeo heterólogico de interesse em uma planta ou uma célula de planta, método para expressar um polinucleotídeo de refêrencia em tecidos de óvulo de uma planta
US7541452B2 (en) Rice regulatory sequences for gene expression in defined wheat tissue
US7078503B2 (en) Plant regulatory sequences for selective control of gene expression
US7256324B2 (en) Plant regulatory sequences for selective control of gene expression
US20040115628A1 (en) Atrsp gene promoters
AU2007224398A1 (en) Plant regulatory sequences for control of gene expression