BR112020008745A2 - promotor de planta para expressão de transgene - Google Patents

promotor de planta para expressão de transgene Download PDF

Info

Publication number
BR112020008745A2
BR112020008745A2 BR112020008745-9A BR112020008745A BR112020008745A2 BR 112020008745 A2 BR112020008745 A2 BR 112020008745A2 BR 112020008745 A BR112020008745 A BR 112020008745A BR 112020008745 A2 BR112020008745 A2 BR 112020008745A2
Authority
BR
Brazil
Prior art keywords
sequence
plant
seq
promoter
transgene
Prior art date
Application number
BR112020008745-9A
Other languages
English (en)
Inventor
Lyudmila Sidorenko
Cory M. Larsen
Geny Anthony
Shreedharan Sriram
Holly Jean Butler
Original Assignee
Dow Agrosciences Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow Agrosciences Llc filed Critical Dow Agrosciences Llc
Publication of BR112020008745A2 publication Critical patent/BR112020008745A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

A presente revelação refere-se a composições e métodos para promover a transcrição de uma sequência de nucleotídeos em uma planta ou célula vegetal, empregando um promotor de um gene GmTEFs1. Algumas modalidades referem-se a um promotor ou uma UTR 5? de um gene GmTEFs1 que funciona em plantas para promover a transcrição de sequências de nucleotídeos ligadas de maneira funcional. Outras modalidades referem-se a uma UTR 3? ou um terminador de um gene GmTEFs1 que funciona em plantas para promover a transcrição de sequências de nucleotídeos ligadas de maneira funcional.

Description

Relatório Descritivo da Patente de Invenção para "PROMO- TOR DE PLANTA PARA EXPRESSÃO DE TRANSGENE".
INCORPORAÇÃO A TÍTULO DE REFERÊNCIA
[001] Este pedido reivindica o benefício do Pedido de Patente Provisório número de série U.S. 62/587034, depositado em 16 de no- vembro de 2017, que está expressamente incorporado a título de refe- rência ao presente documento, em sua totalidade.
[002] É incorporada a título de referência, em sua totalidade, uma listagem de sequência de nucleotídeos/aminoácidos legível por com- putador enviada concomitantemente com o presente documento e identificada conforme o seguinte: um arquivo ASCII (Texto) de 30,0 KB nomeado "80596 ST25" em 16 de novembro de 2017.
ANTECEDENTES
[003] Muitas espécies de plantas têm capacidade para serem transformadas com transgenes para introduzir traços ou características agronomicamente desejáveis. As espécies de plantas resultantes são desenvolvidas e/ou modificadas para ter traços desejáveis particula- res. Em geral, traços desejáveis incluem, por exemplo, melhorar a qualidade de valor nutricional, aumentar rendimento, conferir resistên- cia a pragas ou doença, aumentar a tolerância ao estresse e à seca, melhorar qualidades horticulturais (por exemplo, pigmentação e cres- cimento), conferir tolerância a herbicidas, possibilitar a produção de compostos industrialmente úteis e/ou materiais da planta, e/ou possibi- litar a produção de produtos farmacêuticos.
[004] As espécies de plantas transgênicas que compreendem múltiplos transgenes empilhados em um lócus genômico único são produzidas por meio de tecnologias de transformação vegetal. As tec- nologias de transformação vegetal resultam na introdução de um transgene em uma célula vegetal, recuperação de uma planta trans- gênica fértil que contém a cópia integrada de modo estável do trans-
gene no genoma de planta, e expressão de transgene subsequente por meio de resultados de transcrição e tradução em plantas transgê- nicas que possuem traços e fenótipos desejáveis. Entretanto, elemen- tos reguladores de gene inovadores que permitem que a produção de espécies de planta transgênica expresse altamente múltiplos transge- nes manipulados como um conjunto de traços são desejáveis.
[005] De modo semelhante, os elementos reguladores de gene inovadores que permitem a expressão de um transgene em tecidos ou órgãos particulares de uma planta são desejáveis. Por exemplo, a re- sistência aumentada de uma planta à infecção por patógenos originá- rios do solo pode ser alcançada transformando-se o genoma de planta com um gene de resistência a patógeno, de modo que a proteína de resistência a patógeno seja expressa de modo robusto nas raízes da planta. Alternativamente, pode ser desejável expressar um transgene em tecidos de planta que estão em uma fase de desenvolvimento ou crescimento particular, como, por exemplo, divisão ou alongamento celular. Ainda , pode ser desejável expressar um transgene em tecidos de folha e caule de uma planta para fornecer tolerância contra herbici- das, ou resistência contra insetos e pragas acima do solo.
[006] Portanto, existe uma necessidade de elementos regulado- res de gene inovadores que podem levar aos níveis desejáveis de ex- pressão de transgenes em tecidos de planta específicos.
BREVE SUMÁRIO
[007] Nas modalidades da presente invenção, a revelação refere- se a um vetor de ácido nucleico que compreende um promotor ligado de maneira funcional a: uma sequência poliligante; uma sequência de codificação heteróloga não GMTEFs1, em que o dito promotor com- preende uma sequência de polinucleotídeos que tem pelo menos 95% de identidade de sequência com a SEQ ID NO:2. Em outras modalida- des, o dito promotor tem 371 pb de comprimento. Em outras modali-
dades, o promotor consiste em uma sequência de polinucleotídeos que tem pelo menos 95% de identidade de sequência com a SEQ ID NO:2. Em modalidades adicionais, o dito promotor está ligado de ma- neira funcional a uma sequência de codificação heteróloga.
Conse- quentemente, a sequência de codificação heteróloga codifica uma pro- teína marcadora selecionável, uma proteína de resistência a inseticida, uma proteína de tolerância a herbicida, uma proteína de eficiência de uso de nitrogênio, uma proteína de eficiência de uso de água, uma molécula de RNA pequena, uma proteína de qualidade nutricional ou uma proteína de ligação a DNA.
Em outras modalidades, o vetor de ácido nucleico compreende uma sequência de polinucleotídeos termi- nadora.
Em modalidades adicionais, o vetor de ácido nucleico com- preende uma sequência de polinucleotídeos não traduzida 3'. Em mo- dalidades adicionais, o vetor de ácido nucleico compreende uma se- quência de polinucleotídeos não traduzida 5'. Em modalidades adicio- nais, o vetor de ácido nucleico compreende uma sequência de íntrons.
Em modalidades adicionais, o dito promotor tem expressão constitutiva de tecido.
Em outras modalidades, o vetor de ácido nucleico compre- ende uma sequência de polinucleotídeos que tem pelo menos 95% de identidade de sequência com a SEQ ID NO:2 ligada de maneira funci- onal a uma sequência de codificação heteróloga.
Em outras modalida- des, a dita planta é selecionada dentre o grupo que consiste em Zea mays, trigo, arroz, sorgo, aveia, centeio, bananas, cana-de-açúcar, Glycine max, algodão, Arabidopsis, tabaco, girassol e canola.
Em ain- da outra modalidade, a dita planta é Glycine max.
Em algumas moda- lidades, a sequência de codificação heteróloga é inserida no genoma da dita planta.
Em outras modalidades, o promotor compreende uma sequência de polinucleotídeos que tem pelo menos 95% de identidade de sequência com a SEQ ID NO:2?, e o dito promotor é ligado de ma- neira funcional a uma sequência de codificação heteróloga.
Em moda-
lidades adicionais, a planta transgênica compreende uma sequência não traduzida 3'. Em outras modalidades, a dita sequência de codifica- ção heteróloga tem expressão constitutiva de tecido. Em modalidades adicionais, a planta transgênica compreende o dito promotor de 371 pb de comprimento.
[008] Em modalidades da presente revelação, a revelação refere- se a um método para produzir uma célula vegetal transgênica, em que o método compreende as etapas de transformar uma célula vegetal com um cassete de expressão de gene que compreende um promotor de GmMTEFs1 ligado de maneira funcional a pelo menos uma sequên- cia de polinucleotídeos de interesse; isolar a célula vegetal transfor- mada que compreende o cassete de expressão de gene; e produzir uma célula vegetal transgênica que compreende o promotor de GmTEFs1 ligado de maneira funcional a pelo menos uma sequência de polinucleotídeos de interesse. Em outras modalidades, a transfor- mação de uma célula vegetal é realizada com um método de transfor- mação de planta. Em alguns aspectos, o método de transformação de planta é selecionado dentre o grupo que consiste em um método de transformação mediado por Agrobacterium, um método de transforma- ção biolística, um método de transformação de carbeto de silício, um método de transformação de protoplasto e um método de transforma- ção de lipossomo. Em outras modalidades, a sequência de polinucleo- tídeos de interesse é expressa em uma célula vegetal. Em outras mo- dalidades, a sequência de polinucleotídeos de interesse é integrada de modo estável ao genoma da célula vegetal transgênica. Em outras modalidades, o método compreende regenerar a célula vegetal trans- gênica em uma planta transgênica; e obter a planta transgênica, em que a planta transgênica compreende o cassete de expressão de gene que compreende o promotor de GMTEFs1 ligado de maneira funcional a pelo menos uma sequência de polinucleotídeo de interesse. Em ou-
tras modalidades, a célula vegetal transgênica é uma célula vegetal transgênica monocotiledônea ou uma célula vegetal transgênica dicoti- ledônea.
Os exemplos de célula vegetal transgênica dicotiledônea in- cluem uma célula vegetal de Arabidopsis, uma célula vegetal de taba- co, uma célula vegetal de Glycine max, uma célula vegetal de canola e uma célula vegetal de algodão.
Os exemplos de células vegetais transgênicas monocotiledôneas incluem uma célula vegetal de Zea mays, uma célula vegetal de arroz e uma célula vegetal de trigo.
Em algumas modalidades, o promotor de GMTEFs1 compreende o polinu- cleotídeo da SEQ ID NO:2. Em outras modalidades, o promotor de GmTEFs1 compreende uma primeira sequência de polinucleotídeos de interesse ligada de maneira funcional à extremidade 3' da SEQ ID NO:2. Em modalidades adicionais, o método compreende introduzir na célula vegetal uma sequência de polinucleotídeos de interesse ligada de maneira funcional a um promotor de GMTEFs1. Em outras modali- dades, a sequência de polinucleotídeos de interesse ligada de maneira funcional ao promotor de GMTEFs1 é introduzida na célula vegetal por um método de transformação de planta.
Os exemplos de métodos de transformação de planta incluem método de transformação mediada por Agrobacterium, um método de transformação biolística, um método de transformação de carbeto de silício, um método de transformação de protoplasto e um método de transformação de lipossomo.
Em ou- tras modalidades, a sequência de polinucleotídeos de interesse é ex- pressa em tecido de célula embrionária.
Em modalidades adicionais, a sequência de polinucleotídeos de interesse é integrada de modo está- vel ao genoma da célula vegetal.
Em algumas modalidades, a célula vegetal transgênica é uma célula vegetal monocotiledônea ou uma cé- lula vegetal dicotiledônea.
Os exemplos de células vegetais dicotiledô- neas incluem uma célula vegetal de Arabidopsis, uma célula vegetal de tabaco, uma célula vegetal de Glycine max, uma célula vegetal de canola e uma célula vegetal de algodão. Os exemplos de células vege- tais monocotiledôneas incluem uma célula vegetal de Zea mays, uma célula vegetal de arroz e uma célula vegetal de trigo.
[009] Em modalidades da presente revelação, a revelação refere- se a uma célula vegetal transgênica que compreende um promotor de GmTEFs1. Em outras modalidades, a célula vegetal transgênica com- preende um evento transgênico. Em outras modalidades, o evento transgênico compreende um traço agronômico. Os exemplos de traços agronômicos incluem um traço de resistência a inseticida, traço de to- lerância a herbicida, traço de eficiência de uso de nitrogênio, traço de eficiência de uso de água, traço de qualidade nutricional, traço de liga- ção de DNA, traço de marcador selecionável, traço de RNA pequeno, ou qualquer combinação dos mesmos. Em outras modalidades, o traço agronômico compreende um traço tolerante a herbicida. Em um aspec- to dessa modalidade, o traço tolerante a herbicida compreende uma sequência de codificação aad-1. Em ainda outra modalidade, a célula vegetal transgênica produz um produto de mercadoria. Os exemplos de um produto de mercadoria incluem concentrado proteico, isolado proteico, grão, farelo, farinha, óleo ou fibra. Em outras modalidades, a célula vegetal transgênica é selecionada dentre o grupo que consiste em uma célula vegetal dicotiledônea ou uma célula vegetal monocoti- ledônea. Por exemplo, a célula vegetal dicotiledônea é uma célula ve- getal de Glycine max. Em modalidades adicionais, o promotor de GmTEFs1 compreende um polinucleotídeo com pelo menos 95% de identidade de sequência com o polinucleotídeo da SEQ ID NO:2. Em outras modalidades, o promotor de GMTEFs1 tem 371 pb de compri- mento. Em algumas modalidades, o promotor de GMTEFs1 consiste na SEQ ID NO:2. Em modalidades subsequentes, o promotor de GmTEFs1 compreende uma primeira sequência de polinucleotídeos de interesse ligada de maneira funcional à extremidade 3' da SEQ ID
NO:2. Em outras modalidades, o traço agronômico é expresso em te- cidos vegetais. Em outras modalidades, o polinucleotídeo isolado compreende uma sequência de ácidos nucleicos com pelo menos 95% de identidade de sequência com o polinucleotídeo da SEQ ID NO:2. Em modalidades adicionais, o polinucleotídeo isolado aciona a expres- são constitutiva de tecido. Em outras modalidades, o polinucleotídeo isolado compreende atividade de expressão dentro de uma célula ve- getal. Em algumas modalidades, o polinucleotídeo isolado compreen- de um polinucleotídeo de quadro de leitura aberta que codifica um po- lipeptídeo; e uma sequência de terminação. Em modalidades subse- quentes, o polinucleotídeo da SEQ ID NO:2 tem 371 pares de bases de comprimento.
[0010] Em modalidades da presente revelação, a revelação refere- se a um cassete de expressão de gene que compreende um promotor ligado de maneira funcional a uma sequência de codificação heterólo- ga, em que o promotor compreende um polinucleotídeo que compre- ende uma identidade de sequência de pelo menos 95% com a SEQ ID NO:2. Em algumas modalidades, o polinucleotídeo tem pelo menos 95% de identidade de sequência com a SEQ ID NO:2. Em modalida- des adicionais, o cassete de expressão de gene compreende um ín- tron. Em modalidades adicionais, o cassete de expressão de gene compreende uma UTR 5'. Em modalidades subsequentes, o promotor tem expressão constitutiva de tecido. Em outras modalidades, o pro- motor é ligado de maneira funcional a uma sequência de codificação heteróloga que codifica um polipeptídeo ou um gene de RNA pequeno. Exemplos do polipeptídeo codificado ou gene de RNA pequeno inclu- em uma sequência de codificação heteróloga que confere resistência a inseticida, tolerância a herbicida, um ácido nucleico que confere efici- ência de uso de nitrogênio, um ácido nucleico que confere eficiência de uso de água, um ácido nucleico que confere qualidade nutricional,
um ácido nucleico que confere proteína de ligação de DNA e um ácido nucleico que codifica um marcador selecionável. Em modalidades adi- cionais, o cassete de expressão de gene compreende uma região não traduzida 3'. Por exemplo, a região não traduzida 3' tem pelo menos 95% de identidade de sequência com a SEQ ID NO:4. Em modalida- des adicionais, o cassete de expressão de gene compreende uma re- gião não traduzida 5'. Por exemplo, a região não traduzida 5' tem pelo menos 95% de identidade de sequência com a SEQ ID NO:3. Em mo- dalidades adicionais, o cassete de expressão de gene compreende uma região terminadora. Por exemplo, a região terminadora tem pelo menos 95% de identidade de sequência com a SEQ ID NO:5. Em outras modalidades, a presente revelação refere-se a um vetor recom- binante que compreende o cassete de expressão de gene, em que o vetor é selecionado dentre o grupo que consiste em um plasmídeo, um cosmídeo, um cromossomo artificial bacteriano, um vírus e um bacte- riófago. Em outras modalidades, a presente revelação refere-se a uma célula transgênica que compreende o cassete de expressão de gene. Em um aspecto dessa modalidade, a célula transgênica é uma célula vegetal transgênica. Em outros aspectos dessa modalidade, a planta transgênica compreende a célula vegetal transgênica. Em aspectos adicionais, a planta transgênica é uma planta monocotiledônea ou planta dicotiledônea. Exemplos de uma planta monocotiledônea inclu- em uma planta de maís, uma planta de arroz e uma planta de trigo. Em aspectos adicionais da modalidade, a planta transgênica produz uma semente que compreende o cassete de expressão de gene. Em outras modalidades, o promotor é um promotor constitutivo de tecido. Em algumas modalidades, o promotor é um promotor constitutivo.
[0011] As características anteriores e outras serão tornadas mais evidentes a partir da descrição detalhada de diversas modalidades, que seguem com referência às figuras anexas.
BREVE DESCRIÇÃO DAS FIGURAS
[0012] A Figura 1 fornece uma figura de um fragmento de DNA sintético linear que contém o promotor de GMTEFs1, a UTR 5 eo terminador ligado pelo sítio de clonagem múltiplo.
DESCRIÇÃO DETALHADA
1. Visão geral de diversas modalidades
[0013] O desenvolvimento de produtos de planta transgênica se torna complexo de modo crescente. As plantas transgênicas comerci- almente viáveis necessitam agora do empilhamento de múltiplos transgenes em um lócus único. Os promotores vegetais e UTR 3'/terminadores usados para pesquisa básica ou aplicações biotecno- lógicas são geralmente unidirecionais, direcionando apenas um gene que foi fundido em sua extremidade 3' (a jusante) para o promotor ou em sua extremidade 5' (a montante) para a UTR 3'//terminador. Conse- quentemente, cada transgene/sequência de codificação heteróloga precisa normalmente de um promotor e UTR 3'//terminador para ex- pressão, em que múltiplos elementos reguladores são necessários pa- ra expressar múltiplos transgenes em uma pilha de gene. Com um número crescente de transgenes em pilhas de gene, o mesmo promo- tor e/ou UTR 3'//terminador é rotineiramente usado para obter níveis otimizados de padrões de expressão de transgenes diferentes. Obter níveis otimizados de expressão de transgene/sequência de codificação heteróloga é necessário para a produção de um traço poligênico único. Infelizmente, os construtos de múltiplos genes conduzidos pelo mesmo promotor e/ou UTR 3'-terminador são conhecidos por causar o silenci- amento de gene que resulta em produtos transgênicos menos eficazes no campo. O promotor repetido e/ou elementos de UTR 3'//terminador podem levar a um silenciamento de gene com base em homologia. Além disso, as sequências repetitivas em um transgene/sequência de codificação heteróloga podem levar à recombinação homóloga de lo-
cus intra gene que resulta em redisposições de polinucleotídeo. O si- lenciamento e a redisposição de transgenes terão provavelmente um efeito indesejável no desempenho de uma planta transgênica produzi- da para expressar transgenes. Ainda , o excesso de sítios de ligação de fator de transcrição (TF) devido à repetição de promotor pode cau- sar a depleção de TF endógenos que levam à desativação de transcri- ção. Dada a necessidade de introduzir múltiplos genes em plantas pa- ra manipulação metabólica e empilhamento de traço, uma variedade de promotores e/ou UTRs 3'/terminadores é necessária para desen- volver culturas transgênicas que acionam a expressão de múltiplos genes.
[0014] Um problema particular na identificação de promotor e/ou UTR 3'/terminador é a necessidade de identificar promotores especiífi- cos de tecido/preferenciais, relacionados aos tipos de célula específi- cos, estágios de desenvolvimento e/ou funções na planta que não são expressas em outros tecidos de planta. Os promotores específicos de tecido (isto é, preferenciais de tecido) ou de órgão conduzem a ex- pressão de gene em um certo tecido, como no grão, raiz, folha, ou ta- petum da planta. Os promotores específicos de estágio de tecido e de- senvolvimento e/ou UTRs 3'//terminadores podem ser inicialmente identificados a partir da observação da expressão de genes, que são expressos em tecidos particulares ou em períodos de tempo particula- res durante o desenvolvimento vegetal. Esses promotores específicos de tecido/preferenciais e/ou UTRs 3'//terminadores são necessários para certas aplicações na indústria de planta transgênica e são neces- sários visto que permitem expressão específica de genes heterológos de maneira seletiva de tecido e/ou estágio de desenvolvimento, o que indica a expressão do gene heterólogo de modo diferencial em vários órgãos, tecidos e/ou tempos, mas não em outros tecidos indesejáveis. Por exemplo, a resistência aumentada de uma planta à infecção por patógenos originários do solo pode ser alcançada transformando-se o genoma de planta com um gene de resistência a patógeno, de modo que a proteína de resistência a patógeno seja expressa de modo ro- busto nas raízes da planta. Alternativamente, pode ser desejável ex- pressar um transgene/sequência de codificação heteróloga em tecidos de planta que estão em uma fase de desenvolvimento ou crescimento particular, como, por exemplo, divisão ou alongamento celular. Outra aplicação é a conveniência para usar promotores específicos de teci- do/preferenciais e/ou UTRs 3'/terminadores para confirmar a expres- são dos transgenes que codificam um traço agronômico em tipos de tecidos específicos, como desenvolver células de parênquima. Como tal, um problema particular na identificação de promotores e/ou UTR 3'lterminadores é como identificar os promotores e relacionar o promo- tor identificado a propriedades de desenvolvimento da célula para ex- pressão de tecido específica/preferencial.
[0015] Outro problema que refere-se à identificação de um promo- tor é a necessidade para clonar todos os elementos de controle trans- cricionais de atuação cis e ativação trans relevantes de modo que o fragmento de DNA clonado conduza a transcrição no padrão de ex- pressão específico desejável. Visto que tais elementos de controle es- tão localizados de modo distal da iniciação de tradução ou sítio inicial, o tamanho do polinucleotídeo que é selecionado para compreender o promotor é de importância para fornecer o nível de expressão e os pa- drões de expressão da sequência de polinucleotídeos promotora. Sa- be-se que os comprimentos de promotor incluem informações funcio- nais, e genes diferentes demonstraram ter promotores mais longos ou mais curtos do que os promotores dos outros genes no genoma. Elu- cidar o sítio de partida de transcrição de um promotor e prever os ele- mentos de gene funcionais na região de promotor é desafiador. Em adição ao desafio há a complexidade, diversidade e natureza degene-
rada inerente de motivos reguladores e elementos reguladores cis e trans (Blanchette, Mathieu, et al. "Genome-wide computational predic- tion of transcriptional regulatory modules reveals new insights into hu- man gene expression." Genome research 16.5 (2006): 656 a 668). Os elementos reguladores cis e trans são localizados nas partes distais do promotor que regulam a expressão espacial e temporal de um gene para ocorrer apenas em sítios necessários e em tempos específicos (Porto, Milena Silva, et al. "Plant promoters: an approach of structure and function." Molecular biotechnology 56.1 (2014): 38 a 49). Conse- quentemente, a identificação dos elementos reguladores promotores necessita de uma sequência apropriada de um tamanho específico que contém os elementos reguladores cis e trans necessários é obtida de modo que resultará em conduzir a expressão de um transgene |i- gado de maneira funcional/sequência de codificação heteróloga de maneira desejável.
[0016] São fornecidos métodos e composições para superar tais problemas através do uso de elementos reguladores de gene GmTEFs1 para expressar transgenes in planta. 1l. Termos e Abreviações
[0017] Ao longo do pedido, vários termos são usados. A fim de fornecer um entendimento claro e consistente do relatório descritivo e reivindicações, incluindo o escopo a ser dado a esses termos, as se- guintes definições são fornecidas.
[0018] Conforme usado no presente documento, os artigos, "um", "uma" e "o/a" incluem referências ao plural a menos que o contexto cite claramente e de modo não ambíguo de outro modo.
[0019] O termo "isolado", conforme usado no presente documento, significa ter sido removido de seu ambiente natural ou removido de outros compostos presentes quando o composto é formado pela pri- meira vez. O termo "isolado" abrange materiais isolados de fontes na-
turais, assim como materiais (por exemplo, ácidos nucleicos e proteí- nas) recuperados após a preparação por expressão recombinante em uma célula hospedeira, ou compostos quimicamente sintetizados, co- mo moléculas de ácido nucleico, proteínas e peptídeos.
[0020] O termo "purificado", conforme usado no presente docu- mento, refere-se ao isolamento de uma molécula ou composto em uma forma que é substancialmente livre de contaminantes normalmen- te associados à molécula ou composto, em um ambiente nativo ou na- tural, ou substancialmente enriquecido em concentração em relação a outros compostos presentes quando o composto é formado pela pri- meira vez, e meios que aumentaram em pureza como resultado de serem separados de outros componentes da composição original. O termo "ácido nucleico purificado" é usado no presente documento para descrever uma sequência de ácidos nucleicos que foi separada, pro- duzida separada de, ou purificada distante de, outros compostos bio- lógicos incluindo, mas sem limitação, polipeptídeos, lipídeos e carboi- dratos, enquanto efetua uma mudança química ou funcional no com- ponente (por exemplo, um ácido nucleico pode ser purificado de um cromossomo removendo-se os contaminantes de proteína e rompendo ligações químicas que conectam o ácido nucleico ao DNA restante no cromossomo).
[0021] O termo "sintético", conforme usado no presente documen- to, refere-se a uma molécula de polinucleotídeo (isto é, um DNA ou RNA) que foi criada por meio de síntese química como um processo in vitro. Por exemplo, um DNA sintético pode ser criado durante uma re- ação em um tubo Eppendorf'Y, de modo que o DNA sintético seja en- zimaticamente produzido a partir de uma fita nativa de DNA ou RNA. Outros métodos de laboratório podem ser utilizados para sintetizar uma sequência de polinucleotídeos. Os oligonucleotídeos podem ser quimicamente sintetizados em um sintetizador oligo por meio de sínte-
se de fase sólida com o uso de fosforamiditas. Os oligonucleotídeos sintetizados podem ser recozidos entre si como um complexo, produ- zindo assim um polinucleotídeo "sintético". Outros métodos para sinte- tizar quimicamente um polinucleotídeo são conhecidos na técnica, e podem ser prontamente implementados para uso na presente revela- ção.
[0022] O termo "cerca de", conforme usado no presente documen- to, significa maior ou menor do que o valor ou faixa de valores decla- rado em 10 por cento, mas não é destinado a designar qualquer valor ou faixa de valores apenas dentro de essa definição mais ampla. Cada valor ou faixa de valores precedido pelo termo "cerca de" também é destinado a abranger a modalidade do valor absoluto ou faixa de valo- res declarado.
[0023] Para os propósitos da presente revelação, um "gene" inclui uma região de DNA que codifica um produto de gene (consultar infra), assim como todas as regiões de DNA que regulam a produção do pro- duto de gene, caso tais sequências reguladoras sejam ou não adja- centes às sequências de codificação e/ou transcritas. Consequente- mente, um gene inclui, mas não está necessariamente limitado a, se- quências promotoras, terminadores, sequências reguladoras de tradu- ção, como sítios de ligação de ribossomo e sítios de entrada de ribos- somo internos, intensificadores, silenciadores, isoladores, elementos de limiar, origens de replicação, sítios de ligação de matriz, íntrons e regiões de controle de lócus.
[0024] Conforme usado no presente documento, os termos "nati- vo" ou "natural" definem uma condição encontrada na natureza. Uma "sequência de DNA nativa" é uma sequência de DNA presente na na- tureza que foi produzida por meios naturais ou técnicas de reprodução tradicionais, mas não gerada por modificação genética (por exemplo, com o uso de biologia molecular/técnicas de transformação).
[0025] Conforme usado no presente documento, um "transgene" é definido como uma sequência de ácido nucleico que codifica um pro- duto de gene, incluindo, por exemplo, mas sem limitação, um mRNA. Em uma modalidade, o transgene/sequência de codificação heteróloga é um ácido nucleico exógeno, em que o transgene/sequência de codi- ficação heteróloga foi introduzida em uma célula hospedeira por mani- pulação genética (ou a progênie da mesma) em que o transge- ne/sequência de codificação heteróloga não é normalmente encontra- do. Em um exemplo, um transgene/sequência de codificação heterólo- ga codifica um composto industrialmente ou farmaceuticamente útil, ou um gene que codifica um traço agrícola desejável (por exemplo, um gene de resistência a herbicida). Em ainda outro exemplo, um trans- gene/sequência de codificação heteróloga é uma sequência de ácidos nucleicos antissenso, em que a expressão da sequência de ácidos nu- cleicos antissenso inibe a expressão de uma sequência de ácidos nu- cleicos alvo. Em uma modalidade, o transgene/sequência de codifica- ção heteróloga é um ácido nucleico endógeno, em que cópias genômi- cas adicionais do ácido nucleico endógeno são desejáveis, ou um áci- do nucleico que está na orientação antissenso em relação à sequência de um ácido nucleico alvo em um organismo hospedeiro.
[0026] Conforme usado no presente documento, o termo "transge- ne não GmMTEFs1" ou "gene não GmTEFs1" é qualquer transge- ne/sequência de codificação heteróloga que tem menos de 80% de identidade de sequência com a sequência de codificação de gene GmTEFs1.
[0027] Conforme usado no presente documento, "sequência de codificação de DNA heteróloga" significa qualquer sequência de codifi- cação diferente daquela que codifica naturalmente o gene GmMTEFs1 ou qualquer homólogo da proteína de GMTEFs1 expressa. O termo "heterólogo" é usado no contexto desta invenção para qualquer com-
binação de sequências de ácidos nucleicos que não são normalmente encontradas intimamente associadas na natureza.
[0028] Um "produto de gene", conforme definido no presente do- cumento, é qualquer produto produzido pelo gene. Por exemplo, o produto de gene pode ser o produto de transcrição direto de um gene (por exemplo, mRNA, tRNA, rRNA, RNA antissenso, RNA de interfe- rência, ribozima, RNA estrutural ou qualquer outro tipo de RNA) ou uma proteína produzida por tradução de um mMRNA. Os produtos de gene também incluem RNA que são modificados por processos, como capeamento, poliadenilação, metilação e edição, e proteínas modifica- das por, por exemplo, metilação, acetilação, fosforilação, ubiquitina- ção, ADP-ribosilação, miristilação e glicosilação. A expressão de gene pode ser influenciada por sinais externos, por exemplo, exposição de uma célula, tecido, ou organismo a um agente que aumenta ou diminui a expressão de gene. A expressão de um gene também pode ser re- gulada em qualquer parte da via de DNA a RNA a proteína. A regula- ção de expressão de gene ocorre, por exemplo, através de controles que atuam na transcrição, tradução, transporte de RNA e processa- mento, degradação de moléculas intermediárias, como mMRNA, ou através da ativação, desativação, compartimentalização, ou degrada- ção de moléculas de proteína específicas após terem sido feitas, ou por combinações das mesmas. A expressão de gene pode ser medida no nível de RNA ou no nível de proteína por qualquer método conheci- do na técnica, incluindo, sem limitação, Northern blot, RT-PCR, Wes- tern blot, ou ensaio(s) de atividade de proteína in vitro, in situ ou in vi- vo.
[0029] Conforme usado no presente documento, o termo "expres- são de gene" refere-se ao processo pelo qual as informações codifica- das de uma unidade de transcrição de ácido nucleico (incluindo, por exemplo, DNA genômico) são convertidas em uma parte operacional,
não operacional ou estrutural de uma célula, incluindo frequentemente a síntese de uma proteína. A expressão de gene pode ser influenciada por sinais externos, por exemplo, exposição de uma célula, tecido, ou organismo a um agente que aumenta ou diminui a expressão de gene. A expressão de um gene também pode ser regulada em qualquer par- te da via de DNA a RNA a proteína. A regulação de expressão de ge- ne ocorre, por exemplo, através de controles que atuam em transcri- ção, tradução, transporte de RNA e processamento, degradação de moléculas intermediárias, como mMRNA, ou através da ativação, desa- tivação, compartimentalização, ou degradação de moléculas de prote- ína específicas após terem sido feitas, ou por combinações das mes- mas. A expressão de gene pode ser medida no nível de RNA ou no nível de proteína por qualquer método conhecido na técnica, incluindo, sem limitação, Northern blot, RT-PCR, Western blot, ou ensaio de ati- vidade de proteína in vitro, in situ ou in vivo (ou ensaios de atividade de proteína in vitro, in situ ou in vivo).
[0030] Conforme usado no presente documento, "silenciamento de gene com base em homologia" (HBGS) é um termo genérico que inclui tanto o silenciamento de gene de transcrição quanto o silenciamento de gene pós-transcrição. O silenciamento de um lócus alvo por um ló- cus de silenciamento não ligado pode resultar da inibição de transcri- ção (silenciamento de gene de transcrição; TGS) ou degradação de MRNA (silenciamento de gene de pós-transcrição; PTGS), devido à produção de RNA de fita dupla (dsRNA) correspondente às sequên- cias promotoras ou transcritas, respectivamente. O envolvimento de componentes celulares distintos em cada processo sugere que TGS e PTGS induzidas por dsRNA resultarão provavelmente da diversifica- ção de um mecanismo comum antigo. Entretanto, uma comparação estrita de TGS e PTGS foi difícil de ser alcançada devido ao fato de que depende geralmente da análise de loci de silenciamento distinto.
Em alguns casos, um lócus de transgene único pode acionar tanto TGS quanto PTGS, devido à produção de dsRNA correspondente ao promotor e sequências transcritas de genes-alvo diferentes. Mourrain et al. (2007) Planta 225:365 a 379. É provável que siRNA sejam as moléculas reais que acionam TGS e PTGS em sequências homólogas: os SIRNA acionariam, nesse modelo, o silenciamento e a metilação de sequências homólogas em cis e em trans através do espalhamento de metilação de sequências de transgene no promotor endógeno.
[0031] Conforme usado no presente documento, o termo "molécu- la de ácido nucleico" (ou "ácido nucleico" ou "polinucleotídeo") pode se referir a uma forma polimérica de nucleotídeos, a qual pode incluir tan- to fitas senso quanto antissenso de RNA, cDNA, DNA genômico, e formas sintéticas e polímeros misturados do supracitado. Um nucleotí- deo pode se referir a um ribonucleotídeo, desoxirribonucleotídeo, ou uma forma modificada de qualquer tipo de nucleotídeo. Uma "molécula de ácido nucleico", conforme usado no presente documento, é sinôni- mo de "ácido nucleico" e "polinucleotídeo". A molécula de ácido nuclei- co tem normalmente pelo menos 10 bases em comprimento, a menos que especificado de outro modo. O termo pode se referir a uma molé- cula de RNA ou DNA de comprimento indeterminado. O termo inclui formas de fita simples e dupla de DNA. Uma molécula de ácido nuclei- co pode incluir qualquer um dentre ou ambos os nucleotídeos de ocor- rência natural e modificados ligados juntos por ligações de nucleotídeo de ocorrência natural e/ou de ocorrência não natural.
[0032] As moléculas de ácido nucleico podem ser modificadas quimicamente ou bioquimicamente, ou podem conter bases de nucleo- tídeo não natural ou derivadas, assim como serão prontamente obser- vadas por aqueles versados na técnica. Tais modificações incluem, por exemplo, identificações, metilação, substituição de um ou mais dos nucleotídeos de ocorrência natural com um análogo, modificações in-
ternucleotídeos (por exemplo, ligações não carregadas: por exemplo, fosfonatos de metila, fosfotriésteres, fosforamiditas, carbamatos, etc.; ligações carregadas: por exemplo, fosforotioatos, fosforoditioatos, etc.; porções químicas pendentes: por exemplo, peptídeos; intercala- dores: por exemplo, acridina, psoraleno, etc.; quelantes; alquilantes; e ligações modificadas: por exemplo, ácidos nucleicos alfa anoméricos, etc.). O termo "molécula de ácido nucleico" também inclui qualquer conformação topológica, incluindo conformações de fita simples, de fita dupla, parcialmente duplexadas, triplexadas, em formato de gram- po, circulares e de cadeado.
[0033] A transcrição avança de maneira 5' a 3' ao longo de uma fita de DNA. Isso significa que RNA é feito pela adição sequencial de ribonucleotídeo-S'"-trifosfatos à terminação 3' da cadeia crescente (com uma eliminação necessária do pirofosfato). Em uma molécula de ácido nucleico linear ou circular, os elementos distintos (por exemplo, se- quências de nucleotídeo particulares) podem ser denominados "a montante" ou "5' " em relação a um elemento adicional se forem liga- dos ou fossem ligados ao mesmo ácido nucleico na direção 5' daquele elemento. De modo similar, os elementos distintos podem estar "a ju- sante" ou "3" em relação a um elemento adicional se forem ou fossem ligados ao mesmo ácido nucleico na direção 3' desse elemento.
[0034] Uma "posição" de base, conforme usado no presente do- cumento, refere-se à localização de um dado resíduo de nucleotídeo ou base em um ácido nucleico designado. O ácido nucleico designado pode ser definido por alinhamento (consultar abaixo) com um ácido nucleico de referência.
[0035] A hibridização refere-se à ligação de duas fitas de polinu- cleotídeo por meio de ligações de hidrogênio. Os oligonucleotídeos e seus análogos se hibridizam por ligações de hidrogênio, as quais in- cluem ligação de hidrogênio Watson-Crick, Hoogsteen ou Hoogsteen reversa, entre bases complementares. Em geral, as moléculas de áci- do nucleico consistem em bases nitrogenosas que são pirimidinas (ci- tosina (C), uracila (U), e timina (T)) ou purinas (adenina (A) e guanina (G)). Essas bases nitrogenosas formam ligações de hidrogênio entre uma pirimidina e uma purina, e a ligação da pirimidina à purina é de- nominada "pareamento de base." Mais especificamente, A fará liga- ção de hidrogênio com T ou U, e G se ligará a C. "Complementar" refe- re-se ao pareamento de base que ocorre entre duas sequências de ácido nucleico distintas ou duas regiões distintas da mesma sequência de ácidos nucleicos.
[0036] "Especificamente hibridizável" e "especificamente comple- mentar" são termos que indicam um grau suficiente de complementari- dade de modo que a ligação estável e específica ocorra entre o oligo- nucleotídeo e o alvo de DNA ou RNA. O oligonucleotídeo não precisa ser 100% complementar à sua sequência alvo para ser especificamen- te hibridizável. Um oligonucleotídeo é especificamente hibridizável quando a ligação do oligonucleotídeo à molécula de DNA ou RNA alvo interfere com a função normal do DNA ou RNA alvo, e há grau sufici- ente de complementaridade para evitar a ligação não específica do oligonucleotídeo a sequências não alvo sob condições em que a liga- ção específica é desejável, por exemplo, sob condições fisiológicas no caso de ensaios ou sistemas in vivo. Tal ligação é denominada como uma hibridização específica.
[0037] As condições de hibridização que resultam em graus parti- culares de estringência variarão dependendo da natureza do método de hibridização escolhido e a composição e comprimento das sequên- cias de ácido nucleico de hibridização. Em geral, a temperatura de hi- bridização e a força iônica (especialmente a concentração de Na+ e/ou Mg2+) do tampão de hibridização contribuirá para a estringência de hibridização, embora tempos de lavagem também influenciem a es-
tringência. Os cálculos em relação às condições de hibridização ne- cessários para alcançar graus particulares de estringência são discuti- dos em Sambrook et al. (ed.), Molecular Cloning: A Laboratory Manu- al, 2.º edição, volumes 1 a 3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nova lorque, 1989, capítulos 9 e 11.
[0038] Conforme usado no presente documento, "condições es- tringentes" abrangem condições sob as quais a hibridização ocorrerá apenas se houver menos do que 50% de divergência entre a molécula de hibridização e o alvo de DNA. "Condições estringentes" incluem ainda níveis particulares de estringência. Desse modo, conforme usa- do no presente documento, condições de "estringência moderada" são aquelas sob as quais as moléculas com mais do que 50% de diver- gência de sequência não hibridizarão; as condições de "alta estringên- cia" são aquelas sob as quais as sequências com mais do que 20% de divergência não hibridizarão; e condições de "estringência muito alta" são aquelas sob as quais as sequências com mais do que 10% de di- vergência não hibridizarão.
[0039] Em modalidades particulares, as condições estringentes podem incluir hibridização a 65 ºC, seguida por lavagens a 65 ºC com SSC 0,1xX/SDS 0,1% por 40 minutos.
[0040] As seguintes são condições de hibridização não limitantes representativas: Estringência Muito Alta: A hibridização em tampão SSC 5x a 65 ºC por 16 horas; lavagem duas vezes em tampão SSC 2x à tem- peratura ambiente por 15 minutos cada uma; e lavagem duas vezes em tampão SSC 0,5x a 65 ºC por 20 minutos cada um.
Alta Estringência: A hibridização em tampão SSC 5x a 6x a 65 a 70 ºC por 16 a 20 horas; lavagem duas vezes em tampão SSC 2x à temperatura ambiente por 5 a 20 minutos cada uma; e lavagem duas vezes em tampão SSC 1x a 55 a 70 ºC por 30 minutos cada um.
Estringência Moderada: Hibridização em tampão SSC 6x à temperatura ambiente a 55 ºC por 16 a 20 horas; lavagem pelo menos duas vezes em tampão SSC 2x a 3x à temperatura ambiente a 55 ºC por 20 a 30 minutos cada um.
[0041] Em modalidades particulares, moléculas de ácido nucleico especificamente hibridizáveis podem permanecer ligadas sob condi- ções de hibridização de estringência muito alta. Nessas e em modali- dades adicionais, moléculas de ácido nucleico especificamente hibridi- záveis podem permanecer ligadas sob condições de hibridização de estringência alta. Nessas e em modalidades adicionais, moléculas de ácido nucleico especificamente hibridizáveis podem permanecer liga- das sob condições de hibridização de estringência moderada.
[0042] Conforme usado no presente documento, o termo "oligonu- cleotídeo" refere-se a um polímero de ácido nucleico curto. Os oligo- nucleotídeos podem ser formados por clivagem de segmentos de áci- do nucleico mais longos ou por polimerização de precursores de nu- cleotídeo individual. Os sintetizadores automatizados permitem a sín- tese de oligonucleotídeos até diversas centenas de pares de bases em comprimento. Devido ao fato de que os oligonucleotídeos podem se ligar a uma sequência de nucleotídeos complementar, os mesmos po- dem ser usados como sondas para detectar DNA ou RNA. Os oligonu- cleotídeos compostos de DNA (oligodesoxirribonucleotídeos) podem ser usados em PCR, uma técnica para a amplificação de sequências de DNA pequenas. Em PCR, o oligonucleotídeo é tipicamente deno- minado como "iniciador", o qual permite que uma DNA polimerase es- tenda o oligonucleotídeo e replique a fita complementar.
[0043] Os termos "porcentagem de identidade de sequência" ou "porcentagem de identidade" ou "identidade" são usados de modo in- tercambiável para se referir a uma comparação de sequência com ba- se em correspondências idênticas entre posições consequentemente idênticas nas sequências comparadas entre duas ou mais sequências de aminoácidos ou nucleotídeo. A porcentagem de identidade refere- se à extensão em que duas sequências de polinucleotídeo ou peptídeo alinhadas de modo otimizado são invariáveis ao longo de uma janela de alinhamento de componentes, por exemplo, nucleotídeos ou ami- noácidos. Os experimentos de hibridização e algoritmos matemáticos conhecidos na técnica podem ser usados para determinar a porcenta- gem de identidade. Muitos algoritmos matemáticos existem como pro- gramas de computador de alinhamento de sequência conhecidos na técnica que calculam a porcentagem de identidade. Esses programas podem ser categorizados como programas de alinhamento de sequên- cia globais ou programas de alinhamento de sequência locais.
[0044] Os programas de alinhamento de sequência global calcu- lam a porcentagem de identidade de duas sequências por comparação de alinhamentos de extremidade a extremidade a fim de encontrar cor- respondências exatas, dividindo o número de correspondências exatas pelo comprimento das sequências mais curtas, e, então, multiplicando- se por 100. Basicamente, é a porcentagem de nucleotídeos idênticos em uma sequência de polinucleotídeos linear de uma molécula de po- linucleotídeo de referência ("consulta") em comparação com uma mo- lécula de polinucleotídeo de teste ("sujeito") quando as duas sequên- cias são alinhadas de modo otimizado (com inserções, deleções ou lacunas de nucleotídeo apropriadas).
[0045] Os programas de alinhamento de sequência locais são si- milares em seu cálculo, mas apenas comparam fragmentos alinhados das sequências em vez de utilizar uma análise de extremidade-a- extremidade. Os programas de alinhamento de sequência local, como BLAST podem ser usados para comparar regiões específicas de duas sequências. Uma comparação de BLAST de duas sequências resulta em um valor E, ou valor de expectativa, que representa o número de alinhamentos diferentes com pontuações equivalentes a, ou melhores do que, a pontuação de alinhamento bruta, S, que se espera que ocor- ram em uma busca de banco de dados ao acaso. Quanto mais baixo o valor E, mais significativa a correspondência. Devido ao fato de que o tamanho do banco de dados é um elemento em cálculos de valor E, valores E obtidos por BLASTing em relação a bancos de dados públi- cos, como GENBANK, em geral, aumentaram ao longo do tempo para qualquer determinada consulta/correspondência de entrada. Em crité- rios de definição para segurança de previsão de função de polipeptí- deo, uma "alta" correspondência de BLAST é considerada no presente documento como tendo um valor E para o acerto de BLAST superior menor do que 1E-30; um valor E de BLASTX médio de 1E-30 a 1E-8; e um valor E de BLASTX baixo maior que 1E-8. A atribuição de função de proteína na presente invenção é determinada com o uso de combi- nações de valores E, porcentagem de identidade, cobertura de consul- ta e cobertura de acerto. A cobertura de consulta refere-se à porcenta- gem da sequência de consulta que é representada no alinhamento de BLAST. A cobertura de acerto refere-se à porcentagem da entrada do banco de dados que é representada no alinhamento de BLAST. Em uma modalidade da invenção, a função de um polipeptídeo de consul- ta é inferida a partir da função de uma sequência de proteína conser- vada em que ou (1) hit p<1e-30 ou % de identidade >35% E query coverage >50% E hit coverage >50%, ou (2) hit p<1e-8 E query coverage >70% E hit coverage >70%. As abreviações a seguir são produzidas durante uma análise de BLAST de uma sequência.
[0046] Os métodos para alinhar as sequências para comparação são bem conhecidos na técnica. Diversos programas e algoritmos de alinhamento são descritos. Em uma modalidade, a presente revelação refere-se ao cálculo de porcentagem de identidade entre duas se- quências de polinucleotídeos ou aminoácidos com o uso de um pro-
grama de alinhamento AlignX do pacote de NTI de Vetor (Invitrogen, Carlsbad, CA). O programa de alinhamento AlignX é um programa de alinhamento de sequência global para polinucleotídeos ou proteínas.
Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa MegAlign do pacote de com- putação de bioinformática LASERGENE (MegAlign'“ (01993-2016). DNASTAR.
Madison, WI). O programa MegAlign é um programa de alinhamento de sequência global para polinucleotídeos ou proteínas.
Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do pacote Clustal de programas de alinha- mento, incluindo, porém sem limitação, ClustalW e ClustalV (Higgins e Sharp (1988) Gene.
Dec. 15;73(1):237 a 244; Higgins e Sharp (1989) CABIOS 5:151 a 153; Higgins et al. (1992) Comput.
Appl.
Biosci. 8:189-91). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de poli- nucleotídeos ou aminoácidos com o uso do pacote GCG de programas (Wisconsin Package Versão 9.0, Genetics Computer Group (GCG), Madison, WI). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de poli- nucleotídeos ou aminoácidos com o uso do pacote BLAST de progra- mas de alinhamento, por exemplo, porém sem limitação, BLASTP, BLASTN, BLASTX, etc. (Altschul et al. (1990) J.
Mol.
Biol. 215:403 a 410). Outros exemplos de tais programas de alinhamento BLAST in- cluem Gapped-BLAST ou PSI-BLAST (Altschul et a/., 1997). Em uma modalidade, a presente revelação refere-se ao cálculo da porcenta- gem de identidade entre duas sequências de polinucleotídeos ou ami- noácidos com o uso do pacote FASTA de programas de alinhamento, incluindo, porém sem limitação, FASTA, TFASTX, TFASTY, SSE-
ARCH, LALIGN etc. (Pearson (1994) Comput.
Methods Genome Res. [Proc.
Int.
Symp.], Data do Encontro, 1992 (Suhai e Sandor, Eds.), Plenum: Nova lorque, NY, pp. 111-20). Em uma modalidade, a presen- te revelação refere-se ao cálculo da porcentagem de identidade entre dois polinucleotídeos ou sequências de aminoácidos com o uso do programa de alinhamento T-Coffee (Notredame, et. al. (2000) J.
Mol.
Biol. 302, 205 a 217). Em uma modalidade, a presente revelação refe- re-se ao cálculo da porcentagem de identidade entre dois polinucleotí- deos ou sequências de aminoácidos com o uso do pacote DIALIGN de programas de alinhamento, incluindo, porém sem limitação DIALIGN, CHAOS, DIALIGN-TX, DIALIGN-T etc. (Al Ait, et. al. (2013) DIALIGN em GOBICS Nuc.
Acids Research 41, W3-W7). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identi- dade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do pacote MUSCLE de programas de alinhamento (Edgar (2004) Nucleic Acids Res. 32(5): 1792-1797). Em uma modalidade, a presen- te revelação refere-se ao cálculo da porcentagem de identidade entre dois polinucleotídeos ou sequências de aminoácidos com o uso do programa de alinhamento MAFFT (Katoh, et. al. (2002) Nucleic Acids Research 30(14): 3059-3066). Em uma modalidade, a presente reve- lação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do progra- ma Genoogle (Albrecht, Felipe. arXiv150702987v1 [cs.DC] 10 de julho de 2015). Em uma modalidade, a presente revelação refere-se ao cál- culo da porcentagem de identidade entre duas sequências de polinu- cleotídeos ou aminoácidos com o uso do pacote HMMER de progra- mas (Eddy. (1998) Bioinformatics, 14:755-63). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do pacote PLAST de programas de alinhamento, incluindo, porém sem limitação, TPLASTN, PLASTP, KLAST e PLASTX (Nguyen & Lavenier. (2009) BMC Bioinformatics, 10:329). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento USEARCH (Edgar (2010) Bioinformatics 26(19), 2460-61). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do pacote SAM de pro- gramas de alinhamento (Hughey & Krogh (jan. de 1995) Technical Re- port UCSCOCRL-95-7, Universidade da Califórnia, Santa Cruz). Em uma modalidade, a presente revelação refere-se ao cálculo da porcen- tagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do Buscador IDF (O'Kane, K.C., The Effect of Inverse Document Frequency Weights on Indexed Sequence Retrieval, Online Journal of Bioinformatics, Volume 6 (2) 162-173, 2005). Em uma modalidade, a presente revelação refere-se ao cálculo da porcen- tagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento Parasail. (Daily, Jeff.
Parasail: SIMD C library for global, semi-global, and local pairwise sequence alignments.
BMC Bioinformatics. 17:18. 10 de fevereiro de 2016). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre dois polinucleotídeos ou sequên- cias de aminoácidos com o uso do programa de alinhamento Scala- BLAST (Oehmen C, Nieplocha J. "ScalaBLAST: A scalable implemen- tation of BLAST for high-performance data-intensive bioinformatics analysis." /EEE Transactions on Parallel & Distributed Systems 17 (8): 740-749 ago. de 2006). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas se- quências de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento SWIPE (Rognes, T.
Faster Smilth-Waterman database searches with inter-sequence SIMD parallelization.
BMC Bioinforma- tics. 12, 221 (2011)). Em uma modalidade, a presente revelação refe- re-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa de ali- nhamento ACANA (Weichun Huang, David M.
Umbach, e Leping Li, Accurate anchoring alignment of divergent sequences.
Bioinformatics 22:29-34, 1 de janeiro de 2006). Em uma modalidade, a presente reve- lação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do progra- ma de alinhamento DOTLET (Junier, T. & Pagni, M.
DOTLET: diagonal plots in a web browser.
Bioinformatics 16(2): 178-9 fev. de 2000). Em uma modalidade, a presente revelação refere-se a calcular percentual de identidade entre dois polinucleotídeos ou sequências de aminoáci- dos com o uso do programa de alinhamento G-PAS (Frohmberg, W., et al.
G-PAS 2.0 — uma versão aprimorada da ferramenta de alinha- mento de proteínas com uma rotina de retrocesso eficaz em múltiplos GPUs.
Bulletin of the Polish Academy of Sciences Technical Sciences, Vol. 60, 491, nov. de 2012). Em uma modalidade, a presente revela- ção refere-se ao cálculo da porcentagem de identidade entre duas se- quências de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento GapMis (Flouri, T. et. al., Gap Mis: A tool for pairwise sequence alignment with a single gap.
Recent Pat DNA Gene Seq. 7(2): 84-95, ago. de 2013). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas se- quências de polinucleotídeos ou aminoácidos com o uso do pacote de EMBOSS de programas de alinhamento, incluindo, porém sem limita- ção: Matcher, Needle, Stretcher, Water, Wordmatch, etc. (Rice, P., Longden, |. & Bleasby, A.
EMBOSS: The European Molecular Biology Open Software Suite.
Trends in Genetics 16(6) 276-77 (2000)). Em uma modalidade, a presente revelação refere-se ao cálculo da porcen-
tagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento Ngila (Cartwright, R. Ngila: global pairwise alignments with logarithmic and affine gap costs. Bioinformatics. 23(11): 1.427 a 1.428. 1 de junho de 2007). Em uma modalidade, a presente revelação refere-se ao cálculo da porcen- tagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do probA, também conhecido como propA, programa de alinhamento (Múuckstein, U., Hofacker, IL, & Stadler, PF. Stochastic pairwise alignments. Bioinformatics 18 Suppl. 2:8153-60. 2002). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotí- deos ou aminoácidos com o uso do pacote SEQALN de programas de alinhamento (Hardy, P. & Waterman, M. The Sequence Alignment Sof- tware Library at USC. 1997). Em uma modalidade, a presente revela- ção refere-se ao cálculo da porcentagem de identidade entre duas se- quências de polinucleotídeos ou aminoácidos com o uso do pacote SIM de programas de alinhamento, incluindo, porém sem limitação, GAP, NAP, LAP, etc. (Huang, X & Miller, W. A Time-Efficient, Linear- Space Local Similarity Algorithm. Advances in Applied Mathematics, vol. 12 (1991) 337-57). Em uma modalidade, a presente revelação re- fere-se ao cálculo da porcentagem de identidade entre duas sequên- cias de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento UGENE (Okonechnikov, K., Golosova, O. & Fursov, M. Unipro UGENE: a unified bioinformatics toolkit. Bioinformatics. 2012 28:1166-67). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de poli- nucleotídeos ou aminoácidos com o uso do programa de alinhamento BAli-Phy (Suchard, MA & Redelings, BD. BAli-Phy: simultaneous Ba- yesian inference of alignment and phylogeny. Bioinformatics. 22:2047-
48. 2006). Em uma modalidade, a presente revelação refere-se ao cál-
culo da porcentagem de identidade entre duas sequências de polinu- cleotídeos ou aminoácidos com o uso do programa de alinhamento Base-By-Base (Brodie, R., et. al.
Base-By-Base: Single nucleotide- level analysis of whole viral genoma alignments, BMC Bioinformatics, 5, 96, 2004). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de poli- nucleotídeos ou aminoácidos com o uso do programa de alinhamento DECIPHER (ES Wright (2015) "DECIPHER: harnessing local sequen- ce context to improve protein multiple sequence alignment." BMC Bioinformatics, doi:10.1186/s12859-015-0749-z.). Em uma modalida- de, a presente revelação refere-se ao cálculo da porcentagem de iden- tidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento FSA (Bradley, RK, et. al. (2009) Fast Statistical Alignment.
PLoS Computational Biology. 5:21000392). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento Geneious (Kearse, M,, et. al. (2012). Geneious Basic: an integrad and extendable desktop software platform for the organization and analysis of sequen- ce data.
Bioinformatics, 28(12), 1647-49). Em uma modalidade, a pre- sente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento Kalign (Lassmann, T. & Sonnhammer, E.
Kalign — an accurate and fast multiple sequence alignment algorithm.
BMC Bioinformatics 2005 6:298). Em uma modalidade, a presente re- velação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do progra- ma de alinhamento MAVID (Bray, N. & Pachter, L.
MAVID: Constrai- ned Ancestral Alignment of Multiple Sequences.
Genome Res. abril de 2004; 14(4): 693-99). Em uma modalidade, a presente revelação refe-
re-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa de ali- nhamento MSA (Lipman, DJ, et.al.
A tool for multiple sequence align- ment.
Proc.
Nat'l Acad.
Sci.
USA. 1989; 86:4412-15). Em uma modali- dade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre dois polinucleotídeos ou sequências de aminoácidos com o uso do programa de alinhamento MultAlin (Corpet, F., Multiple sequence alignment with hierarchial clustering.
Nucl.
Acids Res., 1988, 16(22), 10.881 a 10.890). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas se- quências de polinucleotídeos ou aminoácidos com o uso dos progra- mas de alinhamento LAGAN ou MLAGAN (Brudno, et. al.
LAGAN and MUIlti-LAGAN: efficient tools for large-scale multiple alignment of ge- nomic DNA.
Genome Research abril de 2003; 13(4): 721-31). Em uma modalidade, a presente revelação refere-se ao cálculo da porcenta- gem de identidade entre duas sequências de polinucleotídeos ou ami- noácidos com o uso do programa de alinhamento Opal (Wheeler, T.J., & Kececiouglu, J.D.
Multiple alignment by aligning alignments.
Procee- dings of the 15" ISCB conference on Intelligent Systems for Molecular Biology.
Bioinformatics. 23, i559-68, 2007). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do pacote PicXAA de programas, incluindo, porém sem limitação, PIcXAA, PIicXAA-R, PicXAA-Web, etc. (Mohammad, S., Sahraeian, E. & Yoon, B.
PicXAA: greedy probabilistic construction of maximum ex- pected accuracy alignment de multiple sequences.
Nucleic Acids Re- search. 38(15):4917-28. 2010). Em uma modalidade, a presente reve- lação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do progra- ma de alinhamento PSAlign (SZE, S.-H., Lu, Y., & Yang, Q. (2006) A polinomial time solvable formulation of multiple sequence alignment Journal of Computational Biology, 13, 309-19). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento StatAlign (Novák, Á., et.al. (2008) StatA- lign: an extendable software package for joint Bayesian estimation of alignments and evolutionary trees. Bioinformatics, 24(20):2.403 a
2.404). Em uma modalidade, a presente revelação refere-se ao cál- culo da porcentagem de identidade entre duas sequências de polinu- cleotídeos ou aminoácidos com o uso do programa de alinhamento Gap de Needleman e Wunsch (Needleman e Wunsch, Journal of Mo- lecular Biology 48:443-453, 1970). Em uma modalidade, a presente revelação refere-se ao cálculo da porcentagem de identidade entre duas sequências de polinucleotídeos ou aminoácidos com o uso do programa de alinhamento BestFit de Smith e Waterman (Smith e Wa- terman, Advances in Applied Mathematics, 2:482-489, 1981, Smith et al., Nucleic Acids Research 11:2205-2220, 1983). Esses programas produzem alinhamentos de múltiplas sequências biologicamente signi- ficativas de sequências divergentes. Os alinhamentos de melhor cor- respondência calculados para as sequências selecionadas são alinha- dos de modo que identidades, similaridades e diferenças possam ser observadas.
[0047] O termo "similaridade" refere-se a uma comparação entre sequências de aminoácidos e leva em consideração não só aminoáci- dos idênticos em posições correspondentes, mas também aminoáci- dos de funcionalidade similar em posições correspondentes. Desse modo, uma similaridade entre as sequências de polipeptídeos indica também uma similaridade funcional, além de similaridade de sequên- cia.
[0048] O termo "homologia" é, algumas vezes, usado para se refe-
rir ao nível de similaridade entre duas ou mais sequências de aminoá- cidos ou ácidos nucleicos em termos de porcentagem de identidade posicional (isto é, similaridade de sequência ou identidade). Homologia também refere-se ao conceito de relação evolucionária, em geral, evi- denciada por propriedades funcionais similares dentre diferentes áci- dos nucleicos ou proteínas que compartilham sequências similares.
[0049] Conforme usado no presente documento, o termo "varian- tes" significa sequências substancialmente similares. Para sequências de nucleotídeos, variantes de ocorrência natural podem ser identifica- das com o uso de técnicas de biologia molecular bastante conhecidas, tais como, por exemplo, com técnicas de reação em cadeia de polime- rase (PCR) e de hibridização conforme delineado no presente docu- mento.
[0050] Para as sequências de nucleotídeos, uma variante compre- ende uma deleção e/ou adição de um ou mais nucleotídeos em um ou mais sítios internos dentro do polinucleotídeo nativo e/ou uma substi- tuição de um ou mais nucleotídeos em um ou mais sítios no polinucle- otídeo nativo. Conforme usado no presente documento, uma sequên- cia de nucleotídeos "nativa" compreende uma sequência de nucleotí- deos de ocorrência natural. Para sequências de nucleotídeos, as vari- antes de ocorrência natural podem ser identificadas com o uso de téc- nicas de biologia molecular bem conhecidas, como, por exemplo, téc- nicas de reação em cadeia da polimerase (PCR) e hibridização, con- forme destacado abaixo. As sequências de nucleotídeos variantes também incluem sequências de nucleotídeos sinteticamente deriva- das, como aquelas geradas, por exemplo, usando-se mutagênese de local direcionado. Geralmente, as variantes de uma sequência de nu- cleotídeos particular da invenção terão pelo menos cerca de 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de se-
quência com aquela sequência de nucleotídeos particular conforme determinado por programas de alinhamento de sequência e parâme- tros descritos em outro local no presente documento. Uma variante biologicamente ativa de uma sequência de nucleotídeos da invenção pode diferir daquela sequência em tão pouco quanto 1 a 15 resíduos de ácido nucleico, em 1 a 10, como 6 a 10, em 5, 4, 3, 2 ou até mesmo 1 resíduo de ácido nucleico.
[0051] Conforme usado no presente documento, o termo "ligado de maneira funcional" refere-se a uma primeira sequência de ácidos nucleicos que é ligada de maneira funcional a uma segunda sequência de ácidos nucleicos quando a primeira sequência de ácidos nucleicos está em uma relação funcional com a segunda sequência de ácidos nucleicos. Por exemplo, um promotor é ligado de maneira funcional a uma sequência de codificação quando o promotor afeta a transcrição ou expressão da sequência de codificação. Quando produzidas de modo recombinante, sequências de ácidos nucleicos ligadas de ma- neira funcional são geralmente contíguas e, quando necessário, para unir duas regiões de codificação de proteína, no mesmo quadro de lei- tura. No entanto, os elementos não precisam ser contíguos para serem ligados de maneira funcional.
[0052] Conforme usado no presente documento, o termo "promo- tor" refere-se a uma região de DNA que geralmente está localizada a montante (em direção à região 5' de um gene) de um gene e é neces- sária para iniciar e acionar transcrição do gene. Um promotor pode permitir a ativação ou repressão apropriadas de um gene que o mes- mo controla. Um promotor pode conter sequências específicas que são reconhecidas por fatores de transcrição. Esses fatores podem se ligar a uma sequência de DNA de promotor, que resulta no recruta- mento de polimerase de RNA, uma enzima que sintetiza RNA da regi- ão de codificação do gene. O promotor geralmente refere-se a todos os elementos reguladores de gene localizados a montante do gene, incluindo, promotores a montante, UTR 5', íntrons e sequências líder.
[0053] Conforme usado no presente documento, o termo "promo- tor a montante" refere-se a uma sequência de polinucleotídeos contí- gua que é suficiente para direcionar iniciação de transcrição. Conforme usado no presente documento, um promotor a montante abrange o sítio de iniciação de transcrição com diversos motivos de sequência, que incluem TATA Box, sequência de iniciadores, elementos de reco- nhecimento de TFIIB e outros motivos de promotor (Jennifer, E.F. et al., (2002) Genes & Dev., 16: 2583-2592). O promotor a montante for- nece o sítio de ação para polimerase de RNA Il que é uma enzima de múltiplas subunidades com os fatores basais ou gerais de transcrição como, TFIL A, B, D, E, F e H. Esses fatores se agrupam em um com- plexo de pré-iniciação de transcrição que catalisa a síntese de RNA do modelo de DNA.
[0054] A ativação do promotor a montante é realizada pela se- quência adicional de elementos reguladores de sequência de DNA aos quais diversas proteínas se ligam e interagem de modo subsequente com o complexo de iniciação de transcrição para ativar expressão de gene. Essas sequências de elementos reguladores de genes intera- gem com fatores de ligação de DNA específicos. Esses motivos de sequência podem, algumas vezes, ser denominados de elementos cis. Tais elementos cis, aos quais fatores de transcrição específicos de de- senvolvimento ou específicos de tecido se ligam, individualmente ou em combinação, podem determinar o padrão de expressão espaço- temporal de um promotor no nível de transcrição. Esses elementos cis variam amplamente no tipo de controle que os mesmos exercem em genes ligados de maneira funcional. Alguns elementos atuam para aumentar a transcrição de genes ligados de maneira funcional em res- posta a respostas ambientais (por exemplo, temperatura, umidade e ferimento). Outros elementos cis podem responder a sugestões de- senvolvimentais (por exemplo, germinação, maturação de semente e florescimento) ou a informações espaciais (por exemplo, especificida- de de tecido). Consultar, por exemplo, Langridge et a/., (1989) Proc. Natl. Acad. Sci. USA 86:3219-23. Esses cis-elementos estão localiza- dos em uma distância variável de ponto de partida de transcrição, al- guns elementos cis (chamados elementos proximais) são adjacentes a uma região de promotor de núcleo mínimo enquanto outros elementos podem ser posicionados diversos quilobases a montante ou a jusante do promotor (intensificadores).
[0055] Conforme usado no presente documento, os termos "região não traduzida 5"" ou "UTR 5" são definidos como o segmento não tra- duzido no terminal 5' de pré-mRNAs ou mMRNAs maduros. Por exem- plo, em mRNAs maduros, uma UTR 5' tipicamente abriga em sua ex- tremidade 5' uma cap de 7-metilguanosina e é envolvida em muitos processos, como splicing, poliadenilação, exportação de mRNA em direção ao citoplasma, identificação da extremidade 5' do mMRNA pelo maquinário de tradução e proteção dos mMRNAs contra degradação.
[0056] Conforme usado no presente documento, o termo "íntron" refere-se a qualquer sequência de ácidos nucleicos compreendida em um gene (ou sequência de polinucleotídeos expressada de interesse) que é transcrito, mas não traduzido. Íntrons incluem sequência de áci- dos nucleicos não traduzida em uma sequência expressa de DNA, as- sim como a sequência correspondente em moléculas de RNA transcri- tas a partir da mesma. Um construto descrito no presente documento também pode conter sequências que intensificam a tradução e/ou es- tabilidade de MRNA, como íntrons. Um exemplo de tal íntron é o pri- meiro íntron de gene Il da variante histona H3 de Arabidopsis thaliana ou qualquer outra sequência de íntrons comumente conhecida. Os ín- trons podem ser usados em combinação com uma sequência promoto-
ra para intensificar a tradução e/ou estabilidade de MRNA.
[0057] Conforme usado no presente documento, os termos "termi- nador de transcrição" ou "terminador" são definidos como o segmento transcrito no terminal 3' de pré-mRNAs ou mMRNAs maduros. Por exemplo, estiramentos mais longos de DNA além do sítio de "sinal de poliadenilação" são transcritos como um pré-mRNA. Essa sequência de DNA normalmente contém sinal de terminação de transcrição para o processamento apropriado do pré-mRNA em mRNA maduro.
[0058] Conforme usado no presente documento, o termo "região não traduzida 3" ou "UTR 3"' é definido como o segmento não traduzi- do em um terminal 3' dos pré-mRNAs ou mRNAs maduros. Por exem- plo, em mRNAs maduros, essa região abriga a cauda poli-(A) e é co- nhecida por ter muitos papéis na estabilidade do MRNA, iniciação de tradução e exportação de mRNA. Além disso, a UTR 3' é considerada como incluindo o sinal de poliadenilação e terminador de transcrição.
[0059] Conforme usado no presente documento, o termo "sinal de poliadenilação" designa uma sequência de ácidos nucleicos pre- sentes em transcrições de MRNA que permitem transcrições, quando na presença de uma poli-(A) polimerase, a ser poliadenilado no sítio de poliadenilação, por exemplo, localizado 10 a 30 bases a jusante do poli-(A) sinal. Muitos sinais de poliadenilação são conhecidos na técni- ca e são úteis para a presente invenção. Uma sequência exemplificati- va inclui AAUAAA e variantes dos mesmos, como descrito em Loke J., et al., (2005) Plant Physiology 138(3); 1457-1468.
[0060] Um "transgene de ligação de DNA" é uma sequência de codificação de polinucleotídeo que codifica uma proteína de ligação de DNA. A proteína de ligação de DNA tem capacidade de se ligar de modo subsequente a outra molécula. Uma proteína de ligação pode se ligar a, por exemplo, uma molécula de DNA (uma proteína de ligação de DNA), uma molécula de RNA (uma proteína de ligação de RNA),
e/ou uma molécula de proteína (uma proteína de ligação de proteína). No caso de uma proteína de ligação de proteína, a mesma pode se ligar a si mesma (para formar homodímeros, homotrímeros, etc.) e/ou pode se ligar a uma ou mais moléculas de uma proteína diferente ou proteínas diferentes. Uma proteína de ligação pode ter mais de um tipo de atividade de ligação. Por exemplo, proteínas de dedo de zinco têm ligação de DNA, ligação de RNA e atividade de ligação de proteína.
[0061] Exemplos de proteínas de ligação de DNA incluem; me- ganucleases, dedos de zinco, CRISPRs, e domínios de ligação de TA- LEN que podem ser "geneticamente modificados" para se ligar a uma sequência de nucleotídeos predeterminada. Tipicamente, as proteínas de ligação de DNA geneticamente modificadas (por exemplo, dedos de zinco, CRISPRs ou TALEN) são proteínas que são de ocorrência não natural. Exemplos não limitantes de métodos para proteínas de ligação de DNA geneticamente modificadas são projeto e seleção. Uma prote- ína de ligação de DNA projetada é uma proteína de ocorrência não natural cujo projeto/composição resulta principalmente a partir de crité- rios racionais. Os critérios racionais para projeto incluem aplicação de regras de substituição e algoritmos computadorizados para processar informações em um banco de dados que armazena informações de projetos de ZFP, CRISPR e/ou TALEN existentes e dados de ligação. Consultar, por exemplo, Patentes dos EUA 6.140.081; 6.453.242; e
6.534.261; consultar também WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 e WO 03/016496 e Pedido dos EUA n.º 20110301073, 20110239315 e 20119145940.
[0062] Uma "proteína de ligação de DNA de dedo de zinco" (ou domínio de ligação) é uma proteína, ou um domínio dentro de uma proteína maior, que liga DNA de uma maneira específica de sequência através de um ou mais dedos de zinco, que são regiões de sequência de aminoácidos dentro do domínio de ligação cuja estrutura é estabili-
zada através de coordenação de um fon de zinco. O termo proteína de ligação de DNA de dedo de zinco é, em geral, abreviado como proteí- na de dedo de zinco ou ZFP. Os domínios de ligação de dedo de zinco podem ser "geneticamente modificados" para se ligarem a uma se- quência de nucleotídeos predeterminada. Exemplos não limitantes de métodos para modificar geneticamente proteínas de dedo de zinco são projeto e seleção. Uma proteína de dedo de zinco projetada é uma proteína de ocorrência não natural cujo projeto/composição resulta principalmente a partir de critérios racionais. Os critérios racionais para projeto incluem aplicação de regras de substituição e algoritmos com- putadorizados para processar informações em um banco de dados que armazena informações de projetos de ZFP existente e dados de ligação. Consultar, por exemplo, as Patentes dos EUA n.º* 6.140.081;
6.453.242; 6.534.261 e 6.794.136; consultar também WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 e WO 03/016496.
[0063] Em outros exemplos, o domínio de ligação de DNA de uma ou mais das nucleases compreende um domínio de ligação de DNA de efetor de TAL de ocorrência natural ou geneticamente modificado (ocorrência não natural). Consultar, por exemplo, Pedido de Patente do n.º 20110301073, incorporado a título de referência em sua totali- dade no presente documento. As bactérias patogênicas de plantas do gênero Xanthomonas são conhecidas por causarem muitas doenças em plantas de cultura importantes. A patogenicidade de Xanthomonas depende de um sistema de secreção de tipo Ill conservada (T3S) que injeta mais do que proteínas efetoras diferentes na célula vegetal. Dentre essas proteínas injetadas estão efetores do tipo ativador de transcrição (TALEN) que imitam ativadores transcricionais de planta e manipulam o transcritoma de planta (consultar Kay et al., (2007) Sci- ence 318:648-651). Essas proteínas contêm um domínio de ligação de DNA e um domínio de ativação transcricional. Um dos efetores de TAL mais bem caracterizados é AvrBs3 de Xanthomonas campestgris pv. Vesicatoria (consultar Bonas et al., (1989) Mol Gen Genet 218: 127- 136 e WO2010079430). Os efetores de TAL contêm um domínio cen- tralizado de repetições em tandem, em que cada repetição contém aproximadamente 34 aminoácidos, que são chave para a especificida- de de ligação de DNA dessas proteínas. Além disso, os mesmos con- têm uma sequência de localização nuclear e um domínio ácido de ati- vação transcricional (para uma avaliação, consultar Schornack S, et al., (2006) J Plant Physiol 163(3): 256-272). Além disso, dois genes nas bactérias fitopatogênicas Ralstonia solanacearum, designados brg11 e hpx17, foram constatados como sendo homólogos à família AvrBs3 de Xanthomonas na cepa biovar R. Solanacearum GMI1000 e na cepa biovar 4 R$1000 (Consultar Heuer et a/., (2007) Appl and En- viro Micro 73(13): 4379-4384). Esses genes são 98,9% idênticos em sequência de nucleotídeos entre si, mas diferem por uma deleção de
1.575 pb no domínio de repetição de hpx17. No entanto, ambos os produtos de gene têm menos do que 40% de identidade de sequência com proteínas de família AvrBs3 de Xanthomonas. Consultar, por exemplo, Pedido de Patente dos EUA n.º 20110301073, incorporado a título de referência em sua totalidade.
[0064] A especificidade desses efetores de TAL depende das se- quências constatadas nas repetições em tandem. A sequência repeti- da compreende aproximadamente 102 pb e as repetições são tipica- mente 91 a 100% homólogas entre si (Bonas et al., ibid). O polimor- fismo das repetições está normalmente localizado nas posições 12 e 13 e parece ser uma correspondência de um para um entre a identida- de dos dirresíduos hipervariáveis nas posições 12 e 13 com a identi- dade dos nucleotídeos contíguos na sequência alvo do efetor de TAL (consultar Moscou e Bogdanove, (2009) Science 326:1501 e Boch et al., (2009) Science 326:1509-1512). Experimentalmente, o código na-
tural para reconhecimento de DNA desses efetores de TAL foi deter- minado de modo que uma sequência de HD nas posições 12 e 13 leva a uma ligação à citosina (C), NG se liga a T, NIa A, C, G ou T, NN se liga a A ou G, e ING se liga a T. Essas repetições de ligação de DNA foram agrupadas em proteínas com novas combinações e números de repetições, para produzir fatores artificiais de transcrição que têm ca- pacidade de interagir com novas sequências e ativar a expressão de um gene-repórter não endógeno em células vegetais (Boch et al., ibid). As proteínas de TAL geneticamente modificadas foram ligadas a um meio domínio de clivagem de Fokl para produzir uma fusão de nu- clease de domínio de efetor de TAL (TALEN) que exibe atividade em um ensaio de repórter de levedura (alvo à base de plasmídeo).
[0065] O sistema de nuclease de CRISPR (Repetições Palindrô- micas Curtas Interespaçadas Regularmente Agrupadas)/Cas (CRISPR Associado) é um sistema de nuclease recentemente geneticamente modificado com base em um sistema bacteriano que pode ser usado para manipulação genética de genoma. O mesmo tem como base, em parte, a resposta imune adaptativa de muitas bactérias e Archaea. Quando um vírus ou plasmídeo invade uma bactéria, segmentos do DNA do invasor são convertidos em RNA de CRISPR (crRNA) pela resposta "imune". Esse crRNA, então, se associa, através de uma re- gião de complementaridade parcial, com outro tipo de RNA chamado tracrRNA para guiar a nuclease de Cas9 para uma região homóloga ao crRNA no DNA alvo chamado um "protoespaçador." Cas9 realiza a clivagem do DNA para gerar extremidades sem corte na ruptura de fita dupla (DSB) em sítios especificados por uma sequência guia de 20 nucleotídeos contida dentro da transcrição de crRNA. Cas9 necessita tanto do crRNA quanto do tracrRNA para reconhecimento de DNA es- pecífico de sítio e clivagem. Esse sistema foi, agora, geneticamente modificado de modo que o crRNA e o tracrRNA possam ser combina-
dos em uma molécula (o "único RNA guia"), e a porção equivalente de crRNA do único RNA guia pode ser geneticamente modificada para guiar a nuclease de Cas9 para alvejar qualquer sequência desejada (consultar Jinek et a/l., (2012) Science 337, páginas 816-821, Jinek et al., (2013), eLife 2:200471, e David Segal, (2013) eLife 2:200563). Em outros exemplos, o crRNA se associa ao tracrRNA para guiar a nu- clease de Cpf1i para uma região homóloga ao crRNA para clivar DNA com extremidades escalonadas (consultar Zetsche, Bernd, et al. Cell
163.3 (2015): 759-771.). Desse modo, o sistema de CRISPR/Cas pode ser geneticamente modificado para criar um DSB em um alvo deseja- do em um genoma, e a reparação do DSB pode ser influenciada pelo uso de inibidores de reparação para ocasionar um aumento em reparo propenso a erro.
[0066] Em outros exemplos, o transgene/sequência de codificação heteróloga de ligação de DNA é uma nuclease específica de sítio que compreende uma Meganuclease geneticamente modificada (ocorrên- cia não natural) (também descrita como uma endonuclease de migra- ção). As sequências de reconhecimento de endonucleases ou me- ganucleases de migração como |-Scel, |-Ceul, PI-Pspl, Pl-Sce, |- ScelV, I-Csml, |-Panl, I-Scell, I-Ppol, I-Scelll, |-Crel, |-Teul, |-Tevll e |- Tevlll são conhecidas. Consultar também Patente dos EUA n.º 5,420,032; Patente dos EUA n.º 6.833.252; Belfort et a/., (1997) Nu- cleic Acids Res. 25:3379-30 3388; Dujon et a/., (1989) Gene 82:115- 118; Perler et a/., (1994) Nucleic Acids Res. 22, 11127; Jasin (1996) Trends Genet. 12:224—-228; Gimble et a/l., (1996) J. Mol. Biol. 263:163- 180; Argast et al., (1998) J. Mol. Biol. 280:345-353 e o catálogo New England Biolabs. Além disso, a especificidade de ligação de DNA de endonucleases e meganucleases de migração pode ser geneticamen- te modificada para se ligar a sítios de alvo não naturais. Consultar, por exemplo, Chevalier et a/., (2002) Molec. Cell 10:895-905; Epinat et al.,
(2003) Nucleic Acids Res. 5 31:2952-2962; Ashworth et a/., (2006) Na- ture 441:656-659; Paques et al., (2007) Current Gene Therapy 7:49- 66; Pedido de Patente dos EUA n.º 20070117128. Os domínios de |li- gação de DNA das endonucleases e meganucleases de migração po- dem ser alterados no contexto da nuclease como um todo (isto é, de modo que a nuclease inclua o domínio de clivagem de cognato) ou possa ser fundida a um domínio de clivagem heterólogo.
[0067] Conforme usado no presente documento, o termo "trans- formação" abrange todas as técnicas que uma molécula de ácido nu- cleico pode ser introduzida em tal célula. Exemplos incluem, porém sem limitação: transfecção com vetores virais; transformação com ve- tores de plasmídeo; eletroporação; lipofecção; microinjeção (Mueller et al., (1978) Cell 15:579-85); transferência mediada por Agrobacterium; absorção de DNA direta; transformação mediada por WHISKERS'Y"; e bombardeamento de microprojétil. Essas técnicas podem ser usadas tanto para transformação estável quanto transformação transitória de uma célula vegetal. "Transformação estável" refere-se à introdução de um fragmento de ácido nucleico em um genoma de um organismo hospedeiro resultando em herança geneticamente estável. Após trans- formação estável, o fragmento de ácido nucleico é integrado de forma estável no genoma do organismo hospedeiro e qualquer geração sub- sequente. Os organismos hospedeiros que contêm os fragmentos de ácido nucleico transformados são chamados de organismos "transgê- nicos". "Transformação transiente" refere-se à introdução de um frag- mento de ácido nucleico no núcleo, ou organela que contém DNA, de um organismo hospedeiro, resultando na expressão gênica sem he- rança geneticamente estável.
[0068] Uma sequência exógena de ácidos nucleicos. Em um exemplo, um transgene/sequência de codificação heteróloga é uma sequência de genes (por exemplo, um gene resistente a herbicida), um gene que codifica um composto industrial ou farmaceuticamente útil, ou um gene que codifica um traço agrícola desejado. Em ainda outro exemplo, o transgene/sequência de codificação heteróloga é uma se- quência de ácidos nucleicos antissenso, em que a expressão da se- quência de ácidos nucleicos antissenso inibe a expressão de uma se- quência de ácidos nucleicos alvo. Um transgene/sequência de codifi- cação heteróloga pode conter sequências reguladoras ligadas de ma- neira funcional ao transgene/sequência de codificação heteróloga (por exemplo, um promotor). Em algumas modalidades, uma sequência de polinucleotídeos de interesse é um transgene. No entanto, em outras modalidades, uma sequência de polinucleotídeos de interesse é uma sequência endógena de ácidos nucleicos, em que cópias genômicas adicionais da sequência endógena de ácidos nucleicos são desejadas, ou uma sequência de ácidos nucleicos que está na orientação antis- senso em relação à sequência de uma molécula alvo de ácido nucleico no organismo hospedeiro.
[0069] Conforme usado no presente documento, o termo um "evento" transgênico é produzido pela transformação de células vege- tais com DNA heterólogo, isto é, um construto de ácido nucleico que inclui um transgene/sequência de codificação heteróloga de interesse, regeneração de uma população de plantas que resulta da inserção do transgene/sequência de codificação heteróloga no genoma da planta, e seleção de uma planta particular caracterizada pela inserção em uma localização de genoma particular. O termo "evento" refere-se ao transformador original e progênie da transformação que incluem o DNA heterólogo. O termo "evento" também refere-se a progênie pro- duzida por um cruzamento sexual entre o transformante e outra varie- dade que inclui o DNA genômico/transgene. Mesmo após retrocruza- mento repetido para um parente recorrente, o DNA de transge- ne/sequência de codificação heteróloga inserida e DNA genômico de flanqueamento (DNA genômico/transgene) do parente transformado está presente na progênie do cruzamento na mesma localização cro- mossômica. O termo "evento" também refere-se ao DNA do transfor- mante original e progênie do mesmo que compreende o DNA inserido e sequência genômica de flanqueamento imediatamente adjacente ao DNA inserido que se esperava que fosse transferido para uma progê- nie que recebe DNA inserido, incluindo o transgene/sequência de codi- ficação heteróloga de interesse como resultado de um cruzamento se- xual de uma linhagem parental que inclui o DNA inserido (por exemplo, o transformante original e progênie que resultam de autopolinização) e uma linhagem parental que não contém o DNA inserido.
[0070] Conforme usado no presente documento, os termos "Rea- ção de Cadeia de Polimerase" ou "PCR" definem um procedimento ou técnica na qual quantidades por minuto de ácido nucleico, RNA e/ou DNA são amplificadas, como descrito na Pat. dos EUA n.º 4.683.195 emitida em 28 de julho de 1987. Em geral, as informações de sequên- cia das extremidades da região de interesse ou além precisam estar disponíveis, de modo que iniciadores de oligonucleotídeo possam ser projetados; esses iniciadores serão idênticos ou similares em sequên- cia às fitas opostas do modelo a ser amplificado. Os nucleotídeos de terminal 5' dos dois iniciadores podem coincidir com as extremidades do material amplificado. PCR pode ser usada para amplificar sequên- cias de RNA específicas, sequências de DNA específicas de DNA ge- nômico total, e cDNA transcrito do RNA celular total, sequências de bacteriófago ou plasmídeo, etc. Consultar geralmente Mullis et al., Cold Spring Harbor Symp. Quant. Biol., 51:263 (1987); Erlich, ed., PCR Technology, (Stockton Press, NY, 1989).
[0071] Conforme usado no presente documento, o termo "inicia- dor" refere-se a um oligonucleotídeo com capacidade de atuar como um ponto de iniciação de síntese ao longo de uma fita complementar quando condições são adequadas para síntese de um produto de ex- tensão de iniciador. As condições de sintetização incluem a presença de quatro trifosfatos de desoxirribonucleotídeo diferentes e pelo menos um agente de indução de polimerização como transcriptase reversa ou DNA polimerase. Os mesmos estão presentes em um tampão ade- quado, que pode incluir constituintes que são cofatores ou que afetam condições, como pH e similares em diversas temperaturas adequadas. Um iniciador é, de preferência, uma sequência de fita única, de modo que a eficiência de amplificação seja ideal, mas sequências de fita du- pla possam ser utilizadas.
[0072] Conforme usado no presente documento, o termo "sonda" refere-se a um oligonucleotídeo que hibridiza para uma sequência al- vo. No procedimento de ensaio TaqManº ou de estilo TaqManº, a sonda hibridiza para uma porção do alvo situada entre o sítio de reco- zimento dos dois iniciadores. Uma sonda inclui cerca de oito nucleotí- deos, cerca de dez nucleotídeos, cerca de quinze nucleotídeos, cerca de vinte nucleotídeos, cerca de trinta nucleotídeos, cerca de quarenta nucleotídeos, ou cerca de cinquenta nucleotídeos. Em algumas moda- lidades, uma sonda inclui de cerca de oito nucleotídeos a cerca de quinze nucleotídeos. Uma sonda pode incluir ainda uma identificação detectável, por exemplo, um fluoróforo (Texas-Redº, isotiocianato de fluoresceína, etc.,). A identificação detectável pode ser fixada de modo covalente diretamente ao oligonucleotídeo de sonda, por exemplo, lo- calizado na extremidade 5' da sonda ou na extremidade 3' da sonda. Uma sonda que inclui um fluoróforo pode também incluir ainda um ar- refecedor brusco, por exemplo, Black Hole QuencherT"Y, lowa Black'"Y, etc.
[0073] Conforme usado no presente documento, os termos "endo- nucleases de restrição" e "enzimas de restrição" se referem a enzimas bacterianas, cada uma das quais corta o DNA de fita dupla em, ou próximo a, uma sequência específica de nucleotídeos. As enzimas de restrição do tipo 2 reconhecem e clivam DNA no mesmo sítio e inclu- em, porém sem limitação, Xbal, BamHlI, Hindlll, EcoRI, Xhol, Sall, Kpnl, Aval, Pstl e Smal.
[0074] Conforme usado no presente documento, o termo "vetor" é usado de modo intercambiável com os termos "construto", "vetor de clonagem" e "vetor de expressão" e significam o veículo pelo qual uma sequência de DNA ou RNA (por exemplo, um gene exógeno) pode ser introduzida em uma célula hospedeira, de modo a transformar o hos- pedeiro e promover a expressão (por exemplo, transcrição e tradução) da sequência introduzida. Um "vetor não viral" se destina a significar qualquer vetor que não compreende um vírus ou retrovírus. Em algu- mas modalidades, um "vetor " é uma sequência de DNA que compre- ende pelo menos uma origem de replicação de DNA e pelo menos um gene de marcador selecionável. Exemplos incluem, porém sem limita- ção, um plasmídeo, cosmídeo, bacteriófago, cromossomo artificial bac- teriano (BAC), ou vírus que transporta DNA exógeno em uma célula. Um vetor também pode incluir um ou mais genes, moléculas antissen- So, e/ou genes de marcador selecionável e outros elementos genéticos conhecidos na técnica. Um vetor pode transduzir, transformar ou infec- tar uma célula, fazendo, dessa maneira, com que a célula expresse as moléculas de ácido nucleico e/ou proteínas codificadas pelo vetor.
[0075] O termo "plasmídeo" define uma fita circular de ácido nu- cleico com capacidade de replicação autossomal tanto em uma célula hospedeira procariótica como uma eucariótica. O termo inclui ácido nucleico que pode ser ou DNA ou RNA e pode ser de fita única ou du- pla. O plasmídeo da definição também pode incluir as sequências que correspondem a uma origem bacteriana de replicação.
[0076] Conforme usado no presente documento, o termo "gene de marcador selecionável" conforme usado no presente documento define um gene ou outro cassete de expressão que codifica uma proteína que facilita a identificação de células nas quais o gene de marcador seleci- onável é inserido. Por exemplo, um "gene de marcador selecionável" abrange genes-repórter, assim como genes usados em transformação de planta para, por exemplo, proteger células vegetais de um agente seletivo ou fornecer resistência/tolerância a um agente seletivo. Em uma modalidade, apenas essas células ou plantas que recebem um marcador selecionável funcional têm capacidade de se dividir ou se- rem cultivadas mediante condições que têm um agente seletivo. A ex- pressão "marcador positivo" refere-se a plantas que foram transforma- das para incluir um gene de marcador selecionável.
[0077] Conforme usado no presente documento, o termo "marca- dor detectável" refere-se a uma identificação com capacidade de de- tecção, como, por exemplo, um radioisótopo, composto fluorescente, composto bioluminescente, um composto quimioluminescente, quelan- te de metal, ou enzima. Exemplos de marcadores detectáveis incluem, porém sem limitação, o seguinte: identificações fluorescentes (por exemplo, FITC, rodamina, fósforos lantanídeos), identificações enzi- máticas (por exemplo, peroxidase de rábano, B-galactosidase, lucife- rase, fosfatase alcalina), quimioluminescência, grupos biotinila, epíto- pos de polipeptídeo predeterminados reconhecidos por um repórter secundário (por exemplo, sequências de par de zíper de leucina, sítios de ligação para anticorpos secundários, domínios de ligação de metal, etiquetas de epítopo). Em uma modalidade, um marcador detectável pode ser fixado por braços espaçadores de diversos comprimentos para reduzir impedimento estérico potencial.
[0078] Conforme usado no presente documento, os termos "casse- te", "cassete de expressão" e "cassete de expressão de gene" se refe- rem a um segmento de DNA que pode ser inserido em um ácido nu- cleico ou polinucleotídeo em sítios de restrição específicos ou por re-
combinação homóloga. Conforme usado no presente documento, o segmento de DNA compreende um polinucleotídeo que codifica um polipeptídeo de interesse, e o cassete e sítios de restrição são projeta- dos para garantir a inserção do cassete no quadro de leitura apropria- do para transcrição e tradução. Em uma modalidade, um cassete de expressão pode incluir um polinucleotídeo que codifica um polipeptí- deo de interesse e que tem elementos além do polinucleotídeo que facilitam a transformação de uma célula hospedeira específica. Em uma modalidade, um cassete de expressão de gene também pode in- cluir elementos que permitem a expressão aperfeiçoada de um polinu- cleotídeo que codifica um polipeptídeo de interesse em uma célula hospedeira. Esses elementos podem incluir, porém sem limitação: um promotor, um promotor mínimo, um intensificador, um elemento de resposta, uma sequência de terminador, uma sequência de poliadeni- lação e similares.
[0079] Conforme usado no presente documento, um "ligante" ou "espaçador" é uma ligação, molécula ou grupo de moléculas que ligam duas entidades separadas entre si. Ligantes e espaçadores podem fornecer um espaçamento ideal das duas entidades ou podem forne- cer ainda uma ligação lábil que permite que as duas entidades sejam separadas umas das outras. As ligações lábeis incluem grupos fotocli- váveis, porções químicas ácidas-lábeis, porções químicas de base- lábeis e grupos cliváveis por enzima. Os termos "poliligante" ou "múlti- plos sítios de clonagem", conforme usados no presente documento, definem um agrupamento de três ou mais sítios de enzima de restrição de Tipo 2 localizados dentro de 10 nucleotídeos uns em relação aos outros em uma sequência de ácidos nucleicos. Em outros exemplos, o termo "poliligante", conforme usado no presente documento, refere-se a um estiramento de nucleotídeos que são alvejados para unir duas sequências por meio de qualquer método de clonagem contínuo co-
nhecido (isto é, Gibson Assembly&, NEBuilder HIFIDNA Assembly&O, Golden Gate Assembly, BioBrick& Assembly, etc.). Os construtos que compreendem um poliligante são utilizados para a inserção e/ou exci- são de sequências de ácidos nucleicos como a região de codificação de um gene.
[0080] Conforme usado no presente documento, o termo "controle" refere-se a uma amostra usada em um procedimento analítico para propósitos de comparação. Um controle pode ser "positivo" ou "negati- vo". Por exemplo, quando o propósito de um procedimento analítico é detectar uma transcrição expressa de modo diferente ou polipeptídeo em células ou tecido, é geralmente preferencial incluir um controle po- sitivo, como uma amostra de uma planta conhecida que exibe a ex- pressão desejada, e um controle negativo, como uma amostra de uma planta conhecida que não tem a expressão desejada.
[0081] Conforme usado no presente documento, o termo "planta" inclui uma planta completa e qualquer descendente, célula, tecido ou parte de uma planta. Uma classe de planta que pode ser usada na presente invenção é geralmente tão abrangente quanto a classe de plantas inferiores e superiores passíveis de mutagênese, incluindo an- giospermas (plantas monocotiledôneas e dicotiledôneas), gimnosper- mas, samambaias e algas multicelulares. Desse modo, "planta" inclui plantas monocotiledôneas e dicotiledôneas. O termo "partes de planta" inclui qualquer parte (ou quaisquer partes) de uma planta, incluindo, por exemplo e sem limitação: semente (incluindo semente madura e semente não madura); um corte de planta; uma célula vegetal; uma cultura de célula vegetal; um órgão de planta (por exemplo, pólen, em- briões, flores, frutos, brotos, folhas, raízes, caules e explantes). Um tecido de planta ou órgão de planta pode ser uma semente, protoplas- to, calo ou qualquer outro grupo de células vegetais que é organizado em uma unidade estrutural ou funcional. Uma célula vegetal ou cultura de tecido pode ter a capacidade de regenerar uma planta que tem as características fisiológicas e morfológicas da planta a partir da qual a célula ou tecido foi obtido, e de regenerar uma planta que tem subs- tancialmente o mesmo genótipo que a planta. Em contrapartida, algu- mas células vegetais não têm capacidade de serem regeneradas para produzir plantas. As células regeneráveis em uma célula vegetal ou cultura de tecido podem ser embriões, protoplastos, células meriste- máticas, calo, pólen, folhas, anteras, raízes, pontas de raiz, seda, flo- res, grãos, espigas, sabugos, cascas ou caules.
[0082] As partes de planta incluem partes passíveis de colheita e partes úteis para a propagação de plantas de progênie. As partes de planta úteis para propagação incluem, por exemplo, e sem limitação: semente; fruta; um corte; uma muda; um tubérculo; e um porta- enxerto. Uma parte passível de colheita de uma planta pode ser qual- quer parte útil de uma planta, incluindo, por exemplo, e sem limitação: flor; pólen; muda; tubérculo; folha; caule; fruta; semente; e raiz.
[0083] Uma célula vegetal é a unidade estrutural e fisiológica da planta, que compreende um protoplasto e uma parede celular. Uma célula vegetal pode estar na forma de uma única célula isolada, ou um agregado de células (por exemplo, um calo friável e uma célula culti- vada), e pode ser parte de uma unidade organizada superior (por exemplo, um tecido de planta, órgão de planta, e planta). Desse modo, uma célula vegetal pode ser um protoplasto, um gameta que produz célula, ou uma célula ou coleção de células que podem se regenerar em uma planta completa. Dessa maneira, uma semente, que compre- ende múltiplas células vegetais e tem capacidade de se regenerar em uma planta completa, é considerada uma "célula vegetal" em modali- dades no presente documento.
[0084] Conforme usado no presente documento, o termo "RNA pequeno" refere-se a diversas classes de ácido ribonucleico de não codificação (necRNA). O termo RNA pequeno descreve as cadeias cur- tas de ncRNA produzido em células bacterianas, animais, plantas e fungos. Essas cadeias curtas de ncºRNA podem ser produzidas natu- ralmente dentro da célula ou podem ser produzidas pela introdução de uma sequência exógena que expressa a cadeia curta ou ncRNA. As sequências de RNA pequeno não codificam diretamente uma proteína, e diferem em função de outro RNA uma vez que as sequências de RNA pequeno são apenas transcritas e não traduzidas. As sequências de RNA pequeno são envolvidas em outras funções celulares, incluin- do expressão de gene e modificação. As moléculas RNA pequeno são normalmente constituídas de cerca de 20 a 30 nucleotídeos. As se- quências de RNA pequeno podem ser derivadas de precursores mais longos. Os precursores formam estruturas que se dobram novamente umas nas outras em regiões autocomplementares; os mesmos são, então, processados pela nuclease Dicer em animais ou DCL1 em plan- tas.
[0085] Existem muitos tipos de RNA pequeno, tanto naturais quan- to produzidos artificialmente, incluindo microRNAs (mIiRNA), RNAs cur- tos de interferência (siRNA), RNAs antissenso, RNA curto em formato de grampo (sShRNA), e RNAs nucleolares pequenos (snoRNA). Deter- minados tipos de RNA pequeno, como microRNA e siRNA, são impor- tantes no silenciamento de gene e interferência de RNA (RNAi). O si- lenciamento de gene é um processo de regulação genética no qual um gene que seria normalmente expresso é "desligado" por um elemento intracelular, nesse caso, o RNA pequeno. A proteína que seria nor- malmente formada por essas informações genéticas não é formada devido à interferência, e as informações codificadas no gene são blo- queadas da expressão.
[0086] Conforme usado no presente documento, o termo "RNA pequeno" abrange moléculas de RNA descritas na literatura como
"RNA minúsculo" (Storz, (2002) Science 296:1260-3; Illangasekare et al., (1999) RNA 5:1482-1489); "RNA pequeno" procariótico (SRNA) (Wassarman et al., (1999) Trends Microbiol. 7:37-45); "RNA de não codificação (ncRNA)" eucariótico; "micro-RNA (mMIRNA)"; "não mMRNA pequeno (snMRNA)"; "RNA funcional (fRNA)"; "RNA de transferência (tRNA)"; "RNA catalítico" [por exemplo, ribozimas, incluindo ribozimas de auto-acilação (Illangaskare et a/., (1999) RNA 5:1482-1489); "RNAs nucleolares pequenos (snoRNAs)," "!mRNA" (também conhecido como "10S RNA," Muto et a/., (1998) Trends Biochem Sci. 23:25 a 29; e Gil- let et al., (2001) Mol Microbiol. 42:879-885); moléculas de RNAi, inclu- indo sem limitação "RNA pequeno de interferência (siIRNA)," "siRNA preparado por endoribonuclease (e-siRNA)," "RNA curto em formato de grampo (shRNA);" e "RNA regulado temporariamente pequeno (StRNA)," "siRNA cortado (d-siRNA)," e aptâmeros, oligonucleotídeos e outros ácidos nucleicos sintéticos que compreendem pelo menos uma base de uracila.
[0087] A menos que especificamente explicado de outro modo, todos os termos técnicos e científicos usados no presente documento têm o mesmo significado que o comumente entendido por aqueles de habilidade comum na técnica a qual essa revelação pertence. As defi- nições de termos comuns em biologia molecular podem ser constata- das em, por exemplo: Lewin, Genes V, Oxford University Press, 1994 (ISBN 0-19-854287-9); Kendrew et al. (eds.), The Encyclopedia of Mo- lecular Biology, Blackwell Science Ltd., 1994 (ISBN 0-632-02182-9); e Meyers (ed.), Molecular Biology and Biotechnology: A Comprehensive Desk Reference, VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8). Ill. Elementos Reguladores de Gene GmTEFs1 e Ácidos Nucleicos que compreendem os mesmos
[0088] São fornecidos métodos e composições para usar um pro- motor de um gene Glyma19g07240 (fator de alongamento 1 alfa) de
Glycine max para expressar transgenes não GmMTEFs1 em plantas. Em uma modalidade, um promotor pode ser um promotor de gene GmTEFs1 da SEQ ID NO:2.
[0089] Em uma modalidade, é fornecido um polinucleotídeo que compreende um promotor, em que o promotor é pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% idêntico à SEQ ID NO:2. Em uma modalidade, um promotor é um promotor de gene GmMTEFs1 que compreende um poli- nucleotídeo de pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% de identidade com o polinucleotídeo da SEQ ID NO:2. Em uma modalidade, é forne- cido um polinucleotídeo isolado que compreende pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% de identidade com o polinucleotídeo da SEQ ID NO:2. Em uma modalidade, é fornecido um vetor de ácido nucleico que com- preende um promotor de GMTEFs1 da SEQ ID NO:2. Em uma modali- dade, é fornecido um polinucleotídeo que compreende um promotor de GmTEFs1 que está ligado de maneira funcional a um poliligante. Em uma modalidade, é fornecido um cassete de expressão de gene que compreende um promotor de GmMTEFs1 que está ligado de maneira funcional a um transgene não GmMTEFs1. Em uma modalidade, é for- necido um vetor de ácido nucleico que compreende um promotor de GmTEFs1 que está ligado de maneira funcional a um transgene não GmTEFs1. Em uma modalidade, o promotor consiste na SEQ ID NO:2. Em uma modalidade ilustrativa, um vetor de ácido nucleico compreen- de um promotor de GmMTEFs1 que é ligado de maneira funcional a um transgene, em que o transgene/sequência de codificação heteróloga pode ser um transgene de resistência a inseticida, um transgene de tolerância a herbicida, um transgene de eficiência de uso de nitrogê- nio, um transgene de eficiência de uso de água, um transgene de qua-
lidade nutricional, um transgene de ligação de DNA, um transgene de RNA pequeno, transgene de marcador selecionável ou combinações dos mesmos.
[0090] Em uma modalidade, um vetor de ácido nucleico compre- ende um cassete de expressão de gene, como revelado no presente documento. Em uma modalidade, um vetor pode ser um plasmídeo, um cosmídeo, um cromossomo artificial bacteriano (BAC), um bacte- riófago, um vírus, ou um fragmento de polinucleotídeo excisado para uso em transformação direta ou alvejamento de gene como um DNA doador.
[0091] A expressão de transgene também pode ser regulada por uma região 5' de UTR localizada a jusante da sequência de promotor. Tanto um promotor quanto uma UTR 5' podem regular a expressão de transgene/sequência de codificação heteróloga. Embora um promotor seja necessário para acionar a transcrição, a presença de uma UTR 5' pode aumentar níveis de expressão que resultam em transcrição de mMRNA para tradução e síntese de proteína. Uma região de gene de UTR 5' auxilia em expressão estável de um transgene. Em outra mo- dalidade, uma UTR 5' está ligada de maneira funcional a um promotor de GmTEFs1. Em uma modalidade, uma UTR 5' pode ser a UTR 5º de GmTEFs1 da SEQ ID NO:3.
[0092] Em uma modalidade, é fornecido um polinucleotídeo que compreende uma UTR 5', em que a UTR 5' é pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% idêntica à SEQ ID NO:3. Em uma modalidade, uma UTR 5' é uma UTR 5' de GMTEFs1 que compreende um polinucleotí- deo de pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% de identidade com o polinu- cleotídeo da SEQ ID NO:3. Em uma modalidade, é fornecido um poli- nucleotídeo isolado que compreende pelo menos 80%, 85%, 90%,
91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% de identidade com o polinucleotídeo da SEQ ID NO:3. Em uma modalidade, é fornecido um vetor de ácido nucleico que compreende a UTR 5' de GM TEFs1 da SEQ ID NO:3. Em uma modalidade, é forne- cido um polinucleotídeo que compreende uma UTR 5' de GmMTEFs1 que está ligada de maneira funcional a um poliligante. Em uma moda- lidade, é fornecido um cassete de expressão de gene que compreende uma UTR 5' de GMTEFs1 que está ligada de maneira funcional a um transgene não GmMTEFs1. Em uma modalidade, é fornecido um vetor de ácido nucleico que compreende uma UTR 5' de GM TEFs1 que está ligada de maneira funcional a um transgene não GM TEFs1. Em uma modalidade, a UTR 5' consiste na SEQ ID NO:3. Em uma modalidade ilustrativa, um vetor de ácido nucleico compreende uma UTR 5' de GmTEFs1 que é ligada de maneira funcional a um transgene, em que o transgene/sequência de codificação heteróloga pode ser um trans- gene de resistência a inseticida, um transgene de tolerância a herbici- da, um transgene de eficiência de uso de nitrogênio, um transgene de eficiência de uso de água, um transgene de qualidade nutricional, um transgene de ligação de DNA, um transgene de RNA pequeno, trans- gene de marcador selecionável ou combinações dos mesmos.
[0093] A expressão de transgene também pode ser regulada por uma região de íntron localizada a jusante da sequência de promotor. Tanto um promotor quanto um íntron podem regular a expressão de transgene/sequência de codificação heteróloga. Embora um promotor seja necessário para acionar a transcrição, a presença de um íntron pode aumentar os níveis de expressão que resultam em transcrição de mMRNA para tradução e síntese de proteína. Uma região de gene de íntron auxilia na expressão estável de um transgene. Em outra modali- dade, um íntron está ligado de maneira funcional a um promotor de GmTEFs1. Em uma modalidade, um íntron pode ser a UTR 5' de
GmTEFs1 da SEQ ID NO:28.
[0094] Em uma modalidade, é fornecido um polinucleotídeo que compreende um íntron, em que o íntron é pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% idêntico à SEQ ID NO:28. Em uma modalidade, um íntron é um íntron de GMTEFs1 que compreende um polinucleotídeo de pelo me- nos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% de identidade com o polinucleotídeo da SEQ ID NO:28. Em uma modalidade, é fornecido um polinucleotídeo isolado que compreende pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% de identidade com o polinucleotídeo da SEQ ID NO:28. Em uma modali- dade, é fornecido um vetor de ácido nucleico que compreende um ín- tron de GNMTEFs1 da SEQ ID NO:28. Em uma modalidade, é fornecido um polinucleotídeo que compreende um íntron de GMTEFs1 que está ligado de maneira funcional a um poliligante. Em uma modalidade, é fornecido um cassete de expressão de gene que compreende um ín- tron de GMTEFs1 que está ligado de maneira funcional a um transge- ne não GMTEFs1. Em uma modalidade, é fornecido um vetor de ácido nucleico que compreende um íntron de GMTEFs1 que está ligado de maneira funcional a um transgene não GmMTEFs1. Em uma modalida- de, o íntron consiste na SEQ ID NO:28. Em uma modalidade ilustrati- va, um vetor de ácido nucleico compreende um íntron de GMTEFs1 que é ligado de maneira funcional a um transgene, em que o transge- ne/sequência de codificação heteróloga pode ser um transgene de re- sistência a inseticida, um transgene de tolerância a herbicida, um transgene de eficiência de uso de nitrogênio, um transgene de eficiên- cia de uso de água, um transgene de qualidade nutricional, um trans- gene de ligação de DNA, um transgene de RNA pequeno, transgene de marcador selecionável ou combinações dos mesmos.
[0095] Em conformidade com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de expressão de gene recombinante, em que o cassete de expressão de gene recombi- nante compreende um promotor de GMTEFs1 ligado de maneira fun- cional a uma sequência poliligante, um gene não GmMTEFs1 ou um transgene não GMTEFs1 ou combinações dos mesmos. Em uma mo- dalidade, o cassete de gene recombinante compreende um promotor de GmTEFs1 ligado de maneira funcional a um gene ou transgene não GmTEFs1. Em uma modalidade, o cassete de gene recombinante compreende um promotor de GmMTEFs1, conforme revelado no pre- sente documento, que está ligado de maneira funcional a uma se- quência poliligante. O poliligante é ligado de modo operacional ao promotor de GMTEFs1 de maneira que a inserção de uma sequência de codificação em um dos sítios de restrição do poliligante ligará de modo operacional a sequência de codificação que permite a expressão da sequência de codificação quando o vetor é transformado ou trans- fectado em uma célula hospedeira.
[0096] Em conformidade com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de gene que consiste em um promotor de GMTEFs1 e um gene não GmMTEFs1. Em uma modalidade, o promotor de GMTEFs1 da SEQ ID NO: 2 está liga- do de maneira funcional à extremidade 5' do gene ou transgene não GmTEFs1. Em outra modalidade, a sequência promotora de GmTEFs1 compreende a SEQ ID NO:2 ou uma sequência que tem 80, 85, 90, 95, 99 ou 100% de identidade de sequência com a SEQ ID NO:2. De acordo com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de gene que consiste em um promotor de GM TEFs1 e um gene não GmMTEFs1, em que o promotor de GmTEFs1 está ligado de maneira funcional à extremidade 5' do ge- ne não GmTEFs1, e a sequência promotora de GMTEFs1 compreende a SEQ ID NO:2 ou uma sequência que tem 80, 85, 90, 95, 99 ou 100% de identidade de sequência com uma SEQ ID NO: 2. Em outra modali- dade, a sequência promotora de GM TEFs1 consiste na SEQ ID NO: 2 ou a sequência de 371 pb que tem 80, 85, 90, 95 ou 99% de identida- de de sequência com uma SEQ ID NO: 2.
[0097] Em conformidade com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de expressão de gene recombinante, em que o cassete de expressão de gene recombi- nante compreende uma UTR 5' de GMTEFs1 ligada de maneira funci- onal a uma sequência poliligante, um gene ou transgene não GmTEFs1 ou combinação dos mesmos. Em uma modalidade, o cas- sete de gene recombinante compreende uma UTR 5' de GmTEFs1 ligada de maneira funcional a um gene ou transgene não GmMTEFs1. Em uma modalidade, o cassete de gene recombinante compreende uma UTR 5' de GMTEFs1, conforme revelado no presente documento, que está ligada de maneira funcional a uma sequência poliligante. O poliligante é ligado de modo operacional à UTR 5' de GmMTEFs1 de maneira que a inserção de uma sequência de codificação em um dos sítios de restrição do poliligante ligará de modo operacional a sequên- cia de codificação que permite a expressão da sequência de codifica- ção quando o vetor é transformado ou transfectado em uma célula hospedeira.
[0098] De acordo com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de gene que consiste em uma UTR 5' de GNTEFs1 e um gene não GmMTEFs1. Em uma modali- dade, a UTR 5' de GMTEFs1 da SEQ ID NO:3 está ligada de maneira funcional à extremidade 5' do gene ou transgene não GmMTEFs1. Em outra modalidade, a sequência de UTR 5' de GNTEFs1 compreende a SEQ ID NO:3 ou uma sequência que tem 80, 85, 90, 95, 99 ou 100% de identidade de sequência com a SEQ ID NO:3. De acordo com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de gene que consiste em uma UTR 5' de GMTEFs1 e um gene não GmMTEFs1, em que a UTR 5' de GMTEFs1 está ligada de maneira funcional à extremidade 5' do gene não GMTEFs1, e aUTR 5' de gene GmMTEFs1 compreende a SEQ ID NO:3 ou uma sequência que tem 80, 85, 90, 95, 99 ou 100% de identidade de sequência com uma SEQ ID NO:3. Em uma modalidade adicional, a UTR 5' de gene GmTEFs1 consiste na SEQ ID NO:3 ou em uma sequência de 248 pb que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO:3.
[0099] Em conformidade com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de expressão de gene recombinante, em que o cassete de expressão de gene recombi- nante compreende um íntron de GM TEFs1 ligado de maneira funcional a uma sequência poliligante, um gene ou transgene não GM TEFs1 ou combinação dos mesmos. Em uma modalidade, o cassete de gene recombinante compreende um íntron de GMTEFs1 ligado de maneira funcional a um gene ou transgene não GmMTEFs1. Em uma modalida- de, o cassete de gene recombinante compreende um íntron de GmTEFs1, conforme revelado no presente documento, que está ligado de maneira funcional a uma sequência poliligante. O poliligante é liga- do de modo operacional ao íntron de GMTEFs1 de maneira que a in- serção de uma sequência de codificação em um dos sítios de restrição do poliligante ligará de modo operacional a sequência de codificação que permite a expressão da sequência de codificação quando o vetor é transformado ou transfectado em uma célula hospedeira.
[00100] Em conformidade com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de gene que consiste em um íntron de GMTEFs1 e um gene não GmTEFs1. Em uma modalidade, o íntron de GNMTEFs1 da SEQ ID NO:28 está ligado de maneira funcional à extremidade 5' do gene ou transgene não GmTEFs1. Em outra modalidade, a sequência de íntron de GmMTEFs1 compreende a SEQ ID NO:28 ou uma sequência que tem 80, 85, 90, 95, 99 ou 100% de identidade de sequência com a SEQ ID NO:28. De acordo com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de gene que consiste em um íntron de GmTEFs1 e um gene não GmMTEFs1, em que o íntron de GmTEFs1 está ligado de maneira funcional à extremidade 5' do gene não GmTEFs1, e a sequência de íntron de gene GNTEFs1 compreende a SEQ ID NO:28 ou uma sequência que tem 80, 85, 90, 95, 99 ou 100% de identidade de sequência com uma SEQ ID NO:28. Em uma modali- dade adicional, o íntron de gene GM TEFs1 consiste na SEQ ID NO:28 ou em uma sequência de 895 pb que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO:28.
[00101] Um promotor de GM TEFs1 pode também compreender um ou mais elementos de sequências adicionais. Em algumas modalida- des, um promotor de GmMTEFs1 pode compreender um éxon (por exemplo, um peptídeo líder ou sinal como um peptídeo de transição de cloroplasto ou sinal de retenção de ER). Por exemplo, e sem limitação, um promotor de GmMTEFs1 pode codificar um éxon incorporado no promotor de GMTEFs1 como uma modalidade adicional.
[00102] São ainda fornecidos métodos e composições para uso de uma UTR 3' de um gene Glyma19g07240 (Fator de alongamento 1 alfa) de Glicihna max para terminar a expressão de transgenes não GmTEFs1 em uma planta. Em uma modalidade, um terminador de UTR 3' pode ser a UTR 3' de GM TEFs1 da SEQ ID NO:4.
[00103] Em uma modalidade, é fornecido um polinucleotídeo que compreende uma UTR 3', em que a UTR 3' é pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% idêntica à SEQ ID NO:4. Em uma modalidade, uma
UTR 3' é uma UTR 3' de GMNTEFs1 que compreende um polinucleotí- deo de pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% de identidade com o polinu- cleotídeo da SEQ ID NO:4. Em uma modalidade, é fornecido um poli- nucleotídeo isolado que compreende pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% de identidade com o polinucleotídeo da SEQ ID NO:4. Em uma modalidade, é fornecido um vetor de ácido nucleico que compreende uma UTR 3' de GMTEFs1 da SEQ ID NO:4. Em uma modalidade, é fornecido um polinucleotídeo que compreende uma UTR 3' de GmTEFs1 que está ligada de maneira funcional a um poliligante. Em uma modalidade, é fornecido um cassete de expressão de gene que compreende uma UTR 3' de GmMTEFs1 que está ligada de maneira funcional a um transgene não GmMTEFs1. Em uma modalidade, é for- necido um vetor de ácido nucleico que compreende uma UTR 3' de GmTEFs1 que está ligada de maneira funcional a um transgene não GmTEFs1. Em uma modalidade, a UTR 3' consiste na SEQ ID NO: 4. Em uma modalidade ilustrativa, um vetor de ácido nucleico compreen- de uma UTR 3' de gene GMTEFs1 que é ligada de maneira funcional a um transgene, em que o transgene/sequência de codificação heterólo- ga pode ser um transgene de resistência a inseticida, um transgene de tolerância a herbicida, um transgene de eficiência de uso de nitrogê- nio, um transgene de eficiência de uso de água, um transgene de qua- lidade nutricional, um transgene de ligação de DNA, um transgene de RNA pequeno, transgene de marcador selecionável ou combinações dos mesmos.
[00104] Em conformidade com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de expressão de gene recombinante, em que o cassete de expressão de gene recombi- nante compreende uma UTR 3' de GMTEFs1 ligada de maneira funci-
onal a uma sequência poliligante, um gene ou transgene/sequência de codificação heteróloga não GMTEFs1 ou combinação dos mesmos. Em uma modalidade, o cassete de gene recombinante compreende uma UTR 3' de GMTEFs1 ligada de maneira funcional a um gene ou transgene não GmMTEFs1. Em uma modalidade, o cassete de gene re- combinante compreende uma UTR 3' de GMTEFs1, como revelado no presente documento, que é ligada de maneira funcional a uma se- quência poliligante. O poliligante é ligado de modo operacional à UTR 3' de GMTEFs1 de maneira que a inserção de uma sequência de codi- ficação em um dos sítios de restrição do poliligante ligará de modo operacional a sequência de codificação que permite a expressão da sequência de codificação quando o vetor é transformado ou transfec- tado em uma célula hospedeira.
[00105] De acordo com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de gene que consiste em uma UTR 3' de GNTEFs1 e um gene não GmMTEFs1. Em uma modali- dade, a UTR 3' de GM TEFs1 da SEQ ID NO:4 está ligada de maneira funcional à extremidade 3' do gene ou transgene não GmMTEFs1. Em outra modalidade, a sequência de UTR 3' de GMTEFs1 compreende a SEQ ID NO:4 ou uma sequência que tem 80, 85, 90, 95, 99 ou 100% de identidade de sequência com a SEQ ID NO:4. De acordo com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de gene que consiste em uma UTR 3' de GMTEFs1 e um gene não GmMTEFs1, em que a UTR 3' de GMTEFs1 está ligada de maneira funcional à extremidade 3' do gene não GMTEFs1, e a UTR 3' de GmTEFs1 compreende a SEQ ID NO:4 ou uma sequência que tem 80, 85, 90, 95, 99 ou 100% de identidade de sequência com uma SEQ ID NO:4. Em uma modalidade adicional, a sequência de UTR 3' de GmTEFs1 consiste na SEQ ID NO:4 ou em uma sequência de 739 pb que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ
ID NO:4.
[00106] São ainda fornecidos métodos e composições para uso de um terminador de um gene Glyma19g07240 (Fator de alongamento 1 alfa) de Glicihna max para terminar a expressão de transgenes não GmTEFs1 em uma planta. Em uma modalidade, um terminador pode ser o terminador de GNTEFs1 da SEQ ID NO:5.
[00107] Em uma modalidade, é fornecido um polinucleotídeo que compreende um terminador, em que o terminador é pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% idêntico à SEQ ID NO:5. Em uma modalidade, um terminador é um terminador de GMTEFs1 que compreende um polinu- cleotídeo de pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% de identidade com o polinucleotídeo da SEQ ID NO:5. Em uma modalidade, é fornecido um polinucleotídeo isolado que compreende pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,8% ou 100% de identidade com o polinucleotídeo da SEQ ID NO:5. Em uma modalidade, é fornecido um vetor de ácido nucleico que compreende um terminador de GMTEFs1 da SEQ ID NO:5. Em uma modalidade, é fornecido um polinucleotídeo que compreende um terminador de GmTEFs1 que está ligado de maneira funcional a um poliligante. Em uma modalidade, é fornecido um cassete de expressão de gene que compreende um terminador de GMTEFs1 que está ligado de maneira funcional a um transgene não GmMTEFs1. Em uma modalidade, é for- necido um vetor de ácido nucleico que compreende um terminador de GmTEFs1 que está ligado de maneira funcional a um transgene não GmTEFs1. Em uma modalidade, o terminador consiste na SEQ ID NO:
5. Em uma modalidade ilustrativa, um vetor de ácido nucleico compre- ende um terminador de GMTEFs1 que está ligado de maneira funcio- nal a um transgene, em que o transgene/sequência de codificação he-
teróloga pode ser um transgene de resistência a inseticida, um trans- gene de tolerância a herbicida, um transgene de eficiência de uso de nitrogênio, um transgene de eficiência de uso de água, um transgene de qualidade nutricional, um transgene de ligação de DNA, um trans- gene de RNA pequeno, transgene de marcador selecionável ou com- binações dos mesmos.
[00108] Em conformidade com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de expressão de gene recombinante, em que o cassete de expressão de gene recombi- nante compreende um terminador de GmMTEFs1 ligado de maneira funcional a uma sequência poliligante, um gene ou transgene não GmTEFs1 ou combinação dos mesmos. Em uma modalidade, o cas- sete de gene recombinante compreende um terminador de GMTEFs1 ligado de maneira funcional a um gene ou transgene não GmMTEFs1. Em uma modalidade, o cassete de gene recombinante compreende um terminador de GmMTEFs1, conforme revelado no presente docu- mento, ligado de maneira funcional a uma sequência poliligante. O po- liigante é ligado de modo operacional ao terminador de GMTEFs1 de maneira que a inserção de uma sequência de codificação em um dos sítios de restrição do poliligante ligará de modo operacional a sequên- cia de codificação que permite a expressão da sequência de codifica- ção quando o vetor é transformado ou transfectado em uma célula hospedeira.
[00109] Em conformidade com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de gene que consiste em um terminador de GMTEFs1 e um gene não GmMTEFs1. Em uma modalidade, o terminador de GM TEFs1 da SEQ ID NO:5 está ligado de maneira funcional à extremidade 3' do gene ou transgene não GmMTEFs1. Em outra modalidade, a sequência terminadora de GmTEFs1 compreende a SEQ ID NO:5 ou uma sequência que tem 80,
85, 90, 95, 99 ou 100% de identidade de sequência com a SEQ ID NO:5. De acordo com uma modalidade, é fornecido um vetor de ácido nucleico que compreende um cassete de gene que consiste em um terminador de GM TEFs1 e um gene não GmTEFs1, em que o termi- nador de GMTEFs1 está ligado de maneira funcional à extremidade 3' do gene não GmMTEFs1, e a sequência terminadora de GmMTEFs1 compreende a SEQ ID NO:5 ou uma sequência que tem 80, 85, 90, 95, 99 ou 100% de identidade de sequência com uma SEQ ID NO:5. Em uma modalidade adicional, a sequência terminadora de GmMTEFs1 consiste na SEQ ID NO:5 ou em uma sequência de 897 pb que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO:5.
[00110] Em uma modalidade, é fornecido um construto de ácido nu- cleico que compreende um promotor de GMTEFs1 e um gene não GmTEFs1 e opcionalmente um ou mais dos seguintes elementos: a) uma região não traduzida 5'; b) um íntron; e c) uma região não traduzida 3', em que, o promotor de GmMTEFs1 consiste na SEQ ID NO:2 ou uma sequência que tem 95% de identidade de sequência com a SEQ ID NO:2; a UTR 5' de GM TEFs1 consiste em uma UTR 5' conhecida, SEQ ID NO:3 ou uma sequência que tem 95% de identidade de se- quência com a SEQ ID NO:3; e a UTR 3' consiste em uma UTR 3' conhecida, SEQ ID NO:4 ou uma sequência que tem 95% de identidade de sequência com a SEQ ID NO:4; ademais, em que o dito promotor de GMTEFs1 está |li- gado de maneira funcional ao dito transgene/sequência de codificação heteróloga e cada elemento opcional, quando presente, está também ligado de maneira funcional tanto ao promotor quanto ao transgene. Em uma modalidade adicional, é fornecida uma célula transgênica que compreende o construto de ácido nucleico revelado imediatamente acima. Em uma modalidade, a célula transgênica é uma célula vegetal, e em uma modalidade adicional, uma planta é fornecida, em que a planta compreende as ditas células transgênicas.
[00111] Em uma modalidade, é fornecido um construto de ácido nu- cleico que compreende um promotor de GMTEFs1 e um gene não GmTEFs1 e opcionalmente um ou mais dos seguintes elementos: a) uma região não traduzida 5'; b) um íntron; e c) uma região terminadora 3', em que, o promotor de GMTEFs1 consiste na SEQ ID NO:2 ou uma sequência que tem 95% de identidade de sequência com a SEQ ID NO:2; a UTR 5' de GM TEFs1 consiste em uma UTR 5' conhecida, SEQ ID NO:3 ou uma sequência que tem 95% de identidade de se- quência com a SEQ ID NO:3; e o terminador 3' consiste em um terminador 3' conhecido, SEQ ID NO:5 ou uma sequência que tem 95% de identidade de se- quência com a SEQ ID NO:5; ademais, em que o dito promotor de GmTEFs1 está ligado de maneira funcional ao dito transge- ne/sequência de codificação heteróloga e cada elemento opcional, quando presente, está também ligado de maneira funcional tanto ao promotor quanto ao transgene. Em uma modalidade adicional, é forne- cida uma célula transgênica que compreende o construto de ácido nu- cleico revelado imediatamente acima. Em uma modalidade, a célula transgênica é uma célula vegetal, e em uma modalidade adicional, uma planta é fornecida, em que a planta compreende as ditas células transgênicas.
[00112] Outro aspecto da presente revelação compreende uma va- riante funcional que difere em um ou mais nucleotídeos dentre aqueles das sequências de nucleotídeos que compreendem o elemento regu- lador fornecido no presente documento. Tal variante é produzida como o resultado de uma ou mais modificações (por exemplo, deleção, reor- ganização ou inserção) das sequências de nucleotídeos que compre- endem a sequência descrita no presente documento. Por exemplo, os fragmentos e variantes da sequência promotora de GMTEFs1 da SEQ ID NO: 2 podem ser usados em um construto de DNA ou em um cas- sete de expressão de gene para acionar a expressão de uma sequên- cia de codificação heteróloga. Conforme usado no presente documen- to, o termo "fragmento" refere-se a uma porção da sequência de áci- dos nucleicos. Os fragmentos de sequência promotora de GMTEFs1 da SEQ ID NO: 2 podem manter a atividade biológica de iniciação de transcrição, mais particularmente de acionamento de transcrição de uma maneira constitutivamente expressa. Alternativamente, os frag- mentos de uma sequência de nucleotídeos que são úteis como sondas de hibridização podem não reter necessariamente a atividade biológi- ca. Os fragmentos de uma sequência de nucleotídeos para a região promotora da sequência promotora de GMTEFs1 da SEQ ID NO:2 po- dem estar na faixa de pelo menos cerca de 20 nucleotídeos, cerca de 50 nucleotídeos, cerca de 100 nucleotídeos, até a sequência de nucle- otídeos de comprimento completo da invenção para a região promoto- ra do gene.
[00113] Uma porção biologicamente ativa de uma sequência pro- motora de GMTEFs1 da SEQ ID NO:2 pode ser preparada isolando-se uma porção da sequência promotora de GMTEFs1 da SEQ ID NO:2 e avaliando-se a atividade promotora da porção. As moléculas de ácido nucleico que são fragmentos de uma sequência de nucleotídeos pro-
motora de GMTEFs1 compreendem pelo menos cerca de 16, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 800, 900, 1.000, 1.100, 1.200, 1.300, 1.400, 1.500, 1.550, 1.600, 1.650 ou
1.700 nucleotídeos ou até o número de nucleotídeos presentes em uma sequência promotora de GM TEFs1 de comprimento completo re- velada no presente documento.
[00114] As sequências de nucleotídeos variantes também abran- gem as sequências derivadas de um procedimento mutagênico e re- combinogênico, como embaralhamento de DNA. Com tal procedimen- to, as sequências de nucleotídeos promotoras de GMTEFs1 da SEQ ID NO:2 podem ser manipuladas para criar um novo promotor de GmTEFs1. Dessa maneira, as bibliotecas de polinucleotídeos recom- binantes são geradas a partir de uma população de polinucleotídeos de sequência relacionada que compreendem regiões de sequência que têm identidade de sequência substancial e podem ser recombina- das de modo homólogo in vitro ou in vivo. As estratégias para tal em- baralhamento de DNA são conhecidas na técnica. Consultar, por exemplo, Stemmer (1994) Proc. Natl. Acad. Sci. USA i: 10.747 a
10.751; Stemmer (1994) Nature 570:389 a 391; Crameri et al. (1997) Nature Biotech. 75:436 a 438; Moore et al. (1997) J. Mol. Biol. 272:336 a 347; Zhang et al. (1997) Proc. Natl. Acad. Sci. USA £4:4.504 a
4.509; Crameri et al. (1998) Nature 527:288 a 291; e Patentes nº U.S.
5.605.793 e 5.837.458.
[00115] As sequências de nucleotídeos da presente revelação po- dem ser usadas para isolar as sequências correspondentes de outros organismos, particularmente outras plantas, mais particularmente ou- tras monocotiledôneas. Dessa maneira, os métodos, como PCR, hibri- dização e semelhantes podem ser usados para identificar tais sequên- cias com base em sua homologia de sequência às sequências estabe- lecidas no presente documento. Sequências isoladas com base em sua identidade de sequência com a sequência promotora de GmTEFs1 inteira apresentada no presente documento ou com frag- mentos das mesmas estão englobadas pela presente invenção.
[00116] Em uma abordagem de PCR, os iniciadores de oligonucleo- tídeo podem ser projetados para uso em reações de PCR para amplifi- car as sequências de DNA correspondentes de DNA genômico extraí- do de qualquer planta de interesse. Os métodos para projetar iniciado- res de PCR e clonagem de PCR são geralmente conhecidos na técni- ca e são revelados em Sambrook et al. (1989) Molecular Cloning: À Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, Nova lorque), mais adiante no presente documento, deno- minado como Sambrook. Também consultar Innis et al., eds. (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, Nova lorque); Innis e Gelfand, eds. (1995) PCR Strategies (Academic Press, Nova lorque); e Innis e Gelfand, eds. (1999) PCR Methods Manual (Academic Press, Nova lorque). Os métodos conhe- cidos de PCR incluem, mas sem limitação, métodos que usam inicia- dores emparelhados, iniciadores encaixados, iniciadores específicos únicos, iniciadores degenerados, iniciadores específicos para genes, iniciadores específicos para vetores, iniciadores com emparelhamento parcialmente errôneo e semelhantes.
[00117] Em técnicas de hibridização, toda ou parte de uma sequên- cia de nucleotídeos conhecida é usada como uma sonda que hibridiza seletivamente para outras sequências de nucleotídeos corresponden- tes presentes em uma população de fragmentos de DNA genômico clonado de um organismo escolhido. As sondas de hibridização podem ser identificadas com um grupo detectável, como P*? ou qualquer outro marcador detectável. Assim, por exemplo, sondas para hibridização podem ser produzidas marcando-se oligonucleotídeos sintéticos com base na sequência promotora de GMTEFs1 da invenção. Os métodos para a preparação de sondas para hibridização e para construção de bibliotecas genômicas são geralmente conhecidos na técnica e são revelados em Sambrook. Por exemplo, a sequência promotora de GmTEFs1 completa aqui revelada, ou uma ou mais porções da mes- ma, pode ser utilizada como uma sonda capaz de hibridar especifica- mente com sequências promotoras de GmMTEFs1 correspondentes e RNAs mensageiros. Para obter hibridização específica sob uma varie- dade de condições, tais sondas incluem sequências que são únicas dentre sequências promotoras de GMTEFs1 e têm pelo menos cerca de 10 nucleotídeos de comprimento ou pelo menos cerca de 20 nucle- otídeos de comprimento. Tais sondas podem ser usadas para amplifi- car a sequência promotora de GmMTEFs1 correspondente a partir de uma planta escolhida através de PCR. Essa técnica pode ser usada para isolar as sequências de codificação adicionais de um organismo desejado, ou como um ensaio diagnóstico para determinar a presença de sequências de codificação em um organismo. As técnicas de hibri- dação incluem o rastreamento da hibridação de bibliotecas de DNA transferidas para placas (placas ou colônias; consultar, por exemplo, Sambrook).
[00118] De acordo com uma modalidade, o vetor de ácido nucleico compreende ainda uma sequência que codifica um marcador selecio- nável. De acordo com uma modalidade, o cassete de gene recombi- nante é ligado de maneira funcional a uma borda de T-DNA de Agrobacterium. De acordo com uma modalidade, o cassete de gene recombinante compreende ainda uma primeira e uma segunda bordas de T-DNA, em que a primeira borda de T-DNA é ligada de maneira funcional a uma extremidade de um construto de gene, e a segunda borda de T-DNA é ligada de maneira funcional à outra extremidade de um construto de gene. As primeira e segunda bordas de T-DNA de Agrobacterium podem ser independentemente selecionadas a partir de sequências de borda de T-DNA que se originam de cepas bacterianas selecionadas dentre o grupo que consiste em uma borda de T-DNA de sintetização de nopalina de Agrobacterium, uma borda de T-DNA de sintetização de ocotopina de Agrobacterium, uma borda de T-DNA de sintetização de manopina de Agrobacterium, uma borda de T-DNA de sintetização de succinamopina de Agrobacterium, ou qualquer combi- nação das mesmas.
Em uma modalidade, uma cepa de Agrobacterium selecionada dentre o grupo que consiste em uma cepa de sintetização de nopalina, uma cepa de sintetização de manopina, uma cepa de sin- tetização de succinamopina, ou uma cepa de sintetização de octopina é fornecida, em que a dita cepa compreende um plasmídeo, em que o plasmídeo compreende um transgene/sequência de codificação hete- róloga ligada de maneira funcional a uma sequência selecionada a partir de SEQ ID NO:2 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com SEQ ID NO:2. Em outra modali- dade, as primeira e segunda bordas de T-DNA de Agrobacterium po- dem ser independentemente selecionadas a partir de sequências de borda de T-DNA que se originam de cepas bacterianas selecionadas dentre o grupo que consiste em uma borda de T-DNA de sintetização de nopalina de Agrobacterium, uma borda de T-DNA de sintetização de ocotopina de Agrobacterium, uma borda de T-DNA de sintetização de manopina de Agrobacterium, uma borda de T-DNA de sintetização de succinamopina de Agrobacterium, ou qualquer combinação das mesmas.
Em uma modalidade, uma cepa de Agrobacterium selecio- nada dentre o grupo que consiste em uma cepa de sintetização de no- palina, uma cepa de sintetização de manopina, uma cepa de sintetiza- ção de succinamopina, ou uma cepa de sintetização de octopina é for- necida, em que a dita cepa compreende um plasmídeo, em que o plasmídeo compreende um transgene/sequência de codificação hete- róloga ligada de maneira funcional a uma sequência selecionada a partir de SEQ ID NO:3 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO:3. Em uma modalidade, uma cepa de Agrobacterium selecionada dentre o grupo que consiste em uma cepa de sintetização de nopalina, uma cepa de sintetização de manopina, uma cepa de sintetização de succinamopi- na, ou uma cepa de sintetização de octopina é fornecida, em que a dita cepa compreende um plasmídeo, em que o plasmídeo compreen- de um transgene/sequência de codificação heteróloga ligado de ma- neira funcional a uma sequência selecionada a partir de SEQ ID NO:4 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com SEQ ID NO:4. Em uma modalidade, uma cepa de Agrobacterium selecionada dentre o grupo que consiste em uma cepa de sintetização de nopalina, uma cepa de sintetização de manopina, uma cepa de sintetização de succinamopina, ou uma cepa de sinteti- zação de octopina é fornecida, em que a dita cepa compreende um plasmídeo, em que o plasmídeo compreende um transgene/sequência de codificação heteróloga ligado de maneira funcional a uma sequên- cia selecionada a partir de SEQ ID NO:5 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com SEQ ID NO:5.
[00119] Transgenes de interesse que são adequados para uso nos construtos presentemente revelados incluem, porém sem limitação, sequências de codificação que conferem (1) resistência a pragas ou doença, (2) tolerância a herbicidas, (3) traços agronômicos de valor adicionado como; aprimoramento de rendimento, eficiência de uso de nitrogênio, eficiência de uso de água, e qualidade nutricional, (4) liga- ção de uma proteína a DNA de uma maneira específica de sítio, (5) expressão de RNA pequeno e (6) marcadores selecionáveis. De acor- do com uma modalidade, o transgene/sequência de codificação hete- róloga codifica um marcador selecionável ou um produto de gene que confere resistência a inseticidas, tolerância a herbicidas, expressão de
RNA pequeno, eficiência de uso de nitrogênio, eficiência de uso de água ou qualidade nutricional.
1. Resistência a Insetos
[00120] Diversos genes de resistência a insetos podem ser ligados de maneira funcional ao promotor de GmMTEFs1 que compreende a SEQ ID NO: 2, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO: 2. Além disso, os ge- nes de resistência a insetos podem ser ligados de maneira funcional à UTR 5' de GMTEFs1 que compreende a SEQ ID NO:3 ou uma se- quência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO:3. Os genes de resistência a insetos podem ser li- gados de maneira funcional ao íntron de GMTEFs1 que compreende a SEQ ID NO:28, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO:28. De modo seme- lhante, os genes de resistência a insetos podem ser ligados de manei- ra funcional à UTR 3' de GNTEFs1 que compreende a SEQ ID NO:4, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ |D NO: 4. Além disso, os genes de resistên- cia a insetos podem ser ligados de maneira funcional ao terminador de GmTEFs1 que compreende a SEQ ID NO:5 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO: 5. As sequências ligadas de maneira funcional podem, então, ser incorporadas em um vetor escolhido para permitir identificação e sele- ção de plantas transformadas ("transformantes"). As sequências de codificação de resistência a insetos exemplificativas são conhecidas na técnica. Como modalidades de sequências de codificação de resis- tência a insetos que podem ser ligadas de maneira funcional aos ele- mentos reguladores da presente revelação, os traços a seguir são for- necidos. As sequências exemplificativas de codificação que fornecem resistência a insetos Lepidópteros incluem: cry1A; cry1A.105; cry1Ab;
cry1Abí(truncado); cry1Ab-Ac (proteína de fusão); cry1Ac (comerciali- zado como WidestrikeGO); cry1C; cry1F (comercializado como Widestri- ke86); cry1Fa2; cry2Ab2; cry2Ae; cry9C; mocry1F; pinll (proteína inibi- dora de protease); vip3A(a); e vip3Aa20. As sequências exemplificati- vas de codificação que fornecem resistência a insetos Coleópteros in- cluem: cry34Ab1 (comercializado como HerculexO); cry35Ab1 (comer- cializado como Herculex6); cry3A; cry3Bb1; dvsnf7; e mcry3A. As se- quências exemplificativas de codificação que fornecem resistência a múltiplos insetos exemplificativa incluem ecry371.Ab. A lista acima de genes de resistência a insetos não se destina a ser limitante. Quais- quer genes de resistência a insetos são abrangidos pela presente re- velação.
2. Tolerância a Herbicida
[00121] Diversos genes de tolerância a herbicida podem ser ligados de maneira funcional ao promotor de gGmTEFs1 que compreende a SEQ ID NO: 2, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO: 2. Além disso, os ge- nes de resistência a insetos podem ser ligados de maneira funcional à UTR 5' de GmMTEFs1 que compreende a SEQ ID NO:3 ou uma se- quência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO:3. Os genes de resistência a insetos podem ser li- gados de maneira funcional ao íntron de GMTEFs1 que compreende a SEQ ID NO:28, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO:28. De modo seme- lhante, os genes de resistência a insetos podem ser ligados de manei- ra funcional à UTR 3' de GMTEFs1 que compreende a SEQ ID NO:4, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO: 4. Além disso, os genes de resistên- cia a insetos podem ser ligados de maneira funcional ao terminador de GmTEFs1 que compreende a SEQ ID NO:5 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO: 5. As sequências ligadas de maneira funcional podem, então, ser incorporadas em um vetor escolhido para permitir identificação e sele- ção de plantas transformadas ("transformantes"). As sequências exemplificativas de codificação de tolerância a herbicida são conheci- das na técnica.
Como modalidades de sequências de codificação de tolerância a herbicida que podem ser ligadas de maneira funcional aos elementos reguladores da presente revelação, são fornecidos os tra- ços a seguir.
O herbicida glifosato contém um modo de ação inibindo- se a enzima EPSPS (sintase de 5-enolpiruvilshikimato-3-fosfato). Essa enzima é envolvida na biossíntese de aminoácidos aromáticos que são essenciais para o crescimento e desenvolvimento de plantas.
Diversos mecanismos enzimáticos são conhecidos na técnica que podem ser utilizados para inibir essa enzima.
Os genes que codificam tais enzi- mas podem ser ligados de maneira funcional aos elementos regulado- res de gene da presente revelação.
Em uma modalidade, genes de marcador selecionável incluem, porém sem limitação, genes que codi- ficam genes de resistência a glifosato que incluem: genes mutantes de EPSPS, como genes 2mEPSPS, genes cp4 EPSPS, genes mEPSPS, genes dgt-28; genes aroA; e genes de degradação de glifosato, como genes de acetil transferase de glifosato (gat) e genes de oxidase de glifosato (gox). Esses traços são atualmente comercializados como Gly-Tol"M, OptimumO GATO, Agrisure& GT e Roundup ReadyO.
Os genes de resistência para compostos de glufosinato e/ou bialafos in- cluem genes dsm-2, bar e pat.
Os traços de bar e pat são atualmente comercializados como LibertyLink&. Também são incluídos genes de tolerância que fornecem resistência a genes 2,4-D, como genes aad-1 (deve ser observado que genes aad-1 têm ainda atividade em herbici- das de arloxifenoxipropionato) e genes aad-12 (deve ser observado que genes aad-12 têm ainda atividade em auxinas sintéticas de piidilo-
7TTII3T xiacetato). Esses traços são comercializados como tecnologia de pro- teção de cultura Enlistê.
Os genes de resistência para inibidores de ALS (sulfonilureias, imidazolinonas, triazolpirimidinas, pirimidiniltioben- zoatos e sulfonilamino-carbonil-triazolinonas) são conhecidos na técni- ca.
Esses genes de resistência resultam mais comumente de muta- ções de ponto para a sequência de genes que codificam ALS.
Outros genes de resistência de inibidor de ALS incluem genes hra, os genes csr1-2, genes Sr-HrA e genes surB.
Alguns dos traços são comerciali- zados sob o nome comercial Clearfield&. Os herbicidas que inibem HPPD incluem as pirazolonas, como pirazoxifeno, benzofenona e to- pramezona; tricetonas, como mesotriona, sulcotriona, tembotriona, benzobiciclona; e dicetonitrilas como isoxaflutol.
Esses herbicidas de HPPD exemplificativos podem ser tolerados por traços conhecidos.
Exemplos de inibidores de HPPD incluem genes hppadPF.
W336 (para resistência a isoxaflutol) e genes avhppd-03 (para resistência a meos- triona). Um exemplo de traços tolerantes a herbicida oxinila incluem o gene bxn, que tem se mostrado como conferindo resistência ao herbi- cida/antibiótico bromoxinil.
Os genes de resistência para dicamba in- cluem o gene de mono-oxigenase de dicamba (dmo), como revelado no Pedido Internacional PCT n.º WO 2008/105890. Os genes de resis- tência para herbicidas do tipo inibidor de PPO ou PROTOX (por exem- plo, acifluorfeno, butafenacil, flupropazil, pentoxazona, carfentrazona, fluazolato, piraflufeno, aclonifeno, azafenidina, flumioxazina, flumiclo- rac, bifenox, oxifluorfeno, lactofeno, fomesafeno, fluoroglicofeno e sul- fentrazona) são conhecidos na técnica.
Genes exemplificativos que conferem resistência a PPO incluem sobre-expressão de uma enzima de PPO de Arabidopsis thaliana de tipo selvagem (Lermontova | e Grimm B, (2000) Overexpression of plastidic protoporphyrinogen IX oxidase leads to resistance to the diphenyl-ether herbicide acifluorfen.
Plant Physiol 122:75-83.), o gene de PPO de B. subtilis (Li, X. e Ni-
choll D. 2005. Development of PPO inhibitor-resistant cultures and crops. Pest Manag. Sci. 61:277-285 e Choi KW, Han O, Lee HJ, Yun YC, Moon YH, Kim MK, Kuk YI, Han SU e Guh JO, (1998) Generation of resistance to the diphenyl ether herbicide, oxyfluorfen, via expressi- on of the Bacillus subtilis protoporphyrinogen oxidase gene in transge- nic tobacco plants. Biosci Biotechnol Biochem 62:558 a 560.) Os ge- nes de resistência para ácidos propiônicos piridinóxi ou fenóxi e ciclo- hexonas incluem os genes de codificação de inibidor de ACCase (por exemplo, Acc1-S1, Acc1-S2 e Acc1-S3). Genes exemplificativos que conferem resistência a ciclo-hexanodionas e/ou ácido ariloxifenoxipro- panoico incluem haloxifop, diclofop, fenoxiprop, fluazifop e quizalofop. Finalmente, os herbicidas podem inibir fotossíntese, incluindo triazina ou benzonitrila, e serem fornecidos com tolerância por genes psbA (to- lerância a triazina), genes 1s+ (tolerância a triazina), e genes nitrilase (tolerância a benzonitrila). A lista acima de genes de tolerância a her- bicida não se destina a ser limitante. Quaisquer genes de tolerância a herbicida são abrangidos pela presente revelação.
3. Traços Agronômicos
[00122] Diversos genes de traço agronômico podem ser ligados de maneira funcional ao promotor de GMTEFs1 que compreende a SEQ ID NO: 2, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identi- dade de sequência com uma SEQ ID NO: 2. Além disso, os genes de resistência a insetos podem ser ligados de maneira funcional à UTR 5' de GmTEFs1 que compreende a SEQ ID NO:3 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO:3. Os genes de resistência a insetos podem ser ligados de manei- ra funcional ao íntron de GMTEFs1 que compreende a SEQ ID NO:28, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO:28. De modo semelhante, os genes de resistência a insetos podem ser ligados de maneira funcional à
UTR 3' de GMTEFs1 que compreende a SEQ ID NO:4, ou uma se- quência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO: 4. Além disso, os genes de resistência a insetos podem ser ligados de maneira funcional ao terminador de GmMTEFs1 que compreende a SEQ ID NO:5 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO: 5. As sequências ligadas de maneira funcional podem, então, ser incorpora- das em um vetor escolhido para permitir identificação e seleção de plantas transformadas ("transformantes"). As sequências exemplifica- tivas de codificação de traço agronômico são conhecidas na técnica.
Como modalidades de sequências de codificação de traço agronômico que podem ser ligadas de maneira funcional aos elementos regulado- res da presente revelação, são fornecidos os traços a seguir.
O amo- lecimento atrasado de fruta, como fornecido pelos genes pg, inibe a produção de enzima poligalacturonase responsável pela ruptura de moléculas de pectina na parede celular e, desse modo, ocasiona amo- lecimento atrasado da fruta.
Ademais, os genes acc para o atraso no amadurecimento/senescência de fruta atuam para suprimir a expres- são normal do gene nativo acc sintase, resultando em produção de etileno reduzida e amadurecimento de fruta atrasado.
Enquanto os ge- nes accd metabolizam o precursor do etileno de hormônio de amadu- recimento de fruta, resultando em amadurecimento de fruta atrasado.
De modo alternativo, os genes sam-k ocasionam o amadurecimento atrasado reduzindo a S-adenosilmetionina (SAM), um substrato para produção de etileno.
Fenótipos de tolerância ao estresse por falta de água, como fornecido por genes cspB, mantêm as funções celulares normais mediante condições de estresse por falta de água, preservan- do, dessa forma, a estabilidade e a tradução de RNA.
Outro exemplo inclui os genes EcBetA que catalisam a produção da glicina betaína de composto osmoprotetor que confere tolerância ao estresse por falta de água. Além disso, os genes RmBetA catalisam a produção da glicina betaína de composto osmoprotetor que confere tolerância a estresse por falta de água. A fotossíntese e o aperfeiçoamento de rendimento são fornecidos com o gene bbx32 que expressa uma proteína que in- terage com um ou mais fatores endógenos de transcrição para regular os processos fisiológicos diurnos/noturnos da planta. A produção de etanol pode ser aumentada por expressão dos genes amy797E que codificam uma enzima de alfa-amilase termoestável que aperfeiçoa produção de bioetanol, aumentando, dessa forma, a termoestabilidade da amilase usada em amido de degradação. Finalmente, composições de aminoácido modificadas podem resultar através da expressão dos genes cordapA que codificam uma enzima de sintase de di- hidrodipicolinato que aumenta a produção de lisina de aminoácido. À lista acima de sequências de codificação de traço agronômico não se destina a ser limitante. Qualquer sequência de codificação de traço agronômico é abrangida pela presente revelação.
4. Proteínas de Ligação de DNA
[00123] Diversos transgenes de ligação a DNA/genes de sequência de codificação heteróloga/sequências de codificação heterólogas po- dem estar ligados de maneira funcional ao promotor de GMTEFs1 que compreende a SEQ ID NO: 2, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO: 2. Além disso, os genes de resistência a insetos podem ser ligados de maneira funcional à UTR 5' de GMTEFs1 que compreende a SEQ ID NO:3 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de se- quência com a SEQ ID NO:3. Os genes de resistência a insetos po- dem ser ligados de maneira funcional ao íntron de GMTEFs1 que compreende a SEQ ID NO:28, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO:28. De modo semelhante, os genes de resistência a insetos podem ser liga-
dos de maneira funcional à UTR 3' de GMTEFs1 que compreende a SEQ ID NO:4, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO: 4. Além disso, os ge- nes de resistência a insetos podem ser ligados de maneira funcional ao terminador de GMTEFs1 que compreende a SEQ ID NO:5 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO: 5. As sequências ligadas de maneira funcional po- dem, então, ser incorporadas a um vetor escolhido para permitir i lhante, os genes de resistência a insetos podem ser ligados de manei- ra funcional à UTR 3' de GNTEFs1 que compreende a SEQ ID NO:4, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO: 4. Além disso, os genes de resistên- cia a insetos podem ser ligados de maneira funcional ao terminador de GmTEFs1 que compreende a SEQ ID NO:5 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO: 5. As sequências ligadas de maneira funcional podem, então, ser incorporadas em um vetor escolhido para permitir identificação e sele- ção de plantas transformadas ("transformantes"). Os traços de RNA pequeno exemplificativos são conhecidos na técnica.
Como modalida- des de sequências de codificação de RNA pequeno que podem ser ligadas de maneira funcional aos elementos reguladores da presente revelação, os traços a seguir são fornecidos.
Por exemplo, o RNA pe- queno anti-efe para atraso de amadurecimento/senescência de fruta atrasa o amadurecimento das frutas suprimindo a produção de etileno por meio de silenciamento do gene ACO que codifica uma enzima de formação de etileno.
A produção de lignina alterada de RNA pequeno ccomt reduz teor de guanacil (G) lignina por inibição da S-adenosil-L- metionina endógena: trans-cafeoil CoA 3-O-metiltransferase (gene CCOMT). Ademais, a Tolerância a Ferimento de Mancha Preta em So- lanum verrucosum pode ser reduzida pelo RNA pequeno Ppo5 que aciona a degradação de transcrições de Ppo5 para bloquear desen- volvimento de ferimento de mancha preta.
Também é incluído o RNA pequeno dvsnf7 que inibe a Lagarta da Raiz do Milho Ocidental com dsRNA que contém um fragmento de 240 pb do gene da Lagarta da Raiz do Milho Ocidental Snf7. Os amidos/carboidratos modificados po- dem resultar de RNA pequeno, como o RNA pequeno pPhL (degrada transcrições de PhL para limitar a formação de açúcares de redução através de degradação de amido) e RNA pequeno pR1 (degrada transcrições de R1 para limitar a formação de açúcares de redução através de degradação de amido). Benefícios adicionais são percebi- dos, como acrilamida reduzida que resulta do RNA pequeno asn1 que aciona degradação de Asn1 para prejudicar formação de asparagina e reduzir poliacrilamida. Finalmente, o fenótipo de não escurecimento de RNA pequeno pgas de supressão de ppo resulta em PPO de supres- são para produzir maçãs com um fenótipo de não escurecimento. À lista acima de RNAs pequenos não se destina a ser limitante. Quais- quer sequências de codificação de RNA pequeno são abrangidas pela presente revelação.
6. Marcadores Selecionáveis
[00125] Diversos marcadores selecionáveis também descritos como genes-repórter podem ser ligados de maneira funcional ao promotor de GmMTEFs1 que compreende a SEQ ID NO: 2, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO: 2. Além disso, os genes de resistência a insetos podem ser ligados de maneira funcional à UTR 5' de GMTEFs1 que compre- ende a SEQ ID NO:3 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com a SEQ ID NO:3. Os genes de resistência a insetos podem ser ligados de maneira funcional ao íntron de GmMTEFs1 que compreende a SEQ ID NO:28, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO:28. De modo semelhante, os genes de resistência a inse- tos podem ser ligados de maneira funcional à UTR 3' de GmMTEFs1 que compreende a SEQ ID NO:4, ou uma sequência que tem 80, 85, 90, 95 ou 99% de identidade de sequência com uma SEQ ID NO: 4. Além disso, os genes de resistência a insetos podem ser ligados de maneira funcional ao terminador de GM TEFs1 que compreende a SEQ ID NO:5 ou uma sequência que tem 80, 85, 90, 95 ou 99% de identi- dade de sequência com a SEQ ID NO: 5. As sequências ligadas de maneira funcional podem, então, ser incorporadas a um vetor escolhi- do para permitir identificação e seleção de plantas transformadas ("transformantes"). Muitos métodos estão disponíveis para confirmar a expressão de marcadores selecionáveis em plantas transformadas, incluindo, por exemplo, sequenciamento de DNA e PCR (reação de cadeia de polimerase), Southern blotting, blotting de RNA, métodos imunológicos para detecção de uma proteína expressa do vetor. Mas, normalmente os genes-repórter são observados através de observa- ção visual de proteínas que, quando expressas, produzem um produto colorido. Genes-repórter exemplificativos são conhecidos na técnica e codificam B-glucuronidase (GUS), luciferase, proteína verde fluores- cente (GFP), proteína amarelo fluorescente (YFP, Phi-YFP), proteína vermelho fluorescente (DSRFP, RFP, etc), B-galactosidase, e similares (Consultar Sambrook, et al., Molecular Cloning: A Laboratory Manual, Terceira Edição, Cold Spring Harbor Press, N.Y., 2001, cujo conteúdo do mesmo é incorporado ao presente documento a título de referência em sua totalidade).
[00126] Genes marcadores selecionáveis são utilizados para a se- leção de células ou tecidos transformados. Genes de marcados sele- cionáveis incluem genes que codificam resistência a antibiótico, como aqueles que codificam neomicina fosfotransferase Il (NEO), resistência a espectinomicina/estreptionomicina (AAD) e higromicina fosfotransfe- rase (HPT ou HGR), assim como genes que conferem resistência a compostos herbicidas. Os genes de resistência a herbicida geralmente codificam para uma proteína alvo modificada insensível ao herbicida ou para uma enzima que degrada ou desintoxica o herbicida na planta antes de o mesmo poder atuar. Por exemplo, resistência a glifosato foi obtida usando-se codificação de genes para enzimas alvo mutantes, sintase de 5-enolpiruvilshiquimato-3-fosfato (EPSPS). Genes e mutan- tes para EPSPS são bem conhecidos, e ainda descritos abaixo. Re-
sistências a glufosinato de amônio, bromoxinil e 24 diclorofenoxiacetato (2,4-D) foram obtidas usando-se genes bacteria- nos que codificam PAT ou DSM-2, uma nitrilase, um AAD-1 ou um AAD-12, em que cada um dos quais são exemplos de proteínas que desintoxicam seus respectivos herbicidas.
[00127] Em uma modalidade, os herbicidas podem inibir o ponto de crescimento ou meristema, incluindo imidazolinona ou sulfonilureia, e genes para resistência/tolerância de sintase de aceto-hidroxiácido (AHAS) e sintase de acetolactato (ALS) para esses herbicidas são bem conhecidos. Os genes de resistência de glifosato incluem sintase de 5-enolpiruvilshiquimato-3-fosfato mutante (EPSP) e genes dgt-28 (por meio da introdução de ácidos nucleicos recombinantes e/ou diver- sas formas de mutagênese in vivo de genes EPSP nativos), genes aroA e genes de glifosato acetil transferase (GAT), respectivamente). Os genes de resistência para outros compostos de fosfono incluem genes bar e pat de espécie Streptomyces, incluindo Streptomyces hygroscopicus e Streptomyces viridichromogenes, e piridinóxi ou áci- dos fenóxi propiônicos e ciclo-hexonas (genes de codificação de inibi- dor de ACCase). Genes exemplificativos que conferem resistência a ciclo-hexanodionas e/ou ácido ariloxifenoxipropanoico (incluindo ha- loxifop, diclofop, fenoxiprop, fluazifop, quizalofop) incluem genes de carboxilase de coenzima de acetila A (ACCase); Acc1-S1, Acc1-S2 e Acc1-S3. Em uma modalidade, os herbicidas podem inibir a fotossín- tese, incluindo triazina (genes psbA e 1s+) ou benzonitrila (gene nitri- lase). Além disso, tais marcadores selecionáveis podem incluir marca- dores de seleção positiva como enzima fosfomanose isomerase (PMI).
[00128] Em uma modalidade, genes de marcador selecionável in- cluem, porém sem limitação, genes que codificam: 2,4-D; neomicina fosfotransferase ||; cianamida hidratase; aspartato quinase; sintase de di-hidrodipicolinato; triptofano —descarboxilase; sintase de di hidrodipicolinato e aspartato quinase dessensibilizada; gene bar; tripto- fano descarboxilase; neomicina fosfotransferase (NEO); higromicina fosfotransferase (HPT ou HYG); di-hidrofolato redutase (DHFR); fosfi- notricina acetiltransferase; ácido 2,2-dicloropropiônico de-halogenase; sintase de aceto-hidroxiácido; sintase de 5-enolpiruvil-shiquimate- fosfato (aroA); haloarilnitrilase; carboxilase de acetil-coenzima A; sin- tase de di-hidropteroato (sul |); e polipeptídeo de fotosistema Il 32 kD (psbA). Uma modalidade também inclui genes de marcador selecioná- vel que codificam resistência a: cloranfenicol; metotrexato; higromicina; espectinomicina; bromoxinil; glifosato; e fosfinotricina. A lista acima de genes marcadores selecionáveis não é destinada a ser limitante. Qualquer gene de marcador selecionável ou repórter é abrangido pela presente revelação.
[00129] Em algumas modalidades, as sequências de codificação são sintetizadas para expressão ideal em uma planta. Por exemplo, em uma modalidade, uma sequência de codificação de um gene foi modificada por otimização de códon para aperfeiçoar expressão em plantas. Uma resistência a transgene de inseticida, uma tolerância a transgene de herbicida, uma eficiência de uso de transgene de nitro- gênio, uma eficiência de uso de transgene de água, um transgene de qualidade nutricional, um transgene de ligação de DNA, ou um trans- gene de marcador selecionável/sequência de codificação heteróloga pode ser ideal para expressão em uma espécie de planta particular ou, de modo alternativo, pode ser modificado para expressão ideal em plantas dicotiledôneas ou monocotiledôneas. Códons preferenciais de planta podem ser determinados a partir dos códons de frequência mais alta nas proteínas expressas na maior quantidade na espécie de plan- ta particular de interesse. Em uma modalidade, uma sequência de co- dificação, gene, sequência de codificação heteróloga ou transge- ne/sequência de codificação heteróloga é projetada para ser expressa em plantas em um nível mais alto, resultando em maior eficiência de transformação. Os métodos para otimização de genes de planta são bem conhecidos. Orientações relacionadas à otimização e à produção de sequências de DNA sintético podem ser constatadas, por exemplo, nos documentos WO2013016546, WO2011146524, WO1997013402, Patente dos EUA n.º 6166302, e Patente dos EUA n.º 5380831, incor- porados ao presente documento a título de referência. Transformação
[00130] Os métodos adequados para transformação de plantas in- cluem qualquer método pelo qual o DNA pode ser introduzido em uma célula, por exemplo e sem limitação: eletroporação (consulte, por exemplo, Patente dos EUA 5.384.253); bombardeamento de micropro- jétil (consulte, por exemplo, Patentes dos EUA 5.015.580, 5.550.318,
5.538.880, 6.160.208, 6.399.861 e 6.403.865); transformação mediada por Agrobacterium (consulte, por exemplo, Patentes dos EUA
5.635.055, 5.824.877, 5.591.616; 5.981.840, e 6.384.301); e transfor- mação de protoplasto (consulte, por exemplo, Patente dos EUA
5.508.184).
[00131] Um construto de DNA pode ser introduzido diretamente no DNA genômico da célula vegetal com o uso de técnicas, como agita- ção com fibras de carbeto de silício (consulte, por exemplo, Patentes dos EUA 5.302.523 e 5.464.765), ou os construtos de DNA podem ser introduzidos diretamente no tecido de planta com o uso de métodos biolísticos, como bombardeamento de partícula de DNA (consultar, por exemplo, Klein et al. (1987) Nature 327:70-73). De modo alternativo, o construto de DNA pode ser introduzido na célula vegetal por meio de transformação de nanopartícula (consultar, por exemplo, Pedido de Patente dos EUA n.º 20090104700, que é incorporado ao presente documento a título de referência em sua totalidade).
[00132] Além disso, transferência de gene pode ser alcançada com o uso de bactérias ou vírus não Agrobacterium, como Rhizobium sp. NGRZ234, Sinorhizoboium meliloti, Mesorhizobium loti, vírus X de bata- ta, vírus mosaico de couve-flor e vírus do mosaico da veia da mandio- ca e/ou vírus mosaico de tabaco, Consultar, por exemplo, Chung et al. (2006) Trends Plant Sci. 11(1):1-4.
[00133] Através da aplicação de técnicas de transformação, células de praticamente qualquer espécie de planta podem ser transformadas de modo estável, e estas células podem ser desenvolvidas em plantas transgênicas por técnicas bem conhecidas. Por exemplo, técnicas que podem ser particularmente úteis no contexto de transformação de al- godão são descritas na Patente dos EUA n.ºs 5.846.797, 5.159.135,
5.004.863 e 6.624.344; técnicas para transformar plantas Brassica, em particular, são descritas, por exemplo, na Patente dos EUA 5.750.871; técnicas para transformar grãos de soja são descritas, por exemplo, na Patente dos EUA 6,384,301; e técnicas para transformar Zea mays são descritas, por exemplo, nas Patentes dos EUA 7.060.876 e
5.591.616, e Pedido Internacional PCT WO 95/06722.
[00134] Após entrega eficaz de um ácido nucleico exógeno para uma célula receptora, uma célula transformada é geralmente identifi- cada para cultura adicional e regeneração de planta. A fim de aprimo- rar a capacidade de identificar transformantes, pode ser desejado em- pregar um gene de marcador selecionável com o vetor de transforma- ção usado para gerar a transformação. Em uma modalidade ilustrativa, uma população de célula transformada pode ser examinada expondo- se as células a um agente ou agentes seletivos, ou as células podem ser analisadas para o traço de gene de marcador desejado.
[00135] As células que sobrevivem à exposição a um agente seleti- vo, ou células que foram classificadas como positivas em um ensaio de análise, podem ser cultivadas em meios que suportam regeneração de plantas. Em uma modalidade, qualquer meio de cultura de tecido de planta adequado pode ser modificado incluindo-se substâncias adi- cionais, como reguladores de crescimento. O tecido pode ser mantido em um meio básico com reguladores de crescimento até tecido sufici- ente estar disponível para iniciar os esforços de regeneração de plan- ta, ou após ciclos repetidos de seleção manual, até a morfologia do tecido estar adequada para regeneração (por exemplo, pelo menos 2 semanas) e, então, ser transferido para meios condutores para forma- ção de brotos. As culturas são transferidas periodicamente até a for- mação de broto suficiente ter ocorrido. Uma vez que os brotos estejam formados, os mesmos são transferidos para um meio condutor para formação de raiz. Uma vez que raízes suficientes estejam formadas, as plantas podem ser transferidas para o solo para crescimento e ma- turação adicional.
Plantas Transgênicas
[00136] Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende um promotor de GMTEFs1. Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende o promotor de GmMTEFs1 de uma sequência selecionada dentre a SEQ ID NO:2 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identi- dade de sequência com uma sequência selecionada dentre as SEQ ID NO:2. Em uma modalidade, uma planta, tecido de planta ou célula ve- getal compreende um cassete de expressão de gene que compreende uma sequência selecionada dentre as SEQ ID NO:2 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada dentre as SEQ ID NO:2 que é ligada de modo operacional a um gene não GMTEFs1. Em uma modalidade ilustrativa, uma planta, tecido de planta ou célula vegetal compreende um cassete de expressão de gene que compreende um promotor de GmTEFs1 que está ligado de maneira funcional a um transgene ou sequência de codificação heteróloga, em que o transgene ou sequên-
cia de codificação heteróloga pode ser um transgene de resistência a inseticida, um transgene de tolerância a herbicida, um transgene de eficiência de uso de nitrogênio, um transgene de eficiência de uso de água, um transgene de qualidade nutricional, um transgene de ligação a DNA, um transgene de marcador selecionável ou combinação dos mesmos.
[00137] Em conformidade com uma modalidade, é fornecida uma planta, tecido de planta ou célula vegetal, em que a planta, tecido de planta ou célula vegetal compreende uma sequência derivada de pro- motor de GMTEFs1 ligada de maneira funcional a um transgene, em que a sequência derivada de promotor de GMTEFs1 compreende uma sequência SEQ ID NO:2 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:2. Em uma modalidade, é fornecida uma planta, tecido de planta ou célula vegetal, em que a planta, tecido de planta ou célula vegetal compre- ende a SEQ ID NO:2 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:2 ligada de maneira funcional a um gene não GmMTEFs1. Em uma modalidade, a planta, tecido de planta, ou célula vegetal é uma planta dicotiledônea ou monocotiledônea ou uma célula ou tecido derivado de uma planta dicotiledônea ou monocotiledônea. Em uma modalidade, a planta é selecionada dentre o grupo que consiste em Zea mays, trigo, arroz, sorgo, aveia, centeio, bananas, cana de açúcar, soja, algodão, girasso!| e canola. Em uma modalidade, a planta é Zea mays. Em outra modali- dade, a planta é soja (por exemplo, Glycine max). De acordo com uma modalidade, a planta, tecido de planta, ou célula vegetal compreende a SEQ ID NO: 2 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma SEQ ID NO:2 ligada de maneira funcional a um gene não GmMTEFs1. Em uma modalidade, a planta, tecido de planta ou célula vegetal compreende um promotor ligado de maneira funcional a um transgene/sequência de codificação heteróloga em que o promotor consiste na SEQ ID NO:2 ou em uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:2. De acordo com uma modalidade, o construto de gene que compreende um promotor de gene GmMTEFs1 ligado de maneira funcional a um transgene/sequência de codificação heteróloga é incorporado ao genoma da planta, tecido de planta ou célula vegetal.
[00138] Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende uma UTR 5' de GMTEFs1. Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende a UTR 5' de GmMTEFs1 de uma sequência selecionada dentre a SEQ ID NO:3 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identi- dade de sequência com uma sequência selecionada dentre as SEQ ID NO:3. Em uma modalidade, uma planta, tecido de planta ou célula ve- getal compreende um cassete de expressão de gene que compreende uma sequência selecionada dentre as SEQ ID NO:3, ou uma sequên- cia que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequên- cia com uma sequência selecionada dentre as SEQ ID NO:3 que é li- gada de modo operacional a um gene não GmMTEFs1. Em uma moda- lidade ilustrativa, uma planta, tecido de planta ou célula vegetal com- preende um cassete de expressão de gene que compreende uma UTR 5' de GM TEFs1 que é ligada de maneira funcional a um transgene, em que o transgene/sequência de codificação heteróloga pode ser um transgene de resistência a inseticida, um transgene de tolerância a herbicida, um transgene de eficiência de uso de nitrogênio, um trans- gene de eficiência de uso de água, um transgene de qualidade nutrici- onal, um transgene de ligação de DNA, um transgene de marcador selecionável ou combinações dos mesmos.
[00139] De acordo com uma modalidade, é fornecida uma planta,
tecido de planta ou célula vegetal, em que a planta, tecido de planta ou célula vegetal compreende uma sequência derivada de UTR 5' de GmTEFs1 ligada de maneira funcional a um transgene, em que a se- quência derivada de UTR 5' de GNTEFs1 compreende uma sequência SEQ ID NO:3 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:3. Em uma mo- dalidade, é fornecida uma planta, tecido de planta ou célula vegetal, em que a planta, tecido de planta ou célula vegetal compreende a SEQ ID NO:3 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:3 ligada de ma- neira funcional a um gene não GmMTEFs1. Em uma modalidade, a planta, tecido de planta, ou célula vegetal é uma planta dicotiledônea ou monocotiledônea ou uma célula ou tecido derivado de uma planta dicotiledônea ou monocotiledônea.
Em uma modalidade, a planta é selecionada dentre o grupo que consiste em Zea mays, trigo, arroz, sorgo, aveia, centeio, bananas, cana de açúcar, soja, algodão, girassol! e canola.
Em uma modalidade, a planta é Zea mays.
Em outra modali- dade, a planta é soja (por exemplo, Glycine max). Em conformidade com uma modalidade, a planta, tecido de planta ou célula vegetal compreende a SEQ ID NO:3 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:3 ligada de maneira funcional a um gene não GMTEFs1. Em uma moda- lidade, a planta, tecido de planta ou célula vegetal compreende uma UTR 5' ligada de maneira funcional a um transgene/sequência de codi- ficação heteróloga, em que a UTR 5' consiste na SEQ ID NO:3 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:3. De acordo com uma modalidade, o construto de gene que compreende uma UTR 5' de gene GmMTEFs1 ligada de maneira funcional a um transgene/sequência de codificação heteróloga é incorporado ao genoma da planta, tecido de planta ou célula vegetal.
[00140] Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende um íntron de GmMTEFs1. Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende o íntron de GmTEFs1 de uma sequência selecionada dentre a SEQ ID NO:28 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada dentre as SEQ ID NO:28. Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende um cassete de expressão de gene que compre- ende uma sequência selecionada dentre as SEQ ID NO:28, ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada dentre as SEQ ID NO:28 que é ligada de modo operacional a um gene não GMTEFs1. Em uma modalidade ilustrativa, uma planta, tecido de planta ou célula vegetal compreende um cassete de expressão de gene que compreende um íntron de GMTEFs1 que é ligado de maneira funcional a um transgene, em que o transgene/sequência de codificação heteróloga pode ser um transgene de resistência a inseticida, um transgene de tolerância a herbicida, um transgene de eficiência de uso de nitrogênio, um trans- gene de eficiência de uso de água, um transgene de qualidade nutrici- onal, um transgene de ligação de DNA, um transgene de marcador selecionável ou combinações dos mesmos.
[00141] Em conformidade com uma modalidade, é fornecida uma planta, tecido de planta ou célula vegetal, em que a planta, tecido de planta ou célula vegetal compreende uma sequência derivada de ín- tron de GM TEFs1 ligada de maneira funcional a um transgene, em que a sequência derivada de íntron GNMTEFs1 compreende uma sequência SEQ ID NO:28 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:28. Em uma modalidade, é fornecida uma planta, tecido de planta ou célula vegetal,
em que a planta, tecido de planta ou célula vegetal compreende a SEQ ID NO:28 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:28 ligada de maneira funcional a um gene não GmMTEFs1. Em uma modalidade, a planta, tecido de planta, ou célula vegetal é uma planta dicotiledônea ou monocotiledônea ou uma célula ou tecido derivado de uma planta dicotiledônea ou monocotiledônea. Em uma modalidade, a planta é selecionada dentre o grupo que consiste em Zea mays, trigo, arroz, sorgo, aveia, centeio, bananas, cana de açúcar, soja, algodão, girasso| e canola. Em uma modalidade, a planta é Zea mays. Em outra modali- dade, a planta é soja (por exemplo, Glycine max). Em conformidade com uma modalidade, a planta, tecido de planta ou célula vegetal compreende a SEQ ID NO:28 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:28 ligada de maneira funcional a um gene não GNTEFs1. Em uma moda- lidade, a planta, tecido de planta ou célula vegetal compreende um ín- tron ligado de maneira funcional a um transgene/sequência de codifi- cação heteróloga, em que o íntron consiste na SEQ ID NO:28 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:28. De acordo com uma modalidade, o construto de gene que compreende uma sequência de íntron de GmTEFs1 ligada de maneira funcional a um transgene/sequência de codificação heteróloga é incorporado ao genoma da planta, tecido de planta ou célula vegetal.
[00142] Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende uma UTR 3' de GmMTEFs1. Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende a UTR 3' de GmMTEFs1 de uma sequência selecionada dentre a SEQ ID NO:4 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identi- dade de sequência com uma sequência selecionada dentre as SEQ ID
NO:4. Em uma modalidade, uma planta, tecido de planta ou célula ve- getal compreende um cassete de expressão de gene que compreende uma sequência selecionada da SEQ ID NO:4, ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada dentre as SEQ ID NO:4 que é ligada de modo operacional a um gene não GMTEFs1. Em uma modalidade ilus- trativa, uma planta, tecido de planta ou célula vegetal compreende um cassete de expressão de gene que compreende uma UTR 3' de GmTEFs1 que é ligada de maneira funcional a um transgene, em que o transgene/sequência de codificação heteróloga pode ser um trans- gene de resistência a inseticida, um transgene de tolerância a herbici- da, um transgene de eficiência de uso de nitrogênio, um transgene de eficiência de uso de água, um transgene de qualidade nutricional, um transgene de ligação de DNA, um transgene de marcador selecionável ou combinações dos mesmos.
[00143] De acordo com uma modalidade, é fornecida uma planta, tecido de planta ou célula vegetal, em que a planta, tecido de planta ou célula vegetal compreende uma sequência derivada de UTR 3' de GmTEFs1 ligada de maneira funcional a um transgene, em que a se- quência derivada de UTR 3' de GNTEFs1 compreende uma sequência SEQ ID NO:4 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:4. Em uma mo- dalidade, é fornecida uma planta, tecido de planta ou célula vegetal, em que a planta, tecido de planta ou célula vegetal compreende a SEQ ID NO:4 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:4 ligada de ma- neira funcional a um gene não GMTEFs1. Em uma modalidade, a planta, tecido de planta, ou célula vegetal é uma planta dicotiledônea ou monocotiledônea ou uma célula ou tecido derivado de uma planta dicotiledônea ou monocotiledônea. Em uma modalidade, a planta é selecionada dentre o grupo que consiste em Zea mays, trigo, arroz, sorgo, aveia, centeio, bananas, cana de açúcar, soja, algodão, girasso!| e canola. Em uma modalidade, a planta é Zea mays. Em outra modali- dade, a planta é soja (por exemplo, Glycine max). Em conformidade com uma modalidade, a planta, tecido de planta ou célula vegetal compreende a SEQ ID NO:4 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:4 ligada de maneira funcional a um gene não GMTEFs1. Em uma moda- lidade, a planta, tecido de planta ou célula vegetal compreende uma UTR 3' ligada de maneira funcional a um transgene/sequência de codi- ficação heteróloga, em que a UTR 3' consiste na SEQ ID NO:4 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:4. De acordo com uma modalidade, o construto de gene que compreende uma sequência de UTR 3' de gene GmTEFs1 ligada de maneira funcional a um transgene/sequência de codificação heteróloga é incorporado ao genoma da planta, tecido de planta ou célula vegetal.
[00144] Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende um terminador de GM TEFs1. Em uma modalida- de, uma planta, tecido de planta ou célula vegetal compreende o ter- minador de GM TEFs1 de uma sequência selecionada dentre a SEQ ID NO:5 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada dentre as SEQ ID NO:5. Em uma modalidade, uma planta, tecido de planta ou célula vegetal compreende um cassete de expressão de gene que compreende uma sequência selecionada dentre as SEQ ID NO:5, ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada dentre as SEQ ID NO:5 que é ligada de modo operacional a um gene não GmMTEFs1. Em uma modalidade ilustrativa, uma planta, tecido de planta ou célula vegetal compreende um cassete de expressão de gene que compreende um terminador de GmMTEFs1 que está ligado de maneira funcional a um transgene, em que o transgene/sequência de codificação heteróloga pode ser um transgene de resistência a inseticida, um transgene de tolerância a herbicida, um transgene de eficiência de uso de nitrogê- nio, um transgene de eficiência de uso de água, um transgene de qua- lidade nutricional, um transgene de ligação de DNA, um transgene de marcador selecionável ou combinações dos mesmos.
[00145] Em conformidade com uma modalidade, é fornecida uma planta, tecido de planta ou célula vegetal, em que a planta, tecido de planta ou célula vegetal compreende uma sequência derivada de ter- minador de GMTEFs1 ligada de maneira funcional a um transgene, em que a sequência derivada de terminador de GMTEFs1 compreende uma sequência SEQ ID NO:5 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:5. Em uma modalidade, é fornecida uma planta, tecido de planta ou célu- la vegetal, em que a planta, tecido de planta ou célula vegetal compre- ende a SEQ ID NO:5 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com a SEQ ID NO:5 ligada de maneira funcional a um gene não GMTEFs1. Em uma modalidade, a planta, tecido de planta, ou célula vegetal é uma planta dicotiledônea ou monocotiledônea ou uma célula ou tecido derivado de uma planta dicotiledônea ou monocotiledônea. Em uma modalidade, a planta é selecionada dentre o grupo que consiste em Zea mays, trigo, arroz, sorgo, aveia, centeio, bananas, cana de açúcar, soja, algodão, girassol! e canola. Em uma modalidade, a planta é Zea mays. Em outra modali- dade, a planta é soja (por exemplo, Glycine max). De acordo com uma modalidade, a planta, tecido de planta ou célula vegetal compreende a SEQ ID NO:5 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com SEQ ID NO:5 ligada de manei-
ra funcional a um gene não GMTEFs1. Em uma modalidade, a planta, tecido de planta ou célula vegetal compreende um terminador ligado de maneira funcional a um transgene/sequência de codificação heteró- loga em que o terminador consiste na SEQ ID NO:5 ou em uma se- quência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de se- quência com a SEQ ID NO:5. De acordo com uma modalidade, o construto de gene que compreende uma sequência terminadora de gene GmTEFs1i ligada de maneira funcional a um transge- ne/sequência de codificação heteróloga é incorporado ao genoma da planta, tecido de planta ou célula vegetal.
[00146] Em uma modalidade, uma planta, tecido de planta ou célula vegetal, de acordo com os métodos revelados no presente documento, pode ser uma planta dicotiledônea. A planta dicotiledônea, tecido de planta, ou célula vegetal pode ser, porém sem limitação, alfafa, colza, canola, mostarda indiana, mostarda da Etiópica, soja, girassol, algo- dão, feijões, brócolis, repolho, couve-flor, aipo, pepino, berinjela, alfa- ce; melão, ervilha, pimenta, amendoim, batata, abóbora, rabanete, es- pinafre, beterraba, girassol, tabaco, tomate e melancia.
[00147] Um indivíduo versado na técnica reconhecerá que, após a sequência exógena ser incorporada de modo estável em plantas transgênicas e confirmada como sendo operável, a mesma pode ser introduzida em outras plantas por cruzamento sexual. Qualquer uma dentre um número de técnicas de reprodução padrão pode ser usada, dependendo das espécies a serem cruzadas.
[00148] A presente revelação também abrange as sementes das plantas transgênicas descritas acima, em que a semente tem o trans- gene/sequência de codificação heteróloga ou construto de gene que contém os elementos reguladores de gene da presente revelação. À presente revelação abrange ainda a progênie, clones, linhagens celu- lares ou células das plantas transgênicas descritas acima, em que a dita progênie, clone, linhagem celular ou célula tem o transge- ne/sequência de codificação heteróloga ou construto de gene que con- tém os elementos reguladores de gene da presente revelação.
[00149] Apresente revelação também abrange o cultivo das plantas transgênicas descritas acima, em que a planta transgênica tem o transgene/sequência de codificação heteróloga ou construto de gene que contém os elementos reguladores de gene da presente revelação. Consequentemente, tais plantas transgênicas podem ser genetica- mente modificadas para, inter alia, ter um ou mais traços ou eventos transgênicos desejados que contêm os elementos reguladores de ge- ne da presente revelação, ao serem transformadas com moléculas de ácido nucleico de acordo com a invenção, e podem ser colhidas ou cultivadas por qualquer método conhecido por aqueles versados na técnica. Método de Expressar um Transgene
[00150] Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um promotor de GmTEFs1 ligado de maneira funcional a pelo menos um transge- ne/sequência de codificação heteróloga ou uma sequência poliligante. Em uma modalidade, o promotor de GMTEFs1 consiste em uma se- quência selecionada a partir da SEQ ID NO:2 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada a partir da SEQ ID NO:2. Em uma modali- dade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um promotor de GMTEFs1 ligado de maneira funcional a pelo menos um transgene. Em uma modalidade, um méto- do para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de planta ou célula vegetal compreende culti-
var um tecido de planta ou célula vegetal que compreende um promo- tor de GM TEFs1 ligado de maneira funcional a pelo menos um trans- gene.
[00151] Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um cassete de ex- pressão de gene que compreende um promotor de GmMTEFs1 ligado de modo operacional a pelo menos um transgene. Em uma modalida- de, o promotor de GMTEFs1 consiste em uma sequência selecionada a partir da SEQ ID NO:2 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência sele- cionada a partir da SEQ ID NO:2. Em uma modalidade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que com- preende um cassete de expressão de gene que compreende um pro- motor de GmMTEFs1 ligado de modo operacional a pelo menos um transgene. Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um cassete de ex- pressão de gene que compreende um promotor de GmMTEFs1 ligado de modo operacional a pelo menos um transgene. Em uma modalida- de, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de planta ou célula vegetal compreende cultivar um tecido de planta ou célula vegetal que com- preende um cassete de expressão de gene contendo um promotor de GmTEFs1 ligado de maneira funcional a pelo menos um transgene. Em uma modalidade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de plan- ta ou célula vegetal compreende cultivar um tecido de planta ou célula vegetal que compreende um cassete de expressão de gene que com-
preende um promotor de GMTEFs1 ligado de maneira funcional a pelo menos um transgene.
[00152] Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende uma UTR 5' de GmTEFs1 ligada de maneira funcional a pelo menos um transge- ne/sequência de codificação heteróloga ou uma sequência poliligante. Em uma modalidade, a UTR 5' de GmMTEFs1 consiste em uma se- quência selecionada a partir da SEQ ID NO:3 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada a partir da SEQ ID NO:3. Em uma modali- dade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende uma UTR 5' de GMTEFs1 ligada de maneira funcional a pelo menos um transgene. Em uma modalidade, um méto- do para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de planta ou célula vegetal compreende culti- var um tecido de planta ou célula vegetal que compreende uma UTR 5' de GmMTEFs1 ligada de maneira funcional a pelo menos um transgene.
[00153] Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um cassete de ex- pressão de gene que compreende uma UTR 5' de GM TEFs1 ligada de modo operacional a pelo menos um transgene. Em uma modalidade, a UTR 5' de GMTEFs1 consiste em uma sequência selecionada a partir da SEQ ID NO:3 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada a partir da SEQ ID NO:3. Em uma modalidade, um método para expres- sar pelo menos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um cas-
sete de expressão de gene que compreende uma UTR 5' de GmTEFs1 ligada de modo operacional a pelo menos um transgene. Em uma modalidade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em uma planta com- preende cultivar uma planta que compreende um cassete de expres- são de gene que compreende uma UTR 5' de GmMTEFs1 ligada de modo operacional a pelo menos um transgene. Em uma modalidade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de planta ou célula vegetal com- preende cultivar um tecido de planta ou célula vegetal que compreen- de um cassete de expressão de gene contendo uma UTR 5' de GmTEFs1 ligada de maneira funcional a pelo menos um transgene. Em uma modalidade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de plan- ta ou célula vegetal compreende cultivar um tecido de planta ou célula vegetal que compreende um cassete de expressão de gene que com- preende uma UTR 5' de GMTEFs1 ligada de maneira funcional a pelo menos um transgene.
[00154] Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um íntron de GmTEFs1 ligado de maneira funcional a pelo menos um transge- ne/sequência de codificação heteróloga ou uma sequência poliligante. Em uma modalidade, o íntron de GNTEFs1 consiste em uma sequên- cia selecionada a partir da SEQ ID NO:28 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada a partir da SEQ ID NO:28. Em uma modalida- de, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um íntron de GmMTEFs1 ligado de maneira funcional a pelo menos um transgene. Em uma modalidade, um méto- do para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de planta ou célula vegetal compreende culti- var um tecido de planta ou célula vegetal que compreende um íntron de GmTEFs1 ligado de maneira funcional a pelo menos um transgene.
[00155] Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um cassete de ex- pressão de gene que compreende um íntron de GMTEFs1 ligado de modo operacional a pelo menos um transgene. Em uma modalidade, o íntron de GMTEFs1 consiste em uma sequência selecionada a partir da SEQ ID NO:28 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada a partir da SEQ ID NO:28. Em uma modalidade, um método para ex- pressar pelo menos um transgene/sequência de codificação heterólo- ga em uma planta compreende cultivar uma planta que compreende um cassete de expressão de gene que compreende um íntron de GmTEFs1 ligado de modo operacional a pelo menos um transgene. Em uma modalidade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em uma planta com- preende cultivar uma planta que compreende um cassete de expres- são de gene que compreende um íntron de GMTEFs1 ligado de modo operacional a pelo menos um transgene. Em uma modalidade, um mé- todo para expressar pelo menos um transgene/sequência de codifica- ção heteróloga em um tecido de planta ou célula vegetal compreende cultivar um tecido de planta ou célula vegetal que compreende um cassete de expressão de gene contendo um íntron de GMTEFs1 liga- do de maneira funcional a pelo menos um transgene. Em uma modali- dade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de planta ou célula vegetal compreende cultivar um tecido de planta ou célula vegetal que com- preende um cassete de expressão de gene que compreende um íntron de GmTEFs1 ligado de maneira funcional a pelo menos um transgene.
[00156] Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende uma UTR 3' de GmTEFs1 ligada de maneira funcional a pelo menos um transge- ne/sequência de codificação heteróloga ou uma sequência poliligante. Em uma modalidade, a UTR 3' de GMTEFs1 consiste em uma se- quência selecionada a partir da SEQ ID NO:4 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada a partir da SEQ ID NO:4. Em uma modali- dade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende uma UTR 3' de GmMTEFs1 ligada de maneira funcional a pelo menos um transgene. Em uma modalidade, um méto- do para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de planta ou célula vegetal compreende culti- var um tecido de planta ou célula vegetal que compreende uma UTR 3' de GmTEFs1 ligada de maneira funcional a pelo menos um transgene.
[00157] Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um cassete de ex- pressão de gene que compreende uma UTR 3' de GMTEFs1 ligada de modo operacional a pelo menos um transgene. Em uma modalidade, a UTR 3' de GMTEFs1 consiste em uma sequência selecionada a partir da SEQ ID NO:4 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada a partir da SEQ ID NO:4. Em uma modalidade, um método para expres- sar pelo menos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um cas- sete de expressão de gene que compreende uma UTR 3' de GmTEFs1 ligada de modo operacional a pelo menos um transgene. Em uma modalidade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em uma planta com- preende cultivar uma planta que compreende um cassete de expres- são de gene que compreende uma UTR 3' de GmMmTEFs1 ligada de modo operacional a pelo menos um transgene. Em uma modalidade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de planta ou célula vegetal com- preende cultivar um tecido de planta ou célula vegetal que compreen- de um cassete de expressão de gene contendo uma UTR 3' de GmTEFs1 ligada de maneira funcional a pelo menos um transgene. Em uma modalidade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de plan- ta ou célula vegetal compreende cultivar um tecido de planta ou célula vegetal que compreende um cassete de expressão de gene que com- preende uma UTR 3' de GMTEFs1 ligada de maneira funcional a pelo menos um transgene.
[00158] Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um terminador de GmTEFs1 ligado de maneira funcional a pelo menos um transge- ne/sequência de codificação heteróloga ou uma sequência poliligante. Em uma modalidade, o terminador de GNTEFs1 consiste em uma se- quência selecionada a partir da SEQ ID NO:5 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada a partir da SEQ ID NO:5. Em uma modali- dade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um terminador de GMTEFs1 ligado de manei- ra funcional a pelo menos um transgene. Em uma modalidade, um mé- todo para expressar pelo menos um transgene/sequência de codifica- ção heteróloga em um tecido de planta ou célula vegetal compreende cultivar um tecido de planta ou célula vegetal que compreende um terminador de GMTEFs1 ligado de maneira funcional a pelo menos um transgene.
[00159] Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um cassete de ex- pressão de gene que compreende um terminador de GMTEFs1 ligado de modo operacional a pelo menos um transgene. Em uma modalida- de, o terminador de GMTEFs1 consiste em uma sequência seleciona- da a partir da SEQ ID NO:5 ou uma sequência que tem 80%, 85%, 90%, 95% ou 99,5% de identidade de sequência com uma sequência selecionada a partir da SEQ ID NO:5. Em uma modalidade, um méto- do para expressar pelo menos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que com- preende um cassete de expressão de gene que compreende um ter- minador de GMTEFs1 ligado de modo operacional a pelo menos um transgene. Em uma modalidade, um método para expressar pelo me- nos um transgene/sequência de codificação heteróloga em uma planta compreende cultivar uma planta que compreende um cassete de ex- pressão de gene que compreende um terminador de GmMTEFs1 ligado de modo operacional a pelo menos um transgene. Em uma modalida- de, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de planta ou célula vegetal compreende cultivar um tecido de planta ou célula vegetal que com- preende um cassete de expressão de gene contendo um terminador de GmMTEFs1 ligado de maneira funcional a pelo menos um transgene.
Em uma modalidade, um método para expressar pelo menos um transgene/sequência de codificação heteróloga em um tecido de plan- ta ou célula vegetal compreende cultivar um tecido de planta ou célula vegetal que compreende um cassete de expressão de gene contendo um terminador de GM TEFs1 ligado de maneira funcional a pelo menos um transgene.
[00160] Os exemplos a seguir são fornecidos para ilustrar determi- nados recursos e/ou modalidades específicas. Os exemplos não de- vem ser interpretados como limitando a revelação aos recursos ou modalidades específicos exemplificados.
EXEMPLOS Exemplo 1: Identificação de Elementos Reguladores de Sequências Genômicas de Soja
[00161] Os perfis de expressão da expressão de mRNA total para tecidos de soja (var. Williams 82) foram obtidos por meio de Se- quenciamento de Próxima Geração (NGS) e foram usados para identi- ficar genes de soja candidatos para obter elementos reguladores. Os tecidos incluídos foram coletados de mudas jovens (cotilédones ex- pandidos, raízes e hipocótilos), V5 (folhas e caules) e plantas de soja R5 (folhas, flores, estágios diferentes de desenvolvimento de semente e vagens). Os genes endógenos de soja que exibiram o perfil de ex- pressão desejado foram identificados como candidatos potenciais para se obter as sequências reguladoras.
[00162] Um dos genes com o padrão de expressão desejado foi Glyma19g07240 que foi expresso ubiquitariamente. Esse gene foi identificado como gene GmMTEFs1 que codifica o fator de alongamento de tradução 1 alfa (UniProtKB - 004299 SOYBN) (Apweiler, Rolf, et al. "UniProt: the universal protein knowledgebase." Nucleic acids rese- arch 32.suppl 1 (2004): D115-D119; disponível em http://www.uniprot.org/), assim, esse gene foi descrito como
"GmTEFs1". As sequências reguladoras do gene GmMTEFs1 foram iso- ladas e caracterizadas quanto à capacidade de acionar a expressão de transgene. O promotor do GMTEFs1 é fornecido no presente do- cumento como SEQ ID NO:2.
[00163] As sequências reguladoras do gene Glyma19g07240 (GmMTEFs1) foram definidas como sequência de — 1,4 kb a montante de ATG do gene Glyma19g07240 para o promotor e líder não traduzi- do 5' (UTR) e -0,6 kb a jusante do códon de parada de gene Gly- ma19g07240 para a UTR 3' e terminador. Para refinar ainda as se- quências reguladoras, análises adicionais dos elementos reguladores foram concluídas. Sequências reguladoras a montante e a jusante pu- tativas foram avaliadas quanto à presença de marcas de sequências transponíveis, DNA repressivo (metilação) e cromatina (histona-H3- lisina-4-dimetilação, comumente abreviada como H3K4me2) com o uso de métodos conforme anteriormente revelado na Publicação de Patente nº U.S. 20150128309A1, incorporada ao presente documento a título de referência em sua totalidade. As sequências de DNA do ge- ne Glyma19g07240 contendo as marcas de DNA repressivo e croma- tina foram excluídas da sequência reguladora a montante e a jusante obtida. Extensões longas (100 pb ou mais) de sequências ricas em AT (>75% ricas em AT) dentro das sequências 5' e 3' foram também evi- tadas como meios de reduzir dificuldades com a síntese de novo dos fragmentos de DNA.
[00164] A sequência reguladora a montante de GMTEFs1 resultan- te continha tanto um promotor (SEQ ID NO:2) quanto uma UTR 5' (SEQ ID NO:3) que contém um íntron de 895 pb (SEQ ID NO:28). As sequências a jusante abrangeram uma UTR 3' (SEQ ID NO:4) e um terminador (SEQ ID NO:4) do gene GmMTEFs1. As sequências termi- nadoras se estenderam por -100 a 200 pb além do último sítio de poli- adenilação conhecido. Dois pares de bases de guanina foram deleta-
dos do terminador de GMTEFs1 candidato (SEQ ID NO:5) para remo- ver os sítios de restrição indesejáveis.
[00165] As sequências obtidas a partir do genoma de soja do termi- nador e promotor/UTR 5' do gene GmMTEFs1 (Glyma19g07240) são fornecidas no presente documento. Exemplo 2: Clonagem das Sequências Reguladoras de Soja
[00166] As sequências de promotor, 5' UTR e 3' UTR/terminador do gene GmTEFs1 foram sintetizadas por DNA2.0. Um diagrama do fra- gmento sintético é mostrado na Figura 1. Um ligante contendo múlti- plos sítios de clonagem foi incluído entre o promotor/UTR 5' com o ín- tron e a sequência de UTR 3'//terminador.
[00167] O fragmento de GmMTEFs1 sintético (promotor/UTR 5' e terminador) foi clonado em um vetor de entrada de Porta de acesso, e o gene-repórter RFP/AAD12 (SEQ ID NO:10) foi inserido entre a UTR 5' e o terminador. O gene-repórter foi o repórter duplo que codifica uma proteína de fusão de tradução que contém os polipeptídeos RFP e AAD1I2 unidos com o ligante de peptídeo helicoidal rígido, LAE(EAAAK)sAAA descrito por Arai et a/l, (2001), Protein Eng, 14, 529 a 532 e Marqusee et a/, (1987), Proc Natl Acad Sci USA, 84, 8.898 a
8.902. O cassete de expressão resultante (SEQ ID NO:11) foi movido para um vetor binário e identificado como pDAB122124. Esse vetor binário também continha o gene de Proteína Verde Fluorescente (GFP) acionado pelo promotor UTR 5' de Arabidopsis Ubiquitin3 (AtU- bi3) e terminado pelo terminador de Arabidopsis Ubiquitin 3 (AtUbi3). Igualmente, o vetor binário continha o gene de fosfofinotricina N- acetiltransferase sintético de Streptomyces viridochromogenes (PAT) que foi acionado pelo promotor do vírus do mosaico da veia da mandi- oca (CsSVMV) e terminado pelo terminador de Agrobacterium tumefaci- ens Orf1 (AtuOrf1). Os cassetes de expressão de gene GFP e PAT são fornecidos como SEQ ID NO:12.
[00168] As etapas de clonagem para as sequências reguladoras de GmAct7-2 e GMGAPC1 foram similares àquelas descritas acima para GmTEFs1. O GmAct7-2 foi testado no construto pDAB122133 e GmGAPC1 foi testado no construto pDAB122134.
Exemplo 3: Infiltrações de Folha de N. benthamiana e Ensaios Tem- porários da Expressão Acionada por GmTEFs1, GmAct7-2 e GmGAPC1 do Repórter REP/AAD12
[00169] A seguir, plantas de N.benthamiana foram cultivadas na estufa sob um fotoperíodo de 16 horas, a 27 ºC/24 ºC. As plantas de a 24 dias de idade foram usadas para ensaios de expressão tempo- rários. Para isso, as 3 a 4 folhas superiores foram infiltradas com o uso de uma mistura de duas cepas de Agrobacterium tumefaciens modifi- cadas. A primeira cepa foi usada em todas as infiltrações e portou o construto pDAB112236 contendo o transgene que expressou o su- pressor de silenciamento P19 (Voinnet et a/, (1999), Proc Natl Acad Sci U.S.A., 96, 14.147 a 14.152). A segunda cepa de Agrobacterium foi ou a cepa experimental que porta um construto de teste (com os elementos reguladores de GMTEFs1, GmAct7-2 ou GNGAPC1) ou um construto de controle de referência (Tabela 1). Os construtos de refe- rência que foram usados continham o gene-repórter RFEP/AAD12 sob o controle do promotor de Arabidopsis thaliana Ubiquitin 14::terminador de Arabidopsis thaliana Ubiquitin 14 (AtUbi14/AtUbi14) e o promotor de Arabidopsis thaliana Ubiquitin 10::Agrobacterium tumefaciens Orf23 (AtUbi10/AtuOrf23). As razões de mistura tiveram base nas leituras de Densidade Óptica (OD). A densidade de todas as culturas de Agrobac- terium foi ajustada para OD 2.0. Após a infiltração, as plantas foram cultivadas a um Conviron'Y até que as folhas infiltradas fossem cole- tadas no quinto dia após a infiltração. Os dados de fluorescência para os genes-repórter foram coletados com o uso de um digitalizador Typhoon'"Y de 25 a 30 discos de folha de 1,5 cm individuais para cada construto.
[00170] Todas as amostras de N. benthamiana foram digitalizadas em três canais; clorofila (488 nm de laser azul, 670 nm de BP30, 580 nm de divisão), GFP (488 nm de laser azul, 520 nm de BP40, 580 nm de divisão), e RFP (532 nm de laser verde, 580 nm de BP30). A defini- ção de tensão de fotomultiplicador (PMT) usada para N. benthamiana foi 340 para clorofila, 340 para GFP e 360 para RFP.
[00171] Os resultados de teste em ensaio transiente de N. bentha- miana são mostrados na Tabela 1. A análise da fluorescência produzi- da pelo transgene repórter RFP/AAD12 revelou que as sequências re- guladoras de GmMTEFs1 resultaram em fluorescência de RFP média (1.283,3 pixels/área) que foi significativamente mais alta (p<0,0001) do que a fluorescência de fundo média (26,1 pixels/área). Foi observado que a fluorescência de RFP/AAD12 das sequências reguladoras de GmTEFs1i era menor (p<0,0001) do que a fluorescência de RFP/AAD12 média dos construtos acionados pelos elementos regula- dores de referência do AtUbi14/AtUbi14 e AtUbi10/AtuOrf23; 7.9567,4 e
3.084,5 pixels/área, respectivamente. A fluorescência de RFP/AAD12 significativamente mais alta do que o fundo suportada pelos elementos reguladores de GmMTEFs1 indicou que as sequências reguladoras de GmTEFs1 de Glyma19g07240 eram funcionais e podem ser usadas para acionar a expressão de um transgene heterólogo em ensaios temporários de folha de N. benthamiana.
[00172] Em contrapartida, para as sequências reguladoras de GmTEFs1 que acionaram expressão de fluorescência de RFP/AAD12 média significativamente mais alta do que o fundo, as sequências re- guladoras de GmAct2-2 e GmMGAPCT1 contidas dentro dos construtos PDAB122333 e pDAB122134, respectivamente, produziram apenas baixos níveis de expressão que foram similares ao fundo (Tabela 1). Esses resultados demonstram que as sequências reguladoras candi-
datas de GmAct2-2 e GMGAPC1 isoladas de novo não tiveram a ca- pacidade de acionar a expressão de transgene RFP/AAD12. A falta de expressão de RFP/AAD1I2 nos construtos de pDAB122333 e PDAB122134 não foi devido a infiltrações insatisfatórias devido ao fato de que o segundo transgene dentro desses construtos, GFP, exibiu fluorescência forte que foi significativamente mais alta do que o fundo (p<0,0001). Assim, esses resultados mostram que as sequências regu- ladoras candidatas de novo de Glyma06g15520 e Glyma06g01850 não tiveram a capacidade de acionar a expressão de transgene repór- ter heterólogo.
[00173] Com base nesses resultados, os construtos pDAB122333 e PDAB122134 que portam GmAct7-2 e GmMGAPC1, respectivamente, não foram prosseguidos ainda . Em contrapartida, o construto PDAB122124 contendo as sequências reguladoras de GmMTEFs1 e exibindo altos níveis constitutivos de fluorescência de RFP/AAD12, em comparação ao fundo das folhas de N. benthamiana, foi avançado pa- ra testes adicionais em plantas transgênicas de Arabidopsis estavel- mente transformadas.
» OOo = =) UOoOOUO Ss Wow | |àN o jo | |g208 o w/o " "e N f=) o SS e |O [5] "vcs o se — co o o fx N O EM o NS k>BO qa oóo De o o S5E E 2) o Er E Jd 888 2 es ms de e je [589 Ss 2S > EO o bd co o o sosºe 2 a 9v|)s fe) o NS o o =. 2o Ss o E. — o x = o e. EE 8 Lu oo T [o] o ae + TESS = 6/8) 2388 - 8|s wo TEQUE o vc o a Pr o W CUOSE E Ss 2 lo Ns É F so OS & vols o [e] ço co co o Tato 2 E 8 | | 8 & 5 8 sgê=s = os - o8 ços Ss OL sc 1 oo0or << FE x z x t x 2oco, FER * X —- x x STO = Ss o o o o - - V Fa So x o o o * lo a o Gas > LOGO 8 EE |º [E 5 |S | 8 7as53 o o o fo) T o oO $ 2 Sou C 7 os oo <c = o 2 O <s — o + — o TETs5Oo = Tn o A - >. 0 OS - o EO = o = Ezsç? E Elo E o el o 075% Ss Ss [-o o = = 27.0 E | w co$293 qa = og 70 = Ú E oo q Fes ma o |s82%82 2 Tas e 3 2 E é EFo07 = alo ql = o rm o Ed EO & so o - = RE O [. ESTIG 2 PRO oc o Vic T o o ns 300< ” ss 2 o S T jº |o o PESO o o + o o o + o 6 O o o co a o NNW a a ao nn O ONO Cc Ts o el = 855 E Õ 8 PR O 3090ECECço DP 8 x z x DE SGSS Fo 2|s x F É neodos 5 Ss = T o o o 2 |deL&£$8oees Ss 3 o o N — o E o oEfESca = Ls a o co a a co RBS o o a 3>38282o o N o —- õ = ke! — o Su? oo” o , LUSO E 7 886 sl o |= o E gos Ss o I= o o 8 CrCoSzsE c FF ES|SN a a o Fe o << TÇROoss 8 : : f f PO oCG8S o 2 Ss 2 2 = =<|= SS, Ô = IL rd < INS OZ TETE OS v 28 = Se = RE E EL LL EoR8sST 2 £ eEG ESTO SCE SQ <<unuv ço so É Ss Eggs 350/TSTZ FSXSIONCONI CADA LAN ã 7 o Ec3E s SO EE E E on < = o zZz37Oo E |5 |5 E E «O S 2 E. o 5 2 2 GO ooo ELO 2 Lg ui 2 |< |< Bs g e : F$35º $ <$ E|5S 8 ,lm Sn Sim Sn Sm 3: En df 8 ES; RSS ZSEIAS ES ,o8OS : s o A nm S|s 2 acâêcâsoaalbaçgoroo S < 5/0 L — — - - Tr oSoa É Fr alo ZP2Po:2E 8 8 3 & 2
É
[00174] O ecotipo Columbia-O (Col-O0) de Arabidopsis thaliana foi usado para testar a expressão do repórter RFP/AAD12 sob o controle dos elementos reguladores de GMTEFs1. Um procedimento de trans- formação de Arabidopsis padrão foi usado para produzir semente transgênica por método de imersão de florescência (Clough e Bent 1998). As sementes T; foram semeadas em bandejas de seleção (26,6 x 53,34 x 2,54 cm (10,5"x21"x1"), T.O. Plastics Inc., Clearwater, MN). Para isso, 200 mg de sementes estratificadas frias (0,1% de ágar + 385 mg/l de Liberty por 48 horas antes de semeadura) foram distribuí- dos em bandejas de seleção com o uso de um aparelho de aspersão acionado por ar modificado para distribuir 10 ml! de suspensão de se- mente por bandeja de seleção. As bandejas foram cobertas com do- mos de umidade, marcadas com identificador de semente e colocadas em um Conviron'M com uma bandeja de irrigação individual sob cada placa. O domo umidificante foi removido aproximadamente cinco dias após a semeadura. A primeira irrigação das bandejas de seleção foi feita com o uso de subirrigação com o fertilizante de Hoagland em aproximadamente 10 a 14 dias após a semeadura. Além da estratifica- ção com o herbicida, as plantas são aspergidas com uma solução 0,2% (20 ul /10mL de H2O destilada) do herbicida Liberty'"" sete e no- ve dias após a semeadura. As plantas T: resistentes a Liberty!" foram transplantadas de bandejas de seleção para potes de duas polegadas (cinco centímetros) e deixadas crescer por sete a dez dias antes da amostragem para análise molecular.
[00175] Em seguida, DNA foi extraído das folhas com o uso de uma folha de aproximadamente 0,5 centímetro quadrado de Arabidopsis que foi removida de cada planta. As amostras foram coletadas em uma placa de extração de DNA de 96 poços. Então, 200 ul de tampão de extração foram adicionados a cada poço e o tecido foi rompido com microesferas de aço inoxidável de três mm com o uso de um pulveri-
zador de tecido Kleko'Y (três minutos na definição máxima). Após a maceração do tecido, o DNA foi isolado com o uso do Kit BioSprint 96 DNA Plant'"Y,
[00176] Para qPCR, o número de cópias de transgenes foi avaliado com o uso de uma sonda de hidrólise projetada para detectar os genes pat e aad12 (Tabela 2). O gene endógeno de Arabidopsis, AtTafll15 (Locus de Arabidopsis: AT4G31720), foi usado para normalização da concentração de modelo de DNA (Tabela 2). A qPCR foi realizada da seguinte forma: 10 ul de mistura Probes Master"'M com uma concen- tração final de 0,4 UM de cada iniciador e 0,2 uM de cada sonda. Os ciclos de PCR foram realizados com o uso de 95 ºC por 10 min, segui- dos por 40 ciclos de amplificação (95 ºC por 1 min, 60º C por 40 s e 72º C por 1 s) e 40 ºC por 1 s. Todos os ensaios de qPCR foram exe- cutados em formato biplex, com os ensaios pat ou aad12 pareados com o ensaio para o gene endógeno AtTaflil15. As pontuações de cp, o ponto no qual o sinal de fluorescência cruza o limiar de fundo com o uso do algoritmo de quantificação relativo avançado, com base no mé- todo AACt, (software LightCycler& versão 1.5) foram usadas para ana- lisar os dados de PCR em tempo real. Todas as amostras foram, en- tão, calibradas a uma planta hemizigota conhecida para obtenção do número de cópias de transgene. Até 100 eventos T: que foram identifi- cados como sendo resistentes a Liberty'“, foram triados para identifi- car eventos de transgene de uma e duas cópias que foram usados pa- ra análises adicionais da expressão de transgene em plantas transgê- nicas Ti.
TABELA 2. Iniciadores e sondas usados para genotipagem e análises de zigosidade de plantas transgênicas de Arabidopsis Nome de Oli- Sequência de Oligo — IIldentificação|! Gene alvo go de fluoróforo) AtTafll15 F SEQ ID NO:13 AtTafll15
GAGGATTAGGGTTTCAA
CGGAG AtTafll15 R SEQ ID NO:14 AtTafll15
IGAGAATTGAGCTGAGAC
GAGG AtTafll SEQ ID NO:15 HEX AtTafll15 15Probe AGAGAAGTTTCGACGGA,
TTTCGGGC Iniciador PAT SEQ ID NO:16 PAT
A ACAAGAGTGGATTGATG
ATCTAGAGAGGT Iniciador PAT SEQ ID NO:17 PAT Ss CTTTGATGCCTATGTGA
CACGTAAACAGT Sonda SEQ ID NO:18 Ccy5 PAT PAT AS AGGGTGTTGTGGCTGGT|
ATTGCTTACGCT AAD1I2F SEQ ID NO:19 AAD12
CAGAGTCCATGCTCACC
AAT AADI2R SEQ ID NO:20 AAD12
ACGTGGCAACTTGAAAT ce Sonda AAD12 SEQ ID NO:21 Cy5 (T1) ou AAD12 TGGAGATGTGGTTGTGT| FAM(T2)
GGGACAA Exemplo 5: Avaliação de Genes Ligados de Maneira Funcional a Se- quências Reguladoras de GMmTEFs1 em Plantas de Arabidopsis T
[00177] Para avaliar a expressão do gene-repórter RFP/AAD12 aci-
onado pelos elementos reguladores de promotor de GMTEFs1, UTR 5' de GmTEFs1 e terminador de GMTEFs1, eventos transgênicos de có- pia única foram identificados e analisados quanto à fluorescência de RFP/AAD12 com o uso do instrumento Typhoon. Todas as amostras foram digitalizadas em três canais: clorofila (488 nm de laser azul, 670 nm de BP30, 580 nm de divisão), GFP (488 nm de laser azul, 520 nm de BP40, 580 nm de divisão), e RFP (532 nm de laser verde, 580 nm de BP30). A definição de PMT para o tecido de folha foi clorofila 400, GFP 400 e RFP 420. Para análises de fluorescência em folhas, folhas de roseta completamente expandidas de eventos transgênicos de poucas cópias (1 a 2 cópias) foram colhidas a partir de cada planta e triadas a partir do lado adaxial (topo). A função de "Desenho de Con- torno" foi usada para destacar formatos de folha e a fluorescência normalizada foi determinada dividindo-se o volume de sinal por super- fície da folha. Os resultados são mostrados na Tabela 3.
[00178] A análise dos eventos T; quanto à fluorescência de RFP/AAD12 revelaram que os elementos reguladores de GmMTEFs1 suportaram alta fluorescência de RFP/AAD1I2 média (804,4 pixels/área) que foi estatisticamente mais alta (p<0,0001) do que a flu- orescência de fundo média (350,5 pixels/área) detectada no controle do tipo selvagem não transgênico (Wt) (Tabela 3). Esses resultados mostram que as sequências reguladoras de GMTEFs1 acionaram ex- pressão maior do que o fundo do repórter RFP/AAD12 em plantas transgênicas de Arabidopsis thaliana. A fluorescência de RFP/AAD12 média produzida pelos elementos reguladores de GM TEFs1 foi menor do que os níveis de fluorescência de RFP/AAD12 dos construtos de referência pDAB117559 e pDAB117560 (p<0,0001, não mostrado). Nos construtos pDAB117559 e pDAB117560, o repórter RFP/AAD12 estava sob o controle dos elementos reguladores a seguir; promotor de Arabidopsis thaliana Ubiquitin 14::terminador de Arabidopsis thalia-
na Ubiquitin 14 e o promotor de Arabidopsis thaliana Ubiquitin 10::terminador de Agrobacterium tumefaciens Orf23, respectivamente.
Embora a fluorescência suportada por RFP/AAD12 tenha sido menor do que os controles positivos pDAB117559 e pDAB117560, a mesma foi maior do que a fluorescência de fundo, indicando que GmMTEFs1 suporta expressão de transgene baixa, mas estatisticamente mais alta do que o fundo.
Com base nesses resultados, os eventos transgênicos de pDAB122124 contendo as sequências reguladoras de GmMTEFs1 foram avançados para caracterização adicional em Arabidopsis T2.
OL ss o : º - a 283º S o = = ES 8 na ojo N = s 3 ES : 58 IR E oro o e s|& Ss ã 8 mo — =OÇ : É 300 o z a o 83º ões 2 e Ss. 8 SO Sw o 8 & o > E 5 Ss SF T SE 8 8 aç3iº FE S T EE é o SB o RX se -. ES S sós ++ â = oO j 3 Ts zo o r . S 3 e e - : = 8 o Õ - + S & SE o nl << 3 = F 235 Ss z 2 8 ai o 95 S : 2 sW Ss 83 $ E. 85 o s= - - : seo o L z t í + & à E | hn | ges : ; ; S 8 To : 8 |E |à |5 ss õ O = o & SE ) 25 2 Ss 1 8 E 3 Sçõo : - S 2070 8) õ co — e So ZÉ EEE o 8 3 Ses E oe ES 8 8 58 & es + : - 6 0275BT é 2 | E fo "Et go q o 3 285 LE eg = - SS ao
8. 8 TZ o 3 S EE 2 8 /9/8FS <x 28 TE as E o à: SG TS Ss o = |. 288sã gas o Do Ss o ss S o Ss 8 S STã8 o <mçT FE o tó ro O o oBS 8? 3 é S Co - eos o U|5 8830 o) o ss 8 : BD Gg = x x z 5897 8 o EPA z t : E 2 E o o & o & 28: : 3 À S NT Dl SoB88 So $ 8 às | 3 [5082 85) 2 8 |S E o 2: 7 o 38o o E 382: a 8/23 3 le 828% 2 E 5 s 2823 Sa gÇ 8888 Ss o > Se : "o o = —- Éo8E : 8 8 FP" — SN EL aSo8 : 3 2 os E ZssS é eo : Ses 3 = EE & Sa : ES ss FS SS 3SEEç5õãs : E S $ ê 7 Ss E 5 Sc2Z2 22 5 o gs : E 2 ZE << Z 6 2885 : é so. IE SSS : % CAPEAPET SS : fez] qo 82/15 : 43 ao = AEATaNSdiõe : Tico) ss [z fa à Tias Séc ! “o | ã << o : Fr Cc :
Exemplo 6: Expressão de Genes Ligados de Maneira Funcional a Se- quências Reguladoras de GMTEFs1 em Folhas de Plantas de Arabi- dopsis T2
[00179] As sequências reguladoras de GMTEFs1 exibiram níveis de expressão mais baixos, mas significativamente mais altos do que o fundo, em comparação aos níveis de expressão das sequências regu- ladoras de referência de promotor de Arabidopsis thaliana Ubiquitin 14::terminador de Arabidopsis thaliana Ubiquitin 14 e promotor de Ara- bidopsis thaliana Ubiquitin 10:: terminador de Agrobacterium tumefaci- ens Orf23 em Arabidopsis T1 (EXEMPLO 5). Os eventos selecionados que continham as sequências reguladoras de GMTEFs1 que acionam o gene-repórter RFP/AAD12 foram avançados para caracterização adicional em plantas de Arabidopsis T2. Consequentemente, cinco plantas T; que expressaram níveis médios a altos de RFP/AAD12 e GFP foram selecionadas. Essas cinco plantas continham eventos transgênicos de pDAB122124 e foram selecionadas para teste de planta T2. A partir desses quatro eventos, 56 plantas foram cultivadas para cada evento. As plantas T> foram genotipadas de modo molecu- lar, conforme descrito no EXEMPLO 4. Com base nas análises mole- culares, todas as plantas homozigotas e um número comparável de hemizigotas foram retidas para análise de fluorescência dos eventos de cópia única. Para simplificar a interpretação de dados para os even- tos transgênicos de duas cópias, apenas plantas hemizigotas foram retidas para análises de expressão.
[00180] Os resultados das análises em plantas transgênicas T2 são fornecidos na Tabela 4. Os resultados para eventos homozigotos (1 cópia) e hemizigotos (1 e 2 cópias) que continham o transgene RFP/AAD12 sob o controle de elementos reguladores de GmMTEFs1 exibiram fluorescência de RFP/AAD12 que foi significativamente mais alta do que a fluorescência de fundo de plantas de controle não trans-
gênicas.
Embora a fluorescência de RFP/AAD12 média produzida por hemizigoto e homozigoto para uma planta transgênica que porta os elementos reguladores de GmMTEFs1 tenha sido significativamente mais alta do que a fluorescência de fundo (Tabela 4), essa fluorescên- cia foi mais baixa do que esta dos construtos de referência PDAB117559 e pDAB117560 (p<0,0002, não mostrado). Nos constru- tos pDAB117559 e pDAB117560, o repórter RFP/AAD12 estava sob o controle dos elementos reguladores a seguir; promotor de Arabidopsis thaliana Ubiquitin 14::terminador de Arabidopsis thaliana Ubiquitin 14 e o promotor de Arabidopsis thaliana Ubiquitin 10::terminador de Agrobacterium tumefaciens Orf23, respectivamente.
Esses resultados demonstram que as sequências reguladoras de GMTEFs1 suportam a expressão robusta de transgenes em duas gerações de eventos trans- gênicos.
oo.
De o õ N ajlo SD882 No) Tn oo o Ts S 8/28; o o 165 x Ss 3s 83 E 8 S e ese Nn x e âns 3 2 =O 3 Ê & SC 383% o x o < nn] 2 2/8 3 3 o “lo " z 23 sig 3 SS E Ss &8 SN So é . a 838 |$ D [ES Si=ioag 2 o go 8 o o A o Lô S $ ã 2 o + ojel e o E C es o qs e sielegs o vc co 2 « SS S 2 53 33 es a 6 T = FNE g e 3 oÔo = SS SS o E & Ê o o o 2 | - x 280 $ = tt |z | 29% o o x x tt LS " o f t EE b|&/E88 ê õ Ss ci > o o Nils o 5? ro o NS ei o S | S 5/5 52 é : 3 3 3 FS Sd 8 oES é - & o Ojo 87 : aja. so x Õõ o o no d) 8/3 58 À g : O |N NE 5 | S/A ol 2 Si S|< 5/2 3 é 3 Ss ess 8 Ss o o = 28 a o E DIO 6 o É 8 e) | são |é 21888 ê Ss TS Tao & F ZF eso 2 |& Zs SS ss u 2>E S gs 83 S2 82 EAR E 8 SS = 885 o Logo [ss Se? 3 Ls e ae E $S E Fr om o o ne a e ess o 2 Te o << co =|R $ 38 2 FA S a o o ss 8 s a. a 3/83 Ss 8 & So TriIN ESET SES 2 8 32 7 7 - e) DEoL esco = = eo —Es3É Ss CE o]Ss 7 o - ES SE Í & x lã Rà ss > E o & j& Rs Sã £283 oO x IE N 2. IZ« JE: Sig 5288 3 ã e O O o = Pv os 2 32 S8 |S8 3882 8 OE = Õ NR So NS 888% E 2 |E O SG8s o "+ 58 <S &8 ee 838% S S | É 2 Q Tv ao 225 To a & - 232 ê * 50 O o nD)ZES 2288 $ =/ oO FE ê 2 E| e E el nÇEoS ; L 8 DO E E Ele E SS “13 o 3 E E SE Ses e 2 v o õ 2 8 8 se $ E 83 E F F F|- TRES ss” nos 2 SIN s 2838 Ss : << 88 850 7 E lo 3 Tr Sc. . o 90 õ = ts Eh EoSE z 86 o 25 E TI sa uu 28E : E = — Hi S5 : so TT 3 Ss Hi E É : É e SS ZTZ ES e E 8823 : SS <4E/ES E Ss > CORIE E 32 5 2º s > 2? 8 z 8 É & L2| É fo =2 Z 8238 : Y wXY 2 | 228 : XX E 22885 : so o nt: 88? : Tt çÇio m 8 28 FSLN : < 2|/> ” << wo o" CEPIS: : 9 E = N w Ss = S : o S | sa 2 83: : S - < ss Z 00. : <t TIO : Fr Cc : 2
[00181] A interrogação dos eventos transgênicos individuais (Tabe- la 5) revelou que a fluorescência de RFP/AAD12 detectada nos dois eventos de cópia única (pDDAB122124-033 e pDAB122124-065) teve fluorescência de RFP/AAD12 média que foi mais alta do que a fluores- cência Wt média (Tabela 5). Nesses eventos transgênicos de cópia única, as plantas homozigotas exibiram fluorescência de RFP/AAD12 mais alta do que as plantas hemizigotas, indicando que a expressão de transgene nesses eventos foi dependente de número de cópias. Três eventos que tiveram um locus de transgene complexo (duas có- pias) também exibiram fluorescência de RFP/AAD12 mais alta do que o fundo, embora os níveis da expressão de AAD12 tenham sido mais baixos do que este dos eventos de cópia única homozigotos (p=0,0091, não mostrado), indicando uma possibilidade de que estru- turas de locus complexas, com reorganizações de DNA potenciais, podem ter impactado a expressão de RFP/AAD12.
[00182] Em suma, o teste dos eventos de Arabidopsis T2 transgêni- cos mostraram que os elementos reguladores de GMTEFs1 acionam a expressão hereditária do gene-repórter RFP/AAD12 que é mais alta do que a fluorescência de fundo Wt. Esses resultados reafirmam que os elementos reguladores de GM TEFs1 são eficazes no acionamento da expressão de transgene hereditária em plantas de Arabidopsis esta- velmente transformadas.
o xo & É — o Ss S o 2 [eg T E se se ul eles S o ES) = NT IsZssssTssa EE É I E RS SiS 8 3 Ss ga 3 ã aNJO|INITZ= S/8|8 SE : S cc e 8 88 RN SIT : : FT) 8 X/ 28 8 |ÉS$ > s8sss8as os ES SERES EEE ft o - exis 2/88 8 83 $ S So - SS SS RS SSERBSE 3 S|8 A AO 2/73) E O. E 2|&) ss ss co |IT|N|o à 2/2) | sds e Ss ge sc ses Sds SRS: Ss SS S/S BSS SBC 28/38 Sã SSIS SS 2/8 8/8/2 2 =. Fen eils 8 8 : Q e l&e FNESE > 2 [O =| o ô e ls secs ce = + 3 RI 8 Ss SR E 828 2 S SiS 8 BIS Ss 8 8 888 5/88 3º BS BIS SIR 3 8/8 8/88 no. a o o 2 8 st gs [ERRAR 8 7S8 a eRNSRERSESESs < 8 km o SSIS Ss 8 FEIA É g EE SR SR SEE SS cs SI FZ STS SS SRS & Es S Tl 5/22 > ú > A A e pl 28 o [EZE > INS | Za : 2 i=/lal= ae ape 3 3 235 3 SESI o O LO o BS|= & : : o E SS RSS EBERTISTE & | o Be 3/5 S/S 5/2/8888 & | SiS SS RETNIS eis Tango O ss! 2 Ss S S NS) à ISS Ego 2/8 > S 8 8/2) 3 E 8 SS SRS S 2 3 3 SEER o | 9) = o E SSIS 33 2 3 8S/8s v cs Sn Ses gs SS SEE 28 si RIR | ST 2/28 8 | nn [eta e à 8 E 2 Ss SS RÉ ls S o o = els Ss ss essas = 2 = ES SFB SEÍESFsSEs a o & sE SBESSESERSRSSis x N Tl SIS IT 8 ES 2 8 8/8/S8 3 SS SS E 88 s/=8 28º e o E 2s - º 8 5 [SSESALTSERCA * 2 jo 2 kH| 2 ww - F — — 2 2/38 See õ = E/8IE 8 E/S: 2 IE E SIS E 8/8 8/5 8/5|S N 2 |8|5/2/5)2/5/2/5/S/S/2 EEE o o Cc Ss 8 S/S 5 5 /s|5/s/5|s 8 8 egjejejajejejeia & 8 8 Eçglo ) - E E) SSL do =| 3 E > 2 85 a Ba 8 8 8 : o o ú ESB en Ego a ez eg És $ o Zz— —- = Sa es SR Es SR É E o . - = 2 EE : 6 SE E : ' <a 8585 É z 2 : É < SF ES RE É 2 : 8 Est; 8 o = : SS 383 S Tal pR< a WS ses) º = EZ0 = ss : e: = TS Ss É Hs nã =Et 32 Rr <C€ uu az dE : 2 < à z ? 2a << & z 8 3 3 ã
Ê úS e 2 Êê o = SB = ss as fxEgsas E 855 8/8/5|8 2 ke cj = 8 : 8 ass 8 $ x o “x F — : i. — o. E Ss ST ss : à. = Bs eT es : a ER E STS ce S SE 8/32) E SE o - ' ' v) - ih : e ss) & Sa : : A sã Ss SS ga E 3 || F/S|N Ss : 83 ODIN Pp OO g ; 3| 3 88/83|5 & SI 8 BISI5 & Ss ê o õ “" : 3 |S8 & Ss ej= i anil 3 2 3 Rldlsis ; S ? Sl SS) Í o o |S Ss ; : : N 8 $ : = &S 8 : oIj— Ss S 21. SIS 888 3 : o Ss R 3 : id: À &|á t x | | : Sã E FNE) : E 85 à SE eee Ss! à |SÊ ae 8 28/88) e Fes 8 E/S 88 à ; Sã BITÍg/IS8 S & = o = É Ê ã SS o o S Xloo ! is E SE SN - . as Ssgz Ss 2 jd Ss 3 8/3 8/3|5 a ÉS = 8 8/8 : ge é E =8/S8 3 É e TIN = $|s 3 |) - il : á Li S = Sl : o Ss aj— 8 à Ss 8 8 Ts As KG S 8/8 FS 3 8) E [BS 8IZIS|S é é $| 2 8/8 2/38 3 s|5 2º ejols 2 23 ê : 2? 8 : S e É e $8 & |88 E) E SER 3 is 2 BI S/8|3 3 S: EE Sds F| N& x o TFjw/Os S S/s 8 ã|: | S me Oo 8 32 2 * sk : “* 2 & 2 9? de : e sl” 2j-j2 SR a - : o Bt. - ol. e ed o o 33 SEIS 5 N s 8 5/8|s â eleje ss Ê z E e = 2 x k i à E o 3 ã : ih H co |O 8 S : : > e 8 Ee 28 : ã 2 ESSE Ig FR i SR ERNSSSS ú = TR EEIREIES TER ST êge No 5 SE NEN SSAS ão à 2288 fã - Bol ; vn ES ú ses SE 85 e T =; E uu 255 mkEE : FS : Doo : 2 2
E
S z 3 8 ê ã
Ê & a 8
É
LOU E DE8G o o go omDES a o - oqenado Fo T PÇFSETW voe T EeSSS5 S 2 ES T E OZEW 1 5809 rg 3 o 8 e Taveooêo x o o o 2 2TESO a > a GT ICPZE as? Ss 2033205 Ele o Poe ego Lj oo =S8EoQSOS8 o Bco OE os 8) Esrovr38 =): V= + TOTO, SlS | NaEZTLIBGW 2) S —oaZETEO Ss 2 SS QN oo | = NSEQESSE & o nOaLÇGSSO o t oNMN Oo =Eg Ss õ TE OoTOOS 3) = a o x) > ; oç5 nº ie Ss 2530 .8oSs = 8 oLScLSS Sy VIM E%?O Vê oo NOS OL oES To o 208? ESTO a o o SETTE Tio p= SIT OTES se o 32EGSGTO 2 ES TES 18 e uu 3 3$>, S TES HIi o sa Ta e VOOS 2/28 o. ST3OESO 27 =D 359 = 83 = 2SHE DOE E ôs Ss ETOÇOSMO HA nÃsEdoS 2 E << l6sS588a Ss o N og ESXZ3o ol = = LçFos s 3 - 2 SL & 253 gd) E Low oos o2çvroos 8 É FO Zoo ” 5 t OoNGENÇO Si z BNSsZSO, ra | & o? d5OCo 2) 3 o = se 2/3 Fo SOFA 7 É ERES = OE” e
GOIS IÇCA 3 STO CS o o : VE 9º nO zs º ogT2doo Ts 38920903 = TOS SO 2 Ou Es o oo = O QN, oo E TELOEÇS S 2 SC 7 o so < Sor eoLs NS SorPEsb : an Eos > R 2 ITQ LET LS oON> 8 E NNTc SS NE: 2 $ SESSSSESSNT Oo : a IT SS a mSoAN: O ú SO 28 CEP z POST : & $GToS<E OS ê o Ss É ê To 22AT2607 ã F- 2 redo : so? TS E) : zo s SS Qo2w : EEB no OLD5' : v so <Eo "E z ses cTSTSÇ600 j SE SECT O)> S o oo oNSwOo0çÇOT z Wu Zo>Ecoo ê Ss 2
Exemplo 7: Produção de Plantas Transgênicas de Soja e Estimativa de Número de Cópias de Transgene Com o Uso de PCR TaqManº em Tempo Real
[00183] Os elementos reguladores de GmMTEFs1 (pDAB122124) foram ainda testados em plantas de soja transgênicas. As plantas de soja transgênicas foram produzidas com o uso do método de transfor- mação de semente dividida descrito em Pareddy et al, US 2014/0173774 A1, incorporado ao presente documento a título de refe- rência em sua totalidade. Plântulas transgênicas foram analisadas mo- lecularmente para determinar o número de cópias de transgene. Para isso, amostras de tecido de folha de plantas de soja transgênicas e controles não transgênicos foram coletadas em tubos de coleta de 96 poços. O rompimento de tecido foi realizado com o uso de microesfe- ras de 2 mm de tungstênio. Após a maceração do tecido, o DNA ge- nômico foi isolado em formato de alta produtividade com o uso do kit MagaAttract Plant'"Y (Qiagen, Hilden, Alemanha) no Agilent BioCelT". O número de cópias transgênicas de PAT foi determinado usando-se um ensaio de sonda de hidrólise, análogo ao ensaio TaqManº, em biplex com um gene de referência interno de soja, GMS116 (GMFLO01-25-J19 de nº de Acesso ao Genbank: AK286292.1). Os ensaios foram proje- tados com o uso do Software LightCyclerº Probe Design 2.0. A pre- sença/ausência transgênica de gene de resistência de Espectinomici- na (SpecR) foi determinada usando-se um ensaio de sonda de hidróli- se, análogo ao ensaio de TaqManº, em bi-plex com um gene de refe- rência interna de soja, GMS116. Esse ensaio foi projetado para detec- tar o gene SpecR localizado na cadeia principal dos construtos biná- rios usados para transformação. Apenas eventos em que não houve amplificação com sonda SpecR foram regenerados devido ao fato de que isso indicou que os fragmentos de cadeia principal não foram pro- pensos a estarem presentes no genoma de soja transgênica. Para a amplificação de todos os genes de interesse (PAT, SpecR, GMS116), a mistura LightCyclerº480 Probes Master"" (Roche Applied Science) foi preparada em uma concentração final de 1x em uma reação de multi- plex de volume de 10 ul que contém 0,4 uM de cada iniciador e 0,2 uM de cada sonda (composição de iniciadores e sondas listadas na TA- BELA 7). Uma reação de amplificação de duas etapas foi realizada com o uso do LIGHTCYCLER 480 system“ (Roche Applied Science), com uma extensão a 60 ºC por 60 segundos com aquisição de fluo- rescência.
[00184] A análise de dados de PCR em tempo real foi realizada com o uso de software LightCyclerº versão 1.5 com o uso do módulo quant relativo avançado e teve base no método AACt. Para PAT, uma amostra de gDNA de cópia única conhecida foi incluída em cada teste e foi usada como um calibrador de cópia única. Além disso, cada teste, para todos os genes de interesse, incluiu uma amostra de tipo selva- gem (Maverick) como um controle negativo. TABELA 6. Informações de Iniciador e Sonda para ensaio de sonda de hidrólise de genes PAT e SpecR localizados na cadeia principal e referência interna (GMS116). Todas as sequências são indicadas co- mo 5'-3'.
OLIGO SEQUÊNCIA TYPE PAT F JACAAGAGTGGATTGATGATCTAGAGA (SEQ | Iniciador ID NO:22 PATR |CTTTGATGCCTATGTGACACGTAAAC (SEQ | Iniciador ID NO:23) PAT PR 6FAM- Sonda de CCAGCGTAAGCAATACCAGCCACAACACC-| hidrólise 3BHQ 1(SEQ ID NO:24 SpecRF | CGCCGAAGTATCGACTCAACT (SEQ |D NO:25 | SpecR R J[GCAACGTCGGTTCGAGATG (SEQ ID NO:26 SpecR PR| GFAM-TCAGAGGTAGTTGGCGTCATCGAG- | Sonda de 3BHQ 1(SEQ ID NO:27 hidrólise
Exemplo 8: Avaliação da Expressão de Sequências Reguladoras de GmTEFs1 em Plantas de Soja T,
[00185] A expressão de genes pelos elementos reguladores de GmTEFSs1 foi testada em plantas transgênicas de soja. Para essa aná- lise, a transformação estável de plantas de soja foi gerada conforme descrito no EXEMPLO 7. Plântulas transgênicas que portam baixo número de cópias de transgene (1 a 2 cópias) das transformações de construto de elementos reguladores de GMTEFs1 (pDAB122124) e do construto de referência de controle (pDAB117560) foram geradas, e sementes Ti: foram coletadas e usadas para plantação em estufa. As plantas de soja T: foram cultivadas em estufa e genotipadas para transgene conforme descrito no EXEMPLO 7.
[00186] Para avaliar a expressão do gene-repórter RFP/AAD12 aci- onado pelos elementos reguladores de promotor de GMTEFs1, UTR 5' de GmTEFs1 e terminador de GmMTEFs1, plantas transgênicas foram identificadas e analisadas quanto à fluorescência de RFP/AAD12 com o uso do instrumento Typhoon. Todas as amostras foram digitalizadas em três canais: clorofila (488 nm de laser azul, 670 nm de BP30, 580 nm de divisão), GFP (488 nm de laser azul, 520 nm de BP40, 580 nm de divisão), e RFP (532 nm de laser verde, 580 nm de BP30). A defini- ção de PMT para o tecido de folha foi clorofila 400, GFP 400 e RFP
420. Folhas foram coletadas em plantas de soja V3 da folha comple- tamente expandida mais alta. Para varredura, três discos de folha fo- ram cortados de cada folha coletada. Os resultados de fluorescência dos genes-repórter RFP/AAD12 e GFP são mostrados na Tabela 7. À expressão do gene-repórter acionado pelas sequências reguladoras de GmTEFs1 foi robusta (1.507,5 pixels/área para plantas hemizigotas e 2.674,2 pixels/área para homozigotas) e altamente significativa aci- ma do fundo (613,1 pixels/área, p<0,0001, Tabela 7). A fluorescência de RFP/AAD12 média especificada pelas plantas de pDAB122124 hemizigotas e homozigotas que portam sequências reguladoras de GmTEFs1 foi mais baixa do que esta de RFP/AAD12 acionado pelo promotor de Arabidopsis thaliana Ubiquitin 10::terminador de Agrobac- terium tumefaciens Orf23 (p<0,0001 para plantas hemizigotas e homo- zigotas, não mostrado). Embora a expressão de RFP/AAD12 acionado por GM TEFs1 tenha sido menor do que esta do controle, esse nível de expressão é suficiente para expressão de transgene confiável em soja Ta.
o fe) 6 O Ss et la | | = jose SC ES Va o oo o DO o O n uu q º | o o fo) SN > ES = u a oO
OL 8 O oo co o “e o 2 TGESIS Rx + rw =OÇ o To no NR o SB SN S3v 2 N o o VB Ses o o o co sSoo Ss TP E 1 | — &ãaes õ 2 uu 8 $es low |º là |« [grs o & XB C oo o wo o o - a ci SS: Ú E oc > o 2 o Õ S ke! Zz Es NIQ Qg fe) o TO< o = o. DP 3 F F x so o E +/-o a QN ow o SE "O ww Tx ww: NT Oo: 20 o &Áilco* jó* Àài =* 008 7 o alo o o o =oE on SN T SN = OS n o o Se 8 o o a = 28 2 ES o oo w N 8gT=> õ n | Mm j8 jS | so - & SÉ = o = S5o | OO a É eg e a o | [les 8 Tv > E lo o õ o E 28 2 / OT O o Q o o <c o 55/90 cg oo o S Õ SS & oloS oo T- SN - 207 E cols Se ) N o = $ ES XX oibpo co | NS 2 - Gs 2 OO xX= gi! o [e] N PST S&S a / 82 8 css o o o Ss 3 8 82 2"8/8 18 |S | 582 2 S|5 x x x x ss 2 nix = e | |& | 555 - . o TIO x |O x |NnN x | + = Oo es sn to *[O* | nN* S2rg Ss 8 cos o o o DO > qo oÔ T = [s ES oL z So (o No A NA E) ESIZ "o cr 5858 TZ o FIO BFlalo co QN USO w o 88 N|T|S o NM 1 Cos no o o c= o ? DO &s = 3 9S E ++ OS DEZ 2 +r v208 & Se. o $28 = & A 08 qa - + o 2253. o Sa ES - - QN o ToQ8ge fi Za o PO 7 Ss Sos E EEB. o o o PESO 8 E 8 osa|[SE |E É |83%s cs o S PRF SS ZT 2 2 |T$ 52 v oNg ES 8o o o So oc 7 Fo x= oO TEEO g NES OO nN Eo8SE s E CIC o, EXT eo 2 S £/o= 8 SB nãos Z 2 SS ES * E23 TS Â o oo z,ZX OE Ç 2 É E mx = << 2>?76OS Zz O OO UN as rm eo £7?S3 Ss o 6 o3s T < o | > m ES md ft Oo 3 ao) Ss <o <= * COS s e jv sIGYNX Ooo SO E m oejic a — a N OE S < >3/o - - 292 oç z Er CIO Z 00" 8 8
S & 2
Ê
[00187] Ainterrogação dos eventos transgênicos de soja individuais (Tabela 8) revelou que a fluorescência de RFP/AAD12 foi detectada em todos os quatro eventos de cópia única que foram avaliados. Para todos os eventos transgênicos, as plantas homozigotas exibiram fluo- rescência de RFP/AAD12 mais alta do que as irmãs hemizigotas, indi- cando, assim, que a expressão de transgene nesses eventos foi de- pendente de número de cópias.
[00188] Em suma, o teste dos eventos de Soja T, transgênicos mostraram que os elementos reguladores de GM TEFs1 acionam a ex- pressão hereditária do gene-repórter RFP/AAD12 que é mais alta do que o fundo Wt em múltiplos eventos transgênicos independentes. Es- ses resultados reafirmam que os elementos reguladores de GMTEFs1 são eficazes no acionamento da expressão de transgene hereditária em plantas de soja estavelmente transformadas.
o o & ; S o 8 v no = Ê oÉ 2 2 Ss sã? 3 8 o 7 dades. : : desssodadasds Ss o x o RAIN ke | .e8 eso 8 2 à É e = ºlo 7388 o ' s : : Cc o oo E ass sz 2O 2880: [TEAR S 8 dscRsas ass se jd : dsss42d8 ss É : Ah Z3/69/9 O O o 2 Sade Es 2 8 É d dddsds cs. o 8 S de NEsadas dade ss g =| SERRERRRERCES a PR Flgz TES: DT. uu 284: Ds a Pr SMSEERRENPRE $s x E == 882 Les 2 NSESssSRdsdsts às o O a ASNcgagds ss Nos no E sSSS ss e NE 8 83/88 5 23 ES S [Fails es Ss < 8 7. ” 3 Bags Is às . o dIssedsddas 5 : E 3 la eL.o 2 un SS = o SSsasdsss: E Sz 28 ess O |& o in 12 Bo] = Jess S alm às 2 818 5 Ss ss trt oO x o 3 se ess ses Ss o ERRRSEEEREECES = 3 SE gs É o SEBBRRREEREE E 8 S co A iss dô 2/5 5 sz : 3 E Ss 2) Ss : : É ê ã 3 dz aggss o 2S 8 Ns = FINSERRERERE SS E |2 SAR ESSEEASS o Ê EEERERENOHA g ss E Pies: o Ta EE x ss: o o = Aa 2a/ 4/5): í 2. n 2 es SNS SESESES 8538 8 SHAHRAAAHAAAR A o o SEEREERRERRRE & Õ o a E deRNsAaIsAs: ss a o 808 oÔ dSNddisss 1 Í $ 8 BSS bd = FA a 6 Se o E 28 o o co o SF 5/2028 ke E 29 | &o| 6a 10] co | co HE S/s Nas do 2 2888 sele 2 2/5 2 53 = = 8 .8 " o 2 tt Bot eee ele o a-— Ss 5 Se + $isgêls E eee EB vTÇQS2 : : 8& Ss E E E =| o n/ o ovos no o o FEBEREERE Cs ú 86 o Ss 2/8 2 E 21 E SE ES : IH SE SS 888: mw. SS & 8 1 ES Ss Rica s = O & E SRS s 2 5 57 É s € ES ESES S 188 ; :: É 328) É& Io FACES o. oo =! SgNçNglES o: | é SSNISSS [A S E = aSaSES o És ig E sQ = assess o << o 5. 5 35 y : H ; 28 ESoS& às x Zz zz2 nn S : 1 m 2 — E 2a 2 o o s 2x 8 £o | Fr << õE ao 28 58 FE A 7 80 ã or SS 5 : ; 2º ÉS : SN s$8o : à SO E í o : Zz50º : Pl z s ê 2 & 2
É
Exemplo 9: Transformação Mediada por Agrobacterium de Genes Li- gados de Maneira Funcional ao Promotor de GMmTEFs1, à UTR 5' de GmTEFs1, à UTR 3' de GMNTEFs1 e/ou ao Terminador de GMTEFs1
[00189] A soja pode ser transformada com genes ligados de manei- ra funcional ao promotor de GMTEFs1, à UTR 5' de GM TEFs1, à UTR 3' de GmMTEFs1 e/ou ao terminador de GmMTEFs1 utilizando-se as mesmas técnicas anteriormente descritas no Exemplo nº 11 ou no Exemplo nº 13 do pedido de patente WO 2007/053482.
[00190] O algodão pode ser transformado com genes ligados de maneira funcional ao promotor de GNTEFs1, à UTR 5' de GNTEFs1, à UTR 3' de GMTEFs1 e/ou ao terminador de GMTEFs1 utilizando-se as mesmas técnicas anteriormente descritas no Exemplo nº 14 da Paten- te nº U.S. 7.838.733 ou no Exemplo nº 12 do pedido de patente WO 2007/053482 (Wright et a/.).
[00191] A canola pode ser transformada com genes ligados de ma- neira funcional ao promotor de GMTEFs1, à UTR 5' de GmTEFs1, à UTR 3' de GMTEFs1 e/ou ao terminador de GMTEFs1 utilizando-se as mesmas técnicas anteriormente descritas no Exemplo nº 26 da Paten- te nº U.S. 7.838.733 ou no Exemplo nº 22 do pedido de patente WO 2007/053482 (Wright et al.).
[00192] O trigo pode ser transformado com genes ligados de manei- ra funcional ao promotor de GMTEFs1, à UTR 5' de GM TEFs1, à UTR 3' de GmMTEFs1 e/ou ao terminador de GmMTEFs1 utilizando-se as mesmas técnicas anteriormente descritas no Exemplo nº 23 do pedido de patente WO 2013/116700A1 (Lira et a/.).
[00193] O arroz pode ser transformado com genes ligados de ma- neira funcional ao promotor de GMTEFs1, à UTR 5' de GmMTEFs1, à UTR 3' de GMTEFs1 e/ou ao terminador de GMTEFs1 utilizando-se as mesmas técnicas anteriormente descritas no Exemplo nº 19 do pedido de patente WO 2013/116700A1 (Lira et a/.).
Exemplo 10: Transformação mediada por Agrobacterium de Genes Ligados de Maneira Funcional aos Elementos Reguladores de GmTEFs1
[00194] À luz da presente revelação, culturas adicionais podem ser transformadas, de acordo com as modalidades da presente revelação, com o uso de técnicas que são conhecidas na técnica. Para transfor- mação mediada por Agrobacterium de centeio, consultar, por exemplo, Popelka JC, Xu J, Altpeter F., "Generation of rye with low transgene copy number after biolistic gene transfer and production of (Secale ce- reale L.) plants instantly marker-free transgenic rye," Transgenic Res. Out. de 2003;12(5):587 a 596.). Para transformação mediada por Agrobacterium de sorgo, consultar, por exemplo, Zhao et al., "Agrobac- terium-mediated sorghum transformation," Plant Mol Biol. dez. de 2000;44(6):789 a 798. Para transformação mediada por Agrobacterium de cevada, consultar, por exemplo, Tingay et al., "Agrobacterium tume- faciens-mediated barley transformation," The Plant Journal, (1997) 11:
1.369 a 1.376. Para transformação mediada por Agrobacterium de tri- go, consultar, por exemplo, Cheng et al., "Genetic Transformation de Wheat Mediated by Agrobacterium tumefaciens," Plant Physiol. Nov. de 1997;115(3):971 a 980. Para transformação mediada por Agrobac- terium de arroz, consultar, por exemplo, Hiei et al., "Transformation of rice mediated by Agrobacterium tumefaciens," Plant Mol. Biol. set. de 1997;35(1-2):205 a 218.
[00195] Os nomes em latim para essas e outras plantas são deter- minados abaixo. Deve ficar claro que outras técnicas de transformação (não Agrobacterium) podem ser usadas para transformar genes liga- dos de maneira funcional ao promotor de GmMTEFs1, à UTR 5' de GmTEFs1, à UTR 3' de GMTEFs1 e/ou ao terminador de GmMTEFs1, por exemplo, nessas ou em outras plantas. Os exemplos incluem, po- rém sem limitação; Maís (Zea mays), Trigo (Triticum spp.), Arroz (Ory-
za spp. e Zizania spp.), Cevada (Hordeum spp.), Algodão (Abroma au- gusta e Gossypium spp.), Soja (Glycine max), Beterraba sacarina e de mesa (Beta spp.), Cana de açúcar (Arenga pinnata), Tomate (Lycoper- sicon esculentum e outras spp., Physalis ixocarpa, Solanum incanum e outras spp., e Cyphomandra betacea), Batata (Solanum tuberosum), Batata-doce (Ipomoea batatas), Centeio (Secale spp.), Pimentas (Capsicum annuum, chinense e frutescens), Alface (Lactuca sativa, perennis e pulchella), Repolho (Brassica spp.), Aipo (Apium graveo- lens), Berinjela (Solanum melongena), Amendoim (Arachis hypogea), Sorgo (Sorghum spp.), Alfafa (Medicago sativa), Cenoura (Daucus ca- rota), Feijão (Phaseolus spp. e outros gêneros), Aveias (Avena sativa e strigosa), Ervilhas (Pisum, Vigna e Tetragonolobus spp.), Girassol (Helianthus annuus), Abóbora (Cucurbita spp.), Pepino (Cucumis sati- va), Tabaco (Nicotiana spp.), Arabidopsis (Arabidopsis thaliana), Gra- mado (Lolium, Agrostis, Poa, Cynodon, e outros gêneros), Trevo (Trifo- lium), Ervilhaca (Víicia). A transformação de tais plantas, com genes ligados de maneira funcional ao promotor de GMTEFs1, à UTR 5' de GmTEFs1, à UTR 3' de GMTEFs1 e/ou ao terminador de GMTEFs1, por exemplo, é contemplada nas modalidades da presente revelação.
[00196] O uso do promotor de GMTEFs1, da UTR 5' de GMTEFs1, da UTR 3' de GM TEFs1 e/ou do terminador de GM TEFs1 para acionar genes ligados de maneira funcional pode ser empregado em muitas espécies de madeira perenes e decíduas. Tais aplicações estão tam- bém dentro do escopo das modalidades desta revelação. Essas espé- cies incluem, porém sem limitação: amieiro (Alnus spp.), freixo (Fraxi- nus spp.), espécies de choupo tremedor e álamo (Populus spp.), faia (Fagus spp.), bétula (Betula spp.), cereja (Prunus Spp.), eucalipto (Eu- calyptus spp.), nogueira (Carya spp.), bordo (Acer spp.), carvalho (Quercus spp.) e pinheiro (Pinus spp.).
[00197] O uso do promotor de GMTEFs1, da UTR 5' de GMTEFs1,
da UTR 3' de GM TEFs1 e/ou do terminador de GM TEFs1 para acionar genes ligados de maneira funcional pode ser empregado em espécies ornamentais e frutíferas. Tais aplicações estão também dentro do es- copo das modalidades desta revelação. Os exemplos incluem, porém sem limitação: rosa (Rosa spp.), sarça ardente (Euonymus Spp.), pe- túnia (Petunia spp.), begônia (Begonia spp.), rododendro (Rhododen- dron spp.), maçã silvestre ou maçã (Malus spp.), pera (Pyrus Spp.), pêssego (Prunus Spp.) e calêndulas (Tagetes spp.).
[00198] “Embora diversos aspectos e modalidades exemplificativos tenham sido discutidos acima, aqueles versados na técnica reconhe- cerão certas modificações, permutações, adições e subcombinações dos mesmos. É pretendido, portanto, que as reivindicações anexas e reivindicações introduzidas doravante sejam interpretadas como inclu- indo todas tais modificações, permutações, adições e subcombinações conforme estejam dentro de seu espírito e escopo verdadeiros.

Claims (20)

REIVINDICAÇÕES
1. Vetor de ácido nucleico caracterizado pelo fato de que compreende um promotor ligado de maneira funcional a uma sequên- cia de polinucleotídeos heteróloga de: a) uma sequência poliligante; b) uma sequência de codificação heteróloga de não GmTEFs1; ou c) uma combinação de a) e b); em que o dito promotor compreende uma sequência de polinucleotídeos que tem pelo menos 95% de identidade de sequência com a SEQ ID NO:2.
2. Vetor de ácido nucleico, de acordo com a reivindicação 1, caracterizado pelo fato de que o dito promotor tem 371 pares de ba- ses de comprimento.
3. Vetor de ácido nucleico, de acordo com a reivindicação 1, caracterizado pelo fato de que o dito promotor consiste em uma se- quência de polinucleotídeos que tem pelo menos 95% de identidade de sequência com a SEQ ID NO:2.
4. Vetor de ácido nucleico, de acordo com a reivindicação 1, caracterizado pelo fato de que o dito promotor é ligado de maneira funcional a uma sequência de codificação heteróloga.
5. Vetor de ácido nucleico, de acordo com a reivindicação 4, caracterizado pelo fato de que a sequência de codificação heterólo- ga codifica uma proteína marcadora selecionável, uma proteína de re- sistência a inseticida, uma proteína de tolerância a herbicida, uma pro- teína de eficiência de uso de nitrogênio, uma proteína de eficiência de uso de água, uma molécula de RNA pequena, uma proteína de quali- dade nutricional ou uma proteína de ligação a DNA.
6. Vetor de ácido nucleico, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda uma sequência de polinucleotídeos de terminador.
7. Vetor de ácido nucleico, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda uma sequência de polinucleotídeos não traduzida 3'.
8. Vetor de ácido nucleico, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda uma sequência de polinucleotídeos não traduzida 5'.
9. Vetor de ácido nucleico, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda uma sequência de íntrons.
10. Vetor de ácido nucleico, de acordo com a reivindicação 1, caracterizado pelo fato de que o dito promotor tem expressão cons- titutiva de tecido.
11. Planta transgênica caracterizada pelo fato de que com- preende uma sequência de polinucleotídeos que tem pelo menos 95% de identidade de sequência com a SEQ ID NO:2 ligada de maneira funcional a uma sequência de codificação heteróloga.
12. Planta transgênica, de acordo com a reivindicação 11, caracterizada pelo fato de que a dita planta é selecionada dentre o grupo que consiste em Zea mays, trigo, arroz, sorgo, aveia, centeio, bananas, cana-de-açúcar, Glycine max, algodão, Arabidopsis, tabaco, girassol e canola.
13. Planta transgênica, de acordo com a reivindicação 12, caracterizada pelo fato de que a dita planta é Glycine max.
14. Planta transgênica, de acordo com a reivindicação 11, caracterizada pelo fato de que a sequência de codificação heteróloga é inserida no genoma da dita planta.
15. Planta transgênica, de acordo com a reivindicação 11, caracterizada pelo fato de que um promotor compreende uma sequên- cia de polinucleotídeos que tem pelo menos 95% de identidade de se-
quência com a SEQ ID NO:2, e o dito promotor é ligado de maneira funcional a uma sequência de codificação heteróloga.
16. Planta transgênica, de acordo com a reivindicação 15, caracterizada pelo fato de que compreende ainda uma sequência não traduzida 3'.
17. Planta transgênica, de acordo com a reivindicação 15, caracterizada pelo fato de que a dita sequência de codificação heteró- loga tem expressão constitutiva de tecido.
18. Planta transgênica, de acordo com a reivindicação 15, caracterizada pelo fato de que o dito promotor tem 371 pares de bases de comprimento.
19. Método para produzir uma célula vegetal transgênica, sendo o método caracterizado pelo fato de que compreende as etapas de: a) transformar uma célula vegetal com um cassete de ex- pressão de gene que compreende um promotor de GmMTEFs1, em que o dito promotor tem pelo menos 95% de identidade de sequência com a SEQ ID NO:2, ligado de maneira funcional a pelo menos uma se- quência de polinucleotídeos de interesse; b) isolar a célula de planta transformada que compreende o cassete de expressão de gene; e c) produzir uma célula vegetal transgênica que compreende o promotor de GmMTEFs1 ligado de maneira funcional a pelo menos uma sequência de polinucleotídeos de interesse.
20. Método para expressar uma sequência de polinucleotí- deos de interesse em uma célula vegetal, sendo o método caracteri- zado pelo fato de que compreende introduzir na célula vegetal uma sequência de polinucleotídeos de interesse ligada de maneira funcio- nal a um promotor de GMTEFs1, em que o dito promotor tem pelo me- nos 95% de identidade de sequência com a SEQ ID NO:2.
BR112020008745-9A 2017-11-16 2018-10-31 promotor de planta para expressão de transgene BR112020008745A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762587034P 2017-11-16 2017-11-16
US62/587,034 2017-11-16
PCT/US2018/058337 WO2019099191A1 (en) 2017-11-16 2018-10-31 Plant promoter for transgene expression

Publications (1)

Publication Number Publication Date
BR112020008745A2 true BR112020008745A2 (pt) 2020-10-20

Family

ID=66538776

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020008745-9A BR112020008745A2 (pt) 2017-11-16 2018-10-31 promotor de planta para expressão de transgene

Country Status (4)

Country Link
US (3) US11274311B2 (pt)
BR (1) BR112020008745A2 (pt)
CA (1) CA3074617A1 (pt)
WO (1) WO2019099191A1 (pt)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019099191A1 (en) * 2017-11-16 2019-05-23 Dow Agrosciences Llc Plant promoter for transgene expression

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8697857B2 (en) 2007-11-20 2014-04-15 E. I. Du Pont De Nemours And Company Soybean EF1A2 promoter and its use in constitutive expression of transgenic genes in plants
WO2013184537A1 (en) * 2012-06-04 2013-12-12 Pioneer Hi-Bred International, Inc. Sb-actin terminator sequence for gene expression in plants
BR112016003591A8 (pt) * 2013-08-22 2018-01-30 Du Pont promotor u6 de polimerase iii de soja e métodos de uso
WO2019099191A1 (en) * 2017-11-16 2019-05-23 Dow Agrosciences Llc Plant promoter for transgene expression

Also Published As

Publication number Publication date
US20200318127A1 (en) 2020-10-08
US11560570B2 (en) 2023-01-24
US11274311B2 (en) 2022-03-15
US11913004B2 (en) 2024-02-27
CA3074617A1 (en) 2019-05-23
US20230332167A1 (en) 2023-10-19
US20220090109A1 (en) 2022-03-24
WO2019099191A1 (en) 2019-05-23

Similar Documents

Publication Publication Date Title
US11814633B2 (en) Plant terminator for transgene expression
US12043840B2 (en) 3&#39;UTR sequence for transgene expression
BR112018003012B1 (pt) Vetor de ácido nucleico e 3&#39;utr de zrp2 de zea mays
US11913004B2 (en) Plant promoter for transgene expression
BR102017012660A2 (pt) Promotor de planta e 3&#39; utr para expressão de transgene
BR112019027401A2 (pt) promotor de planta para expressão de transgene
US20220098606A1 (en) Plant promoter for transgene expression
BR102017012838A2 (pt) Promotor de planta e 3&#39;utr para expressão de transgene
US10968455B2 (en) Plant promoter and 3′UTR for transgene expression
BR112017021903B1 (pt) Promotor de planta para expressão de transgene
CN115244178A (zh) 顺式作用调节元件
BR112020005315A2 (pt) uso de uma região não traduzida de maís para expressão de transgene em plantas
US10400245B2 (en) Plant promoter and 3&#39;UTR for transgene expression
US20170298373A1 (en) Plant promoter and 3&#39;utr for transgene expression
US20240309392A1 (en) Plant promoter for transgene expression
BR112017021703B1 (pt) Promotor de planta para expressão de transgene
AU2016340893A1 (en) Plant promoter for transgene expression
BR112020009457A2 (pt) promotor de proteína relacionada à patogênese de planta para expressão transgênica

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]