BR102015000943A2 - expressão aumentada de proteína em planta - Google Patents

expressão aumentada de proteína em planta Download PDF

Info

Publication number
BR102015000943A2
BR102015000943A2 BR102015000943A BR102015000943A BR102015000943A2 BR 102015000943 A2 BR102015000943 A2 BR 102015000943A2 BR 102015000943 A BR102015000943 A BR 102015000943A BR 102015000943 A BR102015000943 A BR 102015000943A BR 102015000943 A2 BR102015000943 A2 BR 102015000943A2
Authority
BR
Brazil
Prior art keywords
plant
sequence
polypeptide
interest
polynucleotide
Prior art date
Application number
BR102015000943A
Other languages
English (en)
Inventor
Aaron Woosley
Sarah Worden
Original Assignee
Dow Agrosciences Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow Agrosciences Llc filed Critical Dow Agrosciences Llc
Publication of BR102015000943A2 publication Critical patent/BR102015000943A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N37/00Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids
    • A01N37/44Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids containing at least one carboxylic group or a thio analogue, or a derivative thereof, and a nitrogen atom attached to the same carbon skeleton by a single or double bond, this nitrogen atom not being a member of a derivative or of a thio analogue of a carboxylic group, e.g. amino-carboxylic acids
    • A01N37/46N-acyl derivatives
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L7/00Cereal-derived products; Malt products; Preparation or treatment thereof
    • A23L7/10Cereal-derived products
    • A23L7/198Dry unshaped finely divided cereal products, not provided for in groups A23L7/117 - A23L7/196 and A23L29/00, e.g. meal, flour, powder, dried cereal creams or extracts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

expressão aumentada de proteína em plantas. essa descrição refere-se a polinucleotídeos sintéticos que codificam um polipeptídeo de interesse que são particularmente bem adequados para a expressão em plantas-alvo.

Description

Relatório Descritivo da Patente de Invenção para "EXPRESSÃO AUMENTADA DE PROTEÍNA EM PLANTAS". REIVINDICAÇÃO DE PRIORIDADE
[001] Esse pedido reivindica o benefício da data de depósito do Pedido de Patente Provisório dos Estados Unidos Número de Série 61/928.8952, depositado em 17 de janeiro de 2014, para "EXPRESSÃO AUMENTADA DE PROTEÍNA EM PLANTAS".
CAMPO TÉCNICO
[002] A presente descrição refere-se a métodos e composições para o aperfeiçoamento da expressão de polinucleotídeos em uma célula de planta. Em algumas modalidades, uma proteína que codifica uma região de um polinucleotídeo é modificada para refletir o desvio da utilização de códon de um organismo hospedeiro, enquanto que preserva simultaneamente certas sequências de poliadenilação no gene nativo.
ANTECEDENTES
[003] O código genético consiste em unidades de três nucleotí-deos ("códons"). Existem 64 códons possíveis, cada especificando um de vinte aminoácidos ou uma terminação para a transcrição (isto é, "códons de PARADA"). Portanto, pelo menos alguns códons são redundantes. No sistema de codificação usado pela grande maioria dos organismos, dois aminoácidos são codificados por um único códon, enquanto que todos os outros aminoácidos são codificados por dois, três, quatro ou seis códons, com três códons de PARADA. Para aminoácidos com dois, três ou quatro códons, os códons diferem um do outro na terceira posição de nucleotídeo. Para os três que possuem seis códons, eles possuem um bloqueio de quatro códons que seguem esse padrão e um conjunto adicional de dois que também diferem um do outro na terceira posição. Para os dois aminoácidos representados pelos seis códons, (Arg e Leu), eles são representados cada um por um bloco diferente do outro pela mudança na segunda posição de nu-cleotídeo. A representação do códon da serina (Ser) é incomum, caracterizada pelo fato de que os dois blocos de códons são muito similares. Para aminoácidos representados pelos dois códons, a terceira posição é uma purina (A, G) ou pirimidina (C,T) em ambos os casos.
[004] A degeneração do código genético fornece uma oportunidade para construir um polinucleotídeo alternativo que codifique um produto de polipeptídeo de um polipeptídeo de referência. Por exemplo, a degeneração do códon permite fazer sequências de DNA sintético que codificam uma proteína de interesse usando códons que diferem daqueles usados na sequência codificadora original do DNA. Para um aminoácido em particular, um dado organismo não usa os códons possíveis igualmente. Cada organismo possui um desvio na utilização do códon. O padrão do desvio na utilização do códon é diferente para um organismo e seus parentes próximos ao longo do genoma. Por exemplo, no Streptomyces spp., os códons frequentes geralmente incluem G ou C na terceira posição de nucleotídeo. Códons raros geralmente incluem A ou T na terceira posição. Em outros organismos, A ou T é preferido na terceira posição. Dentro de uma espécie em particular, pode haver categorias distintas de genes com seus próprios desvios de códon. Na E. coli, por exemplo, existem aproximadamente três classes de genes, cada um com uma assinatura de utilização de códon distinta. Uma classe é rica em proteínas que são abundantemente expressas; a segunda classe inclui proteínas que são expressas em níveis relativamente baixos; e a terceira classe inclui proteínas que provavelmente foram adquiridas recentemente de outras espécies.
[005] Para obter os níveis de expressão desejados de proteínas heterólogas em plantas transgênicas, foi encontrado ser benéfico alterar a sequência codificadora nativa (as vezes referida como de tipo selvagem ou original) do DNA de várias maneiras, por exemplo, tal que a utilização do códon seja mais intimamente compatível com a utilização de códon da espécie da planta hospedeira e/ou o conteúdo de G+C da sequência codificadora seja mais intimamente compatível com o nível de G+C tipicamente encontrado nas sequências codificadoras da espécie de planta hospedeira e/ou fazendo com que certas sequências que desestabilizam o mRNA sejam removidas. Por exemplo, a expressão da proteína cristalina das toxinas de inseto de Bacillus thuringiensis (Bt) em plantas foi aperfeiçoada pelo uso de uma ou mais dessas abordagens. Veja, por exemplo, Patente U.S. 5.380.301; Patente U.S. 5.625.136; Patente U.S. 6.218.188; Patente U.S. 6.340.593; Patente U.S. 6.673.990; e Patente U.S. 7.741.118.
[006] Na maioria das estratégias de design de gene, o processo tenta combinar a composição do códon de um gene sintético com as composições de códon de genes de um hospedeiro, no qual o gene sintético será expresso. Veja, por exemplo, Publicação de Patente U.S. No. US 2007/0292918 A1. Tais estratégias podem, em algumas situações, levar a uma expressão aumentada do gene sintético no hospedeiro. Por exemplo, a otimização de códon na levedura pode aperfeiçoar significativamente a tradução dos transcritos de gene hete-rólogo devido a minimização dos efeitos de, por exemplo, limitação de aminoacii-tRNAs e terminação da transcrição em sequências ricas em AT. Veja, por exemplo, Daly e Hearn (2004) J. Mol. Recognition 18:119-38.
[007] Entretanto, apesar da concordância geral na técnica sobre a necessidade de algum tipo de otimização de códon, os profissionais discordam da estratégia comum que deve ser empregada para a otimização. Uma estratégia que é preferida por alguns é maximizar o uso de códons frequentes na expressão da espécie hospedeira durante o design de genes heterólogos. Uma segunda estratégia preferida por outros é colocar um valor máximo no contexto de códons particulares e, portanto, maximizar o uso de pares de códons que ocorrem frequentemente na expressão do hospedeiro. Uma terceira estratégia é fazer a utilização de códon da nova sequência codificadora na nova espécie se assemelhar com a utilização de códon da sequência codificadora de referência na espécie de origem. Essa terceira estratégia coloca um valor alto no reconhecimento de requisitos possíveis para códons raros para assegurar a estrutura secundária apropriada de moléculas de transcrito de RNA. Adicionalmente, usando simplesmente o mesmo códon que ocorre frequentemente repetidamente em uma sequência heteróloga é esperado que eventualmente haja o mesmo efeito de uma seleção de códon raro; por exemplo, o uso exagerado do tRNA correspondente limitará a disponibilidade do tRNA. Uma pessoa que tente otimizar os códons de uma sequência de gene para a expressão em um organismo hospedeiro deve equilibrar essas estratégias e seus problemas subjacentes a fim de chegar a uma metodologia particular.
[008] O processo de otimização da sequência codificadora do nucleotídeo para uma proteína expressa heterologamente pode ser uma etapa importante para aperfeiçoar áreas de expressão. Entretanto, vários problemas potenciais limitam a utilidade da otimização para a expressão de genes particulares. Por exemplo, a estrutura secundária de um transcrito otimizado pode limitar a tradução do transcrito. Griswold et al. (2003) Protein Expression and Purification 27:134-42. Adicionalmente, existem vários motivos de sequência que são deseja-velmente evitados em sequências sintéticas para a expressão heteróloga, incluindo os sítios de terminação da transcrição classes I e II na E. coli para um gene sob o controle de um promotor T7; sequências semelhantes a Shine-Dalgarno; sinais de splice em potencial; sequências que promovem desvios de fase e pausas em ribossomas; e sinais de poliadenilação. Welch et al. (2010) J. R. Soc. Interface 6:S467-76. Em particular, a compreensão na técnica é que as sequências de sinal de poliadenilação devem ser reduzidas para permitir a expressão intensificada de genes sintéticos em plantas. Patente U.S. 7.741.118. DESCRIÇÃO
[009] Contrariamente a compreensão na técnica (Veja, por exemplo, a Patente U.S. 7.741.118), descobriu-se recentemente que uma redução no número de sequências de sinal de poliadenilação (por exemplo, AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA) não é necessária nem suficiente para possibilitar a expressão intensificada de genes sintéticos em plantas. Modalidades do mesmo fazem uso prático do resultado surpreendente e inesperado de que a preservação dessas sequências de poliadenilação em uma sequência codificadora sintética com relação a sua ocorrência em uma sequência nativa pode ser utilizada em um processo de otimização de gene para aumentar a expressão da proteína heterólo-ga.
[0010] Modalidades do mesmo incluem ácidos nucleicos sintéticos que codificam pelo menos um polipeptídeo de interesse. Em modalidades, um ácido nucleico sintético que codifica pelo menos um polipeptídeo de interesse é designado de acordo com as restrições dos parâmetros de design do gene específico que geralmente aumentam a expressão do polipeptídeo de interesse a partir do ácido nucleico em um hospedeiro (por exemplo, uma célula de planta, tecido de planta e planta). Sequências de ácido nucleico sintético podem ser planejadas a partir de uma sequência de ácido nucleico de referência, por exemplo, para otimizar a expressão heteróloga da sequência de ácido nucleico no organismo hospedeiro.
[0011] Em algumas modalidades, um ácido nucleico sintético que codifica um polipeptídeo de interesse é manipulado para a expressão de um polipeptídeo heterólogo em uma célula hospedeira, em que o polipeptídeo é produzido em uma célula manipulada não geneticamente em uma espécie diferente daquela da célula hospedeira e é codificado aí por um polinucleotídeo de referência. Em algumas modalidades, o ácido nucleico sintético tem o códon otimizado para a expressão na célula hospedeira, por exemplo, pela alteração da sequência de nucleotídeo do polinucleotídeo de referência para ter substancialmente todos os códons preferidos (por exemplo, os mais preferidos) no organismo hospedeiro. Em algumas modalidades, a análise posterior e a manipulação podem ser realizadas em um ácido nucleico sintético com códon otimizado, por exemplo, para confirmar a ausência de motivos indesejados de ácido nucleico (por exemplo, motivos de ácido nucleico que formam uma estrutura secundária indesejável em uma molécula de RNA transcrita a partir dele), confirmar a ausência de sítios de reconhecimento de enzima de restrição e/ou assegurar a diversidade do códon e da sequência.
[0012] Em algumas modalidades, um ácido nucleico sintético que codifica um polipeptídeo de interesse compreende uma sequência co-dificadora que tem o códon otimizado para a expressão em uma célula heteróloga e, pelo menos, uma sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, AT AC AT, AAAATA, ATTAAA, AATTAA, A AT AC A, e CATAAA, em que a pelo menos uma sequência de poliadenilação está na localização correspondente da sequência codificadora como em um polinucleotídeo de referência. Em modalidades particulares, o ácido nucleico sintético compreende o mesmo número das sequências de poliadenilação precedentes como ocorre no polinucleotídeo de referência. Em modalidades particulares, o ácido nucleico sintético compreende o mesmo número das sequências de poliadenilação precedentes como ocorre no polinucleotídeo de referência e as sequências de poliadenilação estão cada uma nas suas localizações correspondentes da sequência codificadora como no polinucleotídeo de referência.
[0013] Algumas modalidades incluem métodos para fazer um ácido nucleico sintético que codifica um polipeptídeo de interesse, em que os métodos compreendem fornecer a sequência de aminoácidos de um polipeptídeo de interesse que seja codificado por um polinucleotídeo de referência em uma célula não geneticamente manipulada que compreenda pelo menos uma sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA, e que produza um ácido nucleico sintético que codifique o polipeptídeo de interesse que contenha pelo menos uma das sequências de poliadenilação na localização correspondente da sequência codificadora do ácido nucleico sintético como no polinucleotídeo de referência. Em modalidades particulares, o ácido nucleico sintético é produzido de modo a que ele compreenda o mesmo número de sequências de poliadenilação precedentes como ocorre no polinucleotídeo de referência e as sequências de poliadenilação estão, cada uma, em suas localizações correspondentes da sequência codificadora do ácido nucleico sintético como no polinucleotídeo de referência.
[0014] Outras modalidades incluem vetores (por exemplo, vetores de transformação em planta) que compreendem pelo menos um dos ácidos nucleicos sintéticos precedentes. Modalidades particulares incluem vetores que compreendem uma unidade de transcrição que compreende um ácido nucleico sintético que codifica um polipeptídeo de interesse que compreende uma sequência codificadora que tem códon otimizado para a expressão em uma célula heteróloga e, pelo menos, uma sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA , em que a pelo menos uma sequência de poliadenilação está na localização correspondente da sequência codifícadora como em um polinucleotídeo de referência. Em alguns exemplos, tal vetor pode compreender, por exemplo e sem limitação: uma sequência 5’ não traduzida (por exemplo, que compreenda um promotor de planta); uma sequência de DNA sintético; e uma região 3’ não traduzida (por exemplo, que compreenda um sinal de terminação da transcrição).
[0015] Modalidades particulares incluem métodos de geração de uma planta, parte de planta, órgão de planta, semente de planta e/ou célula de planta que expresse um polipeptídeo de interesse (por exemplo, um polipeptídeo heterólogo de interesse). Métodos de acordo com modalidades particulares compreendem: transformar uma planta, parte de planta, órgão de planta, semente de planta e/ou célula de planta com pelo menos um ácido nucleico sintético que codifique um polipeptídeo de interesse que compreende uma sequência codifi-cadora que tem códon otimizado para a expressão em uma célula he-teróloga e, pelo menos, uma sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA , em que a pelo menos uma sequência de poliadenilação está na localização correspondente da sequência codifícadora como em um polinucleotídeo de referência; e expressar o ácido nucleico de modo a produzir o polipeptídeo de interesse codificado dessa maneira. Nos exemplos, uma planta, parte de planta, órgão de planta, semente de planta e/ou célula de planta transformada com os ácidos nucleicos sintéticos precedentes podem expressar o polipeptídeo de interesse em uma quantidade maior do que uma planta, parte de planta, órgão de planta, semente de planta e/ou célula de planta da mesma espécie transformada com o polinucleotídeo de referência.
[0016] Algumas modalidades incluem uma planta, parte de planta, órgão de planta, semente de planta e/ou célula de planta que compreende um ácido nucleico sintético que codifica um polipeptídeo de interesse que compreende uma sequência codificadora que tem códon otimizado para a expressão em uma célula heteróloga e, pelo menos, uma sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATAC AT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA , em que a pelo menos uma sequência de poliadenilação está na localização correspondente da sequência codificadora como em um polinucleotídeo de referência que codifica o polipeptídeo nativo de interesse em um organismo não geneticamente modificado.
[0017] Outras modalidades incluem métodos de obtenção de um fenótipo de expressão desejável em uma planta. Os métodos de acordo com algumas modalidades incluem transformar uma planta, parte de planta, órgão de planta, semente de planta e/ou célula de planta com pelo menos um ácido nucleico sintético que codifica um polipeptídeo de interesse que compreende uma sequência codificadora que tem códon otimizado para a expressão em uma célula heteróloga e, pelo menos, uma sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, AT AC AT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA, em que a pelo menos uma sequência de poliadenilação está na localização correspondente da sequência codificadora como em um polinucleotídeo de referência e em que o polipeptídeo de interesse é expresso na parte, órgão de planta, semente de planta e/ou célula de planta, conferindo ou intensi- ficando dessa maneira um fenótipo dessa. Exemplos de fenótipos que podem ser obtidos ou intensificados em modalidades particulares incluem, por exemplo, e sem limitação: resistência e/ou controle de pragas; tolerância à herbicida; características modificadas do óleo; e tolerância ao estresse.
[0018] Por exemplo, os métodos em algumas modalidades incluem o controle de pragas em uma planta, grão e/ou sementes, pela expressão de pelo menos um polinucleotídeo sintético em uma célula de planta, em que o polinucleotídeo sintético codifica uma toxina de inseto (por exemplo, proteína Cry de Bacillus thuringiensis); controle de pragas em um alimento ou farinha pelo fornecimento de um alimento ou farinha a partir de um grão obtido de uma planta transgênica que expressa uma toxina de inseto a partir de um polinucleotídeo sintético; aumentar a tolerância ao herbicida em uma planta pela expressão de pelo menos um polinucleotídeo sintético na planta, em que o polinucleotídeo sintético codifica um polipeptídeo de tolerância ao herbicida (por exemplo, ariloxialcanoato dioxigenase (AAD1); fosfinotricina ace-tiltransferase; e 5-enolpiruvatochiquimato-3-fosfato sintase); modificar os perfis de óleo em uma planta pela expressão de pelo menos um polinucleotídeo sintético na planta, em que o polinucleotídeo sintético codifica um polipeptídeo para modificar os perfis de óleo em plantas (por exemplo, ácido graxo dessaturase); e aumentar a tolerância ao estresse (por exemplo, tolerância ao estresse hídrico e/ou calor) em uma planta pela expressão de pelo menos um polinucleotídeo sintético na planta, em que o polinucleotídeo sintético codifica o produto de um gene de tolerância ao estresse (por exemplo, o estresse associado à proteína (SAP1) e/ou proteínas 1-Cys peroxiredoxina (Perl)). Modalidades particulares incluem métodos para introduzir um gene repórter em uma planta pela expressão de um polinucleotídeo sintético na planta, em que o polinucleotídeo sintético codifica uma proteína marcadora da transformação (por exemplo, GFP e/ou beta-glicuronidase).
[0019] Também incluída em algumas modalidades está uma composição (por exemplo, um produto de consumo) produzido a partir de plantas transgênicas ou partes ou materiais dessas que contêm um ácido nucleico sintético que codifica um polipeptídeo de interesse que compreende uma sequência codificadora que tem códon otimizado para a expressão em uma célula heteróloga e, pelo menos, uma sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, AT ATA A, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA, em que a pelo menos uma sequência de poliadenilação está na localização correspondente da sequência codificadora como em um polinucleotídeo de referência. Em modalidades particulares, a composição é um produto de consumo selecionado do grupo que compreende um alimento, farinha, concentrado de proteína e um óleo.
[0020] O precedente e outras características ficarão mais claros a partir da descrição detalhada a seguir de várias modalidades, que prossegue com referência às figuras em anexo.
BREVE DESCRIÇÃO DOS DESENHOS
[0021] Fig. 1 inclui ilustrações de três plasmídeos binários exem-plificadores que foram usados para a transformação do milho com CrylAb. Todos os plasmídeos são idênticos com exceção do polinucleotídeo crylAb.
[0022] Fig. 2 inclui as frequências de transformação avaliadas pelo construto usado para a transformação com CrylAb. pDAB109812 é o controle negativo e esse plasmídeo contém YFP ao invés de CrylAb, mas é idêntico com relação aos elementos regulatórios e o cassete do marcador selecionável.
[0023] Fig. 3 inclui um resumo da análise estatística de eventos de transformação TO, obtidos pelo uso do programa de análise estatística JMP para cada um dos antecedentes.
[0024] Fig. 4 inclui a imagem de um Western Blot do tecido da fo- lha de milho coletado no estágio V5 de desenvolvimento. Os conteúdos das bandas são: Banda 1 = controle negativo; banda 2 = BioRad MWM, 20 pL; banda 3 = 107645[1]-021.001 AJ.016; banda 4 = 107645[1]-021.001 AJ.021; banda 5 = 107645[1]-021.001 AJ.006; banda 6 = 111447[1]-002.001; banda 7 = 111447[1]-003.001; banda 8 = 111447[1]-033.001; banda 9 = 111448[1]-030.001; banda 10 = 111448[1 ]-013.001; banda 11 = 111448[1]-032.001; banda 12 = 111449[1]-020.001; banda 13 = 111449[1]-009.001; banda 14 = 111449[1]-018.001; e banda 15 = CrylAb bacteriana purificada padronizada (1 ng). 107645 eventos são eventos Tque contêm CrylAb de extensão completa que foi determinada ser ativa em um bioensaio com inseto.
[0025] Fig. 5 inclui um resumo de uma análise Turkey-Kramer Oneway do percentual de dano da larva de traça do milho (CEW) pelo construto. Os materiais de controle, 109812 (YFP), B104 (controle não transformado), e HX1 (HERCULEX®) foram avaliados ao lado dos eventos CrylAb. Todos os três antecedentes contendo CrylAb forneceram proteção que é igual àquela de HERCULEX® contra CEW.
[0026] Fig. 6 inclui um resumo de uma análise Turkey-Kramer Oneway do percentual de dano da broca do milho europeu (ECB) pelo construto. Os materiais de controle, 109812 (YFP), B104 (controle não transformado), e HX1 (HERCULEX®) foram avaliados ao lado dos eventos CrylAb. Todos os três antecedentes contendo CrylAb forneceram proteção que é igual àquela de HERCULEX® contra ECB.
[0027] Fig. 7 inclui um resumo de uma análise Turkey-Kramer Oneway do percentual de dano da broca do milho europeu resistente a CrylFa (rECB) pelo construto. Os materiais de controle, 109812 (YFP), B104 (controle não transformado), e HX1 (HERCULEX®) foram avaliados ao lado dos eventos CrylAb. Todos os três antecedentes contendo CrylAb forneceram proteção que é igual àquela de HERCULEX® contra rECB.
[0028] Fig. 8 inclui mapas dos doze plasmídeos binários usados no experimento de transformação do milho com CrylFa. Todos os plasmídeos exceto pDAB110842 são idênticos, diferentes do polinu-cleotídeo que codifica CrylFa. O plasmídeo binário pDAB110842tem o cassete de gene mais similar ao produto HERCULEX®, incluindo o promotor ZmUbil v6 e AtuORF25/26 3’ UTR v1.
[0029] Fig. 9 inclui uma imagem mostrando que plantas dos antecedentes pDAB111436 e pDAB11437 demostraram genótipos agronômicos negativos. A descoloração vermelha do caule e do material da folha e o enrolamento severo na folha e tecido do caule foram detectados.
[0030] Fig. 10 inclui um resumo da análise estatística de eventos T0 para cada um dos antecedentes usando o programa estatístico JMP. HERCULEX®, o produto, foi determinado expressar CrylFa a 60 ng/cm2 sob essas condições de estufa. A média é a linha central do losango verde para cada um dos antecedentes. A linha ilustrada diretamente abaixo de 40 ng/cm2 é a média geral de todos os eventos através de todos os antecedentes.
[0031] Fig. 11 inclui a imagem de um Western Blot do tecido da folha de milho coletado no estágio V5 de desenvolvimento. Os conteúdos das bandas são: Banda 1 = controle negativo; banda 2 = BioRad MWM, 20 pL; banda 3 = 111434[1]-010.001; banda 4 = 111434[1]-004.001; banda 5 = 111434[1]-013.001; banda 6 = 111435[1]-003.001; banda 7 = 111435[1]-006.001; banda 8 = 111435[1]-012.001; banda 9 = CrylAb bacteriana purificada padronizada (2 ng); e banda 10 = CrylAb bacteriana purificada padronizada (20 ng).
LISTAGEM DE SEQUÊNCIAS
[0032] As sequências de ácido nucleico listadas na listagem de sequências em anexo são mostradas usando as abreviações com letra padronizadas para as bases de nucleotídeos, como definidas em 37 C.F.R § 1.822. Apenas uma fita de cada sequência de ácido nucleico é mostrada, mas a fita complementar é compreendida estar incluída por qualquer referência à fita apresentada. Na listagem de sequências em anexo: [0033] SEQ ID NO:1 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.1471.2: AT G G AT AAC AAC C C G AAC AT C AAC G AG T G C AT C C C GT AC AACT G C
CTGAGCAACCCGGAGGTGGAGGTGCTGGGCGGCGAGAGGATCG
AGACCGGCTACACCCCGATCGACATCAGCCTGTCCCTGACCCAG
TTCCTGCTGTCCGAGTTCGTGCCTGGCGCTGGCTTCGTGCTGGG
ACTCGTGGATATAATCTGGGGAATCTTTGGCCCGTCCCAGTGGGA
CGCCTTCCTGGTGCAGATCGAGCAGCTAATTAACCAAAGGATCGA
G G AGTT CG C G AG G AACC AAG C C ATTT C G AG G CT G G AG G G CCT GT
C C AAC CTGT AC C A AAT CTAC G C G G AG AG CTTC C G C G AG TG G G AG
G C G G AC C C G AC C AAC CCGGCCCT G AG G G AG G AG AT G AG G AT AC
AGTTCAACGACATGAACTCCGCGCTGACCACCGCCATCCCGCTGT
TCGCCGTGCAGAACTACCAAGTGCCGCTGCTGTCCGTGTACGTG
CAAGCCGCGAACCTGCACCTGAGCGTGCTGAGGGACGTGAGCGT
CTTT G G C C AG AG GTGGGGCTTC G AC G C G G C G AC C AT CA AC AG CA
GATACAACGACCTGACCAGACTGATCGGCAACTACACCGACTACG
CCGTGAGGTGGTACAACACCGGCCTGGAGAGGGTGTGGGGCCC
GGACTCAAGGGACTGGGTGAGATACAATCAATTCAGAAGGGAATT
AACCCT G ACCGTGCT GGACATCGTGGCCCT GTTCCCGAACTACGA
CT CAAGG AG AT ACCCGAT CAG AACCGT GTCCCAATT AACCAGAG A
AATCTACACCAACCCGGTGCTGGAGAACTTCGACGGCAGCTTCAG
AGGCAGCGCCCAAGGCATCGAGAGGAGCATCAGATCCCCGCACC T G AT G G AC AT C CT G AACT C C AT C AC C AT CT AC AC C G AC G C G CACA GAGGCTACTACTACTGGAGCGGCCACCAAATAATGGCCTCCCCG GTGGGCTTCTCCGGCCCGGAGTTCACCTTCCCGCTGTACGGCAC AATGGGCAACGCGGCCCCGCAGCAGAGGATCGTGGCGCAGCTG GGCCAAGGCGTGTACAGAACCCTCAGCTCCACCCTGTACAGAAG G CCGTT CAACAT C G G C ATC AATAATC AAC AG CTGAGCGTG CTG G A CGGCACCGAGTTCGCATACGGCACCTCCTCCAACCTGCCGAGCG CCGTGTACAGAAAGTCCGGCACCGTGGACTCCCTGGATGAAATC CCGCCGCAGAACAACAACGTGCCGCCGAGGCAAGGCTTCAGCCA CAG ACT GAGCCACGTG AGCAT GTT CAGATCCGGCTT CT CAAACT C C AG CGT G AG C AT C AT C AG AG C G CC G AT GTT C AG CT G G AT AC AT AG G AG C G C G G AG TT C AAT AAT AT AAT C C C CAG CTCT CAG AT C AC C C A GATCCCGCTGACCAAGTCCACCAACCTGGGCTCCGGCACCAGCG T GGT GAAGGGACCGGGCTTTACCGGCGGCGACAT CCT GAGGAGG ACCTCCCCGGGCCAAATCTCCACCCTGAGGGTGAACATCACCGC C C C G CT G AG C CAG AG AT AC AG AGT G AG G AT CAG AT AC G C GTC CA CCACCAACCTTCAGTTCCATACATCCATCGACGGGAGGCCGATTA AT CAAGGCAACTT CTCCGCGACCAT GT CCAGCGGCT CCAACCT CC AGAGCGGCAGCTTCAGAACCGTGGGCTTCACCACCCCGTTCAAC TTCTCAAACGGCAGCAGCGTGTTCACCCTGAGCGCCCACGTGTTC AACT CC G G C AAC G AG GT GT AC AT C G AC AG AAT C G AGTT C GTG CC GGCAGAAGTGACCTTCGAGGCCGAGTACGACCTGGAGAGGTGA
[0034] SEQ ID NO:2 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.1471.3: AT G G AC AAC AAC CCT AAC AT C AAT G AG T G C AT AC C AT AC AACT GTC TTAGCAACCCAGAAGTT GAGGTTCTGGGTGGGGAGAGGATAGAG ACT GG AT AC ACT C CAAT AGACATTTCG CT GT CACT G ACGC AATTCC TTCTGTCTGAGTTCGTTCCTGGTGCTGGATTCGTGCTGGGCTTGG TGGATATAATTTGGGGAATCTTTGGACCGTCCCAGTGGGATGCCT
TT CTT GTT C AG ATT G AGC AGCT AATT AACCAAAG AATT G AG G AGTT T G C AC G C AAC C AAG C C AT AT CC AG ACTT G AAG G C CTTT CG AACTT GTATC AAATCTAC G C AG AG AG CTTC AG AG AGTG G G AG G C AG AC C CGACGAATCCAGCCCTCAGAGAGGAGATGAGGATTCAGTTCAAC G ACAT G AACT CAG CACT G ACT ACT GCC ATTCCCCT CTTT G C CGTC CAG AACT AT CAAGT G CC ACT G CT GTCCGT CT ACGTT C AAG CAG CG AAT CT G C ACCT CAG CGT CTT G AG AG AC GT CT C G GTCTTT G G C CAG CGCT GGGGTTTT GATGCAGCGACGAT CAATAGCAGATACAAT GAC CT C AC AAG G CT G ATT G G AAACT AC AC C G ATT AC G C AGTT C G CT G G TACAATACGGGTCTCGAACGGGTCTGGGGACCCGACTCACGCGA CTG G GT CAG AT AC AAT C AATT CAG AC G C G AATT AACTTT G ACC GTT CTG GAC AT AGT CG CACT CTTT C C G AACTACG AC AG CAG AAG AT AT C C G ATT AG G AC G G TTT C C C AATT AAC C AG AG AAAT CT AT AC C AAT C CCGTGCTCGAAAACTTTGACGGCAGCTTTAGGGGAAGCGCTCAA GGCATT GAGAGG AGCAT C AGATCCCCACAT CT CATGG AC ATT CT G AACT C AAT C AC G AT CT AC ACT G AT G C AC AT AG G G GTT ACT ACT ATT GGAGCGGTCATCAAATAATGGCCTCGCCAGTGGGGTTTTCGGGT C C G G AGTTT AC ATT C C CACT GT AC G G G AC AAT G G G AAAT G CAG CA CCGCAACAGCGGATCGTTGCTCAGCTGGGTCAAGGGGTGTACAG AAC G CTCT C AT C G AC G CTGT AT C G G AG AC C CTT C AAC AT A G G C AT CAATAATCAACAACTCTCAGTCTTGGACGGCACCGAGTTCGCGTA TGGGACATCCTCCAACCTCCCGTCTGCCGTGTATCGCAAGTCCGG AACAGTCGATTCG CTGGAT G AAATTCCT CCACAGAACAACAACGT GCCT CC AAGACAAGGCTT CT CT CACAG ATT GAGCC AT GT G AGCAT GTTCCGCTCTGGCTTCTCCAACTCCTCAGTGTCGATCATTAGGGC ACCGAT GTT CT CTT G GATACATC G G AG C G C AG AG TTC AAT AATATA AT CCCGT CAAGCCAGAT CACGCAG ATCCCACT GACCAAGT CCACC AATCT CGGCTCTGGGACAAGCGTT GT GAAGGGTCCT GGCTT CACT GGT GGGG AT AT CCT GCGGAGG ACTT CTCCTGGCCAGATTT CAACC CT CAG AGT C AAC AT C AC C G C AC C C CTTT CACAG CGCT AT C G G G TT
C G C AT AC G CT AC G CTT CC AC G AC C AAT CT GC AATT CC AT AC AT C C
ATCGACGG G AGG CCTATTAATC AAG G CAACTTCTCAG CG ACTATG
TCCTCGGGTTCTAACCTTCAGTCTGGCAGCTTCAGAACGGTGGGG
TTCACCACTCCATTCAACTTCTCGAACGGGTCAAGCGTGTTCACCT
TGAGCGCTCACGTGTTCAATTCCGGAAACGAAGTGTACATCGACC
GCATAGAGTTCGTGCCAGCAGAAGTTACATTCGAAGCCGAGTACG
AT CTTGAGAGGTGA
[0035] SEQ ID NO:3 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.1471.4: ATGGATAACAACCCGAACATCAAT GAGTGCATCCCGTATAACT GT
CTCAGTAACCCTGAAGTGGAGGTCTTAGGTGGCGAACGCATCGAA
ACTGGTTACACCCCAATCGACATTAGCTTGTCGTTGACGCAGTTC
CTCTTGTCCGAGTTCGTGCCCGGTGCGGGTTTCGTGCTGGGGCT
AGTTGATATAATCTGGGGAATCTTTGGTCCCTCTCAGTGGGACGC
CTTT CTT GT GCAAATT G AGC AGCTAATT AACCAAAG AAT AG AAG AG
TTCG CG AG G AACC AAG CC ATTT CCAG ACT G G AG G G ACT AAG CAAC
CTTTATCAAATCTACGCGGAGTCTTTTAGGGAGTGGGAGGCAGAT
CCTACGAACCCGGCACTGCGCGAAGAGATGCGTATTCAGTTCAAC
GACATGAACAGTGCCCTTACAACCGCTATTCCCCTTTTCGCAGTTC
AAAATTACCAAGTTCCCCTTCTCTCAGTGTACGTTCAAGCCGCAAA
TTTACACCTAAGCGTTCTCCGCGATGTGTCAGTGTTCGGCCAGAG
GTGGGGATTTGATGCCGCCACTATCAATAGTCGTTATAATGATCTG
ACGAGGCTTATCGGCAACTATACCGACTATGCTGTCCGCTGGTAC
AATACGGGATTAGAGCGGGTCTGGGGTCCGGATTCCCGAGACTG
GGTGCGCTACAATCAATTCCGCCGCGAATTAACCCTCACTGTCCT
CGACATCGTGGCGCTGTTCCCGAACTACGACAGTAGGAGATACC
C AAT C C G C AC AG TTT C C C AATT AAC G C G G G AAATTT AC AC CAAC C
CAGTCCTG G AG AATTTTG AC G G GAGCTTC C G AG G CTCGGCTCAA
G G C AT AG AAC G C AG C ATT AGGT CG C C AC ACTT G AT G G AT AT C CTT
AAC AG C AT C AC C AT CT AC AC G G AT G C C C AT AG G G GTT ACT ACT AC
TGGTCGGGGCATCAAATAATGGCTTCTCCTGTCGGGTTTTCGGGG
CCAGAGTTCACCTTCCCGCTCTACGGCACTATGGGAAATGCCGCG
CCACAACAACGTATCGTCGCTCAACTAGGTCAAGGCGTGTACCGG
ACACTGTCGTCCACTCTCTATCGGCGGCCTTTCAATATAGGGATC
AAT AAT CAAC AGTT GT CT GT GCT G G ACGG G AC AG AGTTT G CTT AC
GGAACCTCAAGCAACTTGCCATCCGCTGTATACAGAAAAAGCGGC
ACGGTGGACTCGCTGGATGAAATCCCGCCCCAGAATAACAACGT
GCCCCCTCGGCAAGGCTTCAGTCATCGACTGAGCCACGTTAGCAT
GTTCCGTTCGGGCTTCAGCAACTCCTCCGTAAGTATCATAAGAGC
AC CT AT GTT C AG CTG G AT AC AT CGTTCCGCC G AG TT C AAT AAT AT A
ATT CC CT CCT CT C AAAT C AC AC AG AT C C CT CT G AC AAAGT CT ACT A
ATCTTGGCTCTGGGACTTCTGTCGTTAAGGGGCCTGGCTTTACGG
GCGGCGATATTCTGCGGAGAACTTCACCTGGCCAGATTTCCACCC
TGCGCGT GAATAT CACCGCGCCATT GT CACAACGTTACCGCGT GC
GGATTCGCTACGCTTCTACCACAAACCTCCAGTTCCATACATCTAT
TGACGGCAGACCCATTAATCAAGGGAATTTCTCCGCCACGATGTC
GTCCGGCTCCAATCTCCAGTCCGGAAGTTTCCGCACCGTAGGTTT
TACTACCCCGTTCAACTTTTCAAACGGCTCAAGTGTGTTTACGCTG
TCCGCT CAT GT GTT CAACT CT GGCAAT GAGGTTTACAT CG ACCGG
ATTGAGTTCGTCCCGGCAGAAGTCACCTTCGAAGCCGAGTACGAT
CTT GAGAGGTGA
[0036] SEQ ID NO:4 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.586.34: ATGGAGAATAATATCCAGAATCAATGCGTGCCGTACAACTGCCTG AATAATCCG G AG GTG G AG ATATTAAAC G AG G AG AG G AG C AC CG G GAGGCTGCCGCTGGACAT CTCCCT GT CCCT GACCCGCTT CCT GC TGTCCGAGTTCGTCCCGGGCGTGGGCGTGGCGTTCGGCCTGTTC G ACCT G AT CTG G G G CTT CAT C AC CC C G AG C G ACT G G AG C CT GTT CCT GCTT C AG ATCG AGCAGCT GATCGAGCAG AGGAT CGAG ACCC TGGAGAGGAACCGCGCGATCACCACCCTGAGGGGCCTGGCGGA
C AG CTATG AAATCTAC ATCG AG G C G CTG AG G GAGTG G G AG G C C A
ACCCGAATAATGCTCAATTAAGGGAGGACGTGAGGATACGCTTCG
C G AAT AC AG AC G AC G C G CT G AT C AC C G C AAT C AAT AATTT C AC C C
TGACCTCCTTCGAGATCCCGCTGCTGAGCGTGTACGTCCAAGCG
GCGAACCTGCACCT GTCCCT GCT GAGGGACGCCGT GAGCTTTGG
CCAAGGCTGGGGCCTGGACATCGCGACCGTGAATAATCACTACA
ACAGATTAATCAACCTGATCCACCGCTACACCAAGCACTGCCTGG
ACACCT ACAAT CAAGGCCTGG AG AACCT G AGGGGCACCAACACC
CGCCAGTGGGCGAGGTTCAACCAGTTTAGGAGGGACCTGACCCT
GACCGTGCT GGACATCGTGGCCCT GTTCCCGAACTACGACGT GA
GGACCTACCCGATCCAGACCAGCTCCCAATTAACCCGCGAAATCT
ACACCTCCAGCGTGATCGAGGACAGCCCGGTGTCCGCGAACATC
CCGAACGGCTTCAACCGCGCGGAGTTCGGCGTGAGGCCGCCGC
ACCT G AT GGACTT CAT GAAC AGCCT GTTCGT GACCGCCGAG ACCG
T GAGGT CCCAGACCGT GTGGGGAGGCCACCTGGT GTCCT CACGC
AACACCGCCGGCAACCGCATCAACTTCCCGTCCTACGGCGTGTTC
AACCCGGGCGGCGCCATCTGGATCGCCGACGAGGACCCGAGGC
CGTTCTACCGCACCCTGAGCGACCCGGTGTTCGTGAGGGGCGGC
TTTGGCAACCCGCACTACGTGCTGGGCCTGAGGGGCGTGGCCTT
CCAGCAGACCGGCACCAACCACACCCGCACCTTCCGCAACAGCG
GCACCATCGACAGCCT GGAT GAAATCCCGCCGCAAGACAACTCC
GGCGCCCCGTGGAACGACTACAGCCACGTATTAAACCACGTGAC
CTTCGTGAGGTGGCCGGGCGAAATCTCCGGCAGCGACAGCTGGA
GGGCACCGATGTTCTCCTGGACCCATCGGTCCGCGACCCCGACC
AAT ACAATCGACCCGGAGAGGATCACCCAGAT CCCGCTGGT GAA
GGCGCACACCCTT CAGAGCGGCACCACCGTGGT GAGGGGACCG
GGCTTCACCGGAGGCGACATCCTGAGGAGGACCTCGGGAGGAC
CGTTCGCGTATACTATCGTGAATATAAACGGCCAGCTGCCGCAGC
GCTACCGGGCACGCATCCGCTACGCCAGCACCACCAACCTGAGG
ATCTACGTGACCGTGGCGGGGGAGAGGATCTTCGCGGGCCAGTT
C AAC AAG AC AAT G G AC AC CG G AG AC C CG CT G AC CTTCC AG AG CTT
CTCCTACGCCACCATTAATACAGCGTTCACCTTCCCGATGAGCCA
GTCCTCATTCACCGTGGGCGCCGACACCTTCTCCAGCGGCAACG
AGGTGTACATCGACCGCTTCGAGCTGATCCCAGTGACCGCCACC
CTCGAGTGA
[0037] SEQ ID NO:5 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.586.35: ATGGAGAATAATATCCAGAATCAATGCGTGCCGTACAACTGCCTG
AATAATCCG G AG GTG G AG ATATTAAAC G AG G AG AG G AG C AC CG G
GAGGCTGCCGCTGGACATCTCCCTGTCCCTGACCCGCTTCCTGC
TGTCCGAGTTCGTCCCTGGCGTGGGCGTGGCGTTCGGCCTGTTC
GACCTGATCTGGGGCTTCATCACCCCGAGCGACTGGAGCCTGTT
CCTGCTTCAGATCGAGCAGCTGATCGAGCAGAGGATCGAGACCC
TGGAGAGGAACAGAGCGATCACCACCCTGAGAGGCCTGGCGGAC
AGCTAT GAAAT CTACATCGAGGCGCT GAGGGAGT GGGAGGCCAA
CCCGAATAATGCTCAATTAAGGGAGGACGTGAGGATACGCTTCGC
GAATACAGACGACGCGCTGATCACCGCAATCAATAATTTCACCCT
GACCTCCTTCGAGATCCCGCTGCTGAGCGTGTACGTCCAAGCTG
CGAACCTGCACCTGTCCCTGCTGAGGGACGCCGTGAGCTTTGGC
CAAGGCTGGGGTCTGGACATCGCGACCGTGAATAATCACTACAAC
AG ATT AAT CAACCT GATCCACCGCT AC ACCAAGCACT GCCTGGAC
ACCT AC AAT CAAG GCCTGGAG AACCT G AGGGGC ACCAAC ACAAG
GCAGTGGGCGAGGTTCAACCAGTTTAGGAGGGACCTGACCCTGA
CCGTGCTGGACATCGTGGCCCTGTTCCCGAACTACGACGTGAGG
ACCTACCCGATCCAGACCAGCTCCCAATTAACACGCGAAATCTAC
ACCTCCAGCGTGATCGAGGACTCTCCGGTGTCCGCGAACATCCC
GAACGGCTTCAACAGAGCGGAGTTCGGCGTGAGGCCACCGCACC
T GATGGACTT CAT GAACAGCCT GTTCGT GACTGCCGAGACCGT GA
GGT CCCAGACCGT GT GGGGAGGCCACCTGGT GT CCTCACGCAAC
ACCGCTGGCAACCGCATCAACTTCCCGTCCTACGGCGTGTTCAAC
CCTGGTGGAGCCATCTGGATCGCCGACGAGGACCCGAGGCCGTT
CTACCGCACCCTGAGCGACCCGGTGTTCGTGAGGGGTGGCTTTG
GCAACCCGCACTACGTGCTGGGCCTGAGAGGCGTGGCCTTCCAG
C AG AC C G G C AC C AAC C AC AC C C G C AC CTT C C G C AAC AG C G G C AC
C AT C G AC AG C CT G G AT G AAAT C C C ACC G C AAG AC AACT C CG GTG
CTC CGT G G AAC G ACT AC AG C C AC GT ATT AAAC C AC GT G AC CTT CG
TGAGGTGGCCTGGCGAAATCTCCGGCAGCGACAGCTGGAGGGCA
CCGATGTTCTCCTGGACCCATCGGTCCGCGACCCCGACCAATACA
AT CGACCCGGAG AGGAT CACCCAGAT CCCGCT GGT GAAGGCGCA
CACCCTT CAGAGCGGCACCACCGT GGT GAGGGGACCTGGCTT CA
CCGGAGGCGACATCCTGAGGAGGACCTCGGGAGGACCGTTCGC
GTATACTATCGTGAATATAAACGGCCAGCTGCCGCAGCGCTACAG
AG C AC G C AT CCGCTACGC C AG C AC C AC C AAC CTG AG G AT CT AC G
TGACCGTGGCTGGGGAGAGGATCTTCGCTGGCCAGTTCAACAAG
AC AAT G G AC AC C G G AG AC C CG CT G AC CTT C C AG AG CTT CTCCT AC
G C C AC C ATT AAT AC AG C GTT C AC CTT C C C G AT G AG C C AG T C CTC A
TTCACCGTGGGTGCCGACACCTTCTCCAGCGGCAACGAGGTGTA
CATCGACCGCTTCGAGCTGATCCCAGTGACCGCCACCCTCGAGT
GA
[0038] SEQ ID NO:6 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.586.36: ATGGAGAATAATATCCAGAATCAATGCGTGCCGTACAACTGCCTC
AAT AAT C C G G AG GTG G AG AT ATT AAAC G AG G AG C G C AG C AC C G G
CCGCCTCCCGCTCGACATCTCCCTCTCCCTCACCCGCTTCCTCCT
CTCCGAGTTCGTGCCGGGCGTGGGCGTGGCCTTCGGCCTCTTCG
ACCTCATCTGGGGCTTCATCACCCCGTCCGACTGGTCCCTCTTCC
TCCT CCAGAT CGAGCAGCT CAT CGAG CAGCGCAT CG AG ACCCT C
GAGCGCAACCGCGCCATCACCACCCTCCGCGGCCTCGCCGACTC
CTATGAAATCTACATCGAGGCCCTCCGCGAGTGGGAGGCCAACC
CGAATAATGCCCAATTAAGGGAGGACGTGCGCATCCGCTTCGCCA
AT ACAG ACG AC G CCCT C AT C AC C GC AAT C AAT AATTT C ACCCT C AC
CTCCTTCGAGATCCCGCTCCTCTCCGTGTACGTGCAGGCCGCCAA
CCTCCACCTCTCCCTCCTCCGCGACGCCGTGTCCTTCGGCCAGG
G CTG G G G CCTCG ACATCG CCACCGTG AATAATCACTACAAC AG AT
TAATCAACCTCATCCACCGCTACACCAAGCACTGCCTCGACACCT
ACAATCAAGGCCTCGAGAACCTCCGCGGCACCAACACCCGCCAG
TGGGCCCGCTTCAACCAGTTCCGCCGCGACCTCACCCTCACCGT
GCTCGACATCGTGGCCCTCTTCCCGAACTACGACGTGCGCACCTA
CCCGATCCAGACCTCCTCCCAATTAACCCGCGAGATCTACACCTC
CTCCGTGATCGAGGACTCCCCGGTGTCCGCCAACATCCCGAACG
GCTTCAACCGCGCCGAGTTCGGCGTGCGCCCGCCGCACCTCATG
GACTTCATGAACTCCCTCTTCGTGACCGCCGAGACCGTGCGCTCC
CAGACCGTGTGGGGCGGCCACCTCGTGTCCTCCCGCAACACCGC
CGGCAACCGCATCAACTTCCCGTCCTACGGCGTGTTCAACCCGG
GCGGCGCCATCTGGATCGCCGACGAGGACCCGCGCCCGTTCTAC
CGCACCCTCTCCGACCCGGTGTTCGTGCGCGGCGGCTTCGGCAA
CCCGCACTACGTGCTCGGCCTCCGCGGCGTGGCCTTCCAGCAGA
CCGGCACCAACCACACCCGCACCTTCCGCAACTCCGGCACCATC
GACTCCCTCGATGAAATCCCGCCGCAGGACAACTCCGGCGCCCC
GTGGAACGACTACT CCCACGTATTAAACCACGT GACCTTCGTGCG
CTGGCCGGGCGAGATCTCCGGCTCCGACTCCTGGCGCGCGCCG
ATGTTCTCCTGGACCCACCGCTCCGCCACCCCGACCAATACAATC
GACCCGGAGCGCATCACCCAGATCCCGCTCGTGAAGGCCCACAC
CCTCCAGTCCGGCACCACCGTGGTGCGCGGCCCGGGCTTCACC
GGCGGCGACATCCTCCGCCGCACCTCCGGCGGCCCGTTCGCCTA
TACTATCGTGAATATAAACGGCCAGCTCCCGCAGAGGTACAGGGC
CCGCATCCGCTACGCCTCCACCACCAACCTCCGCATCTACGTGAC
CGTGGCCGGCGAGCGCATCTTCGCCGGCCAGTTCAACAAGACGA
TGGACACCGGCGACCCGCTCACCTTCCAGTCCTTCTCCTACGCCA
CCATT AAT ACAGCCTT CACCTTCCCGAT GTCCCAGTCCT CCTT CAC
CGTGGGCGCCGACACCTTCTCCTCAGGCAACGAGGTCTACATCG
ACCGCTT CGAGCT GAT CCCCGT GACCGCCACCCTCGAGT GA
[0039] SEQ ID NO:7 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.586.37: ATGGAGAATAATATCCAGAATCAATGCGTGCCGTACAACTGCCTC
AAT AAT C C G G AG GTG G AG AT ATT AAAC G AG G AG C G C AG C AC C G G
ACGCCTCCCGCTCGACATCTCCCTCTCCCTCACCCGCTTCCTCCT
CTCCGAGTTCGTGCCTGGCGTGGGCGTGGCTTTCGGCCTCTTCG
ACCTCATCTGGGGCTTCATCACCCCGTCCGACTGGTCCCTCTTCC
TCCT CCAGATCGAGCAGCT CAT CGAG CAGCGCAT CG AG ACCCT G
G AGCG CAAC AG AG CCATCACC ACCCTCAG AG GCCTCGCCGACTC
CTATGAAATCTACATCGAGGCCCTCCGCGAGTGGGAGGCCAACC
CGAATAATGCCCAATTAAGGGAGGACGTCCGCATCCGCTTCGCCA
AT AC AG AC G AC G C CCT CAT C AC C G C AAT C AAT AATTT C ACC CT C AC
CTCCTTCGAGATCCCGCTCCTCTCCGTGTACGTGCAAGCAGCCAA
CCTCCACCTCTCCCTCCTCCGCGACGCCGTGTCGTTCGGCCAAG
GCTGGGGT CT CG AC AT CG C C AC CGT G AAT AAT C ACT AC AAC AG AT
TAATCAACCTCATCCACCGCTACACCAAGCACTGCCTCGACACCT
ACAATCAAGGCCTGGAGAACCTCAGAGGCACCAACACACGCCAG
TGGGCACGCTT CAACCAGTTCCGCAGAGACCT CACCCT CACCGT
GCTCGACATCGTGGCCCTCTTCCCGAACTACGACGTCCGCACCTA
CCCGATCCAGACCTCCTCCCAATTAACACGCGAAATCTACACCTC
CTCCGTGATCGAGGACTCTCCGGTGTCCGCCAACATCCCGAACG
GCTTCAACAGAGCCGAGTTCGGCGTGAGGCCACCGCACCTCATG
GACTT CAT GAACT CCCTCTTCGT GACAGCCGAGACCGTGCGCT CC
CAGACCGTGTGGGGTGGCCACCTCGTGTCCTCCAGAAACACCGC
TGGCAACCGCATCAACTTCCCGTCCTACGGCGTGTTCAACCCTGG
CGGAGCCATCTGGATCGCCGACGAGGACCCGAGGCCGTTCTACC
GCACGCTCTCCGACCCGGTGTTCGTGAGGGGAGGGTTCGGCAAC
CCGCACTACGTGCTCGGCCTCAGAGGCGTGGCCTTCCAGCAGAC
CGGCACCAACCACACCCGCACCTTCCGCAACTCCGGCACCATCG
ACTCCCTCG AT GAAAT CCCACCGCAAG ACAACTCCGGAG CACCGT
GGAACGACTACTCCCACGTATTAAACCACGTGACCTTCGTGCGCT
GGCCTGGCGAAATCTCCGGCTCCGACTCCTGGAGGGCACCGATG
TTCTCCTGGACCCACCGCTCCGCCACCCCGACCAATACAATCGAC
CCGGAGCGCATCACCCAGATCCCGCTCGTGAAGGCCCACACCCT
CCAGTCCGGCACCACCGTGGTGAGAGGCCCTGGCTTCACTGGTG
GCGACATCCTCAGACGCACCTCTGGCGGACCGTTCGCCTATACTA
TCGTGAATATAAACGGCCAGCTCCCGCAGAGATACAGAGCACGCA
TCCGCTACGCCTCCACCACCAACCTCCGCATCTACGTGACCGTGG
CTG G G G AG C G C AT CTT CG CTG G C C AG TT C AAC AAG AC G AT G G AC
ACT GGCGACCCG CT CACCTT CC AGTCCTT CT CCT ACGCCACCATT
AAT ACAGCCTT CACCTT CCCGAT GTCCCAGT CCTCCTT CACCGTG
GGAGCCGACACCTTCTCATCCGGCAACGAGGTCTACATCGACCG
CTTC GAG CT GAT C C C C GT GAC CGCCACCCTC GAGTGA
[0040] SEQ ID NO:8 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.586.38: AT G G AG AAT AAT AT AC AG AATC AAT G C GTCC C CT AC AACT G C CT CA ATAATCCTGAAGTAGAGATATTAAACGAAGAGAGGTCGACTGGCA GATT GCCGTTAGACATCT CCCT GTCCCTTACACGTTT CCT GTT GT C TGAGTTTGTTCCAGGTGTGGGAGTTGCGTTTGGCCTCTTCGACCT CATCTG G G G CTT C AT CACT CC AT CT GATT G G AG C CTCTTTCTTCTC C AG ATT GAACAGTT GATT GAACAAAGG ATT G AG AC CTT GGAAAGG AATCGGGCCAT CACTACCCTTCGT GGCTTAGCAGACAGCT AT GAA ATCTACATTGAAGCACTAAGAGAGTGGGAAGCCAATCCTAATAAT GCCCAATTAAGAGAAGATGTGCGTATACGCTTTGCTAATACAGAT G AT G CTTT G AT C AC AG C AAT C AAT AATTT C AC C CTT AC C AG CTTC G AG ATCCCT CTT CT CTCGGTCT AT GTT C AAG CT G CT AAC CT G C ACTT GTCACTACTGCGCGACGCTGTGTCGTTTGGGCAAGGTTGGGGAC T G G AC AT AGCTACTGT C AAT AAT CACT AC AAC AG ATT AAT C AAT CT
GATT CAT CG AT AC ACGAAACATT GTTT GGAT ACCT ACAAT CAAGGA TT GGAGAACCT GAGAGGTACTAACACT CGCCAATGGGCCAGGTT C AAT C AGTT C AG G AG AG AC CTT AC ACTT ACT GTGTT AG AC AT AGTT G CTCTCTTTCCGAACTACGATGTTCGTACCTATCCGATTCAAACGTC AT CC C AATT AAC AAG G G AG AT CTAC AC C AGTT C AGT C ATT G AAG AC TCTC CAGTTTCTG C G AAC ATACC C AATG GTTTC AAC AG G G CTG AG TTT GGAGT CAGACCACCCCATCTCAT G G ACTT CAT GAACT CTTT GT TT GT GACT GCAGAGACT GTTAGATCCCAAACT GT GTGGGG AGGAC ACTTAGTTAG CTC AC G C AAC AC G G CTG G C AATC GTATC AACTTTC CTAGTTACGGGGTCTTCAATCCCGGGGGCGCCATCTGGATTGCA G AT G AAG AT CC AC GTCCTTT CT ATCG G ACCTT GT CAG AT C CT GT CT TCGTCCGAGGAGGCTTTGGCAATCCTCACTATGTACTCGGTCTTA G G G G AGT G G C CTTT C AAC AAACT G GT ACG AAT C AC AC CC G C AC AT T CAGG AACT CCGG G ACCATT GACT CT CTAGAT GAAAT ACCACCT C AAGACAACAGCGGCGCACCTTGGAATGACTACTCCCATGTATTAA AT CAT GTT ACCTTT GTGCGCT GGCCAG GT G AGAT CT CAGGTT CCG ACT CAT G G AG AG C AC C AAT G TTCTCTT G G AC G CAT CGT AG C G CTA CCCCCACAAATAC AATT G ATCC AG AGAGAAT CACT CAGATTCCCTT G GT G AAG G CACACACACTT CAGTCAG GAACT ACAGTT GT AAG AGG GCCGGGGTT C AC G G G AG G AG AC ATT C TTC G AC G CACT AG TG G AG GACCATTCGCGTATACTATTGTCAATATAAATGGGCAACTTCCCCA AAGGTATCGTGCCAGGATACGCTATGCCTCTACTACCAATCTAAG AATCTAC GTTAC GGTTG C AG GTG AAC G G AT CTTT G CTG GTC AGTT CAACAAGACAATGGATACCGGTGATCCACTTACATTCCAATCTTTC TCCTACGCCACGATTAATACAGCGTTCACCTTTCCAATGAGCCAG AGC AGTTT C AC AG T AG GT G CT G AT ACCTT C AGTT CAG G C AAC G AA GT GTACATT GACAGGTTT GAGTT GATT CCAGTTACT GCCACACTCG AGTGA
[0041] SEQ ID NO:9 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.586.39: ATGGAGAATAATATACAGAATCAATGCGTCCCCTACAACTGCCTCA ATAATCCTGAAGTCGAGATATTAAACGAAGAGAGGTCCACTGGCA GATTGCCGTTGGACATCTCCCTGTCCCTTACACGCTTCCTGTTGT CT G AGTTT GTTCCTGGT GTGGG AGTT G CGTTT GGCCT CTTCGACC TC ATCTG G G G ATT CAT CACT CCAT CT G ATT G G AG C CTCTTTCTTCT CCAGATT GAACAGTT GATT GAACAAAGGATTGAGACCTTGGAAAG G AATAG AG CC ATC ACTACC CTT AG AG GCCTCG C AG AC AG CTATGA AATCTAC ATTG AAG C ACTC AG AG AGTG G GAAG C C AATCC C AATAA TG C CC AATTAAG AG AAG ATGTG CG G ATAC G CTTTG CTAATAC AG A T G AT G CTTT G AT C AC AG C AAT C AAT AATTT C AC C CTT AC C AG CTTC G AG AT CCCT CTT CT CT C G GTCT AT GTT C AAG CT G CT AAC CT G CACT TGTCACTCCTGCGCGACGCTGTGTCGTTTGGGCAAGGTTGGGGA CTG G AC AT AG CT ACT GT C AAT AAT C ACTAC AAC AG ATT AAT C AAT C TGATTCATCGCTACACGAAACACTGCTTGGATACCTACAATCAAGG ATTGGAGAACCTGAGAGGCACTAACACTCGCCAATGGGCGAGGT T C AAT CAGTTT AG G AG AG ACCTT ACACTT ACT GTGCTCG AC AT AGT TGCTCTCTTTCCGAACTACGATGTTCGCACCTATCCGATTCAAACG T C ATCCCAATTAACAAGGG AG ATTT ACACCAGCT CAGT CATT GAG GACTCTCCAGTTTCTGCGAACATACCCAATGGTTTCAACAGAGCT G AGTTTGGAGTCAG ACCACCCC AT CT CAT GGACTT CAT GAACT CT CT CTTT GT GACTGCCGAGACT GTTAGATCCCAAACT GT GTGGGGA G G AC AC CT CGTT AG CT C ACG C AAC AC G G CT G G C AATCG C AT C AAC TTTCCTTCCTACGGGGTGTTCAATCCTGGAGGTGCCATCTGGATT GC AG AT GAAG AT CCACGCCCTTT CTAT CGGACCTT GT C AG AT CCT GT GTTCGTCAGAGGAGGCTTT G GCAAT CCTCACTAT GT CCT CGGT CTTAGGGGAGTGGCCTTTCAACAAACTGGCACGAATCACACCCGC ACATT CCGCAACT CCGGGACCATT GACTCCCTT G AT GAAAT ACCA CCT CAAG ACAACT CCGGT GCGCCTTGGAAT GACTACTCCCAT GTA TTAAATCATGTTACCTTTGTGCGCTGGCCTGGTGAAATCTCCGGTT CCGACT CAT GGAG AGCACCAAT GTT CT CTT GGACGCATCG CAGCG
CT ACCCCCACAAAT AC AATCGATCCAG AG AGAAT C ACT CAGATT C CCTTGGT GAAGGCACACACACTT CAGT CGGGAACTACAGTT GT CA GAGGACCTGGGTTCACGGGAGGAGACATTCTTAGGCGCACCAGC GGAGGACCATTCGCGTATACTATTGTCAATATAAATGGGCAACTTC C C C AAC G CT AT AG AG C G AG G AT AC G CT AT GCCTCTACTAC C AAT C TTAGAATCTACGTTACGGTCGCTGGTGAACGGATCTTTGCTGGTC AGTT CAACAAG AC AAT GG AT ACT G GT G AT CCACTT AC ATTCC AAT C TTT CTC CT AC G CC AC G ATT AAT AC AG C GTT C ACCTTT C C AAT G AG C CAG AGCAGCTT CACAGT CGGT G CT G AT ACCTT CT CAT CT G G CAAC GAAGT GTACATT GACCGCTTT G AGTT G ATTCCAGTTACT GCCACAC TGGAGTAA
[0042] SEQ ID NO: 10 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.586.40: AT G G AG AAT AAT AT C CAG AAT C AAT G C GT G CCTT AC AATT GT CT CA AT AAT C C C G AG GT G G AG AT ATT AAAC G AG G AG AG AT C C ACT G G CA G ACTGCCACT CGACATATCCTT GTCCCTTACCCGTTT CCTTTT GAG CGAATTT GTTCCTGGT GTGGG AGTGG CTTT CGGACT GTTCGAT CT GATATGGGGCTTTATCACTCCTTCTGATTGGAGCCTCTTCCTTCTC CAGATT GAG C AATT GATT GAGCAGAGAATAGAAACCTTGGAAAGG AACCGTGCAATCACGACCTTGCGCGGTCTCGCCGATAGCTATGAA ATCTACATTGAAGCACTGAGGGAGTGGGAGGCCAACCCCAATAAT G CT C AATT AAG G G AAG AT GTG C GTATT CGTTTT G CT AAT AC AG AC G ACGCT CT CAT CAC AG CAAT C AAT AATTT C AC ACTT ACAT CCTTT G A AATCCCGCTTTTGAGCGTGTACGTTCAAGCCGCCAATCTCCACCT CT CACTT CT GAGGGACGCT GT CT CCTTTGGGCAAGGTT GGGGACT G G AT AT CGCTACTGT G AAT AAT C ACT AC AAT AG ATT AAT CAAC CTG ATT CAT AG AT AT AC G AAG C ACT G CTT G G AC AC AT AC AAT C AAG G AC T GG AGAACCTTAGGGGAACTAACACTAGGCAGT GGGCAAGGTTC AACCAGTT CAGACGT GAT CTCACACTTACT GT GCTGGATATCGTT G CT CT CTTT CCGAACTACGAT G TTCG CAC CTACC CAAT CCAGACGT
CATCCCAATTAACAAGGGAAAT CTACACCTCCT CAGT GATT GAGG ACTCTCCCGTTTCTGCTAACATACCTAACGGCTTCAACCGCGCCG AGTT C G G AGTT AG AC C G C C C C AC CTT ATG G ACTTT AT G AAT AG CTT GTTCGTGACTGCTGAGACTGTTAGAAGCCAAACTGTGTGGGGCG G C CACTT G GTC AG CTCACGCAACACGGCTG G CAAC CGTATCAACT TCCCGTCTTACGGGGTCTTTAACCCTGGTGGCGCCATTTGGATTG CAGACGAGGACCCACGTCCTTTTTACCGCACCCTGTCAGATCCGG TTTTCGTCAGAGGCGGATTTGGGAATCCTCATTATGTCCTGGGCC TTAG G G G AG TG G CTTT C C AAC AG ACT G G C AC CAAC C AC AC C C G TA C G TTT C G C AAT AG C G G G AC C AT AG ATT CTCTT G AT G AAAT C C C AC CT C AAG AT AAC AG C G G C G C AC CTT G G AAC GATT ATT C C C AC G T AT TAAATCACGTTACGTTCGTCCGCTGGCCGGGTGAGATCAGCGGC AG CG ATT C AT G G AG AG C AC C AAT GTTCT CTT G G ACG C AC C GTT CA G C C AC C C CT AC AAAT AC AATT G AC C C G G AG AG GATT ACT C AAAT C CCATTGGT CAAAGCACAT AC ACTT CAGT CT GGG ACCACCGTGGT C AGAGGGCCTGGGTTCACGGGAGGAGACATTCTTAGGCGCACATC CGGAGGACCCTTCGCTTATACTATCGTTAATATAAATGGGCAGCT CCCCCAGCGCTATCGTGCCAGAATCCGTTACGCCTCTACTACAAA TCTCAGAATCTACGTGACGGTTGCCGGTGAGCGCATCTTTGCTGG TCAGTTTAACAAGACGATGGATACTGGCGACCCACTGACATTCCA AT CTTT CT C AT ACG C AACT ATT AAT AC AG CTTT C AC ATT C CC AAT G A GCCAGTCATCTTTCACCGTCGGTGCTGATACCTTCAGCTCTGGCA ACGAAGTCTATAT CGACAGATTT GAGTT GATT CCAGTTACT GCAAC GCTCGAGTGA
[0043] SEQ ID NO:11 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.586.41: AT G G AG AAT AAT AT C C AG AAT C AAT GCGTGCCTT AC AACT G TCT CA ATAATCCCGAGGTGGAGATATTAAACGAGGAGAGATCCACTGGCA GACT GCCACT CGACATATCCTT GTCCCTTACCCGCTT CCTTTT GAG CGAATTT GTTCCT GGT GT GGGAGTGG CTTT CG G ACT GTTCGAT CT
GATATG G G G CTTT ATC ACTC CTTCTG ATTG G AG C CTCTTCCTTCTC CAGATT GAGCAGTT GATT GAGCAGAGAATAGAAACCTT GG AAAGG AATCGGGCAATCACGACCTTGAGGGGTCTCGCCGATAGCTATGAA ATCTACATTGAAGCACTGAGGGAGTGGGAGGCCAACCCCAATAAT G CTC AATTAAG GGAAGATGTG C G G ATTCG CTTTG CTAATAC AG AC G ACG CT CT C AT C AC AG C AAT C AAT AATTT C AC ACTT AC AT C CTTT G AAATCCCGCTTTTGAGCGTGTACGTTCAAGCAGCCAATCTCCACC T CTCACTT CT GAGGGACGCT GT CT CCTTTGGGCAAGGTTGGGGAC T G G AT AT C G CT ACT GT G AAT AAT C ACT AC AAT AG ATT AAT C AACCT GATT C AT AG AT AT ACG AAG CACTG CTT G G AC AC AT AC AAT C AAG G A CTG G AG AACCTTAG G G G AACTAAC ACT AG G CAGTG G G C AAG GTT CAACCAGTT CAGACGCG AT CT C ACACTTACT GT GCT GG AT ATCGT TGCT CT CTTT CCG AACTACGATGTTCG CACCTACCCAATCCAGAC G T C AT C C C AATT AAC AAG G G AAAT CT AC AC CTC CT C AG T G ATT G AG GACT CTCCCGTTT CTGCTAACAT ACCT AACGGCTT CAACAGAGCC GAGTTCGGAGTTAGACCACCCCACCTTATGGACTTTATGAATAGC TTGTTCGTGACTGCTGAGACTGTTAGAAGCCAAACTGTGTGGGGT GGCCACTTGGTCAGCTCACGCAACACGGCTGGCAACCGCATCAA CTTCCCGTCTTACGGGGTCTTTAACCCTGGTGGAGCCATTTGGAT TGCAGACGAGGACCCACGCCCTTTTTACCGCACCCT GT CAGAT CC GGTTTTCGTCAGAGGCGGATTTGGGAATCCTCATTATGTCCTGGG CCTTAGGGGAGTGGCTTTCCAACAGACTGGCACCAACCACACCC GCACGTTTCGCAATAGCGGGACCATAGATTCTCTTGATGAAATCC CACCTCAAGATAACAGCGGAGCACCTTGGAACGATTATTCCCACG TATTAAATCACGTTACGTTCGTCCGCTGGCCTGGTGAGATCAGCG G C AG C GATT C AT G G AG AG C AC C AAT GTT CT CTTG G AC G C AC CG CT CAGCCACCCCTACAAATACAATCGACCCGGAGAGGATTACTCAAA T CCC ATT G GT C AAAG C AC AT AC ACTT C AGT CTG G G AC C AC CGT G G TCAGAGGGCCTGGGTTCACGGGAGGAGACATTCTTAGGCGCACA TCCGGAGGACCCTTCGCTTATACTATCGTTAATATAAATGGGCAG
CTCCCCCAGCGCTATAGAGCCAGAATCCGCTACGCCTCTACTACA AATCTCAGAATCTACGTGACGGTTGCCGGTGAGCGCATCTTTGCT G G T C AG TTT AAC AAG AC G AT G G AT ACT G G C G AC C C ACT G AC ATT C C AATCTTTCTC ATAC G C AACT ATT AAT AC AG CTTT C AC ATT C C C AAT G AGCCAGTCAT CTTT CACCGTCGGT GCT G ATACCTT CAGCT CTGG CAACGAAGTCTATATCGACAGATTTGAGTTGATTCCAGTTACTGCA ACGCTCGAGTGA
[0044] SEQ ID NO: 12 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.586.42: AT G G AG AAT AAT AT C C AG AAT C AAT GTGTC C C AT AC AACT G C CT CA ATAATCCTGAAGTTGAGATATTAAACGAAGAGAGGAGCACTGGAC GCCTT CCCCTT GACAT CT CCCT CT CCCTCACAAGGTTCCT CTT GT C T GAGTTT GTTCCTGGT GT GGGT GT GGCCTTTGGCCT CTTT GACCT CATCTGGGGATTCATCACCCCATCTGATTGGAGCCTCTTCCTTCTC CAGATT GAACAGTT GATT G AGC AGAGG ATT GAGACCCTT G AAAGG AAC AG AG C C AT C AC C AC ACTT AG AG G C CTTG CT G AC AG CT AT G AA AT CT AC ATT G AAG C ACT G AG G G AGT G G G AAG CC AAT C CC AAT AAT GCT C AATT AAG G G AAG AT GTG AG GATT C G CTTT G CC AAT AC AG AT GACGCTTTGATCACAGCAATCAATAATTTCACCCTCACCAGCTTTG AGATCCCTTTGCT CT CAGT CTAT GTT C AAGCT GCAAACCT CCACTT G AGCTT GCTT AGGGATGCT GT GT CGTT CGG ACAAGGTTGGGGAC TT GACAT AG C C ACT GT C AAT AAT C ACT AC AAC AG ATT AAT C AACTT GATT CAT CGCTACACCAAACATT GCTT GGACACCT ACAAT CAAGGA TTG G AG AAC CTC AG AG G C AC C AAC ACTCG CC AATG G G C AAG GTT C AACC AGTTT AG AAG GG AT CT C ACACT CACT GT GCTT GACAT AGTT GCT CT CTT CCCCAACTAT G AT GTT CGCACCT ACCCAATT C AAACCA GCTCCCAATTAACAAGGGAAATCTACACCTCCTCAGTCATTGAGG ACAGCCCAGTTTCTGCCAACAT ACCCAATGGTTT CAATAG GGCT G AGTTTGGT GT CAGACCACCCCAT CTCATGGACTT CAT GAACTCCTT GTTCGTGACT GCCGAGACT GTT AGGTCCCAAACT GT GT GGGGAG
G C C ACCTT GTT AG CTCC C G C AAC AC C G CT G G C AACC G C AT C AACT TCCCATCCTATGGGGTTTTCAATCCTGGTGGAGCCATCTGGATTG C AG AT G AG G AC C C AAG G CCTTT CT AC AG AACCTT GTC AG AT CCTG TCTTTGTC AG AG G AG G CTTTG G CAATC CACACT AT GTT CTT GGTTT G AG G G G AGT G G CTTTT C AG C AG ACT G G C ACC AAT C AC AC C CG C A CATT CAGAAACAGCGGCACCATT GACAGCCTT GAT GAAAT CCCAC CTCAAG ACAACAG CG G AG CAC CCTGG AACG ACTACTCCC ATGTAT TAAATCATGTCACCTTTGTGCGCTGGCCTGGTGAGATCAGCGGTT CAG ATT CTT GGAG AGCACCAAT GTT CT CAT GGACCCATCG CT CT G C CAC AC C C AC AAAT AC AAT AG AT C C AG AG AG AAT CAC C C AG ATT C CCTTGGT GAAGGC ACACACACTT CAGT CT GGAACCACAGTT GTCA G AGGGCCTGGGTT CACT GGT GGAG AC ATT CT CAGACGCACCT CT GGAGGGCCATTTGCTTATACTATTGTCAATATAAATGGGCAACTTC CCCAACGCTACAGAGCCAGAATCCGCTATGCTTCCACCACTAACT T G AG AAT CT AT GT CACAGTTGCT GGT G AAAGGAT CTTTG CTG GTC AGTT C AAC AAG AC AAT GGACACTGGT G ATCCATT G ACATTCCAGT CATT CTCCTATGCCACC ATT AAT AC AG C CTT CACCTTTCCAAT GAG CC AGT CCAGCTT C ACAGTGGGT G CAG AT ACCTT CAG CT CC G G CAA T GAGGT GTACATT GACCGCTTT G AGTT GATT CCAGT GACT GCCAC ACTCGAGTGA
[0045] SEQ ID NO: 13 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como IRDIG.586.43: AT G GAG AAT AAT AT C CAG AAT C AAT GCGTGCCCT AC AACT GT CT G A ATAATCCGGAGGTGGAGATATTAAACGAAGAGCGCTCAACGGGG AGGCTCCCGCTGGACATATCCCTGTCGCTTACCCGGTTCCTCTTG TCCGAGTTCGTTCCGGGTGTGGGCGTGGCGTTCGGACTCTTTGAT CT CATCT GGGGCTT CATAACCCCCTCT GATTGGAGCCT GTTCCT C CT CCAG ATCGAGCAGCT GATCG AGCAGAGGAT AGAGACATT GGA GAGGAACCGGGCAATCACCACGCTTAGGGGACTCGCAGATAGCT ATGAAATCTACATTGAAGCCCTGCGCGAGTGGGAAGCCAACCCGA
ATAATG C AC AATTAAG G G AG G ATGTG AG G ATTCG CTTTG C CAATA
CAGACGACGCTCTGATAACGGCAATCAATAATTTCACACTTACCAG
CTTT G AGATCCCCCTT CT GTCGGTCTAT GTT CAAGCT GCG AACCT
G C AC CTGTCACTG CTC AG AG AC G CTGTCTC GTTC G G CC AAG G CT
G G G G ACTG GACATCGCTAC C GTG AATAATC ATTAC AAC AG ATTAA
T C AACCTT ATT C AC AG AT AC AC G AAAC ATT G CTT G G AC AC AT AC AA
TCAAGGGCTGGAAAACCTGAGGGGCACTAACACTCGCCAGTGGG
CCAGATTCAACCAGTTTCGGAGGGATCTCACCCTTACTGTGCTTG
ATATCGTCGCCCTTTTCCCGAACTACGATGTTCGGACCTACCCAAT
TC AG ACGTC ATC C C AATTAAC AAG G G AAATCTAC AC C AG CTCCGT
C ATT G AAG ATT CTC C AG TTT C C G CT AAC AT C C CT AAC G G TTT C AAC
CGCGCAGAGTTCGGCGTGAGGCCACCCCATCTCATGGACTTCAT
GAACTCTTTGTTCGTCACTGCCGAGACCGTTAGAAGCCAGACGGT
GTGGGGCGGACACCTCGTGTCCTCACGCAACACTGCTGGCAACC
GGATCAACTTCCCCTCCTACGGGGTTTTCAACCCTGGTGGAGCCA
T CTGGATT GCGGACGAGGACCCACGCCCTTTCTACCGGACCTT GT
CAGACCCTGTCTTTGTCAGAGGAGGGTTCGGCAACCCGCATTATG
TCCTGGGCCTCAGAGGCGTCGCGTTTCAGCAGACCGGCACGAAC
CACACCCGGACGTTCCGGAACAGCGGGACCATCGACTCCCTGGA
T GAAATCCCACCGCAAGACAACAGCGGCGCT CCCT GGAACGACT
ACAGCCAT GTATT AAACCACGT GACCTTT GTCCGCTGGCCTGGT G
AG ATTT C G G G C AG CG ACT C AT G G AG G G C ACCC AT GTT CT CTTG G A
CGCACCGCTCGGCCACCCCTACCAATACAATCGATCCGGAGAGG
ATTACTCAGATCCCGCTCGTGAAGGCCCACACCCTTCAGTCCGGA
ACTACT GTT GT GAGGGGT CCTGGGTTTACGGGTGGCGATATT CTT
AGGCGCACCTCCGGCGGACCATTCGCCTATACTATTGTCAATATA
AACGGGCAACTGCCCCAGAGATATAGAGCACGCATCCGCTACGC
CTCTACTACAAACCTGAGGATCTACGTGACGGTTGCCGGTGAGCG
GATCTTCGCTGGCCAGTTCAACAAGACAATGGACACTGGCGACCC
ACT CACATT CCAAT CATT CT CCT ACGCG ACCATTAAT ACAGCGTTT
ACATTCCCAATG AG CCAGTCTAG CTTC ACCGTG G GTG CG G ACACG TTTT CGTCTG G G AACG AG GT CT AC AT C G AC CG CTTT G AGTT G AT C CCAGT GACCGCGACACTCGAGTGA
[0046] SEQ ID NO: 14 mostra uma sequência de polinucleotídeos referida em alguns locais do mesmo como Cry1F trunc Hx: ATGGAGAACAACATACAGAAT CAGTGCGTCCCCTACAACTGCCT C AACAATCCT GAAGTAG AGATT CT CAAC G AAG AG AG GTC G ACTG G C AGATTGCCGTTAGACATCTCCCTGTCCCTTACACGTTTCCTGTTGT CT GAGTTT GTT CCAGGT GT GGGAGTTGCGTTTGGCCTCTTCGACC TC ATCTG G G G CTTC ATC ACTCC ATCTG ATTG G AG C CTCTTTCTTCT CCAGATT GAACAGTT GATT GAACAAAGGATTGAGACCTTGGAAAG GAATCGGGCCATCACTACCCTTCGTGGCTTAGCAGACAGCTATGA G AT CT AC ATT G AAG C ACT AAG AG AGT G G G AAG CC AAT CCT AAC AA TGCCCAACT GAGAGAAGAT GTGCGTAT ACGCTTTGCTAACACAGA T G AT G CTTT G AT C AC AG C C AT C AAC AACTT C AC C CTT AC C AG CTTC G AG AT CCCT CTT CT CT C G GTCT AT GTT C AAG CT G CT AAC CT G C ACT TGTCACTACTGCGCGACGCTGTGTCGTTTGGGCAAGGTTGGGGA CTG G AC AT AG CT ACT GT CAAC AAT C ACT AC AAC AG ACT C AT C AAT C T GATT C AT C G AT AC ACG AAAC ATT GTTT G G AT ACCT AC AAT C AG G G ATTGGAGAACCT G AGAGGTACT AACACT CGCCAAT GGGCCAGGTT C AAT CAGTT CAGG AG AGACCTT ACACTT ACT GT GTTAGACAT AGTT GCTCTCTTTCCGAACTACGATGTTCGTACCTATCCGATTCAAACGT C ATC C C AACTTAC AAG GG AG AT CTACACCAGTT CAGT CATT GAAG ACT CTC C AGTTT CT G CG AAC AT ACCC AAT G GTTT CAAC AG G G CTG AGTTTGGAGTCAG ACCACCCCAT CT CATGGACTT CAT G AACT CTTT GTTT GT GACTGC AG AG ACTGTT AG AT C CC AAACT GTGTG G G G AGG AC ACTTAGTTAG CTC AC G CAAC AC G G CTG G C AATC GTATC AACTTT CCTAGTTACGGGGTCTTCAATCCCGGGGGCGCCATCTGGATTGC AG AT G AAG ATCC ACGT CCTTT CT AT CG G ACCTTGT CAG AT CCT GTC TTC GTC C G AG G AG G CTTT G G C AAT CCT C ACT AT GTACTCGGTCTT
AG G G G AGT G G CCTTT C AAC AA ACT G G T AC G AAT C AC AC C C G CACA TTCAGGAACTCCGGGACCATTGACTCTCTAGATGAGATACCACCT CAAGACAACAGCGGCGCACCTTGGAATGACTACTCCCATGTGCTG AAT C AT GTT ACCTTT GTGCGCTGGC C AG GTG AG AT CT C AG GTTC C GACT CAT GGAGAGCACCAAT GTT CT CTT GGACGCATCGT AGCGCT ACCCCCACAAACACCATT GATCCAGAG AGAAT CACT CAGATT CCC TT GGT GAAGGCACACACACTT CAGT CAGGAACTACAGTT GTAAGA GGGCCGGGGTTCACGGGAGGAGACATTCTTCGACGCACTAGTGG AGGACCATT CGCGTACACCATT GT CAACAT CAAT GGGCAACTTCC CCAAAGGTATCGTGCCAGGATACGCTATGCCTCTACTACCAATCT AAGAAT CT ACGTT ACGGTT GCAGGT GAACGGAT CTTT GCTGGT CA GTT C AAC AAG AC AAT G G AT ACC G GT G ATCC ACTT AC ATT C C AAT CT TT CT CCTACGCCACT AT CAACACCGCGTT CACCTTTCCAAT GAGCC AG AG C AGTTTC AC AGTAG GTGCT GAT ACCTT CAGTT CAG G C AAC G AAGT GT ACATT GACAGGTTT G AGTT GATT CCAGTTACT GCC ACACT CGAGTAA
[0047] SEQ ID NOs: 15 a 29 mostram iniciadores e sondas exem-plifícadoras utilizadas em certas modalidades do mesmo.
MODO(S) PARA REALIZAR A INVENÇÃO I. Visão geral de várias modalidades [0048] São fornecidas aqui composições e métodos para manipular genes sintéticos para a expressão aumentada de seus produtos de proteína codificada. Está descrita aqui a descoberta inesperada e aplicável de modo geral de que a expressão da proteína heteróloga pode ser aumentada em uma célula de planta pela manipulação da sequência de nucleotídeos do gene sintético para incluir as sequências de po-liadenilação que estão presentes no gene nativo. Em algumas modalidades, as sequências de poliadenilação são incluídas no gene sintético no mesmo número e nas mesmas localizações como elas estão presentes no gene nativo. Foi inesperadamente e surpreendentemente descoberto em alguns exemplos que tais genes sintéticos demonstram um aumento na expressão média de proteína em tecido de folha V5 (por exemplo, entre cerca de 0,5 vezes a cerca de 17 vezes), quando comparado aos genes sintéticos designados que utilizam abordagens convencionais.
[0049] Um polinucleotídeo sintético que codifica um polipeptídeo pode ser manipulado por um processo que compreende, por exemplo e sem limitação: substituir códons raros com códons preferidos (por exemplo, os códons mais preferidos); remoção de fatores de desesta-bilização conhecidos; remoção de sequências preditas formar estruturas em haste alça secundárias; remoção de fases de leitura aberta acidentais; e remoção de sequências de reconhecimento de enzima de restrição interna indesejadas. Em uma modalidade do mesmo, o polinucleotídeo resultante que codifica um polipeptídeo é adicionalmente modificado para incluir pelo menos uma sequência de poliadenilação específica que está presente em um gene nativo que codifica o mesmo polipeptídeo na posição de nucleotídeo idêntica, por exemplo, de modo a manter a localização e o número total das sequências de poliadenilação especificadas.
[0050] Exemplos específicos aqui demonstram a descoberta precedente no milho com nove genes diferentes que codificam as proteínas Bt inseticidas e um gene de tolerância ao glifosato. Em exemplos em particular, os métodos precedentes e as composições são utilizadas para manipular um polinucleotídeo sintético para expressar um polipeptídeo heterólogo em uma planta cultivada (por exemplo, milho e soja). Por exemplo, a expressão de três configurações de um gene crylAb truncado foi avaliada no milho transgênico na geração T0. Foi determinado que um dos polinucleotídeos crylAb, em que as sequências de poliadenilação nativas foram preservadas, produziu uma proteína CrylAb estável em um nível significativamente maior do que os outros polinucleotídeos que foram avaliados. Por meio de um exemplo adicional, a expressão de doze configurações de um gene crylAb truncado também foi avaliada no milho transgênico na geração T0. Dois polinucleotídeos crylFa produziram uma proteína CrylFa estável em um nível significativamente maior do que os outros polinucleotídeos que foram avaliados. II. Abreviações [0051] Bt - Bacillus thuringiensis [0052] larva de traça do milho - CEW
[0053] ECB - broca do milho europeia [0054] FAW - lagarta de cartucho [0055] GFP - proteína verde fluorescente [0056] NCBI - National Center for Biotechnology Information [0057] PCR - reação em cadeia da polimerase [0058] rEBC - broca do milho europeu resistente a Cry1 Fa III. Expressões [0059] O uso das formas no singular "um/uma" e "o/a" incluem referencias no plural a menos que o contexto indique claramente de outra maneira. Por exemplo, a referência a um "polinucleotídeo" inclui uma pluralidade de polinucleotídeos, a referência a "um substrato" inclui uma pluralidade de tais substratos, a referência a "uma variante" inclui uma pluralidade de tais variantes, etc.
[0060] Quando uma faixa de valores é citada, é para ser compreendido que cada valor inteiro interveniente e cada fração do mesmo, entre os limites citados superior e inferior da faixa também está especificamente descrito, junto com cada sub-faixa entre tais valores. Os limites superiores e inferiores de cada faixa podem ser independentemente incluídos ou excluídos da faixa e cada faixa onde um, nenhum ou ambos os limites estão incluídos também está abrangida dentro da invenção. Onde um valor a ser discutido tem limites inerentes (por exemplo, onde um componente pode estar presente em uma concentração entre 0 a 100% ou onde o pH de uma solução aquosa pode variar entre 1 a 14), esses limites inerentes são especificamente descritos.
[0061] Onde um valor é explicitamente citado, deve ser compreendido que os valores que têm cerca da mesma grandeza ou quantidade que o valor citado também estão dentro do escopo da invenção. Onde uma combinação está descrita, cada sub-combinação dos elementos daquela combinação também está especificamente descrito e está dentro do escopo da invenção. Inversamente, onde diferentes elementos ou grupos de elementos são individualmente descritos, combinações dos mesmos também estão descritas. Onde qualquer elemento de uma invenção está descrito como possuindo uma pluralidade de alternativas, exemplos daquela invenção na qual cada alternativa está isoladamente excluída ou em qualquer combinação com outras alternativas, também estão descritas por meio dessa (mais do que um elemento de uma invenção pode ter tais exclusões e todas as combinações de elementos que possuem tais exclusões estão descritas por meio dessa).
[0062] A menos que fornecido de outra maneira, todas as expressões técnicas e científicas usadas nesse possuem o mesmo significado como comumente compreendidas por aquele versado na área da genética, bioinformática e design de gene. Dicionários comuns que contêm várias das expressões usadas nessa descrição são: Singleton et al. (1994) Dictionary of Microbioloqy and Molecular Bioloqy, 2nd Ed., John Wiley and Sons, New York; e Hale and Marham (1991) The Har-per Collins Dictionary of Bioloqy, Harper Perennial, New York. Quaisquer métodos e materiais similares ou equivalentes aqueles descritos aqui podem ser usados na prática ou experimentação das modalidades da invenção, embora certos métodos e materiais estejam exempli- ficados por aqueles aqui descritos.
[0063] Preferência de utilização de códon: Como usada aqui, a expressão "preferência de utilização de códon" ou simplesmente "utilização de códon", se refere ao uso preferencial de alta frequência de um códon em particular (em oposição a outros códons sinônimos) que codificam um aminoácido dentro de um organismo. Uma preferência de utilização de códon pode ser expressa como uma medida quantitativa da taxa na qual um códon particular é usado no genoma de um organismo em particular, por exemplo, quando comparado com outros códons que codificam o mesmo aminoácido.
[0064] Vários métodos são conhecidos por aqueles versados na técnica para determinar a preferência de utilização de códon. Em algumas modalidades, a preferência de utilização de códon pode ser determinada pelo método do índice de adaptação de códon (CAI), que é essencialmente uma medida da distância da utilização do códon de um gene para a utilização do códon em um conjunto pré-definido de genes altamente expressos. Sharp and Li (1987) Nucleic Acids Res. 15:1281-95. Métodos alternativos para a determinação da preferência de utilização de códon incluem MILC (measure independent of length and çomposition - medida independente de comprimento e composição) (Supek and Vlahovicek (2005) BMC Bioinformatics 6:182) e utilização relativa de códon sinônimo (relative synonymous codon usage) (RSCU), que é a frequência observada de um códon particular dividida pela frequência esperada da utilização igual de todos os códons sinônimos para aquele aminoácido. Sharp et al. (1986) Nucleic Acids Res. 14:5125-43. Valores de RSCU próximos de 1,0 indicam uma ausência de preferência por um códon particular, enquanto que o afastamento de 1,0 reflete a preferência de utilização de códon.
[0065] Portanto, a preferência de utilização de códon inclui frequências relativas do uso de códons que codificam o mesmo aminoá- cido ("códons sinônimos"). Uma preferência pode ter ocorrência natural; por exemplo, a preferência de códon no genoma de um organismo reflete o uso relativo global de códons sinônimos dentro de todos os genes naquele organismo. Uma preferência também pode ser usada em um algoritmo computacional, onde, por exemplo, ela pode ser usada para determinar a frequência relativa com a qual códons sinônimos diferentes são selecionados para uso no planejamento de uma sequência de polinucleotídeo. Similarmente, a frequência "relativa" de qualquer elemento da sequência usado para codificar um polipeptídeo dentro de uma sequência de nucleotídeos é a frequência com a qual o elemento da sequência é usado para codificar uma característica do polipeptídeo, dividida pelo número de ocorrências dentro do polipeptídeo em uma dada fase de leitura de características que poderão ser codificadas por aquele elemento da sequência.
[0066] A preferência de utilização de códon também pode ser inferida a partir de uma tabela de utilização de códon para um organismo hospedeiro de expressão em particular. Tabelas de utilização de códon estão prontamente disponíveis para vários organismos hospedeiros de expressão. Veja, por exemplo, Nakamura et al. (2000) Nucleic Acids Res. 28:292 (Codon Usage Database - versões atualizadas disponíveis em kazusa.or.jp/codon). Quando uma tabela de utilização de códon não está disponível, ela pode ser montada a partir de bancos de dados de genética de organismos, tais como aqueles mantidos pela NCBI (disponível em ncbi.nlm.nih.gov/sites/genome). Em algumas modalidades, uma tabela de utilização pode ser montada a partir de um conjunto de regiões codificadoras obtidas a partir do organismo hospedeiro de expressão em particular. Em alguns exemplos, um conjunto de regiões codificadoras compreende pelo menos 100, pelo menos 200, pelo menos 300, pelo menos 400, pelo menos 500, pelo menos 550, pelo menos 600 ou mais regiões codificadoras obtidas a partir do organismo hospedeiro de expressão em particular.
[0067] As expressões "tabela de utilização de códon" ou "tabela de preferência de códon" ou tabela de frequência de códon" são usadas alternativamente e descrevem uma tabela que correlaciona cada códon que pode ser usado para codificar um aminoácido particular com as frequências com as quais cada códon é usado para codificar aquele aminoácido em um organismo específico, dentro de uma classe especificada de genes dentro daquele organismo ou dentro de um ou mais polinucleotídeos sintéticos.
[0068] Frequência absoluta de códon: Como usada aqui, a expressão "frequência absoluta de códon" se refere à frequência com a qual um códon aparece em relação ao número total de códons (por exemplo, ambos códons sinônimos e não sinônimos) dentro de um po-linucleotídeo ou conjunto de polinucleotídeos em uma dada fase de leitura (por exemplo, uma fase de leitura que é usada para codificar um polipeptídeo de interesse). Similarmente, a frequência "absoluta" de qualquer elemento da sequência usada para codificar um polipeptídeo dentro de um polinucleotídeo é a frequência com a qual o elemento da sequência é usado para codificar uma característica (por exemplo, aminoácido, par de aminoácidos, etc.) do polipeptídeo, dividida pelo número de ocorrências dentro do polipeptídeo das características do mesmo tamanho como aquelas que poderíam ser codificadas por aquele elemento de sequência.
[0069] Como usado aqui, com relação a preferência de códon e frequência de códon, um "códon raro" é um códon que tem uma utilização de menos do que 10% no organismo de interesse. Em alguns exemplos, um "códon raro" é um códon que tem uma utilização de menos do que 5% no organismo. Como usado aqui, um "códon preferido" é um códon que tem uma utilização de mais do que 5% no organismo de interesse. Em alguns exemplos, um "códon mais preferido" é um códon que tem uma utilização de mais do que 10% no organismo, por exemplo, o códon com a maior utilização no organismo para a codificação de um aminoácido particular.
[0070] Espaço de códon: Como usado aqui, a expressão "espaço de códon" se refere a todas as sequências de polinucleotídeos possíveis que podem ser usadas para codificar um polipeptídeo específico, pela variação dos códons usados para codificar os aminoácidos dentro do polipeptídeo.
[0071] Substituição de códon: Como usada aqui, a expressão "substituição de códon" se refere a alteração de uma sequência codifi-cadora de nucleotídeo pela mudança de um ou mais dos códons que codificam um ou mais aminoácidos de um polipeptídeo codificado, sem alterar a sequência de aminoácidos do polipeptídeo codificado.
[0072] Otimização de códon: Como usada aqui, a expressão "otimização de códon" se refere a processos empregados para modificar uma sequência codificadora existente ou para projetar uma sequência codificadora na primeira circunstância, por exemplo, para aperfeiçoar a tradução em uma célula ou organismo hospedeiro de expressão de um transcrito de molécula de RNA, transcrita a partir da sequência codificadora ou para aperfeiçoar a transcrição de uma sequência codificadora. A otimização de códon inclui, mas não está limitada a processos que incluem selecionar códons para a sequência codificadora para adaptar a preferência de códon do organismo hospedeiro de expressão. A otimização de códon também inclui, por exemplo, o processo algumas vezes referido como "humanização do códon", em que códons de uma sequência de códon que são reconhecidos como de baixa utilização no organismo fonte são alterados para códons que são reconhecidos como de baixa utilização no novo hospedeiro de expressão. Esse processo pode ajudar os polipeptídeos expressos a enove-lar normalmente pela introdução de pausas naturais e apropriadas du- rante a tradução/extensão. Birkholtz et al. (2008) Malaria J. 7:197-217.
[0073] Será compreendido que, devido a redundância do código genético, múltiplas sequências de DNA podem ser projetadas para codificar uma única sequência de aminoácidos. Portanto, sequências de DNA otimizadas podem ser projetadas, por exemplo, para remover sítios de restrição supérfluos e estruturas secundárias indesejáveis de RNA, enquanto otimiza a sequência de nucleotídeos da região codifi-cadora tal que a composição do códon se pareça com a composição global do códon do hospedeiro, no qual o DNA vai ser expresso. Orientações com relação ao projeto e produção de sequências de DNA sintético podem ser encontradas, por exemplo, no Pedido de Patente Internacional PCT Nos. WO 2013016546, WO 2011146524, e WO 1997013402; e Patentes U.S. 6.166.302 e 5.380.831.
[0074] Modificar: Como usadas aqui, as expressões "modificar" ou "alterar" ou quaisquer formas dessas significam modificar, alterar, mudar, deletar, substituir, remover, variar ou transformar.
[0075] Retrocruzamento: Métodos de retrocruzamento podem ser usados para introduzir uma sequência de ácido nucleico nas plantas. A técnica de retrocruzamento tem sido amplamente usada por décadas para introduzir novas características nas plantas. Jensen, N., Ed. Plant Breedinq Methodoloqv. John Wiley & Sons, Inc., 1988. Em um protocolo típico de retrocruzamento, a variedade original de interesse (paren-tal recorrente) é cruzada com uma segunda variedade (parental não recorrente) que carrega um gene de interesse a ser transferido. A pro-gênie resultante do mesmo cruzamento é então cruzada novamente com o parental recorrente e o processo é repetido até que uma planta seja obtida na qual essencialmente todas as características morfológi-cas e fisiológicas desejadas das plantas recorrentes são recuperadas na planta convertida, em adição ao gene transferido de uma planta não recorrente.
[0076] Isolado: Um componente biológico "isolado" (tal como um ácido nucleico ou proteína) foi substancialmente separado, produzido longe de ou purificado sem outros componentes biológicos na célula do organismo no qual o componente ocorre naturalmente (isto é, outros DNA e RNA cromossômicos e extra-cromossômicos e proteínas), enquanto efetua uma alteração química ou funcional no componente (por exemplo, um ácido nucleico pode ser isolado de um cromossomo pela ruptura química de ligações que conectam o ácido nucleico ao restante do DNA no cromossomo). Moléculas de ácido nucleico e proteínas que foram "isoladas" incluem moléculas de ácido nucleico e proteínas purificadas pelos métodos de purificação padronizados. A expressão também abrange ácidos nucleicos e proteínas preparadas pela expressão recombinante em uma célula hospedeira, assim como moléculas de ácido nucleico, proteínas e peptídeos quimicamente sintetizados.
[0077] Molécula de ácido nucleico: Como usada aqui, a expressão "molécula de ácido nucleico" pode se referir a uma forma polimérica de nucleotídeos, que pode incluir ambas as fitas senso e antissenso de RNA, cDNA, DNA genômico e formas sintéticas e polímeros mistos dos acima. Um nucleotídeo pode se referir a um ribonucleotídeo, de-soxirribonucleotídeo ou uma forma modificada de cada tipo de nucleotídeo. Uma "molécula de ácido nucleico" como usada aqui é sinônima de "ácido nucleico" e "polinucleotídeo". Uma molécula de ácido nucleico tem geralmente pelo menos 10 bases de extensão, a menos que especificado de outra maneira. A expressão inclui formas de DNA de fita simples e fita dupla. Uma molécula de ácido nucleico pode incluir qualquer um ou ambos nucleotídeos que ocorrem naturalmente e modificados ligados por ligações de nucleotídeo que ocorrem e/ou não ocorrem naturalmente.
[0078] Moléculas de ácido nucleico podem ser modificadas quimi- camente ou bioquimicamente ou podem conter bases de nucleotídeo não natural ou derivatizados, como será prontamente apreciado por aqueles versados na técnica. Tais modificações incluem, por exemplo, marcadores, metilação, substituição de um ou mais dos nucleotídeos que ocorrem naturalmente com um análogo, modificações inter-nucleotídeo (por exemplo, ligações não carregadas: por exemplo, metil fosfonatos, fosfotriésteres, fosforamidatos, carbamatos, etc.; ligações carregadas: por exemplo, fosforotioatos, fosforoditioatos, etc.; porções pendentes: por exemplo, peptideos; intercaladores: por exemplo, acri-dina, psoralen, etc.; quelantes; alquilantes; e ligações modificadas: por exemplo, ácidos nucleicos alfa anoméricos, etc.). A expressão "molécula de ácido nucleico" também inclui qualquer conformação topológi-ca, incluindo conformações de fita simples, fita dupla, parcialmente duplicadas, triplicadas, com hairpin, circulares e trancadas.
[0079] Operativamente ligada: Uma primeira sequência de nucleotídeos está operativamente ligada com uma segunda sequência de ácido nucleico quando a primeira sequência de ácido nucleico está em um relacionamento funcional com a segunda sequência de ácido nucleico. Quando recombinantemente produzidas, sequências de ácido nucleico operativamente ligadas são geralmente contíguas e, onde necessário ligar duas regiões codificadoras de proteína, na mesma fase de leitura (por exemplo, em uma ORF policistrônica). Entretanto, os ácidos nucleicos não precisam ser contíguos para estar operativamente ligados.
[0080] A expressão "operativamente ligada", quando usada em referência a uma sequência regulatória e uma sequência codificadora, significa que a sequência regulatória afeta a expressão da sequência codificadora ligada. "Sequências regulatórias" ou "elementos de controle" se referem a sequências de nucleotídeos que influenciam o momento e o nível/quantidade de transcrição, processamento ou estabili- dade do RNA ou a tradução da sequência codificadora associada. As sequências regulatórias podem incluir promotores; sequências líder da tradução; íntrons; intensificadores; estruturas haste-alça; sequências repressoras de ligação; sequências de terminação e sequências de reconhecimento de poliadenilação. Sequências regulatórias particulares podem estar localizadas a montante e/ou a jusante de uma sequência codificadora operativamente ligada a ela. Sequências regulatórias particulares operativamente ligadas a uma sequência codificadora também podem estar localizadas sobre a fita complementar associada de uma molécula de ácido nucleico de fita dupla.
[0081] Promotor: Como usada aqui, a expressão "promotor" se refere a uma região de DNA que pode estar a montante do início da transcrição e que pode estar envolvido no reconhecimento e na ligação da RNA polimerase e outras proteínas para iniciar a transcrição. Um promotor pode estar operativamente ligado a uma sequência codificadora para expressão em uma célula ou um promotor pode estar operativamente ligado a uma sequência de nucleotídeos que codifica uma sequência de sinal que pode estar operativamente ligada a uma sequência codificadora para expressão em uma célula. Um "promotor de planta" pode ser um promotor capaz de iniciar a transcrição em células de planta. Exemplos de promotores sob controle evolucionário do desenvolvimento incluem promotores que preferencialmente iniciam a transcrição em certos tecidos, tais como folhas, raízes, sementes, fibras, vasos do xilema, traqueídas ou esclerênquima. Tais promotores são referidos como "preferidos para os tecidos". Promotores que iniciam a transcrição apenas em certos tecidos são referidos como "específicos para o tecido". Um promotor específico para o tipo celular" direciona a expressão primariamente em certos tipos celulares em um ou mais órgãos, por exemplo, células vasculares em raízes ou folhas. Um promotor "induzível" pode ser um promotor que pode estar sob contro- le ambiental. Exemplos de condições ambientais que podem iniciar a transcrição pelos promotores induzíveis incluem condições anaeróbi-cas e a presença de luz. Promotores específicos para o tecido, preferidos para o tecido, específicos para o tipo celular e induzíveis constituem a classe de promotores "não constitutivos", Um promotor "constitutivo" é um promotor que pode ser ativo na maioria das células do organismo sob a maioria das condições ambientais.
[0082] Qualquer promotor induzível pode ser usado em algumas modalidades da invenção. Veja Ward et al. (1993) Plant Mol. Biol. 22:361-66. Com um promotor induzível, a taxa de transcrição aumenta em resposta a um agente de indução. Promotores induzíveis exempli-ficadores incluem, mas não são limitados a: promotores do sistema ACEI que responde ao cobre; gene In2 do milho que responde aos fi-toprotetores do herbicida benzenosulfonamida; repressor Tet de Tn10; e o promotor induzível de um gene de hormônio esteroide, cuja atividade transcricional pode ser induzida por um hormônio glicocorticoste-roide (Schena et al. (1991) Proc. Natl. Acad. Sei. USA 88:10421-5).
[0083] Promotores constitutivos exemplificadores incluem, mas não são limitados a promotores de vírus de planta, tais como o promotor 35S de CaMV; promotores de genes de actina do arroz; promotores de ubiquitina; pEMU; MAS; promotor H3 de histona de milho; e o promotor ALS, fragmento 5’ Xba1/Ncol ao gene estrutural de Brassica na-pus (ou uma sequência de nucleotídeos similar ao dito fragmento Xba1/Ncol (Publicação de Patente Internacional PCT No. WO 96/30530).
[0084] Adicionalmente, qualquer promotor específico para o tecido ou preferido para o tecido pode ser utilizado em algumas modalidades da invenção. As plantas transformadas com a molécula de ácido nu-cleico que compreende uma sequência codificadora operativamente ligada a um promotor específico para o tecido, pode produzir o produto da sequência codificadora exclusivamente ou preferencial mente em um tecido específico. Promotores específicos para o tecido ou promotores preferidos para o tecido exemplificadores incluem, mas não são limitados a um promotor preferido para raiz, tal como aquele do gene de faseolina; um promotor específico para folha e induzido pela luz tal como aquele de cab ou rubisco-, um promotor específico para a antera tal como aquele de LAT52\ um promotor específico para o pólen tal como aquele de Zm13\ um promotor preferido para microesporo tal como aquele de apg\ e um promotor específico para semente (por exemplo, um promotor de PvDlec2, LfKCS3, FAE1, BoACP, ou BnNa-pinC).
[0085] Heterólogo: A expressão "heterólogo", quando aplicada a ácidos nucleicos (por exemplo, polinucleotídeos, DNA, RNA e genes), significa de origem diferente. Por exemplo, se uma célula hospedeira é transformada com um ácido nucleico que não ocorre na célula hospedeira não transformada na natureza, então aquele ácido nucleico é heterólogo (e exógeno) para aquela célula hospedeira. Adicionalmente, elementos diferentes (por exemplo, promotor, intensificador, sequência codificadora, terminador, etc.) de um ácido nucleico para transformação podem ser heterólogos um ao outro e/ou para a célula transformada.
[0086] Nativo: Como usada aqui, a expressão "nativa" se refere a forma de um polinucleotídeo ou gene em sua localização natural no organismo ou no genoma de um organismo como encontrado na natureza, com suas próprias sequências regulatórias, se presentes.
[0087] Endógeno: Como usada aqui, a expressão "endógeno" se refere a um polinucleotídeo, gene ou polipeptídeo que está localizado no organismo ou genoma que compreende a molécula na natureza.
[0088] Transformação: Como usada aqui, a expressão "transformação" se refere a transferência de uma ou mais moléculas de ácido nucleico em uma célula. Uma célula é "transformada" pela molécula de ácido nucleico transduzida em uma célula quando a molécula de ácido nucleico se torna estavelmente replicada pela célula, pela incorporação da molécula de ácido nucleico no genoma celular ou pela replica-ção epissomal. Como usada aqui, a expressão "transformação" abrange todas as técnicas pelas quais uma molécula de ácido nucleico pode ser introduzida em tal célula. Exemplos incluem, mas não são limitados a: transfecção com vetores virais, transformação com vetores de plasmídeo; eletroporação (Fromm et al. (1986) Nature 319:791-3); lipofecção (Felgner et al. (1987) Proc. Natl. Acad. Sei. USA 84:7413-7); microinjeção (Mueller et al. (1978) Cell 15:579-85); transferência mediada por Agrobacterium (Fraley et al. (1983) Proc. Natl. Acad. Sei. USA 80:4803-7); absorção direta de DNA; e bombardeio com microprojétil (Klein et ai (1987) Nature 327:70).
[0089] Transgene: Um polinucleotídeo exógeno que codifica um produto que está integrado no genoma do hospedeiro. Em alguns exemplos, um transgene pode conter sequências regulatórias operativamente ligadas a uma sequência codificadora do transgene (por exemplo, um promotor).
[0090] Vetor: Uma molécula de ácido nucleico quando introduzida em uma célula, por exemplo, para produzir uma célula transformada. Um vetor pode incluir sequências de ácido nucleico que permitem a replicação na célula hospedeira, tal como uma origem de replicação. Exemplos de vetores incluem, mas não são limitados a: um plasmídeo; um cosmídeo; bacteriófago; ou vírus que carregue DNA exógeno em uma célula. Um vetor também pode incluir um ou mais genes, moléculas antissenso e/ou genes marcadores selecionáveis e outros elementos genéticos conhecidos na técnica. Um vetor pode transduzir, transformar ou infectar uma célula, fazendo com que dessa maneira a célula expresse as moléculas de ácido nucleico e/ou proteínas codificadas pelo vetor. Opcionalmente, um vetor inclui materiais para auxiliar na obtenção da entrada da molécula de ácido nucleico na célula (por exemplo, um lipossoma e proteína de revestimento).
[0091] Expressão: Como usado aqui, o termo "expressão" pode se referir à transcrição e o acúmulo estável de mRNA codificado por um polinucleotídeo ou à tradução de tal mRNA em um polipeptídeo. O termo "superexpressão", como usado aqui, se refere à expressão que é maior do que a expressão endógena do mesmo ou de um gene intimamente relacionado. Um gene heterólogo é superexpresso se sua expressão é maior do que aquela de um gene endógeno intimamente relacionado (por exemplo, um homólogo).
[0092] Exógenos: A expressão "exógeno", como aplicada a ácidos nucleicos (por exemplo, polinucleotídeos, DNA, RNA e genes), se refere a um ou mais ácidos nucleicos que estão normalmente presentes dentro de seu ambiente ou contexto específicos. Por exemplo, se uma célula hospedeira é transformada com um ácido nucleico que não ocorre na célula hospedeira não transformada na natureza, então esse ácido nucleico é exógeno para a célula hospedeira. A expressão exó-gena, como usada aqui, também se refere a um ou mais ácidos nucleicos que são idênticos em sequência a um ácido nucleico já presente em uma célula hospedeira, mas que estão localizados em um contexto celular ou genômico diferentes do ácido nucleico com a mesma sequência já presente na célula hospedeira. Por exemplo, um ácido nucleico que está integrado no genoma da célula hospedeira em uma localização diferente do ácido nucleico com a mesma sequência, é exógeno para a célula hospedeira. Adicionalmente, um ácido nucleico (por exemplo, uma molécula de DNA) que está presente em um plas-mídeo ou vetor na célula hospedeira é exógeno para a célula hospedeira, quando o ácido nucleico com a mesma sequência está normalmente presente no genoma da célula hospedeira.
[0093] Identidade de sequência: A expressão "identidade de sequência" ou "identidade", como usada aqui no contexto de dois polinu-cleotídeos ou polipeptídeos, pode se referir aos resíduos (nucleotídeos ou aminoácidos, respectivamente) nas duas sequências que são iguais quando alinhados para a correspondência máxima sobre uma janela de comparação especificada.
[0094] Como usada aqui, a expressão "percentual de identidade de sequência" pode se referir ao valor determinado pela comparação de duas sequências otimamente alinhadas (por exemplo, sequências de ácido nucleico e sequências de aminoácidos) sobre uma janela de comparação, em que a porção da sequência na janela de comparação pode compreender adições ou deleções (isto é, lacunas) quando comparadas com a sequência de referência (que não compreende adições ou deleções) para o alinhamento ótimo das duas sequências. O percentual é calculado pela determinação do número de posições nas quais o resíduo de nucleotídeo ou aminoácido idêntico ocorre em ambas as sequências para fornecer o número de posições que combinam, dividindo o número de posições combinadas pelo número total de posições na janela de comparação e multiplicando o resultado por 100 para fornecer o percentual de identidade de sequência.
[0095] Métodos para o alinhamento de sequências para comparação são bem conhecidos na técnica. Vários programas e algoritmos de alinhamento estão descritos em, por exemplo: Smith and Waterman (1981) Adv. Appl. Math. 2:482; Needleman and Wunsch (1970) J. Mol. Biol. 48:443; Pearson and Lipman (1988) Proc. Natl. Acad. Sei. U.S.A. 85:2444; Higgins and Sharp (1988) Gene 73:237-44; Higgins and Sharp (1989) CABIOS 5:151-3; Corpet et al. (1988) Nucleic Acids Res. 16:10881-90; Huang et al. (1992) Comp. Appl. Biosci. 8:155-65; Pearson et al. (1994) Methods Mol. Biol. 24:307-31; Tatiana et al. (1999) FEMS Microbiol. Lett. 174:247-50. Uma consideração detalha- da de métodos de alinhamento de sequência e cálculos de homologia pode ser encontrada em, por exemplo, Altschul et al. (1990) J. Mol. Biol. 215:403-10.
[0096] A National Center for Biotechnology Information (NCBI) Basic Local Alignment Search Tool (BLAST™; Altschul et al. (1990)) está disponível a partir de várias fontes, incluindo o National Center for Biotechnology Information (Bethesda, MD) e na internet, para uso em conjunto com vários programas de análise de sequência. Uma descrição para determinar a identidade de sequência usando esse programa está disponível na internet na seção "ajuda" de BLAST™. Para comparações de sequências de ácido nucleico, as "sequências Blast 2", função do programa BLAST™ (Blastn), podem ser empregadas usando parâmetros padronizados. As sequências de ácido nucleico com maior similaridade com as sequências de referência mostrarão um percentual de identidade crescente quando avaliadas por esse método.
[0097] Como usada aqui, a expressão "substancialmente idêntica pode se referir a sequências de nucleotídeo que são mais do que 85% idênticas. Por exemplo, uma sequência de nucleotídeos substancialmente idêntica pode ser pelo menos 85,5%; pelo menos 86%; pelo menos 87%; pelo menos 88%; pelo menos 89%; pelo menos 90%; pelo menos 91%; pelo menos 92%; pelo menos 93%; pelo menos 94%; pelo menos 95%; pelo menos 96%; pelo menos 97%; pelo menos 98%; pelo menos 99%; ou pelo menos 99,5% idêntica à sequência de referência.
[0098] Em algumas modalidades, a presença de um ácido nucleico heterólogo em uma planta pode ser detectada através do uso de uma sonda de ácido nucleico. Uma sonda pode ser uma molécula de DNA ou uma molécula de RNA. Sondas de RNA podem ser sintetizadas por meios conhecidos na técnica, por exemplo, usando um modelo de molécula de DNA. Uma sonda pode conter toda ou uma porção da se- quência de nucleotídeos do ácido nucleico heterólogo e uma sequência de nucleotídeos adicional, contígua do genoma da planta. Isso é referido aqui como uma "sonda contígua". A sequência de nucleotídeos adicional, contígua é referida como "a montante" ou "a jusante" do ácido nucleico heterólogo, dependendo se a sequência de nucleotídeos contígua está sobre o lado 5’ ou 3’ do ácido nucleico heterólogo, como convencionalmente compreendido. Como é reconhecido por aqueles versados na técnica, o processo de obtenção da sequência de nucleotídeos adicional, contígua para inclusão em uma sonda pode ser repetido quase indefinidamente (limitado apenas pela extensão do cromossomo), identificando dessa maneira um ácido nucleico adicional ao longo do cromossomo. Qualquer uma e todas as variedades acima descritas de sondas podem ser usadas em algumas modalidades da presente invenção.
[0099] Uma sonda pode conter uma sequência de nucleotídeos que não é contígua aquela do ácido nucleico heterólogo; essa sonda é referida aqui como uma "sonda não contígua". A sequência da sonda contígua está localizada suficientemente perto da sequência de ácido nucleico heterólogo sobre o cromossomo, tal que a sonda não contígua está geneticamente ligada ao ácido nucleico heterólogo. Uma sonda pode ser também uma cópia exata de um ácido nucleico heterólogo a ser detectado. Uma sonda também pode ser uma molécula de ácido nucleico que compreende, ou consiste em uma sequência de nucleotídeos que é substancialmente idêntica a um segmento clonado de DNA cromossômico que compreende um ácido nucleico heterólogo a ser detectado.
[00100] Uma sequência de sonda de oligonucleotídeos pode ser preparada sinteticamente ou por clonagem. Vetores de clonagem adequados são bem conhecidos daqueles versados na técnica. Uma sonda de oligonucleotídeo pode ser marcada ou não marcada. Uma gran- de variedade de técnicas existem para a marcação de moléculas de ácido nucleico, incluindo, por exemplo e sem limitação: Radio-marcação por nick translation; iniciação aleatória; resíduos com deso-xitransferase terminal; et.; onde os nucleotídeos empregados são marcados, por exemplo, com 32P radioativo. Outros marcadores que podem ser usados incluem, por exemplo e sem limitação: Fluoróforos; enzimas; substratos de enzimas; cofatores de enzima; inibidores de enzimas; etc. Alternativamente, o uso de um marcador que fornece um sinal detectável, por si ou em conjunto com outros agentes reativos, pode ser substituído pelos ligantes aos quais os receptores se ligam, onde os receptores são marcados (por exemplo, pelos marcadores acima indicados) para fornecer os sinais detectáveis, ou por si próprios ou em conjunto com outros reagentes. Veja, por exemplo, Leary et al. (1983) Proc. Natl. Acad. Sei. USA 80:4045-9.
[00101] Uma sonda também pode ser uma molécula de ácido nucleico que seja "especificamente hibridizável" ou "especificamente complementar" a uma cópia exata do marcador a ser detectado ("DNA alvo"). "Especificamente hibridizável" e "especificamente complementar" são expressões que indicam um grau suficiente de complementaridade tal que uma ligação estável e específica ocorra entre a molécula de ácido nucleico e o DNA alvo. Uma molécula de ácido nucleico não precisa ser 100% complementar a sua sequência alvo para ser especificamente hibridizável. Uma molécula de ácido nucleico é especificamente hibridizável quando houver um grau suficiente de complementaridade para evitar a ligação não específica do ácido nucleico com sequências não alvos sob condições onde a ligação específica é desejada, por exemplo, sob condições estringentes de hibridização.
[00102] Condições de hibridização que resultam em graus particulares de estringência variarão dependendo da natureza do método de hibridização de escolha e a composição e a extensão das sequências de ácido nucleico que hibridizam. Geralmente, a temperatura de hibri-dização e a força iônica (especialmente a concentração de Na+ e/ou Mg++) do tampão de hibridização determinarão a estringência da hibri-dização, embora os tempos de lavagem também influenciem a estringência. Cálculos com relação às condições de hibridização necessárias para atingir graus particulares de estringência são conhecidos por aqueles versados na técnica e estão discutidos, por exemplo, em Sambrook et al. (ed.) Molecular Cloninq: A Laboratorv Manual. 2nd ed., vol. 1-3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, capítulos 9 e 11; e Hames and Higgins (eds.) Nucleic Acid Hvbridization, IRL Press, Oxford, 1985. Instruções detalhadas adicionais e orientações com relação a hibridização de ácidos nucleicos podem ser encontrads, por exemplo, em Tijssen, "OverView of principies of hybridization and the strategy of nucleic acid probe assays," in Laboratorv Techniques in Biochemistry and Molecular Bioloqy- Hvbridization with Nucleic Acid Probes, Part I, Chapter 2, Elsevier, NY, 1993; e Ausubel et al., Eds., Current Protocols in Molecular Bioloqy, Chapter 2, Greene Publishing and Wiley-lnterscience, NY, 1995.
[00103] Como usadas aqui, "condições estringentes" abrangem condições sob as quais a hibridização ocorrerá apenas se houver menos do que 25% de não pareamento entre a molécula de hibridização e o DNA alvo. "Condições estringentes" incluem níveis particulares adicionais de estringência. Portanto, como usada aqui, condições de "estringência moderada" são aquelas sob as quais as moléculas com mais do que 25% de não pareamento de sequência não hibridizarão; condições de "estringência média" são aquelas sob as quais moléculas com mais do que 15% de não pareamento não hibridizarão; e condições de "alta estringência" são aquelas sob as quais sequências com mais do que 10% de não pareamento não hibridizarão. Condições de "estringência muito alta" são aquelas sob as quais sequências com mais do que 6% de não pareamento não hibridizarão.
[00104] Em modalidades particulares, condições estringentes são hibridização a 65°C em tampão 6x salina-citrato de sódio (SSC), 5x solução de Denhardt, SDS 0,5% e 100 μ de DNA de testículo de salmão cisalhado, seguidas por 15 a 30 minutos de lavagens sequenciais a 65°C em 2x tampão SSC e SDS 0,5%, seguido por 1 x tampão SSC e SDS 0,5% e finalmente 0,2x tampão SSC e SDS 0,5%.
[00105] Com relação a todas as sondas discutidas, supra, a sonda pode compreender sequências de ácido nucleico adicionais, por exemplo, promotores; sinais de transcrição; e/ou sequências de vetores.
[00106] Proteína/polipeptídeo: As expressões "proteína" e "polipep-tídeo" são usadas aqui alternativamente. As expressões se referem a uma cadeia molecular contígua de aminoácidos ligados através de ligações peptídicas. As expressões não se referem a uma extensão específica do produto. Portanto, "peptídeos", "oligopeptídeos" e "proteínas" estão incluídos dentro da definição de polipeptídeo. As expressões incluem polipeptídeos que contêm modificações co- e/ou pós-traducionais do polipeptídeo feitas in vivo ou in vitro: por exemplo, e sem limitação: glicosilações, acetilações, fosforilações, PEGuilações e sulfatações. Em adição, fragmentos de proteína, análogos (incluindo aminoácidos não codificados pelo código genético; por exemplo, ho-mocisteína, ornitina, p-acetilfenilalanina, D-aminoácidos e creatina), mutantes naturais ou artificiais, variantes, proteína de fusão, resíduos derivatizados (por exemplo, alquilação de grupos amina, acetilações ou esterificações de grupos carboxila) e combinações de quaisquer um dos precedentes estão incluídos dentro do significado de polipeptídeo.
[00107] Tipicamente, proteínas possuem uma função. Entretanto, as proteínas também abrangem oligopeptídeos e sequências de aminoácidos contíguas menores que não possuem uma atividade funcio- nal. Exemplos não limitantes de proteínas funcionais incluem: receptores, ligantes de receptores, citocinas, anticorpos, moléculas imunomo-duladoras, moléculas de sinalização, proteínas fluorescentes, proteínas com atividade inseticida ou biocida e enzimas. Classes gerais de enzimas úteis incluem, mas não são limitadas a: proteases, celulases, oxidoredutases, lipases, liases, ligases, hemicelulases, lacases, amila-ses, glicoamilases, esterases, desidrogenases, lactases, poligalactu-ronases, galactosidases, ligninases, oxidases, peroxidases, transfera-ses, glicose isomerases, nitrilases, hidroxilases, hidrolases, polimera-ses e depolimerases.
[00108] Em adição às enzimas, as proteínas que podem ser codificadas pelas moléculas de ácido nucleico sintético aqui descritas incluem sem limitação: fatores de transcrição, anticorpos, receptores, fatores de crescimento (qualquer um de PDGFs, EGFs, FGFs, SCF, HGF, TGFs, TNFs, insulina, IGFs, LIFs, oncostatinas, CSFs, etc), imunomo-duladores, hormônios peptídicos, citocinas, integrinas, interleucinas, moléculas de adesão, moléculas trombomoduladoras, inibidores de protease, angiostatinas, defensinas, cluster de antígenos de diferenciação, interferons, quimiocinas, antígenos que incluem aqueles de vírus infecciosos e organismos, produtos de oncogene, trombopoietina, eri-tropoietina, ativador do plasminogênico tecidual e qualquer outra proteína biologicamente ativa que seja desejada para uso em um ambiente clínico, de diagnóstico ou veterinário. Todas essas proteínas são bem definidas na literatura (por exemplo, pelas sequências de aminoácidos exemplificadoras) e são aqui definidas assim. Também estão incluídas mutantes por deleção de tais proteínas, domínios individuais de tais proteínas, proteínas de fusão feitas de tais proteínas e misturas de tais proteínas.
[00109] Substituição conservativa: Como usada aqui em relação a um polipeptídeo, a expressão "substituição conservativa" se refere a uma substituição onde um resíduo de aminoácido é substituído por outro aminoácido na mesma classe. Uma substituição de aminoácido não conservativa é aquela onde os resíduos não estão na mesma classe, por exemplo, substituição de um aminoácido básico por um aminoácido neutro ou não polar. Classes de aminoácidos que podem ser definidos para o propósito da realização de uma substituição conservativa são conhecidos na técnica.
[00110] Em algumas modalidades, uma substituição conservativa inclui uma substituição de um primeiro aminoácido alifático por um segundo aminoácido alifático diferente. Por exemplo, se um primeiro aminoácido é qualquer um de Gly;Ala; Pro; lie; Leu; Vai;; e Met, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre Gly; Ala; Pro; lie; Leu; Vai; e Met. Em exemplos particulares, se um primeiro aminoácido é qualquer um de Gly; Ala; Pro; lie; Leu; e Vai, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre Gly; Ala; Pro; lie; Leu; e Vai. Em exemplos particulares que envolvem a substituição de aminoácidos alifáticos hidrofóbicos, se um primeiro aminoácido é qualquer um de Ala; Pro; lie; Leu; e Vai, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre Ala; Pro; lie; Leu; e Vai.
[00111] Em algumas modalidades, uma substituição conservativa inclui uma substituição de um primeiro aminoácido aromático por um segundo aminoácido aromático diferente. Por exemplo, se um primeiro aminoácido é qualquer um de His; Phe; Trp; e Tyr, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre His; Phe; Trp; e Tyr. Em exemplos particulares que envolvem a substituição de aminoácidos aromáticos não carregados, se um primeiro aminoácido é qualquer um de Phe; Trp; e Tyr, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre Phe; Trp; e Tyr.
[00112] Em algumas modalidades, uma substituição conservativa inclui uma substituição de um primeiro aminoácido hidrofóbico por um segundo aminoácido hidrofóbico diferente. Por exemplo, se um primeiro aminoácido é qualquer um de Ala; Vai; lie; Leu; Met; Phe; Tyr; e Trp, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre Ala; Vai; lie; Leu; Met; Phe; Tyr; e Trp. Em exemplos particulares que envolvem a substituição de amino-ácidos não aromáticos hidrofóbicos, se um primeiro aminoácido é qualquer um de Ala; Vai; lie; Leu; e Met, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre Ala; Vai; lie; Leu; e Met.
[00113] Em outras modalidades, uma substituição conservativa inclui uma substituição de um primeiro aminoácido polar por um segundo aminoácido polar diferente. Por exemplo, se um primeiro aminoácido é qualquer um de Ser; Thr; Asn; Gin; Cys; Gly; Pro; Arg; His; Lys; Asp; e Glu, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre Ser; Thr; Asn; Gin; Cys; Gly; Pro; Arg; His; Lys; Asp; e Glu. Em exemplos particulares que envolvem a substituição de aminoácidos polares não carregados, se um primeiro aminoácido é qualquer um de Ser; Thr; Asn; Gin; Cys; Gly; e Pro, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre Ser; Thr; Asn; Gin; Cys; Gly; e Pro. Em exemplos particulares que envolvem a substituição de aminoácidos polares carregados, se um primeiro aminoácido é qualquer um de His; Arg; Lys; Asp; e Glu, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre His; Arg; Lys; Asp; e Glu. Em exemplos particulares que envolvem a substituição de aminoácidos polares positivamente carregados (básicos), se um primeiro aminoácido é qualquer um de His; Arg; e Lys, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre His; Arg; e Lys. Em exemplos adicionais que envolvem a substituição de aminoácidos polares positivamente carregados (básicos), se um primeiro aminoácido é Arg ou Lys, o primeiro aminoácido pode ser substituído por outro aminoácido de Arg ou Lys. Em exemplos particulares que envolvem a substituição de aminoácidos polares negativamente carregados (ácidos), se um primeiro aminoácido é Asp ou Glu, o primeiro aminoácido pode ser substituído por outro aminoácido de Asp ou Glu.
[00114] Em modalidades alternativas, uma substituição conservati-va inclui a substituição de um primeiro aminoácido eletricamente neutro por um segundo aminoácido eletricamente neutro diferente. Por exemplo, se um primeiro aminoácido é qualquer um de Gly; Ser; Thr; Cys; Asn; Gin; e Tyr, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre Gly; Ser; Thr; Cys; Asn; Gin; e Tyr.
[00115] Em outras modalidades ainda, uma substituição conservati-va inclui a substituição de um primeiro aminoácido não polar por um segundo aminoácido não polar diferente. Por exemplo, se um primeiro aminoácido é qualquer um de Ala; Vai; Leu; lie; Phe; Trp; Pro; e Met, o primeiro aminoácido pode ser substituído por um segundo aminoácido diferente selecionado entre Ala; Vai; Leu; lie; Phe; Trp; Pro; e Met.
[00116] Em vários exemplos, a seleção de um segundo aminoácido em particular a ser usado em uma substituição conservativa para substituir um primeiro aminoácido pode ser feita a fim de maximizar o número de classes precedentes as quais o primeiro e segundo aminoácidos pertencem. Portanto, se o primeiro aminoácido é Ser (um aminoácido polar, não aromático e eletricamente neutro), o segundo aminoácido pode ser outro aminoácido polar (isto é, Thr; Asn; Gin; Cys; Gly; Pro; Arg; His; Lys; Asp; ou Glu); outro aminoácido não aromático (isto é, Thr; Asn; Gin; Cys; Gly; Pro; Arg; His; Lys; Asp; Glu; Ala; lie; Leu; Vai; ou Met); ou outro aminoácido eletricamente neutro (isto é, Gly; Thr; Cys; Asn; Gin; ou Tyr). Entretanto, pode ser preferido que o segundo aminoácido nesse caso seja um de Thr; Asn; Gin; Cys; e Gly, por que esses aminoácidos compartilham todas as classificações de acordo com a polaridade, não aromaticidade e neutralidade elétrica. Critérios adicionais que podem ser opcionalmente usados para selecionar um segundo aminoácido particular para ser usado em uma substituição conservativa são conhecidos na técnica. Por exemplo, Thr; Asn; Gin; Cys; e Gly estão disponíveis para serem usados em uma substituição conservativa de Ser, Cys pode ser eliminado da seleção a fim de evitar a formação de reticulações e/ou ligações de dissulfeto indesejáveis. Igualmente, Gly pode ser eliminado da seleção por que ele carece de uma cadeia lateral alquila. Nesse caso, Thr pode ser selecionado, por exemplo, a fim de reter a funcionalidade de um grupo hidroxila da cadeia lateral. A seleção do segundo aminoácido em particular para ser usado em uma substituição conservativa está, em última análise, entretanto dentro do discernimento do pesquisador experiente.
[00117] Planta: A expressão "planta", como usada aqui inclui qualquer descendente, célula, tecido, semente, óleo de semente ou parte dessa.
[00118] Traço ou fenótipo: As expressões "traço" ou "fenótipo" são usadas aqui alternativamente. Para os propósitos da presente descrição, traços de interesse particular incluem traços agronomicamente importantes, que podem ser expressos, por exemplo, em uma planta cultivada (por exemplo, expressão de uma proteína inseticida). IV. Polinucleotídeo sintético que codifica um polipeptídeo de interesse [00119] Essa descrição fornece métodos para o planejamento de um polinucleotídeo sintético que codifique um polipeptídeo de interes- se, por exemplo, para aumentar a expressão do polipeptídeo de interesse em uma célula ou organismo hospedeiro heterólogo. Em algumas modalidades do mesmo, um polinucleotídeo que codifique um polipeptídeo de interesse é manipulado, em que o polinucleotídeo sintético é derivado de um gene de referência que contém pelo menos uma sequência de poliadenilação (por exemplo, pelo menos uma sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATAC AT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA). Por exemplo, o polinucleotídeo sintético pode compreender pelo menos uma sequência de poliadenilação do gene de referência na mesma quantidade e na mesma localização da sequência codi-ficadora.
[00120] Modalidades fornecem polinucleotídeos sintéticos que codificam um polipeptídeo de interesse que tenha sido manipulado de acordo com o precedente. Tais polinucleotídeos sintéticos podem ser particularmente bem adequados para uso na expressão do polipeptídeo de interesse em uma célula de planta transgênica ou tecido de planta transgênica ou planta que compreenda tal célula de planta.
[00121] Métodos de modalidades particulares do mesmo podem ser usados para manipular uma sequência de ácido nucleico sintético para uma variedade de razões conhecidas por aqueles versados na técnica; por exemplo, para aumentar a expressão, para adaptar a sequência de ácido nucleico a ser expressa em uma nova célula hospedeira ou organismo e para introduzir mutações funcionais e/ou não funcionais em um polipeptídeo codificado. Tipicamente, em modalidades onde um polipeptídeo de interesse é um produto de gene que ocorre naturalmente ou porção de um produto de gene que ocorre naturalmente (por exemplo, um domínio isolado de proteína), um polinucleotídeo de referência que ocorre naturalmente que codifica o polipeptídeo pode ser obtido, por exemplo, pela pesquisa de bancos de dados de genoma ou pela clonagem a partir de uma fonte genômica. Em vários casos, homólogos ou ortólogos de tais polinucleotídeos de referência que ocorrem naturalmente também podem ser encontrados nos genomas de outros organismos. Em modalidades, polinucleotídeos sintéticos que codificam todo ou parte do polipeptídeo de interesse podem ser designados ou derivados de um polinucleotídeo de referência que codifique qualquer polipeptídeo de interesse. Em modalidades particulares, o polinucleotídeo de referência compreende pelo menos uma sequência de poliadenilação.
[00122] Em modalidades, um polipeptídeo de interesse pode ser qualquer proteína ou polipeptídeo que ocorra na natureza ou qualquer variante que ocorre naturalmente incluindo, por exemplo e sem limitação, formas processadas de tais proteínas. O polipeptídeo de interesse pode ser uma proteína formada pela combinação de porções ou fragmentos de mais do que uma proteína que ocorre naturalmente, tal como pela misturação e combinação de domínios funcionais de proteína. Ácidos nucleicos sintéticos de certas modalidades codificam poli-peptídeos de interesse que são, por exemplo e sem limitação, proteínas inseticidas (por exemplo, de Bacillus thuringiensis)·, produtos de expressão de genes de tolerância ao herbicida, estresse hídrico e/ou calor; proteínas envolvidas na produção, armazenamento e/ou metabolismo de óleo de planta; e/ou produtos de expressão de genes marcadores. Em algumas modalidades, um polipeptídeo de interesse é aquele para o qual sua expressão em uma planta resulta em um fenó-tipo que é um traço agronômico ou é uma proteína repórter útil para a introgressão ou introdução de traços agronômicos.
[00123] Proteínas inseticidas, por exemplo, aquelas com atividade contra pragas veiculadas por Lepidópteros, são uma ferramenta extremamente importante no melhoramento da cultura. A proteína CrylAb de Bacillus thuringiensis tem demonstrado atividade contra Ostrinia nubilalis (broca do milho europeu (ECB)) e Helicoverpa zea (larva da traça do milho (CEW)) usando ensaios baseados em dieta in vitro. CrylAb é uma forma ativa estabilizada da proteína que é utilizada atualmente no produto SMART STAX™ resistente a inseto. HERCULEX® também é uma ferramenta agrícola bem sucedida. O ingrediente ativo de HERCULEX™, a proteína CrylFa na forma truncada, tem demonstrado ser eficaz contra várias pragas do milho, incluindo Spodoptera frugiperda (lagarta de cartucho (FAW)), Ostrinia nubilalis (broca do milho europeu (ECB)), e Helicoverpa zea (larva da traça do milho (CEW)).
[00124] Os insetos podem desenvolver resistência à atividade de toxinas Cry através de alterações nos receptores localizados no intestino médio que se ligam à toxina Cry truncada. Van Rie et al. (1990) Science 247(4938):72-4; Heckel et al. (2007) J. Invert. Pathol. 95(3):192-7. Um método para evitar ou retardar o desenvolvimento de resistência às toxinas Cry em insetos é expressar múltiplas toxinas na planta que possuem modos de ação diferentes. Roush (1998) Philos. Trans. B 353:1777-86; Ives et al. (2011) Ecol. Appl. 21(2):503-15. Modalidades do mesmo utilizam CrylAb e/ou CrylFa como polipeptídeos de resistência de inseto como parte de uma estratégia de manuseio de inseto para prolongar a atividade de um traço de resistência a inseto em uma planta. Tal método pode fornecer uma vantagem particular no retardo do desenvolvimento de resistência a toxina de pragas de inseto.
[00125] Em algumas modalidades, uma sequência de gene nati-vo/de tipo selvagem que codifica um polipeptídeo de interesse é identificada e/ou fornecida e subsequentemente analisada para determinar se as sequências de sinal de poliadenilação estão presentes. Em modalidades particulares, uma etapa na manipulação de um polinucleotí- deo sintético que expresse o polipeptídeo de interesse inclui reduzir no polinucleotídeo (com relação ao gene de referência) o número de sequências indesejáveis de sinal de poliadenilação, selecionadas do grupo que consiste em ATATAT, TTGTTT, TTTTGT, TGTTTT, TATATA, TATTTT, TTTTTT, ATTTTT, TTATTT, TTTATT, TAATAA, ATTTAT, TATATT, TTTTAT, ATATTT, T ATT AT, TGTTTG, TTATAT, TGTAAT, AAATAA, ATTTTT, TATTTT, TTATTT, TTTATT, TTTTTT, TTTTAT, AATTTT, TTTTTA, TAATTT, TTAATT, AAATTT, AAATAA, ATATTT, TTTGTT, TTGTTT, ATATAT, ATTATT, ΑΤΤΤΤΑ,ΤΤΤΑΑΤ, e TTTTAA. Em modalidades particulares, ocorrências da sequência de Shaw-Kamen, ATTTA, também são removidas.
[00126] Técnicas conhecidas na tecnologia de DNA recombinante podem ser usadas em certas modalidades para aperfeiçoar o controle da expressão de polinucleotídeos heterólogos, por exemplo e sem limitação pela manipulação do número de cópias dos polinucleotídeos dentro da célula hospedeira; pela manipulação da eficiência com a qual esses polinucleotídeos são transcritos; pela manipulação da eficiência com a qual os transcritos resultantes são traduzidos; e pela manipulação da eficiência das modificações pós-traducional. Por meio de um exemplo adicional, as sequências promotoras podem ser geneticamente manipuladas para melhorar o nível de expressão no hospedeiro, quando comparadas com a promotora de referência. Portanto, tais técnicas úteis para controlar a expressão dos polinucleotídeos incluem, por exemplo e sem limitação, a integração dos polinucleotídeos em um ou mais cromossomos da célula hospedeira; adição de sequências de estabilidade do vetor para plasmídeos; substituições ou modificações de sinais de controle da transcrição (por exemplo, promotores, operadores e intensificadores); substituições ou modificações de sinais de controle da tradução (por exemplo, sítios de ligação ao ribossomo e sequências de Shine-Dalgarno); modificação dos polinu- cleotídeos para corresponder a utilização de códon da célula hospedeira; e deleção de sequências que desestabilizam os transcritos.
[00127] Fatores que podem afetar a taxa de alongamento traducio-nal de um polipeptídeo de interesse durante a síntese incluem, por exemplo, o nível de tRNAs carregados (Elf et al. (2003) Science 300:1718-22), que depende das concentrações de tRNA, taxas de carregamento de tRNA e disponibilidade de aminoácido. Por exemplo, a pausa traducional induzida por um códon raro (ou não preferido) de acordo com o desvio de utilização de códon do organismo hospedeiro pode reduzir a taxa de expressão de proteína heteróloga. Uma pausa traducional induzida por um códon raro inclui a presença de códons no polinucleotídeo de interesse que são raramente usados no organismo hospedeiro e podem ter um efeito negativo sobre a tradução de proteína devido a sua escassez no pool de tRNA disponível. Esses fatores também incluem a taxa de seleção de tRNA ribossômico (taxa de de-codificação), que depende de: da força de interação do códon-anticódon; do códon precedente (sítio do códon P); da oscilação da base do códon precedente; e da oscilação da base do códon a ser lido. Fatores que podem afetar a fidelidade ribossômica incluem aqueles que influenciam mudanças de fase ribossômicas, tais como fitas de homopolímeros, ilhas de G/C, ilhas de A/T e fitas de homopolímeros próximas de sítios de pausa. Além disso, alguns polipeptídeos podem estar impedidos no canal de saída ribossômico, o que depende em parte da sequência dos 10 a 20 aminoácidos iniciais do polipeptídeo. Em vista do precedente, um método de aperfeiçoamento da tradução ótima em um organismo hospedeiro inclui realizar a otimização do códon, o que pode resultar em códons hospedeiros raros a serem modificados em um polinucleotídeo sintético.
[00128] Portanto, em adição à remoção de sequências de sinal de poliadenilação indesejáveis e sequências de Shaw-Kamen, os polinu- cleotídeos sintéticos do mesmo podem ser manipulados para utilizar códons aproximadamente na mesma frequência na qual eles são utilizados, em média, nos genes que ocorrem naturalmente em espécies de plantas nas quais o polinucleotídeo sintético será expresso. Em algumas modalidades, o processo de manipulação do polinucleotídeo sintético compreende otimizar a sequência do códon pela substituição dos códons raros na sequência pelos códons preferidos e pela preservação de certas sequências de poliadenilação na sequência codifica-dora.
[00129] A Tabela 1 fornece percentuais-alvos exemplificadores de utilização de códons em genes sintéticos pretendidos para uso no milho e na soja. Esses percentuais podem ser usados, por exemplo, na ausência de dados de utilização de códon mais específicos, assim como em dicotiledôneas de modo geral ou em plantas de modo geral. Tabela 1. Composições-alvo redimensionadas de códon de genes de planta sintéticos.
[00130] Em algumas modalidades, os métodos descritos envolvem a otimização da sequência de nucleotídeos de um polinucleotídeo, tal que a estrutura primária de um polipeptídeo codificado esteja inalterada. A estrutura de um polipeptídeo codificado é determinada, em sua maior extensão, pela sequência de aminoácidos do polipeptídeo. Portanto, uma estrutura desejada para um polipeptídeo codificado coloca limitações sobre sua sequência codificadora de polinucleotídeo, que são determinadas pela degeneração do código genético e utilização de códon padronizada. Em certas modalidades da invenção, um polinu-cleotídeo sintético é manipulado in silico, tal que o polinucleotídeo compreenda uma sequência de códon otimizado específica selecionada do espaço de códon que codifica todo ou parte do polipeptídeo de interesse, em que o número e a localização de certas sequências de poliadenilação estão preservados do polinucleotídeo nativo para o polinucleotídeo sintético. A incorporação da sequência de polinucleotídeo específica que é selecionada pode evitar certos problemas associados com as sequências de nucleotídeos heterólogas que codificam os poli-peptídeos e pode obter uma ou mais propriedades desejadas (por exemplo, expressão intensificada) quando comparadas com polinucle-otídeos que têm meramente o códon otimizado, por exemplo, pela referência ao desvio de utilização de códon de um organismo hospedeiro de expressão.
[00131] Uma variedade de métodos está disponível para aqueles versados na técnica para otimizar a sequência codificadora de uma molécula de ácido nucleico (por exemplo, um polinucleotídeo que codifique um polipeptídeo de interesse) de acordo com parâmetros predeterminados. Por exemplo, um técnico experiente pode otimizar uma sequência de códon pela inspeção, por exemplo, para melhor se adaptar ao desvio de utilização de códon de um organismo hospedeiro de expressão. Mais comumente, um programa implementado por computador pode ser usado para otimizar uma sequência codificadora. Tais programas podem compreender um ou mais algoritmos que otimizam fatores selecionados do grupo que compreende: fatores que podem afetar a expressão de um polipeptídeo codificado de interesse; fatores que podem afetar a taxa de iniciação da tradução de um transcrito; e fatores que podem afetar a taxa de alongamento traducional do polipeptídeo codificado ou seu precursor. Consequentemente, em algumas modalidades, um polinucleotídeo de referência pode ser importa- do para um programa implementado por computador que seja capaz de otimizar uma sequência codificadora de acordo com parâmetros predeterminados. Exemplos particulares de tais programas incluem, sem limitação, OptGene™ (Ocimum Biosolutions), Accelrys GCG™ (Accelrys Software, Inc.), OPTIMIZER™ (disponibilizado para uso público na internet em genomes.urv.es/OPTIMIZER), e OptimumGene™ (GenScript).
[00132] Em algumas modalidades, a sequência de aminoácidos de um polipeptídeo de interesse pode ser usada diretamente para obter uma sequência de polinucleotídeo com códon otimizado. Em modalidades particulares, a sequência de aminoácidos do polipeptídeo de interesse (por exemplo, fornecida diretamente) pode ser usada para deduzir um polinucleotídeo com códon otimizado que codifique a sequência de aminoácidos (por exemplo, tradução reversa in silico), por exemplo, pelo uso de um programa implementado por computador que é capaz de otimizar uma sequência codificadora de acordo com parâmetros predeterminados. Em exemplos específicos, um polinucleotídeo com códon otimizado pode ser deduzido usando o código genético padronizado e uma tabela de desvio de utilização de códon apropriado para um organismo hospedeiro de expressão. Pode ser desejável em algumas modalidades deduzir múltiplos polinucleotídeos com códon otimizado que codifiquem cada polipeptídeo de interesse. Portanto, em exemplos particulares, um polipeptídeo de interesse pode ser usado para deduzir um conjunto de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ou mais sequências de ácido nucleico com códon otimizado que codificam o polinucleotídeo de interesse. Em algumas modalidades, polinucleotídeos com códon otimizado deduzidos que codificam o polipeptídeo de interesse podem ser exportadas em arquivos de texto por um programa implementado por computador ou registrados de outra maneira pelo profissional. Por exemplo, um pro- grama implementado por computador pode exportar em um número correspondente de arquivos de texto, um conjunto completo de polinu-cleotídeos com códon otimizado deduzidos que codificam um único polipeptídeo de interesse.
[00133] Em outras modalidades, polinucleotídeos com códon otimizado que codificam um polipeptídeo de interesse podem ser alinhados pela homologia de sequência. Em exemplos particulares, um ou mais polinucleotídeos com códon otimizado deduzidos que correspondem a todas as sequências de poliadenilação do polipeptídeo de interesse são alinhados com um polinucleotídeo nativo que codifica o polipeptídeo de interesse. Em exemplos particulares, as sequências de ácido nucleico com códon otimizado deduzido correspondem a segmentos de regiões codificadoras de proteína e os alinhamentos podem ser realizados sem a permissão de "lacunas".
[00134] De acordo com o precedente, os métodos podem ser usados para fornecer um único polinucleotídeo com códon otimizado que codifica um polipeptídeo de interesse. Em exemplos particulares, pode ser usado um método para fornecer um conjunto de polinucleotídeos únicos com códon otimizado, cada um dos quais o polipeptídeo de interesse.
[00135] Em algumas modalidades, uma sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, AT AC AT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA pode ser incorporada em um polinucleotídeo otimizado que codifica um polipeptídeo de interesse completo, tal que a sequência de poliadenilação selecionada é incorporada na posição nativa da sequência de poliadenilação particular em uma sequência de ácido nucleico nativa que codifica o polipeptídeo de interesse, enquanto que a fase de leitura correta para o polipeptídeo de interesse é mantida. Por exemplo, todos os membros do conjunto de sequências de poliadeni-lação nativa selecionadas do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, AT AC AT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA, podem ser, cada um, incorporado em um polinucleotídeo otimizado que codifica o polipeptídeo de interesse completo, tal que todos os membros do grupo são incorporados em suas posições nativas da sequência de poliadenilação particular no polinucleotídeo completo. Portanto, algumas modalidades do mesmo podem ser usadas para produzir polinucleotídeos sintéticos que codificam o polipeptídeo de interesse, em que cada sequência de poliadenilação do polinucleotídeo nativo está presente na mesma posição do polinucleotídeo otimizado sintético alinhado.
[00136] A otimização de um ácido nucleico pode incluir, por exemplo, etapas para aperfeiçoar a habilidade do hospedeiro de produzir uma proteína heteróloga, assim como etapas para auxiliar um pesquisador a planejar eficientemente um construto de expressão. Fatores que podem ser considerados durante a otimização de um ácido nucleico podem incluir, sem limitação: fatores que podem afetar a expressão de um polipeptídeo codificado de interesse; fatores que podem afetar a taxa de iniciação da tradução de um transcrito; e fatores que podem afetar a taxa de alongamento traducional do polipeptídeo codificado ou seu precursor. A seleção de qual dos mesmos fatores a ser considerado durante o projeto de um conjunto de sequências com códon otimizado está dentro do conhecimento do profissional versado na técnica.
[00137] Fatores que podem afetar a expressão de um polipeptídeo de interesse que é codificado pelo polinucleotídeo podem ser influenciados pelos códons particulares escolhidos para codificar os aminoá-cidos do polipeptídeo. Fatores que afetam a taxa de produção de mRNA a partir do modelo de sequência de ácido nucleico podem inclu- ir: o tipo de RNA poiimerase usada para a transcrição; o nível de RNA polimerase presente no sistema de expressão; e a sequência promotora da transcrição usada. Os níveis de mRNA também podem ser afetados pela taxa de degradação do mRNA, o que por sua vez pode ser influenciado pelos motivos que desestabilizam o mRNA; sequências de reconhecimento de RNAse; e sinais de adição de poliA. Os níveis de mRNA também podem ser afetados pelas estruturas de mRNA no sítio de iniciação da tradução, no sítio de ligação ao ribossomo, no có-don de partida e/ou em torno dos 10 a 50 códons iniciais da sequência codificadora (ou em qualquer lugar dentro ou acompanhando a fase de leitura aberta); motivos de terminação transcricional presentes antes ou dentro da fase de leitura aberta; e sinais dentro da sequência transcrita tais como aqueles que direcionam, alteram ou modificam o spli-cing do mRNA e/ou a exportação nuclear. Um exemplo particular de um fator que afeta a taxa de produção do mRNA a partir de uma sequência de modelo é o escorregamento da polimerase induzido pela repetição de nucleotídeo. O escorregamento da polimerase induzido pela repetição de nucleotídeo envolve repetições de sequência de nucleotídeo que mostraram causar o escorregamento ou hesitação da DNA polimerase que pode resultar em mutações de mudança de fase. Tais repetições de nucleotídeos também podem causar o escorregamento da RNA polimerase. Por exemplo, em um organismo com um desvio elevado do conteúdo de G+C, pode haver um alto grau de repetição dos nucleotídeos G ou C. Portanto, um método de reduzir a possibilidade de indução de escorregamento de RNA polimerase inclui alterar as repetições estendidas de nucleotídeos G ou C.
[00138] A iniciação traducional alternada e estruturas secundárias que interferem no RNA podem afetar a taxa de iniciação traducional de um transcrito particular. A iniciação transcricional alternada pode ocorrer em uma sequência de polinucleotídeo sintético que contenha inad- vertidamente um ou mais motivos capazes de funcionar como um sítio de ligação ao ribossomo (RBS). Esses sítios podem resultar na iniciação da tradução de uma proteína truncada a partir de um sítio interno do gene. Um método para reduzir a possibilidade de produção de uma proteína truncada, que pode ser difícil de remover durante a purificação, inclui a modificação de sequências de RBS internas putativas a partir de um polinucleotídeo otimizada. As estruturas secundárias de interferência podem sequestrar a sequência de RBS ou códon de iniciação e têm sido correlacionadas com uma redução na expressão da proteína. Estruturas de haste-alça também podem estar envolvidas na pausa e atenuação transcricional. Um polinucleotídeo otimizado pode então conter estruturas secundárias mínimas no RBS e regiões codifi-cadoras do gene para permitir a transcrição e tradução aperfeiçoadas.
[00139] Outra classe de elementos da sequência de polinucleotídeo que podem afetar a expressão de proteína heteróloga inclui sítios de restrição. Portanto, a otimização de um polinucleotídeo pode incluir a modificação dos sítios de restrição que podem, por exemplo, interferir com a sub-clonagem subsequente de unidades de transcrição em vetores de expressão no hospedeiro.
[00140] Toda ou uma porção de uma sequência de polinucleotídeos pode ser otimizada. Em alguns exemplos, uma modulação desejada da expressão pode ser desejada pela otimização essencialmente de um gene completo, enquanto se preserva certas sequências de polia-denilação no gene nativo. Em outros exemplos, uma modulação desejada pode ser obtida pela otimização de parte, mas não de todo um gene. O ponto de partida para tal otimização pode ser uma sequência codificadora que consista apenas nos códons comumente usados ou preferidos, de acordo com o desvio de utilização do códon do hospedeiro de expressão ou uma sequência codificadora que contenha uma mistura de códons comuns e não comuns. A otimização de um polinu- cleotídeo pode afetar negativamente ou positivamente a expressão de um gene ou a produção de uma proteína. Por exemplo, a substituição de um códon raro ou não preferido com um códon mais comum pode afetar a meia-vida de uma molécula de mRNA transcrita a partir da sequência que compreende o códon substituído ou alterar sua estrutura pela introdução de uma estrutura secundária que interfere com sua tradução. Portanto, pode ser necessário, em certos exemplos, alterar adicionalmente um polinucleotídeo otimizado.
[00141] Dentro de algumas modalidades, um polinucleotídeo sintético que compreende sequências de códon otimizadas que codificam um polipeptídeo de interesse, enquanto preserva certas sequências de poliadenilação do gene nativo pode compreender mais do que uma sequência otimizada. Por exemplo, tal polinucleotídeo pode codificar um polipeptídeo de fusão que compreende polipeptídeos múltiplos como aqui descritos ou que compreende pelo menos um polipeptídeo como aqui descrito e uma sequência não relacionada. Os polipeptídeos de fusão podem ser preparados usando técnicas padronizadas, incluindo a conjugação química, de modo a permitir a tradução em um único polipeptídeo de fusão que retém pelo menos uma atividade biológica de ambos polipeptídeos componentes. Uma sequência ligante peptídica pode ser empregada para separar os componentes de polipeptídeo de um polipeptídeo de fusão por uma distância suficiente para assegurar que cada polipeptídeo enovele nas estruturas secundárias e terciárias apropriadas. Tal sequência ligante de polipeptídeo pode estar incorporada no polipeptídeo de fusão usando técnicas apropriadas bem conhecidas.
[00142] Em várias modalidades, regiões não codificadoras de uma molécula de ácido nucleico que compreende um polinucleotídeo que codifica um polipeptídeo de interesse também podem ser otimizadas. Por exemplo, pode ser desejável incluir certas sequências não codifi- cadoras a montante, a jusante ou dentro (por exemplo, íntrons) do po-linucleotídeo sintético. Portanto, em algumas modalidades, as sequências de quaisquer sequências não codificadoras incluídas em uma molécula de ácido nucleico que compreende um polinucleotídeo sintético pode ser levada em consideração nos métodos do mesmo.
[00143] Ácidos nucleicos que compreendem um polinucleotídeo sintético que codifica um polipeptídeo de interesse podem ser expressos para uso em uma variedade de aplicações, por exemplo, para produzir um polipeptídeo recombinante; para desenvolver um novo sistema de expressão; para comparar as propriedades de expressão com aquelas de outras sequências de ácido nucleico; e para aplicações de diagnóstico. V. Expressão de uma sequência de ácido nucleico com códon otimizado, divergido [00144] Algumas modalidades do mesmo fornecem métodos para a obtenção de um fenótipo ou traço desejáveis em uma célula de planta, tecido de planta, material de planta, e/ou planta completa, por um processo que compreende introduzir um polinucleotídeo sintético que codifica um polipeptídeo de interesse em uma célula de planta, de modo a expressar o polipeptídeo de interesse na célula. Em modalidades particulares, o polipeptídeo de interesse é um polipeptídeo heterólogo não normalmente encontrado na célula.
[00145] Construtos de ácido nucleico (por exemplo, vetores) que compreendem um polinucleotídeo sintético que codifica um polipeptídeo de interesse podem ser empregados em modalidades particulares para a transformação de um hospedeiro de expressão, em que o cons-truto pode ser integrado no genoma do hospedeiro de expressão. O construto pode compreender pelo menos regiões de iniciação e terminação transcricional e traducional e o polinucleotídeo sintético pode ser posicionado entre as regiões de iniciação e terminação e sob seu controle regulatório. O construto pode compreender um marcador de seleção e/ou outras sequências funcionais, por exemplo e sem limitação, sequências homólogas para a integração no genoma hospedeiro, sequências que hibridizam aos iniciadores de PCR; e sítios de restrição.
[00146] Em algumas modalidades, um hospedeiro de expressão pode ser uma célula de planta, tal como, por exemplo, uma célula de planta em uma cultura de tecido de planta ou planta completa. Modalidades da invenção podem incluir células de planta de qualquer tecido ou onde quer que eles sejam encontrados, incluindo mas não limitados a em embriões, células meristemáticas, calos, pólen, folhas, anteras, raízes, pontas de raiz, flores, sementes, vagens, caules e cultura de tecido. Um polinucleotídeo sintético pode ser incorporado em um vetor apropriado e introduzido em uma célula de planta por qualquer método conhecido daqueles versados na técnica. Por exemplo, uma molécula de ácido nucleico pode ser introduzida em uma célula de planta por métodos que incluem, sem limitação, a transfecção com vetores virais, transformação com vetores de plasmídeo, eletroporação (Fromm et al. (1986) Nature 319:791-3), lipofecção (Felgner et al. (1987) Proc. Natl. Acad. Sei. USA 84:7413-7), microinjeção (Mueller et al. (1978) Cell 15:579-85), transferência mediada por Agrobacterium (Fraley et al. (1983) Proc. Natl. Acad. Sei. USA 80:4803-7), absorção direta de DNA e bombardeio com microprojétil (Klein et al. (1987) Nature 327:70).
[00147] Em outras modalidades, um vetor que compreende um polinucleotídeo sintético pode ser introduzido em uma parte particular de uma célula de planta (por exemplo, através de bombardeio de nano-partícula). Exemplos de partes particulares de células de planta nas quais uma molécula de ácido nucleico pode ser introduzida incluem, mas não são limitadas a citossol, núcleo, tonoplastos, plastídeos, etio-plastos, cromoplastos, leucoplastos, elaioplastos, proteinoplastos, ami- loplastos, cloroplastos e a luz de uma membrana dupla.
[00148] A transformação da célula (incluindo a transformação de célula de planta) pode envolver a construção de um vetor de expressão que funcionará em uma célula particular. Tal vetor pode compreender DNA que inclui um gene sob o controle de, ou operativamente ligado a um elemento regulatório (por exemplo, um promotor). O vetor de expressão pode conter um ou mais de tais combinações de ge-ne/elemento regulatório operativamente ligados. Os vetores podem estar na forma de um plasmídeo e podem ser usados sozinhos ou em combinação com outros plasmídeos para fornecer células transformadas que usam métodos de transformação como aqui descritos para incorporar transgene(s) no material genético de uma célula de planta.
[00149] Vetores de expressão em célula de planta podem incluir pelo menos um marcador genético, operativamente ligado a um elemento regulatório (um promotor, por exemplo) que permite às células transformadas que contêm o marcador serem recuperadas pela seleção negativa (isto é, inibindo o crescimento das células que não contêm o gene marcador selecionável) ou pela seleção positiva (isto é, rastreando o produto codificado pelo marcador genético). Vários genes marcadores selecionáveis adequados para a transformação em planta são bem conhecidos nas técnicas de transformação e incluem, por exemplo, genes que codificam enzimas que purificam metabolicamen-te um agente químico seletivo que pode ser um antibiótico ou um herbicida, ou genes que codificam um alvo alterado que pode ser insensível ao inibidor. Alguns métodos de seleção positiva também são conhecidos na técmica. Em algumas modalidades, genes marcadores selecionáveis adequados para transformação em planta podem incluir: o gene de neomicina fosfotransferase II (nptll) sob o controle de sinais regulatórios de planta, que confere resistência a canamicina (Veja, por exemplo, Fraley et ai (1983) Proc. Natl. Acad. Sei. U.S.A. 80:4803); o gene de higromicina fosfotransferase, que confere resistência ao antibiótico higromicina (Veja, por exemplo, Vanden Elzen et al. (1985) Plant Mol. Biol., 5:299); genes marcadores de origem bacteriana que conferem resistência aos antibióticos, incluindo gentamicina acetil transferase, estreptomicina fosfotransferase, aminoglicosideo-3'-adenil transferase, e o determinante de resistência à bleomicina (Veja Hayford et al. (1988) Plant Physiol. 86:1216; Jones et al. (1987) Mol. Gen. Genet. 210:86; Svab et al. (1990) Plant Mol. Biol. 14:197; e Hille et al. (1986) Plant Mol. Biol. 7:171); genes marcadores que conferem resistência a herbicidas tais como glifosato, glifosinato ou bromoxynil (Veja Cornai et al. (1985) Nature 317:741-744; Gordon-Kamm et al. (1990) Plant Cell 2:603-618; e Stalker et al. (1988) Science 242:419-423); e genes marcadores de origem não bacteriana, por exemplo, di-hidrofolato redutase de camundongo, 5-enolpiruvilchiquimato-3-fosfate sintase de planta, e acetolactato sin-tase de planta (Veja Eichholtz et al. (1987) Somatic Cell Mol. Genet. 13:67; Shah et al. (1986) Science 233:478; and Charest et al. (1990) Plant Cell Rep. 8:643).
[00150] Outra classe de genes marcadores adequados para a transformação em planta requer o rastreamento de células de planta presumivelmente transformadas mais do que a seleção genética direta de células transformadas para resistência a uma substância tóxica, tal como um antibiótico. Esses genes podem ser particularmente úteis para quantificar ou visualizar o padrão espacial de expressão de um gene em tecidos específicos e eles são frequentemente referidos como genes repórter, por que eles podem ser fundidos a um gene ou sequência regulatória de gene para investigação da expressão do gene. Genes comumente usados para o rastreamento de células transformadas incluem β-glicuronidase (GUS), β-galactosidase, luciferase, e cloranfenicol acetiltransferase. Veja Jefferson (1987) Plant Mol. Biol.
Rep. 5:387; Teeri et al. (1989) EMBO J. 8:343; Koncz et al. (1987) Proc. Natl. Acad. Scí. U.S.A. 84:131; e DeBlock et al. (1984) EMBO J. 3:1681. Métodos estão disponíveis para visualizar a atividade de GUS in vivo que não requerem a destruição do tecido de planta. Molecular Probes publication 2908 (1993) IMAGENE GREEN™, pp. 1-4; e Nale-way et al. (1991) J. Cell Biol. 115:151. Genes que codificam proteínas fluorescentes (por exemplo, GFP, EGFP, EBFP, ECFP, e YFP) também têm sido utilizados como marcadores para a expressão de gene em células procarióticas e eucarióticas. Veja Chalfie et al. (1994) Science 263:802. Portanto, proteínas fluorescentes e mutações de proteínas fluorescentes podem ser usadas como marcadores rastreáveis.
[00151] A expressão de um polinucleotídeo sintético incluído em um vetor de expressão em planta pode ser dirigida por uma sequência de nucleotídeos que compreenda um elemento regulatório, por exemplo, um promotor. Vários tipos de promotores úteis em células de plantas são bem conhecidos na técnica da transformação, assim como outros elementos regulatórios que podem ser usados sozinhos ou em combinação com tais promotores.
[00152] A expressão "promotor" se refere a uma região do DNA que pode estar a montante do início da transcrição e que pode estar envolvida no reconhecimento e na ligação da RNA polimerase e outras proteínas para iniciar a transcrição. Um "promotor de planta" pode ser um promotor capaz de iniciar a transcrição em células de planta. Exemplos de promotores sobre controle desenvolvimentista incluem promotores que preferencialmente iniciam a transcrição em certos tecidos, por exemplo, em folhas, raízes, sementes, fibras, vasos do xilema, tra-queídes ou esclerênquima. Tais promotores são referidos como "preferidos para o tecido". Promotores que iniciam a transcrição apenas em certos tecidos são referidos como "específicos para o tecido". Um promotor "específico para o tipo celular" dirige primariamente a ex- pressão em certos tipos de célula em um ou mais órgãos, por exemplo, células vasculares em raízes ou folhas. Um "promotor induzível" é um promotor que pode estar sob controle ambiental. Exemplos de condições ambientais que podem afetar a transcrição pelos promotores induzíveis incluem, sem limitação, condições anaeróbicas ou a presença de luz. Promotores específicos para o tecido, preferidos para o tecido, específicos para o tipo celular e induzíveis constituem a classe de promotores "não constitutivos". Um promotor "constitutivo" é um promotor que pode ser ativo sob a maioria das condições ambientais.
[00153] Um promotor induzível pode estar operativamente ligado a uma sequência de nucleotídeos otimizada da invenção para expressão em uma célula. Opcionalmente, um promotor induzível pode estar operativamente ligado a uma sequência de nucleotídeos que codifica uma sequência de sinal, que pode estar operativamente ligada a uma sequência de nucleotídeos da invenção para expressão em uma célula. A taxa de transcrição de uma sequência de nucleotídeos operativamente ligada a um promotor induzível pode aumentar em resposta a um agente de indução. Qualquer promotor induzível pode ser usado na presente invenção. Veja Ward et al. (1993) Plant Mol. Biol. 22:361-366. Promotores induzíveis exemplificadores incluem, mas não são limitados a: aqueles do sistema ACEI que responde ao cobre (Mett et al. (1993) Proc. Natl. Acad. Sei. U.S.A. 90:4567-71); gene In2 do milho que responde aos fitoprotetores de herbicida benzenosulfonami-da (Hershey et al. (1991) Mol. Gen Genetics 227:229-37; and Gatz et al. (1994) Mol. Gen. Genetics 243:32-8); r o repressor Tet de Tn10 (Gatz et al. (1991) Mol. Gen. Genetics 227:229-37). Um promotor induzível particularmente útil pode ser um promotor que responda a um agente de indução ao qual as plantas não respondem normalmente. Um promotor induzível exemplificador pode ser um promotor induzível de um gene de hormônio esteroide, cuja atividade transcricional pode ser induzida por um hormônio glicorticosteróide. Schena et al. (1991) Proc. Natl. Acad. Sei. U.S.A. 88:10421-5.
[00154] Alternativamente, um promotor constitutivo pode estar operativamente ligado a um polinucleotídeo sintético para expressão em uma célula ou o promotor constitutivo pode estar operativamente ligado a uma sequência de nucleotídeos que codifica uma sequência de sinal que pode estar operativamente ligado a um polinucleotídeo sintético para expressão em uma célula. Promotores constitutivos diferentes podem ser utilizados na presente invenção. Promotores constitutivos exemplificadores incluem, mas não são limitados a: promotores de vírus de planta, tais como o promotor 35S de CaMV (Odell et al. (1985) Nature 313:810-2); promotores do gene de actina do arroz (McElroy et al. (1990) Plant Cell 2:163-71); ubiquitina (Christensen et al. (1989) Plant Mol. Biol. 12:619-32; e Christensen et al. (1992) Plant Mol. Biol. 18:675-89); pEMU (Last et al. (1991) Theor. Appl. Genet. 81:581-8); MAS (Velten et al. (1984) EMBO J. 3:2723-30); histona H3 do milho (Lepetit et al. (1992) Mol. Gen. Genetics 231:276-85; e Atanassova et al. (1992) Plant Journal 2(3):291-300). O promotor ALS, fragmento 5’ Xba1/Ncol para o gene estrutural ALS3 de Brassica napus (ou uma sequência de nucleotídeos com similaridade ao dito fragmento Xba1/Ncol), representa um promotor constitutivo particularmente útil. Veja Publicação de Patente Internacional PCT No. WO 96/30530.
[00155] Um promotor específico para o tecido pode ser alternativamente operativamente ligado a um polinucleotídeo sintético para expressão em uma célula. Opcionalmente, o promotor específico para o tecido pode estar operativamente ligado a uma sequência de nucleotí-deo que codifica uma sequência de sinal que pode estar operativamente ligada a um polinucleotídeo sintético para a expressão em uma célula. Plantas transformadas com um polinucleotídeo sintético operativamente ligado a um promotor específico para o tecido podem produ- zir um produto de proteína do polinucleotídeo sintético exclusivamente ou preferencialmente em um tecido específico. Qualquer promotor específico para o tecido ou preferido para o tecido pode ser utilizado em modalidades particulares. Promotores específicos para o tecido ou preferidos para o tecido exemplifícadores incluem, mas não são limitados a: um promotor preferido para raiz, tal como o gene de faseolina (Murai et ai (1983) Science 23:476-82; e Sengupta-Gopalan et ai (1985) Proc. Natl. Acad. Sei. U.S.A. 82:3320-4); um promotor específico para a folha e induzido pela luz tal como aquele de cab ou rubisco (Simpson et ai (1985) EMBO J. 4(11 ):2723-9; e Timko et ai (1985) Nature 318:579-82); um promotor específico para antera tal como aquele de LAT52 (Twell et ai (1989) Mol. Gen. Genetics 217:240-5); um promotor específico para o pólen tal como aquele de Zm13 (Guer-rero et ai (1993) Mol. Gen. Genetics 244:161-168); e um promotor preferido para o microesporo tal como aquele de apg (Twell et ai (1993) Sex. Plant Reprod. 6:217-224).
[00156] O transporte de um polipeptídeo expresso a partir de um polinucleotídeo sintético para um compartimento subcelular, tal como o cloroplasto, vacúolo, peroxissoma, glioxissoma, parede celular ou mi-tocôndria ou para secreção no apoplasto, pode ser obtido por meio da ligação operativa de uma sequência de nucleotídeos que codifica uma sequência de sinal para a região 5’ e/ou 3’ do polinucleotídeo sintético que codifica o polipeptídeo. Direcionar sequências na extremidade 5’ e/ou 3’ do gene estrutural pode determinar, durante a síntese e o processamento da proteína, onde a proteína codificada pode ser finalmente compartimentada. Alternativamente, proteínas direcionadas para um compartimento subcelular podem estar diretamente ligadas a uma nanopartícula para direcionar a nanopartícula revestida com a molécula de interesse para um compartimento subcelular desejado. Várias sequências de sinal são conhecidas na técnica. Veja, por exemplo, Becker et al. (1992) Plant Mol. Biol. 20:49; Close, P. S. (1993) Master's Thesis, lowa State University; Knox et al. (1987) Plant Mol. Biol. 9:3-17; Lerner et al. (1989) Plant Physiol. 91:124-129; Fontes et al. (1991) Plant Cell 3:483-496; Matsuoka et al. (1991) Proc. Natl. Acad. Sei. U.S.A. 88:834; Gould et al. (1989) J. Cell. Biol. 108:1657; Creissen et al. (1991) Plant J. 2:129; Kalderon et al. (1984) Cell 39:499-509; and Steifel etal. (1990) Plant Cell 2:785-793.
[00157] Em modalidades onde o hospedeiro de expressão é um organismo multicelular (por exemplo, uma planta) um vetor ou construto de DNA pode ser introduzido em uma ou mais células do organismo multicelular e expresso nesse local. Em alguns exemplos, um organismo completo pode ser produzido a partir de uma ou mais células do organismo multicelular que compreende um vetor ou construto de DNA introduzido. Por exemplo, métodos para regenerar uma planta completa a partir de células de planta transformadas com uma molécula de ácido nucleico de interesse e subsequente seleção de uma planta que tenha a molécula de ácido nucleico integrada no seu genoma, são conhecidos na técnica.
[00158] Em algumas modalidades, ficará compreendido que, em adição a ser um organismo multicelular, um hospedeiro de expressão para uso nas modalidades do mesmo pode ser um organismo unicelu-lar procariótico ou eucariótico. Uma variedade de sistemas de expressão pode ser usada para a expressão de um polipeptídeo a partir de uma sequência de ácido nucleico otimizada da invenção. O hospedeiro de expressão pode, por exemplo, ser selecionado do grupo que compreende bactérias, algas; fungos (por exemplo, levedura); células de inseto; células de animais; baculovírus; e cultura de tecido de mamífero.
[00159] Em modalidades particulares, um sistema de expressão pode ser, por exemplo e sem limitação: um sistema de expressão bac- teriano, tal como Escherichia coli, Salmonella spp., Bacillus spp., Streptomyces spp., Pseudomonas spp. (por exemplo, P. fluorescens), Ralstonia eutropha, Chlamydomonas spp.; sistemas de expressão em levedura incluindo Saccharomyces, Pichia, Klebsiella, and Candida species, S. cerevisiae, P. pastoris, P. methanolica, e K. lactis; sistemas de expressão emfungos incluindo Cryptosporidium e Trichoderma spp.; aiatemas de produção de proteína em fungos filamentosos; sistemas de expressão em protozoários incluindo Plasmodium falciparum e Leishmania; organismos de modelo incluindo Caenorhabditis ele-gans, Drosophila melanogaster, e Xenopus laevis; células de planta (incluindo, por exemplo, soja, feijão, milho, algodão, tabaco e Arabi-dopsis)', sistemas de expressão em cultura de tecido incluindo células COS, células de Ovário de Hamster Chinês e fibloblastos tais como células 3T3; linhagens celulares infectadas com adenovírus; linhagens celulares de insetos tais como aquelas derivadas de Spodoptera spp. para o desenvolvimento de baculovírus; organismos de modelo para o estudo de doenças e testes de eficácia de vacinas de DNA tais como macacos, camundongos, ratos, porcos da guiné, ovelhas, cabras e coelhos; sistemas de expressão in vitro preparados a partir de extratos de células vivas tais como extratos de E. coli, extratos de germe de trigo, lisados de reticulócito de coelho; e sistemas de expressão in vitro preparados pela reunião de componentes individuais purificados.
[00160] Métodos para a expressão de gene em um organismo geneticamente modificado incluindo, por exemplo e sem limitação, uma planta, são conhecidos na técnica. Algumas modalidades incluem um vetor recombinante (por exemplo, um plasmídeo) que compreende um ou mais polinucleotídeos heterólogos que codificam um polipeptídeo heterólogo de interesse. Um vetor recombinante é uma molécula de ácido nucleico manipulada (por exemplo, produzida artificialmente) que é usada como uma ferramenta para a manipulação de um ácido nu- cleico de escolha e/ou para a introdução de tal ácido nucleico em uma célula hospedeira. O vetor recombinante pode, portanto, ser adequado para uso na clonagem, sequenciamento e na manipulação de outra maneira do polinucleotídeo, tal como pela expressão e/ou liberação do poiinucleotídeo em uma célula hospedeira para formar uma célula recombinante. Um vetor pode conter sequências de nucleotídeos que não são encontradas naturalmente adjacentes ao polinucleotídeo a ser clonado ou liberado. Um vetor pode conter também sequências de ácido nucleico regulatórias (por exemplo, promotoras, regiões não traduzidas) que são encontradas naturalmente adjacentes ao polinucleotídeo ou que são úteis para expressão no polinucleotídeo. Um polinucleotídeo integrado pode estar sob o controle de promotor cromossô-mico, sob o controle de um promotor nativo ou de plasmídeo ou sob uma combinação de vários promotores de controle. Um vetor pode ser de RNA ou DNA e pode ser procariótico ou eucariótico. Um vetor pode ser mantido como um elemento extra-cromossômico (por exemplo, um plasmídeo) ou pode estar integrado em um cromossomo de um organismo recombinante (por exemplo, micróbio, levedura e célula de planta). O vetor completo pode permanecer no lugar dentro da célula hospedeira ou sob certas circunstancias, o DNA estranho (por exemplo, sequências de plasmídeo desnecessárias) pode ser deletado, deixando para trás um ou mais polinucleotídeos heterólogos que codificam um polipeptídeo heterólogo de interesse. Cópias únicas ou múltiplas dos polinucleotídeos heterólogos podem ser integradas no genoma do hospedeiro. Um vetor recombinante da presente invenção pode conter pelo menos um marcador selecionável.
[00161] Em algumas modalidades, um vetor recombinante que compreende um ou mais polinucleotídeos heterólogos que codificam um polipeptídeo heterólogo de interesse é um vetor de expressão, por exemplo, um vetor de expressão em planta. Em tais modalidades, pelo menos um polinucleotídeo que codifica o produto a ser produzido pode ser inserido no vetor recombinante de uma maneira que ligue operativamente o polinucleotídeo às sequências regulatórias no vetor que possibilitam a transcrição e a tradução da sequência de ácido nucleico dentro da célula hospedeira recombinante. Vetores úteis para a transformação de uma variedade de organismos hospedeiros e células são conhecidos na técnica. Tipicamente, um vetor contém um marcador selecionável e sequências que permitem a replicação autônoma ou a integração cromossômica no hospedeiro desejado.
[00162] Métodos adequados para a transformação de células hospedeiras incluem qualquer método pelo qual o DNA pode ser introduzido em uma célula, tal como pela transformação de protoplastos (Veja, por exemplo, Patente U.S. 5.508.184), pela absorção de DNA mediada pela dessecação/ inibição (Veja, por exemplo, Potrykus et al. (1985) Mol. Gen. Genet. 199:183-8), pela eletroporação (Veja, por exemplo, Patente U.S. 5.384.253), pela agitação com fibras de carbo-neto de silício (Veja, por exemplo, Patente U.S. 5.302.523 e 5.464.765), pela transformação mediada por Agrobacterium (Veja, por exemplo, Patente U.S. 5.563.055; 5.591.616; 5.693.512; 5.824.877; 5.981.840; e 6.384.301), e pela aceleração de partículas revestidas de DNA (Veja, por exemplo, Patente U.S. 5.015.580; 5.550.318; 5.538.880; 6.160.208; 6.399.861; e 6.403.865). Através da aplicação de técnicas tais como essas, as células de virtualmente qualquer espécie pode ser estavelmente transformada, incluindo ambas as plantas monocotiledôneas e dicotiledôneas. Em algumas modalidades, o DNA transformado está integrado no genoma da célula hospedeira. No caso de espécies multicelulares, as células transgênicas podem ser regeneradas em um organismo transgênico. Qualquer uma dessas técnicas pode ser usada para produzir uma planta monocotiledônea ou dicotile-dônea transgênica, por exemplo, que compreende um ou mais polinu- cleotídeos heterólogos que codificam um polipeptídeo heterólogo de interesse no genoma da planta transgênica.
[00163] O método mais amplamente usado para a introdução de um vetor de expressão em plantas é baseado no sistema de transformação natural de Agrobacterium. A. tumefaciens e A. rhizogenes são bactérias do solo patogênicas para a planta que geralmente transformam células de planta. Os plasmídeos Ti e Ri de A. tumefaciens e A. rhizogenes, respectivamente, carregam genes responsáveis para a transformação genética da planta. Os plasmídeos Ti (que induzem tumor) contêm um grande segmento conhecido como T-DNA que é transferido para as plantas transformadas. Outro segmento do plasmí-deo Ti, a região vir, é responsável pela transferência do T-DNA. A região do T-DNA está delimitada por repetições terminais. Em vetores binários modificados, os genes que induzem tumor foram deletados e as funções da região vir são utilizadas para transferir o DNA estranho delimitado pelas sequências de borda de T-DNA. A região T também pode conter um marcador selecionável para a recuperação eficiente de plantas e células transgênicas e um sítio de clonagem múltipla para a inserção de sequências para a transferência tal como de um ácido nu-cleico que codifica um dsRNA.
[00164] Portanto, em modalidades particulares, um vetor de transformação de planta é derivado de um plasmídeo Ti de A. tumefaciens {Veja, por exemplo, Patente U.S. Nos. 4.536.475, 4.693.977, 4.886,937, e 5.501.967; e a Patente Européia EP 0 122 791) ou um plasmídeo Ri de A. rhizogenes. Vetores de transformação de planta adicionais incluem, por exemplo e sem limitação, aqueles descritos por Herrera-Estrella et ai. (1983) Nature 303:209-13; Bevan et al. (1983) Nature 304:184-7; Klee et al. (1985) Bio/Technol. 3:637-42; e na Patente Européia EP 0 120 516, e aqueles derivados de qualquer um dos precedentes. Outras bactérias tais como Sinorhizobium, Rhizobium, e Mesorhizobium que interagem com plantas naturalmente, podem ser modificadas para mediar a transferência de gene para várias plantas diferentes. Essas bactérias simbióticas associadas com a planta podem ser tornadas competentes para transferência de gene pela aquisição de ambos, um plasmídeo Ti desarmado e um vetor binário adequado.
[00165] Depois de fornecer DNA exógeno para células receptoras, as células transformadas são geralmente identificadas para cultura e regeneração de planta. A fim de aperfeiçoar a habilidade de identificar as células transformadas, pode ser desejável empregar um gene marcador selecionável ou rastreável, como previamente descrito, com o vetor de transformação usado para gerar o transformante. No caso onde um marcador selecionável é usado, as células transformadas são identificadas dentro da população de células potencialmente transformadas pela exposição das células a um agente ou agentes seletivos. No caso onde um marcador rastreável é usado, as células podem ser rastreadas quanto ao traço do gene marcador desejado.
[00166] As células que sobrevivem a exposição ao agente seletivo ou células que tenham sido rastreadas como positivas em um ensaio de rastreamento, podem ser cultivadas em meios que suportam a regeneração das plantas. Em algumas modalidades, qualquer meio de cultura de tecido de planta adequado (por exemplo, meios MS e N6) pode ser modificado pela inclusão de substancias adicionais, tais como reguladores do crescimento. O tecido pode ser mantido em um meio básico com reguladores do crescimento até que tecido suficiente esteja disponível para começar os esforços para regeneração da planta ou, depois de rodadas repetidas de seleção manual, até que a mor-fologia do tecido seja adequada para regeneração (por exemplo, pelo menos 2 semanas), depois transferido para um meio que conduz à formação de muda. As culturas são transferidas periodicamente até que tenha ocorrido a formação suficiente de muda. Uma vez que raízes suficientes tenham se formado, as plantas podem ser transferidas para o solo para crescimento e maturidade adicionais.
[00167] Para confirmar a presença de uma molécula de ácido nu-cleico de interesse (por exemplo, um polinucleotídeo heterólogo que codifique um polipeptídeo heterólogo de interesse) nas plantas regeneradas, uma variedade de ensaios pode ser realizada. Tais ensaios incluem, por exemplo: ensaios biológicos moleculares, tais como Southern e Northern blotting, PCR e sequenciamento de ácido nuclei-co; ensaios bioquímicos tais como detectar a presença de um produto de proteína, por exemplo, por meios imunológicos (ELISA e/ou Western blots) ou pela função enzimática; ensaios em parte de planta, tais como ensaios em folha e raiz; e análise do fenótipo da planta completa regenerada.
[00168] Eventos de integração podem ser analisados, por exemplo, pela amplificação por PCR usando, por exemplo, iniciadores de oligo-nucleotídeo específicos para uma molécula de ácido nucleico de interesse. A genotipagem por PCR é compreendida incluir, mas não estar limitada à amplificação pela reação em cadeia da polimerase (PCR) de DNA genômico derivado de um tecido de calo isolado de planta hospedeira predito para conter uma molécula de ácido nucleico de interesse integrada no genoma, seguida pela clonagem padronizada e análise de sequência dos produtos de amplificação por PCR. Métodos de genotipagem por PCR foram bem descritos (por exemplo, Rios, G. et al. (2002) Plant J. 32:243-53) e podem ser aplicados ao DNA genômico derivado de qualquer espécie de planta (por exemplo, Z. mays e G.max) ou tipo de tecido, incluindo culturas celulares.
[00169] Uma planta transgênica formada usando os métodos de transformação dependentes de Agrobacterium tipicamente contém um único polinucleotídeo recombinante inserido em um cromossomo. O único polinucleotídeo recombinante é referido como um "evento trans-gênico" ou "evento de integração". Tais plantas transgênicas são hete-rozigotas para a sequência exógena inserida. Em algumas modalidades, uma planta transgênica homozigota com relação a um transgene pode ser obtida pela reprodução sexuada (autofecundação) de uma planta transgênica segregante independente que contém uma única sequência de gene exógeno para si própria, por exemplo, uma planta T0 para produzir uma semente Th Um quarto das sementes T, produzidas será homozigota com relação ao transgene. A germinação das sementes T, resulta em plantas que podem ser testadas quanto a hete-rozigosidade, usando tipicamente um ensaio de SNP ou de amplificação térmica que permite a distinção entre hetrozigotos e homozigotos (isto é, ensaio de zigosidade).
[00170] Em adição a transformação direta de uma planta com uma molécula de ácido nucleico recombinante, plantas transgênicas podem ser preparadas pelo cruzamento de uma primeira planta que possua pelo menos um evento transgênico com uma segunda planta que careça de tal evento. Por exemplo, uma molécula de ácido nucleico recombinante que compreenda um ou mais polinucleotídeos heterólogos que codificam um polipeptídeo heterólogo de interesse pode ser introduzido em uma primeira planta que seja passível de transformação para produzir uma planta transgênica, cuja planta transgênica pode ser cruzada com uma segunda linhagem de planta para introgredir o(s) polinucleotídeo(s) na segunda linhagem de planta.
[00171] As manipulações genéticas precedentes de um hospedeiro recombinante podem ser realizadas usando técnicas e rastreamento genético padronizados e podem ser feitos em qualquer célula hospedeira que seja adequada para manipulação genética. Em algumas modalidades, o hospedeiro recombinante é uma planta superior, incluindo ambas as plantas monocotiledôneas e dicotiledôneas e plantas consumíveis incluindo plantas cultiváveis e plantas. Portanto, qualquer espécie de planta ou célula de planta pode ser selecionada.
[00172] Modalidades particulares fornecem métodos de produção de um polipeptídeo heterólogo de interesse no citoplasma e/ou peri-plasma de uma célula. Algumas modalidades utilizam um polinucleotí-deo sintético otimizado para a expressão heteróloga em um organismo hospedeiro (por exemplo, um organismo hospedeiro bacteriano). Em modalidades particulares, tal polinucleotídeo otimizado sintético pode ser ligado a um vetor de expressão e o vetor de expressão que compreende o polinucleotídeo otimizado pode ser introduzido em uma célula hospedeira de expressão (por exemplo, pela transformação), onde um polipeptídeo é expresso a partir da sequência de ácido nucleico sintética otimizada.
[00173] Moléculas de ácido nucleico que compreendem um polinucleotídeo sintético que codifica o polipeptídeo de interesse podem ser introduzidos pelos métodos conhecidos daqueles versados na técnica. Por exemplo, em algumas modalidades, segmentos relativamente curtos de uma sequência de ácido nucleico desejada podem ser confia-velmente sintetizados, seguido pela concatenação. Avanços no campo da síntese do DNA têm permitido a síntese confiável de polinucleotí-deos mais longos, assim como mais curtos. As técnicas sintéticas permitem a síntese razoavelmente apurada de oligonucleotídeos com 300 bases ou mais. Portanto, em outras modalidades, polinucleotídeos mais longos podem ser sintetizados tal que a concatenação pode não ser necessária. Entretanto, oligonucleotídeos quimicamente sintéticos produzidos têm tipicamente entre 20 e 100 bp de comprimento. Em algumas modalidades, um gene sintético ou um fragmento de gene podem ser preparados usando a PCR de uma maneira escalonada pelo anelamento e extensão de oligômeros senso e antissenso que se alternam e superpõem (por exemplo, 90 a 110 bp de comprimento) designados para codificar a sequência final desejada.
[00174] A produção de oligonucieotídeos pode incluir a síntese de oligo realizada pelo protocolo da fosforoamidita como síntese em fase sólida. Resumidamente, um primeiro nucleotídeo com seu grupo funcional 5’-OH protegido por um grupo DMT pode ser acoplado a esferas de poliestireno como uma fase sólida. Depois, o grupo DMT pode ser removido pelo tratamento ácido, gerando um grupo 5’-OH livre. Depois a fosforoamidita de escolha pode ser adicionada, convertida em um intermediário reativo em condições fracamente ácidas e acoplada ao grupo 5’-OH livre para produzir uma nova ligação de fosfito. Essas reações também podem ocorrer em THF ou DMSO. Como o 5’-OH do nucleotídeo adicionado permanece protegido, apenas um nucleotídeo é adicionado à cadeia em crescimento. Os grupos 5’-OH que não reagem podem ser revestidos tal que eles não fazem parte no processo de síntese e geram oligonucieotídeos com deleções. Isso pode ser obtido pela acetilação depois do tratamento com ácido acético e 1-metilimidazol. Finalmente, a água e iodo podem ser adicionados para oxidar a ligação de fosfito para uma ligação de fosfodiéster. Entre as etapas, os sistemas de produção podem ser condicionados pela lavagem com um solvente adequado. Depois de repetir essa sequência de etapas como necessário, o oligonucleotídeo pode ser finalmente cliva-do a partir de uma coluna e tratado com hidróxido de amônio em alta temperatura para remover todos os grupos protetores remanescentes. Esse processo pode ser feito mais eficientemente com o uso de uma abordagem fotolitográfica, por exemplo, como fornecido por NIMBLEGEN™ (Febit, Alemanha).
[00175] Depois que oligonucieotídeos curtos forem produzidos pela síntese em fase sólida, os oligonucieotídeos podem ser montados em fragmentos maiores de DNA, por exemplo, até um tamanho de cerca de 500 bp. Isso é tipicamente obtido por um de uma variedade de mé- todos auxiliados por enzima. Por exemplo, pares de oligonucleotídeos com superposição curta podem ser usados para gerar moléculas de dsDNA mais longas através de uma reação de extensão de Klenow. Os oligonucleotídeos correspondentes podem ser misturados, hibridi-zados e depois convertidos em montagens maiores por PCA. Em uma reação de PCA, todos os oligonucleotídeos que juntos representam o fragmento de DNA de fita dupla desejado estão presentes. Pela fusão e re-hibridização repetidas, os oligonucleotídeos são prolongados passo a passo em seções mais longas até que uma certa população atinja a extensão desejada. Note que essa reação é realizada sem oligonu-cleotídeo terminal em excesso, de modo que não é uma reação de amplificação. Particularmente, o fragmento de extensão completa consiste em oligonucleotídeos e suas extensões, reduzindo dessa maneira a chance de introdução de erros pela ação da polimerase. Uma metodologia alternativa ao PCA é "polymerase assembly multiplexing (PAM)", em que iniciadores terminais são adicionados a um pool de oligonucleotídeos tal que apenas um subgrupo específico de oligonucleotídeos é amplificado. Em uma segunda rodada de reações de PAM, múltiplos oligonucleotídeos podem ser recombinados em uma única molécula de DNA pelo uso de um novo conjunto de iniciadores.
[00176] Oligonucleotídeos maiores (por exemplo, oligonucleotídeos produzidos por PCA, PMA, etc.) podem ser montados em molécula de DNA ainda maiores, por exemplo, pela digestão de restrição e ligação.
[00177] Em modalidades nas quais um polipeptídeo de interesse que compreende regiões de repetição de aminoácidos é para ser expresso em uma célula procariótica ou sistema de expressão, um poli-nucleotídeo otimizado que codifica o polipeptídeo de interesse pode ser clonado primeiro em um vetor procariótico pela linearização do vetor que possui uma origem de replicação e sítios de restrição convenientes, que podem envolver um poliligante, para inserção da sequência de ácido nucleico. O vetor também pode ter um gene marcador para seleção, que pode transmitir resistência a antibiótico ou fornecer outra característica distinta (por exemplo, formação de cromóforo ou fluoró-foro). Há uma grande variedade de reagentes de antibióticos (por exemplo, tetraciclina, cloranfenicol, actinomicina, neomicina, ampicili-na, higromicina, metais pesados, etc) que podem ser utilizados para a seleção assistida por marcador. Outros marcadores incluem a □-galactosidase, que converte o substrato X-gal para fornecer uma cor azul quando expresso. Numerosos vetores estão comercialmente disponíveis para a clonagem em bactérias e esses vetores são bem conhecidos daqueles versados na técnica. Em algumas modalidades, um vetor procariótico que compreende um ou mais polinucleotídeos sintéticos otimizados que codificam um polipeptídeo de interesse, podem então ser introduzidos em um hospedeiro de clonagem apropriado por qualquer meio conveniente, incluindo sem limitação: DNA precipitado com fosfato de cálcio, fusão, transfecção e conjugação. As células podem então ser cultivadas em um meio nutriente seletivo apropriado. As células sobreviventes podem ser coletadas, lisadas e o plasmídeo isolado.
[00178] Um vetor de expressão procariótico pode ser caracterizado por ter uma origem de replicação que é funcional em hospedeiro de expressão apropriado, geralmente para manutenção epissomal, e um marcador de seleção. Para vetores não integrados ou construtos, a origem de replicação fornecerá de modo geral múltiplas cópias, por exemplo, pelo menos cerca de 5 cópias em média. O vetor de expressão terá tipicamente também um promotor que é funcional no hospedeiro de expressão. Um grande número de promotores está disponível e promotores em particular podem, por exemplo, fornecer um alto nível de transcrição induzível ou constitutiva. Promotores ilustrativos que podem ser úteis em algumas modalidades incluem, sem limitação: □-lactamase; D-galactosidase; promotores jPl ou nP*; promotor trpE; promotor trp-lac; promotor T7 (particularmente genes 9 e 10); e clfs.
[00179] Uma molécula de ácido nucleico que compreende um poli-nucleotídeo otimizado pode ser combinada com um vetor linearizado pela hibridização, por exemplo, ligação. Onde o polinucleotídeo otimizado não tem um códon de iniciação, tal códon pode ser adicionado. Em algumas modalidades, um polinucleotídeo pode ser inserido em uma sequência codificadora presente no vetor (em uma fase de leitura apropriada), sob o controle transcricional de um promotor. Uma sequência de sinal pode ser incluída na terminação 5’ da sequência codificadora para permitir a secreção do produto de polipeptídeo no espaço periplasmático. Geralmente, o produto será produzido intracelularmente.
[00180] A célula hospedeira de expressão que compreende um vetor ou construto de DNA introduzido, pode ser cultivada em um meio de cultura apropriado (por exemplo, fermentação). Depois que as células tiverem sido cultivadas até uma densidade apropriada, as células podem ser coletadas e lisadas e o produto de expressão pode ser isolado de acordo com suas características físicas e químicas. Em algumas modalidades, um produto de expressão pode ser insolúvel em temperaturas moderadas em um meio aquoso e pode ser purificado pela extração com detergente em temperaturas moderadamente elevadas. Veja a Patente U.S. 5.235.041. Como apropriado, o produto bruto ou purificado pode então ser usado para seu propósito pretendido.
[00181] Modalidades permitem a expressão de qualquer polipeptídeo de interesse. Em alguns exemplos, o polipeptídeo de interesse pode ser, ele próprio, desejável para uma aplicação (por exemplo, um polímero). Em outros exemplos, o polipeptídeo de interesse pode ser expresso no hospedeiro para produzir um polipeptídeo desejável adi- cional, molécula pequena ou outra substância (por exemplo, uma enzima) ou para introduzir um fenótipo desejado no hospedeiro. Em exemplos particulares, um polipeptídeo de interesse pode ser: uma proteína que não é normalmente encontrada nas células do hospedeiro de expressão; um produto de gene agronômico; um polipeptídeo que confere resistência a pragas ou doenças; uma proteína de Bacillus thuringiensis; uma lectina; uma proteína que se ligue a vitamina (por exemplo, avidina); um inibidor de enzima; um hormônio específico para inseto ou feromônio; um peptídeo ou neuropeptídeo que seja específico para um organismo particular; um veneno; uma enzima responsável pelo hiperacúmulo de um monoterpeno, um sesquiterpeno, um esteroide, ácido hidroxâmico, um derivado fenilpropanoide ou outra molécula não proteica; uma enzima envolvida na modificação, incluindo a modificação pós-traducional, de uma molécula biologicamente ativa(por exemplo, uma enzima envolvida na síntese de ácidos graxos omega 3); uma molécula de transdução do sinal ou molécula que estimule a transdução do sinal (por exemplo, calmodulina); um peptídeo de momento hidrofóbico; uma permease, transportador ou canal de membrana; um formador de canal ou bloqueador de canal; uma proteína viral invasiva ou toxina complexa derivada dessa; um anticorpo ou imunotoxina (por exemplo, um anticorpo específico para um vírus); uma proteína que impede o desenvolvimento; um polipeptídeo que confere resistência a um herbicida, fungicida ou outra molécula pequena prejudicial; proteínas do arcabouço; e polipeptídeos sintéticos que são designados para ter uma função particular (por exemplo, uma função atribuível a regiões de repetição de aminoácidos, tais como propriedades ou características físicas.). Em algumas modalidades, um polipeptídeo de interesse pode ser apropriado a partir da natureza. Em outras modalidades, um polipeptídeo de interesse pode ser um polipeptídeo que não é encontrado normalmente na natureza; por exemplo, um polipeptídeo mutante que compreende uma mutação conservativa na sequência de aminoácidos de um polipeptídeo nativo de interesse.
[00182] Em modalidades particulares, duas ou mais sequências candidatas diferentes que foram geradas pela otimização de sequência usando parâmetros diferentes (por exemplo, sequências que diferem em sua utilização de códon) podem ser geradas e testadas para determinar se elas possuem a propriedade desejada. As sequências candidatas podem ser avaliadas, por exemplo, para pesquisar a presença de elementos regulatórios, tais como silenciadoras ou intensifi-cadoras ou para pesquisar a presença de regiões da sequência codifi-cadora que poderão ser convertidas em tais elementos regulatórios por uma alteração na utilização de códon. Critérios adicionais podem incluir o enriquecimento com nucleotídeos particulares (por exemplo, A, C, G ou U, desvio de códon para um aminoácido particular), a presença ou ausência de uma estrutura secundária ou terciária de mRNA e/ou a presença ou ausência de sequências de poliadenilação adicional. O ajuste da sequência candidata para expressão posterior pode ser feito com base em tais critérios.
[00183] Sequências candidatas promissoras podem ser construídas e avaliadas experimentalmente. Candidatas múltiplas podem ser independentemente avaliadas uma da outra ou o processo pode ser interativo, pelo uso da candidata mais promissora como um novo ponto de partida ou pela combinação de regiões de duas ou mais candidatas para produzir um novo híbrido. Rodadas adicionais de modificação e avaliação podem ser desejáveis.
[00184] Outras modalidades fornecem métodos para obter um fenó-tipo ou traço desejável em uma célula de planta, tecido de planta, material de planta e/ou planta completa, em que o fenótipo desejado é, por exemplo, a expressão de uma toxina de inseto e em que o traço desejável pode ser a tolerância e/ou resistência à praga. Em alguns exemplos, um método para controlar pragas em uma planta compreende expressar um polinucleotídeo sintético que codifica uma toxina de inseto; por exemplo e sem limitação, uma proteína Cry de Bacillus thuringiensis. Exemplos particulares de um método para controlar pragas em uma ração ou farinha compreende obter um grão ou semente de uma planta que contenha um polinucleotídeo sintético, em que a planta expressa uma toxina de inseto. Plantas transgênicas que expressam uma toxina de inseto podem ser resistentes ao ataque de uma praga de inseto em virtude da presença de quantidades controladoras da proteína inseticida em questão (ou variantes dessas) nas células da planta. Por exemplo, pela incorporação no genoma de uma planta de um polinucleotídeo que codifica um polipeptídeo que possui propriedades inseticidas das toxinas Bt inseticidas, pragas de inseto (por exemplo, adulto ou larvas) morrem depois de consumir o material da planta.
[00185] Modalidades particulares fornecem métodos para obter um fenótipo ou traço desejável em uma célula de planta, tecido de planta, material de planta e/ou planta completa, em que o fenótipo desejável é, por exemplo, a expressão de um gene de tolerância e/ou resistência a herbicida. Em alguns exemplos, um método para fornecer tolerância ao herbicida para uma planta compreende expressar um polinucleotídeo sintético que codifica um polipeptídeo de interesse em uma célula de planta, onde o polinucleotídeo sintético codifica uma enzima de tolerância a herbicida, por exemplo e sem limitação, as enzimas ariloxi-alcanoato dioxigenase (AAD1) (Veja Publicação de Patente Internacional PCT No. WO 2005/107437); fosfinotricina acetiltransferase (PAT), ou 5-enolpiruvilchiquimato-3-fosfato sintase (EPSP sintase).
[00186] Modalidades particulares fornecem métodos para a obtenção de um traço ou fenótipo desejáveis em uma célula de planta, teci- do de planta, material de planta e/ou planta completa, em que o fenóti-po desejável é, por exemplo, a expressão de uma proteína envolvida em um traço de óleo de planta e em que o traço desejável pode ser um perfil de óleo modificado na planta (por exemplo, em uma semente de planta). Em alguns exemplos, um método para modificar o perfil do óleo de uma planta compreende expressar um polinucleotídeo sintético que codifica um polipeptídeo de interesse em uma célula de planta, onde o polinucleotídeo sintético codifica uma ou mais enzimas para a modificação de perfis de óleo em plantas; por exemplo e sem limitação, um ácido graxo desaturase (por exemplo, FAD2 ou FAD3).
[00187] Modalidades particulares fornecem métodos para a obtenção de um traço ou fenótipo desejáveis em uma célula de planta, tecido de planta, material de planta e/ou planta completa, em que o fenótipo desejável é, por exemplo, a expressão de um gene de tolerância ao estresse, e em que o traço desejado pode ser a tolerância aumentada ao estresse, por exemplo, estresse hídrico e/ou de temperatura. Em alguns exemplos, um método para fornecer a tolerância ao estresse para uma planta compreende expressar um polinucleotídeo sintético que codifica um polipeptídeo de interesse em uma célula de planta, onde o polinucleotídeo sintético codifica uma ou mais proteínas de tolerância ao estresse; por exemplo e sem limitação, a proteína associada ao estresse (SAP1) (Publicação de Patente U.S. No. 2010/0275327); e proteínas 1-Cys peroxiredoxina (1-CysPrx) (Mowla et ai (2002) Planta 215:716-26).
[00188] Modalidades particulares fornecem métodos para a obtenção de um traço ou fenótipo desejáveis em uma célula de planta, tecido de planta, material de planta e/ou planta completa, em que o fenótipo desejável é, por exemplo, a expressão de uma proteína marcadora e em que o traço desejável pode ser um marcador de seleção. Em alguns exemplos, um método para fornecer a tolerância ao estresse pa- ra uma planta compreende expressar um polinucleotídeo sintético que codifica um polipeptídeo de interesse em uma célula de planta, onde o polinucleotídeo sintético codifica uma ou mais proteínas marcadoras de transformação; por exemplo e sem limitação, proteína verde fluorescente (GFP) ou a enzima beta-glicuronidase. VI. Plantas transgênicas que compreendem o polipeptídeo de interesse [00189] Essa descrição também fornece organismos geneticamente modificados que compreendem um polinucleotídeo heterólogo, sintético que codifica um polipeptídeo de interesse. Algumas modalidades fornecem uma planta transgênica que compreende um polipeptídeo heterólogo, sintético que codifica um polipeptídeo de interesse, por exemplo, como pode ser produzido pela regeneração de uma planta a partir de uma célula de planta transformada com um ácido nucleico que compreende o polinucleotídeo sintético. Um polinucleotídeo sintético que codifica um polipeptídeo de interesse pode estar operativamente ligado a sequências regulatórias (por exemplo, um promotor) apropriado para o organismo, como previamente descrito. Em modalidades particulares, o organismo pode expressar o polipeptídeo de interesse. Em certas modalidades, um polipeptídeo de interesse pode ser expresso a partir de um polipeptídeo otimizado em um nível que é de pelo menos 110%, 150%, 200%, 500%, 1.000%, 5.000% até 10.000% daquele expresso pelo polinucleotídeo que codifica o mesmo polipeptídeo que não tenha sido igualmente otimizado; por exemplo, um polinucleotídeo que tenha tido o códon otimizado para a expressão no mesmo hospedeiro, mas em que a sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, AT AC AT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA não tenha sido preservada.
[00190] Em algumas modalidades, um organismo geneticamente modificado que compreende um polinucleotídeo heterólogo, sintético que codifica um polipeptídeo de interesse é uma planta geneticamente modificada, em que pelo menos alguma das células da planta geneticamente modificada compreendem um ou mais dos polinucleotídeos heterólogos, sintéticos. Em um exemplo de uma modalidade, um plasmídeo que compreende um polinucleotídeo heterólogo, sintético que codifica um polipeptídeo de interesse e um marcador selecionável é introduzido em uma célula de planta, por exemplo, por qualquer um dos métodos previamente enumerados aqui. Transformantes estáveis que possuem o polinucleotídeo sintético e/ou o marcador selecionável estavelmente integrados podem ser selecionados a partir de tais plantas. Em outras modalidades, uma célula de planta que compreende o polinucleotídeo sintético (por exemplo, um transformante estável que tenha sido selecionado) pode ser propagada para produzir novas células de planta que compreendem o polinucleotídeo sintético. Células de planta que compreendem um polinucleotídeo sintético podem ser uma célula regenerável que pode ser usada para regenerar uma planta completa. Tais células de planta e plantas completas geradas a partir delas podem expressar um polipeptídeo de interesse que é codificado pelo polinucleotídeo sintético.
[00191] Nessas e em modalidades posteriores, métodos para criar células de planta regeneráveis que compreendem um polinucleotídeo sintético (por exemplo, para uso em cultura de tecido) podem ser fornecidos. Uma cultura de tecido pode ser capaz de regenerar plantas que possuem substancialmente o mesmo genótipo como as células regeneráveis. As células regeneráveis em tais culturas de tecido podem ser embriões, protoplastos, células meristemáticas, calos, pólen, folhas, anteras, raízes, pontas de raiz, flores, sementes, vagens ou caules. Algumas modalidades da invenção fornecem plantas regene- radas a partir de culturas de tecido da invenção.
[00192] Também são fornecidos métodos para gerar linhagens de planta estabilizadas que compreendem um polinucleotídeo sintético que codifica um polipeptídeo de interesse, em que as células das linhagens de planta estabilizadas podem expressar o polipeptídeo de interesse que é codificado pelo polinucleotídeo. Métodos de geração de linhagens de planta estabilizadas são conhecidos daqueles versados na técnica e podem incluir técnicas tais como, mas não limitadas a autofecundação, retrocruzamentos, produção de híbrido e cruzamentos de populações. Todas as plantas e células de planta que compreendem o polinucleotídeo sintético que codifica um polipeptídeo de interesse como aqui descrito não existem na natureza e elas podem exibir propriedades de expressão vantajosas do polipeptídeo heterólogo de interesse, por exemplo, quando comparadas com uma planta ou célula de planta que compreendem um polinucleotídeo sintético que codifica um polipeptídeo de interesse que não tenha sido igualmente otimizado. Células de planta que compreendem um polinucleotídeo sintético podem ser usadas em cruzamentos com outras plantas, diferentes para produzir uma primeira geração (F-i) de células híbridas, sementes e/ou plantas com características superiores ou desejáveis.
[00193] Qualquer planta ou célula de planta que expresse um polipeptídeo de interesse a partir de um polinucleotídeo sintético otimizado pelos métodos aqui descritos ou material de planta que compreende tal polipeptídeo, está incluída em modalidades particulares. Em modalidades particulares, um polinucleotídeo sintético é utilizado para produzir plantas de Brassica napus geneticamente modificadas. Em modalidades adicionais, plantas geneticamente modificadas produzidas usando um polinucleotídeo sintético podem ser, por exemplo, sem limitação: uma planta superior: planta dicotiledônea; planta monocotiledô-nea; planta consumível (por exemplo, plantas cultivadas e plantas usadas por seus óleos); soja, colza; semente de linho; milho; açafrão; girassóis; tabaco; uma planta da família Fabaceae (Leguminosae, família dos legumes, família da ervilha, família do feijão, ou "pulse fa-mily"); uma planta do gênero de Glycine (por exemplo, G. albicans, G. aphyonota, G. arenari, G. argyrea, G. canescens, G. clandestine, G. curvata, G. cyrtoloba, G. falcate, G. gracei, G. hirticaulis, G. hirticaulis subsp. leptosa, G. lactovirens, G. latifolia, G. latrobeana, G. microphyl-la, G. montis-douglas, G. peratosa, G. pescadrensis, G. pindanica, G. pullenii, G. rubiginosa, G. stenophita, G. syndetika, G. tabacina, G. to-mentella, G. soja, e G. max (soja)); amendoim; Phaseolus vulgaris, Vicia faba; e Pisum sativum.
[00194] Em algumas modalidades, uma planta geneticamente modificada é uma planta que é conhecida por produzir compostos usados como agentes farmacêuticos, agentes flavorizantes, agentes nutracêu-ticos, ingredientes alimentícios funcionais ou agentes cosmeticamente ativos ou uma planta que é geneticamente manipulada para produzir esses compostos/agentes.
[00195] Em outras modalidades, a planta geneticamente modificada é uma planta oleaginosa, em que as sementes oleaginosas e/ou seu óleo contêm um óleo de perfil modificado com relação a uma planta de tipo selvagem da mesma espécie (por exemplo, expressão de LC-PUFAs em quantidades incomuns, conteúdo de óleo omega e conteúdo de óleo aumentado).
[00196] Em modalidades alternativas, uma planta ou semente transgênica compreendendo um polinucleotídeo heterólogo sintético que codifica um polipeptídeo de interesse como aqui descrito também pode compreender pelo menos um outro evento transgênico em seu genoma, incluindo sem limitação: um gene que codifica uma proteína inseticida (por exemplo, uma proteína inseticida de Bacillus thuringien-sis)] um gene de tolerância ao herbicida (por exemplo, um gene que fornece tolerância ao glifosato); e um gene que contribui para um fenó-tipo desejável na planta transgênica, tal como rendimento aumentado, metabolismo alterado de ácido graxo ou restauração da esterilidade masculina citoplasmática. Em modalidades particulares, um polinu-cleotídeo sintético que codifica um polipeptídeo de interesse é combinado com tais transgenes adicionais, pelas técnicas de DNA recombi-nante ou reprodução convencional com uma planta que já compreende os transgenes adicionais.
[00197] Também incluídas em algumas modalidades estão partes de uma planta que compreende um polinucleotídeo heterólogo, sintético que codifica um polipeptídeo de interesse como aqui descrito. Tais partes de planta incluem quaisquer partes de planta, incluindo, por exemplo e sem limitação, sementes (incluindo sementes maduras e sementes imaturas); tecidos; pólen; embriões; flores; frutos; mudas; folhas; raízes; caules e explantes. Modalidades particulares incluem descendentes de uma planta que compreende um polinucleotídeo heterólogo, sintético que codifica um polipeptídeo de interesse como aqui descrito.
[00198] Os exemplos a seguir são fornecidos para ilustrar certas características e/ou modalidades particulares. Os exemplos não devem ser considerados limitar a descrição para as características particulares ou modalidades exemplificadoras.
EXEMPLOS
Exemplo 1: Avaliação de Múltiplas Sequências de DNA que Codificam a Proteína CrylAb Truncada quanto ao Impacto sobre a Expressão de Gene em Milho T0 [00199] Três sequências de DNA que codificam a proteína CrylAb truncada idêntica foram avaliadas. As 3 versões diferentes do gene crylAb foram testadas em um vetor de transformação de planta binário uniforme. Os genes foram clonados em cassetes de expressão de ge- ne idênticos com o mesmo cassete marcador selecionável. A única variável em cada plasmídeo era a sequência de DNA real que codifica o gene crylAb truncado.
Materiais e Métodos [00200] Design de Sequências de DNA de CrylAb sintético. A proteína CrylAb truncada usada nesse estudo consiste em aminoácidos que correspondem aquelas encontradas nas posições 1-619 da proteína CrylAb nativa de extensão completa. A forma truncada do gene crylAb nativo que codificou os aminoácidos 1-619 foi analisada quanto a presença de 16 sequências de poliadenilação distintas. Tabela 2. A localização e a composição dessas 16 sequências identificadas no crylAb nativo foram registradas e foram incluídas no design das sequências do gene crylAb truncado que foram avaliadas.
[00201] Três sequências de DNA diferentes foram designadas e criadas usando vários conceitos de reformulação de gene. Cada versão do gene crylAb foi cortado para fornecer a proteína correspondente que consiste nos aminoácidos 1 a 619 e a composição do DNA foi alterado para incluir as 16 sequências de poliadenilação anteriormente mencionadas encontradas no gene nativo, para eliminar uma instabilidade de sequência putativa adicional e a décima sétima sequência de poliadenilação que começa na base 1639 foi incorporada ao design. Essa sequência é referida aqui como "IRDIG.1471.4".
[00202] Duas novas versões do gene foram desenhadas para testar hipóteses de reformulação diferentes. A sequência de DNA de tipo selvagem que codifica a toxina do núcleo CrylAb foi traduzida na sequência de aminoácidos correspondente e depois traduzida reversamente usando o códon mais preferido para cada aminoácido, usando o programa OptGene™ 2.0 (Ocimum Biosolutions, Banjara Hills Hyde-rabad, India) A sequência de DNA resultante foi analisada e os códons foram alterados onde necessário para restaurar as sequências identifi- cadas na Tabela 2, para remover fases de leitura aberta indesejadas, para remover sítios de restrição indesejados e para remover séries estendidas de G+C e A+T quando possível pela substituição de uma base para romper a cadeia consecutiva de códons G+C ou A+T. A sequência de aminoácidos codificada resultante correspondeu a sequência de aminoácidos nativa. Essa sequência é referida aqui como "IRDIG.1471.2".
[00203] O segundo design de sequência foi baseado na tabela de distribuição de códon do milho que abrange a distribuição de códons de aminoácidos ao longo de 800 genes de milho. A sequência de aminoácidos que corresponde a proteína CrylAb do milho foi traduzida reversamente usando a tabela de distribuição de códon do milho que correspondeu aos níveis de cada códon presente no gene do milho. Códons raros (isto é, códons presentes em 10% do tempo ou menos) não foram incluídos. A sequência de DNA resultante foi analisada e os códons foram trocados quando necessário para remover fases de leitura aberta indesejadas, para remover sítios de restrição indesejados, para restaurar sequências identificadas na Tabela 2 e para remover séries estendidas de G+C e A+T quando possível. A sequência de aminoácidos codificada resultante correspondeu à sequência de aminoácidos nativa. Essa sequência é referida aqui como "IRDIG.1471.3". Tabela 2. Sequências encontradas no gene crylAb nativo foram incluídas na reconstrução dos genes que foram avaliados nesse experimento. Há um sítio de poliadenilação adicional na tabela em 1639 (AATCAA), que não está incluído na sequência nativa, mas foi manipulado nas reconstruções por que ele elimina uma sequência de deses-tabilização putativa adicional.
[00204] As 3 versões diferentes de crylAb truncado foram avaliadas quanto ao conteúdo total de G+C. O total variou entre 50,9% a 59,5% de C+C. Tabela 3. Cada uma das 3 versões do gene crylAb truncado descritas acima foi sintetizada (DNA2.0; Menlo Park, CA). Tabela 3. Conteúdo de G+C para cada uma das 3 versões diferentes de CrylAb.
[00205] Construção do Vetor de Expressão em Planta. Métodos de clonagem padronizados foram usados na construção de vetores de entrada que contêm cassetes de expressão de crylAb. Plasmídeos binários que continham os cassetes de expressão de crylAb foram manipulados usando GATEWAY® (Invitrogen, Carlsbad, CA) e usados na transformação de planta mediada por Agrobacterium. As endonu-cleases de restrição foram obtidas do New England BioLabs (NEB®; Ipswich, MA), e T4 DNA Ligase (Invitrogen) foi usada para a ligação do DNA. As reações de GATEWAY® foram realizadas usando a mistura de enzima GATEWAY® LR CLONASE® (Invitrogen) para a montagem de um vetor de entrada e um vetor de destino. As preparações de plasmídeo foram realizadas usando o NucleoSpin® Plasmid Kit (Ma-cherey-Nagel Inc., Bethlehem, PA) ou o Plasmid Midi Kit (QIAGEN) de acordo com as instruções dos fabricantes. Os fragmentos de DNA foram isolados usando o QIAquick® Gel Extraction Kit (QIAGEN) depois da eletroforese em gel de agarose acetato de Tris.
[00206] Três genes sintéticos que codificam CrylAb truncada com o design de DNA acima mencionado foram obtidos nos plasmídeos DASDNA441-DASDNA443. A construção do vetor de expressão em planta foi iniciada com a inserção de cada gene sintético crylAb em pDAB101557 entre o promotor ZmUbil e a região 3’ não traduzida (3’ UTR) ZmPerõ sobre um fragmento BamHI/SacI, criando os vetores de entrada pDAB111444-pDAB111446. Os vetores de entrada pDAB111444-pDAB111446 foram recombinados, cada um, usando a tecnologia GATEWAY® com o vetor de destino pDAB109805, que continha o cassete marcador selecionável SCBV(MAM) promotor v2/AAD-1 v3/ZmLip 3’ UTR v1, para criar os vetores binários finais pDAB111447-pDAB111449, respectivamente.
[00207] Colônias de todos os plasmídeos montados foram rastrea-das inicialmente pela digestão de restrição de miniprep DNA. O plasmídeo de DNA de clones selecionados foi sequenciado pelo contrato com um vendedor comercial de sequenciamento (EUROFINS™ MWG
Operon, Huntsville, AL). Os dados de sequência foram reunidos e analisados usando o programa SEQUENCHER™ (Gene Codes Corp. Ann Arbor, Ml). Mapas dos plasmídeos refletem a sequência correta. Fig. 1.
[00208] Produção da Cepa de Agrobacterium tumefaciens. Os detalhes do plasmídeo de DNA derivado de E. coli usado para desenvolver as cepas de Agrobacterium tumefaciens para transformação em planta são fornecidos na Tabela 4. Dat13192, uma cepa recA ternária de A. tumefaciens foi a cepa de base selecionada para o desenvolvimento dessas cepas de transformação em planta. Protocolos de transformação padronizados foram utilizados no desenvolvimento dessas cepas. O desenvolvimento de novas cepas de A. tumefaciens estável mente transformadas com o vetor binário de interesse foi confirmado pela digestão de restrição de cada cepa, resultando na validação de pelo menos uma colônia para cada construto.
Tabela 4. Plasmídeo de DNA derivado de E. coli usado para desenvolver as cepas de Agrobacterium tumefaciens para transformação de planta a partir da cepa DAt13192.
[00209] Iniciação da cultura de Agrobacterium. Concentrados em glicerol dos vetores do projeto na cepa hospedeira de A. tumefaciens DAt13192 (cepa ternária RecA menos) foram obtidos e as culturas de Agrobacterium foram repicadas dos concentrados de glicerol sobre meio mínimo AB e incubadas a 20°C, no escuro por 2 a 3 dias. As culturas de Agrobacterium foram repicadas então sobre uma placa com meio YEP e incubadas a 20°C, no escuro por 1 dia.
[00210] No dia do experimento, uma mistura de meio de inoculação e acetosiringona foi preparada em um volume apropriado para o número de construtos no experimento. Tabela 5. O meio de inoculação foi pipetado em um frasco estéril, descartável de 250 ml_. Uma solução concentrada 1 M de acetosiringona em dimetil sulfóxido 100% foi adicionada ao frasco contendo o meio de inoculação em um volume apropriado para fazer uma concentração final de acetosiringona de 200 μΜ.
Tabela 5. Quantidade de inoculação da mistura de meio/acetosiringona feita de acordo com o número de construtos a serem preparados.
[00211] Para cada construto, 1 a 2 alças de Agrobacterium da placa YEP foram suspensas em 15 ml_ de uma mistura de meio de inocula-ção/acetosiringona dentro de um tubo de centrífuga estéril, descartável de 50 mL e a densidade óptica da solução a 600 nm (OD6oo) foi medida em um espectrofotômetro. A suspensão foi então diluída para OD6oo 0,25- 0,35 usando uma mistura de meio de inoculação/acetosiringona adicional. Um tubo da suspensão de Agrobacterium foi colocado então horizontalmente sobre uma plataforma de agitação ajustada para cerca de 75 rpm em temperatura ambiente entre 1 e 4 horas antes do uso.
[00212] Esterilização da Espiga e Isolamento do Embrião. Espigas de Zea mays cultivar B104 foram produzidas em instalações de estufa e colhidas 10 a 12 dias depois da polinização. As espigas colhidas foram descascadas e a superfície esterilizada por imersão em uma solução 20% de branqueador comercial (Ultra Clorox® Germicidal Bleach, hipoclorito de sódio 6,15%) e duas gotas de TWEEN™ 20, por 20 minutos, seguido por três lavagens em água estéril deionizada dentro de uma capela de fluxo laminar. Embriões zigóticos imaturos (1,8 a 2,2 mm de comprimento) foram removidos assepticamente de cada espiga e distribuídos em um ou mais tubos de micro-centrífuga contendo 2,0 mL de suspensão de Agrobacterium, na qual 2 pl do tensoa-tivo BREAK-THRU® S233 10% tinham sido adicionados.
[00213] Co-cultivo de Agrobacterium. Depois da finalização da atividade de isolamento do embrião, o tubo dos embriões foi fechado e colocado uma plataforma basculante por 5 minutos. Os conteúdos do tubo foram então vertidos sobre uma placa com meio de Co-cultura e a suspensão líquida de Agrobacterium foi removida com uma pipeta de transferência estéril, descartável. Os embriões foram orientados com o escutelo para cima usando um microscópio. A placa de co-cultura com os embriões foi então colocada no fundo de uma capela de fluxo laminar com a tampa entreaberta por 15 minutos adicionais. A placa foi então lacrada com fita micropore 3M e colocada em uma incubadora a 25°C com 24 horas de luz do dia em aproximadamente 60 pmol m'2s'1 de intensidade luminosa.
[00214] Seleção do Calo e Regeneração de Eventos Transgênicos. Depois do período de co-cultura, os embriões foram transferidos para um meio de Repouso. Não mais do que 36 embriões foram movidos para cada placa. As placas foram embrulhadas com fita micropore 3M e incubadas a 27°C com 24 horas de luz do dia em aproximadamente 50 μιτιοΙ rrf2s'1 de intensidade luminosa por 7 a 10 dias. Os embriões com calo foram transferidos para o meio Seleção I. Não mais do que 18 embriões com calo foram movidos para cada placa de Seleção I. As placas foram embrulhadas com fita micropore 3M e incubadas a 27°C com 24 horas de luz do dia em aproximadamente 50 pmol m'2s'1 de intensidade luminosa por 7 dias. Os embriões com calo foram transferidos para o meio Seleção II. Não mais do que 12 embriões com calo foram movidos para cada placa de Seleção II. As placas foram embrulhadas com fita micropore 3M e incubadas a 27°C com 24 horas de luz do dia em aproximadamente 50 pmol m'2s'1 de intensidade luminosa por 14 dias.
[00215] Nesse estágio, os calos restantes foram movidos para o meio de Pre-Regeneração. Não mais do que 9 calos foram movidos para cada placa de Seleção I. As placas foram embrulhadas com fita micropore 3M e incubadas a 27°C com 24 horas de luz do dia em aproximadamente 50 pmol rrf2s'1 de intensidade luminosa por 7 dias. Os calos regenerados foram então transferidos para meio de Regeneração em PHYTATRAYS™ e incubados a 25,5°C com 16 horas de luz/8 horas de escuro por dia em aproximadamente 90 pmol m"2s'1 de intensidade luminosa por 7 a 14 dias ou até que as mudas se desenvolvessem. Não mais do que 5 calos foram colocados em cada PHYTATRAY™. Pequenos brotos com raízes primárias foram então isolados e transferidos para o meio de Alongamento de Broto. Plântu-las enraizadas com cerca de 6 cm ou mais altas foram transplantadas para o solo e movidas para uma câmara de crescimento.
[00216] Isolamento de DNA Genômico para PCR em Tecidos de Plantas. Amostras de tecido (um pedaço de folha equivalente a 2 perfurações de folha usando um furador de papel padronizado) foram coletadas em placas de coleta de 96 poços (QIAGEN #19560). A ruptura do tecido foi realizada com um pulverizador de tecido KLECKO™ (Garcia Manufacturing, Visalia, CA) em tampão de lise BIOSPRINT96™ AP1 com uma esfera de aço inoxidável. Depois da maceração do tecido, o DNA genômico foi isolado em um formato de alto rendimento usando o kit BIOSPRINT96™ Plant (QIAGEN, #69181) que usa o robô de extração BIOSPRINT96™. O DNA genômico foi diluído em 2:3 DNA/H20 antes de realizar a reação de qPCR para obter os escores Cp apropriados.
[00217] qPCR. A detecção de transgene pelo ensaio de hidrólise da sonda foi realizada pela PCR em tempo real usando o sistema LightCycler®480 (Roche Applied Science). Os ensaios foram designados para AAD-1 usando PRIMER EXPRESS™ e a região 3’ do promotor ZmUbil (zmUbiLNK) e o gene de resistência a espectinomi-cina (specR) usando o LightCycler® Probe Design Software 2.0. Os ensaios forma mulplexados com o ensaio de invertase de referência interna para assegurar que o gDNA estivesse presente em cada ensaio. Para a amplificação, a mistura LightCycler®480 Probes Master (Roche Applied Science, #04707494001) foi preparada em uma concentração final de 1X em uma reação multiplex com um volume de 10 pL contendo 0,4 pM de iniciador e 0,2 pM de sonda. Tabela 6. Uma reação de amplificação em duas etapas foi realizada com uma extensão 60Ό por 40 segundos com aquisição fluorescente . Tabela 6.
[00218] Os escores Cp, o ponto no qual o sinal fluorescente cruza o limiar de fundo usando o algoritmo de pontos de ajuste (programa de liberação LightCycler® 1.5) e o módulo RELATIVE QUANT™ (baseado no método AACt) foi usado para realizar a análise dos dados de PCR em tempo real.
Tabela 6. Iniciadores e sondas para o ensaio HP.
Tabela 7. Componentes da reação e condições para a análise de T0 [00219] Extração de Proteína. O tecido da folha de planta foi amostrado no estágio V3 a V5 dentro de um dia da coleta do bioensaio, Duas amostras de folha com 6 mm de diâmetro forma armazenados em um suporte de tubos aglomerados de 96 poços a -80°C até o dia da análise. Two Daisy™ Steel BB’s e 300 pL de tampão de extração (solução de PBS contendo TWEEN™ 20 0,05% e 5 pL/mL de inibidores de protease (SIGMA™ número de catálogo 9599) foram adicionados a cada tubo. As amostras foram trituradas em um pulverizador de tecido KLECKO™ por 3 minutos, no ajuste máximo. 85 pL de tampão de amostra desnaturante NuPage™ e 15 pL de DTT foram adicionados a cada tubo de amostra. As amostras foram cuidadosamente misturadas, aquecidas por 5 minutos a 90°C e depois centrifugadas a 3000 rcf. O sobrenadante foi removido e testado no mesmo dia.
[00220] Produção de Western Blot. A eletroforese convencional e os métodos de blotting (Gallagher et al. (2008) Curr. Prot. Immolunol. 8(10):1-28) foram usados com instrumentos da INVITROGEN™ e rea-gentes básicos. Um anticorpo anti-Cry1Ab nuclear de coelho foi o anticorpo primário utilizado com o sistema de detecção de quimiolumines-cência.
[00221] Método Quantitativo. O ELISA usado para a quantificação de CrylAb nesse estudo foi ENVIROLOGIX™ Número de Catálogo ΑΡ003, usando uma proteína CrylAb purificada como o modelo.
[00222] Bioensaio de inseto em T0. Plantas transgênicas contendos genes únicos de Bt foram testadas quanto a atividade inseticida em bioensaios conduzidos com larvas neonatas de lepidóptero sobre folhas de plantas transgênicas. As espécies lepidópteras ensaiadas eram a Broca do Milho Europeu, Ostrinia nubilalis Hübner (ECB) e a Larva da Traça do Milho, Helicoverpa zea (CEW).
[00223] Bandejas com 32 poços (C-D International, Pitman, NJ) foram parcialmente preenchidas com uma solução de ágar 2% e o ágar foi deixado solidificar. Seções de folha (aproximadamente 6,45 cm2 (1 in2)) foram retiradas de cada planta e colocadas separadamente em poços das bandejas de 32 poços. Um pedaço de folha foi colocado em cada poço e dois pedaços de folha foram testadas por planta e por inseto. Os insetos infestaram em massa usando um pincel, colocando 10 larvas neonatas em cada poço. As bandejas foram lacradas com tampas adesivas perfuradas que permitiam a ventilação durante o teste. As bandejas foram colocadas a 28°C, RH 40%, 18:8 horas de cal-ro:escuro por três dias. Depois da duração do teste, um escore de percentual de dano foi feito para cada pedaço de folha. Os escores de danos para cada teste foram calculados e usados junto com a análise de expressão de proteína para conduzir as análises de correlação.
[00224] Produção de Semente de T-\. Eventos selecionados de todos os três antecedentes foram identificados quanto ao progresso para a próxima geração com base no número de cópias dos genes, nível de expressão de proteína como medido por ELISA, proteção no bioensaio de folha e saúde global da planta. Os eventos que continham o gene de resistência à espectinomicina (SpecR) foram notados, mas não necessariamente omitidos da progressão; esses eventos foram testados na estufa, mas foram usados em berçários de inverno ou bandejas de campo.
[00225] Os eventos selecionados para progressão foram transplantados em potes de 18,92 litros. As observações foram feitas periodicamente para rastrear quaisquer fenótipos anormais. Sacos de mudas foram colocados sobre as mudas antes da emergência do cabelo para evitar a contaminação cruzada com pólen isolado. Quaisquer mudas que produzem cabelos antes da cobertura foram anotadas e a muda foi removida. A segunda muda foi então coberta e usada para as polinizações. As plantas que produziram mudas anormais ou não produziram mudas foram registradas no banco de dados. Os cabelos foram cortados no dia anterior as polinizações para fornecer uma escova uniforme para aceitar o pólen. O pólen do cultivar natural B104 foi usado para todas as polinizações. Cruzamentos recíprocos foram realizados quando possível. As informações da polinização foram registradas para os propósitos de rastreamento no banco de dados. As espigas foram descascadas 21 dias depois da polinização para intensificar a secagem seguida pela colheita completa (espiga removida da planta) com 42 dias depois da polinização. As espigas foram colocadas na secadora por 1 semana, seguido pelo processamento da semente (remoção da polpa, contagem e embalagem em envelopes pré-impressos).
[00226] A Tabela 8 descreve os componentes de vários meios usados nos protocolos precedentes.
Tabela 8. Componentes do meio de planta Resultados e Discussão [00227] Resultados da Transformação. As frequências de transformação foram avaliadas para cada construto. Tabela 9. A frequência de transformação foi avaliada pela divisão do número de eventos que produziram pelo menos uma planta pronta para isolar (Total de Eventos Regeneráveis) pela soma de todos os embriões infectados com Agrobacterium (Total de Embriões Tratados). Em adição, a Tabela 9 lista o número de plantas com resultados negativos de qPCR entre o total que foi testado. Existe um amplo grau de variação na frequência de transformação estimada, variando entre 4,9% a 30,0% como mostrado na FIG. 2.
Tabela 9. Resumo da frequência de transformação estimada para cada um dos construtos individuais. Pelo menos 25 eventos foram produzidos para cada construto.
[00228] Ensaio de qPCR para Detecção do Número de Cópias. A detecção do transgene pelo ensaio de hidrólise da sonda foi realizada pelos ensaios de PCR em tempo real designados para identificar o número de cópias do gene AAD-1. Como 3 sequências de DNA diferentes foram implementadas, o gene crylAb não era o alvo do ensaio da hidrólise da sonda. Ao contrário, uma região do cassete do gene crylAb que estava presente em todos os antecedentes foi utilizada. A região, localizada a montante do gene crylAb e que consistia em uma porção do íntron 1 de ZmUbil (um poliligante para facilitar a clonagem e a sequência de Kozak que precede o sítio de início da tradução) foi identificada. A confirmação da presença dessa região indicou a presença do cassete do gene crylAb; ele não foi usado para determinar o número de cópias, apenas a presença ou a ausência da região.
[00229] Esses dois ensaios (AAD-1 e ligante de CrylAb) foram mul-tiplexados com o gene de invertase do ensaio de referência interno para assegurar que o gDNA estava presente em cada ensaio. Adicionalmente, ensaios foram designados para identificar a presença do gene specR, para determinar quais eventos não devem ser propostos para a próxima geração para uso no teste de campo. Durante o curso do mesmo experimento, os dados da análise molecular foram implementados para remover eventos negativos ou eventos que contêm 3 ou mais cópias do gene AAD-1 da população e para assegurar que apenas eventos com poucas cópias contendo ambos os genes crylAb e AAD-1 fossem propostos para o CONVIRON™ e a estufa para testes adicionais. Todos os precedentes produziram pelo menos 20 eventos com poucas cópias (1-2). Entretanto, o precedente pDAB111447 produziu o maior percentual de eventos com cópia única (isto é, 32,3%). Tabela 10.
Tabela 10. Os eventos foram analisados usando o ensaio de hi-drólise da sonda para: AAD-1 para determinação do número de cópias; uma região ligante entre o promotor de Ubiquitina do milho e o início ATG de crylAb encontrado em todos os antecedentes, para presença ou ausência; o gene specR para presença ou ausência; assim como o gene nativo do milho, invertase, quanto a intensidade relativa do sinal.
[00230] Análise de Proteína. Todos os eventos com poucas cópias que passaram pelo crivo da análise molecular de cada um dos três antecedentes foram analisados quanto ao nível de proteína CrylAb. O antecedente rico em GC, pDAB111447, exibiu um nível de expressão médio significativamente maior de CrylAb, quando comparado com outros dois antecedentes com um valor de 45,3 ng/cm2. O antecedente de milho com desvio de códon, pDAB111448, tinha uma expressão média de 23,8 ng/cm2 e a proteína descrita na Publicação de Patente U.S. No. 2012/0266335 A1 (pDAB111449) tinha um nível de expressão médio de 5,8 ng/cm2. As análises estatísticas dos níveis da proteína CrylAb detectados nos eventos T0 de cada antecedente estão descritos na FIG. 3 e resumidos na Tabela 11.
Tabela 11.0 número de eventos para cada antecedente que foram incluídos na determinação quantitativa por ELISA da expressão da proteína CrylAb. A expressão média variou entre 5,8 a 45,3 ng/cm2 dos diferentes antecedentes.
[00231] Western blots foram completados sobre eventos selecionados de cada antecedente para garantir que a proteína era estável e do tamanho correto. Um Western blot representativo que consistia em amostras do controle (pDAB107645) contendo CrylAb de extensão completa e eventos T0 de pDAB111447; pDAB111448; e pDAB111449 está ilustrado na FIG. 4. A proteína CrylAb truncada pode ser detectada em eventos de cada um dos antecedentes, junto com produtos de quebra de 20 e 18 kD de tamanho. Os controles CrylAb de extensão completa de T1 são conhecidos por serem ativos no bioensaio e expressam CrylAb abaixo do nível de detecção para o anticorpo.
[00232] Resultados do Bioensaio de Eventos T0. Materiais de folha dos eventos que representam os antecedentes pDAB111447, pDAB111448 e pDAB111449 foram coletados no estágio V5 de desenvolvimento e inoculados com larvas de CEW, ECB e de broca do milho europeu resistente a CrylFa (rECB). O ensaio durou 3 dias e os eventos T0 foram avaliados quando alcançaram o estágio de desenvolvimento V5. As amostras foram então graduadas quanto ao dano do tecido da folha. As FIGs. 5 a 7 contêm os resultados do bioensaio para CEW, ECB e rECB, respectivamente. Os eventos dos três cons-trutos atuaram igualmente bem contra todas as três pragas. Cada um atuou assim como o controle HERCULEX® contra CEW e ECB e cada um tinha menos do que 20% de dano da folha contra rECB.
[00233] Polinizações. Eventos com cópia única, de alta expressão como determinada pela análise de AAD-1, que também foram determinados ser positivos para o cassete de gene de CrylAb foram considerados para a progressão para a geração T-ι. Eventos contendo o gene SpecR foram omitidos do processo de progressão. Dez eventos de cada antecedente foram progredidos para a geração 1% As plantas foram polinizadas de forma cruzada com eventos do doador B104 de modo recíproco para assegurar que a semente seja recuperada para avaliação na geração 1% Os eventos que foram progredidos para a produção de semente T-i são mostrados na Tabela 12.
Tabela 12. Resumo dos dados de cada um dos eventos que foram progredidos para a produção de semente Todos os eventos foram positivos para a detecção do ligante Zmllbil e negativos para a detecção de SpecR. Cada evento foi polinizado de modo cruzado com B104.
Conclusões [00234] Sequências múltiplas de DNA foram avaliadas que codificam a proteína CrylAb truncada e pDAB111447 (modificada adicionalmente para incluir um conjunto específico de sequências de polia-denilação que foram identificadas na composição de DNA do gene nativo na posição de nucleotídeo idêntica no gene reconstruído) foi identificado como um gene inesperadamente superior que será utilizado em um empilhamento de gene de controle de Lepidoptera acima do solo. Três sequências de DNA diferentes, abrangendo várias metodologias de design de DNA, foram avaliadas no milho na geração T0. Todas as três sequências de DNA foram combinadas com um plasmídeo binário de transformação em planta que consiste em componentes idênticos para a expressão da proteína CrylAb. Apenas a própria sequência de DNA foi variada entre os construtos.
[00235] A expressão de proteína variou entre um mínimo de 5,8 ng/cm2 para a expressão média na população T0 (observada no antecedente pDAB111449) até um máximo de 45,3 ng/cm2, como detectado no antecedente pDAB111447. Portanto, pDAB111447 fornece um aumento de 8 vezes. Eventos individuais foram registrados para ex- pressar a proteína CrylAb em quantidades tão grandes quanto 68 ng/cm2 no antecedente pDAB111447. pDAB111447 também produziu o maior percentual de eventos com cópia única comparado com os outros dois antecedentes. Entretanto, a eficiência da transformação com pDAB111447 foi muito menor (4,5%), em comparação com os outros dois antecedentes (ambos cerca de 25%).
[00236] A expressão coletiva da proteína CrylAb medida nos eventos do antecedente pDAB111447 e a atividade contra CEW, ECB, e rECB no bioensaio de inseto na folha foram fatores-chave na progressão dessa sequência de DNA para um empilhamento de gene de controle de Lepidoptera acima do solo. Essa versão de CrylAb truncada será combinada com um gene CrylFa em alguns empilhamentos de gene exemplificadores.
Exemplo 2: Avaliação de Múltiplas Sequências de DNA que Codificam a Proteína CrylAb Truncada quanto ao Impacto sobre a Expressão de Gene no Milho T0 [00237] Esse experimento avaliou 11 sequências diferentes de DNA que codificam a proteína CrylFa truncada idêntica. As 11 versões diferentes do gene crylFa foram testadas em um vetor de transformação em planta binário. Os genes foram clonados em cassetes de expressão de gene idênticos que possuem o mesmo cassete marcador sele-cionável. A única variável em cada plasmídeo é a sequência real de DNA que codifica a proteína CrylFa truncada.
Materiais e Métodos [00238] Design de genes CrylFa sintéticos. A proteína CrylFa truncada usada nesse estudo consiste nos aminoácidos que correspondem aqueles encontrados nas posições 1 a 605 da proteína CrylFa nativa de extensão completa. A forma truncada do gene nativo crylFa que codificou os aminoácidos 1 a 605 foi analisada quanto a presença de 16 sequências de poliadenilação distintas. Tabela 13. A localização e a composição dessas 22 sequências foram registradas e estão incluídas no design das sequências do gene truncado crylFa que foram avaliadas.
[00239] Onze sequências diferentes do gene crylFa foram designadas para testar hipóteses de restruturação diferentes. Versões pré-existentes de CrylFa incluem uma sequência com desvio de códon de milho, 2 sequências com desvio de códon de planta e uma descrita na Publicação de Patente U.S. No. US 2012/0266335 A1. Cada versão do gene crylFa foi cortado para fornecer a proteína correspondente que consiste nos aminoácidos 1 a 605 e a composição do DNA foi alterada para incluir as 22 sequências de poliadenilação acima mencionadas encontradas no gene nativo.
[00240] Várias versões novas do gene foram designadas para testar diferentes hipóteses de restruturação. A sequência de DNA de tipo selvagem que codifica a toxina do núcleo CrylFa foi traduzida na sequência de aminoácidos correspondentes e ela foi traduzida de forma reversa usando o códon mais preferido para cada aminoácido, usando o programa OptGene™ 2.0 (Ocimum Biosolutions, Banjara Hills Hyde-rabad, India). A sequência de DNA resultante foi analisada e os có-dons foram substituídos, onde necessário, para restaurar as sequências identificadas na Tabela 13, para remover fases de leitura abertas indesejadas e para remover sítios de restrição indesejados. Fileiras estendidas de G+C e A+T foram ignoradas nesse design de gene inicial. A sequência de aminoácidos foi preservada e a sequência de DNA resultante é referida aqui como "IRDIG.586.34." IRDIG.586.34 foi modificada adicionalmente, eliminando as fileiras de G+C e A+T que se estendem por seis bases ou mais, pela substituição de uma base para romper a fita consecutiva de códons G+C ou A+T onde possível. Como antes, a composição da sequência de aminoácidos foi preservada. A sequência de DNA resultante é referida aqui como "IRDIG.586.35." [00241] O gene crylFa de milho com desvio de códon pré-existente foi modificado pela restauração das sequências identificadas na Tabela 13, com a preservação da sequência de aminoácidos. A sequência de DNA resultante é referida aqui como "IRDIG.586.36." IRDIG.586.36 foi modificada adicionalmente pela análise do DNA e alterando os có-dons quando necessário para remover fases de leitura abertas indese-jadas e para remover sítios de restrição indesejados, enquanto se preserva a sequência de aminoácidos. A sequência de DNA resultante é referida aqui como "IRDIG.586.37." [00242] As duas versões de planta com desvio de códon pré-existentes do gene crylFa foram modificadas, novamente pela restauração das sequências identificadas na Tabela 13. A sequência de aminoácidos de cada uma foi preservada. As sequências de DNA resultantes são referidas aqui como "IRDIG.586.38" e "IRDIG.586.42", respectivamente. IRDIG.586.38 foi modificada posteriormente pela análise do DNA e alterando os códons quando necessário para remover fases de leitura abertas indesejadas e para remover sítios de restrição indesejados. A sequência de aminoácidos foi preservada. A sequência de DNA resultante é referida aqui como "IRDIG.586.39." [00243] A sequência de CrylFa truncada descrita na Publicação de Patente U.S. No. 2012/0266335 A1 foi utilizada para comparação. Essa sequência é referida aqui como "IRDIG.586.40." IRDIG.586.40 foi modificada adicionalmente, eliminando as fileiras de G+C e A+T que se estendem por seis bases ou mais, pela substituição de uma base para romper a fita consecutiva de códons G+C ou A+T onde possível, com a preservação da sequência de aminoácidos no produto codificado. A sequência de DNA resultante é referida aqui como "IRDIG.586.41." [00244] Uma sequência adicional foi designada especificamente pela tradução reversa usando uma tabela de distribuição de códon de aminoácidos que correspondia aos níveis nos quais cada códon estra-va presente no gene de milho típico. Códons raros (isto é, códons presentes em 10% ou menos) não foram incluídos. A sequência de DNA resultante foi analisada e os códons foram trocados onde necessário para remover fases de leitura abertas indesejadas, para remover sítios de restrição indesejados, para restaurar as sequências identificadas na Tabela 13 e para remover fileiras estendidas de G+C e A+T onde possível. A sequência de DNA resultante é referida aqui como "IRDIG.586.43." Tabela 13. As sequências descobertas no gene nativo crylFa que foram incluídas na reconstrução de genes avaliados nesse experimento. As sequências AATAAA encontradas no gene nativo confrontando a posição de nucleotídeo 426 e 582 foram alteradas para AATCAA nas mesmas localizações nos genes reconstruídos.
[00245] As 11 versões diferentes do gene truncado crylFa foram avaliadas quanto ao conteúdo total de G+C. O total variou de um mínimo de 46,9% de G+C em IRDIG.586.38, até um máximo de 64,1% de G+C em IRDIG.568.36. O conteúdo de G+C para cada versão do gene, incluindo o gene de CrylFa HERCULEX® (isto é, "Cry1F trunc HX"), é encontrado na Tabela 14.
Tabela 14. O conteúdo de G+C para cada uma das 11 versões diferentes de CrylFa.
[00246] Cada um dos 10 genes crylFa truncados descritos acima (IRDIG.568.34-IRDIG.568.43) foi sintetizado (DNA2.0; Menio Park, CA).
[00247] Construção do Vetor de Expressão em Planta. Métodos padronizados de clonagem foram usados na construção de vetores de entrada contendo cassetes de expressão de crylFa. Veja, por exemplo, Sambrook et al. (1989) Molecular Cloninq: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. Plasmídeos binários de Agrobacterium que continham cassetes de expressão de crylFa foram manipulados usando GATEWAY® (Invitro-gen, Carlsbad, CA) e foram usados na transformação de planta mediada por Agrobacterium. Endonucleases de restrição foram obtidas do New England BioLabs (NEB™; Ipswich, MA), e a T4 DNA Ligase (Invi-trogen) foi usada para ligação ao DNA. A amplificação por PCR foi realizada usando PHUSION™ High-Fideiity DNA Polymerase (NEB) e os iniciadores sintetizados pela Integrated DNA Technologies Inc. (IDT™; Coralville, IA). As reações GATEWAY® foram realizadas usando a mistura de enzima GATEWAY® LR CLONASE® (Invitrogen) para montagem de um vetor de entrada e um vetor de destino. As preparações de plasmídeo foram realizadas usando NucleoSpin® Plasmid Kit (Mache-rey-Nagel Inc., Bethlehem, PA) ou o Plasmid Midi Kit (QIAGEN) de acordo com as instruções dos fornecedores. Fragmentos de DNA foram isolados usando o QIAquick® Gel Extraction Kit (QIAGEN) depois de eletroforese em gel de agarose acetato de Tris.
[00248] Dez genes sintéticos que codificam CrylFa de acordo com os designs de DNA precedentes foram obtidos nos plasmídeos DASDNA426 - DASDNA435. A construção do vetor de expressão em planta foi iniciada com a inserção de gene crylFa sintético em pDAB101557, entre o promotor ZmUbil e a região 3’ não traduzida (3’ UTR) ZmPer5 sobre um fragmento BamHI/SacI, criando os vetores de entrada pDAB111424-pDAB111433, respectivamente. Os vetores de entrada pDAB111424 até pDAB111433 foram recombinados cada um usando a tecnologia GATEWAY® com o vetor de destino pDAB109805, que continha o promotor do cassete marcador selecionável SCBV(MAM) v2/AAD-1 v3/ZmLip 3’UTR v1, para criar os vetores binários finais pDAB111434-pDAB111443, respectivamente.
[00249] Dois vetores de expressão em planta adicionais forma mon- tados com o gene crylFa truncado a partir de pMYC2405. O primeiro dos mesmos incluiu um fragmento que continha crylFa que foi amplificado por PCR a partir de pMYC2405 com os iniciadores pMYC2405 F (G AT C AT ACC AT G G AG AAC AAC AT AC AG AAT C AGT G C; SEQ ID NO:28) e pMYC2405 R (GATCTCGAGCTCGCGAAAGCTTGGC; SEQ ID NO:29). O fragmento amplificado com 1869 bp foi digerido com Ncol/Sacl e inserido em pDAB101557 para criar o vetor de entrada pDAB110830 que foi subsequentemente recombinado usando a tecnologia GATEWAY® com o vetor de destino pDAB109805, para criar pDAB110839. O plasmídeo final foi montado pela inserção do fragmento Sacl-blunted EcoRI de pMYC2405 em pDAB110831, criando o vetor de entrada pDAB110833. Uma reação de recombinação GATEWAY® com pDAB110833 e pDAB109805 resultou em pDAB110842.
[00250] Colônias de todos os plasmídeos montados foram inicialmente rastreados pela digestão de restrição de miniprep DNA. O plasmídeo de DNA de clones selecionados foi sequenciado (EUROFINS™ MWG Operon, Huntsville, AL) e os dados da sequência foram reunidos e analisados usando o programa SEQUENCHER™ (Gene Codes Corp. Ann Arbor, Ml). Mapas dos plasmídeos refletem a sequência. FIG. 8.
[00251] Produção da Cepa de Agrobacterium tumefasciens. Os detalhes do plasmídeo de DNA derivado de E. coli usado para desenvol- ver as cepas de Agrobacterium tumefaciens para transformação em planta são fornecidos na Tabela 15. DAt13192, uma cepa ternária re-cA de A. tumefaciens, foi a cepa de base selecionada para o desenvolvimento dessas cepas de transformação em planta, usando protocolos de transformação padronizados. O desenvolvimento de novas cepas de A. tumefaciens estavelmente transformadas com o vetor binário de interesse foi confirmado pela digestão de restrição de cada cepa, resultando na validação de pelo menos uma colônia para cada construto.
Tabela 15. Plasmídeo de DNA derivado de E. coli usado para desenvolver as cepas de A. tumefaciens para transformação de planta.
[00252] A iniciação da cultura de Agrobacterium, esterilização da espiga, isolamento do embrião, inoculação e co-cultura foram realizadas substancialmente como descrito no Exemplo I.
[00253] Seleção de Calo e Regeneração de Eventos Transgênicos. Depois do período de co-cultura, os embriões foram transferidos para o meio de Repouso. Não mais do que 36 embriões foram transferidos para cada placa. As plantas foram embrulhadas com fita micropore 3M e incubadas a 27°C com 24 horas de luz do dia em aproximadamente 50 pmol m'2s'1 de intensidade luminosa por 7 a 10 dias. Os embriões com calo foram transferidos para o meio Seleção I. Não mais do que 18 embriões com calo foram movidos para cada placa de Seleção I. As placas foram embrulhadas com fita micropore 3M e incubadas a 27°C com 24 horas de luz do dia em aproximadamente 50 pmol m'2s'1 de intensidade luminosa por 7 dias. Os embriões com calo foram transferidos para o meio Seleção II. Não mais do que 12 embriões com calo foram movidos para cada placa de Seleção II. As placas foram embrulhadas com fita micropore 3M e incubadas a 27°C com 24 horas de luz do dia em aproximadamente 50 pmol rrf2s'1 de intensidade luminosa por 14 dias.
[00254] Nesse estágio, os calos restantes foram movidos para o meio de Pre-Regeneração. Não mais do que 9 calos foram movidos para cada placa de Seleção I. As placas foram embrulhadas com fita micropore 3M e incubadas a 27°C com 24 horas de luz do dia em aproximadamente 50 pmol m"2s"1 de intensidade luminosa por 7 dias. Os calos regenerados foram então transferidos para meio de Regeneração em PHYTATRAYS™ e incubados a 25,5°C com 16 horas de luz/8 horas de escuro por dia em aproximadamente 90 pmol m'2s'1 de intensidade luminosa por 7 a 14 dias ou até que as mudas se desenvolvessem. Não mais do que 6 calos foram colocados em cada PHYTATRAY™. Pequenos brotos com raízes primárias foram então isolados e transferidos para o meio de Broto/raiz. Plântulas enraizadas com cerca de 6 cm ou mais altas foram transplantadas para o solo e movidas para uma câmara de crescimento.
[00255] Transferência e Estabelecimento de Plantas T0 na Estufa. Plantas transgênicas foram identificadoras únicas (uma planta por evento) e transferidas em base regular para a estufa. As plantas foram transplantadas da PHYTATRAY™ para pequenos potes (T.O. Plastics, 3.5" SVD, 700022C) preenchidos com meio de crescimento (Premier Tech Horticulture, ProMix BX, 0581 P), e cobertos com um humidome, para ajudar a aclimatar as plantas ao ambiente da estufa (Tipo de Exposição a Luz: Foto ou Assimilação; Limite Luminoso Superior: 1200 PAR; 16 horas por dia; 27V, Dia/24O Noite).
[00256] Isolamento de DNA genômico; qPCR (Veja Tabela 7); extração de proteína; produção de Western blot; e análise quantitativa foram realizados substancialmente como descrito no Exemplo I.
[00257] Produção de Semente T·). Eventos selecionados de cada um dos doze plasmídeos foram selecionados para progressão para a próxima geração com base no número de cópias dos genes, nível de ex- pressão de proteína como medido por ELISA e saúde global da planta. Os eventos que continham o gene SpecR foram testados na estufa, mas foram usados em berçários de inverno ou bandejas de campo. Os eventos selecionados para progressão foram transplantados em potes de 18,92 litros. As observações foram feitas periodicamente para ras-trear quaisquer fenótipos anormais. Sacos de mudas foram colocados sobre as mudas antes da emergência do cabelo para evitar a contaminação cruzada com pólen isolado. Quaisquer mudas que produzem cabelos antes da cobertura foram anotadas e a muda foi removida. A segunda muda foi então coberta e usada para as polinizações. As plantas que produziram mudas anormais ou não produziram mudas foram registradas no banco de dados. Os cabelos foram cortados no dia anterior as polinizações para fornecer uma escova uniforme para aceitar o pólen. O pólen do cultivar natural B104 foi usado para todas as polinizações. Cruzamentos recíprocos foram realizados quando possível. As informações da polinização foram registradas para os propósitos de rastrea-mento no banco de dados. As espigas foram descascadas 21 dias depois da polinização para intensificar a secagem seguida pela colheita completa (espiga removida da planta) com 42 dias depois da polinização. As espigas foram colocadas na secadora por 1 semana, seguido pelo processamento da semente (remoção da polpa, contagem e embalagem em envelopes pré-impressos).
Resultados e Discussão [00258] Transformação. As eficiências de transformação para cada construto foram calculadas e reunidas na Tabela 16. Existe um amplo grau de variação na frequência de transformação, variando entre 4% a 23%. Os antecedentes pDAB111434 e pDAB111436 tiveram a mais baixa eficiência de transformação (5% e 4%, respectivamente), enquanto que os antecedentes pDAB111435 e pDAB110839 exibiram as mais altas taxas de transformação (cada uma atingindo 23%). Plântu- Ias que emergem de pDAB111436 e pDAB111437 demonstraram descoloração nas mudas e folhas e epinastia nas folhas e caules. FIG. 9. A maioria dos mesmos eventos não sobreviveu e não foram analisados pela análise molecular.
Tabela 16. Sumário da frequência de transformação (ajustada para AAD-1) para cada um dos plasmídeos individuais. Pelo menos 25 eventos foram produzidos para cada um dos antecedentes. Entretanto, várias plântulas do antecedente pDAB11436 continham uma pigmentação vermelha e demonstravam enrolamento do caule e da folha e não saudáveis o suficiente para progredirem para análise. 00259] Os vários antecedentes que contêm cry1F foram compara- dos para determinar a significância estatística do efeito que sequência de DNA teve sobre a transformação. O número de eventos produzidos foi comparado como um percentual do número total de embriões tratados, para gerar uma frequência de transformação. O uso do programa de estatística JMP™ para completar uma análise de contingência, determinou que os antecedentes pDAB111435, pDAB 110839, e pDAB111442 eram estatisticamente iguais quanto a frequência de transformação, no nível 0,05 de significância. As frequências de transformação com pDAB110842, pDAB111440, pDAB111443, pDAB111437, pDAB111438, e pDAB111439 foram todas estatisticamente iguais. Adicionalmente, pDAB111441, pDAB111434 e pDAB111436 eram todos estatisticamente iguais já que as sequências de DNA fornecem as mais baixas frequências de transformação.
[00260] Ensaio de qPCR para Detecção do Número de Cópias. A detecção do transgene pelo ensaio de hidrólise da sonda foi realizado por PCR em tempo real. Os ensaios foram designados para identificar o número de cópias do gene AAD-1. Como 11 sequências diferentes de DNA foram utilizadas, o gene crylFa não foi o alvo do ensaio de hidrólise da sonda. Ao contrário, uma região do cassete do gene crylFa que estava presente em todos os antecedentes foi utilizada. A região, localizada a montante do gene crylFa e que consistia em uma porção do íntron 1 de ZmLIbil (um poliligante para facilitar a clonagem e a sequência de Kozak que precede o sítio de início da tradução) foi identificada. A confirmação da presença dessa região indicou a presença do cassete do gene crylFa-, ele não foi usado para determinar o número de cópias. Esses dois ensaios (AAD-1 e ligante de CrylFa) foram multiplexados com o gene de invertase do ensaio de referência interno para assegurar que o gDNA estivesse presente em cada ensaio. Adicionalmente, ensaios foram designados para identificar a presença do gene specR, para determinar quais eventos não devem ser propostos para a próxima geração para uso no teste de campo. Eventos negativos ou eventos que contêm 3 ou mais cópias do gene AAD-1 foram removidos da população e para assegurar que apenas eventos com poucas cópias contendo ambos os genes crylAb e AAD-1 fossem propostos para o CONVIRON™ e a estufa para testes adicionais. A Tabela 17 contém um resumo das análises conduzidas nos eventos de cada antecedente.
[00261] Os eventos do antecedente pDAB111435 (23% de frequência de transformação) também tinham o mais alto percentual de cópia única e poucos eventos de cópia (51,4% e 91,9%, respectivamente), com 24% dos eventos sendo positivos para o gene de resistência à espectinomicina. pDAB111436 teve o percentual mais baixo de eventos de cópia única (5,3%; 1 evento) e também o mais alto percentual de eventos com contaminação do arcabouço (52,6%).
Tabela 17. Eventos foram analisados usando o ensaio de hidrólise da sonda para: AAD-1 para determinação do número de cópias; uma região ligante entre o promotor de Ubiquitina do milho e o início ATG de crylFa encontrados em todos os antecedentes quanto a presença ou ausência; o gene specR quanto a presença ou ausência; assim como o gene nativo do milho, invertase, quanto a intensidade relativa do sinal.
[00262] Os vários arcabouços que contêm cry1F foram comparados para determinar a significância estatística do efeito da sequência de DNA sobre a geração de eventos de cópia única. O número de eventos que continha uma cópia única de AAD-1, como medido pelo ensaio de hidrólise da sonda, foi comparado como um percentual do número total de eventos e usando o programa estatístico JMP™, para completar a análise de contingência. A análise de contingência determinou que o número de eventos com uma cópia gerados pelos antecedentes pDAB111435, pDAB110839, pDAB111434, pDAB111438, pDAB111441, e pDAB111442 eram estatisticamente iguais no nível de significância 0,05, embora o percentual de eventos de cópia única variasse entre 51,4% a 21,9%.
[00263] Análise de Proteína. Todos os eventos com poucas cópias que passaram no crivo da análise molecular de cada um dos doze antecedentes foram avaliados quanto a expressão de proteína por um ensaio ELISA quantitativo para CrylFa. A FIG. 10 ilustra a expressão média de proteína dos eventos de cada um dos doze antecedentes. O nível de expressão de CrylFa em HERCULEX® na estufa foi determinado ser de 60 ng/cm2. Dois dos antecedentes (pDAB111434 e pDAB111435) forneceram um nível médio de expressão para todos os eventos T0, que era igual aquele de HERCULEX®, com vários eventos expressando CrylFa em níveis consideravelmente altos. pDAB110839 e pDAB110842, antecedentes que contêm a versão HERCULEX® de CrylFa e o cassete de gene HERCULEX®, respectivamente, forneceram níveis médios de expressão de CrylFa de 43,8 ng/cm2 e 45,1 ng/cm2, respectivamente. Os níveis médios de expressão de CrylFa para os eventos T0 de todos os outros antecedentes eram menores do que aqueles encontrados para pDAB110839 e pDAB110842, embora eventos específicos de pDAB111437, pDAB111438, e pDAB111439 foram determinados ser de ou estar acima do nível de 60 ng/cm2 de expressão. Tabela 18.
Tabela 18. Determinação por ELISA da expressão da proteína CrylFa dos vários antecedentes, variando entre 4 ng/cm2 a 62,8 ng/cm2 00264] Western blots foram completados sobre eventos selecionados de cada um dos antecedentes para assegurar que a proteína era estável e do tamanho correto. Duas bandas de proteína distintas puderam ser detectadas nos eventos da maioria dos antecedentes, incluindo o controle HERCULEX®. A banda mais larga (68 kDa) corresponde a proteína CrylFa truncada e um produto menor (66 kDa) corresponde a toxina CrylFa do núcleo totalmente processada. Um Western blot representativo que consiste de amostras dos eventos pDAB111434 e pDAB111435 é fornecida na FIG. 11.
[00265] Polinizações. Eventos de cópia única, de alta expressão como determinados pela análise de AAD-1 por PCR, que também foram determinados ser positivos para o cassete de gene crylFa, foram considerados para a progressão para a geração ΊΥ Na maioria dos antecedentes, os eventos que contêm o gene specR foram omitidos. Entretanto, nos antecedentes pDAB111437, pDAB111442, e pDAB111443, não havia eventos de cópia única sem specR suficientes, de modo que um único evento contendo specR de cada antece- dente foi incluído. Plantas dos mesmos eventos não foram incluídas em qualquer tipo de teste de campo e foram limitadas a teste na estufa. Adicionalmente, o antecedente pDAB111436 tinha apenas 1 evento de cópia única disponível e portanto quatro eventos de cópia múltipla foram selecionados para a progressão. Por outro lado, cinco eventos de cada antecedente foram progredidos para a geração T1f para polinização cruzada com eventos doadores de B104 de modo recíproco. Conclusões [00266] Múltiplas sequências de DNA foram avaliadas que podem codificar a proteína CrylFa truncada, para identificar a sequência de DNA de crylFa como um gene inesperadamente superior que será utilizado em um empilhamento de gene de controle de Lepidoptera acima do solo. Onze sequências diferentes de DNA que abrangem várias metodologias de design de DNA, foram avaliadas no milho na geração T0. Todos as onze sequências de DNA foram combinadas com um plasmídeo de transformação em planta binário que consiste em componentes idênticos para a expressão da proteína CrylFa. Apenas a própria sequência de DNA foi variada.
[00267] Vários parâmetros foram afetados pela sequência de DNA de crylFa. A expressão de proteína variou de um mínimo de 4 ng/cm2 para a expressão média na população T0 (antecedente pDAB111440), até um máximo de 62,6 ng/cm2 (antecedente pDAB111434), o que representou um aumento de 15 vezes na expressão. Eventos individuais foram registrados para expressar a proteína CrylFa tão alta quanto 120 ng/cm2 em ambos os antecedentes pDAB111434 e pDAB111435. A frequência de transformação entre 4% (pDAB111436) a 23% (ambos pDAB110839 e pDAB111435), respectivamente. A diferença na frequência de transformação foi estatisticamente significativa. Outro fator na seleção é o número de eventos de qualidade, particularmente eventos com cópia única do cassete de gene crylFa. Antecedentes com eventos de cópia única variaram entre 5% pDAB111436) a 51% (pDAB111435), respectivamente. Essa ampla faixa de frequência de transformação, número de cópias de DNA (eventos de alta qualidade) e expressão de proteína forneceu três áreas distintas para a identificação de um único antecedente para avançar em futuros experimentos de empilhamento.
[00268] A expressão coletiva da proteína CrylFa medida nos eventos dos antecedentes pDAB111434 e pDAB111435 foi maior do que em todos os outros antecedentes. Além disso, cada um dos dois antecedentes teve eventos individuais com os níveis mais altos de expressão da proteína CrylFa. As sequências de DNA dos mesmos dois antecedentes são muito similares; a sequência de DNA de pDAB111434 foi modificada para reduzir o número de fileiras de G+C e A+T que tinham 6 bases ou mais, para criar pDAB111435. Há um total de 32 bases de diferença entre os genes crylFa de pDAB111434 e pDAB111435, e o DNA é 98,2% idêntico. A expressão da proteína resultante é aproximadamente idêntica (62,6 e 60,8 ng/cm2), respectivamente. Entretanto, há uma diferença significativa na eficiência de transformação (5% e 23%), entre esses dois antecedentes. Adicionalmente, a diferença na qualidade da produção do evento de cópia única, como detectado pelo ensaio de hidrólise da sonda, foi estatisticamente significativa também; 32,3% em pDAB111434 e 51,4% em pDAB111435.
[00269] Os dois antecedentes que continham a versão HERCULEX® do gene crylFa, pDAB110839 (gene apenas) e pDAB110842 (cassete de gene) expressaram, cada um, a proteína CrylFa em níveis aproximadamente iguais; 43,8 e 45,1 ng/cm2, respectivamente. Esses dois antecedentes tinham versões idênticas da sequência de DNA, mas diferiam nos elementos regulatórios associados com o gene. O poliligante que precede o promotor em pDAB110842 inclui uma deleção de 24 pares de bases, comparado com pDAB110839. As versões diferentes do promotor 1 de Ubiquitina do milho foram usadas em cada antecedente, diferindo na sequência em 7 bases. A sequência líder que une o promotor ao início traducio-nal ATG tem uma discrepância de 5 pares de base e 19 bases adicionais no antecedente pDAB110839. Finalmente, a região 3’UTR para ambos os cassetes de gene são diferentes; o antecedente pDAB110839 tem a 3’UTR Per5 de Zea mays, enquanto que pDAB110842 tem a 3’UTR ORF25 de A. tumefaciens.
[00270] Em adições a diferenças estruturais, a eficiência de transformação e o percentual de evento de cópia única detectados nos dois antecedentes também variou. O antecedente pDAB110839 forneceu uma eficiência de transformação (23%) e uma frequência de eventos únicos (30,6%) estatisticamente maiores, quando comparado com o antecedente pDAB110842 (14% e 19%, respectivamente).
[00271] Os antecedentes remanescentes expressaram cada um CrylFa menos do que a média dos controles HERCULEX®. No caso de pDAB111436 e pDAB111437, expressão elevada durante o estágio de calo e plântulas jovens podem ter eliminado os eventos de alta expressão de cópia única da população, resultando em taxas menores de transformação e uma população com expressão reduzida de CrylFa. Algumas plântulas dos mesmos eventos foram relatadas ter uma descoloração vermelha nas folhas e caules com enrolamento severo da folha e das estruturas do caule, resultando em última análise em plantas pouco saudáveis. A utilização de um promotor mais fraco do que a ubiquitina 1 do milho em conjunto com essas sequências podem ter sido responsáveis pela menor expressão global e pDAB111436 e pDAB111437 podem ter sequências de DNA desejáveis com relação a expressão de proteína.
[00272] Ter uma sequência de DNA ótima para expressão de trans- gene em um hospedeiro particular pode ser crítico para obter os alvos de expressão. A expressão média de proteína de diferentes antecedentes variou de um mínimo de 4 ng/cm2 (observado em pDAB111440), a um máximo de 62,8 ng/cm2 (medido em pDAB111434). A expressão de eventos únicos variou entre 0 ng/cm2, detectada em todos os antecedentes, a um máximo de 120 ng/cm2 em ambos os antecedentes pDAB111434 e pDAB111435, provando que a integração em uma localização pobre do genoma do milho pode resultar na não expressão, independentemente do design do gene. Entretanto, um gene planejado para expressão ótima no hospedeiro pode ser expresso em níveis significativamente maiores quando comparado com um gene menos ótimo, se a integração ocorre em uma localização favorável para a expressão de gene, como demonstrado pelos exemplos particulares do mesmo, variando entre 10 ng/cm2 (pDAB111440) a 120 ng/cm2 (pDAB11434 e pDAB111435).

Claims (25)

1. Sistema para expressão de um polipeptídeo heterólogo de interesse em uma célula de uma planta, caracterizado pelo fato do sistema compreender: - um polinucleotídeo de referência que codifica um polipeptídeo de interesse a partir do genoma de um organismo diferente da planta; e - um polinucleotídeo sintético que possui uma sequência que compreende: - uma sequência que codifica o polipeptídeo de interesse, em que a sequência tenha um códon otimizado para remover todos os códons que são raros de acordo com o desvio de códon da planta, - pelo menos uma sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA, em que as sequências de poliadenilação estão presente no mesmo número e na mesma localização como no polinucleotídeo de referência e em que a sequência do polinucleotídeo sintético não compreende qualquer sequência de poliadenilação selecionada do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA em um número ou localização diferentes do polinucleotídeo de referência.
2. Sistema de acordo com a reivindicação 1, caracterizado pelo fato de que o polinucleotídeo sintético não compreende qualquer sequência de poliadenilação diferente daquelas do grupo que consiste em AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA, e CATAAA.
3. Sistema de acordo com a reivindicação 1, caracterizado pelo fato de que o polipeptídeo de interesse é uma proteína selecionada do grupo que consiste em proteínas inseticidas, proteínas de tolerância a herbicida, proteínas de tolerância ao estresse e proteínas para modificação do perfil de óleo.
4. Sistema de acordo com a reivindicação 3, caracterizado pelo fato de que o polipeptídeo de interesse é uma proteína inseticida.
5. Sistema de acordo com a reivindicação 3, caracterizado pelo fato de que o polipeptídeo de interesse é uma proteína ariloxial-canoato dioxigenase 1 (AAD1).
6. Sistema de acordo com a reivindicação 1, caracterizado pelo fato de que a planta é uma planta de soja ou milho.
7. Sistema de acordo com a reivindicação 1, caracterizado pelo fato de que o polinucleotídeo sintético compreende uma sequência 5’ não traduzida e uma região 3’ não traduzida, em que a sequência 5’ não traduzida compreende um promotor de planta operativamente ligado a sequência que codifica o polipeptídeo de interesse e em que a sequência 3’ não traduzida compreende uma sequência de terminação da transcrição.
8. Sistema de acordo com a reivindicação 1, caracterizado pelo fato de que o polinucleotídeo sintético é uma unidade transcricio-nal de planta.
9. Sistema de acordo com a reivindicação 8, caracterizado pelo fato de que o polinucleotídeo sintético é um vetor de expressão em planta.
10. Planta transgênica caracterizada pelo fato de conter o polinucleotídeo como definido na reivindicação 1.
11. Material de planta de uma planta transgênica como definida na reivindicação, caracterizado pelo fato de que o material de planta compreende um nível detectável do polinucleotídeo heterólogo de interesse.
12. Polinucleotídeo caracterizado pelo fato de compreender uma sequência de nucleotídeos selecionada do grupo que consiste em SEQ ID NO:1; SEQ ID NO:4, e SEQ ID NO:5.
13. Célula de planta, tecido de planta, material de planta ou planta que compreendem o polinucleotídeo como definido na reivindicação 12, caracterizados pelo fato de que a planta é a soja ou milho.
14. Método para introdução de um polipeptídeo de interesse em uma célula de planta, caracterizado pelo fato de compreender: - fornecer o sistema como definido na reivindicação 1; e - transformar uma célula de planta com o polinucleotídeo sintético.
15. Célula de planta caracterizada pelo fato de ser produzida pelo método como definido na reivindicação 14.
16. Método para expressar um polipeptídeo de interesse em uma planta, caracterizado pelo fato de que o método compreende regenerar uma planta a partir da célula de planta como definida na reivindicação 15.
17. Método para introduzir um polipeptídeo de interesse em uma planta, caracterizado pelo fato de que o método compreende: - fornecer o sistema como definido na reivindicação 1; e - transformar a planta com o polinucleotídeo sintético.
18. Método de acordo com a reivindicação 17, caracterizado pelo fato de que a transformação da planta compreende transformar uma célula da planta e regenerar a planta a partir da célula transformada.
19. Planta caracterizada pelo fato de ser produzida pelo método como definido na reivindicação 17.
20. Planta de acordo com a reivindicação 19, caracterizada pelo fato de que a planta compreende quantidades maiores do poli-peptídeo heterólogo de interesse do que a planta da mesma espécie que é transformada com um polinucleotídeo sintético que não compreende as sequências de poliadenilação no mesmo número e na mesma localização como no polinucleotídeo de referência.
21. Método de acordo com a reivindicação 17, caracterizado pelo fato de que o polipeptídeo de interesse é uma proteína selecionada do grupo que consiste em proteínas inseticidas, proteínas de tolerância a herbicida, proteínas relacionadas a tolerância ao estresse e proteínas para modificação do perfil de óleo.
22. Método de controle de pragas, caracterizado pelo fato de que o método compreende obter um grão de uma planta produzida de acordo com o método de acordo a reivindicação 21, em que o polipeptídeo de interesse é uma proteína inseticida.
23. Método de controle de pragas, caracterizado pelo fato de que o método compreende obter uma semente de uma planta produzida de acordo com o método de acordo a reivindicação 21, em que o polipeptídeo de interesse é uma proteína inseticida
24. Método de acordo com a reivindicação 23, caracterizado pelo fato de que o método compreende adicionalmente germinar a semente.
25. Composição derivada de uma planta transgênica como definida na reivindicação 19, caracterizada pelo fato de que a composição é um produto de consumo selecionado do grupo que consiste em um alimento, farinha, concentrado de proteína e óleo.
BR102015000943A 2014-01-17 2015-01-15 expressão aumentada de proteína em planta BR102015000943A2 (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201461928852P 2014-01-17 2014-01-17

Publications (1)

Publication Number Publication Date
BR102015000943A2 true BR102015000943A2 (pt) 2016-06-07

Family

ID=53543504

Family Applications (1)

Application Number Title Priority Date Filing Date
BR102015000943A BR102015000943A2 (pt) 2014-01-17 2015-01-15 expressão aumentada de proteína em planta

Country Status (11)

Country Link
US (3) US10774336B2 (pt)
EP (2) EP3094169A4 (pt)
JP (1) JP2017504332A (pt)
KR (1) KR20160104074A (pt)
CN (2) CN105916371A (pt)
AR (1) AR099116A1 (pt)
AU (1) AU2015206247B2 (pt)
BR (1) BR102015000943A2 (pt)
CA (1) CA2933728A1 (pt)
IL (1) IL246593A0 (pt)
WO (1) WO2015109241A1 (pt)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR102015000943A2 (pt) * 2014-01-17 2016-06-07 Dow Agrosciences Llc expressão aumentada de proteína em planta
US11041158B2 (en) 2014-12-22 2021-06-22 AgBiome, Inc. Optimization methods for making a synthetic gene
EP3115458A1 (en) 2015-07-06 2017-01-11 Genective Method for gene optimization
BR112018070604A2 (pt) * 2016-04-07 2019-02-05 Dow Agrosciences Llc toxinas cry inseticidas
CN108363904B (zh) * 2018-02-07 2019-06-28 南京林业大学 一种用于木本植物遗传密码子优化的CodonNX系统及其优化方法
CN110095614A (zh) * 2019-05-27 2019-08-06 武汉上成生物科技有限公司 一种快速检测转基因植物中转基因蛋白Bt-Cry1AbAc的方法
WO2023141464A1 (en) * 2022-01-18 2023-07-27 AgBiome, Inc. Method for designing synthetic nucleotide sequences
WO2023230039A1 (en) * 2022-05-26 2023-11-30 Syngenta Crop Protection Ag Maize pollen storage and carriers

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4693977A (en) 1982-08-23 1987-09-15 Queen's University At Kingston Enzyme immobilization for producing cephalosporin antibiotics
US4536475A (en) 1982-10-05 1985-08-20 Phytogen Plant vector
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
NZ207765A (en) 1983-04-15 1987-03-06 Lubrizol Genetics Inc Plant expression of transferred dna(t-dna)from plasmids associated with agrobacterium sp
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4886937A (en) 1985-05-20 1989-12-12 North Carolina State University Method for transforming pine
ES2039474T3 (es) 1986-12-05 1993-10-01 Ciba-Geigy Ag Procedimineto mejorado para la transformacion de protoplastos vegetales.
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
DE69033816T2 (de) 1989-02-24 2002-08-08 Monsanto Technology Llc Synthetische pflanzengene und verfahren zu ihrer herstellung
US5302523A (en) 1989-06-21 1994-04-12 Zeneca Limited Transformation of plant cells
US5501967A (en) 1989-07-26 1996-03-26 Mogen International, N.V./Rijksuniversiteit Te Leiden Process for the site-directed integration of DNA into the genome of plants
US7705215B1 (en) 1990-04-17 2010-04-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5550318A (en) 1990-04-17 1996-08-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5177308A (en) 1989-11-29 1993-01-05 Agracetus Insecticidal toxins in plants
CA2074355C (en) 1990-01-22 2008-10-28 Ronald C. Lundquist Method of producing fertile transgenic corn plants
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
US6403865B1 (en) 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
US5235041A (en) 1990-12-28 1993-08-10 Protein Polymer Technologies, Inc. Purification of structurally ordered recombinant protein polymers
US5384253A (en) 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
US5591616A (en) 1992-07-07 1997-01-07 Japan Tobacco, Inc. Method for transforming monocotyledons
US5380301A (en) 1992-07-10 1995-01-10 Sherwood Medical Company Catheter/hub strain relief and method of manufacture thereof
WO1994002620A2 (en) 1992-07-27 1994-02-03 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5689052A (en) * 1993-12-22 1997-11-18 Monsanto Company Synthetic DNA sequences having enhanced expression in monocotyledonous plants and method for preparation thereof
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
DE69638032D1 (de) 1995-10-13 2009-11-05 Dow Agrosciences Llc Modifiziertes bacillus thuringiensis gen zur kontrolle von lepidoptera in pflanzen
US5693512A (en) 1996-03-01 1997-12-02 The Ohio State Research Foundation Method for transforming plant tissue by sonication
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
US6218188B1 (en) 1997-11-12 2001-04-17 Mycogen Corporation Plant-optimized genes encoding pesticidal toxins
CA2703161C (en) 1998-10-23 2011-12-20 Mycogen Corporation Plant-optimized polynucleotides encoding approximately 15 kda and approximately 45 kda pesticidal proteins
JP2002534129A (ja) 1999-01-14 2002-10-15 モンサント テクノロジー エルエルシー ダイズ形質転換方法
US20030208790A1 (en) * 2002-05-03 2003-11-06 Stefan Jansens Insect resistant plants and methods for making same
US20030208789A1 (en) * 2002-05-03 2003-11-06 Stefan Jansens Wound-inducible expression in plants
PL2308977T5 (pl) 2004-04-30 2017-10-31 Dow Agrosciences Llc Nowy gen odporności na herbicydy
CA2649038A1 (en) 2006-05-30 2007-12-13 Dow Global Technolgies Inc. Codon optimization method
WO2008121633A1 (en) * 2007-03-28 2008-10-09 Syngenta Participations Ag Insecticidal proteins
CN102124113A (zh) 2007-11-06 2011-07-13 开普敦大学 Xvsap1基因的植物启动子
WO2010147880A2 (en) * 2009-06-16 2010-12-23 Dow Agrosciences Llc Dig-11 insecticidal cry toxins
CN101818157B (zh) * 2009-12-02 2013-01-02 安徽省农业科学院水稻研究所 一种人工设计的Bt抗虫基因及其应用
TW201144442A (en) 2010-05-17 2011-12-16 Dow Agrosciences Llc Production of DHA and other LC-PUFAs in plants
CN102339407A (zh) 2010-07-27 2012-02-01 钒创科技股份有限公司 具有感应线圈的薄型电路板及其制造方法
WO2012131619A1 (en) * 2011-03-30 2012-10-04 Metahelix Life Sciences Limited A nucleotide sequence, expression cassette, transgenic events, cells and methods thereof
UY34014A (es) * 2011-04-15 2012-11-30 Dow Agrosciences Llc Genes sintéticos para expresar proteínas en células de maíz, construcciones, plantas transgénicas, métodos para controlar pestes y composiciones
TW201307553A (zh) 2011-07-26 2013-02-16 Dow Agrosciences Llc 在植物中生產二十二碳六烯酸(dha)及其他長鏈多元不飽和脂肪酸(lc-pufa)之技術
BR102015000943A2 (pt) * 2014-01-17 2016-06-07 Dow Agrosciences Llc expressão aumentada de proteína em planta

Also Published As

Publication number Publication date
KR20160104074A (ko) 2016-09-02
WO2015109241A1 (en) 2015-07-23
CN105916371A (zh) 2016-08-31
AU2015206247A1 (en) 2016-07-07
AR099116A1 (es) 2016-06-29
AU2015206247B2 (en) 2017-12-21
EP3892091A1 (en) 2021-10-13
EP3094169A1 (en) 2016-11-23
US11441151B2 (en) 2022-09-13
US20230127734A1 (en) 2023-04-27
EP3094169A4 (en) 2017-08-02
IL246593A0 (en) 2016-08-31
US20150203857A1 (en) 2015-07-23
CA2933728A1 (en) 2015-07-23
CN114457107A (zh) 2022-05-10
US10774336B2 (en) 2020-09-15
JP2017504332A (ja) 2017-02-09
US20200407739A1 (en) 2020-12-31

Similar Documents

Publication Publication Date Title
US11441151B2 (en) Increased protein expression in plants
RU2679510C2 (ru) Обогащение активируемой флуоресценцией сортировки клеток (facs) для создания растений
CA2219979C (fr) Sequence adn d'un gene de l'hydroxy-phenyl pyruvate dioxygenase et obtention de plantes contenant un gene de l'hydroxy-phenyl pyruvate dioxygenase, tolerantes a certains herbicides
EP2872630B1 (en) Process for designing diverged, codon-optimized large repeated dna sequences
CN109868273B (zh) 用于检测玉米植物dbn9501的核酸序列及其检测方法
WO2024060732A1 (zh) 转基因玉米事件lp026-2及其检测方法
JP2013537412A (ja) 植物形質転換率を高めるように改変されたアグロバクテリウム(Agrobacterium)株
CN109312350B (zh) 非生物胁迫耐性的植物和方法
CN109971880B (zh) 用于检测玉米植物dbn9508的核酸序列及其检测方法
BR102012025724A2 (pt) moléculas de ácido nucleico que se direcionam a pp1-87b e conferem resistência a pestes coleópteras
EP2114125A2 (en) Acetyl-coa carboxylase herbicide resistant sorghum
KR20220031927A (ko) 대두 식물 dbn8002를 검출하기 위한 핵산 서열 및 이의 검출 방법
CN113151534A (zh) 转基因玉米事件lp007-5及其检测方法
BR102016005404A2 (pt) moléculas de ácido nucléico de rna polimerase ii33 para controlar as pragas de inseto
CN110881367A (zh) 一种玉米事件t抗-4及其使用方法
WO2021003592A1 (en) Sterile genes and related constructs and applications thereof
US20150211019A1 (en) Compositions and Methods for Increasing Pest Resistance in Plants
BR102014032935A2 (pt) promotores de ubiquitina de milho
CN117242182A (zh) 用于在植物中赋予杀昆虫特性的核酸分子
AU2018201526A1 (en) RNA production in higher plants

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B12B Appeal against refusal [chapter 12.2 patent gazette]