BRPI0712991A2 - polinucleotìdeo isolado, método de produção de uma planta transformada que mostra toleráncia a glifosato, célula vegetal e planta tolerantes a glifosato, semente transformada, método para controlar seletivamente ervas daninhas, moléculas de ácido nucléico isolada e planta - Google Patents

polinucleotìdeo isolado, método de produção de uma planta transformada que mostra toleráncia a glifosato, célula vegetal e planta tolerantes a glifosato, semente transformada, método para controlar seletivamente ervas daninhas, moléculas de ácido nucléico isolada e planta Download PDF

Info

Publication number
BRPI0712991A2
BRPI0712991A2 BRPI0712991-2A BRPI0712991A BRPI0712991A2 BR PI0712991 A2 BRPI0712991 A2 BR PI0712991A2 BR PI0712991 A BRPI0712991 A BR PI0712991A BR PI0712991 A2 BRPI0712991 A2 BR PI0712991A2
Authority
BR
Brazil
Prior art keywords
wing
gly
ile
seq
leu
Prior art date
Application number
BRPI0712991-2A
Other languages
English (en)
Inventor
Volker Heinrichs
Original Assignee
Athenix Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Athenix Corp filed Critical Athenix Corp
Publication of BRPI0712991A2 publication Critical patent/BRPI0712991A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • C12N9/10923-Phosphoshikimate 1-carboxyvinyltransferase (2.5.1.19), i.e. 5-enolpyruvylshikimate-3-phosphate synthase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8275Glyphosate

Abstract

POLINUCLEOTìDEO ISOLADO, MéTODO DE PRODUçãO DE UMA PLANTA TRANSFORMADA QUE MOSTRA TOLERáNCIA A GLIFOSATO, CéLULA VEGETAL E PLANTA TOLERANTES A GLIFOSATO, SEMENTE TRANSFORMADA, MéTODO PARA CONTROLAR SELETIVAMENTE ERVAS DANINHAS, MOLéCULA DE áCIDO NUCLéICO ISOLADA E PLANTA. São fornecidos composições e métodos para conferir tolerância a glifosato em bactérias, plantas, células, tecidos e sementes vegetais. Composições incluem novas enzimas EPSP sintase e moléculas de ácido nucléico codificando tais enzimas, vetores compreendendo tais moléculas de ácido nucléico e células hospedeiras compreendendo os vetores.

Description

POLINUCLEOTÍDEO ISOLADO, MÉTODO DE PRODUÇÃO DE UMA PLANTA TRANSFORMADA QUE MOSTRA TOLERÂNCIA A GLIFOSATO, CÉLULA VEGETAL E PLANTA TOLERANTES A GLIFOSATO, SEMENTE TRANSFORMADA, MÉTODO PARA CONTROLAR SELETIVAMENTE ERVAS DANINHAS, MOLÉCULA DE ÁCIDO NUCLÉICO ISOLADA E PLANTA
CAMPO DA INVENÇÃO
Essa invenção está relacionada com a biologia molecular vegetal, particularmente com novos polipeptideos de EPSP sintase que conferem resistência melhorada ou tolerância ao herbicida glifosato.
FUNDAMENTOS DA INVENÇÃO
N-fosfonometilglicina, comumente referido como glifosato, é um importante agente químico agronômico. Glifosato inibe a enzima que converte fosfoenolpiruvato (PEP) e chiquimato-3-fosfato (S3P) em - 5-enolpiruvilchiquimato-3-fosfato. Inibição dessa enzima (5-enolpiruvilchiquimato-3-fosfato sintase; referida aqui como "EPSP sintase" ou "EPSPS") leva células vegetais à morte através do desligamento da cascata do chiquimato, a que leva à inibição da biossíntese de aminoácidos aromáticos.
Como herbicidas da classe dos glifosatos inibem a biossíntese de aminoácidos aromáticos, eles não só levam células vegetais à morte, mas também são tóxicos para células bacterianas. Glifosato inibe várias EPSP sintases bacterianas, e conseqüentemente é tóxico para essas bactérias. Porém, certas EPSP sintases bacterianas possuem alta tolerância ao glifosato.
Células vegetais resistentes à toxicidade do glifosato podem ser obtidas através da transformação de células vegetais para expressarem EPSP sintases bacterianas resistentes ao glifosato. Particularmente, o gene bacteriano da Agrobacterium tumefaciens cepa CP4 vem sendo usado para conferir resistência ao herbicida em células vegetais seguido de expressão em plantas. Uma EPSP sintase mutada da Salmonella typhimurium cepa CT7 confere resistência ao glifosato em células bacterianas, e confere resistência ao glifosato em células vegetais (Patentes Norte-Americanas Nos. 4,535,060, 4,769,061, 5,094,945).
Variantes da enzima EPSP sintase selvagem que são tolerantes ao glifosato em conseqüência de alterações na seqüência codificante de aminoácidos da EPSP sintase foram isoladas (Kishore e Shah (1988) Annu. Rev. Biochem. 57:627-63; Wang et al. (2003) J. Plant Res. 116:455-60; Eschenburg et al. (2002) Planta 216:129-35). A Patente Norte-Americana 6,040,497 reporta enzimas EPSP sintase de milho contendo substituições de treonina para isoleucina na posição 102 e de prolina para serina na posição 106 as mutações "TIPS". Tais alterações conferem resistência ao glifosato à enzima de milho. Uma EPSP sintase mutada da Salmonella typhimurium cepa CT7 confere resistência ao glifosato em células bacterianas, e é reportada como capaz de conferir resistência ao glifosato às células vegetais (Patentes Norte-Americanas Nos. 4,535,060, 4,769,061, e 5,094,945). He et al. ((2001) Biochem et Biophysica Acta 1568:1-6) desenvolveram EPSP sintases com tolerância ao glifosato aumentada através de mutagênese e recombinação entre os genes de EPSP sintase de E. coli e Salmonella typhimurium, e sugerem que mutações na posição 42 (T42M) e na posição 230 (Q23 0K) são provavelmente responsáveis pela resistência observada. Um trabalho subseqüente (He et al. (2003) Biosci. Biotech. Biochem. 67:1405-1409) mostra que a mutação T42M (de treonina para metionina) é suficiente para melhorar a tolerância das enzimas tanto de E. coli quanto de Salmonella typhimurium. Devido às muitas vantagens que plantas resistentes a herbicidas provêm, genes de resistência a herbicidas que melhoram a atividade de resistência ao glifosato são desejados.
SUMÁRIO DA INVENÇÃO
Composições e métodos para conferência da resistência ou tolerância são providos. Composições incluem enzimas EPSP sintase que são resistentes ao herbicida glifosato, e moléculas de ácidos nucléicos codificando tais enzimas, vetores contendo essas moléculas de ácidos nucléicos, e células hospedei ras contendo esses vetores. As composições da invenção incluem enzimas EPSP sintase exceto as SEQ ID NO:1 e 46 contendo o domínio de seqüência X-C-X-E-S- G-L-S-X-R-X-F-X-P-X (SEQ ID NO:44), onde X denota qualquer aminoácido. Em algumas concretizações, as enzimas EPSP sintase contendo o domínio de seqüência D-C-Xi-X2-S-G (SEQ ID NO:76), onde X1 denota glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina ou treonina e X2 denota qualquer aminoácido. Em outras concretizações, as enzimas EPSP sintase da invenção contêm o domínio de seqüência Xi-C-X2-E-G-L-S-X3-R-X4-F-X5-P-X6 (SEQ ID NO: 45) onde Xi denota D, Κ, E, S, G, P, R, ou N, e X2 denota G, Q, V, D, Ε, I, Ν, Μ, A, T, S, ou R, e X3 denota I, G, S, M, F, ou V, e X4 denota M, A7 S, G, Q, L, V, ou I, X5 denota Τ, P, L, G, A, V, ou I, e X6 denota I, L, C, A, F ou M.
Composições incluem moléculas de ácidos nucléicos codificando polipeptídeos de resistência ao herbicida, incluindo aqueles codificando polipeptídeos exceto as SEQ ID NO:1 e 46 contendo SEQ ID NO:5-43 e SEQ ID NO:56-65, assim como as seqüências de polinucleotídeo de SEQ ID NO:3, 4, 66, 67, 74, e 75 e seqüências de polinucleotídeo contendo SEQ ID NO:68-73. As seqüências codificantes podem ser usadas em construções de DNA ou cassetes de expressão para transformação e expressão em organismos, incluindo microorganismos e plantas. Composições também incluem bactéria, plantas, células vegetais, tecidos e sementes transformadas que são resistentes ao glifosato devido à introdução de composições da invenção no genoma do organismo. Quando o organismo é uma planta, a introdução da seqüência permite que herbicidas contendo glifosato seja aplicado a plantas para matar seletivamente ervas daninhas sensíveis ao glifosato ou outras plantas não transformadas, mas não o organismo transformado. As seqüências podem adicionalmente ser usadas com um marcador para a seleção de células vegetais crescendo sob condições com glifosato.
Métodos para identificar uma enzima EPSP sintase com atividade de resistência ao glifosato são adicionalmente providas. Os métodos consistem na identificação de seqüências adicionais de EPSP sintase que são resistentes ao glifosato baseados na presença do domínio da invenção.
DESCRIÇÃO DAS FIGURAS
Figura 1 ilustra a estratégia de mutagênese combinatória para região de volta em forma de Q (Q-Ioop) do syngrgl-SB.
Figura 2 ilustra o desenho da biblioteca de mutagênese permutacional para a região de volta em forma de Q (Q-Ioop) do syngrgl-SB. 0 consenso de tradução e o desenho do oligonucleotídeo são mostrados na parte de baixo da Figura 2 e na SEQ ID NO:48 (consenso de tradução) e SEQ ID NO:49 (desenho do oligonucleotídeo).
Figura 3 mostra a estratégia de mutagênese combinatória para a biblioteca 3. "N" representa as bases nucleotídicas A, T, C, ou G; "W" representa as bases nucleotídicas A ou T; "S" representa as bases nucleotídicas C ou G.
Figura 4 mostra um alinhamento de seqüência de aminoácidos na região central da volta em forma de Q (Q-loop) dos clones resistentes a glifosato. O colchete evidencia a região central da volta em forma de Q (Q-loop). Sombreamento cinza designa posições onde alterações não são observadas. Posições com alteração são mostradas sem sombreamento. Também inclusa está a seqüência selvagem de aminoácidos de GRGl nessa região (correspondendo às posições de aminoácidos de 81 a 104 da SEQ ID NO:2).
Figura 5 mostra uma ilustração da estrutura cristalina de GRG1 simulada através da sobreposição da seqüência de aminoácidos de GRGl sobre a estrutura cristalina da AroA de E. coli (Stallings et al. (1991) Proc Natl Acad Sci USA. 1;88(11) :5046-50). Painel A mostra a proteína completa relativa aos substratos chiquimato-3-fosfato e PEP. Painel B mostra somente a região da volta em forma de Q (Q-Ioop) de GRG1 relativo aos substratos chiquimato-3-fosfato e PEP.
Figura 6 mostra um Western blot de amostras de folha de plantas transgênicas de milho expressando GRG1(EV06), detectado com um anticorpo policlonal. Proteína total foi isolada das amostras de folha de milho, e expressão da proteína GRG1(EV06) foi identificada usando análise de Western blot. Faixa A mostra 5ng de proteína GRG1(EV06) purificada, Faixa B mostra Ing de proteína GRG1. Faixa de B a J mostram plantas transgênicas independentes expressando grgl(evo6). Faixa contendo plantas controle negativo não apresentam sinal.
DESCRIÇÃO DETALHADA DA INVENÇÃO
Composições
Seqüências polipeptídicas capazes de conferir tolerância ou resistência ao glifosato são fornecidas. Essas composições incluem polipeptídeos da EPSP sintase contendo o domínio de seqüência X-C-X-E-S-G-L-S-X-R-X-F-X- p-x (SEQ ID NO: 44), onde X denota qualquer aminoácido, o domínio de seqüência D-C-X1-X2-S-G (SEQ ID NO: 76), onde X1 denota glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina, ou treonina e X2 denota qualquer aminoácido, ou o domínio de seqüência X1-C-X2-E-S-G-L-S-X3- R-X4-F-X5-P-X6 (SEQ ID NO: 45), e onde Xi denota ácido aspártico, lisina, ácido glutâmico, asparagina, serina, glicina, prolina ou arginina,- X2 denota asparagina, alanina, serina, glicina, glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina, treonina, ou arginina; onde X3 denota isoleucina, metionina, fenilalanina, glicina, serina, ou valina; onde X4 denota metionina, alanina, serina, glicina, glutamina, leucina, valina, ou isoleucina; onde X5 denota treonina, alanina, valina, isoleucina, prolina, leucina, ou glicina; e onde X6 denota isoleucina, leucina, cisteína, alanina, fenilalanina ou metionina. Esse domínio é localizado na região de volta em forma de Q (Q-loop) do polipeptídeo da EPSP sintase. A região (aqui referida como o "volta em forma de Q") correspondendo aos aminoácidos 80-105 do polipeptídeo da EPSP sintase resistente ao glifosato GRGl (SEQ ID NO: 2; Pedido de Patente Norte-Americano No. 10/739.610) é conhecida por ser envolvida no reconhecimento do substrato da EPSP sintase fosfoenolpiruvato (PEP) (Schõnbrunn et al. (2001) Proc. Natl. Acad. Sei. USA 90:1376-1380, Stauffer et al. (2001) Biochemistry 40:3951-3957).
Em uma concretização, esse domínio de seqüência corresponde às posições de aminoácidos 85 a 99 da SEQ ID NO: 2 e é selecionado a partir do grupo consistindo das posições correspondentes da SEQ ID NO:5-43 e SEQ ID NO:56-65. Em outra concretização, o polinucleotídeo contendo o domínio de seqüência da invenção codifica um polipeptídeo da EPSP sintase exceto SEQ ID NO :1 e 46 apresentando pelo menos 7 0% de identidade de seqüência com os aminoácidos correspondendo às posições de 1 a 84 e posições de 100 a 431 da SEQ ID NO: 2. Como usado aqui, a expressão "correspondendo a" ou "corresponde a" quando referido ao número da posição do aminoácido (ou nucleotídeo) significa que uma ou mais seqüências de aminoácido (ou nucleotídeo) alinha com a seqüência de referência no número de posição especificado na seqüência de referência. Por exemplo, para identificar uma região de volta em forma de Q em uma seqüência de aminoácido que corresponde aos aminoácidos 80-105 da SEQ ID NO: 2, alguém poderia alinhar a seqüência de aminoácido em questão com a seqüência de aminoácido da SEQ ID NO: 2 usando métodos de alinhamento discutidos em outro lugar nesse documento, e identificar a região da seqüência de aminoácido em questão que alinha com os resíduos de aminoácido 80-105 da SEQ ID NO: 2. É reconhecido que a posição do aminoácido designando a volta em forma de Q pode variar em mais ou menos 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2oul aminoácido(s) em qualquer dos lados dos aminoácidos correspondendo às posições 80-105 da SEQ ID NO:2.
A expressão "exceto as SEQ ID NO: 1 e 46" inclui fragmentos da SEQ ID NO: 1 ou 46, incluindo fragmentos contendo pelo menos cerca de 340, pelo menos cerca de 350, pelo menos 400, pelo menos 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, ou 431 aminoácidos consecutivos da SEQ ID NO: 1 ou 46. Adicionalmente, é reconhecido que seqüências podem estar disponíveis na técnica anterior que contêm um domínio da invenção (veja, por exemplo, Pedidos de Patente Norte- Americanos Nos. 20060143727, 20030049814, 20030079246, 20030200560, 2004148650, e 20050223436; Patentes Norte- Americanas Nos. 5188642, 6040497, 7214535, 7169970, 6867293, 7183110, 5094945, 6225114, 7141722, 7045684, 5312910, 6566587, e RE037287, cada uma a qual está aqui incorporada por referência na sua íntegra). Até a presente invenção tais seqüências podem não ser reconhecidas na arte como possuindo a habilidade de conferir resistência ao glifosato e estas seqüências estão excluídas das composições da invenção. À extensão dessas seqüências não são sabidamente capazes de conferir resistência, elas estão incluídas nas reivindicações do método. Os métodos da invenção provêm uma nova abordagem para identificar e utilizar seqüências que possuem a habilidade de conferir resistência ao glifosato.
A volta em forma de Q da EPSP sintase forma uma porção do bolso de ligação para PEP e glifosato, e contém uma arginina invariante que é sabidamente ligada diretamente por ponte de hidrogênio com o fosfato do PEP (Shuttleworth et al. (1999) Biochemistry 38:296-302). Esse domínio de volta em forma de Q foi descrito como um prognosticador para a resistência ao glifosato e resíduos-chave dentro desse domínio foram identificados (Pedido de Patente Norte- Americano No. 60/658.320, aqui incorporado por referência na sua íntegra). As composições da presente invenção incluem variantes de GRGl que exibem tanto (1) habilidade contínua de tolerância ao glifosato, quanto (2) habilidade aumentada de tolerância ao glifosato. Logo, as seqüências de aminoácidos dessas variantes expandem e refinam os domínios-chave da volta em forma de Q para EPSP sintases que conferem resistência ao glifosato.
A. Polinucleotíáeos isolados, e variantes e fragmentos destes.
Em algumas concretizações, a presente invenção contém polinucleotídeos isolados ou recombinantes. Um polinucleotídeo "isolado" ou "purificado" ou polipeptídeo, ou porção derivada biologicamente ativa, é substancialmente livre de outro material celular, ou meio de cultura quando produzido por técnicas de recombinação, ou substancialmente livre de precursores químicos ou outros agentes químicos quando sintetizados quimicamente. Por "biologicamente ativo" entende-se um que possua a atividade biológica desejada do polipeptídeo nativo, ou seja, retenção da atividade de resistência ao herbicida. Um polinucleotídeo "isolado" ou "recombinante" pode ser livre de seqüências (por exemplo, seqüências codificantes de proteína) que naturalmente flanqueiam o ácido nucléico (ex., seqüências localizadas nas extremidades 5' e 3' do ácido nucléico) no DNA genômico do organismo do qual o polinucleotídeo é derivado. Para propósitos da invenção, "isolado", quando usados para referir-se a polinucleotídeos, exclui cromossomos isolados. Por exemplo, em várias concretizações, o polinucleotídeo isolado codificante de resistência ao glifosato pode conter menos que, aproximadamente, 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb, ou 0, 1 kb da seqüência nucleotídica que naturalmente flanqueia o polinucleotídeo no DNA genômico da célula da qual o polinucleotídeo é derivado.
Polinucleotídeos da invenção incluem aqueles codificando polipeptídeos da EPSP sintase em possuindo o domínio de seqüência da invenção. A informação usada na identificação dos domínios da invenção inclui alinhamentos de seqüência das enzimas EPSP sintase como descrita em outro lugar nesse documento. Os alinhamentos de seqüência são usados na identificação de regiões de homologia entre as seqüências e na identificação de domínios que são característicos dessas enzimas EPSP sintase. Em algumas concretizações, os domínios da invenção são usados na identificação de enzimas EPSP sintase que são resistentes ao glifosato. Concretizações adicionais incluem polinucleotídeos que codificam polipeptídeos resistentes ao glifosato contendo SEQ ID NO: 5-43 e SEQ ID NO: 56-65, as seqüências de polinucleotídeos da SEQ ID NO: 3, 4, 66, 67, 74, e 75, e seqüências de polinucleotídeos contendo SEQ ID NO:68-73.
Por "glifosato" entende-se qualquer herbicida de forma N-fosfonometilglicina (incluindo qualquer sal derivado) e outras formas que resultam na produção do ânion glifosato in planta. Uma "proteína de resistência ao herbicida" ou uma proteína resultante da expressão de uma "molécula de ácido nucléico codificando resistência ao herbicida" inclui proteínas que conferem a uma célula a habilidade de tolerar altas concentrações de um herbicida por mais tempo que células que não expressam a proteína, ou por tolerar uma determinada concentração de um herbicida por mais tempo que células que não expressam proteína. Uma "proteína resistente a glifosato" inclui proteínas que conferem a uma célula habilidade de tolerar altas concentrações de glifosato por mais tempo que células que não expressam a proteína, ou por tolerar uma determinada concentração de um glifosato por mais tempo que uma célula que não expressa proteína. Por "tolerar" ou "tolerância" entende-se tanto sobreviver, quanto manter funções celulares essenciais tais como síntese de proteínas e respiração de maneira que não são prontamente discernidas de células não tratadas.
A presente invenção adicionalmente contempla variantes e fragmentos dos polinucleotídeos descritos aqui. Um "fragmento" de um polinucleotídeo pode codificar uma porção biologicamente ativa de um polipeptídeo, ou pode ser um fragmento que pode ser usado como uma sonda de hibridização ou iniciador de PCR usado métodos revelados em outro lugar nesse documento. Polinucleotídeos que são fragmentos de um polinucleotídeo contêm pelo menos cerca de 15, 20, 50, 75, 100, 200, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950 nucleotídeos contínuos, ou até, no máximo, o número de nucleotídeos presente em um pol inucleotídeo completo apresentado aqui dependendo do uso intencional (ex., um polinucleotídeo de EPSP sintase contendo SEQ ID NO: 1). Por nucleotídeos "contínuos" entende-se resíduos de nucleotídeo que estão imediatamente adjacentes um do outro.
Fragmentos de polinucleotídeos da presente invenção geralmente irão codificar fragmentos de polinucleotídeos que retêm a atividade biológica de resistência ao glifosato da proteína completa, ex. , atividade de resistência ao herbicida. Por "reter atividade de resistência ao herbicida" entende-se que o fragmento terá pelo menos, cerca de 3 0%, pelo menos, cerca de 50%, pelo menos, cerca de 80%, 85%, 90%, 95%, 100%, 110%, 125%, 150%, 175%, 200%, 250%, pelo menos, cerca de 300% ou mais de atividade de resistência ao herbicida da proteína de resistência ao glifosato completa revelados aqui como SEQ ID NO: 2. Métodos para medir atividade de resistência ao herbicida são bem conhecidos na arte. Veja, por exemplo, as Patentes Norte-Americanas Nos. 4,535,060, e 5,188,642, cada uma das quais são aqui incorporados por referência na sua íntegra.
Um fragmento de um polinucleotídeo que codifica uma porção biologicamente ativa de um polipeptídeo da invenção que irá codificar pelo menos, cerca de 15, 25, 30, 50, 75, 100, 125, 150, 175, 200, 300, 350, 400 aminoácidos contíguos, ou até, no máximo, no número total de aminoácidos presentes em um polipeptídeo completo da invenção.
Proteínas preferenciais de resistência ao herbicida da presente invenção são codificadas por uma seqüência nucleotídica contendo um polinucleotídeo codificando um polipeptídeo contendo um domínio de seqüência revelado aqui. Em uma concretização, esse domínio de seqüência corresponde aos aminoácidos de posição 85 a 99 da SEQ ID NO: 2 e é selecionada a partir do grupo consistindo das posições correspondentes da SEQ ID NO:5-43 e SEQ ID NO:56-65. Em outra incorporação, o polinucleotídeo contendo o domínio de seqüência da invenção codifica uma EPSP sintase que é suficientemente idêntico aos aminoácidos correspondendo às posições 1 até 84 e posições 100 até 431 da SEQ ID NO:2. O termo "suficientemente idêntico" refere-se à seqüência de aminoácido ou nucleotídeo que tem pelo menos, por volta de 60% ou 65% de identidade de seqüência, por volta de 70% ou 75% de identidade de seqüência, por volta 80% ou 85% de identidade de seqüência, ou por volta de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência comparada a uma seqüência de referência usando um dos programas de alinhamento descritos aqui como parâmetros padrão. Em outra incorporação, o polinucleotídeo contendo o domínio da invenção codifica uma EPSP sintase que apresenta uma ou mais adições, substituições e deleções na região correspondente às posições de aminoácidos 1 a 84 e posições 100 a 431 da SEQ ID NO: 2, até, no máximo, por volta de 2, por volta de 3, por volta de 4, volta de 5, volta de 6, por volta de 7, por volta 8, por volta de 9, por volta de 10, por volta de 15, por volta de 20, por volta de 25, por volta de 30, por volta de 35, por volta de 40, por volta de 45, por volta de 50, por volta de 55, por volta de 60, por volta de 65, por volta de 70, por volta de 75, por volta de 80, por volta de 85, por volta 90, por volta de 95, por volta de 100 ou mais substituições, deleções, ou inserções de aminoácidos. Alguém com habilidade na arte irá reconhecer que esses valores podem ser apropriadamente ajustados para determinar a identidade correspondente de proteínas codificadas por duas seqüências nucleotídicas levando em consideração degeneração de códon, similaridade de aminoácido, posicionamento da fase de leitura, e similares.
Para determinar a identidade de porcentagem de duas seqüências de aminoácidos ou de dois ácidos nucléicos, as seqüências são alinhadas para propósito de comparação em condições ótimas. A identidade de porcentagem entre as duas seqüências é uma função do número de posições idênticas compartilhadas pelas seqüências (ex., identidade de porcentagem = número de posições idênticas / número total de posições (ex., posições sobrepostas) X 100). Em uma concretização, as duas seqüências possuem o mesmo tamanho. A identidade de porcentagem entre duas seqüências pode ser determinada usando técnicas similares àquelas descritas abaixo, permitindo ou não quebras ("gaps"). No cálculo de identidade de porcentagem, tipicamente pares perfeitos são levados em consideração. Para propósitos da presente invenção, no cálculo de identidade de porcentagem nas regiões correspondendo às posições de aminoácidos 1 a 84 e posições 100 a 431, a porcentagem ao longo de toda a região (1 a 84 mais 100 a 431) são medidas. A determinação da identidade de porcentagem entre duas seqüências pode ser alcançada usando um algoritmo matemático. Um exemplo não limitante de um algoritmo matemático utilizado para comparação de duas seqüências é o algoritmo de Karen e Altschul (199 0) Proe. Natl. Acad. Sei. USA 87:2264, modificado como em Karlin e Altschul (1993) Proc. Natl. Acad. Sei. USA 90:5873-5877. Tal algoritmo é incorporado aos programas BLASTN e BLASTX de Altschul et ai. (1990) J. Mol. Biol. 215:403. Buscas de nucleotídeos pelo BLAST podem ser realizadas com o programa BLASTN, pontuação = 100, tamanho da seqüência = 12, para obter seqüências nucleotídicas homólogas a moléculas de ácido nucléico resistentes ao glifosato da invenção. Busca de proteínas pelo BLAST pode ser realizada com o programa BLASTX, pontuação = 50, tamanho da seqüência = 3, para obter seqüências de aminoácidos homólogos a moléculas de proteína resistentes ao herbicida da invenção. Para obter alinhamentos com quebra para propósito de comparações, Gapped BLAST pode ser utilizado como descrito em Altschul et al. (1997) Nucleie Aeids Res. 25:3389. Alternativamente, PSI-Blast pode ser usado para realizar uma busca iterada que detecta relações distantes entre moléculas. Veja Altschul et al. (1997) supra. Quando utilizando os programas BLAST, Gapped BLAST, e PSI-Blast, os parâmetros padrão dos respectivos programas (ex., BLASTX e BLASTN) podem ser usados. Veja www.nebi.nlm.nih.gov. Outro exemplo não limitante de um algoritmo matemático utilizado na comparação de seqüências é o algoritmo ClustalW (Higgins et al. (1994) Nueleie Aeids Res. 22:4673-4680). Clustal W compara seqüências e alinha a seqüência de aminoácido ou DNA na sua íntegra, e logo pode prover dados sobre a conservação da seqüência de aminoácido inteira. 0 algoritmo ClustalW é usado em vários pacotes de programas de computador de análise de DNA/aminoácido disponíveis comercialmente, tal como o módulo ALIGNX do programa Vector NTI Program Suite (Invitrogen Corporation, Carlsbad, CA, EUA) . Após o alinhamento das seqüências de aminoácidos com ClustalW, a identidade de aminoácido de porcentagem pode ser obtida. Um exemplo não limitante de um programa de computador útil na análise de alinhamentos feitos pelo ClustalW é o GENEDOC™. O GENEDOC™ (Karl Nicholas) permite estimar a similaridade e identidade de aminoácido (ou DNA) entre múltiplas proteínas. Outro exemplo não limitante de um algoritmo matemático utilizado na comparação de seqüências é o algoritmo de Myers e Miller (1998) CABIOS 4:11-17. Tal algoritmo é incorporado ao programa ALIGN (versão 2.0), que é parte do pacote de programas de computador de alinhamento de seqüência GCG (disponível pela Accelrys, Inc., 9865 Scranton Rd., San Diego, Califórnia, EUA). Quando utilizando o programa ALIGN para comparação de seqüências de aminoácidos, uma tabela de resíduo de peso PAMl20, uma penalidade de comprimento de quebra de 12, e uma penalidade de quebra de 4 pode ser usada.
A não ser quando indicado o contrário, GAP Versão 10, o qual usa o algoritmo de Needleman e Wunsch (1970) supra, será usado para determinar identidade ou similaridade de seqüência usando os seguintes parâmetros: % de identidade e % de similaridade para uma seqüência nucleotídica usando o peso GAP de 50 e o peso de tamanho de 3, e matriz de pontuação nwsgapdna.cmp; % de identidade ou % de similaridade para uma seqüência de aminoácidos usando peso GAP 8 e peso de tamanho 2 e o programa de pontuação BLOSUM62. Programas equivalentes também podem ser usados.
Por "programa equivalente" entende-se qualquer programa de comparação de seqüência que, para qualquer duas seqüências em questão, gera um alinhamento que apresenta pares perfeitos de resíduos nucleotídicos idênticos e uma identidade de seqüência de porcentagem idêntica quando comparada com o alinhamento correspondente gerado pelo GAP Versão 10.
A invenção também inclui polinucleotídeos variantes. "Variantes" de polinucleotídeos incluem aquelas seqüências que codificam os polipeptídeos revelados aqui, mas que diferem conservativamente devido à degeneração do código genético, assim como aqueles que são suficientemente idênticos.
Genes bacterianos muito freqüentemente possuem múltiplos códons de metionina de iniciação na proximidade do início da fase aberta de leitura. Freqüentemente, o início de tradução em um ou mais desses códons de iniciação vão levar à geração de uma proteína funcional. Esses códons de iniciação podem incluir códons ATG. Porém, bactérias tais como Bacillus sp. também reconhecem o códon GTG como códon de iniciação, e proteínas que iniciam a tradução no códon GTG contêm uma metionina como primeiro aminoácido. Adicionalmente, não é freqüentemente determinado a priori quais desses códons são naturalmente usados na bactéria. Logo, é entendido que o uso de um dos códons de metionina alternativos podem levar a geração de variantes que conferem resistência ao herbicida. Essas proteínas de resistência ao herbicida estão contidas na presente invenção e podem ser usadas nos métodos da presente invenção.
Variantes alélicas que ocorrem na natureza podem ser identificadas com o uso de técnicas bem conhecidas de biologia molecular, tais com reação da polimerase em cadeia (PCR) e técnicas de hibridização como evidenciadas abaixo. Polinucleotídeos variantes também incluem polinucleotídeos derivados sinteticamente que foram gerados, por exemplo, através de estratégias de mutação sítio-dirigida e outras, mas que ainda codificam o polipeptídeo que possui a atividade biológica desejada.
Alguém com habilidade na arte irá adicionalmente apreciar que modificações podem ser introduzidas por mutações adicionais dos polinucleotídeos da invenção o que levaria a mudanças adicionais na seqüência de aminoácidos dos polipeptídeos codificados, sem alterar a atividade biológica do polipeptídeo. Logo, polinucleotídeos variantes isolados podem ser criados pela introdução de uma ou mais substituições, adições ou deleções adicionais de nucleotídeo no polinucleotídeo correspondente codificando o domínio EPSP sintase revelado aqui, tal que uma ou mais substituições, adições ou deleções de aminoácido são introduzidas no polipeptídeo codificado. Mutações adicionais podem ser introduzidas por técnicas padrão, tais como mutagênese sítio-dirigida e mutagênese mediada por PCR, ou técnicas de embaralhamento de genes. Tais polinucleotídeos variantes estão também contidos na presente invenção.
Polinucleotídeos variantes podem ser obtidos pela introdução de mutações aleatórias ao longo de toda ou parte da seqüência codificante, tais como por mutagênese de saturação, e os mutantes resultantes podem ser selecionados em relação a habilidade de conferir atividade de resistência ao herbicida para identificar mutantes que retenham atividade.
Procedimentos de embaralhamento de genes ou PCR sexual (por exemplo, Smith (1994) Nature 370:324-325; Patente Norte-Americana Nos. 5.837.458; 5.830.721; 5.811.238; e 5.733.731, cada qual aqui incorporados por referência) podem ser usados para modificar ou potencializar adicionalmente polinucleotídeos e polipeptídeos contendo um domínio EPSP sintase da presente invenção (por exemplo, polipeptídeos que conferem resistência ao glifosato). Embaralhamento de genes envolve fragmentação aleatória de vários DNAs mutantes seguidos por reorganização desses por PCR em moléculas de tamanho integral. Exemplos de vários procedimentos de embaralhamento de gene incluem, porém não são limitados a, organização seguida de tratamento com DNase, processo de extensão irregular (STEP), e recombinação in vitro de iniciação aleatória (random priming). No método mediado por DNase, segmentos de DNA isolados de um apanhado de mutantes positivos são quebrados em fragmentos aleatórios com DNaseI e submetidos a múltiplos rodadas de PCR sem adição de oligo. 0 tamanho dos fragmentos aleatórios se aproxima ao de segmentos não quebrados ao longo dos ciclos de PCR, resultando em mutações em diferentes clones que se tornando misturadas e se acumulam em algumas das seqüências resultantes. Múltiplos ciclos de seleção e embaralhamento levaram à potencialização funcional de várias enzimas (Stemmer (1994) Nature 370:389-391; Stemmer (1994) Proc. Natl. Acad. Sei. USA 91:10747-10751; Crameri et al. (1996) Nat. Biotechnol.
14:315-319; Zhang et al. (1997) Proc. Natl. Acad. Sei. USA 94:4504-4509; e Crameri et al. (1997) Nat. Bioteehnol. 15:436-438). Tais procedimentos podem ser realizados, por exemplo, em polinucleotideos codificando polipeptídeos contendo o domínio de seqüência da presente invenção para gerar polipeptídeos que conferem resistência ao glifosato.
Usando métodos tais como PCR, hibridização, e similares, seqüências de resistência ao herbicida correspondentes podem ser identificadas por comparação com os domínios EPSP sintase da presente invenção. Veja, por exemplo, Sambrook e Russell (2001) Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, EUA) e Innis et al. (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, NY, EUA).
Em um método de hibridização, toda ou parte da seqüência nucleotídica de resistência a herbicida pode ser usada em varredura de biblioteca de cDNA ou genômica. Métodos de construção de tais bibliotecas de cDNA ou genômica são geralmente conhecidas na arte e estão apresentadas em Sambrook e Russell, 2001, supra. As então chamadas sondas de hibridização podem ser fragmentos de DNA genômico, fragmentos de cDNA, fragmentos de RNA, ou outros oligonucleotídeos, e podem ser marcadas com um grupamento detectável tal como 32P, ou qualquer outro marcador detectável, tais como outros radioisótopos, um composto fluorescente, uma enzima, ou um co-fator de enzima. Sondas para hibridização podem ser obtidas através de marcação de oligonucleotídeos sintéticos baseada na seqüência nucleotídica conhecida codificando resistência ao herbicida reveladas aqui. Oligo iniciadores degenerados desenhados com base em resíduos de nucleotídeos ou aminoácidos conservados na seqüência nucleotídica ou seqüência codificada de aminoácidos podem ser adicionalmente utilizados. A sonda tipicamente contém uma região de seqüência nucleotídica que hibridiza sob condições estringentes com pelo menos, por volta de 12, preferencialmente por volta de 25, pelo menos, por volta de 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 500, 600, 700, 800, 900, 1000, 1200, 1300 nucleotídeos consecutivos de uma seqüência nucleotídica codificando resistência ao herbicida ou um fragmento ou variante derivados. Métodos para a preparação de sondas para hibridização são geralmente conhecidas na arte e são apresentadas em Sambrook e Russell, 2 001, supra e Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2a ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nova Iorque, EUA), ambos dos quais estão aqui incorporados por referência.
Por exemplo, uma seqüência de resistência ao herbicida completa revelada aqui, ou uma ou mais porções derivadas, podem ser usadas como sonda capaz de hibridizar especificamente com seqüências de resistência ao herbicida correspondentes e RNAs mensageiros. Para obter hibridização específica sob uma variedade de condições, tais sondas incluem seqüências que são únicas e possuem pelo menos, por volta de 10 nucleotídeos de comprimento, ou pelo menos, por volta de 20 nucleotídeos de comprimento. Tais sondas podem ser usadas para amplificar seqüências de resistência ao herbicida correspondentes de um organismo escolhido, por PCR. Essa técnica pode ser usada para isolar seqüências codificantes adicionais de um organismo desejado ou como um ensaio de diagnóstico para determinar a presença de seqüências codificantes em um organismo. Técnicas de hibridização incluem varredura por hibridização de bibliotecas plaqueadas de DNA (tanto placas como colônias; veja, por exemplo, Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2a ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nova Iorque, EUA).
Hibridizações de tais seqüências podem ser conduzidas sob condições estringentes. Por "condições estringentes" ou "condições de hibridização estringentes" entende-se condições sob qual uma sonda irá hibridizar com sua seqüência alvo a um grau detectavelmente maior que de outras seqüências (ex., pelo menos 2 vezes acima do ruído). Condições estringentes são seqüências-dependentes e serão diferentes em circunstâncias diferentes. Através do controle da estringência de hibridização e/ou condições de lavagem, seqüências alvo que são 100% complementares à sonda podem ser identificadas (sondagem homóloga). Alternativamente, condições de estringência podem ser ajustadas para permitir alguns não-pareamentos em seqüências de modo que graus menores de similaridade são detectados (sondagem heteróloga). Geralmente, uma sonda é menor que cerca de 1000 nucleotideos de comprimento, preferencialmente menor que 500 nucleotideos de comprimento.
Tipicamente, condições estringentes serão aquelas em que a concentração de sal é menor que, aproximadamente, 1.5 M de íon Na, tipicamente uma concentração de íon Na de cerca de 0,01 a 1,0 M (ou outros sais) empH 7,0 a 8,3 e a temperatura é de pelo menos, por volta de 30°C para sondas curtas (ex. , 10 a 50 nucleotideos) e pelo menos cerca de 60°C para sondas longas (ex., maior que 50 nucleotideos). Condições estringentes podem também ser alcançadas com a adição de agentes desestabilizantes tal como formamida. Condições exemplares de baixa estringência incluem hibridização com uma solução tampão contendo de 3 0 a 35% de formamida, NaCl 1 M, SDS (sulfato dodecil de sódio) 1% a 37°C, e uma lavagem em SSC de IX a 2X (2 OX SSC = NaCl 3,0 M/citrato de trisódico) entre 50°C e 55°C. Condições exemplares de estringência moderada incluem hibridização em formamida de 40% a 45%, NaCl 1,0 M, SDS 1% a 37°C, e uma lavagem em SSC de 0,5X a IX entre 55°C a 60°C. Condições exemplares de alta estringência incluem hibridização em formamida 50%, NaCl 1M, SDS 1% a 37°C, e uma lavagem em SSC 0,1X entre 60°C e 65°C. Opcionalmente, tampões de lavagem podem conter SDS aproximadamente entre 0,1% e 1%. Duração da hibridização é geralmente menor que, cerca de 24 horas, usualmente em cerca de 4 a 12 horas.
Especificidade é tipicamente a função de lavagens pós- hibridização, o fator crítico sendo a força iônica e temperatura da solução final de lavagem. Para híbridos de DNA-DNA, a Tm pode ser aproximadamente obtida da equação de Meinkoth e Wahl (1984) Anal. Biochem. 138:267-284: Tm = 81,5°C + 16,6 (Iog M) + 0,41 (%GC) - 0,61 (% form) - 500/L; onde M é a molaridade de cátions monovalentes, %GC é a porcentagem de nucleotídeos de guanosina e citosina no DNA, % form é a porcentagem de formamida na solução de hibridização, e L é o comprimento do híbrido em pares de base. A Tm é a temperatura (sob força iônica e pH definidos) no qual 50% de uma seqüência complementar alvo hibridiza com uma sonda que forma um par perfeito. Tm é reduzida em aproximadamente 1°C para cada 1% de não- pareamento; logo, Tm, hibridização, e/ou condições de lavagem podem ser ajustadas para hibridizar com seqüências da identidade desejada. Por exemplo, se seqüências com identidade ^90% são requeridas, a Tm pode ser reduzido em 10°C. Geralmente, condições de estringência são selecionadas para ser cerca de 5°C abaixo do ponto termal de desnaturação (Tm) para a seqüência específica e seu complemento em uma força iônica e pH definidos. Porém, condições severamente estringentes podem utilizar uma hibridização e/ou lavagem a 1, 2, 3, ou 4°C abaixo do ponto termal de desnaturação (Tm) ; condições de estringência moderada podem utilizar uma hibridização e/ou lavagem a 6, 7, 8, 9 ou IO0C abaixo do ponto termal de desnaturação (Tm); condições de baixa estringência podem utilizar uma hibridização e/ou lavagem a 11, 12, 13, 14, 15 ou 20°C abaixo do ponto termal de desnaturação (Tm) . Usando a equação, composições de hibridização e lavagem, e Tm desejada, aqueles com habilidades básicas irão entender que variações na estringência de hibridização e/ou nas soluções de lavagem são intrinsecamente descritas. Se o grau desejado de não-pareamento resulta em uma Tm menor que 45°C (solução aquosa) ou 32°C (solução de formamida), é preferível aumentar a concentração de SSC de modo que uma temperatura mais alta possa ser usada. Um guia extensivo para hibridização de ácidos nucléicos é encontrado em Tijssen (1993) Laboratory Technigues in Biochemistry and Molecular Biology - Hibridization with Nucleic Acid Probes, Part I, Chapter 2 (Elsevier, Nova Iorque, EUA); and Ausubel et al., eds. (1995) Current Protocols in Molecular Biology, Chapter 2 (Greene Publishing and Wiley-Interscience, Nova Iorque, EUA). Veja Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2a ed. , Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nova Iorque, EUA).
B. Proteínas e Variantes Isoladas e Fragmentos Derivados Polipeptídeos de resistência ao herbicida também são parte integrante da presente invenção. Um polipeptídeo de resistência ao herbicida que é substancialmente livre de material celular inclui preparações de polipeptídeos contendo menos que, aproximadamente, 30%, 20%, 10%, ou 5% (por peso seco) de polipeptídeo não resistente ao herbicida (também referido aqui como uma "proteína contaminante"). Na presente invenção, por "proteína de resistência ao herbicida" entende-se um polipeptídeo EPSP sintase contendo o domínio de seqüência da invenção. Fragmentos, porções biologicamente ativas, e variantes derivadas também são providos, e podem ser usados para praticar os métodos da presente invenção.
"Fragmentos" ou "porções biologicamente ativas" incluem fragmentos de polipeptídeos contendo uma porção de uma seqüência de aminoácido codificando uma proteína de resistência ao herbicida e que retém atividade de resistência ao herbicida. Uma porção biologicamente ativa de uma proteína de resistência ao herbicida pode ser um polipeptídeo que é, por exemplo, 10, 25, 50, 100 ou mais aminoácidos em comprimento. Essa proteína pode ser alterada de várias maneiras incluindo substituições de aminoácidos, deleções, truncagem, e inserções de um ou mais aminoácidos na região correspondendo às posições de aminoácidos 85 a 99 da SEQ ID NO: 2, incluindo em até no máximo, cerca de 2, cerca de 3, cerca de 4, cerca de 5, cerca de 6, cerca de 7, cerca de 8, cerca de 9, cerca de 10, cerca de 15, cerca de 20, cerca de 25, cerca de 30, cerca de 35, cerca de 40, cerca de 45, cerca de 50, cerca de 55, cerca de 60, cerca de 65, cerca de 70, cerca de 75, cerca de 80, cerca de 85, cerca de 90, cerca de 100 ou mais de substituições, deleções ou inserções de aminoácidos. Tais porções biologicamente ativas podem ser preparadas através de técnicas de recombinação e avaliadas em relação a atividade de resistência a herbicida. Métodos para medir atividade de resistência ao herbicida são bem conhecidas na arte. Veja, por exemplo, as Patente Norte-Americanas Nos. 4.535.060, e 5.188.642, cada qual está aqui incorporada por referência na sua íntegra. Como usado aqui, um fragmento contém pelo menos 8 aminoácidos contínuos da SEQ ID NO:5-43 ou 56-65. A invenção engloba outros fragmentos, porém, tal como qualquer fragmento na proteína maior, aproximadamente, 10, 20, 30, 50, 100, 150, 200, 250, 300, 350, ou 400 aminoácidos.
Por "variantes" entende-se proteínas ou polipeptídeos contendo uma seqüência de aminoácidos que é pelo menos cerca de 60%, 65%, cerca de 70%, 75%, cerca de 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% idêntica a um polipeptídeo da EPSP sintase contendo o domínio da EPSP sintase da presente invenção. Alguém com habilidade na arte irá reconhecer que esses valores podem ser apropriadamente ajustados para determinar identidade correspondente de polipeptídeos codificados por dois polinucleotídeos levando em consideração degeneração de códons, similaridade de aminoácidos, posicionamento da fase de leitura, e similares.
Por exemplo, substituições conservativas de aminoácidos podem ser feitas em um ou mais resíduos de aminoácidos não-essenciais. Um resíduo de aminoácido "não- essencial" é um resíduo que pode ser alterado a partir da seqüência selvagem de um polipeptídeo sem alterar a atividade biológica, enquanto um resíduo de aminoácido "essencial" é requerido para atividade biológica. Uma "substituição conservativa de aminoácido" é uma em que o resíduo de aminoácido é substituído por um resíduo de aminoácido que possui uma cadeia lateral similar. Famílias de resíduos de aminoácidos contendo cadeias laterais básicas (ex., lisina, arginina, histidina), cadeias laterais ácidas (ex., ácido aspártico, ácido glutâmico), cadeias laterais polares não-carregadas (ex., glicina, asparagina, glutamina, serina, treonina, tirosina, cisteína), cadeias laterais apolares (ex., alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptofano), cadeias laterais beta-ramifiçadas (ex., treonina, valina, isoleucina) e cadeias laterais aromáticas (ex., tirosina, fenilalanina, triptofano, histidina). Substituições de aminoácidos podem estar em regiões não conservadas que retêm função. Em geral, tais substituições não seriam feitas em resíduos de aminoácidos conservados, ou em resíduos de aminoácido residindo dentro de um motivo conservado, onde tais resíduos são essenciais para atividade de polipeptídeo. Porém, alguém com habilidade na arte entenderia que variantes funcionais podem ter pequenas alterações conservadas ou não conservadas em resíduos conservados.
Anticorpos para os polipeptídeos da presente invenção, ou para variantes ou fragmentos derivados, também são englobados nessa invenção. Métodos para produção de anticorpos são bem conhecidos na arte (veja, por exemplo, Harlow e Lane (1988) AntibodiesÇ A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY, EUA; U.S. Patent No. 4.196.265) .
Em uma concretização da presente invenção, a enzima resistente a glifosato EPSPS possui uma Km para fosfoenolpiruvato (PEP) entre cerca de 1 e cerca de 150μΜ, incluindo cerca de 2μΜ, cerca de 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130 ou cerca de 140μΜ, e uma Ki (glifosato) / Km (PEP) entre, cerca de, 50 e, cerca de, 2000, entre, cerca de, 100 e, cerca de, 1000, cerca de 150, cerca de 200, cerca de 250, cerca de 300, cerca de 350, cerca de 400, cerca de 450, cerca de 500, cerca de 500, cerca de 600, cerca de 700, cerca de 800, cerca de 900, cerca de 1000, cerca de 1100, cerca de 1200, cerca de 1300, cerca de 1400, cerca de 1500, cerca de 1600, cerca de 1700, cerca de 1800, cerca de 1900, ou até no máximo cerca de 2 000. Como usado aqui, Km e Ki são medidas sob condições em que a enzima obedece a cinética de Michaelis-Menten, cerca de pH 7. Uma técnica de medida não limitante usa a enzima na forma purificada em cloreto de potássio e tampão HEPES em pH 7 a temperatura ambiente e usa concentrações de glifosato entre 0 e 10mM.
Atividade cinética da EPSP sintase pode ser analisada, por exemplo, através da liberação de fosfato que resulta durante a catálise de um substrato da EPSP sintase (por exemplo, PEP e S3P) em seu produto subseqüente de reação (por exemplo, 5-enolpiruvilchiquimato-3-fosfato) usando um ensaio de fluorescência descrito por Vasquez et al. (2003) Anal. Biochem. 320 (2):292-298 e no Pedido de Patente Norte-Americano No. 11/605.824 intitulada ngrg23 e grg51 Genes Conferring Herbicide Resistance", depositado em 29 de novembro de 2006 e aqui incorporado por referência na sua íntegra.
C. Construções de Polinucleotídeos
Os polinucleotídeos codificando o domínio de EPSP sintase da presente invenção podem ser modificados para obter ou potencializar a expressão em células vegetais. Os polinucleotídeos codificando polipeptídeos identificados pelos métodos da invenção podem ser providos em cassetes de expressão para expressão na planta de interesse. Um "cassete de expressão em plantas" inclui uma construção de DNA, tal como uma construção de DNA recombinante, que é capaz de resultar na expressão de um polinucleotídeo em uma célula vegetal. 0 cassete pode incluir na direção 5'-3' de transcrição, uma região de iniciação transcricional (ex. , promotor), operavelmente ligado a um ou mais polinucleotídeos de interesse, e uma região de terminação traducional e/ou transcricional (ex. região de terminação) funcional em plantas. 0 cassete pode adicionalmente conter pelo menos um polinucleotídeo adicional a ser introduzido no organismo, tal como um gene marcador de seleção.
Alternativamente, o(s) polinucleotídeo(s) adicional(is) podem ser providos em múltiplos cassetes de expressão. Tal cassete de expressão é provido com uma pluralidade de sítios de restrição para inserção do(s) polinucleotídeo(s) para ser sujeito a regulação transcricional das regiões regulatórias. "Heterólogo" geralmente refere-se ao polinucleotídeo ou polipeptídeo que não é endógeno da célula ou não é endógeno da localização no genoma nativo no qual está presente, e foi adicionada à célula por infecção, transfecção, micro-injeção, eletroporação, micro-projeção, ou similares. Por "operavelmente ligado" entende-se uma ligação funcional entre dois polinucleotideos. Por exemplo, quando um promotor é operavelmente ligado a uma seqüência de DNA, a seqüência do promotor inicia e medeia a transcrição da seqüência de DNA. É reconhecido que polinucleotideos operavelmente ligados podem ou não ser contínuos e, onde usados para referenciar a junção de duas regiões codificantes de polipeptídeos, os polipeptídeos estão expressos na mesma fase de leitura.
O promotor pode ser qualquer seqüência polinucleotídica que apresente atividade transcricional nas células vegetais, na parte da planta, ou planta escolhida. O promotor pode ser nativo ou análogo, ou externo ou heterólogo, em relação à planta hospedeira e/ou à seqüência de DNA da invenção. Quando o promotor é "nativo" ou "análogo" em relação à planta hospedeira, entende-se que o promotor é encontrado na planta nativa na qual o promotor é introduzido. Quando o promotor é "externo" ou "heterólogo" em relação à seqüência de DNA da invenção, entende-se que o promotor não é o promotor nativo ou o encontrado na natureza em relação à seqüência de DNA operavelmente ligada da invenção. O promotor pode ser induzível ou constitutivo. Ele pode ser encontrado na natureza, pode ser composto de porções de vários promotores encontrados na natureza, ou pode ser parcialmente ou totalmente sintético. Orientação para o desenho de promotores é provida por estudos de estrutura de promotor, tal como o de Harley e Reynolds (1987) Nucleic Acids Res. 15:2342-2361. Também, a localização do promotor relativa ao inicio da transcrição pode ser otimizada. Veja, ex. , Roberts et al. (1979) Proc. Natl. Acad. Sei. USA, 76:760-764. Muitos promotores apropriados para o uso em plantas são bem conhecidos na arte.
Por exemplo, promotores constitutivos apropriados para o uso em plantas incluem: os promotores de vírus vegetais, tais como o promotor do caulimovírus da linha clorótica de amendoim (PClSV) (Patente Norte-Amerciana No. 5.850.019); o promotor 35S do vírus do mosaico da couve-flor (CaMV) (Odell et al. (1985) Nature 313:810-812); promotores dos genes de metil-transferase do vírus Chlorella (Patente Norte-Amerciana No. 5.563.328) e o promotor do transcrito completo do vírus do mosaico da Scrophularia (FMV) (Patente Norte-Amerciana No. 5.378.619); promotores de genes como actina de arroz (McElroy et al (1990) Plant Cell 2:163- 171); ubiqüitina (Christensen et al. (1989) Plant Mol. Biol. 12:619-632 e Christensen et al. (1992) Plant Mol. Biol. 18:675-689); pEMU (Last et al. (1991) Theor. Appl. Genet. 81:581-588); MAS (Velten et al. (1984) EMBO J. 3:2723-2730); histona H3 de milho (Lepetit et al. (1992) Mol. Gen. Genet. 231:276-285 e Atanassova et al. (1992) Plant J. 2(3):291-3 00); ALS3 de Brassiea napus (pedido de patente PCT WO 97/41228); e promotores de vários genes de Agrobacterium (veja Patentes Norte-Americana Nos. 4.771.002; 5.102.796; 5.182.200; e 5.428.147).
Promotores induzíveis apropriados para o uso em planta incluem: o promotor do sistema ACEl que responde à cobre (Mett et al. (1993) PNAS 90:4567-4571); o promotor do gene In2 de milho que responde ao antídoto do herbicida benzenosulfonamida (Hershey et al. (1991) Mol. Gen. Genetics 227:229-237 e Gatz et al. (1994) Mol. Gen. Genetics 243:32-38); e o promotor do repressor Tet do TnlO (Gatz et al(1991) Mol. Gen. Genet. 227:229-237). Outro promotor induzível para uso em plantas é aquele que responde a um agente indutor ao qual, plantas geralmente não respondem. Um promotor induzível exemplar desse tipo é o promotor induzível do gene do hormônio esteróide, no qual a atividade transcricional é induzida pelo hormônio glucocorticoesteróide (Schena et al. (1991) Proc. Natl. Acad. USA 88:10421) ou a recente aplicação de um ativador transcricional quimérico, XVE, para uso em um sistema induzível de expressão em plantas baseado no receptor de estrogênio ativado por estradiol (Zuo et al. (2000) Plant J., 24:265-273). Outros promotores induzíveis para uso em plantas são descritos em EP 332104, PCT WO 93/21334 e PCT WO 97/062 69 que estão aqui incorporados por referência na sua íntegra. Promotores compostos de parte de outros promotores e promotores parcialmente ou totalmente sintéticos podem também ser utilizados. Veja, ex., Ni et al. (1995) Plant J. 7:661-676 e PCT WO 95/14098 descrevendo tais promotores para uso em plantas. O promotor pode incluir, ou ser modificado para incluir, um ou mais elementos intensificadores ("enhancer"). Em algumas concretizações, o promotor pode incluir uma pluralidade de elementos intensificadores.
Promotores contendo elementos intensificadores provêm níveis mais altos de transcrição quando comparados a promotores que não os inclui. Elementos intensificadores apropriados para uso em plantas incluem o elemento intensificador do PClSV (Patente Norte-America No. 5.850.019), o elemento intensif icador do 35S do CaMV (Patentes Norte-Americanas Nos. 5.106.739 e 5.164.316) e o elemento intensificador do FMV (Maiti et al. (1997) Transgenic Res. 6:143-156). Veja também PCT WO 96/23898.
Freqüentemente, tais construções podem conter regiões 5' ou 3' não traduzidas. Tais construções podem conter uma "seqüência sinal" ou "seqüência líder" para facilitar transporte co-traducional ou pós-traducional do peptídeo de interesse para certas estruturas intracelulares tais como cloroplasto (ou outro plastídeo), retículo endoplasmático, ou aparelho de Golgi, ou para ser secretada. Por exemplo, a construção pode ser desenhada de modo a conter um peptídeo sinal para facilitar a transferência do peptídeo para o retículo endoplasmático. Por "seqüência sinal" entende-se uma seqüência que é conhecida ou suspeita de resultar em transporte de peptídeo co-traducional ou pós-traducional para a membrana plasmática. Em eucariotos, isso tipicamente envolve secreção para dentro do aparelho de Golgi, com alguma glicosilação resultante. Por "seqüência líder" 30 entende-se qualquer seqüência que, quando traduzida, resulte em uma seqüência de aminoácido suficiente para acionar o transporte co-traducional da cadeia peptídica para uma organela sub-celular. Logo, isso inclui seqüências líderes levando ao transporte e/ou glicosilação por passagem no retículo endoplasmático, passagem pelo vacúolo, plastídeos incluindo cloroplastos, mitocôndria, e similares. Também pode ser preferível desenhar um cassete de expressão em planta que contenha um íntron, de modo que o processamento do mRNA seja requerido para expressão.
Por "região 3' não traduzida" entende-se um polinucleotídeo localizado abaixo da seqüência codificante. Seqüência de sinal de poliadenilação e outras seqüências codificando sinais regulatórios capazes de afetar a adição de tratos de ácido poliadenílico na ponta 3' do precursor do mRNA são regiões 3' não traduzidas. Por "região 5' não traduzida" entende-se um polinucleotídeo localizado acima de uma seqüência codificante.
Outros elementos não traduzidos acima ou abaixo incluem intensificadores. Intensificadores são polinucleotídeos que agem para aumentar a expressão de uma região promotora. Intensificadores são bem conhecidos na arte e incluem, porém não são limitados a região intensificadora SV40 e o elemento intensificador 35S.
A região de terminação pode ser nativa em relação à região de início de transcrição, pode ser nativa em relação à seqüência da presente invenção, ou pode ser derivada de outra fonte. Regiões de terminação convenientes estão disponíveis no plasmídeo Ti de A. tumefaciens, tais como as regiões de terminação da octopina sintase e da nopalina sintase. Veja também Guerineau et al. (1991) Mol. Gen. Genet. 262:141-144; Proudfoot (1991) Cell 64:671-674; Sanfacon et al. (1991) Genes Dev. 5:141-149; Morgen et al. (1990) Plant Cell 2:1261-1272; Munroe et al. (1990) Gene 91:151-158; Bailas et al. (1989) Nucleic Acids Res. 17:7891-7903; e Joshi et al. (1987) Nucleic Aeid Res. 15:9627-9639.
Em um aspecto da invenção, seqüências sintéticas de DNA são desenhadas para um determinado polipeptídeo, tais como os polipeptídeos da invenção. Expressão da fase aberta de leitura da seqüência sintética de DNA em uma célula resulta na produção do polipeptídeo da invenção. Seqüências sintéticas de DNA podem ser úteis simplesmente na remoção sítios de endonucleases de restrição indesejados, na facilitação de estratégias de clonagem de DNA, na alteração ou remoção de qualquer tendência potencial de códon, na alteração ou melhoramento do conteúdo GC, na remoção ou alteração de fases de leitura alternativas, e/ou na alteração ou remoção sítios de reconhecimento de processamento íntron/éxon, sítios de poliadenilação, seqüências Shine-Delgarno, elementos promotores indesejados e similares que podem estar presente em uma seqüência de DNA nativo. Também é possível que seqüências sintéticas de DNA possam ser utilizadas para introduzir outros melhoramentos em uma seqüência de DNA, tais como introdução de uma seqüência de íntron, criação de uma seqüência de DNA que é expressa como uma proteína de fusão com seqüências de endereçamento para organelas, tais como peptídeo de trânsito para o cloroplasto, peptídeos de endereçamento para o apoplasto/vacúolo, ou seqüência peptidicas que resultam na retenção do peptídeo resultante no retículo endoplasmático. Genes sintéticos também podem ser sintetizados usando códons preferenciais da célula hospedeira para expressão melhorada, ou ser sintetizados usando códons em uma freqüência preferencial de uso de códons da célula hospedeira. Veja, por exemplo, Campbell e Gowri (1990) Plant Physiol. 92:1-11; Patentes Norte- Americanas Nos. 6.320.100, 6.075.185, 5.380.831, e 5.463.391, Pedidos de Patente Norte-Americano publicados Nos. 20040005600 e 20010003849, e Murray et al. (1989) Nucleic Acids Res. 17:477-498, aqui incorporado por referência.
Em uma concretização, os polinucleotídeos de interesse são endereçados para o cloroplasto para expressão. Dessa maneira, onde o polinucleotídeo de interesse não é diretamente inserido no cloroplasto, o cassete de expressão irá adicionalmente conter um polinucleotídeo codificando um peptídeo de trânsito para direcionar o nucleotídeo de interesse para os cloroplastos. Tais peptídeos de trânsito são conhecidos na arte. Veja, por exemplo, Von Heijne et al. (1991) Plant Mol. Biol. Rep. 9:104-126; Clark et al. (1989) J. Biol. Chem. 264:17544-17550; Della-Cioppa et al.(1987) Plant Physiol. 84:965-968; Romer et al. (1993) Biochem. Biophys. Res. Commun. 196:1414-1421; e Shah et al. (1986) Science 233:478-481. Os polinucleotídeos de interesse a serem endereçados para o cloroplasto podem ser otimizados para expressão no cloroplasto em relação a diferenças no uso de códons entre o núcleo vegetal e essa organela. Dessa maneira, os polinucleotídeos de interesse podem ser sintetizados usando códons preferências de cloroplasto. Veja, por exemplo, a Patente Norte-Americana No. 5.380.831, aqui incorporada por referência.
Esse cassete de expressão em plantas pode ser inserido em um vetor de transformação de planta. Por "vetor de transformação" entende-se uma molécula de DNA que permite a transformação de uma célula. Tal molécula pode consistir em um ou mais cassetes de expressão, e pode estar organizada em mais de uma molécula de vetor de DNA. Por exemplo, vetores binários são vetores de transformação de plantas que utilizam dois vetores de DNA não contínuos para codificar todas as funções que agem em eis e trans requeridas para a transformação de células vegetais (Hellens e Mullineaux (2 000) Trends In Plant Science 5:446- 451). "Vetor" refere-se a uma construção de polinucleotídeo desenhada para realizar transferência entre diferentes células hospedeiras. "Vetor de expressão" refere-se a um vetor que possui a habilidade de incorporar, integrar e expressar seqüências de DNA heterólogo ou fragmentos em uma célula estranha.
O vetor de transformação de planta contém um ou mais vetores de DNA para alcançar a transformação da planta. Por exemplo, é prática comum na arte utilizar vetores de transformação de planta que contêm mais de um segmento continuo de DNA. Esses vetores são freqüentemente referidos como vetores binários na arte. Vetores binários assim como vetores com plasmideo de auxilio ("helper") são mais comumente usados para transformação mediada por Agrobacterium, onde o tamanho e complexidade dos segmentos de DNA requerido para atingir transformação eficiente é bem grande, o que torna vantajoso separar funções em moléculas de DNA separadas. Vetores binários tipicamente contêm um vetor plasmidial que contém seqüências que agem em eis requeridas para a transferência do T-DNA (tais como a borda esquerda e a borda direita), um marcador de seleção que é desenhado para ser capaz de expressar-se em uma célula vegetal, e um "polinucleotídeo de interesse" (um polinucleotideo desenhado para ser capaz de expressar-se em uma célula vegetal pelo número de gerações de plantas transgênicas desejado). Também presentes nesse vetor plasmidial estão seqüências requeridas para replicação bacteriana. Essas seqüências que agem em eis estão arranjadas de maneira que permite transferência eficiente para células vegetais e expressão nestas. Por exemplo, a seqüência de marcador de seleção e a seqüência de interesse estão localizadas entre as bordas esquerda e direita. Freqüentemente, um segundo plasmideo contém os fatores que agem em trans que medeiam a transferência do T-DNA da Agrobaeterium para a célula vegetal. Esse plasmideo freqüentemente contém funções de virulência (genes Vir) que permitem a infecção de células vegetais por Agrobaeterium, e transferência de DNA por clivagem nas seqüências da borda e transferência de DNA mediada pelos genes vir, como é entendido na arte (Hellens e Mullineaux (2 000) Trends in Plant Science, 5:446-451). Vários tipos de cepas de Agrobacterium (ex. LBA4404, GV3101, EHAlOl, EHA105, etc.) podem ser usadas para transformar plantas. O segundo vetor plasmidial não é necessário para a introdução de polinucleotideos em plantas por outros métodos tais como micro-projeção, micro-injeção, eletroporação, polietileno glicol, etc.
D. Transformação de Planta
Métodos da invenção involvem introdução de uma construção nucleotídica em uma planta. Por "introdução" entende-se apresentar à planta a construção nucleotídica de tal maneira que a construção ganha acesso ao interior de uma célula da planta. Os métodos da invenção não requerem que um método particular de introdução de uma construção nucleotídica em uma planta seja usado, somente que a construção nucleotídica ganhe acesso ao interior de, pelo menos, uma célula da planta. Métodos de introdução de construções nucleotídicas em plantas são conhecidas na arte incluindo, porém não limitados a, métodos de transformação estáveis, métodos de transformação transiente, e métodos mediados por vírus.
Em geral, métodos de transformação de plantas involvem transferência de DNA heterólogo para células vegetais alvo (ex. , embriões imaturos e maduros, culturas de células em suspensão, calos indiferenciados, protoplastos, etc.), seguido de aplicação de um nível no limite máximo da seleção apropriada (dependendo do gene marcador de seleção e, nesse caso, "glifosato") para recuperar as células vegetais transformadas a partir de um grupo de massa de células não transformadas. Explantes são tipicamente transferidos para um suprimento fresco do mesmo meio e cultivado rotineiramente. Subseqüentemente, as células transformadas são diferenciadas em brotos após serem colocados em meio de regeneração suplementado com um nível no limite máximo do agente seletivo (ex. "glifosato"). Os brotos são então transferidos para um meio seletivo de enraizamento para recuperar um broto enraizado ou plântula. A plântula transgênica então cresce em plantas maduras e producem sementes férteis (ex., Hiei et al. (1994) The Plant Journal 6:271-282; Ishida et al. (1996) Nature Biotechnology 14:745-750). Explantes são tipicamente transferidos para um suprimento fresco do mesmo meio e cultivado rotineiramente. Uma descrição geral das técnicas e métodos para gerar plantas transgênicas é encontrada em Ayres e Park (1994) Criticai Reviews in Plant Science 13:219-239 e Bommineni e Jauhar (1997) Maydica 42:107-120. Como o material transformado contém muitas células; tanto células transformadas como não transformadas estão presentes em qualquer pedaço do calo ou tecido ou grupo de células subjetivado a alvo. A habilidade de matar células não transformadas e permitir que células transformadas se proliferem resulta em cultura de plantas transformadas. Freqüentemente, a habilidade de remover células não transformadas é uma limitadação para a rápida recuperação de células vegetais transformadas e a geração bem-sucedida de plantas transgênicas. Métodos moleculares e bioquímicos podem ser usados para confirmar a presença do gene de interesse heterólogo integrado no genoma da planta transgênica.
Geração de plantas transgênicas pode ser realizada por um dos vários métodos, incluindo, porém não limitado a, introdução de DNA heterólogo por Agrobacterium em células vegetais (transformação mediada por Agrobacterium) , borbardeamento de células vegetais com DNA externo heterólogo aderido a partículas, e vários outros métodos não mediado diretamente por partículas (ex. , Hiei et ai. (1994) The Plant Journal 6:271-282; Ishida et al. (1996) Nature Biotechnology 14:745-750; Ayres e Park (1994) Criticai Reviews in Plant Science 13:219-239; Bommineni e Jauhar (1997) Maydica 42:107-120) para transferir DNA.
Métodos para transformação de cloroplastos são conhecidos na arte. Veja, por exemplo, Svab et al. (1990) Proc. Natl. Acad. Sei. USA 87:852 6-853 0; Svab e Maliga (1993) Proc. Natl. Acad. Sei. USA 90:913-917; Svab e Maliga (1993) EMBO J. 12:601-606. O método se basea na deposição do DNA contendo um marcador de seleção através do uso de arma de partícula e endereçamento do DNA para o genomado plastídeo através de recombinação homóloga. Adicionalmente, a transformação de plastídeo pode ser obtida por transativação de um transgene silencioso plastídeo- compatível por uma RNA polimerase codificada no núcleo e direcionada para o plastídeo com expressão tecidual preferencial. Tal sistema foi reportado em McBride et al. (1994) Proc. Natl. Acad. Sci USA 91:7301-7305. As células que foram transformadas podem ser crescidas em plantas de acordo com modos convencionais. Veja, por exemplo, McCormick et al. (1986) Plant Cell Reports 5:81- 84. Essas plantas podem então ser crescidas, e também polinizadas com a mesma linhagem transformada ou com uma linhagem diferente, e o híbrido resultante possuir expressão constitutiva da característica fenotípica desejada identificada. Duas ou mais gerações podem ser crescidas para assegurar que a expressão da característica fenotípica desejada é mantida e herdada estavelemente e, depois, as sementes podem ser coletadas para assegurar que a expressão da característica fenotípica desejada foi atingida. Dessa maneira, a presente invenção provém semente transformada (também referida como "semente transgência") contendo uma construção nucleotídica da invenção, por exemplo, um cassete de expressão da invenção, incorporado estavelmente no genoma da semente.
E. Avaliação da Transformação de Planta
Seguido a introdução do DNA externo heterólogo em células vegetais, a transformação ou integração do gene heterólogo no genoma da planta é confirmado por vários métodos tais como análise de ácidos nucléicos, proteínas e metabólitos associados como o gene integrado.
Análise de PCR é um método rápido de selecionar células, tecidos ou brotos transformados para a presença do gene incorporado em estágios iniciais que antecedem o transplante para o solo (Sambrook e Russell (2 001) Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, nY, EUA)). PCR é conduzido usando oligonucleotídeos iniciadores específicos para o gene de interesse ou para o corpo do vetor de Agrobacterium, etc.
Transformação de planta pode ser confirmada por análise de Southern blot de DNA genômico (Sambrrok e Russel (2001) supra). Em geral, DNA total é extraído do transformante, digerido com enzimas de restrição apropriadas, fracionado em um gel de agarose e transferido para uma membrana de nitrocelulose ou nylon. A membrana ou "blot" pode então ser hibridizada com, por exemplo, um fragmento de DNA alvo marcado com 32P para confirmar a integração do gene introduzido no genoma da planta de acordo com técnicas padrão (Sambrook e Russell, 2 001, supra).
Na análise por Northen, RNA é isolado de tecidos específicos do transformante, fracionados em um gel de agarose com formaldeído, e transferidos para um filtro de nylon de acordo com procedimentos padrão que são rotineiramente usados na arte (Sambrook e Russel (2 001) supra). Expressão de RNA codificada por seqüências grg da invenção é então testada através da hibridização de filtro a uma sonda radioativa derivada a partir de uma decarboxilase conferindo resistência a glifosato (GDC) por métodos conhecidos na arte (Sambrook e Russel (2001) supra) . Western blot e ensaios bioquímicos e similares podem ser conduzidos nas plantas transgênicas para determinar a presença da proteína codificada pelo gene de resistência ao herbicida por procedimentos padrão (Sambrook e Russel (2001) supra) usando anticorpos que se ligam a um ou mais epítopos presentes na proteína de resistência ao herbicida.
F. Plantas e Partes de Planta
Por "planta" entende-se plantas inteiras, órgãos de plantas (ex. folhas, caules, raízes, etc.), sementes, células vegetais, propágulas, embriões e prole da mesma. Células vegetais podem ser diferenciadas ou indiferenciadas (ex., calo, células em suspensão de cultura, protoplastos, células de folha, células de raiz, células de floema, pólen). A presente invenção pode ser usada para introdução de polinucleotídeos em qualquer espécie de plantas, incluindo, porém não limitada a, monocotiledôneas e dicotiledôneas. Exemplos de plantas de interesse incluem, porém não se limita a, milho, sorgo, tripo, girassol, tomate, crucíferas, pimentas, batata, algodão, arroz, soja, beterraba, cana-de-açúcar, tabaco, cevada, e colza, Brassica sp., alfafa, centeio, milhete, cartamo, amendoim, batata doce, mandioca, café, coco, abacaxi, arvores cítricas, cacau, chá, banana, abacate, figo, goiaba, manga, azeitona, mamão, cajú, macadamia, amêndoa, aveia, vegetais, ornamentais e coníferas.
Vegetais incluem, porém não se limitam a, tomates, alface, feijão verde, feijão de lima, ervilhas, e membros do gênero Curcumis tais como pepino, meloa, e melão. Ornamentais incluem, porém não se limitam a, azaléia, hortência, hibisco, rosas, tulipas, narcisos, petúnias, cravo, bico-depapagaio, e crisântemo. Plantas de cultivo também são de interesse, incluindo, por exemplo, milho, sorgo, trigo, girassol, tomate, crucíferas, pimentas, batata, algodão, arroz, soja, beterraba, cana-de-açúcar, tabaco, cevada, colza, etc.
Essa invenção é apropriada para qualquer membro da família de plantas monocotiledôneas incluindo, porém não limitada a, milho, arroz, cevada, aveia, trigo, sorgo, centeio, cana-de-açúcar, abacaxi, inhame, cebola, banana, coco e tâmara.
G. Métodos para aumentar a produtividade da planta
Métodos para aumentar a produtividade da planta são providos. Os métodos consistem na introdução em uma planta ou célula vegetal de um polinucleotídeo contendo em seqüência de EPSP sintase contendo um domínio de seqüência revelado aqui. Como definido aqui, a "produtividade" da planta refere-se a qualidade e/ou quantidade de biomassa produzida pela planta. Por "biomassa" entende-se qualquer produto vegetal medido. Um aumento na produção de biomassa é qualquer melhora na produtividade do produto vegetal medido. O aumento da produtividade da planta possui várias aplicações comerciais. Por exemplo, o aumento da biomassa de folha da planta pode levar a um aumento da produtividade de vegetais folhosos para consumo humano ou animal. Adicionalmente, o aumento da biomassa de folha pode ser usado para aumentar a produção de farmacêuticos ou produtos industriais derivados de planta. Um aumento em produtividade pode constar de qualquer aumento significativo incluindo, porém não limitado a, pelo menos, um aumento de 1%, pelo menos, um aumento de 3%, pelo menos, um aumento de 5%, pelo menos, um aumento de 10%, pelo menos, um aumento de 20%, pelo menos, um aumento de 3 0%, pelo menos, um aumento de 50%, pelo menos, um aumento de 70%, pelo menos um aumento de 100% ou um aumento ainda maior.
Em métodos específicos, a planta é tratada com uma concentração efetiva de um herbicida, onde a aplicação do herbicida resulta em uma produtivade da planta potencializada. Por "concentração efetiva" entende-se a concentração que permite um aumento de produtiviade na planta. Tais concentrações efetivas para herbicidas de interesse são geralmente conhecidos na arte. O herbicida pode ser aplicado tanto antes ou após a planta ter emergido de acordo com técnicas usuais para aplicação de herbicida em campos contendo plantas de cultivo que se tornaram resistentes ao herbicida devido a expressão heteróloga de um gene EPSP sintase da invenção.
Métodos para conferir resistência ao herbicida em uma planta ou parte de planta também são providos. Em tais métodos, um polinucleotídeo EPSP sintase revelado aqui é introduzido na planta, cuja expressão de polinucleotídeos resulta em tolerância ou resistência ao glifosato. Plantas produzidas via esse método podem ser tratadas com uma concentração efetivade um herbicida e apresentar uma tolerância aumentada ao herbicida. Uma "concentração efetiva" de um herbicida nessa aplicação é uma quantidade suficiente para retardar ou estagnar o crescimento de plantas ou partes de plantas que não são naturalemnte resistentes ou se tornaram resistentes ao herbicida.
H. Métodos de controle de ervas daninhas no campo
Métodos para seletivamente controlar ervas daninhas em um campo contendo uma planta também são providos. Em uma concretização, sementes de plantas ou plantas que são resistentes ao glifosato são reveladas aqui como resultado da inserção na semente da planta ou planta de um polinucleotídeo contendo um domínio de seqüência. Em métodos específicos, a planta é tratada com uma concentração efetiva de um herbicida, onde a aplicação do herbicida resulta em um controle seletivo de ervas daninhas ou outras plantas não transformadas. Por "concentração efetiva" entende-se a concentração capaz de controlar o crescimento ou a propagação de ervas daninhas ou outras plantas não transformadas sem significativamente afetar a planta ou semente de planta resistente ao glifosato. Tais concentrações efetivas para herbicidas de interesse são geralmente conhecidas na arte. 0 herbicida pode ser aplicado antes ou depois da planta ter emergido de acordo com técnicas usuais para aplicação de herbicida em campos contendo plantas ou sementes de plantas que se tornaram resistentes ao herbicida.
Os exemplos seguintes são oferecidos como meio de ilustração e não como meio de limitação. EXPERIMENTOS
Exemplo 1. Desenho e expressão de syngrgl
Uma seqüência gênica nova codificando a proteína GRGl (SEQ ID NO: 2, Pedido de Patente Norte-Americano No. 10/739.610) foi desenhada e sintetizada. Esse seqüência é provida como SEQ ID NO: 3. Esse fase aberta de leitura, designada aqui como "syngrgl", foi clonada em um vetor de expressão pRSFlb (Invitrogen), por métodos conhecidos na arte.
Exemplo 2. Mutagênese Sitio-dirigida de GRGl
0 pedido de patente norte-americano No. 11/651, 752 depositado em 12 de janeiro de 2006 (aqui incorporado por referência) revela a volta em forma de Q como uma região importante na conferência da resistência ao glifosato às EPSP sintases. A volta em forma de Q é definida como a região que vai desde a valina correpondendo à posição de aminoácido 80 da SEQ ID NO: 2 (GRGl) até a glutamina correspondendo à posição de aminoácido 105 da SEQ ID NO: 2.
Para os propósitos da presente invenção, discussão da volta em forma de Q será adicionalmente restrita a uma região contendo a região "central" da volta em forma de Q englobando a partir da isoleucina correspondendo à posição de aminoácido 84 da SEQ ID NO: 2 até a isoleucina correspondendo à posição de aminoácido 99 da SEQ ID NO: 2.
Aqui, um número de posição é designado aos aminoácidos nessa região central para simplificar a referência a cada resíduo de aminoácido nessa região. Logo, as posições do centro da volta de em forma de Q correspondem aos aminoácidos 84 a 99 da SEQ ID NO: 2 (I-D-C-G-E-S-G-L-S-I-R- M-F-T-P-I) e estão aqui incorporados como seguinte:
Tabela 1. Designação das Coordenadas de Posição para os aminoácidos da volta em forma de Q
<table>table see original document page 52</column></row><table>
Para facilitar a mutagênese do gene syngrgl, uma variante de syngrgl foi gerada de modo a criar convenientes sítios de restrição flanqueando a volta em forma de Q. Essa seqüência de DNA variante codifica uma proteína idêntica a proteína GRGl. Mutagênese de syngrgl foi realizada usando-se o QUIKCHANGE® Multsite kit (Stratagene, La Jolla, CA, EUA) usando os oligonucleotídeos GATGGCAGCCTCCAGATCACTAGTGAAGGCGTTAAGCCAGTGGC (SEQ ID NO: 52) e GTTCACACCAATCGTGGCGCTTTCGAAGGAAGAAGTGACAATCAAG
(SEQ ID NO:53) para simultaneamente introduzir dois sítios de restrição flanqueando a região da volta em forma de Q da GRGl; um sítio Spe I a 5' da volta, e um sítio BstB I a 3' da região da volta em forma de Q. A seqüência de DNA do clone resultante, ' syngrgl-SB' (SEQ ID NO: 4) foi confirmada por seqüenciamento de DNA.
Exemplo 3. Mutagênese combinatória de syngrgl-SB
Uma biblioteca de clones mutantes (Biblioteca 1) foi desenvolvida por mutagênese combinatória dentro da região central da volta em forma de Q de GRGl com um conjunto de 32 oligonucleotídeos. Esses oligonucleotídeos foram desenhados para introduzir mutações em quatro resíduos da volta em forma de Q, nas posições 4, 5, 7 e 12 do centro da volta em forma de Q (Tabela 1 e Figura 1) . Oligonucleotídeos foram ressuspendidos em Tris-Hcl 10 mM pH 8,5 a uma concentração de 10 μΜ. Para formar moléculas de DNA dupla-fita, oligonucleotídeos complementares foram misturados e incubados da seguinte forma: 95°C por 1 minuto; 80°C por 1 minuto; 70°C por 1 minuto; 60°C por 1 minuto; e 50°C por 1 minuto.
As moléculas de dupla-fita de DNA contendo códons degenerados foram digeridos com as enzimas de restrição Spe I e BstB I como especificado pelo fabricante. Após a digestão com enzima de restrição, o DNA foi aplicado em um gel de agarose 4% e submetido à eletroforese. 0 DNA foi excisado do gel e eluído usando o QIAQUICK® Gel Extraction kit (Qiagen, Valencia, CA, EUA). Os oligonucleotideos anelados foram ligados em pRSFlb-syngrg-SB, digeridos com Spe I e BstB I, tratados com fosfatase alcalina de vitelo, transformadas em células BL21*DE3 (Invitrogen), e plaqueadas em placas LB contendo canamicina. A partir dessas transformações teste, a biblioteca foi estimada em conter aproximadamente 140.000 clones. Para confirmar a diversidade da biblioteca, 20 clones foram aleatoriamente escolhidos a partir de placas LB-canamicina e seqüenciados na região da volta em forma de Q. Essa análise de seqüência confirmou a alta diversidade da biblioteca, e demonstrou que 75% dos clones são completos e possuem uma fase aberta de leitura intacta da região da volta em forma de Q (dados não mostrados).
Exemplo 4. Mutagênese Permutacional de syngrgl-SB 0 método de mutagênese permutacional (Pedido de Patente Norte-Americano No. 60/813.095, depositado em 13 de junho de 2 006 e incorporado aqui por referência na sua integra) foi usado para gerar uma segunda biblioteca de variantes na volta em forma de Q. As seqüências de aminoácidos de GRGl, GRG2 0 (SEQ ID NO: 54, Pedido de Patente Norte-Americano No. 60/658.320) foram alinhadas, e um conjunto consenso de aminoácidos foi desenvolvido (Figura 2). Uma série de oligonucleotídeos foi desenhada para introduzir a diversidade apresentada na Figura 2, que cobre a diversidade completa do consenso de tradução do centro da volta em forma de Q como mostrado na Tabela 3. Posições 1, 6, 11, e 15 são absolutamente conservadas entre GRGl, GRG20, e GRG21. A diversidade potencial gerada por essa abordagem é mostrada como o consenso de tradução na Figura 2 e na SEQ ID NO: 48.
Oligonucleotídeos foram ressuspensos em Tris-HCl 10 mM pH 8,5 a uma concentração de 10 μΜ. Para formar moléculas de DNA dupla-fita, oligonucleotídeos complementares foram misturados e incubados da seguinte forma: a 95°C por 1 minuto; a 80°C por 1 minuto; a 70°C por 1 minuto; a 60°C por 1 minuto; e a 50°C por 1 minuto. Os oligonucleotídeos anelados foram ligados em pRSFlb-syngrg-SB, digeridos com Spe I e BstB I e tratados com fosfatase alcalina de vitelo. Ligações teste foram transformadas em células BL21*DE3 (Invitrogen), e plaqueadas em placas LB contendo canamicina. A partir dessas transformações teste, a biblioteca foi estimada em conter aproximadamente 180.000 clones. Vinte clones foram aleatoriamente selecionados a partir dos clones crescendo em LB e seqüenciados. Dezenove dos 20 clones apresentaram codificar proteínas completas e na fase certa de leitura na região da volta em forma de Q, apesar da geração de uma grande diversidade na região. Altos níveis de variação foram observados (ao todo 13 posições alvo) nos vinte clones seqüenciados, sugerindo que a diversidade da biblioteca atingiu seu nível teórico (dados não mostrados). Exemplo 5. Seleção para resistência ao glifosato em placas
Ligações de bibliotecas foram transformadas em células competentes de E. coli BL21*DE3 (Invitrogen). As transformações foram realizadas de acordo com as instruções do fabricante com as seguintes modificações. Após incubação por 1 hora a 37°C em meio SOC, as células foram sedimentadas por centrifugação (5 minutos, 1000 X g, 4°C) .
As células foram lavadas com 1 ml de M63+, centrifugadas novamente, e o supernadante decantado. As células foram lavadas por uma segunda vez com 1 ml de M63+ e ressuspendidas em 200 μΐ de M63+.
Para selecionar enzimas GRGl mutantes conferindo resistência ao glifosato em E. coli, as células foram plaqueadas em placas de meio com agar M63+ contendo glifosato 50 mM, IPTG (isopropil-beta-D- tiogalactopiranosideo) 0,05 mM, e canamicina 50 yg/ml. Meio M63+ contém KH2PO4 100 mM, (NH4)2SO4 15 mM. CaCl2 50 μΜ, FeSO4 1 μΜ, MgCl2 50 μΜ, glicose 55 mM, L-prolina 25 mg/litro, HCl tiamina 10 mg/litro, NaOH suficiente para ajustar o pH para 7,0, e agar 15 mg/litro. As placas foram incubadas por 3 6 horas a 37°C.
Exemplo 6. Preparação de extratos contendo mutantes GRG-I glifosato resistentes
Células BL21*DE3 transformadas com mutantes GRG-I crescendo em placas com glifosato foram crescidas em meio LB suplementado com 50 μg/ml de canamicina a 37°C. Quando o meio de cultura atingiu em densidade ótica (600 nm) de 0,5; IPTG 0,5 mM foi adicionado, e as culturas foram incubadas por 16 horas a 20°C. As culturas foram centrifugadas a 12.000 X g por 15 minutos a 4°C, o sobrenadante foi removido, e as células foram ressuspensas em Hepes/KOH 50 mM pH 7,0; NaCl 300 mM; lisozima 1 mg/ml;
0,04 ml de DNase I. As células ressuspensas foram incubadas por 1 hora a temperatura ambiente. As células foram sonicadas 3 vezes por 10 segundos usando um Misonix Sonicator 3 000 na potência 7,5. Entre rupturas de sonificação as células foram incubadas em gelo por 30 segundos. Os lisados de célula foram centrifugados a 27 000 X g por 15 minutos a 4°C, e o sobrenadante contendo o extrato de célula foi recuperado. Os extratos de células foram dialisados 2X por 4 horas contra Hepes/KOH 50 mM pH 7,0; NaCL 3 00 mM e armazenados a 4°C.
Exemplo 7. Quantificação de extratos contendo mutantes GRG-1 resistentes a glifosato
A expressão de proteínas variantes de GRG-1 em extratos de células foi determinada através de um dot blot quantitativo usando anticorpo. Duas folhas de papel de filtro 3MM foram enxarcadas em tampão PBS IX (fosfato de potássio 20 mM pH 7,2; NaCl 150 mM) e colocadas em um molde de 96 poços para dot blot (Schleicher e Schuell, Keene, NH, EUA). Uma folha de membrana de nitrocelulose Optitran BA-S 83 (Schleicher e Schuell) foi enxarcada em tampão PBS IX e colocada em cima do papel de filtro 3MM. Diluições seriais de extratos de células assim como diluições da proteína selvagem GRG-1 purificada de concentração conhecida ("padrões de proteína") foram preparadas em um volume final de 100 μl de PBS IX. As amostras foram aplicadas nos poços de dot blot e um vácuo de 10 cm Hg foi aplicado. Os poços foram lavados 3 vezes com 3 00 μΐ de PBS. A membrana de nitrocelulose foi removida e bloqueada por uma hora em leite em pó 3% em PBS. A solução bloqueadora foi removida e a membrana de nitrocelulose foi incubada com um anticorpo monoclonal anti-6Xhis conjugado com a peroxidase de raiz-forte (Serotec, Raleigh, NC, EUA) diluída 1:5000 em leite em pó 3% em PBS. Após uma hora de incubação a temperatura ambiente, a membrana foi lavada quatro vezes por cinco minutos com PBS-T (Tween20 0,05% em PBS) . A membrana foi incubada com o reagente de detecção para western blotting ECL PLUS™ (Amersham Biosciences, Piscataway, NJ, EUA) por cinco minutos a temperatura ambiente. A solução de detecção foi removida e um filme Biomax Light (Kodak) foi colocado em cima da membrana e exposto por dez minutos. 0 filme foi escaneado e a quantificação de sinal foi realizada utilizando o programa de computador Phoretix Array (Nonlinear Dynamics, Durham, NC, EUA) por comparação com o padrão de proteína GRGl.
Exemplo 8. Determinação de atividade EPSPS das variantes GRG-I
Extratos contendo proteínas variantes GRGl foram testadas para atividade da EPSP sintase usando ensaios como previamente descritos (Pedido de Patente Norte-Americano No. 60/741.166, aqui incorporado por referência na sua íntegra). Ensaios são tipicamente conduzidos em um volume final de 50 μΐ contendo chiquimato-3-fosfato 0,5 mM; fosfoenolpiruvato (PEP) 0-500 μΜ; xantina oxidase 1 U/ml; fosforilase nucleosídica 2U/ml; inosina 2,25 mM; peroxidase de raíz-forte 1 U/ml; glifosato 0-2 mM; Hepes/KOH 50 mM pH 7,0; KCl 100 mM; e AMPLEX® Red (Invitrogen) de acordo com as instruções do fabricante. Extratos foram tipicamente incubados com todos os componentes do ensaio exceto chiquimato-3-fosfoto e AMPLEX® Red por 5 minutos a temperatura ambiente, e ensaios foram iniciados pela adição de chiquimato-3-fosfoto e AMPLEX® Red. Atividade de EPSP sintase foi medida usando um espectrômetro fluorescente Spectrax Gemini XPS (Molecular Dynamics, excitação: 555 nm; emissão: 590 nm).
Para determinação inicial de parâmetros cinéticos, ensaios foram realizados em uma concentração única de PEP de 50 μΜ, e a atividade das enzimas foram acessadas em glifosato 0, ImM, e 2mM. Clones cujos extratos apresentaram pequena ou nenhuma diferença na atividade em 2mM X ImM de glifosato foram selecionadas para análise completa de cinética.
Seguindo determinação completa de parâmetros cinéticos, as constantes de cinética foram determinadas como seguinte, ajustando para a quantidade de proteína determinada tanto por análise de dot-blot com anticorpo como descrita aqui, ou por Ensaio de Bradford, como conhecido na arte. Para qualquer concentração de glifosato, atividade da EPSP sintase foi medida como uma função de amplo espectro de concentrações de PEP. Os dados adequados a equação de Michaelis-Menten usando o programa de computador KALEIDAGRAPH® (Synergy Software) e usado para determinar a Km (Km aparente) da EPSP sintase naquela concentração de glifosato. Valores de Km aparente são determinados a não menos que 3 concentrações de glifosato, e a Ki da EPSPS para glifosato foi calculada a partir do gráfico de Km aparente X concentração de glifosato, usando a equação (ml*x/ (m2+x) ;ml = 1; m2 = 1) como conhecido na arte.
Exemplo 9. Determinação de resíduos variantes da biblioteca
Para a Biblioteca 1, 23 clones foram identificados pelo crescimento em placa contendo 50mM de glifosato. DNA foi isolado a partir desses vinte e três clones, e seqüência de DNA das regiões da volta em forma de Q dos clones foi determinada. Análise cinética foi realizada usando extratos brutos de todos os 23 clones (Figura 4 e SEQ ID NO: 5-43) . Um dos clones identificados a partir da Biblioteca 1, clone Ll-C foi determinado para conter o maior nível de resistência ao glifosato, e análise cinética completa foi realizada. Esse clone é aqui designado syngrgl(evo2) e a proteína codificada é designada GRGl(EVOl) (SEQ ID NO: 5) .
Comparações das seqüências de DNA resultantes contra as seqüências de DNA de clones aleatoriamente amostrados revelam que, dos quatro resíduos centrais alterados na Biblioteca 1, dois dos quatro são intolerantes da variação. Por exemplo, para a posição 5 da região central, somente clones codificando ácido glutâmico estavam representados na Biblioteca 1 sob as condições usadas nesse ensaio (ex. , crescimento em glifosato 50mM). Isso sugere que substituição de outros aminoácidos por ácido glutâmico nessa posição não resultou em ura clone resistente ao glifosato detectável. A partir dessa análise é determinado que, para a posição 5, ácido glutâmico é o resíduo preferido e, para a posição 7, glicina é o aminoácido preferido para potencialização da resistência ao glifosato sob condições do ensaio revelado. É possível que clones resistentes adicionais representando diversidade adicional nessa região possa ser identificados a partir de uma seleção em concentrações mais baixas de glifosato (ex., 20 mM, 15 mM, 10 mM, ou menos) ou após períodos de incubação mais longos (ex., maiores que 16 horas). De fato, Exemplo 12, infra, demonstra que, conforme a concentração de glifosato aumenta, o número de clones resistentes diminui.
Tabela 1. Mutagênese da Biblioteca 1
<table>table see original document page 61</column></row><table> Exemplo 10. Determinação dos resíduos variantes da Bilioteca 2
Biblioteca 2 possui uma diversidade teórica de mais de 2.000.000 clones, e aproximadamente 180.000 clones foram testados em relação à resistência a glifosato. Nove clones foram identificados com base no crescimento em placas de glifosato 50mM. DNA foi isolado a partir desses nove clones, e a seqüência de DNA das regiões da volta em forma de Q dos clones foi determinada. Comparação das seqüências de DNA resultantes contra as seqüências de DNA dos clones aleatoriamente amostrados mostrou que os 13 resíduos centrais alterados na Biblioteca 2 foram intolerantes da variação (veja Tabela 3). Por exemplo, posição 8 da região central foi representada pelos aminoácidos leucina, isoleucina, serina, arginina, metionina, e prolina na Biblioteca 2. Porém, cada clone resistente ao glifosato (crescendo em glifosato 50mM) isolado continha uma Leucina nessa Posição 8. Logo, esse método é útil para "mapear" os aminoácidos mutáveis na região central.
Dos clones identificados a partir da Biblioteca 2, clone 2-5 foi caracterizado baseado na análise de cinética como possuindo resistência mais elevada ao glifosato sob as condições desse ensaio, e é aqui designado syngrgl(evol) e a proteína codificada é designada GRG1(EVO1) (SEQ ID NO:28).
Tabela 3. Mutagênese da Biblioteca 2 <table>table see original document page 63</column></row><table>
Exemplo 11. Geração e isolamento de evo3 e evo4
Uma terceira biblioteca foi gerada usando os métodos acima, capitalizando na informação obtidas através das Bibliotecas 1 e 2 de modo que somente resíduos conhecidos como sendo mutáveis foram utilizados. A Biblioteca 3 foi gerada usando populações de oligos que codificam cada possibilidade de aminoácido nas posições 2, 10, 14, e 16 (veja Figura 3). Biblioteca 3 foi gerada como descrita acima para Biblioteca 1, transformada em E. coli, e testada em relação a clones conferindo resistência ao glifosato de uma maneira similar aos da Biblioteca 1 e 2. Aproximadamente 150.000 bibliotecas sofreram uma varredura em relação ao crescimento em placas M63+ com glifosato 50 mM, canamicina e IPTG como acima. Duzentos e noventa e dois clones foram identificados como capazes de crescer em glifosato 50 mM. Esse duzentos de noventa e dois clones foram então replaqueados em placa similares contendo tanto 100 mM quanto 200 mM de glifosato. Sete clones foram identificados como capazes de crescer em glifosato 200 mM, e todos os sete foram diretamente analisados em relação a suas propriedades cinéticas. A seqüência de DNA da região de volta em forma de Q desses clones foi então determinada. Dosi clones, syngrgl(evo3) (SEQ ID NO: 37; também referido aqui como evo3) , e syngrgl (evo4) (SEQ ID NO: 43; também referido aqui como evo4), foram identificados com apresentando a maior potencialização dos parâmetros cinéticos.
Tabela 4. Amostragem de variantes da volta em forma de Q na Biblioteca 3
<table>table see original document page 64</column></row><table> Exemplo 12. EVOl, EVO2, EVO3, e EV04 possuem propriedades cinéticas melhoradas
Análise cinética de EVOl, EVO2, EVO3, e EV04 demonstra que todos as quatro proteínas exibem resistência ao glifosato potencializada relativa a GRGl (Tabela 5). Todas as quatro proteínas exibiram um Ki melhorado para o glifosato e retém um Km razoável para PEP abaixo de 200 mM. EV03 exibe resistência ao glifosato muito alta, e uma Km para PEP que é virtualmente idêntica a GRGl. EV04 possui uma resistência ao glifosato muito alta, e uma razoável, apesar de um pouco elevada, Km para PEP.
Tabela 5. Cinética de EV01-EV04 X GRGl
<table>table see original document page 65</column></row><table>
Exemplo 13. Combinações Adicionais de Variantes da volta em forma de Q; Biblioteca 4
Dada a identificação dos resíduos funcionais no centro da volta em forma de Q, e dada a indentificação de clones com função melhorada, alguém pode gerar uma biblioteca adicional que combine os resíduos alterados identificados nos clones melhorados. Um método de obter essa bilioteca é gerar uma biblioteca combinatória usando oligonucleotídeos, de maneira similar a Biblioteca 1. Alternativamente, alguém pode gerar uma biblioteca permutacional com na Biblioteca 2. As seqüências de aminoácidos de EVOl, EVO2, EV03 e EV04 foram alinhadas, o consenso de tradução foi derivado (SEQ ID NO: 50), e oligonucleotídeos desenhados para gerar uma biblioteca permutacional. Essa biblioteca possui uma diversidade teórica de aproximadamente 1500 clones. Os oligonucleotídeos foram anelados como descritos aqui, e ligados ao pRSFlh-syngrgl-SB que foi digerido com Spe I e BstB I, e tratado com fosfatase alcalina de vitelo. A biblioteca resultante foi plaqueada em placas M63+ (como descritas acima) contendo glifosato 50 mM. Quatorze clones foram identificados como capazes de crescer em glifosato 50 mM.
Proteína expressa a partir desses quatorze clones foi testada para (1) resistência ao glifosato potencializada e (2) afinidade com a PEP não perturbada. Seis desses quatorze clones [grgl(4S-10) (SEQ ID NO: 66); grgl(4S-16) (SEQ ID NO: 69); grgl(4S-28) (SEQ ID NO: 70); grgl(4S-3) (SEQ ID NO: 71); grgl(4S-39) (SEQ ID NO: 72); e grgl(4S-60) (SEQ ID NO: 73)] codificando proteínas GRGl(4S-10) (SEQ ID NO: 56); GRGl(4S-16) (SEQ ID NO: 59); GRGl(4S-28) (SEQ ID NO: 60); GRGl (4S-3) (SEQ ID NO:61); GRGl(4S-39) (SEQ ID NO:62); e GRGl(4S-60) (SEQ ID NO:63), respectivamente, demonstrando resistência potencializada ao glifosato e boa afinidade com PEP. grgl(4s-10) foi renomeado grgl(evo5) (SEQ ID NO: 66), e a proteína que esse codifica foi designada como GRGl(EV05) (SEQ ID NO:56). Análise cinética da proteína GRGl(EV05) (Tabela 6) determinou que GRGl(EV05) possui uma razão Ki/Km de 1769. Tabela 6. Cinética de variantes selecionadas
<table>table see original document page 67</column></row><table>
As mudanças de aminoácidos identificadas nessas seis variantes provêm delineação adicional dos resíduos chaves na volta em forma de Q contribuindo para a resistência ao glifosato.
Tabela 7. Amostragem de variantes da volta em forma de Q na Biblioteca 5
<table>table see original document page 67</column></row><table> Exemplo 14. Mutagênese aleatória para aumentar a solubilidade de GRG1(EV05); Bilioteca 5
DNA de grgl (evo5) foi mutagenizado por PCR como conhecido na arte, e clonado em pRSFlb (Invitrogen), e uma bilioteca de clones mutagenizados identificados crescimento vigoroso em glifosato 50mM. Esses clones foram então analisados através de dot blot quantitativo como descrito aqui, e dois clones com modificações relativas a grgl(evo5) [(grgl(5.2.A10) (SEQ ID NO:67) e grgl(5.2.B6) (SEQ ID NO:68)], codificando GRGl(5.2.A10) (SEQ ID NO:57) e GRGl(5.2.B6) (SEQ ID NO:58), respectivamente, foram selecionados por apresentar qualidade desejada de um aumento substancial na solubilidade da proteína. GRG1(5.2.A10) (SEQ ID NO:57) e GRG1(5.2.B6) (SEQ ID NO:58) apresentada uma única mudança de aminoácido, cada, relativo a GRGl(EV05). Essas mudanças são apresentadas na Tabela 8. A região codificante da EPSPS da 5.2.A10 foi renomeada como grgl(evo6) (SEQ ID NO:67), e sua proteína codificada como GRG1(EVO6) (SEQ ID NO:57).
Tabela 8. Resumo das mutações em Variantes 5.2.A10 (GRG1(EV06)) e 5.2.B6
<table>table see original document page 68</column></row><table>
Exemplo 15. grgl(evo7) e grg1 (evo8) grgl(evo7) (SEQ ID NO:74), codificando a proteína GRGl(EV07) (SEQ ID NO:64), e grgl(evo8) (SEQ ID NO:75), codificando a proteína GRGl (EV08) (SEQ ID N0-.65), foram isoladas como clones resistentes ao glifosato após mutagênese de grgl(evo6) na região da volta em forma de Q. Análise cinética de GRGl(EV07) e GRGl(EV08) mostra que ambos os clones possuem propriedades cinéticas adicionalmete potencializadas em relação a GRGl(EV06).
Tabela 9. Cinética de variantes selecionadas
<table>table see original document page 69</column></row><table>
Exemplo 16. Resumo da Mutagênese da Região Central da volta em forma de Q
Dada a mutagênese extensiva da região central da volta em forma de Q, o isolamento de variantes que continuam a exibir resistência ao glifosato, e o isolamento de variantes potencializadas, alguém pode inferir os aminoácidos chave responsáveis por conferir resistência potencializada ao glifosato em um esqueleto GRGl. Os dados estão resumidos na Tabela 10.
Tabela 10. Resumo de mutagênese de GRGl <table>table see original document page 70</column></row><table> desejados nessa região. Logo, as variações do domínio central da volta em forma de Q (posições 2-16, correspondendo às posições 85-99 da SEQ ID NO: 2) que conferem resistência ao glifosato podem ser resumidas pela expressão X-C-X-E-S-G-L-S-X-R-X-F-X-P-X (SEQ ID NO:44), (onde X é qualquer aminoácido).
Em uma incorporação, o domínio é representado por X1-C-X2-E-S-G-L-S-X3-R-X4-F-X5-P-X6 (SEQ ID NO: 45), e onde X1 denota D, Κ, E, S, G, P, ou R, ou N, e X2 denota G, Q, V, D, Ε, I, Ν, Μ, A, T, S, OU R, e X3 denota I, G, S, M, F, OU V, X4 denota M, A, S, G, Q, L, V, ou I, X5 denota Τ, P, L, G, A, V, ou I e X6 denota I, L, C, A, F, ouM.
Em outra incorporação, o domínio é representado por D-C-X1-X2-S-G (SEQ ID NO:76), onde X1 denota glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina, ou treonina e X2 denota qualquer aminoácido.
Exemplo 18. Clonagem de syngrg1, evo1, evo2, evo3, evo4, evo5, evo6, evol, e evo8 em um cassete de expressão em plantas
Para cada um dos genes syngrg1, evo1, evo2, evo3, evo4, evo5, evo6, evol, e evo8, a fase aberta de leitura (ORF) é amplificada por PCR a partir de um molde de DNA completo. Sítios de restrição Hind III são adicionados em cada uma das extremidades das ORFs durante o PCR. Adicionalmente, a seqüência nucleotídica ACC é adicionada imediatamente a 5' do códon de iniciação do gene para aumentar a eficiência de tradução (Kozak (1987) Nucleic Acids Research 15:8125-8148; Joshi (1987) Nucleic Acids Research 15:6643-6653). 0 produto de PCR é clonado e seqüenciado usando técnicas bem conhecidas na arte para assegurar que nenhuma mutação seja introduzida durante o PCR.
O plasmídeo contendo o produto de PCR é digerido com Hind III e o fragmento contendo a ORF intacta é isolado. Esse fragmento é clonado no sítio Hind III de um plasmídeo tal como pAX2 00, um vetor de expressão em planta contendo o promotor de actina de arroz (McElroy et al. (1991) Molec. Gen. Genet. 231:150-160) e um terminador PinII (An et al. (1989) The Plant Cell 1:115-122). 0 fragmento promotor - gene - terminador desse plamídeo intermediário é então subclonado no plasmídeo pSBll (Japan Tobacco, Inc.) para formar um plamídeo final baseado no pSBll. Em alguns casos, pode ser preferível gerar uma construção alternativa no qual uma seqüência líder de cloroplasto é codificada com uma fusão da ponta N-terminal das construções syngrgl, evol, evo2, evo3, evo4, evo5, evo6, evo7, e evo8. Esses plasmídeos baseados em pBSll são tipicamente organizados de modo que o fragmento de DNA contendo a construção promotor - gene - terminador, ou a construção promotor - líder de cloroplasto - gene - terminador podem ser excisadas por digestão dupla com enzimas de restrição, tais como Kpn I e Pme I, e usadas para transformação em plantas por injeção de "aerosol beam". A estrutura dos clones baseados em pSBll resultantes é verificado por digestão com enzimas de restrição e eletroforese em gel, e por sequenciamento ao longo de várias junções de clonagem. O plasmídeo é mobilizado para dentro da Agrobacterium tumafaciens da cepa LBA4404 que também carrega o plasmídeo pSBl (Japan Tobacco, Inc.), usando procedimentos de conjugação triparental bem conhecidos na arte, e plaqueado em meio contendo espectiomicina. 0 clone de plamídeo baseado em pSBll carrega resistência a espectiomicina porém é um plasmídeo de espectro de hospedeiros limitado e não pode ser replicado em Agrobacterium. Colônias resistentes a espectiomicina aparecem quando plamídeos baseados em pSBll integra em um plasmídeo pSBl de amplo espectro de hospedeiros através de recombinação homóloga. 0 produto de cointegração do plamídeo pSBl e o baseado em pSBll é verificado por hibridização de Southern. A cepa de Agrobacterium carregando o cointegrado é usada para transformar milho por métodos conhecidos na arte, tal como, por exemplo, o método PureIntro (Japan Tobacco).
Exemplo 19. Transformação de Células de Milho por "Aerosol Beam"
Espigas são melhores coletadas entre 8-12 dias após a polinização. Embriões são isolados a partir das espigas, e estes embriões de 0,8-1,5 mm de tamanho são preferencialmente usados na transformação. Embriões são plaqueados com o lado do escutelo para cima em meio de incubação apropriado, tal como o meio DN62A5S (Sais N6 3,98 g/L; Vitaminas N6 Iml/L (de um estoque 1000X); L-Asparagina 800mg/L; Mio-inositol 100 mg/L; L-Prolina 1,4 g/L; Casoaminoácidos 100 mg/L; sucrose 50 g/L; 2,4-D 1 ml/L (de um estoque de lmg/ml) . Porém, meio e sais além de DN62A5S são apropriados e conhecidos na arte. Embriões são incubados durante a noite a 25°C no escuro. Porém, não é necessário per se incubar os embriões durante a noite.
Os explantes resultantes são transferidos para quadrados de trama (30-40 por placa), transferidos para meio osmótico por volta de 30-45 minutos, depois transferidos para uma placa de aceleração (veja, por exemplo, PCT Publicação No. W0/0138514 e Patente Norte- Americano No. 5.240.842).
As construções de DNA desenhadas para expressar as proteínas GRG da presente invenção em células vegetais são aceleradas em direção ao tecido vegetal usando um acelerador de "aerosol beam", usando condições essencialmentes como descritos na Publicação PCT No. WO/0138514. Após a aceleração, embriões são incubados por volta de 30 min em meio osmótico, e colocados em meio de incubação durante a noite a 25°C no escuro. Para evitar explantes excessivamentes danificados pelo processo, eles são incubados por pelo menos 24 horas antes da transferência para o meio de recuperação.
Embriões são então espalhados no meio de período de recuperação, por volta de 5 dias, 25°C no escuro, depois transferido para um meio de seleção. Explantes são incubados em meio de seleção por até oito semanas, dependendo da natureza e characterística particular da seleção utilizada. Após o período de seleção, o calo resultante é transferido para o meio de maturação de embrião, até que a formação de embriões somáticos maduros seja observada. Os embriões somáticos maduros resultantes são então colocados sob luz baixa, e o processo de regeneração é iniciado através de métodos conhecidos na arte. Os brotos resultantes são permitidos a enraizar em meio de enraizamento, e as plantas resultantes são transferidas para potes de crescimento e propagadas como plantas transgênicas.
Materiais
Meio DN62A5S
<table>table see original document page 75</column></row><table>
Ajuste o pH da solução para pH 5,8 com KOH 1N/KCl 1N, adição de Gelrite (Sigma) a 3 g/L, e autoclave. Após resfriar para 50°C, adição 2 mL/L de uma solução estoque a 5mg/mL de Nitrato de Prata (Phytotechnology Labs). A rceita rende por volta de 20 placas.
Exemplo 20. Transformação das enzimas EPSP sintase em
Células Vegetais de Milho através de Transformação Mediada por Agrobacterium
Espigas são mais bem coletadas entre 8-12 dias após a polinização. Embriões são isolados a partir das espigas, e estes embriões de 0,8-1,5 mm de tamanho são preferencialmente usados na transformação. Embriões são plaqueados com o lado do escutelo para cima em meio de incubação apropriado, e incubados durante a noite a 25°C no escuro.
Porém, não é necessário per se incubar os embriões durante a noite. Embriões são postos em contato com uma cepa de Agrobacterium contendo os vetores apropriados com uma enzima EPSP sintase com um domínio de volta de forma de Q da presente invenção para transferência mediada por plasmídeo Ti por volta de 5-10 min., e então plaqueadas em meio de co-cultivo por aproximadamente 3 dias (25°C no escuro). Após o co-cultivo, explantes são transferidos para o meio de período de recuperação por volta cinco dias (a 25°C no escuro). Explantes são incubados no meio de seleção for até oito semanas, dependendo da natureza e características da seleção particularmente utilizada. Após o período de seleção, o calo resultante é transferido para o meio de maturação de embrião, até que a formação de embriões somáticos maduros seja observada. Os embriões somáticos maduros resultantes são então colocados sob luz baixa, e o processo de regeneração é iniciado como conhecido na arte. Os brotos resultantes são permitidos a enraizar em meio de enraizamento, e as plantas resultantes são transferidas para potes de crescimento e propagadas como plantas transgênicas.
Exemplo 21. Plantas Transgênicas expressando grgl(evo5) e grg1 (evo6)
o gene grg1(evo5) e os genes grgl(evoô) foram cada um clonados em um vetor de expressão em plantas apropriado para transformação mediada por Agrobactéria, tal vetor contendo pelo menos (1) um promotor capaz de expressão em uma célula vegetal, (2) uma seqüência codificante líder de peptídeo cloroplástico, (3) um terminador transcricional. Os clones resultantes, pAX4014 e pAX4032 respectivamente, foram transformados para AgrobacCerium como conhecidos na arte e descrito aqui, e a cepa de Agrobactéria resultante foi utilizada para desenvolver calos transgênicos de milho e enfim em plantas transgênicas de milho.
Análises de Western blot de plantas transgênicas apresentaram expressão de GRGl(EV05) no tecido vegetal transgênico grgl(evo5), e expressão de GRGl(EV06) no tecido vegetal transgênico grgl(evo6). Plantas transgênicas T0 foram borrifadas com formulações de glifosato contendo 14mM de glifosato após adaptação ao solo, e a resistência ao herbicida foi pontuada após duas semanas relativa aos controles não-transgênicos.
Tabela 11. Plantas Resistentes ao Glifosato <table>table see original document page 78</column></row><table>
Todas as publicações e pedidos de patente mencionados na especificação são indicativos do nível de habilidade daqueles hábeis na arte no qual essa invenção se refere. Todas as publicações e pedidos de patente estão aqui incorporados por referência à mesma extensão como se cada publicação individual ou registro de patente fosse especificamente e individualmente indicado para ser incorporado por referência.
Apesar de precedente invenção ter sido descrita em alguns detalhes por meio de ilustrações e exemplo para propósito de clareza de entendimento, será óbvio que certas mudanças e modificações podem ser praticadas dentro do âmbito das reivindicações anexadas. LISTAGEM DE SEQÜÊNCIAS
<110> Depositante: Athenix Corporation
Volker Heinrichs
<120> Título da Invenção: EPSP Sintases Aprimoradas: Composições e
Métodos de Uso
<130> Referência do documento: 45600/329686
<150> Niimero do Documento de Prioridade: 60/813.061
<151> Data de Depósito do Documento de Prioridade: 13-06-2006
<150> Número do Dociimento de Prioridade: 60/878.259
<151> Data de Depósito do Documento de Prioridade: 03-01-2007
<160> Quantidade de SEQ ID NOs.: 76
<170> Software: FastSEQ for Windows Version 4.0
<210> SEQ ID NO: 1 <211> Comprimento: 1398 <212> Tipo: DNA
<213> Organismo: Enterobacteriaceae
<220> Características:
<221> Nome/Chave: CDS
<222> Localização: (103)...(1398)
<400> Seqüência: 1
aaaaaaggaa atgaactatg tgttgctgga aaaagtaggg aagggagtgg tgaagagtat 60 tccactggtt caattagaaa aaatcattca aggattacca aa gtg aaa gta aca 114
Met Lys Val Thr 1
ata cag ccc gga gat ctg act gga att ate cag tca ccc gct tca aaa 162
Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser Pro Ala Ser Lys
5 10 15 20
agt tcg atg cag cga gct tgt gct gct gca ctg gtt gca aaa gga ata 210
Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val Ala Lys Gly Ile
25 30 35
agt gag ate att aat ccc ggt cat age aat gat gat aaa gct gcc agg 258
Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp Lys Ala Ala Arg
40 45 50
gat att gta age cgg ctt ggt gcc agg ctt gaa gat cag cct gat ggt 306
Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp Gln Pro Asp Gly
55 60 65
tet ttg cag ata aca agt gaa ggc gta aaa cct gtc gct cct ttt att 354
Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile
70 75 80
gac tgc ggt gaa tet ggt tta agt ate cgg atg ttt act ccg att gtt 402
Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe Thr Pro Ile Val
85 90 95 100 gcg ttg agt aaa gaa gag gtg acg ate aaa gga tet gga age ctt gtt 450 Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser Gly Ser Leu Val 105 110 115
aca aga cca atg gat ttc ttt gat gaa att ctt ccg cat ctc ggt gta 498 Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro His Leu Gly Val 120 125 130
aaa gtt aaa tet aac cag ggt aaa ttg cct ctc gtt ata cag ggg cca 546 Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val Ile Gln Gly Pro 135 140 145
ttg aaa cca gea gac gtt acg gtt gat ggg tcc tta age tet cag ttc 594 Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu Ser Ser Gln Phe 150 155 160
ctt aca ggt ttg ttg ctt gea tat gcg gcc gea gat gea age gat gtt 642 Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp Ala Ser Asp Val 165 170 175 180
gcg ata aaa gta acg aat ctc aaa age cgt ccg tat ate gat ctt aca 690 Ala Ile Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr Ile Asp Leu Thr 185 190 195
ctg gat gtg atg aag cgg ttt ggt ttg aag act ccc gag aat cga aac 738 Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro Glu Asn Arg Asn 200 205 210
tat gaa gag ttt tat ttc aaa gcc ggg aat gta tat gat gaa acg aaa 786 Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr Asp Glu Thr Lys 215 220 225
atg caa cga tac acc gta gaa ggc gac tgg age ggt ggt gct ttt tta 834 Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly Gly Ala Phe Leu 230 235 240
ctg gta gcg ggg gct att gcc ggg ccg ate acg gta aga ggt ttg gat 882 Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val Arg Gly Leu Asp 245 250 255 260
ata gct tcg acg cag gct gat aaa gcg ate gtt cag gct ttg atg agt 930 Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln Ala Leu Met Ser 265 270 275
gcg aac gea ggt att gcg att gat gea aaa gag ate aaa ctt cat cct 978 Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile Lys Leu His Pro 280 285 290
gct gat ctc aat gea ttt gaa ttt gat gct act gat tgc ccg gat ctt 1026 Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp Cys Pro Asp Leu 295 300 305
ttt ccg cca ttg gtt gct ttg gcg tet tat tgc aaa gga gaa aca aag 1074 Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys Gly Glu Thr Lys 310 315 320
ate aaa ggc gta age agg ctg gcg cat aaa gaa agt gac aga gga ttg 1122 Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser Asp Arg Gly Leu 325 330 335 340 acg ctg cag gac gag ttc ggg aaa atg ggt gtt gaa ate cac ctt gag 1170 Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu Ile His Leu Glu 345 350 355
gga gat ctg atg cgc gtg ate gga ggg aaa ggc gta aaa gga gct gaa 1218 Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val Lys Gly Ala Glu 360 365 370
gtt agt tca agg cac gat cat cgc att gcg atg gct tgc gcg gtg gct 1266 Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala Cys Ala Val Ala 375 380 385
gct tta aaa gct gtg ggt gaa aca acc ate gaa cat gea gaa gcg gtg 1314 Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His Ala Glu Ala Val 390 395 400
aat aaa tcc tac ccg gat ttt tac age gat ctt aaa caa ctt ggc ggt 1362 Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys Gln Leu Gly Gly 405 410 415 420
gtt gta tet tta aac cat caa ttt aat ttc tca tga 1398
Val Val Ser Leu Asn His Gln Phe Asn Phe Ser * 425 430
<210> SEQ ID NO: 2 <211> Comprimento: 431 <212> Tipo: PRT
<213> Organismo: Enterobacteriaceae
<400> Seqüência: : 2 Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser 1 5 10 15 Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val 20 25 30 Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp 35 40 45 Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp 50 55 60 Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val 65 70 75 80 Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe 85 90 95 Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser 100 105 110 Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro 115 120 125 His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val 130 135 140 Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu 145 150 155 160 Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp 165 170 175 Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr 180 185 190 Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro 195 200 205 Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr 210 215 220 Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly 225 230 235 240 Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val
245 250 255
Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln
260 265 270
Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile
275 280 285
Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp
290 295 300
Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys 305 310 315 320
Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser
325 330 335
Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu
340 345 350
Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val
355 360 365
Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala
370 375 380
Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His 385 390 395 400
Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys
405 410 415
Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser 420 425 430
<210> SEQ ID NO: 3 <211> Comprimento: 1296 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: syngrgl
<221> Nome/Chave: CDS
<222> Localização: (1)...(1296)
<400> Seqüência: 3
atg aag gtg aca ate cag cct ggc gat ctc aca ggc ate att cag age 48 Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser 15 10 15
cca gcg tca aag tet tca atg cag aga gcg tgc gcg gcg gcc ctg gtg 96 Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val 20 25 30
gcg aag ggg ate tca gaa ate ate aac cct ggg cat age aac gat gat 144 Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp 35 40 45
aag gcc gcg aga gat ate gtg age cgt ctt ggg gcc aga ctt gaa gat 192 Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp 50 55 60
cag cca gat ggc age ctc cag ate act tca gaa. ggc gtt aag cca gtg 240 Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val 65 70 75 80
gcg cct ttc ate gat tgc ggg gaa tca ggg ctg tet ate cgc atg ttc 288 Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe 85 90 95 aca cca ate gtg gcg ctc tca aag gaa gaa gtg aca ate aag ggg tca 336 Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser 100 105 110
ggg tca ctc gtt act cgc cct atg gat ttc ttc gat gaa ate ctg cca 384 Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro 115 120 125
cat ctg ggc gtg aag gtg aag tca aat cag ggg aag ctc cct ctg gtt 432 His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val 130 135 140
ate cag ggg cca ctt aag cca gcg gat gtt aca gtt gat ggg tet ctc 480 Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu 145 150 155 160
tca tet cag ttc ctg aca ggc ctc ctg ctt gcc tac gcc gcg gcg gat 528 Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp 165 170 175
gcc age gat gtt gcc ate aag gtg act aac ctg aag tca cgt cct tac 576 Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr 180 185 190
ate gat ctt act ctt gat gtt atg aag cgt ttc ggc ctc aag act cct 624 Ile Asp LGU. Thr L6U Asp Vâl Met Lys Ar çj Ph θ Gly L€U Dys Thx Pro 195 200 205
gaa aac cgc aac tac gaa gag ttc tac ttc aag gcc ggg aac gtg tac 672 Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr 210 215 220
gac gaa aca aag atg cag cgt tac act gtt gaa ggg gat tgg tca ggg 720 Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly 225 230 235 240
ggc gcg ttc ctg ctc gtt gcg ggg gcc ate gcc ggg cca ate act gtt 768 Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val 245 250 255
cgt ggc ctt gat ate gcg tca act cag gcg gat aag gcg ate gtt cag 816 Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln 260 265 270
gcg ctc atg age gcc aac gcc ggg ate gcg ate gat gcc aag gaa ate 864 Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile 275 280 285
aag ctg cat cct gcc gat ctg aac gcc ttc gag ttc gat gcc act gat 912 Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp 290 295 300
tgc cct gat ctc ttc cca cca ctc gtg gcc ctc gcc tca tac tgc aag 960 Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys 305 310 315 320
ggg gaa aca aag ate aag ggc gtg age cgc ctt gcg cat aag gaa tet 1008 Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser 325 330 335 gat aga ggg ctg act ctt cag gat gag ttc ggg aag atg ggc gtt gaa 1056
Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu
340 345 350
ate cat ctt gaa ggg gat ctc atg cgt gtg ate ggc ggg aag ggg gtg 1104
Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val
355 360 365
aag ggc gcc gaa gtt age tca cgt cat gat cat cgc ate gcc atg gcg 1152
Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala
370 375 380
tgc gcc gtg gcg gcg ctc aag gcc gtt ggg gaa aca aea ate gaa cat 1200
Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His
385 390 395 400
gcc gaa gcg gtt aac aag tet tac cct gat ttc tac tca gat ttg aag 1248
Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys
405 410 415
cag ctc ggg ggc gtg gtg tet ctg aac cat cag ttc aac ttc tet tag 1296
Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser *
420 425 430
<210> SEQ ID NO: 4 <211> Comprimento: 1296 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: syngrgl-SB
<221> Nome/Chave: CDS
<222> Localização: (1)...(1296)
<400> Seqüência: 4
atg aag gtg aca ate cag cct ggc gat ctc aca ggc ate att cag age 48 Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser 1 5 10 15
cca gcg tca aag tet tca atg cag aga gcg tgc gcg gcg gcc ctg gtg 96 Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val 20 25 30
gcg aag ggg ate tca gaa ate ate aac cct ggg cat age aac gat gat 144 Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp 35 40 45
aag gcc gcg aga gat ate gtg age cgt ctt ggg gcc aga ctt gaa gat 192 Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp 50 55 60
cag cca gat ggc age ctc cag ate act agt gaa ggc gtt aag cca gtg 240 Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val 65 70 75 80
gcg cct ttc ate gat tgc ggg gaa tca ggg ctg tet ate cgc atg ttc 2 88 Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe 85 90 95 aca cca ate gtg gcg ctt tcg aag gaa gaa gtg aca ate aag ggg tca 336
Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser 100 105 110
ggg tca ctc gtt act cgc cct atg gat ttc ttc gat gaa ate ctg cca 384
Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro 115 120 125
cat ctg ggc gtg aag gtg aag tca aat cag ggg aag ctc cct ctg gtt 432
His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val 130 135 140
ate cag ggg cca ctt aag cca gcg gat gtt aca gtt gat ggg tet ctc 480 Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu 145 150 155 160
tca tet cag ttc ctg aca ggc ctc ctg ctt gcc tac gcc gcg gcg gat 528 Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp
165 170 175
gcc age gat gtt gcc ate aag gtg act aac ctg aag tca cgt cct tac 57 6 Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr 180 185 190
ate gat ctt act ctt gat gtt atg aag cgt ttc ggc ctc aag act cct 624
Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro 195 200 205
gaa aac cgc aac tac gaa gag ttc tac ttc aag gcc ggg aac gtg tac 672 Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr 210 215 220
gac gaa aca aag atg cag cgt tac act gtt gaa ggg gat tgg tca ggg 720 Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly 225 230 235 240
ggc gcg ttc ctg ctc gtt gcg ggg gcc ate gcc ggg cca ate act gtt 768
Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val
245 250 255
cgt ggc ctt gat ate gcg tca act cag gcg gat aag gcg ate gtt cag 816
Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln 260 265 270
gcg ctc atg age gcc aac gcc ggg ate gcg ate gat gcc aag gaa ate 864
Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile 275 280 285
aag ctg cat cct gcc gat ctg aac gcc ttc gag ttc gat gcc act gat 912 Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp 290 295 300
tgc cct gat ctc ttc cca cca ctc gtg gcc ctc gcc tca tac tgc aag 960 Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys 305 310 315 320
ggg gaa aca aag ate aag ggc gtg age cgc ctt gcg cat aag gaa tet 1008
Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser
325 330 335 gat aga ggg ctg act ctt cag gat gag ttc ggg aag atg ggc gtt gaa 1056
Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu 340 345 350
ate cat ctt gaa ggg gat ctc atg cgt gtg ate ggc ggg aag ggg gtg 1104
Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val
355 360 365
aag ggc gcc gaa gtt age tca cgt cat gat cat cgc ate gcc atg gcg 1152
Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala
370 375 380
tgc gcc gtg gcg gcg ctc aag gcc gtt ggg gaa aca aca ate gaa cat 1200
Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His
385 390 395 400
gcc gaa gcg gtt aac aag tet tac cct gat ttc tac tca gat ttg aag 1248
Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys
405 410 415
cag ctc ggg ggc gtg gtg tet ctg aac cat cag ttc aac ttc tet tag 1296
Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser * 420 425 430
<210> SEQ ID NO: 5 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone I-C (EV02) <400> Seqüência: 5
Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Ala Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 6 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-1 <400> Seqüência: 6
Pro Phe Ile Asp Cys Gln Glu Ser Gly Leu Ser Ile Arg Ala Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 7 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-10 <400> Seqüência: 7
Pro Phe Ile Asp Cys Val Glu Ser Gly Leu Ser Ile Arg Ser Phe Thr
1 5 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 8 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-11 <400> Seqüência: 8
Pro Phe Ile Asp Cys Val Glu Ser Gly Leu Ser Ile Arg Ser Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 9 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-12
<400> Seqüência: 9
Pro Phe Ile Asp Cys Asp Glu Ser
1 5
Pro Ile Val Ala Leu Ser Lys 20
Gly Leu Ser Ile Arg Ala Phe Thr 10 15
<210> SEQ ID NO: 10 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-14 <400> Seqüência: 10
Pro Phe Ile Asp Cys Glu Glu Ser Gly Leu Ser Ile Arg Ser Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 11 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características: <223> Outras Informações: Clone Ll-12-15 <400> Seqüência: 11
Pro Phe Ile Asp Cys Ile Glu Ser Gly Leu Ser Ile Arg Ala Phe Thr
1 5 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 12 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-2
<400> Seqüência: 12
Pro Phe Ile Asp Cys Gln Glu Ser Gly Leu Ser Ile Arg Gly Phe Thr
1 5 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 13 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-3
<400> Seqüência: 13
Pro Phe Ile Asp Cys Val Glu Ser
1 5
Pro Ile Val Ala Leu Ser Lys 20
Gly Leu Ser Ile Arg Ser Phe Thr 10 15
<210> SEQ ID NO: 14 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-4
<400> Seqüência: 14
Pro Phe Ile Asp Cys Val Glu Ser
1 5
Pro Ile Val Ala Leu Ser Lys 20
Gly Leu Ser Ile Arg Ala Phe Thr 10 15
<210> SEQ ID NO: 15 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-5 <400> Seqüência: 15
Pro Phe Ile Asp Cys Asp Glu Ser Gly Leu Ser Ile Arg Ala Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 16 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-6 <400> Seqüência: 16
Pro Phe Ile Asp Cys Asn Glu Ser Gly Leu Ser Ile Arg Ala Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 17 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-7 <400> Seqüência: 17
Pro Phe Ile Asp Cys Val Glu Ser Gly Leu Ser Ile Arg Ala Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 18 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-12-9 <400> Seqüência: 18
Pro Phe Ile Asp Cys Met Glu Ser Gly Leu Ser Ile Arg Ser Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 19 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone Ll-6-1 <400> Seqüência: 19
Pro Phe Ile Asp Cys Ala Glu Ser Gly Leu Ser Ile Arg Met Phe Thr
1 5 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 20 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-6-2 <400> Seqüência: 20
Pro Phe Ile Asp Cys Ala Glu Ser Gly Leu Ser Ile Arg Met Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 21 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone Ll-6-4
<400> Seqüência: 21
Pro Phe Ile Asp Cys Thr Glu Ser Gly Leu Ser Ile Arg Met Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 22 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone Ll-6-5
<400> Seqüência: 22
Pro Phe Ile Asp Cys Ala Glu Ser
1 5
Pro Ile Val Ala Leu Ser Lys 20
Gly Leu Ser Ile Arg Gln Phe Thr 10 15
<210> SEQ ID NO: 23 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone Ll-A
<400> Seqüência: 23 Pro Phe Ile Asp Cys Val Glu Ser Gly Leu Ser Ile Arg Gln Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys
<210> SEQ ID NO: 24 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artiicial
<220> Características:
<223> Outras Informações: Clone Ll-B
<400> Seqüência: 24
Pro Phe Ile Asp Cys Asn Glu Ser 1 5
Pro Ile Val Ala Leu Ser Lys 20
Gly Leu Ser Ile Arg Ala Phe Thr 10 15
<210> SEQ ID NO: 25 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone L1-E
<400> Seqüência: 25
Pro Phe Ile Asp Cys Ile Glu Ser Gly Leu Ser Ile Arg Ser Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 26 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone Ll-F
<400> Seqüência: 26
Pro Phe Ile Asp Cys Val Glu Ser 1 5
Pro Ile Val Ala Leu Ser Lys 20
Gly Leu Ser Ile Arg Gln Phe Thr 10 15
<210> SEQ ID NO: 27 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone L1-G
<400> Seqüência: 27 Pro Phe Ile Asp Cys Ser Glu Ser Gly Leu Ser Ile Arg Ala Phe Thr
1 5 10 15
Pro Ile Val Ala Leu Ser Lys
<210> SEQ ID NO: 28 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone 2-5 (EVOl) <400> Seqüência: 28
Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Met Arg Leu Phe Thr
1 5 10 15
Pro Phe Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 29 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone L2-2
<400> Seqüência: 29
Pro Phe Ile Asp Cys Asp Glu Ser Gly Leu Ser Ile Arg Met Phe Thr
1 5 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 30 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone L2-3
<400> Seqüência: 30
Pro Phe Ile Asp Cys Asp Glu Ser Gly Leu Ser Ile Arg Met Phe Thr
1 5 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 31 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone L2-4
<400> Seqüência: 31 Pro Phe Ile Lys Cys Arg Glu Ser Gly Leu Ser Met Arg Met Phe Ala
15 10 15
Pro Met Val Ala Leu Ser Lys
<210> SEQ ID NO: 32 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone L2-6
<400> Seqüência: 32
Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Phe Arg Met Phe Val
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 33 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone L2-7
<400> Seqüência: 33
Pro Phe Ile Glu Cys Gly Glu Ser Gly Leu Ser Ile Arg Leu Phe Thr
15 10 15
Pro Leu Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 34 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone L2-8
<400> Seqüência: 34
Pro Phe Ile Asp Cys Ser Glu Ser
1 5
Pro Leu Val Ala Leu Ser Lys 20
Gly Leu Ser Phe Arg Met Phe Ala 10 15
<210> SEQ ID NO: 35 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone L2-9
<400> Seqüência: 35 Pro Phe Ile Asn Cys Gly Glu Ser Gly Leu Ser Phe Arg Met Phe Ile
15 10 15
Pro Met Val Ala Leu Ser Lys
<210> SEQ ID NO: 36 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Clone L2-A
<400> Seqüência: 36
Pro Phe Ile Asn Cys Asp Glu Ser
1 5
Pro Ile Val Ala Leu Ser Lys 20
Gly Leu Ser Phe Arg Met Phe Thr 10 15
<210> SEQ ID NO: 37 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone L3_A-B6 (EV03) <400> Seqüência: 37
Pro Phe Ile Lys Cys Gly Glu Ser Gly Leu Ser Gly Arg Met Phe Pro
15 10 15
Pro Leu Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 38 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone L3_A-C9 <400> Seqüência: 38
Pro Phe Ile Ser Cys Gly Glu Ser Gly Leu Ser Ser Arg Met Phe Leu
15 10 15
Pro Cys Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 39 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone L3_A-D8
<400> Seqüência: 39 Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe Gly
15 10 15
Pro Leu Val Ala Leu Ser Lys
<210> SEQ ID NO: 40 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone L3_A-G8
<400> Seqüência: 40
Pro Phe Ile Gly Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe Thr
15 10 15
Pro Ile Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 41 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone L3_B-G6
<400> Seqüência: 41
Pro Phe Ile Pro Cys Gly Glu Ser Gly Leu Ser Ser Arg Met Phe Val
15 10 15
Pro Ala Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 42 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone L3_C-D8
<400> Seqüência: 42
Pro Phe Ile Arg Cys Gly Glu Ser
1 5
Pro Leu Val Ala Leu Ser Lys 20
Gly Leu Ser Ile Arg Met Phe Ala 10 15
<210> SEQ ID NO: 43 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Clone L3_D-B9 (EV04)
<400> Seqüência: 43 Pro Phe Ile Asn Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe Ala
1 5 10 15
Pro Ile Val Ala Leu Ser Lys
<210> SEQ ID NO: 44 <211> Comprimento: 15 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Domínio Consenso
<221> Nome/Chave: VARIANTE
<222> Localização: 1, 3, 9, 11, 13, 15
<223> Outras Informações: Xaa = Qualquer aminoácido
<400> Seqüência: 44
Xaa Cys Xaa Glu Ser Gly Leu Ser Xaa Arg Xaa Phe Xaa Pro Xaa 1 5 10 15
<210> SEQ ID NO: 45 <211> Comprimento: 15 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Domínio Consenso
<221> Nome/Chave: VARIANTE <222> Localização: 1
<223> Outras Informações: Asp, Lys, Glu, Asn, Ser, Gly, Pro ou Arg
<221> Nome/Chave: VARIANTE <222> Localização: 3
<223> Outras Informações: Asn, Ala, Ser, Gly, Gln, Vai, Asp, Glu, lie,
Met, Thr ou Arg
<221> Nome/Chave: VARIANTE <222> Localização: 9
<223> Outras Informações: He, Met, Phe, Gly, Ser ou Val
<221> Nome/Chave: VARIANTE <222> Localização: 11
<223> Outras Informações: Met, Ala, Ser, Gly, Gln, Leu ou Ile
<221> Nome/Chave: VARIANTE <222> Localização: 13
<223> Outras Informações: Thr, Ala, Vai, lie, Pro, Leu ou Gly
<221> Nome/Chave: VARIANTE <222> Localização: 15
<223> Outras Informações: lie, Leu, Cys, Ala, Phe ou Met <400> Seqüência: 45
Xaa Cys Xaa Glu Ser Gly Leu Ser Xaa Arg Xaa Phe Xaa Pro Xaa 1 5 10 15 <210> SEQ ID NO: 46 <211> Comprimento: 1500 <212> Tipo: DNA <213> Organismo: Desconhecido
<220> Características:
<223> Outras Informações: Isolado do solo
<400> Seqüência: 46 ctcctacagt tagggcaagt cccccaccac tcgggtccgc atgtcggcca ctccacgcca agttcgcaga aaaccgtgac cgttacaccg ccccccggct ccaaatccat taccaaccgt accagccgtt tgagcggtgc gctcaaaagc cggcagatgg gcgtcaccat cgacgagccg ggctcgctgc aattgccggc ccagccgttg tttctcacgg ctgccgtggc caccgtgcaa atgcaaaaac gcccgattgg cccgctgctg gacagcccca ccggttgccc accggtcacc cgtttcgaga ttgatggtgg tttgtccagc gcgtgcggcg aagcgccgat tgaagtggcg tacgtggacc tgaccctcga ctgcatgcgt gacaccacct ggcgcgtcgc ccccaccggc gatgcgtccg ccgccacgta tttgtgggcc atcggcgtag ccgcgcagga cttcacccag cagttcccga acatgcaagc cacggtggta ctggcggtgc tcgccgcgtt caacaacacc cgcgtcaagg aatgtgaccg cgtgcaggcg ggcctggcga ccatcgaggg cgatgacctg accgcctgca ccgcactgat cgacacccac ctggccgggc ttaaagtctc gggcattcgc taccctgact actggaaagc ctggcccagc aaacctgtag cagagcttgc tcgcgaaaaa cgcgttatcg ttgacgttta tcgagctaag
tcgacaagca tggcgtgttt gcctgatgat 60 cctcgccttg accaggagcc ttgtaccttg 120 cccaacttcc ccctcactgg caaggtcgcg 180 gcgctgttgc tggcggcatt ggccaagggc 240 gatgacacgc gccacatgtc ggtcgccctg 300 gacgacacca cctttgtggt caccagccaa 360 ttcctcggca acgctggcac cgccatgcgc 420 ggcaccgtgg tactggacgg cgacgagtac 480 gctaccctgg gccagaacgg catccaggtc 540 gtgcacggca tgggcaaggt ccaggccaag 600 cagtacgtat cggccctgct gatgctcgcg 660 ctgaccggca aggatatcgg tgcccgtggc 720 gccttcgggg cccaggtgga cgccgtggac 7 80 tataccgccc atgattacct gatcgaaccc 840 gcagaagtgc tgaccggtgg gcgtatcgac 900 cccgacgcca aggcccaggc cgtgattgcg 960 ggctcgcaaa tgcaggatgc gatcccgacc 1020 ccggtgcgtt tcactgaact ggcgaacctg 1080 ctgcacgatg gcctcaacga aattcgcccg 1140 ctggtcgcca gcgacccggc cctggcaggc 1200 gccgaccatc gcatcgccat gtgctttgcc 1260 attcaagacc cggactgcgt ggccaagacc 1320 ctgggcgttc acctaaacga ctgacacaca 13 80 cgcacacgtg ccgcgtttgt tcaggaaaca 1440 ctcgctccta cattttgcag cgagatcttg 1500
<210> SEQ ID NO: 47 <211> Comprimento: 499 <212> Tipo: PRT <213> Organismo: Desconhecido
<220> Características:
<223> Outras Informações: Isolado do solo <400> Seqüência: : 47 Leu Leu Gln Leu Gly Gln Val Pro His His Ser Thr Ser Met Ala Cys 1 5 10 15 Leu Pro Asp Asp Ser Gly Pro His Val Gly His Ser Thr Pro Pro Arg 20 25 30 Leu Asp Gln Glu Pro Cys Thr Leu Ser Ser Gln Lys Thr Val Thr Val 35 40 45 Thr Pro Pro Asn Phe Pro Leu Thr Gly Lys Val Ala Pro Pro Gly Ser 50 55 60 Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu Ala Lys Gly 65 70 75 80 Thr Ser Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr Arg His Met 85 90 95 Ser Val Ala Leu Arg Gln Met Gly Val Thr Ile Asp Glu Pro Asp Asp 100 105 110 Thr Thr Phe Val Val Thr Ser Gln Gly Ser Leu Gln Leu Pro Ala Gln
115 120 125 Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe Leu Thr Ala 130 135 140 Ala Val Ala Thr Val Gln Gly Thr Val Val Leu Asp Gly Asp Glu Tyr 145 150 155 160 Met Gln Lys Arg Pro Ile Gly Pro Leu Leu Ala Thr Leu Gly Gln Asn 165 170 175 Gly Ile Gln Val Asp Ser Pro Thr Gly Cys Pro Pro Val Thr Val His 180 185 190 Gly Met Gly Lys Val Gln Ala Lys Arg Phe Glu Ile Asp Gly Gly Leu 195 200 205 Ser Ser Gln Tyr Val Ser Ala Leu Leu Met Leu Ala Ala Cys Gly Glu 210 215 220 Ala Pro Ile Glu Val Ala Leu Thr Gly Lys Asp Ile Gly Ala Arg Gly 225 230 235 240 Tyr Val Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly Ala Gln Val 245 250 255 Asp Ala Val Asp Asp Thr Thr Trp Arg Val Ala Pro Thr Gly Tyr Thr 260 265 270 Ala His Asp Tyr Leu Ile Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu 275 280 285 Trp Ala Ala Glu Val Leu Thr Gly Gly Arg Ile Asp Ile Gly Val Ala 290 295 300 Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala Val Ile Ala 305 310 315 320 Gln Phe Pro Asn Met Gln Ala Thr Val Val Gly Ser Gln Met Gln Asp 325 330 335 Ala Ile Pro Thr Leu Ala Val Leu Ala Ala Phe Asn Asn Thr Pro Val 340 345 350 Arg Phe Thr Glu Leu Ala Asn Leu Arg Val Lys Glu Cys Asp Arg Val 355 360 365 Gln Ala Leu His Asp Gly Leu Asn Glu Ile Arg Pro Gly Leu Ala Thr 370 375 380 Ile Glu Gly Asp Asp Leu Leu Val Ala Ser Asp Pro Ala Leu Ala Gly 385 390 395 400 Thr Ala Cys Thr Ala Leu Ile Asp Thr His Ala Asp HiS Arg Ile Ala 405 410 415 Met Cys Phe Ala Leu Ala Gly Leu Lys Val Ser Gly Ile Arg Ile Gln 420 425 430 Asp Pro Asp Cys Val Ala Lys Thr Tyr Pro Asp Tyr Trp Lys Ala Trp 435 440 445 Pro Ser Leu Gly Val His Leu Asn Asp His Thr Lys Pro Val Ala Glu 450 455 460 Leu Ala Arg Glu Lys Arg Thr Arg Ala Ala Phe Val Gln Glu Thr Arg 465 470 475 480 Val Ile Val Asp Val Tyr Arg Ala Lys Leu Ala Pro Thr Phe Cys Ser 485 490 495 Glu Ile Leu
<210> SEQ ID NO: 48 <211> Comprimento: 17 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Tradução consenso - biblioteca 2
<221> Nome/Chave: VARIANTE <222> Localização: 2
<223> Outras Informações: Xaa = Asp, Lys, Glu ou Asn <221> Nome/Chave: VARIANTE <222> Localização: 3
<223> Outras Informações: Xaa = Cys, Leu, Phe ou Trp
<221> Nome/Chave: VARIANTE <222> Localização: 4
<223> Outras Informações: Xaa = Gly, Asn, Arg, Glu, Lys ou Ser
<221> Nome/Chave: VARIANTE <222> Localização: 5
<223> Outras Informações: Xaa = Glu ou Gly
<221> Nome/Chave: VARIANTE <222> Localização: 7
<223> Outras Informações: Xaa = Gly ou Asp
<221> Nome/Chave: VARIANTE <222> Localização: 8
<223> Outras Informações: Xaa = Leu, Ser, Arg, He, Thr, Met ou Pro
<221> Nome/Chave: VARIANTE <222> Localização: 9
<223> Outras Informações: Xaa = Ser ou Thr
<221> Nome/Chave: VARIANTE <222> Localização: 10
<223> Outras Informações: Xaa = lie, Leu, Phe ou Met
<221> Nome/Chave: VARIANTE <222> Localização: 12
<223> Outras Informações: Xaa = Met, Phe, Ile ou Leu
<221> Nome/Chave: VARIANTE <222> Localização: 13
<223> Outras Informações: Xaa = Phe ou Leu
<221> Nome/Chave: VARIANTE <222> Localização: 14
<223> Outras Informações: Xaa = Thr, Vai, Ile ou Ala
<221> Nome/Chave: VARIANTE <222> Localização: 16
<223> Outras Informações: Xaa = lie, Leu, Phe ou Met <400> Seqüência: 48
Ile Xaa Xaa Xaa Xaa Ser Xaa Xaa Xaa Xaa Arg Xaa Xaa Xaa Pro Xaa
15 10 15
Leu
<210> SEQ ID NO: 49 <211> Comprimento: 48 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Seqüência consenso - biblioteca 2
projeto de oligonucleotídeo <221> Nome/Chave: misc_feature <222> Localização: 4, 10, 11, 14, 40 <223> Outras Informações: r = A ou G
<221> Nome/Chave: misc_feature
<222> Localização: 6, 8
<223> Outras Informações: k = G ou T
<221> Nome/Chave: misc_feature
<222> Localização: 9, 12, 24, 30, 36, 39, 48
<223> Outras Informações: s = G ou C
<221> Nome/Chave: misc_feature
<222> Localização: 22, 42
<223> Outras Informações: m = A ou C
<221> Nome/Chave: misc_feature <222> Localização: 23
<223> Outras Informações: b = G, C ou T
<221> Nome/Chave: misc_feature <222> Localização: 25, 28, 34, 46 <223> Outras Informações: w = A ou T
<221> Nome/Chave: misc_feature
<222> Localização: 27, 41
<223> Outras Informações: y = T ou C
<400> Seqüência: 49
atcraktksr rsgratcagc gmbswcywts cgcwtsttsr ymccawts
<210> SEQ ID NO: 50 <211> Comprimento: 23 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Tradução consenso - biblioteca
<221> Nome/Chave: VARIANTE <222> Localização: 4
<223> Outras Informações: Xaa = Asp, Lys ou Asn
<221> Nome/Chave: VARIANTE <222> Localização: 12
<223> Outras Informações: Xaa = Met, Ile ou Gly
<221> Nome/Chave: VARIANTE <222> Localização: 14
<223> Outras Informações: Xaa = Leu, Ala ou Met
<221> Nome/Chave: VARIANTE <222> Localização: 16
<223> Outras Informações: Xaa = Thr, Pro ou Ala
<221> Nome/Chave: VARIANTE <222> Localização: 18
<223> Outras Informações: Xaa = Phe, Leu ou Ile <400> Seqüência: 50
Pro Phe Ile Xaa Cys Gly Glu Ser Gly Leu Ser Xaa Arg Xaa Phe Xaa
1 5 10 15
Pro Xaa Val Ala Leu Ser Lys 20
<210> SEQ ID NO: 51 <211> Comprimento: 103 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Seqüência consenso projeto de oligonucleotídeo
- biblioteca 4
<221> Nome/Chave: misc_feature
<222> Localização: 20, 33
<223> Outras Informações: r = A ou G
<221> Nome/Chave: misc_feature <222> Localização: 22
<223> Outras Informações: d = G, A ou T
<221> Nome/Chave: misc_feature
<222> Localização: 26, 28
<223> Outras Informações: b = G, C ou T
<221> Nome/Chave: misc_feature <222> Localização: 32, 40, 64 <223> Outras Informações: y = T ou C
<221> Nome/Chave: misc_feature <222> Localização: 34
<223> Outras Informações: h = A, T ou C
<221> Nome/Chave: misc_feature <222> Localização: 38
<223> Outras Informações: η = A, C, G ou T
<221> Nome/Chave: misc_feature
<222> Localização: 39, 62
<223> Outras Informações: m = A ou C
<400> Seqüência: 51
cttccttcga aagcgccacr adtggbgbga ayrhgcgnmy agacagccct gattccccgc 60 amtygatgaa aggcgccact ggcttaacgc cttcactagt gat 103
<210> SEQ ID NO: 52 <211> Comprimento: 44 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: primer
<400> Seqüência: 52
gatggcagcc tccagatcac tagtgaaggc gttaagccag tggc 44
<210> SEQ ID NO: 53 <211> Comprimento: 46 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: primer
<400> Seqüência: 53
gttcacacca atcgtggcgc tttcgaagga agaagtgaca atcaag
<210> SEQ ID NO: 54 <211> Comprimento: 414 <212> Tipo: PRT
<213> Organismo: Sulfolobus sulfataricus <400> Seqüência: 54
Met Ile Val Lys Ile Tyr Pro Ser Lys Ile Ser Gly Ile Ile Lys Ala
1 5 10 15
Pro Gln Ser Lys Ser Leu Ala Ile Arg Leu Ile Phe Leu Ser Leu Phe
20 25 30
Thr Arg Val Tyr Leu His Asn Leu Val Leu Ser Glu Asp Val Ile Asp
35 40 45
Ala Ile Lys Ser Val Arg Ala Leu Gly Val Lys Val Lys Asn Asn Ser
50 55 60
Glu Phe Ile Pro Pro Glu Lys Leu Glu Ile Lys Glu Arg Phe Ile Lys 65 70 75 80
Leu Lys Gly Ser Ala Thr Thr Leu Arg Met Leu Ile Pro Ile Leu Ala
85 90 95
Ala Ile Gly Gly Glu Val Thr Ile Asp Ala Asp Glu Ser Leu Arg Arg
100 105 110
Arg Pro Leu Asn Arg Ile Val Gln Ala Leu Ser Asn Tyr Gly Ile Ser
115 120 125
Phe Ser Ser Tyr Ser Leu Pro Leu Thr Ile Thr Gly Lys Leu Ser Ser
130 135 140
Asn Glu Ile Lys Ile Ser Gly Asp Glu Ser Ser Gln Tyr Ile Ser Gly 145 150 155 160
Leu Ile Tyr Ala Leu His Ile Leu Asn Gly Gly Ser Ile Glu Ile Leu
165 170 175
Pro Pro Ile Ser Ser Lys Ser Tyr Ile Leu Leu Thr Ile Asp Leu Phe
180 185 190
Lys Arg Phe Gly Ser Asp Val Lys Phe Tyr Gly Ser Lys Ile His Val
195 200 205
Asn Pro Asn Asn Leu Val Glu Phe Gln Gly Glu Val Ala Gly Asp Tyr
210 215 220
Gly Leu Ala Ser Phe Tyr Ala Leu Ser Ala Leu Val Ser Gly Gly Gly 225 230 235 240
Ile Thr Ile Thr Asn Leu Trp Glu Pro Lys Glu Tyr Phe Gly Asp His
245 250 255
Ser Ile Val Lys Ile Phe Ser Glu Met Gly Ala Ser Ser Glu Tyr Lys
260 265 270
Asp Gly Arg Trp Phe Val Lys Ala Lys Asp Lys Tyr Ser Pro Ile Lys
275 280 285
Ile Asp Ile Asp Asp Ala Pro Asp Leu Ala Met Thr Ile Ala Gly Leu
290 295 300
Ser Ala Ile Ala Glu Gly Thr Ser Glu Ile Ile Gly Ile Glu Arg Leu 305 310 315 320
Arg Ile Lys Glu Ser Asp Arg Ile Glu Ser Ile Arg Lys Ile Leu Gly
325 330 335
Leu Tyr Gly Val Gly Ser Glu Val Lys Tyr Asn Ser Ile Leu Ile Phe
340 345 350
Gly Ile Asn Lys Gly Met Leu Asn Ser Pro Val Thr Asp Cys Leu Asn 355 360 365 Asp His Arg Val Ala Met Met Ser
370 375
Gly Val Ile Thr Ser Ala Glu Cys 385 390
Trp Gln Asp Leu Leu Ser Leu Asn 405
Ser Ala Leu Ala Leu Val Asn Gly 380
Val Gly Lys Ser Asn Pro Asn Tyr 395 400
Ala Lys Ile Ser Ile Glu 410
<210> SEQ ID NO: 55 <211> Comprimento: 424 <212> Tipo: PRT
<213> Organismo: Fusobacterium nucleatum
<400> Seqüência: 55
Met Arg Asn Met Asn Lys Lys Ile Ile Lys Ala Asp Lys Leu Val Gly
15 10 15
Glu Val Thr Pro Pro Pro Ser Lys Ser Val Leu His Arg Tyr Ile Ile
20 25 30
Ala Ser Ser Leu Ala Lys Gly Ile Ser Lys Ile Glu Asn Ile Ser Tyr
35 40 45
Ser Asp Asp Ile Ile Ala Thr Ile Glu Ala Met Lys Lys Leu Gly Ala
50 55 60
Asn Ile Glu Lys Lys Asp Asn Tyr Leu Leu Ile Asp Gly Ser Lys Thr 65 70 75 80
Phe Asp Lys Glu Tyr Leu Asn Asn Asp Ser Glu Ile Asp Cys Asn Glu
85 90 95
Ser Gly Ser Thr Leu Arg Phe Leu Phe Pro Leu Ser Ile Val Lys Glu
100 105 110
Asn Lys Ile Leu Phe Lys Gly Lys Gly Lys Leu Phe Lys Arg Pro Leu
115 120 125
Ser Pro Tyr Phe Glu Asn Phe Asp Lys Tyr Gln Ile Lys Cys Ser Ser
130 135 140
Ile Asn Glu Asn Lys Ile Leu Leu Asp Gly Glu Leu Lys Ser Gly Val 145 150 155 160
Tyr Glu Ile Asp Gly Asn Ile Ser Ser Gln Phe Ile Thr Gly Leu Leu
165 170 175
Phe Ser Leu Pro Leu Leu Asn Gly Asn Ser Lys Ile Ile Ile Lys Gly
180 185 190
Lys Leu Glu Ser Ser Ser Tyr Ile Asp Ile Thr Leu Asp Cys Leu Asn
195 200 205
Lys Phe Gly Ile Asn Ile Ile Asn Asn Ser Tyr Lys Glu Phe Ile Ile
210 215 220
Glu Gly Asn Gln Thr Tyr Lys Ser Gly Asn Tyr Gln Val Glu Ala Asp 225 230 235 240
Tyr Ser Gln Val Ala Phe Phe Leu Val Ala Asn Ser Ile Gly Ser Asn
245 250 255
Ile Lys Ile Asn Gly Leu Asn Val Asn Ser Leu Gln Gly Asp Lys Lys
260 265 270
Ile Ile Asp Phe Ile Ser Glu Ile Asp Asn Trp Thr Lys Asn Glu Lys
275 280 285
Leu Ile Leu Asp Gly Ser Glu Thr Pro Asp Ile Ile Pro Ile Leu Ser
290 295 300
Leu Lys Ala Cys Ile Ser Lys Lys Glu Ile Glu Ile Val Asn Ile Ala 305 310 315 320
Arg Leu Arg Ile Lys Glu Ser Asp Arg Leu Ser Ala Thr Val Gln Glu
325 330 335
Leu Ser Lys Leu Gly Phe Asp Leu Ile Glu Lys Glu Asp Ser Ile Leu
340 345 350
Ile Asn Ser Arg Lys Asn Phe Asn Glu Ile Ser Asn Asn Ser Pro Ile 355 360 365 Ser Leu Ser Ser His Ser Asp His
370 375
Ala Ser Thr Cys Tyr Glu Gly Glu 385 390
Val Lys Lys Ser Tyr Pro Asn Phe 405
Gly Lys Ile Tyr Glu Tyr Leu Gly 420
Arg Ile Ala Met Thr Val Ala Ile 380
Ile Ile Leu Asp Asn Leu Asp Cys 395 400
Trp Glu Val Phe Leu Ser Leu Gly 410 415
<210> SEQ ID NO: 56 <211> Comprimento: 431 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: GRGl VARIANTE - GRGl(EV05)
<400> Seqüência: 56
Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser
1 5 10 15
Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val
20 25 30
Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp
35 40 45
Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp
50 55 60
Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val 65 70 75 80
Ala Pro Phe Ile Glu Cys Gly Glu Ser Gly Leu Ser Ser Arg Ile Phe
85 90 95
Thr Pro Leu Val Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser
100 105 110
Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro
115 120 125
His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val
130 135 140
Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu 145 150 155 160
Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp
165 170 175
Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr
180 185 190
Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro
195 200 205
Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr
210 215 220
Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly 225 230 235 240
Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val
245 250 255
Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln
260 265 270
Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile
275 280 285
Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp
290 295 300
Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys 305 310 315 320 Gly Glu Thr Lys Ile Lys Gly Val 325
Asp Arg Gly Leu Thr Leu Gln Asp 340
Ile His Leu Glu Gly Asp Leu Met 355 360
Lys Gly Ala Glu Val Ser Ser Arg
370 375
Cys Ala Val Ala Ala Leu Lys Ala 385 390
Ala Glu Ala Val Asn Lys Ser Tyr 405
Gln Leu Gly Gly Val Val Ser Leu 420
Ser Arg Leu Ala His Lys Glu Ser
330 335
Glu Phe Gly Lys Met Gly Val Glu 345 350
Arg Val Ile Gly Gly Lys Gly Val 365
His Asp His Arg Ile Ala Met Ala 380
Val Gly Glu Thr Thr Ile Glu His 395 400
Pro Asp Phe Tyr Ser Asp Leu Lys
410 415
Asn His Gln Phe Asn Phe Ser 425 430
<210> SEQ ID NO: 57 <211> Comprimento: 431 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: GRGl VARIANTE - GRGl(EV06)
<400> Seqüência: : 57 Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser 1 5 10 15 Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val 20 25 30 Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly HiS Ser Asn Asp Asp 35 40 45 Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp 50 55 60 Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val 65 70 75 80 Ala Pro Phe Ile Glu Cys Gly Glu Ser Gly Leu Ser Ser Arg Ile Phe 85 90 95 Thr Pro Leu Val Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser 100 105 110 Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro 115 120 125 His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val 130 135 140 Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu 145 150 155 160 Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp 165 170 175 Ala Ser Asp Val Ala Ile Lys Val Thr Lys Leu Lys Ser Arg Pro Tyr 180 185 190 Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro 195 200 205 Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr 210 215 220 Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly 225 230 235 240 Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val 245 250 255 Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln 260 265 270 Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile 275 280 285 Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp
290 295 300
Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys 305 310 315 320
Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser
325 330 335
Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu
340 345 350
Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val
355 360 365
Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala
370 375 380
Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His 385 390 395 400
Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys
405 410 415
Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser 420 425 430
<210> SEQ ID NO: 58 <211> Comprimento: 431 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: GRGl VARIANTE - GRGl(EV07)
<400> Seqüência: 58
Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser 15 10 15
Pro Ala Ser Lys 20 Ser Ser Met Gln Arg 25 Ala Cys Ala Ala Ala 30 Leu Val Ala Lys Gly 35 Ile Ser Glu Ile Ile 40 Asn Pro Gly His Ser 45 Asn Asp Asp Lys Ala 50 Ala Arg Asp Ile Val 55 Ser Arg Leu Gly Ala 60 Arg Leu Glu Asp Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val 65 70 75 80 Ala Pro Phe Ile Glu 85 Cys Gly Glu Ser Gly 90 Leu Ser Ser Arg Leu 95 Phe Thr Pro Leu Val 100 Ala Leu Ser Lys Glu 105 Glu Val Thr Ile Lys 110 Gly Ser Gly Ser Leu 115 Val Thr Arg Pro Met 120 Asp Phe Phe Asp Glu 125 Ile Leu Pro His Leu 130 Gly Val Lys Val Lys 135 Ser Asn Gln Gly Lys 140 Leu Pro Leu Val Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu 145 150 155 160 Ser Ser Gln Phe Leu 165 Thr Gly Leu Leu Leu 170 Ala Tyr Ala Ala Ala 175 Asp Ala Ser Asp Val 180 Ala Ile Lys Val Thr 185 Lys Leu Lys Ser Arg 190 Pro Tyr Ile Asp Leu 195 Thr Leu Asp Val Met 200 Lys Arg Phe Gly Leu 205 Lys Thr Pro Glu Asn 210 Arg Asn Tyr Glu Glu 215 Phe Tyr Phe Lys Ala 220 Gly Asn Val Tyr Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly 225 230 235 240 Gly Ala Phe Leu Leu 245 Val Ala Gly Ala Ile 250 Ala Gly Pro Ile Thr 255 Val Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln 260 265 270
Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile 275 280 285
Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp 290 295 300
Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys 305 310 315 320
Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser 325 330 335
Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu 340 345 350
Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val 355 360 365
Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala 370 375 380
Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His 385 390 395 400
Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys 405 410 415
Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser 420 425 430
<210> SEQ ID NO: 59 <211> Comprimento: 431 <212> Tipo: PRT <213> Organismo: Seqüência Artificial
<220> Características: <223> Outras Informações: GRG1 VARIANTE - GRG1(EV08)
<400> Seqüência: 59 Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser 1 5 10 15 Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val 20 25 30
Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp 35 40 45
Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp 50 55 60
Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val 65 70 75 80
Ala Pro Phe Ile Glu Cys Gly Glu Ser Gly Leu Ser Ser Arg Val Phe 85 90 95
Thr Pro Leu Val Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser 100 105 110
Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro 115 120 125
His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val 130 135 140
Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu 145 150 155 160
Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp 165 170 175
Ala Ser Asp Val Ala Ile Lys Val Thr Lys Leu Lys Ser Arg Pro Tyr 180 185 190
Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro 195 200 205
Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr 210 215 220 Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly 225 230 235 240
Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val
245 250 255
Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln
260 265 270
Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile
275 280 285
Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp
290 295 300
Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys 305 310 315 320
Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser
325 330 335
Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu
340 345 350
Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val
355 360 365
Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala
370 375 380
Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His 385 390 395 400
Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys
405 410 415
Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser 420 425 430
<210> SEQ ID NO: 60 <211> Comprimento: 431 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: GRGl VARIANTE - GRGl(5.2.B6)
<400> Seqüência: : 60 Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Ile Ile Gln Ser 1 5 10 15 Pro Ala Ser Lys 20 Ser Ser Met Gln Arg 25 Ala Cys Ala Ala Ala 30 Leu Val Ala Lys Gly 35 Ile Ser Glu Ile Ile 40 Asn Pro Gly His Ser 45 Asn Asp Asp Lys Ala 50 Ala Arg Asp Ile Val 55 Ser Arg Leu Gly Ala 60 Arg Leu Glu Asp Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val 65 70 75 80 Ala Pro Phe Ile Glu 85 Cys Gly Glu Ser Gly 90 Leu Ser Ser Arg Ile 95 Phe Thr Pro Leu Val 100 Ala Leu Ser Lys Glu 105 Glu Val Thr Ile Lys 110 Gly Ser Gly Ser Leu 115 Val Thr Arg Pro Met 120 Asp Phe Phe Asp Glu 125 Ile Leu Pro His Leu 130 Gly Val Lys Val Lys 135 Ser Asn Gln Gly Lys 140 Leu Pro Leu Val Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu 145 150 155 160 Ser Ser Gln Phe Leu 165 Thr Gly Leu Leu Leu 170 Ala Tyr Ala Ala Ala 175 Asp Ala Ser Asp Val 180 Ala Ile Lys Val Thr 185 Asn Leu Lys Ser Arg 190 Pro Tyr Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro
195 200 205
Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr
210 215 220
Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly 225 230 235 240
Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val
245 250 255
Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln
260 265 270
Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile
275 280 285
Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp
290 295 300
Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys 305 310 315 320
Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser
325 330 335
Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Ala Glu
340 345 350
Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val
355 360 365
Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala
370 375 380
Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His 385 390 395 400
Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys
405 410 415
Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser 420 425 430
<210> SEQ ID NO: 61 <211> Comprimento: 33 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: GRGl VARIANTE - GRGl(4S-16)
Cys Gly 15
Leu Ser
<400> Seqüencia: 61
Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Glu
1 5 10
Glu Ser Gly Leu Ser Gly Arg Met Phe Pro Pro Phe Val Ala 20 25 30
Lys
<210> SEQ ID NO: 62 <211> Comprimento: 33 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: GRGl VARIANTE - GRGl(4S-28)
<400> Seqüência: 62
Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Lys Cys Gly 1 5 10 15 Glu Ser Gly Leu Ser Gly Arg Ala Phe Thr Pro Ile Val Ala Leu Ser 20 25 30
Lys
<210> SEQ ID NO: 63 <211> Comprimento: 33 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: GRGl VARIANTE - GRGl(4S-3) <400> Seqüência: 63
Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Lys Cys Gly
1 5 10 15
Glu Ser Gly Leu Ser Gly Arg Leu Phe Thr Pro Phe Val Ala Leu Ser 20 25 30
Lys
<210> SEQ ID NO: 64 <211> Comprimento: 33 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: GRGl VARIANTE - GRGl(4S-39) <400> Seqüência: 64
Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Lys Cys Gly
1 5 10 15
Glu Ser Gly Leu Ser Val Arg Ala Phe Thr Pro Ile Val Ala Leu Ser 20 25 30
Lys
<210> SEQ ID NO: 65 <211> Comprimento: 33 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: GRGl VARIANTE - GRGl(4S-60) <400> Seqüência: 65
Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Lys Cys Gly
1 5 10 15
Glu Ser Gly Leu Ser Gly Arg Met Phe Pro Pro Ile Val Ala Leu Ser 20 25 30
Lys
<210> SEQ ID NO: 66 <211> Comprimento: 1296 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: grgl Vi
<400> Seqüência: 66 atgaaggtga caatccagcc tggcgatctc tcttcaatgc agagagcgtg cgcggcggcc aaccctgggc atagcaacga tgataaggcc agacttgaag atcagccaga tggcagcctc gcgcctttca tcgagtgcgg ggaatcaggg gcgctttcga aggaagaagt gacaatcaag gatttcttcg atgaaatcct gccacatctg ctccctctgg ttatccaggg gccacttaag tcatctcagt tcctgacagg cctcctgctt gccatcaagg tgactaacct gaagtcacgt aagcgtttcg gcctcaagac tcctgaaaac gggaacgtgt acgacgaaac aaagatgcag ggcgcgttcc tgctcgttgc gggggccatc atcgcgtcaa ctcaggcgga taaggcgatc atcgcgatcg atgccaagga aatcaagctg gatgccactg attgccctga tctcttccca ggggaaacaa agatcaaggg cgtgagccgc actcttcagg atgagttcgg gaagatgggc cgtgtgatcg gcgggaaggg ggtgaagggc atcgccatgg cgtgcgccgt ggcggcgctc gccgaagcgg ttaacaagtc ttaccctgat gtggtgtctc tgaaccatca gttcaacttc
- grgl(evo5)
acaggcatca ttcagagccc agcgtcaaag 60 ctggtggcga aggggatctc agaaatcatc 120 gcgagagata tcgtgagccg tcttggggcc 180 cagatcacta gtgaaggcgt taagccagtg 240 ctgtctagtc gcatattcac cccacttgtg 300 gggtcagggt cactcgttac tcgccctatg 360 ggcgtgaagg tgaagtcaaa tcaggggaag 420 ccagcggatg ttacagttga tgggtctctc 480 gcctacgccg cggcggatgc cagcgatgtt 540 ccttacatcg atcttactct tgatgttatg 600 cgcaactacg aagagttcta cttcaaggcc 660 cgttacactg ttgaagggga ttggtcaggg 720 gccgggccaa tcactgttcg tggccttgat 780 gttcaggcgc tcatgagcgc caacgccggg 840 catcctgccg atctgaacgc cttcgagttc 900 ccactcgtgg ccctcgcctc atactgcaag 960 cttgcgcata aggaatctga tagagggctg 1020 gttgaaatcc atcttgaagg ggatctcatg 1080 gccgaagtta gctcacgtca tgatcatcgc 1140 aaggccgttg gggaaacaac aatcgaacat 1200 ttctactcag atttgaagca gctcgggggc 1260 tcttag 1296
<210> SEQ ID NO: 67 <211> Comprimento: 1296 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: grgl VARIANTE - grgl(evo6) <400> Seqüência: 67
atgaaggtga caatccagcc tggcgatctc acaggcatca ttcagagccc agcgtcaaag 60
tcttcaatgc agagagcgtg cgcggcggcc ctggtggcga aggggatctc agaaatcatc 120
aaccctgggc atagcaacga tgataaggcc gcgagagata tcgtgagccg tcttggggcc 180
agacttgaag atcagccaga tggcagcctc cagatcacta gtgaaggcgt taagccagtg 240
gcgcctttca tcgagtgcgg ggaatcaggg ctgtctagtc gcatattcac cccacttgtg 3 00
gcgctttcga aggaagaagt gacaatcaag gggtcagggt cactcgttac tcgccctatg 360
gatttcttcg atgaaatcct gccacatctg ggcgtgaagg tgaagtcaaa tcaagggaag 420
ctccctctgg ttatccaggg gccacttaag ccagcggatg ttacagttga tgggtctctc 480
tcatctcagt tcctgacagg cctcctgctt gcctacgccg cggcggatgc cagcgatgtt 540
gccatcaagg tgactaaact gaagtcacgt ccttacatcg atcttactct tgatgttatg 600
aagcgtttcg gcctcaagac tcctgaaaac cgcaactacg aagagttcta cttcaaggcc 660
gggaacgtgt acgacgaaac aaagatgcag cgttacactg ttgaagggga ttggtcaggg 720
ggcgcgttcc tgctcgttgc gggggccatc gccgggccaa tcactgttcg tggccttgat 7 80
atcgcgtcaa ctcaggcgga taaggcgatc gttcaggcgc tcatgagcgc caacgccggg 840
atcgcgatcg atgccaagga aatcaagctg catcctgccg atctgaacgc cttcgagttc 900
gatgccactg attgccctga tctcttccca ccactcgtgg ccctcgcctc atactgcaag 960
ggggaaacaa agatcaaggg cgtgagccgc cttgcgcata aggaatctga tagagggctg 1020
actcttcagg atgagttcgg gaagatgggc gttgaaatcc atcttgaagg ggatctcatg 1080
cgtgtgatcg gcgggaaggg ggtgaagggc gccgaagtta gctcacgtca tgatcatcgc 1140
atcgccatgg cgtgcgccgt ggcggcgctc aaggccgttg gggaaacaac aatcgaacat 1200
gccgaagcgg ttaacaagtc ttaccctgat ttctactcag atttgaagca gctcgggggc 1260
gtggtgtctc tgaaccatca gttcaacttc tcttag 1296 <210> SEQ ID NO: 68 <211> Comprimento: 1296 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: grgl VARIANTE - grgl(5.2.b6) <400> Seqüência: 68
atgaaggtga caatccagcc tggcgatctc acaggcatca ttcagagccc agcgtcaaag 60
tcttcaatgc agagagcgtg cgcggcggcc ctggtggcga aggggatctc agaaatcatc 120
aaccctgggc atagcaacga tgataaggcc gcgagagata tcgtgagccg tcttggggcc 180
agacttgaag atcagccaga tggcagcctc cagatcacta gtgaaggcgt taagccagtg 240
gcgcctttca tcgagtgcgg ggaatcaggg ctgtctagtc gcatattcac cccacttgtg 300
gcgctttcga aggaagaagt gacaatcaag gggtcagggt cactcgttac tcgccctatg 360
gatttcttcg atgaaatcct gccacatctg ggcgtgaagg tgaagtcaaa tcaggggaag 420
ctccctctgg ttatccaggg gccacttaag ccagcggatg ttacagtcga tgggtctctc 480
tcatctcagt tcctgacagg cctcctgctt gcctacgccg cggcggatgc cagcgatgtt 540
gccatcaagg tgactaacct gaagtcacgt ccttacatcg atcttactct tgatgttatg 600
aagcgtttcg gcctcaagac tcctgaaaac cgcaactacg aagagttcta cttcaaggcc 660
gggaacgtgt acgacgaaac aaagatgcag cgttacactg ttgaagggga ttggtcaggg 720
ggcgcgttcc tgctcgttgc gggggccatc gccgggccaa tcactgttcg tggccttgat 7 80
atcgcgtcaa ctcaggcgga taaggcgatc gttcaggcgc tcatgagcgc caacgccggg 840
atcgcgatcg atgccaagga aatcaagctg catcctgccg atctgaacgc cttcgagttc 900 gatgccactg attgccctga tctcttccca ccactcgtgg ccctcgcctc atactgcaag 960
ggggaaacaa agatcaaggg cgtgagccgc cttgcgcata aggaatctga tagagggctg 1020
actcttcagg atgagttcgg gaagatgggc gctgaaatcc atcttgaagg ggatctcatg 1080 cgtgtgatcg gcgggaaggg ggtgaagggc gccgaagtta gctcacgtca tgatcatcgc 1140 atcgccatgg cgtgcgccgt ggcggcgctc aaggccgttg gggaaacaac aatcgaacat 1200 gccgaagcgg ttaacaagtc ttaccctgat ttctactcag atttgaagca gctcgggggc 1260 gtggtgtctc tgaaccatca gttcaacttc tcttag 1296
<210> SEQ ID NO: 69 <211> Comprimento: 99 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: grgl VARIANTE - grgl(4s-16) <400> Seqüência: 69
atcactagtg aaggcgttaa gccagtggcg cctttcatcg agtgcgggga atcagggctg 60 tctgggcgca tgttcccgcc attcgtggcg ctttcgaag 99
<210> SEQ ID NO: 70 <211> Comprimento: 99 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: grgl VARIANTE - grgl(4s-28) <400> Seqüência: 70
atcactagtg aaggcgttaa gccagtggcg cctttcatca agtgcgggga atcagggctg 60 tctggacgcg cgttcacacc aattgtggcg ctttcgaag 99
<210> SEQ ID NO: 71 <211> Comprimento: 99 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: grgl VARIANTE - grgl(4s-3) <400> Seqüência: 71
atcactagtg aaggcgttaa gccagtggcg cctttcatca agtgcgggga atcagggctg 60 tctggacgct tattcacacc attcgtggcg ctttcgaag 99
<210> SEQ ID NO: 72 <211> Comprimento: 99 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: grgl VARIANTE - grgl(4s-39) <400> Seqüência: 72
atcactagtg aaggcgttaa gccagtggcg cctttcatca agtgcgggga atcagggctg 60 tctgtgcgcg cattcacacc aatcgtggcg ctttcgaag 99
<210> SEQ ID NO: 73 <211> Comprimento: 99 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: grgl VARIANTE - grgl(4s-60) <400> Seqüência: 73
atcactagtg aaggcgttaa gccagtggcg cctttcatca agtgcgggga atcagggctg 60 tctggacgca tgttcccgcc aatcgtggcg ctttcgaag 99
<210> SEQ ID NO: 74 <211> Comprimento: 1296 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: grgl VARIANTE - grgl(evo7) <400> Seqüência: 74
atgaaggtga caatccagcc tggcgatctc acaggcatca ttcagagccc agcgtcaaag 60 tcttcaatgc agagagcgtg cgcggcggcc ctggtggcga aggggatctc agaaatcatc 120 aaccctgggc atagcaacga tgataaggcc gcgagagata tcgtgagccg tcttggggcc 180 agacttgaag atcagccaga tggcagcctc cagatcacta gtgaaggcgt taagccagtg 240 gcgcctttca tcgagtgcgg ggaatcaggg ctgtctagtc gcctgttcac cccacttgtg 300 gcgctttcga aggaagaagt gacaatcaag gggtcagggt cactcgttac tcgccctatg 360 gatttcttcg atgaaatcct gccacatctg ggcgtgaagg tgaagtcaaa tcaagggaag 420 ctccctctgg ttatccaggg gccacttaag ccagcggatg ttacagttga tgggtctctc 480 tcatctcagt tcctgacagg cctcctgctt gcctacgccg cggcggatgc cagcgatgtt 540 gccatcaagg tgactaaact gaagtcacgt ccttacatcg atcttactct tgatgttatg 600 aagcgtttcg gcctcaagac tcctgaaaac cgcaactacg aagagttcta cttcaaggcc 660 gggaacgtgt acgacgaaac aaagatgcag cgttacactg ttgaagggga ttggtcaggg 720 ggcgcgttcc tgctcgttgc gggggccatc gccgggccaa tcactgttcg tggccttgat 7 80 atcgcgtcaa ctcaggcgga taaggcgatc gttcaggcgc tcatgagcgc caacgccggg 840 atcgcgatcg atgccaagga aatcaagctg catcctgccg atctgaacgc cttcgagttc 900 gatgccactg attgccctga tctcttccca ccactcgtgg ccctcgcctc atactgcaag 960 ggggaaacaa agatcaaggg cgtgagccgc cttgcgcata aggaatctga tagagggctg 1020 actcttcagg atgagttcgg gaagatgggc gttgaaatcc atcttgaagg ggatctcatg 1080 cgtgtgatcg gcgggaaggg ggtgaagggc gccgaagtta gctcacgtca tgatcatcgc 1140 atcgccatgg cgtgcgccgt ggcggcgctc aaggccgttg gggaaacaac aatcgaacat 1200 gccgaagcgg ttaacaagtc ttaccctgat ttctactcag atttgaagca gctcgggggc 1260 gtggtgtctc tgaaccatca gttcaacttc tcttag 1296
<210> SEQ ID NO: 75 <211> Comprimento: 1296 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: grgl VARIANTE - grgl(evo8) <400> Seqüência: 75
atgaaggtga caatccagcc tggcgatctc acaggcatca ttcagagccc agcgtcaaag 60
tcttcaatgc agagagcgtg cgcggcggcc ctggtggcga aggggatctc agaaatcatc 120 aaccctgggc atagcaacga tgataaggcc gcgagagata tcgtgagccg tcttggggcc 180
agacttgaag atcagccaga tggcagcctc cagatcacta gtgaaggcgt taagccagtg 240
gcgcctttca tcgagtgcgg ggaatcaggg ctgtctagtc gcgttttcac cccacttgtg 300
gcgctttcga aggaagaagt gacaatcaag gggtcagggt cactcgttac tcgccctatg 360 gatttcttcg atgaaatcct gccacatctg ggcgtgaagg tgaagtcaaa tcaagggaag 420 ctccctctgg ttatccaggg gccacttaag ccagcggatg ttacagttga tgggtctctc 480
tcatctcagt tcctgacagg cctcctgctt gcctacgccg cggcggatgc cagcgatgtt 540
gccatcaagg tgactaaact gaagtcacgt ccttacatcg atcttactct tgatgttatg 600 aagcgtttcg gcctcaagac tcctgaaaac cgcaactacg aagagttcta cttcaaggcc 660 gggaacgtgt acgacgaaac aaagatgcag cgttacactg ttgaagggga ttggtcaggg 720 ggcgcgttcc tgctcgttgc gggggccatc gccgggccaa tcactgttcg tggccttgat 780
atcgcgtcaa ctcaggcgga taaggcgatc gttcaggcgc tcatgagcgc caacgccggg 840
atcgcgatcg atgccaagga aatcaagctg catcctgccg atctgaacgc cttcgagttc 900
gatgccactg attgccctga tctcttccca ccactcgtgg ccctcgcctc atactgcaag 960 ggggaaacaa agatcaaggg cgtgagccgc cttgcgcata aggaatctga tagagggctg 1020 actcttcagg atgagttcgg gaagatgggc gttgaaatcc atcttgaagg ggatctcatg 1080 cgtgtgatcg gcgggaaggg ggtgaagggc gccgaagtta gctcacgtca tgatcatcgc 1140
atcgccatgg cgtgcgccgt ggcggcgctc aaggccgttg gggaaacaac aatcgaacat 1200 gccgaagcgg ttaacaagtc ttaccctgat ttctactcag atttgaagca gctcgggggc 1260 gtggtgtctc tgaaccatca gttcaacttc tcttag 1296
<210> SEQ ID NO: 76
<211> Comprimento: 6
<212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: Domínio Consenso
<221> Nome/Chave: VARIANTE <222> Localização: 3
<223> Outras Informações: Xaa = Gln, Vai, Pro, Glu, lie, Met, ou Thr
<221> Nome/Chave: VARIANTE <222> Localização: 4
<223> Outras Informações: Xaa = Qualquer aminoácido
<400> Seqüência: 76 Asp Cys Xaa Xaa Ser Gly 1 5

Claims (36)

1. Polinucleotídeo isolado caracterizado por ser diferente das SEQ ID NO: 1 e 46 codificante de polipeptideo de EPSP sintase tolerante a glifosato tendo um domínio de seqüência selecionado do grupo que consiste em: a) X-C-X-E-S-G-L-S-X-R-F-X-P-X (SEQ ID NO:44), em que X denota qualquer aminoácido; e b) D-C-Xi-X2-S-G (SEQ ID NO:76), em que Xi denota glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina ou treonina e X2 denota qualquer aminoácido.
2. Polinucleotídeo isolado de acordo com a reivindicação 1, caracterizado pelo fato de que o domínio de seqüência é X1-C-X2-E-S-G-L-S-X3-R-X4-F-X5-P-X6 (SEQ ID NO: 45) e em que X1 denota ácido aspártico, lisina, ácido glutâmico, asparagina, serina, glicina, prolina ou arginina; X2 denota asparagina, alanina, serina, glicina, glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina, treonina ou arginina; onde X3 denota isoleucina, metionina, fenilalanina, glicina, serina ou valina; onde X4 denota metionina, alanina, serina, glicina, glutamina, leucina, valina ou isoleucina; onde X5 denota treonina, alanina, valina, isoleucina, prolina, leucina ou glicina; e onde Xe denota isoleucina, leucina, cisteína, alanina, fenilalanina ou metionina.
3. Polinucleotídeo isolado de acordo com a reivindicação 1, caracterizado pelo fato de que o polinucleotídeo citado codifica um polipeptídeo de EPSP sintase que é resistente ao herbicida glifosato.
4. Polinulcleotídeo isolado de acordo com a reivindicação -1, caracterizado pelo fato de que o domínio de seqüência corresponde às posições de aminoácido 85 até 99 da SEQ ID NO:2 e é selecionado do grupo que consiste nas posições correspondentes das SEQ ID NO:5 a 43 e SEQ ID NO: 56 a 65.
5. Polinucleotídeo isolado de acordo com a reivindicação -4, caracterizado pelo fato de que o polinucleotídeo citado codifica um polipeptídeo de EPSP sintase tento pelo menos -70% de identidade de seqüência com os aminoácidos correspondentes às posições 1 até 84 e posições 100 até 431 da SEQ ID NO:2, em que o polipeptídeo de EPSP sintase citado é resistente ao herbicida glifosato.
6. Polinucleotídeo isolado de acordo com a reivindicação -1, caracterizado pelo fato de que o polinucleotídeo codifica um polipeptídeo de fusão compreendendo um peptídeo de trânsito de cloroplasto amino-terminal e a enzima EPSP sintase.
7. Polinucleotídeo isolado de acordo com a reivindicação -1, caracterizado pelo fato de que o polinucleotídeo citado é uma seqüência sintética que foi projetada para expressão em uma planta.
8. Polinucleotídeo isolado de acordo com a reivindicação -7, caracterizado pelo fato de que o polinucleotídeo citado é selecionado do grupo que consiste nas SEQ ID NO:3, 4, 66, -67, 74 e 75.
9. Método de produção de uma planta transformada que mostra tolerância a glifosato, caracterizado por compreender as etapas de: a) inserir no genoma de uma célula vegetal um polinucleotídeo diferente das SEQ ID NO:1 e 46 codificando um polipeptideo de EPSP sintase tolerante a glifosato tendo um domínio de seqüência selecionado do grupo que consiste em: i) X-C-X-E-S-G-L-S-X-R-X-F-X-P-X (SEQ ID NO:44), em que X denota qualquer aminoácido; e ii) D-C-Xi-X2-S-G (SEQ ID NO:76), em que Xi denota glutamina, valina, prolina, ácido glutâmico isoleucina, metionina ou treonina e X2 denota qualquer aminoácido; b) obter uma célula vegetal transformada; e c) regenerar, a partir da célula vegetal transformada, uma planta geneticamente transformada que possui tolerância aumentada ao herbicida glifosato.
10. Método de acordo com a reivindicação 9, caracterizado pelo fato de que o domínio de seqüência é Xi-C-X2-E-S-G-L- S-X3-R-X4-F-X5-P-X6 (SEQ ID NO:45) e em que Xi denota ácido aspártico, lisina, ácido glutâmico, asparagina, serina, glicina, prolina ou arginina; X2 denota asparagina, alanina, serina, glicina, glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina, treonina ou arginina; onde X3 denota isoleucina, metionina, fenilalanina, glicina, serina ou valina; onde X4 denota metionina, alanina, serina, glicina, glutamina, leucina, valina ou isoleucina; onde X5 denota treonina, alanina, valina, isoleucina, prolina, leucina ou glicina; e onde Xe denota isoleucina, leucina, cisteina, alanina, fenilalanina ou metionina.
11. Método de acordo com a reivindicação 9, caracterizado pelo fato de que o domínio de seqüência corresponde às posições 85 até 99 da SEQ ID NO:2 e é selecionado do grupo que consiste nas posições correspondentes das SEQ ID NO:5 a -43 e SEQ ID NO:56 a 65.
12. Método de acordo com a reivindicação 11, caracterizado pelo fato de que o polinucleotídeo codifica um polipeptídeo de EPSP sintase tendo pelo menos 70% de identidade de seqüência com os aminoácidos correspondentes às posições 1 até 84 e posições 100 até 431 da SEQ ID NO:2, em que o polipeptídeo de EPSP sintase citado é resistente ao herbicida glifosato.
13. Método de acordo com a reivindicação 9, caracterizado pelo fato de que o polinucleotídeo citado codifica um polipeptídeo de fusão compreendendo um peptídeo de trânsito de cloroplasto amino-terminal e a enzima EPSP sintase.
14. Método de acordo com a reivindicação 9, caracterizado pelo fato de que o polinucleotideo citado é uma seqüência sintética que foi projetada para expressão em uma planta.
15. Método de acordo com a reivindicação 14, caracterizado pelo fato de que o polinucleotideo citado é selecionado do grupo que consiste nas SEQ ID NO:3, 4, 66, 67, 74 e 75.
16. Célula vegetal tolerante a glifosato caracterizada por compreender um polinucleotideo heterólogo diferente das SEQ ID NO:1 e 46 codificante de um polipeptideo de EPSP sintase tolerante a glifosato tendo um domínio de seqüência selecionado do grupo que consiste em: a) X-C-X-E-S-G-L-S-X-R-X-F-X-P-X (SEQ ID NO:44), em que X denota qualquer aminoácido; e b) D-C-Xi-X2-S-G (SEQ ID NO:76), em que Xi denota glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina ou treonina e X2 denota qualquer aminoácido.
17. Célula vegetal tolerante a glifosato de acordo com a reivindicação 16, caracterizada pelo fato de que o domínio de seqüência é Xi-C-X2-E-S-G-L-S-X3-R-X4-F-X5-P-X6 (SEQ ID NO:45) e em que Xi denota ácido aspártico, lisina, ácido glutâmico, asparagina, serina, glicina, prolina ou arginina; X2 denota asparagina, alanina, serina, glicina, glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina, treonina ou arginina; onde X3 denota isoleucina, metionina, fenilalanina, glicina, serina ou valina; onde X4 denota metionina, alanina, serina, glicina, glutamina, leucina, valina ou isoleucina; onde Xs denota treonina, alanina, valina, isoleucina, prolina, leucina ou glicina; e onde Xe denota isoleucina, leucina, cisteina, alanina, fenilalanina ou metionina.
18. Célula vegetal tolerante a glifosato de acordo com a reivindicação 17, caracterizada pelo fato de que o domínio de seqüência corresponde às posições 85 até 99 da SEQ ID NO:2 e é selecionado do grupo que consiste nas posições correspondentes das SEQ ID NO:5 a 43 e SEQ ID NO:56 a 65.
19. Célula vegetal tolerante a glifosato de acordo com a reivindicação 19, caracterizada pelo fato de que o polinucleotídeo codifica um polipeptídeo de EPSP sintase tendo pelo menos 70% de identidade de seqüência com os aminoácidos correspondentes às posições 1 até 84 e posições -100 até 431 da SEQ ID NO: 2, em que o polipeptídeo de EPSP sintase citado é resistente ao herbicida glifosato.
20. Célula vegetal tolerante a glifosato de acordo com a reivindicação 16, caracterizada pelo fato de que o polinucleotídeo codifica um polipeptídeo de fusão compreendendo um peptídeo de trânsito de cloroplasto amino- terminal e a enzima EPSP sintase.
21. Célula vegetal tolerante a glifosato de acordo cm a reivindicação 16, caracterizada pelo fato de que o polinucleotídeo citado é uma seqüência sintética que foi projetada para expressão em uma planta.
22. Célula vegetal resistente a glifosato de acordo com a reivindicação 21, caracterizada pelo fato de que o polinucleotídeo citado é selecionado do grupo que consiste nas SEQ ID NO:3, 4, 66, 67, 74 e 75.
23. Célula vegetal tolerante a glifosato de acordo com a reivindicação 16, caracterizada pelo fato de que é selecionada do grupo que consiste em milho, trigo, arroz, cevada, soja, algodão, beterraba, colza, canola, linho, girassol, batata, tabaco, tomate, alfafa, álamo, pinheiro, eucalipto, maçã, alface, ervilhas, lentilhas, uva e gramas.
24. Planta tolerante a glifosato caracterizada por compreender a célula vegetal de acordo com a reivindicação -16.
25. Semente transformada caracterizada por compreender o polinucleotídeo de acordo com a reivindicação 1.
26. Planta tolerante a glifosato de acordo com a reivindicação 25, caracterizada pelo fato de que é selecionada do grupo que consiste em milho, trigo, arroz, cevada, soja, algodão, beterraba, colza, canola, linho, girassol, batata, tabaco, tomate, alfafa, álamo, pinheiro, eucalipto, maçã, alface, ervilhas, lentilhas, uva e gramas.
27. Método para controlar seletivamente ervas daninhas em um campo contendo uma planta tendo sementes ou plantas cultivadas caracterizado pelo fato de que compreende as etapas de: a) plantar as sementes ou plantas que são tolerantes a glifosato como resultado da inserção na semente ou planta de iam polinucleotídeo, diferente das SEQ ID NO:1 e 46, codificando um polipeptideo de EPSP sintase tolerante a glifosato tendo um domínio de seqüência selecionado do grupo que consiste em: i) X-C-X-E-S-G-L-S-X-R-F-X-P-X (SEQ ID NO:44), em que X denota qualquer aminoácido; e ii) D-C-X1-X2-S-G (SEQ ID NO:76), em que Xi denota glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina ou treonina e X2 denota qualquer aminoácido; e b) aplicar às plantas e ervas daninhas em um campo lam concentração efetiva de herbicida glifosato para controlar as ervas daninhas sem afetar significativamente as plantas.
28. Método de acordo com a reivindicação 27, caracterizado pelo fato de que o domínio de seqüência é Xi-C-X2-E-S-G-L- S-X3-R-X4-F-X5-P-Xe (SEQ ID NO: 45) e em que Xi denota ácido aspártico, lisina, ácido glutâmico, asparagina, serina, glicina, prolina ou arginina; X2 denota asparagina, alanina, serina, glicina, glutamina, valina, prolina, ácido glutâmico, isoleucina, metionina, treonina ou arginina; onde X3 denota isoleucina, metionina, fenilalanina, glicina, serina ou valina; onde X4 denota metionina, alanina, serina, glicina, glutamina, leucina, valina ou isoleucina; onde X5 denota treonina, alanina, valina, isoleucina, prolina, leucina ou glicina; e onde Xe denota isoleucina, leucina, cisteína, alanina, fenilalanina ou metionina.
29. Método de acordo com a reivindicação 28, caracterizado pelo fato de que o domínio de seqüência corresponde às posições 85 até 99 da SEQ ID NO:2 e é selecionado do grupo que consiste nas posições correspondentes das SEQ ID NO: 5 a 43 e SEQ ID NO:56 a 65.
30. Método de acordo com a reivindicação 29, caracterizado pelo fato de que o polinucleotídeo codifica um polipeptídeo de EPSP sintase tendo pelo menos 70% de identidade de seqüência com os aminoácidos correspondentes às posições 1 até 84 e posições 100 até 431 da SEQ ID NO: 2, em que o polipeptídeo de EPSP sintase citado é resistente ao herbicida glifosato.
31. Método de acordo com a reivindicação 28, caracterizado pelo fato de que o polinucleotídeo codifica um polipeptídeo de fusão compreendendo um peptídeo de trânsito de cloroplasto amino-terminal e a enzima EPSP sintase.
32. Método de acordo com a reivindicação 28, caracterizado pelo fato de que o polinucleotídeo citado é uma seqüência sintética que foi projetada para expressão em uma planta.
33. Método de acordo com a reivindicação 32, caracterizado pelo fato de que o polinucleotídeo citado é selecionado do grupo que consiste nas SEQ ID NO:3, 4, 66, 67, 74 e 75.
34. Molécula de ácido nucléico isolada que codifica uma enzima EPSPS tolerante a glifosato, caracterizada pelo fato de que a referida enzima EPSPS tolerante a glifosato possui um Ki (glifosato) /Km (PEP) entre cerca de 100 e cerca de -1700.
35. Planta caracterizada por ter incorporado de maneira estável no seu genoma uma construção de DNA compreendendo uma seqüência de nucleotídeos que codifique um polipeptideo de EPSPS tolerante a glifosato, o polipeptideo de EPSPS tendo um Ki (glifosato)/Km (PEP) entre cerca de 100 e cerca de 1700, a dita planta mostrando tolerância ao herbicida glifosato.
36. Planta de acordo com a reivindicação 35, caracterizada pelo fato de que a planta citada é selecionada do grupo que consiste em milho, trigo, arroz, cevada, soja, algodão, beterraba, colza, canola, linho, girassol, batata, tabaco, tomate, alfafa, álamo, pinheiro, eucalipto, maçã, alface, ervilhas, lentilhas, uva e gramas.
BRPI0712991-2A 2006-06-13 2007-06-13 polinucleotìdeo isolado, método de produção de uma planta transformada que mostra toleráncia a glifosato, célula vegetal e planta tolerantes a glifosato, semente transformada, método para controlar seletivamente ervas daninhas, moléculas de ácido nucléico isolada e planta BRPI0712991A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US81306106P 2006-06-13 2006-06-13
US60/813,061 2006-06-13
US87825907P 2007-01-03 2007-01-03
US60/878,259 2007-01-03
PCT/US2007/071076 WO2007146980A2 (en) 2006-06-13 2007-06-13 Improved epsp synthases: compositions and methods of use

Publications (1)

Publication Number Publication Date
BRPI0712991A2 true BRPI0712991A2 (pt) 2012-04-17

Family

ID=38832809

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0712991-2A BRPI0712991A2 (pt) 2006-06-13 2007-06-13 polinucleotìdeo isolado, método de produção de uma planta transformada que mostra toleráncia a glifosato, célula vegetal e planta tolerantes a glifosato, semente transformada, método para controlar seletivamente ervas daninhas, moléculas de ácido nucléico isolada e planta

Country Status (10)

Country Link
US (1) US20070295251A1 (pt)
EP (1) EP2027270A2 (pt)
AR (1) AR061366A1 (pt)
AU (1) AU2007257704A1 (pt)
BR (1) BRPI0712991A2 (pt)
CA (1) CA2659556A1 (pt)
MX (1) MX2008015557A (pt)
NZ (1) NZ573399A (pt)
RU (1) RU2008152187A (pt)
WO (1) WO2007146980A2 (pt)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080313769A9 (en) * 2006-01-12 2008-12-18 Athenix Corporation EPSP synthase domains conferring glyphosate resistance
EP2240575A2 (en) 2008-02-01 2010-10-20 Athenix Corporation Directed evolution of grg31 and grg36 epsp synthase enzymes
BRPI0822484B1 (pt) * 2008-03-03 2021-08-31 Ms Technologies, Llc Anticorpo imunorreativo com um polipeptídeo epsps (ácido 5-enolpiruvil-3- fosfoshiquímico sintase) mutante, linhagem de células de hibridomas e método para detectar a presença de um polipeptídeo epsps (ácido 5-enolpiruvil-3-fosfoshiquímico sintase) mutante em uma composição
EP2449108A1 (en) 2009-07-01 2012-05-09 Bayer BioScience N.V. Methods and means for obtaining plants with enhanced glyphosate tolerance
EA022553B1 (ru) 2010-01-22 2016-01-29 Байер Интеллектуэль Проперти Гмбх Применение комбинации биологически активных веществ, набор и средство, содержащие комбинацию биологически активных веществ, для борьбы с вредителями животного происхождения и способ улучшения использования продукционного потенциала трансгенного растения
WO2011154159A1 (en) 2010-06-09 2011-12-15 Bayer Bioscience N.V. Methods and means to modify a plant genome at a nucleotide sequence commonly used in plant genome engineering
CA2801834A1 (en) 2010-06-09 2011-12-15 Kathleen D'halluin Methods and means to modify a plant genome at a nucleotide sequence commonly used in plant genome engineering
CN102399794A (zh) * 2010-09-08 2012-04-04 创世纪转基因技术有限公司 一种棉花epsp合成酶突变体基因及其应用
JP5860471B2 (ja) 2010-11-15 2016-02-16 バイエル・インテレクチュアル・プロパティ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツングBayer Intellectual Property GmbH N−アリールピラゾール(チオ)カルボキサミド類
EP2646559A2 (en) 2010-12-03 2013-10-09 MS Technologies, LLC Optimized expression of glyphosate resistance encoding nucleic acid molecules in plant cells
IN2014DN00156A (pt) 2011-08-10 2015-05-22 Bayer Ip Gmbh
WO2013116782A1 (en) 2012-02-01 2013-08-08 Dow Agrosciences Llc Novel class of glyphosate resistance genes
BR112015014307A2 (pt) 2012-12-19 2017-07-11 Bayer Cropscience Ag difluorometil-nicotínico- tetrahidronaftil carboxamidas
US20150351390A1 (en) 2012-12-21 2015-12-10 Pioneer Hi-Bred International, Inc. Compositions and methods for auxin-analog conjugation
CA2904537A1 (en) 2013-03-14 2014-09-25 Pioneer Hi-Bred International, Inc. Compositions having dicamba decarboxylase activity and methods of use
EP2970995A1 (en) 2013-03-14 2016-01-20 Pioneer Hi-Bred International, Inc. Compositions having dicamba decarboxylase activity and methods of use
WO2016166077A1 (en) 2015-04-13 2016-10-20 Bayer Cropscience Aktiengesellschaft N-cycloalkyl-n-(biheterocyclyethylene)-(thio)carboxamide derivatives

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5094945A (en) 1983-01-05 1992-03-10 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthase, production and use
US4535060A (en) * 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
JP2615013B2 (ja) * 1985-08-07 1997-05-28 モンサント コンパニ− グリホセート耐性キメラ遺伝子
US5312910A (en) 1987-05-26 1994-05-17 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthase
US5633435A (en) * 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
US5866775A (en) 1990-09-28 1999-02-02 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
FR2673643B1 (fr) * 1991-03-05 1993-05-21 Rhone Poulenc Agrochimie Peptide de transit pour l'insertion d'un gene etranger dans un gene vegetal et plantes transformees en utilisant ce peptide.
FR2736926B1 (fr) * 1995-07-19 1997-08-22 Rhone Poulenc Agrochimie 5-enol pyruvylshikimate-3-phosphate synthase mutee, gene codant pour cette proteine et plantes transformees contenant ce gene
US6040497A (en) * 1997-04-03 2000-03-21 Dekalb Genetics Corporation Glyphosate resistant maize lines
CZ20013860A3 (cs) * 1999-04-29 2002-04-17 Syngenta Ltd. Herbicidně rezistentní rostliny
JP2003523173A (ja) * 1999-04-29 2003-08-05 シンジェンタ リミテッド 除草剤耐性植物
CN1359422A (zh) * 1999-04-29 2002-07-17 辛甄塔有限公司 抗除草剂植物
EP2339005A3 (en) 1999-12-16 2011-10-12 Monsanto Technology LLC Dna constructs for expression of heterologous polypeptides in plants
ATE298364T1 (de) 2000-03-09 2005-07-15 Monsanto Technology Llc Verfahren zum herstellen von glyphosat-toleranten pflanzen
EP1325136A1 (en) * 2000-09-29 2003-07-09 Syngenta Limited Herbicide resistant plants
CN1330762C (zh) * 2002-05-10 2007-08-08 北京大学 新的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合酶及其编码基因
US7045684B1 (en) * 2002-08-19 2006-05-16 Mertec, Llc Glyphosate-resistant plants
ATE506438T1 (de) * 2002-12-18 2011-05-15 Athenix Corp Herbizidresistenz verleihende gene
CN101173273B (zh) * 2003-02-18 2013-03-20 孟山都技术有限公司 抗草甘磷的i型5-烯醇丙酮酸莽草酸-3-磷酸合酶
WO2005014820A1 (fr) * 2003-08-08 2005-02-17 Si Chuan Heben Biotic Engineering Co. Ltd. 5-enolpyruvyl-3-phosphoshikimate synthase a bioresistance eleve au glyphosate et sequence de codage
US20080313769A9 (en) * 2006-01-12 2008-12-18 Athenix Corporation EPSP synthase domains conferring glyphosate resistance

Also Published As

Publication number Publication date
AU2007257704A1 (en) 2007-12-21
US20070295251A1 (en) 2007-12-27
EP2027270A2 (en) 2009-02-25
NZ573399A (en) 2011-12-22
CA2659556A1 (en) 2007-12-21
MX2008015557A (es) 2009-01-13
WO2007146980A2 (en) 2007-12-21
WO2007146980A3 (en) 2008-04-03
AR061366A1 (es) 2008-08-20
RU2008152187A (ru) 2010-07-20

Similar Documents

Publication Publication Date Title
BRPI0712991A2 (pt) polinucleotìdeo isolado, método de produção de uma planta transformada que mostra toleráncia a glifosato, célula vegetal e planta tolerantes a glifosato, semente transformada, método para controlar seletivamente ervas daninhas, moléculas de ácido nucléico isolada e planta
US8252981B2 (en) GRG23 EPSP synthases: compositions and methods of use
JP4879969B2 (ja) 新規なクラスのepspシンターゼの同定
US7960615B2 (en) GRG36: novel EPSP synthase gene conferring herbicide resistance
US8003854B2 (en) GRG32: a novel EPSP synthase gene conferring herbicide resistance
US8247535B2 (en) Directed evolution of GRG31 EPSP synthase enzyme
US20090241219A1 (en) Gdc-2 genes conferring herbicide resistance
BRPI0711953A2 (pt) polinucleotìdeo isolado e polipeptìdeo conferindo resistência a glutamina sintetase e métodos para produzir plantas e células vegetais transgênicas apresentando produção e utilização de nitrogênio melhoradas
BRPI0619092A2 (pt) molécula de ácido nucléico isolada, polipetptìdeo isolado, vetor, célula hospedeira, planta transgênica, semente, método para produzir polipeptìdeo com atividade de resistência à herbicidas, método para conferir resistência à herbicida para planta, método para medir à liberação de fosfato por enzima
US20090203075A1 (en) Genes conferring herbicide resistance
AU2007204642A1 (en) EPSP synthase enzyme domains conferring glyphosate resistance

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 5A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: NAO APRESENTADA A GUIA DE CUMPRIMENTO DE EXIGENCIA. REFERENTE A 5A ANUIDADE.