BRPI0712871A2 - molÉcula de Ácido nuclÉico e polipeptÍdeo isolados, vetor, cÉlula hospedeira, planta trasngÊnica, semente, mÉtodos para produzir um polipeptÍdeo com atividade de resistÊncia a herbicida, para conferir resistÊncia a um herbicida em uma planta, para gerar uma variante de polinucleotÍdeo, para aumentar o vigor ou o rendimento em uma planta, e para conferir resist~encia a glifosato em uma planta - Google Patents

molÉcula de Ácido nuclÉico e polipeptÍdeo isolados, vetor, cÉlula hospedeira, planta trasngÊnica, semente, mÉtodos para produzir um polipeptÍdeo com atividade de resistÊncia a herbicida, para conferir resistÊncia a um herbicida em uma planta, para gerar uma variante de polinucleotÍdeo, para aumentar o vigor ou o rendimento em uma planta, e para conferir resist~encia a glifosato em uma planta Download PDF

Info

Publication number
BRPI0712871A2
BRPI0712871A2 BRPI0712871-1A BRPI0712871A BRPI0712871A2 BR PI0712871 A2 BRPI0712871 A2 BR PI0712871A2 BR PI0712871 A BRPI0712871 A BR PI0712871A BR PI0712871 A2 BRPI0712871 A2 BR PI0712871A2
Authority
BR
Brazil
Prior art keywords
gly
val
thr
wing
asp
Prior art date
Application number
BRPI0712871-1A
Other languages
English (en)
Inventor
Brian Carr
Cheryl Peters
De Berg Brian Van
Daniel John Tomso
Original Assignee
Athenix Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Athenix Corp filed Critical Athenix Corp
Publication of BRPI0712871A2 publication Critical patent/BRPI0712871A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8275Glyphosate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • C12N9/10923-Phosphoshikimate 1-carboxyvinyltransferase (2.5.1.19), i.e. 5-enolpyruvylshikimate-3-phosphate synthase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

MOLÉCULA DE ÁCIDO NUCLÉICO E POLIPEPTÍDEO ISOLADOS, VETOR, CÉLULA HOSPEDEIRA, PLANTA TRANSGÊNICA, SEMENTE, MÉTODOS PARA PRODUZIR UM POLIPEPTÍDEO COM ATIVIDADE DE RESISTÊNCIA A HERBICIDA, PARA CONFERIR RESISTÊNCIA A UM HERBICIDA EM UMA PLANTA, PARA GERAR UMA VARINATE DE POLINUCLEOTÍDEO, PARA AUMENTAR OVIGOR OU O RENDIMENTO EM UMA PLANTA, E PARA CONFERIR RESISTÊNCIA A GLIFOSATO EM UMA PLANTA. São providos composições e métodos para conferir resistência ou tolerância a herbicida em bactérias, plantas, células vegetais, tecidos e sementes. Composições compreendendo uma sequência codificadora para um polipeptídeo que confere resistência ou tolerância a herbicidos de glifosato são providas. As sequências codificadoras podem ser usadas em construções de DNA ou cassetes de expressão para transformação em plantas. Composições também compreendem bactérias, plantas, células, tecidos e sementes vegetais transformadas. Em particular, moléculas de ácido nucléico correspondendo a sequências de ácido nucléiico resistentes a glifosato são providas. Adicionalmente, sequências de aminoácidos correspondendo aos polinucleotideos são englobadas. Em particular, a presente invenção provê moléculas de ácido nucléico isoladas compreendendo sequência de nucleotideos que codificam a sequência de aminoácido mostrada em SEO ID NOS: 2, 4, 6, 8, 10, 12, ou 14, ou a sequência de nucleotídeo definida em SEQ ID NOS: 1, 3, 5, 7, 9, 11, 28, 29 30, 31, 33, ou 34.

Description

molécula de ácido nucléico e polipeptídeo isolados, vetor, célula hospedeira, planta transgênica, semente, métodos para produzir um polipeptídeo com atividade de resistência a herbicida, para conferir resistência a um herbicida em uma planta, para gerar uma variante de polinucleotídeo, para aumentar o vigor ou o rendimento em uma planta, e para conferir resistência a glifosato em uma planta
campo da invenção
A presente invenção fornece novos genes que codificam 5- enolpiruvilchiquimato-3-fosfato (EPSP) sintase que proporcionam resistência a herbicida. Esses genes são úteis em biologia vegetal, melhoramento vegetal, e na cultura de células vegetais.
fundamentos da invenção
N-fosfonometilglicina, comumente referido como glifosato, é um importante produto químico agronômico. O glifosato inibe a enzima que converte o ácido fosfoenolpirúvico (PEP) e o ácido 3-fosfochiquímico a ácido 5-enolpiruvil-3-fosfochiquímico. A inibição desta enzima (5- enolpiruvilchiquimato-3-fosfato sintase; aqui referida como "EPSP sintase") mata as células vegetais por encerrar a via do chiquimato, assim, inibindo a biossíntese do ácido aromático. Uma vez que herbicidas da classe glifosato inibem a biossíntese de aminoácidos aromáticos, eles não só matam células vegetais, mas também são tóxicos para células bacterianas. 0 glifosato inibe muitas EPSP sintases bacterianas e, portanto, é tóxico para essas bactérias. No entanto, certas EPSP sintases bacterianas têm uma alta tolerância ao glifosato.
Células vegetais resistentes à toxicidade do glifosato podem ser produzidas por transformar células vegetais para expressar EPSP sintases bacterianas glifosato-resistentes. Notavelmente, o gene da bactéria Agrobacterium tumefaciens estirpe CP4 tem sido utilizado para conferir resistência ao herbicida sobre células vegetais seguida da expressão em plantas. Uma mutação EPSP sintase de Salmonella typhimurium estirpe CT7 confere resistência ao glifosato nas células bacterianas, e confere resistência ao glifosato, em células vegetais (Patentes U.S. nos. 4.535.060, 4.769.061
20
25
e
5.094.945).
A patente U.S. 6.040.497 relata enzimas EPSP sintase mutantes de milho com substituições de treonina para isoleucina na posição 102 e prolina para serina na posição 106 (a mutação -TIPS-). Essas alterações conferem resistência ao glifosato sobre as enzimas de milho. Uma mutação EPSP sintase de Salmonella typhimurium estirpe CT7 confere resistência ao glifosato nas células bacterianas, e é relatado para conferir resistência ao glifosato nas células vegetais (Patentes U.S. nos. 4.535.060, 4.769.061 e 5.094.945). He et al. ((2001) Biochim et Biophysica Acta 1568:1-6) desenvolveram EPSP sintases com maior tolerância ao glifosato por mutagênese e recombinação entre os genes da EPSP sintase de E. coli e Salmonella typhimurium, e sugerem que mutações na posição 42 (T42M) e posição 230 (Q230K) são provavelmente responsáveis pela resistência observada.
Trabalho posterior (He et al. (2003) Biosci. Biotech.
Biochem. 67:1405-1409) mostra que a mutação T42M (treonina
para metionina) é suficiente para melhorar a tolerância de
ambos as enzimas de E. coli e Salmonella typhimurium. Estas
enzimas contêm substituições de aminoácidos em seus sítios
ativos que impedem a ligação do glifosato, sem afetar a
ligação por PEP ou S3P. As mutações que ocorrem na região
dobrada entre os dois domínios globulares de EPSP sintase
foram mostradas para alterar a afinidade de ligação do
glifosato não PEP (He et al, 2003, supra). Portanto, as
enzimas têm alta atividade catalítica, mesmo na presença de glifosato.
Devido às inúmeras vantagens que plantas com resistência ao herbicida fornecem, métodos para a identificação de genes com resistência a herbicida com atividade de resistência ao glifosato são desejáveis. SUMÁRIO DA INVENÇÃO
Composições e métodos para conferir resistência ou tolerância a herbicida em bactérias, plantas, células, tecidos e sementes são fornecidos. Composições incluem moléculas de ácidos nucléicos codificando polipeptídeos com resistência ou tolerância a herbicida, vetores compreendendo as moléculas de ácidos nucléicos, e células hospedeiras compreendendo os vetores. Composições também incluem anticorpos contra polipeptídeos com resistência ou tolerância a herbicida. Como observado, as seqüências de nucleotídeo da invenção podem ser utilizadas em construções de DNA ou cassetes de expressão para transformação e expressão em organismos, incluindo plantas e microorganismos. Composições também compreendem bactérias transformadas, plantas, células, tecidos e sementes. Além disso, métodos são fornecidos para a produção do polipeptídeos codificados pelos nucleotídeos sintéticos da invenção.
Em particular, moléculas de ácidos nucléicos isolados e
variantes destas, codificando polipeptídeos com resistência ou tolerância a herbicida são apresentadas. Adicionalmente, aminoácidos e variantes, codificados pelos polinucleotídeos que conferem resistência ou tolerância a herbicida são englobados. Em particular, a presente invenção prevê moléculas de ácidos nucléicos isolados compreendendo as seqüências nucleotídicas estabelecidas nas SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 28, 29, 30, 31, 32, 33, ou 34, uma seqüência nucleotídica codificando a seqüência de aminoácidos mostrada nas SEQ ID NO: 2, 4, 6, 8, 10, 12, ou 14, a seqüência nucleotídica resistente a herbicida depositada em hospedeiros bacterianos com Nos. de Acesso NRRL B-30911, NRRL B-30912, NRRL B-30913, NRRL B-30914 N, NRRL B -30915, NRRL B-30916 N, ou NRRL B-30917 N, bem como variantes e fragmentos destes. Seqüências nucleotídicas que são complementares a uma seqüência nucleotídica da invenção, ou que hibridizam uma seqüência da invenção também são englobadas.
10
DESCRIÇÃO DAS FIGURAS
Figuras IA-IE mostram um alinhamento da seqüência de aminoácidos GRG25 (SEQ ID NO: 2), GRG26 (SEQ ID NO: 4), GRG27 (SEQ ID NO: 6), GRG28 (SEQ ID NO: 8), GRG29 (SEQ ID NO: 10), GRG30 (SEQ ID NO: 12), e GRG31 (SEQ ID NO: 14) com outra de genes EPSP sintase tolerantes ao glifosato, incluindo GRGl (SEQ ID NO: 15), GRG5 (SEQ ID NO: 16), GRG6 (SEQ ID NO: 17), GRG7 (SEQ ID NO: 18), GRG8 (SEQ ID NO: 19), GRG9 (SEQ ID NO: 20), GRGlO (SEQ ID NO: 21) , GRG 12 (SEQ ID NO: 22), GRG 15 (SEQ ID NO: 23), GRG20 (SEQ ID NO: 24), GRG21 (SEQ ID NO: 25), GRG22 (SEQ ID NO: 26), e GRG23 (SEQ ID NO: 27). O símbolo [*] indica que os resíduos são idênticos em todas as seqüências do alinhamento, o símbolo [:] indica substituições conservadoras, o símbolo [.] indica substituições semi- conservadoras. DESCRIÇÃO DETALHADA DA INVENÇÃO
A presente invenção é esquematizada para composições e métodos de regulação da resistência a herbicida nos organismos, em particular nas plantas ou células vegetais. Os métodos envolvem transformar organismos com uma seqüência nucleotídica que codifica um gene com resistência ao glifosato da invenção. Em especial, uma seqüência nucleotídica da invenção é útil para preparar plantas que apresentam maior tolerância ao herbicida glifosato. Assim, são fornecidas bactérias transformadas, plantas, células, tecidos vegetais e sementes. Composições incluem ácidos nucléicos e proteínas relacionadas à tolerância a herbicida em microorganismos e plantas, bem como bactérias transformadas, plantas, tecidos vegetais e sementes. Mais particularmente, seqüências de nucleotídeos de genes com resistência ao glifosato (grg25, grg26, grg21, grg28, grg29, grg30, grg31, syngrg25, syngrg26, syngrg27, syngrg28, syngrg29, syngrg30, e syngrg31) e as seqüências de aminoácidos a proteínas assim codificadas são descritas. As seqüências encontram uso na construção de vetores de expressão para posterior transformação em plantas de interesse, como sondas para o isolamento de outros genes de resistência ao glifosato, como marcadores selecionáveis, e coisas do gênero. Assim, por gene com "resistência ao glifosato" ou "tolerância ao glifosato" da invenção é destinado a seqüência nucleotídica estabelecida nas SED ID NO: 1, 3, 5, 7, 9, 11 ou 13 e fragmentos e variantes destas (por exemplo, SEQ ID no: 28-34) que codificam um polipeptídeo com resistência ou tolerância ao glifosato. Do mesmo modo, um polipeptídeo com "resistência ao glifosato" ou "tolerância ao glifosato" da invenção é um polipeptídeo tendo a seqüência de aminoácidos estabelecida nas SEQ ID NO: 2, 4, 6, 8, 10, 12, ou 14, e fragmentos e variantes destas, que confere resistência ou tolerância ao glifosato em uma célula hospedeira.
Plasmídios contendo seqüências nucleotídicas com resistência a herbicida da invenção foram depositados na coleção permanente do Agricultural Research Service Culture Collection, Northern Regional Research Laboratory (NRRL), 1815 North University Street, Peoria, Illinois 61604, Estados Unidos da América, em 19 de abril de 2006, e foram atribuídos os Nos. de Acesso N NRRL B-30911 (para grg25 \ NRRL B-30912 (para grg26), NRRL B-30913 (para grg27) , NRRL B-30914 N (para grg28), NRRL B-30915 (para grg29) , NRRL B-30916 N (para grg30), e NRRL B-30917 (para grg31). Este depósito será mantido de acordo com os termos do Tratado de Budapeste sobre o Reconhecimento Internacional do Depósito de Microorganismos para fins de Processo de Patente. Este depósito foi feito apenas como uma conveniência para os versados na técnica e não é uma admissão de que um depósito é exigido sob a 35 U.S.C. [seção] 112.
Por "glifosato" é entendido qualquer forma herbicida de N-fosfonometilglicina (incluindo qualquer sal do mesmo) e de outras formas, que resultem na produção do anion glifosato na planta. Uma "proteína com resistência a herbicida" ou proteína resultante da expressão de uma "molécula de ácido nucléico com codificação de resistência a herbicida" incluem proteínas que conferem a uma célula a capacidade de tolerar uma concentração mais elevada de um herbicida que células que não expressam a proteína, ou a tolerar uma determinada concentração de um herbicida para um período de tempo mais longo do que células que não expressam a proteína. Uma "proteína com resistência ao glifosato" inclui uma proteína que confere a uma célula a capacidade de tolerar uma concentração maior de glifosato do que células que não expressam a proteína, ou a tolerar uma certa concentração de glifosato para um período de tempo mais longo do que células que não expressam a proteína. Por "tolerar" ou "tolerância" entende-se sobreviver, ou realizar funções celulares essenciais, como a síntese protéica e a respiração de uma forma que não é facilmente discernível a partir de células não tratadas.
20
Moléculas de Ácido Nucléico Isolado, e Variantes e Fragmentos Destes
Um aspecto da invenção pertence a moléculas de ácidos nucléicos isoladas ou recombinantes compreendendo seqüências nucleotídicas que codificam proteínas com resistência a herbicida e polipeptídios ou partes biologicamente ativas dos mesmos, bem como moléculas de ácidos nucléicos suficientes 10
15
20
para uso como sondas de hibridização para identificar ácidos
nucléicos codificando resistência a herbicida. Conforme
utilizado aqui, o termo "molécula de ácido nucléico" destina-
se a incluir moléculas de DNA (por exemplo, o DNA
recombinante, cDNA ou DNA genômico) e moléculas de RNA (por
exemplo, mRNA) e análogos do DNA ou RNA gerados utilizando
nucleotídeos análogos. As moléculas de ácidos nucléicos podem
ser de fita única ou fita dupla, mas de preferência são DNA de fita dupla.
Seqüências nucleotídicas codificando as proteínas da presente invenção incluem as seqüências estabelecidas nas SEQ ID Nos.: 1, 3, 5, 7, 9, 11, l3/ 28, 29, 30, 31, 32, 33 e 34, a seqüência nucleotídica com resistência ao herbicida depositada em um hospedeiro bacteriano com Nos. de Acesso NRRL B-30911, NRRL B-30912, NRRL B-30913, NRRL B-30914 N, NRRL B-30915, NRRL B-30916 N, e N NRRL B-30917, e variantes, fragmentos, e complementos da mesma. Por "complementar" entende-se uma seqüência nucleotídica que seja suficientemente complementar a uma determinada seqüência nucleotídica que possa hibridizar a dada seqüência de nucleotídeos, para assim, formar uma forma estável duplex. As seqüências de aminoácidos correspondentes para as proteínas com resistência a herbicida codificadas por estas seqüências nucleotídicas são estabelecidas nas SEQ ID Nos. : 2, 4, 6, 8, 10, 12 e 14. A invenção também inclui moléculas de ácidos nucléicos compreendendo seqüências nucleotídicas que codificam proteínas com resistência a herbicida de comprimento parcial, e complementos da mesma.
Uma molécula de ácido nucléico ou proteína "isolada" ou "purificada", ou parte biologicamente ativa dela, é praticamente isenta de outros materiais celulares, ou meio de cultura, quando produzidas por técnicas recombinantes, ou substancialmente livres de precursores químicos ou outros produtos químicos quando quimicamente sintetizados. De preferência, um ácido nucléico "isolado" é livre de seqüências (de preferência seqüências que codificam proteínas) que naturalmente flanqueiam o ácido nucléico (ou seja, seqüências localizadas nas extremidades 5' e 3' do ácido nucléico) no DNA genômico do organismo do qual o ácido nucléico é derivado. Para efeitos da invenção, o termo "isolado" quando usado para referir-se a moléculas de ácido nucléico isoladas exclui cromossomos. Por exemplo, em vários experimentos, moléculas isoladas de ácido nucléico que codificam a resistência ao glifosato podem conter menos de cerca de 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb, ou 0,1 kb de seqüências nucleotídicas que naturalmente flanqueiam as moléculas de ácido nucléico no DNA genômico da célula a partir da qual é derivado o ácido nucléico. Uma proteína de resistência a herbicida que é substancialmente livre de materiais celulares inclui preparações de proteína com menos de cerca de 30%, 20%, 10%, ou 5% (em peso seco) de proteína não-resistente a herbicida (também aqui referida como "proteína contaminante"). Moléculas de ácidos nucléicos que são fragmentos dessas seqüências nucleotidicas com codificações de resistência a herbicidas também são abrangidas pela presente invenção. Por "fragmento" é entendido uma parte de uma seqüência nucleotídica que codifica uma proteína de resistência a herbicida. Um fragmento de uma seqüência nucleotídica pode codificar uma porção biologicamente ativa de uma proteína resistente a herbicida, ou pode ser um fragmento que pode ser usado como uma sonda de hibridização ou iniciador de PCR utilizando métodos descritos abaixo. Moléculas de ácidos nucléicos que são fragmentos de seqüências nucleotidicas com resistência a herbicida compreendem, pelo menos, cerca de 15, 20, 50, 75, 100, 200, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400 de nucleotídeos contíguos, ou até o número de nucleotídeos presentes em todo o comprimento da seqüência nucleotídica que codifica resistência ao herbicida descrita aqui (por exemplo, 1404 nucleotídeos para SEQ ID NO: 1; 1395 nucleotídeos para SEQ ID NO: 3, 1368 nucleotídeos para SEQ ID NO: 5, etc), dependendo da utilização pretendida. Por nucleotídeos "contíguos" é entendido resíduos de nucleotídeo que são imediatamente adjacentes um ao outro.
Fragmentos das seqüências nucleotidicas da presente invenção geralmente irá codificar fragmentos de proteínas que mantêm a atividade biológica proteína de resistência ao glifosato de comprimento integral, ou seja, de atividade de resistência a herbicida. Por "mantém atividade de resistência a herbicida" entende-se que o fragmento terá pelo menos cerca
de 30%, pelo menos cerca de 50%, pelo menos cerca de 70%, ou
pelo menos cerca de 80% de atividade de resistência a
herbicida de todo o comprimento da proteína de resistência ao
glifosato descrito aqui como SEQ ID NOS: 2, 4, 6, 8, 10, 12
ou 14. Métodos para medir a atividade de resistência a
herbicida são bem conhecidos no estado da técnica. Ver, por
exemplo, Patentes U.S. nos. 4.535.060 e 5.188.642, cada um
dos quais aqui incorporados por referência, na sua totalidade.
Um fragmento de uma seqüência nucleotídica codificando resistência a herbicida que codifica uma porção biologicamente ativa de uma proteína da invenção vai codificar pelo menos cerca de 15, 25, 30, 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450 aminoácidos contíguos, ou até o número total de aminoácidos presentes em todo o comprimento de uma proteína de resistência ao herbicida da invenção (por exemplo, 467 aminoácidos de SEQ ID NO: 2; 464 para SEQ ID NO: 4, 455 aminoácidos de SEQ ID NO: 6, etc.).
Proteínas de resistência a herbicida preferidas da presente invenção são codificadas por uma seqüência nucleotídica suficientemente idêntica à seqüência de nucleotídeos SEQ ID NOS: 1, 3, 5, 7, 9, 11, 13, 28, 29, 30, 31, 32, 33, ou 34. O termo "suficientemente idênticos" é entendido como um aminoácido ou seqüência nucleotídica que tem pelo menos cerca de 60% ou 65% de identidade de
20
25 seqüência, cerca de 70% ou 75% de identidade de seqüência, cerca de 80% ou 85% de identidade de seqüência, ou cerca de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em comparação com uma identidade de seqüência referência usando uma seqüência de programas de alinhamento aqui descritos utilizando parâmetros padrão. Aquele versado na técnica vai reconhecer que estes valores podem ser devidamente adaptados para determinar a identidade correspondente de proteínas codificadas por duas seqüências nucleotídicas, tendo em conta a degeneração de códon, a similaridade de aminoácidos, o posicionamento da fase de leitura, e coisas do gênero.
Para determinar a identidade percentual de duas seqüências de aminoácidos ou dos dois ácidos nucléicos, as seqüências são alinhadas para uma comparação ótima. A identidade percentual entre as duas seqüências é uma função do número de posições idênticas partilhados pelas seqüências (ou seja, identidade percentual = número de posições idênticas / número total de posições (por exemplo, sobreposição de posições) χ 100). Em um experimento, as duas seqüências têm o mesmo comprimento. A identidade percentual entre as duas seqüências pode ser determinada utilizando técnicas semelhantes às descritas abaixo, com ou sem permitir lacunas. No cálculo da identidade percentual, tipicamente correspondências exatas são contadas.
A determinação da identidade percentual entre duas seqüências pode ser realizada utilizando um algoritmo matemático. Um exemplo não limitante de um algoritmo matemático utilizado para a comparação das duas seqüências é o algoritmo de Karlin e Altschul (1990) Proc. Natl. Acad. Sei. E.U.A. 87:2264, modificado como no Karlin e Altschul (1993) Proc. Natl. Acad. Sei. E.U.A. 90: 5873-5877. Tal algoritmo é incorporado nos programas BLASTN e BLASTX de Altschul et al. (1990) J. Mol. Biol. 215:403. Pesquisas de nucleotídeo no BLAST podem ser realizadas com o programa BLASTN, escore = 100, comprimento de palavra = 12, para obter seqüências de aminoácidos homólogas às moléculas de proteína resistentes ao glifosato da invenção. BLAST proteína pesquisas podem ser realizadas com o programa BLASTX, escore = 50, wordlength = 3, para obter aminoácidos homóloga à proteína herbicida resistência moléculas da invenção. Para obter alinhamentos lacunados para fins de comparação, Gapped BLAST pode ser utilizado tal como descrito no Altschul et al. (1997) Nucleic Acids Res. 25:3389. Alternativamente, o PSI- Blast pode ser utilizado para a realização de uma pesquisa que detecta relações distantes entre as moléculas. Ver Altschul et al. (1997) supracitado. Quando se utilizar os programas BLAST, Gapped BLAST, e PSI-Blast, os parâmetros padrão dos respectivos programas (por exemplo, BLASTX e BLASTN) podem ser utilizados. Ver www.ncbi.nlm.nih.gov. Outro exemplo não limitante de algoritmo matemático utilizado para a comparação de seqüências é o algoritmo ClustalW (Higgins et al. (1994) Nucleic Acids Res. 22: 4673-4680). ClustalW compara seqüências, e alinha a totalidade dos aminoácidos ou seqüência de DNA, e assim pode fornecer dados sobre a conservação da seqüência de aminoácidos de toda a seqüência. 0 algoritmo ClustalW é utilizado em vários software comercialmente disponíveis de análise de soluções de DNA/aminoácido, tais como o módulo ALIGNX do Vector NTI Program Suite (Invitrogen Corporation, Carlsbad, CA) . Após o alinhamento das seqüências de aminoácidos com ClustalW, o percentual da identidade de aminoácidos pode ser avaliado. Um exemplo não limitante de um programa de software útil para a análise de alinhamentos ClustalW é o GENEDOC (TM). GENEDOC (TM) (Karl Nicholas) permite a avaliação da similaridade de aminoácidos (ou DNA) e de identidade entre várias proteínas. Outro exemplo não limitante de iam algoritmo matemático utilizado para a comparação de seqüências é o algoritmo de Myers e Miller (1988) CABIOS 4: 11-17. Tal algoritmo é incorporado no programa ALIGN (versão 2.0), que faz parte do software de alinhamento da seqüência GCG (disponível por Accelrys, Inc., 9865 Scranton Rd., San Diego, Califórnia, E.U.A.). Quando utilizar o programa ALIGN para comparar seqüências de aminoácidos, uma mesa de resíduo PAM de peso 120, lima lacuna de comprimento 12, e um desnível 4 podem ser usados.
Salvo indicação em contrário, o GAP Versão 10, que utiliza o algoritmo de Needleman e Wunsch (1970) supra, será utilizado para determinar a identidade de seqüência ou similaridade com os seguintes parâmetros: % de identidade e % de similaridade de uma seqüência nucleotídica usando Peso GAP de 50 e Peso de Comprimento 3, e o escore nwsgapdna. cmp matriz; % de identidade ou % de similaridade de uma seqüência de aminoácidos utilizando peso GAP de 8 e peso de comprimento 2, e o programa de escore BLOSUM62. Programas equivalentes também podem ser utilizados. Por "programa equivalente" entende-se qualquer programa de comparação de seqüência que, para quaisquer duas seqüências em questão, gera um alinhamento com resíduo de nucleotídeo idêntico e uma percentagem idêntica de identidade de seqüência, quando comparado com o alinhamento correspondente gerado pelo GAP Versão 10.
A invenção também engloba variantes de moléculas de ácidos nucléicos. "Variantes" de seqüências nucleotídicas que codificam resistência a herbicida incluem estas seqüências que codificam uma proteína de resistência a herbicida descrita aqui, mas que diferem conservativamente devido à degeneração do código genético, bem como aqueles que são suficientemente idênticos como discutido anteriormente. Variantes alélicos ocorrendo naturalmente podem ser identificados com o uso de técnicas de biologia molecular bem conhecidas, tais como a reação em cadeia da polimerase (PCR) e técnicas de hibridização como descritas abaixo. Seqüências nucleotídicas variantes também incluem seqüências nucleotídicas derivadas sinteticamente que foram geradas, por exemplo, utilizando mutagênese sítio-dirigida, mas que ainda codificam proteínas de resistência a herbicida descritas na presente invenção como discutido abaixo. Proteínas variantes englobadas pela presente invenção são biologicamente ativas, isto é, mantêm a atividade biológica desejada da proteína nativa, ou seja, atividade de resistência a herbicida. Por "mantém a atividade de resistência a herbicida" entende-se a variante que terá pelo menos cerca de 30%, pelo menos cerca de 50%, pelo menos cerca de 70%, ou pelo menos cerca de 80% de atividade de resistência a herbicida da proteína nativa. Métodos para medir a atividade de resistência a herbicida são bem conhecidos no estado da técnica. Ver, por exemplo, Patentes U.S. nos 4.535.060 e 5.188.642, cada uma das quais aqui incorporadas por referência, na sua totalidade.
O versado na técnica irá apreciar ainda que mudanças podem ser introduzidas por mutação nas seqüências nucleotídicas da invenção, assim, levando a alterações na seqüência de aminoácidos da proteína codificada de resistência ao herbicida, sem alterar a atividade biológica das proteínas. Assim, variantes de moléculas de ácidos nucléicos isoladas podem ser criadas através da introdução de uma ou mais substituições nucleotídicas, acréscimos ou supressões na seqüência nucleotídica correspondente descrita aqui, de tal forma que um ou mais substituições de aminoácidos, acréscimos ou supressões são introduzidos na proteína codificada. As mutações podem ser introduzidas pelas técnicas convencionais, como a mutagênese sítio-dirigida e a mutagênese mediada por PCR. Essas variantes de seqüências nucleotídicas são igualmente abrangidas pela presente invenção. Por exemplo, substituições aminoácidas conservativas podem ser feitas em uma ou mais situações previsíveis, de preferência resíduos de aminoácidos desnecessários. Um resíduo de aminoácido "desnecessário" é um resíduo que pode ser alterado a partir da seqüência do tipo selvagem de uma proteína de resistência ao herbicida sem alterar a atividade biológica, enquanto que um resíduo de aminoácido "essencial" é necessário para a atividade biológica. Uma "substituição conservativa de aminoácidos" é uma na qual o resíduo de aminoácido seja substituído por um resíduo de aminoácido que tenha uma cadeia lateral semelhante. Famílias de resíduos de aminoácidos com cadeias laterais semelhantes foram definidas no estado da técnica. Essas famílias incluem aminoácidos com cadeias laterais básicas (por exemplo, lisina, arginina, histidina), cadeias laterais ácidas (por exemplo, ácido aspártico, ácido glutâmico), cadeias laterais polares não modificadas (por exemplo, glicina, asparagina, glutamina, serina, treonina, tirosina, cisteína), cadeias laterais não polares (por exemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptofano), cadeias laterais beta-ramifiçadas (por exemplo, treonina, valina, isoleucina) e cadeias laterais aromáticas (por exemplo, tirosina, fenilalanina, triptofano, histidina). Substituições de aminoácidos podem ser feitas em regiões não conservadas que retêm função. Em geral, essas substituições não seriam feitas de resíduos de aminoácidos conservados, ou de resíduos de aminoácidos que residem dentro de um motivo conservado, onde esses resíduos são essenciais para a atividade protéica. No entanto, um versado na técnica irá compreender que variantes funcionais podem ter alterações menos conservadas ou não conservadas nos resíduos conservados. Exemplos de resíduos que sejam conservados e que podem ser essenciais para a atividade protéica incluem, por exemplo, resíduos que são idênticos entre todas as proteínas contidas no alinhamento da figura 1. Exemplos de resíduos que são conservados, mas que podem permitir substituições conservativas de aminoácidos e que ainda mantêm atividade incluem, por exemplo, resíduos que têm apenas substituições conservativas entre todas as proteínas contidas no alinhamento da figura 1.
Lys-22, Arg-124, Asp-313, Arg-344, Arg-386, e Lis-411, são resíduos conservados da EPSP sintase de E. coli (Schõnbrunn et al. (2001) Proc. Natl. Acad. E.U.A. 98: 1376- 1380) . Resíduos conservados importantes para a atividade de EPSP sintase também incluem Arg-100, Asp-242, e Asp-3 84 (Selvapandiyan et al. (1995) FEBS Letters 374: 253-256). Arg- 27 liga-se à S3P (Shuttleworth et al. (1999) Biochemistry 38: 296-302) .
Alternativamente, seqüências nucleotídicas variantes podem ser feitas através da introdução aleatória de mutações ao longo de todo ou parte do código da seqüência, como por mutagênese de saturação, e os mutantes resultantes podem ser rastreados para a capacidade de conferir atividade de resistência a herbicida para identificar mutantes que mantêm atividade. Após mutagênese, as proteínas codificadas podem ser expressas recombinantemente e, a atividade da proteína pode ser determinada usando ensaios de técnicas padrão.
Utilizando métodos como PCR, hibridização, e similares, seqüências com resistência a herbicida correspondente podem ser identificadas, tais seqüências com identidade substancial para as seqüências da invenção. Ver, por exemplo, Sambrook J., e Russell, D. W. (2001) Molecular Cloning: A Laboratory Manual. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) e Innis, et al. (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, NY).
Em um método de hibridização, a totalidade ou parte da seqüência nucleotídica com resistência a herbicida pode ser utilizada para rastrear cDNA genômico ou bibliotecas. Métodos para a construção de tais cDNA e bibliotecas genômicas são geralmente conhecidos na técnica e são descritos em Sambrook e Russell, 2001, supra. As chamadas sondas de hibridização podem ser fragmentos de DNA genômico, fragmentos de cDNA, fragmentos de RNA, ou outros oligonucleotídeos, e podem ser marcadas com um grupo detectável, como P, ou qualquer outro marcador detectável, como outros radioisótopos, um composto fluorescente, uma enzima, ou um co-fator enzimático. Sondas de hibridização podem ser feitas por marcação de oligonucleotídeos sintéticos baseados nas seqüências nucleotídicas com codificação de resistência a herbicida conhecidas e descritas aqui. Iniciadores degenerados concebidos com base em aminoácidos ou resíduos de nucleotídeos conservados nas seqüências de nucleotídeos ou seqüências de aminoácidos codificados podem também ser utilizados. A sonda tipicamente inclui uma região de seqüência nucleotídica que hibridiza sob condições estringentes de, pelo menos, cerca de 12, de preferência de cerca de 25, pelo menos cerca de 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 500, 600, 700, 800, 900, 1000, 1200, 1300 nucleotídeos consecutivos de uma seqüência nucleotídica com codificação de resistência a herbicida da invenção ou um fragmento ou variante deste. Métodos para a preparação de sondas para hibridização são geralmente conhecidos no estado da técnica e são descritos em Sambrook e Russell, 2001, supra e Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nova Iorque) , ambos os quais são aqui incorporados por referência.
20
Por exemplo, uma seqüência inteira de resistência a herbicida descrita aqui, ou uma ou mais partes dela, pode ser utilizada como uma sonda capaz de hibridizar especificamente as seqüências de resistência ao herbicida correspondente e RNAs mensageiros. Para atingir hibridização específica em uma variedade de condições, tais sondas incluem seqüências que são únicas e são, pelo menos, cerca de 10 nucleotídeos em comprimento, ou pelo menos cerca de 20 nucleotídeos em comprimento. Essas sondas podem ser utilizadas para amplificar seqüências de resistência ao herbicida de um organismo escolhido por PCR. Esta técnica pode ser utilizada para isolar seqüências codificantes adicionais a partir de um desejado organismo ou como um teste diagnóstico para determinar a presença de seqüências codificantes em um organismo. Técnicas de hibridização incluem triagem de hibridação em bibliotecas de DNA plaqueado (ou placas ou colônias; ver, por exemplo, Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nova Iorque).
10
Hibridização dessas seqüências pode ser realizada sob condições estringentes. Por "condições estringentes" ou "condições de hibridização estringentes" entende-se as condições em que uma sonda irá hibridizar a sua seqüência alvo para um maior grau detectável do que de outras seqüências (por exemplo, pelo menos 2 vezes acima). Condições estringentes são dependentes da seqüência e serão diferentes em circunstâncias diferentes. Ao controlar a estringência da hibridização e/ou condições de lavagem, seqüências-alvo que são 100% complementares ao da sonda podem ser identificadas (sonda homóloga). Alternativamente, condições estringentes podem ser ajustadas para permitir algumas inadequações em seqüências como graus menores de similaridade ser detectados (sonda heteróloga). Geralmente, uma sonda é inferior a cerca de 1000 nucleotídeos em comprimento, de preferência com menos de 500 nucleotídeos em comprimento. Tipicamente, condições estringentes serão aquelas em que a concentração de sal é inferior a cerca de 1,5 M de íon Na, tipicamente cerca de 0,01 a 1,0 M de concentração de íon Na (ou de outros sais) empH7,0a8,3ea temperatura é de pelo menos cerca de 30°C para sondas curtas (por exemplo, 10 a 50 nucleotídeos) e pelo menos cerca de 60°C para sondas longas (por exemplo, maior que 50 nucleotídeos). Condições estringentes também podem ser alcançadas com a adição de agentes desestabilizadores, como formamida. Condições exemplares de baixa estringência incluem hibridização com uma solução-tampão de 30 a 35% de formamida, 1 M de NaCl, 1% de SDS (dodecil sulfato de sódio) a 37°C, e uma lavagem Ix ou 2x em SSC (2Ox SSC = 3.0 M NaCl/0.3 M de citrato trissódico) a 50 a 55°C. Condições exemplares de moderada estringência incluem hibridização em 40 a 45% de formamida, 1,0 M de NaCli 1% de SDS a 37°C, e uma lavagem 0. 5x a Ix em SSC a 55 a 60°C. Condições exemplares de elevada estringência incluem hibridização em 50% de formamida, 1 M de NaCl, 1% de SDS a 37°C, e uma lavagem 0.Ix em SSC a 60 a 65°C. Opcionalmente, tampões de lavagem podem incluir cerca de 0,1% para cerca de 1% de SDS. A duração de hibridização é geralmente inferior a cerca de 24 horas, normalmente cerca de 4 a cerca de 12 horas.
A especificidade é normalmente a função de lavagens pós- hibridação, os fatores críticos sendo a força iônica e a temperatura da solução final de lavagem. Para híbridos DNA- DNA, a TM pode ser aproximada a partir da equação de Meinkoth e Wahl (1984) Anal. Biochem. 138:267-284: Tm = 81,5°C + 16,6 (log M) + 0,41 (% GC) - 0,61 (% form) - 500 / L, onde M é a molaridade de cátions monovalentes, % GC é o percentual de nucleotídeos guanosina e citosina no DNA, % form é a percentagem de formamida na solução de hibridização, e L é o comprimento do híbrido em pares de base. A Tm é a temperatura (sob força iônica e pH definidos) em que 50% de uma seqüência alvo complementar hibridiza perfeitamente para uma sonda marcada. Tm é reduzida em cerca de 1°C para cada 1% de inadequações; assim, Tm, hibridação e/ou condições de lavagem podem ser ajustadas para hibridizar para seqüências de identidade pretendida. Por exemplo, se seqüências com ^ 90% de identidade são procurados, a TM pode ser diminuída 10°C. Geralmente, são selecionadas as condições estringentes para ser cerca de 50C inferior ao ponto de fusão térmico (Tm) para a sua seqüência específica e complementar a um força iônica e pH definidos. No entanto, condições severamente estringentes podem utilizar uma hibridação e/ou lavagem com 1, 2, 3 ou 40C inferiores ao ponto de fusão térmico (Tm); condições moderadamente estringentes podem utilizar uma hibridação e/ou lavar a 6, 7, 8, 9 ou IO0C inferiores ao ponto de fusão térmico (Tm), condições de baixa estringência podem utilizar uma hibridação e/ou lavar a 11, 12, 13, 14, 15 ou 2 0°C inferiores ao ponto de fusão térmico (Tm). Usando a equação, hibridização e composições de lavagem, e Tm desejado, os versados na técnica irão entender que as variações na severidade da hibridação e/ou soluções de lavagem são inerentemente descritos. Se o grau desejado de resultados inadequados em um Tm de menos de 45°C (solução aquosa) ou 32°C (solução de formamida) , será preferível aumentar a concentração do SSC, para que uma temperatura mais elevada possa ser utilizada. Um extenso guia para a hibridização de ácidos nucléicos é encontrado em Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology Hybridization with Nucleic Acid Probes, Part I, Chapter 2 (Elsevier, Nova Iorque); e Ausubel et ai. , eds. (1995) Current Protocols in Molecular Biology, Chapter 2 (Greene Publishing and Wiley-Interscience, Nova Iorque).
Proteínas Isoladas e Variantes e Fragmentos Destas
Proteínas com resistência a herbicidas também são englobadas no âmbito da presente invenção. Por "proteína com resistência à herbicida" é entendido uma proteína com seqüência de aminoácidos estabelecidos nas SEQ ID NOS: 2, 4, 6, 8, 10, 12 ou 14. Fragmentos, porções biologicamente ativas, e variantes destes, são também fornecidos, e podem ser utilizados para a prática dos métodos da presente invenção.
"Fragmentos" ou "porções biologicamente ativas" incluem fragmentos de polipeptídeos compreendendo uma porção de uma seqüência de aminoácidos codificando uma proteína de resistência a herbicida, tal como estabelecido nas SEQ ID NOS: 2, 4, 6, 8, 10, 12, ou 14, e que mantém atividade de resistência a herbicida. Uma porção biologicamente ativa de uma proteína com resistência a herbicida pode ser um polipeptídeo que é, por exemplo, 10, 25, 50, 100 ou mais aminoácidos em comprimento. Essas porções biologicamente ativas podem ser preparadas por técnicas recombinantes e avaliadas para atividade de resistência a herbicida. Métodos para medir a atividade de resistência a herbicida são bem conhecidos no estado da técnica. Ver, por exemplo, Patentes U.S. nos. 4.535.060 e 5.188.642, cada um dos quais aqui incorporadas por referência, na sua totalidade. Conforme utilizado aqui, um fragmento compreende pelo menos 8 aminoácidos contíguos de SEQ ID NOS: 2, 4, 6, 8, 10, 12 ou 14. A invenção engloba outros fragmentos, porém, como em qualquer fragmento de proteína superior a cerca de 10, 20, 30, 50, 100, 150, 200, 250, 300, 350, ou 400 aminoácidos.
Por "variantes" é entendido polipeptídeos ou proteínas tendo uma seqüência de aminoácidos que é, pelo menos, cerca de 60%, 65%, cerca de 70%, 75%, 80%, 85%, ou 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% idêntica à seqüência de aminoácidos de SEQ ID NOS: 2, 4, 6, 8, 10, 12 ou 14. Variantes incluem também polipeptídeos codificados por um ácido nucléico que hibridiza a molécula de ácido nucléico das SEQ ID NOS: 1, 3, 5, 7, 9, 11, 13, 28, 29, 30, 31, 32, 33, ou 34, ou um complemento das mesmas, sob condições estringentes. Variantes incluem polipeptídeos que diferem na seqüência de aminoácidos devido a mutagênese. Proteínas variantes englobadas pela presente invenção são biologicamente ativas, isto é, elas continuam a possuir a atividade biológica desejada da proteína nativa, ou seja, mantendo atividade de resistência a herbicida. Métodos para medir a atividade de resistência a herbicida são bem conhecidos no estado da técnica. Ver, por exemplo, Patentes U.S. nos. 4.535.060 e 5.188.642, cada um dos quais aqui incorporados por referência, na sua totalidade.
Genes bacterianos, tais como os genes grg25, grg26, grg27, grg28, grg29, grg30, grg31, syngrg25, syngrg26, syngrg27, syngrg28, syngrg29, syngrg30, e syngrg31 desta invenção, muitas vezes possuem códons de iniciação múltiplos de metionina na proximidade com o início da fase aberta de leitura. Muitas vezes, o início da tradução um ou mais destes códons iniciadores levará à geração de uma proteína funcional. Estes códons iniciadores podem incluir códons ATG. No entanto, bactérias tais como Bacillus sp. também reconhecem o códon GTG como um códon iniciador, e as proteínas que iniciam a tradução dos códons GTG contêm uma metionina no primeiro aminoácido. Além disso, não é muitas vezes determinada a priori qual destes códons são utilizados naturalmente na bactéria. Assim, é entendido que a utilização de um dos códons alternativos de metionina pode levar a geração de variantes de grg25, grg26, grg27, grg28, grg29, grg30, grg31, syngrg25, syngrg26, syngrg27, syngrg28, syngrg29, syngrg30, syngrg31 que conferem resistência a herbicida. Essas proteínas de resistência a herbicidas são englobadas na presente invenção e podem ser utilizadas nos métodos da presente invenção. Anticorpos para os polipeptídeos da presente invenção, ou para as variantes ou fragmentos destes, também estão englobados. Métodos de produção de anticorpos são bem conhecidos na técnica (ver, por exemplo, Harlow e Lane (1988) Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Patente U.S. No. 4.196.265).
Variantes Alteradas ou aperfeiçoadas
10
É reconhecido que seqüências de DNA de grg25, grg26, grg27, grg28, grg29, grg30, grg31, syngrg25, syngrg26, syngrg27, syngrg28, syngrg29, syngrg30, e syngrg31 podem ser alteradas por vários métodos, e que estas alterações podem resultar em seqüências de DNA que codificam proteínas com seqüências de aminoácidos diferentes do que as codificadas por grg25, grg26, grg27, grg28, grg29, grg30, ou grg31, respectivamente. Esta proteína pode ser alterada de várias maneiras, incluindo substituições de aminoácidos, supressões, truncações, e inserções de um ou mais aminoácidos das SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 28, 29, 30, 31, 32, 33, ou 34, incluindo-se cerca de 2, cerca de 3, cerca de 4, cerca de 5, cerca de 6, cerca de 7, cerca de 8, cerca de 9, cerca de 10, cerca de 15, cerca de 20, cerca de 25, cerca de 30 , cerca de 35, cerca de 40, cerca de 45, cerca de 50, cerca de 55, cerca de 60, cerca de 65, cerca de 70, cerca de 75, cerca de 80, cerca de 85, cerca de 90, cerca de 100 ou mais substituições de aminoácidos, supressões ou inserções. Métodos para tais manipulações são geralmente conhecidos no estado da técnica. Por exemplo, variantes da seqüência de aminoácidos de proteínas GRG descritas aqui podem ser preparadas por mutações no DNA. Isso também pode ser realizado por uma das várias formas de mutagênese e/ou em evolução dirigida. Em alguns aspectos, as alterações codificadas na seqüência de aminoácidos não irão afetar substancialmente a função da proteína. Essas variantes vão possuir a atividade de resistência a herbicida desejada. No entanto, entende-se que a capacidade de GRG25, GRG2 6, GRG27, GRG28, GRG29, GRG30, ou GRG31 para conferir resistência a herbicida pode ser melhorada através da utilização de uma dessas técnicas sobre as composições da presente invenção. Por exemplo, um pode expressar GRG25, GRG26, GRG27, GRG28, GRG29, GRG30, ou GRG31 em células hospedeiras que apresentam elevadas taxas de incorporação de base durante a replicação do DNA, como o XL-I Red (Stratagene, La Jolla, CA). Depois de propagação nessas linhagens, pode-se isolar o DNA da invenção (por exemplo, através da preparação do DNA plasmidial, ou por 2 0 amplificação por PCR e clonagem do fragmento resultante da PCR em um vetor) , cultivar mutações grg em uma estirpe não- mutagênica, e identificar genes mutantes com melhor resistência a um herbicida tal como o glifosato, como, por exemplo, cultivando células de cultura em concentrações crescentes de glifosato e testando para clones que conferem a capacidade de tolerar elevadas concentrações de glifosato. Alternativamente, alterações podem ser feitas para a seqüência de proteína no amino ou carboxi terminal de muitas proteínas sem afetar sensivelmente a atividade. Isto pode incluir inserções, deleções, ou alterações introduzidas pelos modernos métodos moleculares, como PCR, incluindo amplif icações PCR que alteram ou aumentam a seqüência de proteína codificante em virtude da inclusão de seqüências de aminoácidos codificando seqüências nos oligonucleotídeos utilizados na amplificação por PCR. Alternativamente, as seqüências protéicas acrescentadas podem incluir toda a codificação de seqüências de proteínas, como as usadas comumente no estado da técnica de produzir fusões protéicas. Essas proteínas fusionadas são freqüentemente utilizadas para (1) aumentar expressão de uma proteína de interesse, (2) introduzir um domínio de ligação, atividade enzimática, ou epítopo para facilitar a purificação protéica, detecção de proteína, ou outras utilizações experimentais conhecidas no estado da técnica, ou, (3) secreção alvo ou tradução de uma proteína de uma organela subcelular, tais como o espaço periplasmático de bactérias gram-negativas, ou do retículo endoplasmático de células eucarióticas, o último dos quais muitas vezes resulta em glicosilação da proteína.
Nucleotídeos variantes e seqüências de aminoácidos da presente invenção também englobam seqüências derivadas de procedimentos mutagênicos e recombinogênicos tais como embaralhamento de DNA. Com tal procedimento, uma ou mais diferentes proteínas com resistência a herbicidas codificando regiões podem ser usadas para criar uma nova proteína com resistência a herbicida possuindo as propriedades desejadas. Desta forma, bibliotecas de polinucleotídeos recombinantes são geradas a partir de uma população de seqüências de polinucleotídeos relacionados compreendendo regiões da seqüência que têm uma identidade de seqüência substancial e que podem ser recombinadas homologamente in vitro ou in vivo. Por exemplo, usando esta abordagem, seqüências-motivo codificando um domínio de interesse podem ser embaralhados entre o gene de resistência a herbicida da invenção e outros genes de resistência a herbicida conhecidos para obter um novo gene que codifica para uma proteína com uma melhoria da propriedade de interesse, tais como um aumento da atividade de resistência ao glifosato. Estratégias para tal embaralhamento de DNA são conhecidas na técnica. Ver, por exemplo, Stemmer (1994) Proc. Natl. Acad. Sei. E.U.A. 91: 10747-10751; Stemmer (1994) Nature 370: 389-391; Crameri et al. (1997) Nature Biotech. 15: 436-438; Moore et ai. (1997) J. Mol Biol. 272: 336-347; Zhang et al. (1997) Proc. Natl. Acad. Sei. E.U.A. 94: 4504-4509; Crameri et al. (1998) Nature 391: 288-291, e Patente U.S. nos. 5.605.793 e 5.837.458.
Espectro de Temperatura
Vários estudos de metabolismo do glifosato nas plantas têm sido realizados, e revelam que o glifosato não é metabolizado pelas plantas ou é metabolizado muito lentamente. 0 glifosato penetra a cutícula rapidamente, e é translocado completamente nas plantas em um período considerável de tempo (revisto em Kearney e Kaufman, Eds (1988) Herbicides; Chemistry, Degradation & Mode of Action Mareei Dekker, Inc., Nova Iorque, 3: 1-70 e Grossbard e Atkinson, Eds. (1985) The Herbieide Glyphosate Butterworths, Londres, p. 25-34). Assim, é provável que a tolerância ao glifosato seja necessária durante um longo período de tempo após a exposição ao glifosato em plantas agronomicamente importantes. Onde as temperaturas excedem com freqüência os 3O0C durante a época de crescimento, seria vantajoso empregar uma EPSP sintase com tolerância ao glifosato que mantivesse atividade em temperaturas elevadas.
Em uma concretização da presente invenção, a EPSP sintase apresenta estabilidade térmica, a uma temperatura que é superior ou inferior à temperatura ambiental do ambiente. Por "estabilidade térmica" entende-se que a enzima está ativa em uma maior ou menor temperatura ambiente superior a temperatura ambiente por um longo período de tempo superior a EPSP sintase que não é estável termicamente a essa temperatura. Por exemplo, uma EPSP sintase estável termicamente possui atividade enzimática para mais de cerca de 1 hora, mais de cerca de 2 horas, a cerca de 3, cerca de 4, cerca de 5, cerca de 6, cerca de 7, cerca de 8, cerca de 9, cerca de 10, cerca de 11 , cerca de 12, cerca de 13, cerca de 14, cerca de 15, cerca de 20, cerca de 25 horas, ou mais, a xima temperatura que é superior ou inferior à temperatura ambiente do meio. Para efeitos da presente invenção, temperatura "ambiente" do meio é de cerca de 30°C. Em algumas concretizações, uma temperatura superior a uma temperatura ambiente é a temperatura igual ou superior a cerca de 32°C, cerca de 34°C, cerca de 37°C, cerca de 40°C, cerca de 45°C, cerca de 50°C, cerca de 55°C, cerca de 60°C, cerca de 65°C ou superior. Uma inferior a temperatura ambiente é uma temperatura igual ou inferior a cerca de 28°C, abaixo de cerca de 27°C, cerca de 26°C, cerca de 25°C, cerca de 23°C, cerca de 20°C, cerca de 18°C, cerca de 15°C, cerca de 10°C, ou menos cerca de 5°C, ou seja, cerca de 0°C. Métodos de ensaio para a atividade da EPSP sintase são discutidos em mais detalhes a seguir noutros trechos. Para efeitos da presente invenção, uma EPSP sintase termicamente estável é considerada ativa quando ela funciona em cerca de 90% a 100%, cerca de 80% para cerca de 90%, cerca de 70% para cerca de 80%, cerca de 60% para cerca de 70% ou cerca de 50% para cerca de 60% do nível máximo de atividade observada à temperatura ótima para essa enzima.
Em outra concretização, a temperatura ótima para uma enzima EPSP sintase da invenção é superior ou inferior à temperatura ótima de uma enzima EPSP sintase de tipo selvagem com tolerância ao glifosato. Para efeitos da presente invenção, uma enzima EPSP sintase de tipo selvagem com tolerância ao glifosato é uma enzima que tem máxima atividade em temperatura ambiental do ambiente (por exemplo, a enzima EPSP sintase com tolerância ao glifosato descrita no GRG23 no Pedido de Patente U.S. No. 11/605.824, depositado em 29 de novembro de 2006, aqui incorporado por referência na sua totalidade). Por "ótima" se entende a maior atividade observada para uma enzima EPSP sintase, por exemplo, guando medida em várias faixas de temperatura. Nos exemplos não limitantes, a EPSP sintase empregada nos métodos da invenção pode ter ótima atividade de cerca de 0°C a cerca de 10°C, cerca de 10°C a cerca de 20°C, cerca de 20°C a cerca de 30°C, cerca de 30°C a cerca de 40°C, cerca de 40°C a cerca de 50°C, cerca de 50°C a cerca de 60°C, cerca de 60°C a cerca de 70 °C, ou cerca de 70°C a cerca de 80°C.
Assim, aqui são fornecidos métodos e composições para o aumento da tolerância ao glifosato, a temperaturas superiores ou inferiores às temperaturas ambientais do ambiente. Em uma concretização, os métodos compreendem incluir em uma planta uma seqüência nucleotídica que codifica uma enzima EPSP sintase com tolerância ao glifosato que é termicamente estável, com uma temperatura superior ou inferior à temperatura ambiente, e cultivar a planta a uma temperatura que é superior ou inferior, respectivamente, à temperatura ambiental do ambiente. Em concretizações específicas, a temperatura crescente é superior ou inferior à temperatura ambiente para uma média de pelo menos cerca de 2 horas por dia, pelo menos cerca de 3 horas por dia, pelo menos cerca de 4 horas por dia, pelo menos cerca de 5, cerca de 6, cerca de 7, cerca de 8, cerca de 9, cerca de 10, cerca de 11, cerca de 12, cerca de 14, cerca de 16, cerca de 18, cerca de 20, pelo menos, cerca de 22 horas por dia, ou até cerca de 24 horas por dia durante o período vegetativo da planta.
Em outra concretização, o método compreende introduzir em uma planta uma seqüência nucleotídica que codifica uma enzima EPSP sintase tolerante ao glifosato diferente da SEQ ID NO: 35, 36, ou 37, que tem uma ótima temperatura ambiente superior a temperatura ambiental do ambiente, contatando a planta com uma concentração com efeito herbicida de glifosato, e cultivando a dita planta a uma temperatura ambiente superior a temperatura ambiental do ambiente durante pelo menos 1 hora, pelo menos cerca de 2 horas, pelo menos cerca de 3, pelo menos cerca de 4 ou mais horas por dia para, pelo menos, 2, 3 , 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais dias após o glifosato ser aplicado nas plantas, em que os dias em que a temperatura excede a temperatura ambiente do meio ocorrem durante o período vegetativo da planta. Em outra concretização, o método compreende introduzir em uma planta uma seqüência nucleotídica que codifica uma enzima EPSP sintase tolerante ao glifosato diferente da SEQ ID NO: 38, que tem uma temperatura ambiente ótima inferior a temperatura ambiente, contatando a planta com uma concentração com efeito herbicida de glifosato, e cultivando a dita planta a uma temperatura inferior a temperatura ambiente durante, pelo menos, cerca de 1 hora, pelo menos cerca de 2 horas, pelo menos cerca de 3, pelo menos cerca de 4 ou mais horas por dia para, pelo menos, 2, 3, 4 , 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais dias após o glifosato ser aplicado às plantas, em que os dias em que a temperatura excede a temperatura ambiente do meio ocorrerem durante o período vegetativo da planta.
Em outra concretização, o método compreende introduzir em uma planta uma seqüência nucleotídica que codifica uma EPSP sintase tolerante ao glifosato que é estavelmente térmica a temperaturas superiores a temperatura ambiente do meio, contatando a planta com uma concentração com efeito herbicida de glifosato, e cultivando a planta em uma temperatura que é superior a temperatura ambiente do meio, onde a temperatura é superior a temperatura ambiente do meio durante, pelo menos, cerca de 1 hora, pelo menos cerca de 2 horas, pelo menos cerca de 3, pelo menos cerca de 4 ou mais horas por dia, durante pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais dias após o glifosato ser aplicado à planta, onde os dias em que a temperatura excede a temperatura ambiente do meio ocorrem durante o período vegetativo da planta. Em um exemplo não limitante, a enzima EPSP sintase termicamente estável é estabelecida na SEQ ID NO: 14. Alternativamente, o método compreende introduzir em uma planta uma seqüência nucleotídica que codifica uma enzima EPSP sintetase tolerante ao glifosato que é térmicamente estável em temperaturas inferiores a temperatura ambiente, contatando a planta com uma concentração com efeito herbicida de glifosato, e cultivando a planta, a uma temperatura que é inferior à temperatura ambiente do meio, por pelo menos, cerca de 1 hora, pelo menos cerca de 2 horas, pelo menos cerca de 3, pelo menos cerca de 4 ou mais horas por dia para, pelo menos, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais dias após o glifosato ser aplicado às plantas, em que os dias em que a temperatura excede a temperatura ambiente do meio ocorrem durante o estado vegetativo da planta.
Em várias concretizações, a enzima EPSP sintase com tolerância ao glifosato que é termicamente estável em temperaturas superiores ou inferiores às temperaturas ambiente do meio, ou que tenha um ótimo térmico a uma temperatura inferior ou superior à temperatura ambiente, não é xima EPSP sintase derivada de planta. Por "derivada de planta" entende-se a seqüência EPSP sintase da planta nativa, ou lima seqüência que é, pelo menos, cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, cerca de 91%, cerca de 92%, cerca de 93%, cerca de 94%, cerca de 95%, cerca de 96%, cerca de 97%, cerca de 98%, ou pelo menos cerca de 99% idêntica à seqüência da planta nativa. Ver, por exemplo, as seqüências EPSP sintase derivadas de plantas com tolerância ao glifosato descritas nos Pedidos de Patente U.S. nos. 20060143727, 20030049814, 20030079246, 20030200560, 2004148650 e 20050223436; Patentes U.S. nos. 5188642, 6040497, 7214535, 7169970, 6867293, 7183110, 5094945, 6225114, 7141722, 7045684, 5312910, 6566587, e RE037287, cada um dos quais aqui incorporados por referência na sua totalidade.
Transformação de bactérias ou células vegetais
Aqui são fornecidos novos genes isolados que conferem resistência a um herbicida. São fornecidas, também, as seqüências de aminoácidos das proteínas GRG da invenção. A proteína resultante da tradução deste gene permite às células funcionar na presença de concentrações de um herbicida tóxicas para as células, incluindo células vegetais e células bacterianas. Em um aspecto da invenção, os genes grg25, grg26, grg27, grg28, grg29, grg30, grg31, syngrg25, syngrg26, syngrg27, syngrg28, syngrg29, syngrg30, e syngrg31 são úteis como marcadores para avaliar a transformação de bactérias ou células vegetais. Métodos para detectar a presença de um transgene em uma planta, órgão vegetal (por exemplo, folhas, caules, raízes, etc), sementes, células vegetais, propágulo, embrião ou descendentes dos mesmos são bem conhecidos no estado da técnica.
Através da engenharia dos genes da invenção a serem expressos a partir de um promotor conhecido por estimular a transcrição no organismo a ser testado e devidamente traduzido para gerar um peptídeo GRG intacto, e colocar as células de uma outra concentração tóxica de herbicida, pode- se identificar as células que foram transformadas com o DNA, por força da sua resistência ao herbicida. Por "promotor" entende-se uma seqüência de ácidos nucléicos que funciona para dirigir a transcrição de uma seqüência codificante à jusante. 0 promotor, em conjunto com outras seqüências de ácidos nucléicos regulatórias transcricional e translacional, (também denominado como "seqüências controle") são necessários para a expressão de uma seqüência de DNA de interesse.
A transformação de células bacterianas é realizada por uma das várias técnicas conhecidas no estado da técnica, incluindo mas não limitadas a eletroporação ou transformação química (ver, por exemplo, Ausubel, ed. (1994) Current Protocols in Molecular Biology, John Wiley and Sons, Inc., Indianapolis, IN). Marcadores conferindo resistência a substâncias tóxicas são úteis na identificação de células transformadas (retomado e expressado o DNA teste) a partir de células não-transformadas (aquelas que não contenham ou não expressam o DNA teste) . Em um aspecto da invenção, os genes grg25, grg26, grg27, grg28, grg29, grg30, grg31, syngrg25, syngrg26, syngrg27, syngrg28, syngrg29, syngrg30, e syngrg31 são úteis como marcadores para avaliar a transformação de bactérias ou células vegetais.
A transformação de células vegetais pode ser realizada no mesmo estilo. Por "plantas" entende-se a planta inteira, órgãos vegetais (por exemplo, folhas, caules, raízes, etc.), sementes, células vegetais, sementes, embriões e descendentes do mesmo. Células vegetais podem ser diferenciadas ou
10
15
20 indiferenciadas (por exemplo, calos, células cultivadas em suspensão, protoplastos, células foliares, células da raiz, células do floema, pólen). "Plantas transgênicas" ou "plantas transformadas" ou plantas "estavelmente transformadas" ou tecidos ou células referem-se a plantas que tenham incorporado ou integrado seqüências de ácido nucléico exógeno ou fragmentos de DNA na célula vegetal. Por "transformação estável" é entendido a construção de nucleotideo introduzido em uma planta que se integra no genoma da planta e é capaz de ser herdado pelos descendentes destes.
Os genes grg da invenção podem ser modificados para obter ou melhorar a expressão nas células vegetais. As seqüências com resistência a herbicida da invenção podem ser fornecidas em cassetes de expressão para expressão na planta de interesse. "Cassete de expressão vegetal" inclui construções de DNA, incluindo construções de DNA recombinante, que são capazes de resultar na expressão de uma proteína a partir de uma fase aberta de leitura na célula vegetal. 0 cassete vai incluir na direção 5'-3' da transcrição, uma região de iniciação transcricional (ou seja, promotor, particularmente um promotor heterólogo) operacionalmente ligado a toma seqüência de DNA da invenção, e/ou uma região terminal transcricional e traducional (ou seja, a região terminal) funcional nas plantas. 0 cassete pode também conter, pelo menos, um gene adicional a ser co transformado para o organismo, como um gene marcador selecionável. Alternativamente, o(s) gene(s) adicional(s) podem ser fornecidos em múltiplos cassetes de expressão. Tal cassete de expressão é fornecido com uma pluralidade de restrições locais para a inserção da seqüência de resistência a herbicida para estar sob a regulação transcricional de regiões reguladoras.
0 promotor pode ser nativo ou análogo, ou externo ou heterólogo, para a planta hospedeira e/ou para a seqüência de DNA da invenção. Adicionalmente, o promotor pode ser a seqüência natural ou, alternativamente, uma seqüência sintética. Onde o promotor é "nativo" ou "homólogo" para a planta hospedeira, pretende-se que o promotor seja encontrado na planta nativa em que o promotor é introduzido. Onde o promotor é "externo" ou "heterólogo" para a seqüência de DNA da invenção, pretende-se que o promotor não seja o nativo ou que ocorre naturalmente para a seqüência de DNA operacionalmente ligada da invenção. "Heterólogo" geralmente se refere às seqüências de ácido nucléico que não são endógenas para a célula ou parte do genoma nativo em que estão presentes, e foram adicionados à célula por infecção, transfecção, microinjeção, eletroporação, microprojeção, ou coisas do gênero. Por "operacionalmente ligado" entende-se uma ligação funcional entre um promotor e uma segunda seqüência, onde a seqüência do promotor inicia e medeia a transcrição da seqüência de DNA correspondente à segunda seqüência. Geralmente, operacionalmente ligado significa que as seqüências do ácido nucléico sendo ligadas são contíguas e 10
onde necessário para juntar duas regiões codificadoras de proteínas, contíguas e na mesma fase de leitura.
Muitas vezes, essas construções também irão conter regiões 5' e 3'não traduzidas. Essas construções podem conter uma "seqüência sinal" ou "seqüência líder" para facilitar o transporte co-traducional ou pós-traducional do peptídeo de interesse para determinadas estruturas intracelulares, como o cloroplasto (ou outro plastídeo), retículo endoplasmático, ou aparelho de Golgi, ou a serem secretadas. Por exemplo, o gene pode ser projetado para conter um peptídeo sinal para facilitar a transferência do peptídeo para o retículo endoplasmático. Por "seqüência sinal" entende-se uma seqüência que é conhecida ou suspeita para resultar em transporte de peptídeo cotraducional ou pós-traducional através da membrana celular. Em eucariotos, esta normalmente envolve secreção no aparelho de Golgi, com alguma glicosilação resultante. Por "seqüência líder" entende-se qualquer seqüência que, quando traduzida, resulta em uma seqüência de aminoácidos suficientes para desencadear o transporte co-traducional da cadeia peptídica para uma organela sub-celular. Assim, esta inclui seqüências líder objetivando transporte e/ou glicosilação pela passagem para o retículo endoplasmático, passagem de vacúolos, plastídeos incluindo cloroplastos, mitocôndrias, e coisas do gênero. Também pode ser preferível a engenharia do cassete de expressão para conter um íntron, de tal forma que o
15
20 processamento do mRNA no íntron é necessário para a expressão.
Por "região 3' não traduzida" entende-se uma seqüência nucleotídica localizada a jusante da seqüência codificante. Seqüências sinal de poliadenilação e outras seqüências codificando sinais reguladores susceptíveis de afetar a adição de ácido poliadenílico para a extremidade 3' de precursores do mRNA são regiões 3' não traduzidas. Por "região 5' não traduzida" entende-se uma seqüência nucleotídica localizada a montante de uma seqüência codificante. Outros elementos não traduzidos a montante ou a jusante incluem promotores.
Promotores são seqüências nucleotídicas que agem no
sentido de aumentar a expressão de uma região promotora.
Promotores são bem conhecidos na técnica e incluem, mas não
estão limitados a, região promotora SV40 e elemento promotor 35S.
A região terminal pode ser nativa com a região de iniciação transcricional, pode ser nativa com a seqüência de resistência a herbicida da presente invenção, ou pode ser derivada de outra fonte. Regiões de terminação convenientes estão disponíveis a partir do plasmídeo-Ti de A. tumefaciens, tais como as regiões de terminação octopina sintase e nopalina sintase. Veja também Guerineau et al. (1991) Mol. Gen. Genet. 262: 141-144; Proudfoot (1991) Cell 64: 671-674; Sanfacon et al. (1991) Genes Dev. 5: 141-149; Mogm et al. (1990) Plant Cell 2: 1261-1272; Munroe et al. (1990) Gene 91: 151-158; Bailas et al. (1989) Nucleic Acids Res. 17: 7891- 7903; e Joshi et al. (1987) Nucleie Aeid Res. 15: 9627-9639.
Em um aspecto da invenção, seqüências de DNA sintéticas, são concebidas para um determinado polipeptídeo, como os polipeptídeos da invenção. A expressão da fase aberta de leitura da seqüência de DNA sintético numa célula resulta na produção do polipeptídeo da invenção. Seqüências de DNA sintéticas podem ser úteis para simplesmente remover sítios de restrição de endonuclease indesejados, para facilitar estratégias de clonagem do DNA, para alterar ou remover qualquer códon potencial, para modificar ou melhorar conteúdo GC, para remover ou alterar sítios fases de leitura, e/ou para alterar ou remover sítios de reconhecimento de íntron/exon, sítios de poliadenilação, seqüências Shine- Delgarno, elementos promotores não desejados e similares que podem estar presentes em uma seqüência de DNA nativo. Também é possível que seqüências sintéticas de DNA possam ser utilizadas para introduzir outras melhorias em uma seqüência de DNA, tais como a introdução de uma seqüência íntron, a criação de uma seqüência de DNA que, expressada como uma proteína de fusão de seqüências de organelas alvo, como peptídeos de trânsito do cloroplasto, apoplasto/peptídeos vacuolares alvo, ou seqüências de peptídeo que resultem na manutenção do peptídeo resultante no retículo endoplasmático. Genes sintéticos também podem ser sintetizados utilizando 4b / 75 códons preferenciais da célula hospedeira para uma melhor expressão, ou podem ser sintetizados utilizando códons de códons hospedeiros preferidos de freqüência útil. Ver, por exemplo, Campbell e Gowri (1990) Plant Physiol. 92: 1-11; Patente U.S. n« 6.320.100, 6.075.185, 5.380.831 e 5.436.391, Pedidos Publicados U.S. nos. 20040005600 e 20010003849, e Murray et ai. (1989) Nucleic Acids Res. 17: 477-498, aqui incorporados por referência.
Em uma concretização, os ácidos nucléicos de interesse são orientados para o cloroplasto para expressão. Desta forma, quando o ácido nucléico de interesse não está diretamente inserido no cloroplasto, o cassete de expressão irá conter adicionalmente um ácido nucléico codificando um peptídeo de trânsito para orientar o produto de gene de interesse para os cloroplastos. Tais peptídeos de trânsito são conhecidos na técnica. Ver, por exemplo, Von Heijne et al. (1991) Plant Mol. Biol. Rep. 9: 104-126; Clark et al. (1989) J. Biol. Chem. 264: 17544-17550; Della-Cioppa et al. (1987) Plant Physiol. 84: 965-968; Romer et al. (1993) Biochem. Biophys. Res. Commun. 196: 1414-1421; e Shah et al. (1986) Science 233: 478-481.
Os ácidos nucléicos de interesse a serem orientados para o cloroplasto podem ser otimizados para a expressão em cloroplasto para ter em conta as diferenças em um códon útil entre o núcleo da planta e esta organela. Desta forma, os ácidos nucléicos de interesse podem ser sintetizados utilizando códons de cloroplastos preferidos. Ver, por
exemplo, Patente U.S. No. 5.380.831, aqui incorporada por referência.
Normalmente este "cassete de expressão vegetal» será
inserido em um "vetor de transformação". Por "vetor de
transformação" entende-se uma molécula de DNA que é
necessária para uma transformação de uma célula. Essa
molécula pode ser constituída por um ou mais cassetes de
expressão, e pode ser organizada em mais de uma molécula de
DNA "vetor". Por exemplo, vetores binários são vetores de
transformação de plantas que utilizam dois vetores não
contíguos de DNA para codificar todas as funções eis- e
trans- de transformação de células vegetais (Hellens e
Mullineaux (2000) Trends in Plant Science 5: 446-451).
"Vetor" refere-se a uma construção de ácido nucléico
concebido para o transporte entre as diferentes células
hospedeiras. "Vetor de expressão" refere-se a um vetor que
tem a capacidade de incorporar, integrar e expressar
seqüências de DNA heterólogas ou fragmentos de uma célula externa.
Este vetor de transformação vegetal pode ser composto apenas por um ou mais vetores de DNA necessários para a realização da transformação de plantas. Por exemplo, é uma prática comum na técnica utilizar vetores de transformação de plantas que são compostos por mais de um segmento contíguo de DNA. Esses vetores são muitas vezes referidos no estado da
20
25 técnica como "vetores binários." Vetores binários, bem como vetores com plasmídios são mais freqüentemente utilizados para transformação mediada por Agrobacteriuml onde a dimensão e complexidade dos segmentos de DNA necessários para alcançar eficiente transformação são muito grandes, e é vantajoso para separar as funções em moléculas de DNA separadas. Vetores binários normalmente contêm um vetor de plasmideo que contém seqüências de ação eis- exigidas para a transferência T-DNA (como a borda esquerda e a borda direita) , um marcador selecionável que está projetado para ser capaz de expressar em uma célula vegetal, e um "gene de interesse" (um gene projetado para ser capaz de expressão em uma célula vegetal para geração de plantas transgênicas que é desejado) . Também presentes neste vetor plasmidial estão seqüências necessárias para a replicação bacteriana. As seqüências de ação cis- estão dispostas em uma forma eficiente para permitir a transferência em células vegetais e a expressão. Por exemplo, o gene marcador selecionável e o gene de interesse estão localizados entre as bordas esquerda e direita. Muitas vezes um segundo vetor plasmidial contém fatores de ação trans- que medeiam a transferência do T-DNA de Agrobacterium de células vegetais. Este plasmidio contém freqüentemente funções de virulência (genes Vir) que permitem a infecção das células vegetais por Agrobacterium, e a transferência de DNA pela clivagem nas seqüências da borda e transferência de DNA mediada por vir, como é entendida na técnica (Hellens e Mullineaux (2000) Trends in Plant Science, 5: 446-451) . Vários tipos de cepas de Agrobacterium (por exemplo, LBA4404, GV3101, EHAlOl, EHAlO5, etc) podem ser utilizadas para a transformação de plantas. 0 segundo vetor plasmidial não é necessário para transformar as plantas através de outros métodos, como microprojeção, microinjeção, eletroporação, polietileno glicol, etc.
Transformação vegetal
Métodos da invenção envolvem a introdução de uma construção de nucleotídeo em uma planta. Por "introdução" entende-se apresentar à planta a construção de nucleotídeo de forma a que os ganhos da construção acessem o interior de uma célula da planta. Os métodos da invenção não exigem que um determinado método para a introdução de uma construção de nucleotídeo em uma planta seja utilizado, só que a construção de nucleotídeo ganhe acesso no interior de, pelo menos, uma célula da planta. Métodos para introduzir construções de nucleotídeo em plantas são conhecidos na técnica, incluindo, mas não se limitando a, métodos de transformação estável, métodos de transformação transiente, e métodos mediados por vírus.
Em geral, métodos de transformação de plantas envolvem transferência heteróloga de DNA em células vegetais alvo (por exemplo, embriões imaturos ou maduros, culturas em suspensão, calos indiferenciados, protoplastos, etc), seguida pela aplicação de um nível limiar máximo adequado de seleção (em função do gene marcador selecionável e, neste caso "glifosato") para recuperar células vegetais transformadas de um grupo de massa celular não transformada. Explantes normalmente são transferidos para um novo suprimento do mesmo meio e cultivados rotineiramente. Posteriormente, as células transformadas são diferenciadas em brotações após a colocação do meio suplementado de regeneração com um limite de nível máximo de agente de seleção (por exemplo, "glifosato"). Os brotos são então transferidos para um meio seletivo de enraizamento para recuperar o enraizado ou as pequenas plantas. As pequenas plantas transgênicas então crescem em plantas maduras e produzem sementes férteis (por exemplo, Hiei et al. (1994) The Plant Journal 6: 271-282; Ishida et al. (1996) Nature Biotechnology 14: 745-750). Explantes normalmente são transferidos para um suprimento fresco do mesmo meio e cultivados rotineiramente. Uma descrição geral das técnicas e métodos para a geração de plantas transgênicas é encontrada em Ayres e Park (1994) Criticai Reviews in Plant Science 13: 219-239 e Bommineni e Jauhar (1997) Maydica 42: 107-120. Uma vez que o material transformado contém muitas células, ambas células transformadas e não transformadas estão presentes em qualquer parte do calo alvo ou tecido ou grupo de células objetivados. A capacidade de matar células não transformadas e permitir células transformadas para multiplicar resulta em culturas de plantas transformadas. Muitas vezes, a capacidade de eliminar células não transformadas é uma limitação para recuperação rápida de células vegetais transformadas e para geração bem sucedida de plantas transgênicas. Métodos bioquímicos e moleculares podem então ser utilizados para confirmar a presença do gene de heterólogo integrado de interesse no genoma da planta transgênica.
A geração de plantas transgênicas pode ser realizada por um de vários métodos, incluindo, mas não limitados a introdução de DNA heterólogo por Agrobacterium em células vegetais (transformação mediada por Agrobacterium) , bombardeamento de células vegetais com DNA heterólogo externo aderido às partículas, e vários outros métodos mediados diretamente por não-partículas (por exemplo, Hiei et al. (1994) The Plant Journal 6: 271-282; Ishida et al. (1996) Nature Biotechnology 14: 745-750; Ayres e Park (1994) Criticai Reviews in Plant Science 13: 219-239; Bommineni e Jauhar (1997) Maydica 42: 107 - 120) para transferir DNA.
Métodos de transformação de cloroplastos são conhecidos no estado da técnica. Ver, por exemplo, Svab et al. (1990) Proc. Natl. Acad. Sei. E.U.A. 87: 8526-8530; Svab e Maliga (1993) Proc. Natl. Acad. Sei. E.U.A. 90: 913-917; Svab e Maliga (1993) EMBO J. 12: 601-606. 0 método baseia-se na descarga de partícula de DNA contendo um marcador selecionável e alvo do DNA para o genoma plastidial através de recombinação homóloga. Além disso, transformação plastidial pode ser realizada através de uma transativação do transgene do plastídeo silencioso por expressão de um tecido preferido de uma RNA polimerase plastídeo-dirigida e núcleo- codificada. Esse sistema tem sido relatado em McBride et al. (1994) Proc. Natl. Acad. Sei. E.U.A. 91: 7301-7305.
As células que foram transformadas em plantas podem ser cultivadas de acordo com as formas convencionais. Ver, por exemplo, McCormick et al. (1986) Plant Cell Reports 5: 81-84. Estas plantas podem então ser cultivadas, por polinização com a mesma linhagem transformada ou diferentes linhagens, e os híbridos resultantes tendo expressão constitutiva de característica fenotípica pretendida identificada. Duas ou mais gerações podem ser cultivadas para garantir que a expressão das características fenotípicas desejadas seja mantida estável e herdável e, em seguida, as sementes colhidas a fim de garantir que a expressão das características fenotípicas pretendidas tenha sido alcançada. Desta forma, a presente invenção prevê semente transformada (também referida como "semente transgênica") , com uma construção de nucleotídeo da invenção, por exemplo, um cassete de expressão da invenção, estavelmente incorporado em seu genoma.
Plantas
A presente invenção pode ser utilizada para a transformação de qualquer espécie vegetal, incluindo mas não limitadas a, monocotiledôneas e dicotiledôneas. Exemplos de plantas de interesse incluem, mas não estão limitados a, milho, sorgo, trigo, girassol, tomate, crucíferas, pimentão, batata, algodão, arroz, soja, beterraba, cana-de-açúcar, tabaco, cevada e colza, Brassica sp., alfafa, centeio, milheto, cártamo, amendoim, batata doce, mandioca, café, coco, abacaxi, citricos, cacau, chá, banana, abacate, figo, goiaba, manga, azeitona, mamão, caju, macadâmia, amêndoa, aveia, legumes, plantas ornamentais, e coníferas.
Vegetais incluem, mas não estão limitados a, tomate, alface, feijão verde, feijões, ervilhas, e os membros do gênero Curcumis tais como pepino, melão, melancia e almiscar. Plantas ornamentais incluem, mas não estão limitadas a, azaléia, hortência, hibisco, rosas, tulipas, narcisos, petúnias, cravo, poinsétia e crisântemo. Preferencialmente, as plantas da presente invenção são espécies vegetais (por exemplo, milho, sorgo, trigo, girassol, tomate, crucíferas, pimentão, batata, algodão, arroz, soja, beterraba, cana-de- açúcar, tabaco, cevada, colza, etc).
Esta invenção é particularmente adequada para qualquer membro da família de plantas monocotiledôneas, incluindo, mas não se limitando a, milho, arroz, cevada, aveia, trigo, sorgo, centeio, cana-de-açúcar, abacaxi, batata doce, cebola, banana, coco, e as palmas.
Avaliação da Transformação Vegetal
Após a introdução de DNA heterólogo externo em células vegetais, a transformação ou integração de genes heterólogos no genoma vegetal é confirmada por vários métodos, como a análise de ácidos nucléicos, proteínas e metabólitos associados com o gene integrado.
Análise por PCR é iam método rápido de selecionar células transformadas, tecidos ou brotos para a presença de genes incorporados na fase anterior, antes do transplante para o solo (Sambrook e Russell (2001) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) . A PCR é realizada utilizando oligonucleotídeos iniciadores específicos para o gene de interesse ou vetor Agrobacterium, etc.
A transformação vegetal pode ser confirmada por análise de Southern blot do DNA genômico (Sambrook e Russell, 2001, supra). Em geral, o DNA total é extraído do transformante, digerido com enzimas restrição apropriadas, fracionado em um gel de agarose e transferido para uma membrana de nitrocelulose ou nylon. A membrana ou "mancha" é, então, analisada, por exemplo, com fragmentos de DNA alvo radiomarcados com 32P para confirmar a integração do gene introduzido no genoma vegetal, de acordo com as técnicas padrão (Sambrook e Russell, 2001, supra). Na análise Northern, o RNA é isolado a partir de tecidos específicos de transformantes, fracionado em um gel de formaldeído agarose, manchado em um filtro de nylon de acordo com procedimentos padrão que são rotineiramente utilizados na técnica (Sambrook e Russell, 2001, supra). A expressão de RNA codificado por grg25, grg26, grg27, grg28, grg29, grg30, gfg31, syngrg25, syngrg26, syngrg27, syngrg28, syngrg29, syngrg30, e syngrg31 é, então, testada por hibridização do filtro para uma sonda radioativa proveniente de um polinucleotídeo da invenção, através de métodos conhecidos na técnica (Sambrook e Russell, 2001, supra).
Western Blot e testes bioquímicos e semelhantes podem ser realizados sobre as plantas transgênicas para determinar a presença da proteína codificada pelo gene de resistência a herbicida por procedimentos padrões (Sambrook e Russell, 2001, supra), utilizando anticorpos que se ligam a um ou mais epítopos presentes na proteína de resistência a herbicida.
Métodos para o aumento da produção vegetal
Métodos para aumentar as características de produção de plantas são fornecidos. Os métodos incluem introdução em uma planta ou uma célula vegetal de polinucleotídeo compreendendo uma seqüência grg descrita aqui. Tal como definido aqui, o "rendimento" da planta se refere à qualidade e/ou à quantidade de biomassa produzida pelas plantas. Por "biomassa" entende-se qualquer medida de produto vegetal. Um aumento na produção de biomassa é uma melhora no rendimento medido do produto vegetal. 0 aumento de produção vegetal tem várias aplicações comerciais. Por exemplo, o aumento da biomassa vegetal foliar pode aumentar o rendimento das hortaliças folhosas para consumo humano ou animal. Adicionalmente, o aumento da biomassa foliar pode ser usado para aumentar a produção de produtos farmacêuticos ou industriais derivados de plantas. Um aumento no rendimento pode incluir qualquer aumento estatisticamente significativo, incluindo, mas não se limitando a, pelo menos um aumento de 1%, pelo menos um aumento de 3%, pelo menos um aumento de 5%, pelo menos um aumento de 10%, pelo menos um aumento de 20%, pelo menos um aumento de 30%, pelo menos um de 50%, pelo menos um de 70%, pelo menos um de 100% ou um aumento maior.
Nos métodos específicos, a planta é tratada com uma concentração efetiva de um herbicida, onde a aplicação do herbicida resulta numa maior produtividade vegetal. Por "concentração efetiva" é entendido a concentração que permite o aumento da produtividade na planta. Essas concentrações eficazes de herbicidas de interesse geralmente são conhecidas na técnica. O herbicida pode ser aplicado pré- ou pós- emergência, de acordo com técnicas usuais para a aplicação de herbicida compreendendo culturas que têm sido tornadas resistentes ao herbicida pela expressão heteróloga de um gene grg da invenção.
Métodos para conferir resistência a um herbicida em uma planta ou parte vegetal são também fornecidos. Nestes métodos, \im polinucleotídeo grg descrito aqui é introduzido na unidade, onde a expressão dos polinucleotídeos resulta em tolerância ou resistência ao glifosato. Plantas produzidas por este método podem ser tratadas com uma concentração efetiva de um herbicida e exibirem uma maior tolerância ao herbicida. Uma "concentração efetiva" de um herbicida no presente pedido é uma quantidade suficiente para desacelerar ou parar o crescimento de plantas ou de partes das plantas que não são naturalmente resistentes ou tornadas resistentes ao herbicida.
Em outra concretização, métodos para conferir resistência a um herbicida em uma planta ou partes de plantas são fornecidos, onde a planta ou parte da planta é cultivada sob temperatura superior ou inferior à ambiental, como descrito acima. Enzimas EPSP sintase tolerantes ao glifosato com estabilidade térmica em temperaturas altas ou baixas, ou ter temperatura ótima em maior ou menor temperatura, são úteis para conferir tolerância ao glifosato nas plantas que são cultivadas em tais condições.
Métodos de controle de plantas daninhas em um campo
Métodos para controlar seletivamente ervas daninhas em
um campo contendo uma planta também são fornecidos. Em uma concretização, as sementes de plantas ou plantas são resistentes ao glifosato como resultado de um polinucleotídeo grg descrito aqui sendo inserido nas sementes de plantas ou plantas. Nos métodos específicos, a planta é tratada com uma concentração efetiva de um herbicida, onde a aplicação do herbicida resulta em um controle seletivo de ervas daninhas ou outras plantas não transformadas. Por "concentração efetiva" entende-se a concentração que controla o crescimento ou a propagação de plantas daninhas ou outras plantas não transformadas sem afetar significativamente a planta ou a sementes das plantas resistentes ao glifosato. Essas concentrações eficazes de herbicidas de interesse geralmente são conhecidas no estado da técnica. O herbicida pode ser aplicado pré- ou pós-emergência, de acordo com técnicas usuais para aplicação de herbicida nos campos compreendendo plantas ou sementes de plantas que tenham sido tornadas resistentes ao herbicida.
Os exemplos seguintes são oferecidos a título de ilustração e não por meio de limitação.
EXPERIMENTAL
Exemplo 1: Isolamento de ATX8909
ATX8909 foi isolado por plaqueamento de amostras de solo em Meio HEPES Mineral Salts (HMSM) contendo glifosato como a única fonte de fósforo. Desde que HMSM não contém aminoácidos aromáticos, uma estirpe deve ser resistente ao glifosato a fim de crescer sobre este meio.
Dois gramas de solo foram suspensos em aproximadamente ml de água, vortexado durante 15 segundos e permitido liquidar durante 15 minutos. Uma alçada de ΙΟμΙ desta suspensão foi adicionada a 3ml de HMSM suplementado com 10 inM de glifosato (pH 7,0). 0 HMSM contém (por litro): IOg de glicose, 2g de NH4SO4, 9,53g de HEPES, l,0ml 0,8M de MgSO4, l,0ml 0, IM de CaCl2, IfOml de Trace Elements Solution (em IOOml de solução IOOOx: 0,lg de FeSO4.7H20, 0. 5mg de CuSO4. SH2O, IfOmg de H3B03, IfOmg de MnS04.SH20, 7, Omg de ZnSO4.7H20f IfOmg de MoO3f 4f0g de KCl) . A cultura foi cultivada em uma incubadora com agitador por quatro dias a 28°C e em seguida 20μ1 foi usado para inocular 2f5ml de HMSM fresco contendo IOmM de glifosato como a única fonte de fósforo. Após dois dias, 20μ1 foi usado para inocular 2,5ml de outra cultura fresca. Após 5 dias, 20μ1 foi usado para inocular 2,5ml de uma nova cultura. Após crescimento suficiente, a cultura foi plaqueada em meios sólidos por estriamento com alça com Ιμΐ sobre a superfície de placas de ágar contendo ágar HMSM contendo 10OmM de glifosato como a única fonte de fósforo e armazenados a 28°C. A cultura foi então replaqueada para isolamento. Uma estirpe, designada ATX8909, foi escolhida devido a sua capacidade de crescer na presença de altas concentrações de glifosato.
As cepas ATX1367, ATX1394, ATX21307, ATX21310, ATX21315 e ATX21318 foram isoladas, como descrito acima e foram colocadas para crescer em iam meio líquido mínimo contendo até 300 mm de glifosato. Cada uma das cepas foi testada por sequenciamento 16S de rDNA ou pelo teor de ácidos graxos por métodos conhecidos na técnica para identificar a estirpe. As identificações das estirpes são apresentadas na Tabela 1: Tabela 1.
Nome da Cepa ID da Cepa Nome do gene EPSP sintase ATX8909 Arthrobacter arilait grg25 ATX21307 Arthrobacter ramosus grg26 ATX21310 Gram+ (nenhuma correspondência a database MIDI) grg27 ATX21315 Arthrobacter ureafaciens grg28 ATX1367 Paenibacillus pabuli grg29 ATX1394 Paenibaeillus pabuli grg30 ATX21318 Sphingobacterium multivorum/faeeium grg31
Exemplo 2. Clonagem de glvphosate-resistente EPSP sintases
0 DNA genômico foi extraído das cepas descritas na Tabela Ieo DNA resultante foi parcialmente digerido com enzima de restrição Sau3A 1 para produzir fragmentos de DNA com aproximadamente 5 kilobases de tamanho. Estas moléculas de DNA foram selecionadas com base no tamanho nos géis de agarose, purificadas e ligadas em partes de vetores LAMBDA ZAP (R) pré-digeridos com BamH I. As partes de vetores ligadas foram então embaladas em partículas fago, e fagos determinados como conhecido no estado da técnica. As bibliotecas resultantes foram amplificadas através de métodos conhecidos na técnica para gerar uma biblioteca de títulos entre 3 χ IO7 e 3 χ IO8 PFLVmL. Para cada biblioteca independente, E. coli (XLl Blue MRF') foi então co- transfectada com fagos a partir de uma biblioteca amplificada, bem como por fago auxiliar M13 para permitir a excisão em massa da biblioteca, sob a forma de um ssDNA circular infectante como conhecido na técnica (Short et al. (1988) Nucleic Acids Research 16: 7583-7600). Após centrifugação das células co-infectadas, o sobrenadante contendo o fago foi aquecido a 65-70°C durante 15-20 minutos, para neutralizar qualquer resíduo de partículas fago lambda. Diluições da biblioteca plasmidial resultante de ssDNA foram transfectadas em uma cultura fresca de células de E. coli competente XL-Blue MRF' (aroA) (XLl Blue MRF'). As células transfectadas resultantes foram plaqueadas em placas M63 contendo kanamicina, 0,1 mM de IPTG e OmM, 20mM ou 50mM de glifosato.
A E. coli XL-Blue MKF' (aroA) utilizada para a transfecção expressa a F-pilus, e também contém uma supressão do gene aroA que codifica a enzima EPSP sintase endógena de E. coli. Esta estirpe é também referida aqui como AaroA. Esta estirpe AaroA não é capaz de crescer em meios mínimos sem aminoácidos aromáticos, a não ser complementado por uma EPSP sintase funcional. Desde que o glifosato é um potente inibidor de EPSP sintases sensíveis ao glifosato típicas, tais como EPSP sintases tipo I, clones transf ectados expressando uma EPSP sintase não-resistente ao glifosato seria capaz de cultivar em placas M63 sem glifosato, mas seria incapaz de crescer em M63 contendo 2 OmM ou 5OmM de glifosato. A fim de crescer em placas M63 contendo 20mM ou 50mM de glifosato, as células devem conter um plasmídeo que expressa uma EPSP sintase que é ambos (1) capaz de cl / 7 5 complementar a mutação AaroA destas células, e (2) resistente ao glifosato. Assim, este método de rastreio permite a identificação de clones contendo EPSP sintases resistentes ao glifosato.
Colônias crescendo em 20mM ou 50mM de glifosato foram colhidas e seus plasmídios analisadas por digestão de restrição para identificar plasmídios que partilham padrões de restrição. Plasmídios individuais foram sequenciados por métodos conhecidos na técnica, com a preferência dada a plasmídios que conferem resistência a 50mM de glifosato.
Usando esta abordagem, como por vezes modificada para cada biblioteca como conhecida e apreciada na técnica, bibliotecas de clones contendo genes EPSP sintase foram identificadas para cada uma das sete cepas da Tabela 1.
Exemplo 3. Seqüências de DNA e proteínas EPSP sintases
As seqüências de DNA de EPSP sintases resistentes ao glifosato foram determinadas para cada um dos clones na Tabela 2 por métodos bem conhecidos na técnica.
grg25. A seqüência de DNA de grg25 é fornecida aqui como SEQ ID NO: 1. O produto da tradução previsto de grg25 (GRG2 5) é fornecido aqui como SEQ ID NO: 2. 62 , 7 5 grg26. A seqüência de DNA de grg26 é fornecida aqui como SEQ ID NO: 3. O produto da tradução previsto de grg26 (GRG26) é fornecido aqui como SEQ ID NO: 4.
grg27. A seqüência de DNA de grg27 é fornecida aqui como SEQ ID NO: 5. O produto da tradução previsto de grg27 (GRG27) é fornecido aqui como SEQ ID NO: 6.
gfg28. A seqüência de DNA de grg28 é fornecida aqui como SEQ ID NO: 7. 0 produto da tradução previsto de grg28 (GRG2 8) é fornecido aqui como SEQ ID NO: 8.
grg29. A seqüência de DNA de grg29 é fornecida aqui como SEQ ID NO: 9. 0 produto da tradução previsto de grg29 (GRG29) é fornecido aqui como SEQ ID NO: 10.
grg30. A seqüência de DNA de grg30 é fornecida aqui como SEQ ID NO: 11. O produto da tradução previsto de grg30 (GRG30) é fornecido aqui como SEQ ID NO: 12.
grg31. A seqüência de DNA de grg31 é fornecida aqui como SEQ ID NO: 13. O produto da tradução previsto de grg31 (GRG31) é fornecido aqui como SEQ ID NO: 14.
syngrg31. A seqüência de DNA sintético de syngrg31 é fornecida aqui como SEQ ID NO: 28. O produto da tradução previsto de syngrgl é idêntico ao de grg31, e é fornecido aqui como SEQ ID NO: 14. syngrg2 5. A seqüência de DNA sintético de syngrg25 é fornecida aqui como SEQ ID NO: 29. 0 produto da tradução previsto de syngrgl é idêntico ao de grg25, e é fornecido aqui como SEQ ID NO: 2.
syngrg26. A seqüência de DNA sintético de syngrg26 é fornecida aqui como SEQ ID NO: 30. O produto da tradução previsto de syngrgl é idêntico ao de grg26, e é fornecido aqui como SEQ ID NO: 4.
syngrg27. A seqüência de DNA sintético de syngrg27 é fornecida aqui como SEQ ID NO: 31. O produto da tradução previsto de syngrgl é idêntico ao de grg27, e é fornecido aqui como SEQ ID NO: 6.
syngrg28. A seqüência de DNA sintético de syngrg28 é fornecida aqui como SEQ ID NO: 32. 0 produto da tradução previsto de syngrgl é idêntico ao de grg28, e é fornecido aqui como SEQ ID NO: 8.
syngrg29. A seqüência de DNA sintético de syngrg29 é fornecida aqui como SEQ ID NO: 33. O produto da tradução previsto de syngrgl é idêntico ao de grg29, e é fornecido aqui como SEQ ID NO: 10.
syngrg30. A seqüência de DNA sintético de syngrg30 é fornecida aqui como SEQ ID NO: 34. O produto da tradução previsto de syngrgl é idêntico ao de grg30, e é fornecido aqui como SEQ ID NO: 12.
Clones contendo cada um dos genes EPSP sintase grg25, grg26, grg27, grg28, grg29, grg30, e grg31 foram depositados em NRRL, e atribuiu depósito números como na Tabela 2.
Tabela 2. Clones contendo EPSP sintases resistentes ao glifosato
EPSPS Cepa com EPSPS Isolado original em pBKCMV Número NRRL GRG25 ATX8909 PAX1932 NRRL B-30911 GRG2 6 ATX21307 PAX1933 NRRL B-30912 GRG27 ATX21310 PAX1934 NRRL B-30913 GRG28 ATX21315 PAX1935 NRRL B-30914 N GRG31 ATX21318 PAX1936 NRRL B-30915 GRG30 ATX1394 PAX1937 NRRL B-30916 N GRG29 ATX1367 PAX1938 NRRL B-30917 N
Cada uma das proteínas GRG25 - GRG31 mostrou homologia com enzimas EPSP sintase na base de dados NCBI pela pesquisa BLAST. A enzima EPSPS com a maior identidade de seqüência protéica a cada enzima GRG está listada na tabela a seguir. 65 /' 75 Tabela 3. Homologia de GRG25-GRG31 para as EPSP sintases conhecidas
Proteína Cepa com enzima EPSP sintase homóloga % de identidade GRG25 Nocardia farcinica 50, 5 GRG26 Arthrobacter sp. FB24 82,9 GRG27 Arthrobacter sp. FB24 78 GRG28 Arthrobacter sp. FB24 81,4 GRG29 Symbiobacterium thermophilum 51, 6 GRG30 Symbiobacterium thermophilum 51,3 GRG31 Bacteroides fragilis 43,3
Exemplo 4. Clonagem de novas EPSP sintases resistentes ao glifosato em um vetor de expressão de E. coli
Os genes EPSP sintase contidos nos clones da Tabela 2 foram sub-clonados no vetor de expressão de E. coli pRSFlb (Invitrogen). Clones resultantes foram confirmados pelo sequenciamento de DNA, e utilizados para induzir a expressão de cada EPSP sintase de E. coli. A proteína His-tagged expressa foi, então, purificada tal como é conhecido no estado da técnica.
Exemplo 5. Resistência ao glifosato de EPSP sintases
Os clones pRSFlb foram plaqueados em para placas M63+ contendo antibiótico e OmM ou 50mM de glifosato. 0 crescimento foi avaliado após dois dias de um crescimento a 37 0C. Todas as sete EPSP sintases foram observadas para conferir resistência a 50mM de glifosato em células de E. coli (Tabela 4).
Tabela 4. Painel de glifosato
EPSPS Clone em pRSFlB Crescimento em 50mM de glifosato Vetor _ GRG25 PAX1939 +++ GRG26 PAX1940 +++ GRG27 PAX1941 +++ GRG28 PAX1942 +++ GRG30 PAX1943 +++ GRG29 PAX1944 +++ GRG31 PAX1945 +++ Exemplo 6. A temperatura ótima da atividade enzimática de
GRG31
Um vetor que coloca expressão de GRG31 sob o controle do promotor viral T7 foi construído (pAX3535) e utilizado para transformar uma estirpe de E. coli possuindo o gene viral T7 imediatamente 3' de um promotor de lactose induzível. Após indução de IPTG, a proteína GRG31 foi purificada à homogeneidade por métodos padrões. Para medir a atividade enzimática, a enzima GRG31 purificada foi diluída para uma análise adequada da concentração em tampão contendo HEPES (50 mM, pH 7) e 50 UM de KCl, e, em seguida, incubada durante 15 minutos em cada 10, 20, 30, 40, 50 ou 60°C. Após a incubação, a enzima foi aquecida a 90°C por 1 minuto de desnaturação da enzima e, em seguida, resfriada a 4°C. O fosfato gerado por cada reação foi então adicionado a um segundo ensaio contendo inosina, nucleosídeo fosforilase purina, xantina oxidase, peroxidase rábano silvestre, e o substrato fluorescente AMPLEX (R) Vermelho (Pedido de Patente U.S. No. 60/741.166, depositado em 1 de dezembro de 2005). Após incubação por 15 minutos em temperatura ambiente, o produto fluorescente foi quantificado utilizando um espectrofluorômetro Gemini XPS (Molecular Devices Corporation, Sunnyvale, CA) . A formação do produto EPSP sintase foi avaliada, e é expressa na Tabela 5, como uma percentagem de atividade máxima.
Tabela 5. Temperatura ótima para GRG31
Temperatura 0C Percentagem de atividade máxima 42% 62% 69% 40 80% 50 100% 60 96% 70 67% 80 36%
Exemplo 7. Estabilidade térmica da atividade enzimática de GRG31
Um vetor que coloca expressão de GRG31 sob o controle do promotor viral T7 foi construído (pAX3535) e utilizado para transformar uma estirpe de E. coli possuindo o gene viral T7 imediatamente 3' de um promotor induzivel de lactose. Após indução de IPTG, a proteína GRG31 foi purificada à homogeneidade por métodos padrões. Para medir a atividade enzimática, a enzima GRG31 purificada foi diluída para uma análise adequada da concentração em tampão contendo HEPES (50 mM, pH7) e 50 niM de KCl, e então incubada a 370C por 0, 2, 6 ou 22 horas. Uma amostra controle foi incubada juntamente a 4°C. Em cada ponto de tempo, uma alíquota de cada amostra foi removida e ensaios enzimáticos foram realizados em um volume final de 50 μΐ contendo 0,5mM de chiquimato-3-fosfato, 200uM de fosfoenolpiruvato-(PEP) , lu/ml de xantina oxidase, 2U/ml de nucleosídeo fosforilase, 2,25mM de inosina, lu/ml de peroxidase horseradish, 2mM de glifosato, 50mM de HEPES/KOH PH 7,0, IOOmM de KCl, e AMPLEX® Vermelho (Invitrogen) , de acordo com as instruções do fabricante. Os ensaios foram iniciados pela adição do chiquimato-3-fosfato. A atividade da EPSP sintase foi medida utilizando um espectrômetro de fluorescência Spectramax Gemini XPS (Molecular Dynamics, excitação: 555nm; emissão: 590 nm). A estabilidade térmica da EPSP sintase foi calculada como o percentual de atividade enzimática em cada ponto de tempo a 3 7 0C em relação à atividade enzimática na amostra controle incubada juntamente a 4°C (Tabela 6). Tabela 6. Estabilidade térmica de GRG31
Tempo, Percentagem de horas controle 0 100% 2 86% 6 68% 22 29% I
Exemplo 8. Engenharia de çrrg25. grg26, arq27, qra28. ara29.
SISHl-Slãàl_e_syngrg25, syngrg26, syngrg27, syngrcj28.
syngrg29, syngrg30. e syngrq31 para Transformação Vegetal
A fase aberta de leitura (ORF) para cada um dos genes grg ê amplificado por PCR a partir de um modelo de cDNA de comprimento total. Sítios de restrição Hind III são adicionados a cada extremidade da ORF durante a PCR. Adicionalmente, a seqüência nucleotídica ACC é adicionada imediatamente na extremidade 5' para o códon de início do gene para aumentar a eficiência traducional (Kozak (1987) Nucleic Acids Research 15: 8125-8148; Joshi (1987) Nucleic Acids Research 15: 6643-6653). 0 produto da PCR é clonado e sequenciado, usando técnicas bem conhecidas no estado da técnica, a fim de assegurar que nenhuma mutação seja introduzida durante a PCR. 0 plasmídio contendo o produto grg da PCR é digerido, por exemplo, com Hind III e o fragmento contendo o ORF intacto é isolado. Podem-se gerar construtos similares que contêm uma seqüência do cloroplasto alvo ligada ao polinucleotídeo da invenção por métodos conhecidos no estado da técnica.
Um fragmento de DNA contendo a EPSP sintase (e, ainda contendo ou não contendo uma seqüência do cloroplasto alvo) é clonado em um plasmídeo, por exemplo, no sítio Hind Iii de PAX200. ΡΑΧ200 é um vetor de expressão vegetal que contém o promotor actina de arroz (McElroy et al. (1991) Molec. Gen. Genet. 231: 150-160), e o terminador PinIII (An et al. (1989) The Plant Cell 1: Il5 -122). 0 fragmento promotor-gene- terminador (ou o fragmento promotor-líder-gene-terminador) a partir deste plasmídio intermediário é subclonado em um plasmídeo, como pSBll (Japan Tobacco, Inc.) para formar um plasmídeo final, aqui referido como, por exemplo, pSBHGRG25. PSB11GRG25 é organizado tal como um fragmento de DNA contendo, por exemplo, a construção promotor-grg25-terminador (ou a construção promotor-líder-grg25-terminador), e podem ser excisados por enzimas de restrição adequadas e também utilizados para transformação de plantas, por exemplo , por feixe de injeção aerossol. A estrutura do pSBllGRG25 é verificada pela digestão por restrição e eletroforese em gel, bem como pelo sequenciamento entre os diversos cruzamentos da clonagem. Os mesmos métodos podem ser utilizados para gerar um plasmídio final para cada um dos genes grg aqui descritos. 0 plasmídio é mobilizado em Agrobacterium tumefaciens estirpe LBA4404 que também abriga o plasmídeo pSBl (Japan Tobacco, Inc.), utilizando procedimentos triparentais de acasalamento 7 χ / 7 5 bem conhecidos no estado da técnica, e plaqueamento em meio contendo antibiótico. Plasmid pSBl 1GRG25 transporta espectinomicina resistência, mas é uma estreita faixa plásmido acolhimento e não pode replicar em Agrobacterium.
Resistentes aos antibióticos colônias surgem quando PSB11GRG25 integra-se na ampla gama de hospedeiros do plasmídio pSBl através de recombinação homóloga. 0 produto cointegrado resultante é verificado por hibridação de Southern. A estirpe de Agrobacterium abrigando o cointegrado pode ser utilizada para transformar milho, por exemplo, pelo método PureIntro (Japan Tobacco).
Exemplo 9. Transformação de grg25, grg26, grg27, grg28, grg29, grg30, grg31, syngrg25, syngrg26, syngrg27, syngrg28, syngrg29, syngrg30, e syngrg31 em células vegetais
Espigas de milho são melhor colhidas 8-12 dias após a polinização. Embriões são isolados das espigas, e os embriões de tamanho 0,8-l,5mm são preferidos para uso em transformação. Embriões são plaqueados com o escutelo para cima sobre um meio de incubação adequado, tais como meio DN62A5S (3,98 g/L de Sais N6; lmL/L de Vitaminas N6 (de IOOOx de Solução estoque) ; 800 mg/L de L-asparagina; 100 mg/L de Mio-inositol, l,4g/L de L-prolina, lOOmg/L de ácidos Casamino; 50g/L de sacarose; lmL/L (de 1 mg/ml de estoque) 2,4-D). No entanto, meio e sais outros que DN62A5S que são adequados são conhecidos no estado da técnica. Embriões são incubados por toda a noite a 25°C no escuro. No entanto, não
20
25 e necessario, por si so incubar os embri5es durante toda a noite.
Os explantes resultantes s3o transferidos para uma malha quadrada (30-40 por placa), transferidos para meios osm0ticos por cerca de 30-45 minutos e, em seguida, transferidos para uma placa feixeada (ver, por exemplo, Publicagao PCT No. W0/0138514 e Patente U.S. n«. 5.240.842).
Constru?5es de DNA concebidos para expressar proteinas
GRG da presente invengSo em c^lulas vegetais s3o acelerados em tecido vegetal utilizando urn feixe de aerossol acelerador, utilizando essencialmente condig5eS/ como descritas na Publicagao PCT No. WO/0138514. Ap0s ο enfeixamento, os embriaes sao incubados por cerca de 30 minutos sobre meios osm0ticos, e colocados no meio de incubagao por toda a noite, a 25°C no escuro. Para evitar danificar os explantes, estes sao incubados por pelo menos 24 horas antes da transferencia para ο meio de recuperagao. Os embriSes s3o entao espalhados em meio para um periodo de recuperagSo, por cerca de 5 dias, a 25°C, no escuro, e em seguida, transferidos para um meio de selegao. Explantes s3o incubados em meios de selegao para por at^ oito semanas, dependendo da natureza e caracteristicas de cada selegao utilizada. Ap6s ο periodo de selegao, ο calo resultante έ transferido para ο meio de matura?3o de embriao, at^ a formagao de embrides somdticos maduros ser observada. Os embri5es somdticos maduros resultantes sSlo entao colocados sob baixa luminosidade, e ο processo de regeneragSo ά iniciado atraves de metodos conhecidos no estado da tecnica. Os turiSes resultantes s3o possibilitados de eniraizar sobre ο meio de enraizamento, e as plantas resultantes sSo transferidas para potes creches e propagadas como plantas transgenicas.
Materials
Tabela 7. Meio DN62A5S
Componentes Por litro Amostra Mistura de Sal Basal Chu's N6 (Prod. No. C 416) 3,98g/L Phytotechnology Labs Solugao de Vitamina Chu's N6 (Prod. No. C 149) lmL/L (de Estoque IOOOx) Phytotechnology Labs L-asparagina 800mg/L Phyto technology- Labs Mio-inositol lOOmg/L Sigma L-prolina l,4g/L Phytotechnology Labs Acidos Casamino lOOmg/L Fisher Scientific Sucrose 50g/L Phytotechnology Labs 2,4-D (Prod. No. D- 7299) lmL/L (de Img/mL de Estoque) Sigma O pH da solugao e ajustado para pH5,8 com IN de K0H/1N de KCl, Gelrite (Sigma) e adicionado a uma concentragao de ate 3g/L, e ο meio έ autoclavado. Apos arrefecimento a 50°C, 2ml/L de um 5mg/ml de solu?ao estoque de nitrate de prata (Phytotechnology Labs) έ adicionado.
Exempl0 10. Transformacao de 卿25, ara26, Qrcr27. ara2R. grg29' grg3°' <^rg31, svnarg25, synara26, syngrcr27, synQrg28. syngrg29,__ou syncfrcr31 em celulas veqetais de Milho Por Transformacao Mediada por Aarobacterium
Espigas sao melhor colhidas 8-12 dias ap0s a polinizagao. EmbriSSes s3o isolados das espigas, e os embri5es de tamanho 0,8-1,5mm s3o preferidos para uso em transformagao. Embriaes sSo plaqueados com escutelo para cima -5 sobre um meio de incubagSo adeguado, e incubados por toda a noite a 25。C no escuro. No entanto, η3ο ό necessario, por si 80 incubar os embriSes durante toda a noite. EmbriSes s3o contatados com uma estirpe de Agrobacterium contendo os vetores apropriados de transferencia mediada por plasmidio Ti O por cerca de 5-10 minutos, e entao plaqueados em meio de co-
Cultivo durante cerca de 3 dias (25。C no escuro)· Depois do co-cultivo, os explantes sao transferidos para um meio para um periodo de recuperagSo por cerca de cinco dias (a 25。C no escuro). Explantes sao incubados em meios de selegSo por at0 oito semanas' dependendo da natureza e caracteristicas de cada selegao utilizada. Ap0s ο period。 de selegSo, ο calo resultante e transferido para ο meio de maturagao de eitibriao, at^ a forma^ao de embriSes somdticos maduros ser observada. Os embri5es somaticos maduros resultantes sao entSo colocados sob baixa luminosidade, e ο processo de regenera?ao έ iniciado como conhecido no estado da t^cnica. Os turi5es resultantes s3o possibilitados de enraizar em um meio de enraizamento, e as plantas resultantes s3o transferidas para potes creches e propagadas como plantas transgenicas.
Todas as publicagaes e pedidos de patentee mencionados na especificagao s3o indicativos do nivel de habilidade das
pessoas versadas na t^cnica k Qtual pertence esta invengao. Todas as publica?Ses e pedidos de patentes s3o aqui incorporados por referenda k mesma medida, como se cada publicagao ou pedido de patente fosse especificamente e individualmente indicado para ser incorporado como referencia.
Apesar de a invencao exposta ter sido descrita em algum detalhe a titulo de ilustra?ao e de exemplo para fins de clareza de entendimento, serd evidente que algumas modifica?Ses e alterag5es possam ser praticadas no ambito das reivindicagSes anexas. gcg Ala
ctg Leu
gcc Ala
get Ala
ttc Phe 95
C y g 1 g G
288
ate
lie
age Ser
cgc
Arg
gac Asp
acc Thr 85
gaa
Glu
ctg Leu
atg
Met
ctc Leu
Listagem de Sequencias
<110> Depositante: Athenix Corporation Brian Vande Berg Cheryl Peters Brian Carr Daniel John Tomso
<120> Titulo da invengao: Molecula de acido nucleico e polipeptideo isolados, vetor, celula hospedeira, planta transgenica, semente, metodos para produzir um polipeptideo com atividade de resistencia a herbicida, para conferir resistencia a um herbicida em uma planta, para gerar uma variante de polinucleotideo, para aumentar ο vigor ou ο rendimento em uma planta, e para conferir resistencia a glifosato em uma planta
<130> Referencia do documento: 45600/329201
<150> Niimero do documento de prioridade: 60/812, 3 60
<151> Data de deposito do documento de prioridade: 09-06-2006
<160> Quantidade de SEQ ID NOs: 38
<170> Software: FastSEQ for Windows Version
4.0
<210> SEQ ID NO: 1 <211> Comprimento: 1404
<212> Tipo: DNA
<213> Organismo: Arthrobacter arilaiti
<220> Caracteristicas: <221> Nome/Chave: CDS <222> Localizagao: (1)
(1404)
<400> Seqiiencia: atg ctg ctg cgc
Met 1
Leu Leu Arg
1 acc Thr 5
g1 t a g V
aaa
Lys
aca Thr
tgc Cys
ctc Leu 10
gag Glu
ccg
Pro
aag
Lys
gat
Asp
cta Leu 15
cca Pro
48
ate lie
tgt Cys
act Thr
gca
Ala 20
age
Ser
gcc
Ala
cct Pro
gga Gly
age
Ser 25
cca Pro
acc Thr
gat
Asp
aag
Lys
ctg Leu 30
cac His
aac Asn
96
gca
Ala
gaa
Glu
aag
Lys 35
acc Thr
tgg Trp
tgg Trp
gcc
Ala
gcg Ala 40
cct Pro
cat
His
gcc Ala
gcc Ala
acc Thr 45
ggc Gly
ctg Leu
gac Asp
144
gcc
Ala
ate
工Ie 50
gtc Val
tcg
Ser
g 1 t a g V
ccc Pro
get Ala 55
tcg Ser
aag Lys
tcc Ser
ttg Leu
acc Thr 60
aac Asn
egg Arg
tat Tyr
ctg Leu
192
ate
lie 65
ctg Leu
gcg Ala
gcc Ala
ctg Leu
gcc
Ala 70
tcc
Ser
tcg
Ser
cca Pro
tcc Ser
acc Thr
75
ate lie
cac His
aac Asn
acg
Thr
ctc Leu 80
240 C y g1 g G
C e t 1 a I
ate
lie
a U O a 1 O gG 1
cgc Arg
acc Thr
acg
Thr
cag
Gln
cca Pro 105
gat Asp
C y g1 g G
tcc Ser
acc
Thr
acc Thr 110
g1 t a g V
gcc Ala
336
ate acc 工Ie Thr
ccg Pro 115
ggc Gly
aag
Lys
ctg Leu
gcc Ala
acc Thr 120
ggc Gly
ccg Pro
ctg Leu
tcc Ser
ate lie 125
gac Asp
tgc Cys
C y g1 g G
384
ctg gcc Leu Ala 130
ggc Gly
acc
Thr
gtc
Val
atg Met
cgc Arg 135
ttc Phe
gtt Val
ccg Pro
ccg Pro
ctg
Leu 140
gcc Ala
gcc Ala
gtt Val
gcc Ala
432
ggt gcc Gly Ala 145
age
Ser
gtg Val
gca
Ala
ttc Phe 150
gat Asp
ggc Gly
t P a S gA
gaa
Glu
a a 5 C 1 5 gAl
gcc
Ala
cgc
Arg
gtg Val
cgc Arg
ccg
Pro 160
480
atg gcc Met Ala
ccg
Pro
gtg Val
ctc
Leu 165
gac
Asp
gcc Ala
ttg Leu
gaa
Glu
acc
Thr 170
ctg Leu
ggt Gly
gcc
Ala
egg Arg
ate
lie 175
gaa
Glu
528
tat gcc
Tyr Ala
ggc Gly
act
Thr 180
CCC
Pro
ggc Gly
atg Met
ctg Leu
ccc
Pro 185
ttc Phe
acc
Thr
atg
Met
gac
Asp
Cao C 1 9 g A 1
age
Ser
gca
Ala
576
ttg cag
Leu Gln
g U 5 a 1 9 g G 1
cgc
Arg
cac
His
gag Glu
g1 t a g V
ctc
Leu 200
ate
lie
gac
Asp
gcc
Ala
tcg
Ser
ggc Gly 205
age
Ser
tcc Ser
cag
Gln
624
ttc ate Phe lie 210
tcc
Ser
gca Ala
ctg Leu
ctg Leu
ctg
Leu 215
gtc Val
ggc Gly
caa
Gln
gca Ala
ctg Leu 220
CCC
Pro
ggt Gly
g y
^ 1 g G
ctg Leu
672
aag ctg
Lys Leu 225
egg Arg
gcc
Ala
gcc Ala
gcg Ala 230
ggg
Gly
cat His
ate lie
gcc
Ala
tcc Ser 235
cct Pro
gac
Asp
cac
His
att lie
Cao C 1 4 g A 2
720
atg acc Met Thr
g1 t a g V
caa
Gln
acc
Thr 245
ctg Leu
cgc Arg
gaa
Glu
ctg Leu
ggc Gly 250
gtc
Val
gag Glu
gta Val
gcc Ala
g 1 5 t a 5
g仏 2
C y g1 g G
768
gag gat Glu Asp
gca Ala
cgc Arg 260
age
Ser
tgg Trp
tcc Ser
ate
lie
aam
C 1 6
^ A 2
ccg Pro
ggt Gly
cag Gln
ctt Leu
tcc Ser 270
gy
g'1 gG
ttc Phe
816
act ate
Thr lie
acc Thr 275
g 1
t a g V
gaa
Glu
ccg Pro
gac Asp
ctg Leu 280
tcc Ser
aac Asn
gcc
Ala
t y g1 g G
CCC
Pro 285
ttc Phe
ctg Leu
gcg Ala
864
gcc gcc Ala Ala 290
ttg Leu
gcc
Ala
acc Thr
aac Asn
ggc Gly 295
acc Thr
g 1 t a
gV
cgc Arg
gtg Val
ccc Pro 300
ttc Phe
tgg Trp
cct Pro
gca
Ala
912
tcc acc Ser Thr 305
acc
Thr
cag
Gln
g 1
t a gV
ggc Gly 310
ggc Gly
Lys
tgg Trp
g1 t a gV
cag
Gln 315
ate
lie
cta Leu
age Ser
egg Arg
atg
Met 320
960
ggc gca Gly Ala
gaa Glu
ate lie
age
Ser 325
cac His
ggc Gly
gag Glu
gac Asp
gga Gly 330
gtg Val
ctc Leu
acc Thr
gta Val
C g 5 g'r 3 C A 3
ggc Gly
1008
acc gga gtg ate cgc ggc ate gac tac gcc gat gcc tcc gaa ttg get
1056 cag Gln
taa
1404
<210> SEQ ID NO: 2
<211> Comprimento: 467 <212> Tipo: PRT
<213> Organismo: Arthrobacter arilaiti <400> Seqiiencia : 2
Met Leu Leu Arg Thr Val Lys Thr Cys Leu Glu Pro Lys Asp Leu Pro
1 5 10 15
lie Cys Thr Ala Ser Ala Pro Gly Ser Pro Thr Asp Lys Leu His Asn
25 30
Ala Glu Lys Thr Trp Trp Ala Ala Pro His Ala Ala Thr Gly Leu Asp
40 45
Ala lie Val Ser Val Pro Ala Ser Lys Ser Leu Thr Asn Arg Tyr Leu
50 55 60
工Ie Leu Ala Ala Leu Ala Ser Ser Pro Ser Thr lie His Asn Thr Leu 65 70 75 80
lie Ser Arg Asp Thr Glu Leu Met Leu Asp Ala Leu Ala Ala Phe Gly
85 90 95
lie Gly lie Glu Arg Thr Thr Gln Pro Asp Gly Ser Thr Thr Val Ala
100 105 110
lie Thr Pro Gly Lys Leu Ala Thr Gly Pro Leu Ser 工Ie Asp Cys Gly
115 120 125
Leu Ala Gly Thr Val Met Arg Phe Val Pro Pro Leu Ala Ala Val Ala
130 135 140
Gly Ala Ser Val Ala Phe Asp Gly Asp Glu Ala Ala Arg Val Arg Pro
Thr Gly Val lie Arg Gly lie Asp Tyr Ala Asp Ala Ser Glu Leu Ala 340 345 350
ccc Pro
acc Thr
ctg Leu 355
gcc
Ala
gcg Ala
ctg Leu
tgc Cys
acc Thr 360
ctg Leu
gcg Ala
gac Asp
tcc Ser
ccc Pro 365
age
Ser
aag Lys
ctg Leu
1104
acc Thr
Cyo gl 7 g'G 3
ate
工Ie
ggg
Gly
cac
His
ctg Leu
cgc Arg 375
ggg
Gly
cac
His
gaa
Glu
acg
Thr
Cpo a S 8 ^ A 3
egg Arg
ctg Leu
gcg Ala
gca Ala
1152
ctg Leu 385
gaa Glu
acc Thr
gag Glu
ctt Leu
Cao C 1 9 g A 3
aag
Lys
gtc Val
ggt Gly
gcc Ala
acg Thr 395
g 1 t a
gV
acc Thr
tcc Ser
acc Thr
Cpo a S O gA 4
1200
gac
Asp
gcg Ala
ttg Leu
gaa
Glu
ate
工Ie 405
att lie
CCC
Pro
gga Gly
acc Thr
ctg Leu 410
cag
Gln
gca
Ala
gcc
Ala
gat Asp
ctg Leu 415
gac Asp
1248
tcc Ser
tac Tyr
gag Glu
t P O a S 2 gA 4
cac
His
egg Arg
atg Met
gcc Ala
acc
Thr 425
gca
Ala
ggc Gly
gca
Ala
ctg Leu
ctg
Leu 430
ggc Gly
ctg Leu
1296
gcc Ala
ate
lie
gaa
Glu 435
ggg Gly
gtg Val
cgc
Arg
gtg Val
a U O a 1 4 g G 4
aat Asn
ate lie
gcc Ala
acc
Thr
acc Thr 445
gcc
Ala
aag
Lys
acc
Thr
1344
atg Met
ccc Pro 450
gac Asp
ttc Phe
ccg Pro
caa
Gln
ctc Leu 455
tgg Trp
acc Thr
gac
Asp
atg Met
Cao
C 1 6
gA 4
gcc
Ala
acc
Thr
gca
Ala
aag
Lys
1392
G
C y 5 g 1 6 gG 4 get tcc gcg ctt ccc ctg tgg ccc gca ccc ttc gcc age cac cct Ala Ser Ala Leu Pro Leu Trp Pro Ala Pro Phe Ala Ser His Pro 25 30
145 Met
Tyr
Leu
Phe
Lys 225 Met
Glu
Thr
Ala
Ser 305 Gly
Thr
Pro
Thr
Leu 385 Asp
Ser
Ala
Met
Gly 465
Ala
Ala
Gln
lie 210 Leu
Thr
Asp
lie
Ala 290 Thr
Ala
Gly
Thr
Gly 370 Glu
Ala
Tyr
lie
Pro 450 Gln
Pro Val Leu 165
Gly Thr Pro 180 Glu Arg His 195
Ser Ala Leu
Arg Ala Ala
Val Gln Thr 245
Ala Arg Ser 260 Thr Val Glu 275
Leu Ala Thr
Thr Gln Val
Glu lie Ser 325
Val lie Arg
340 Leu Ala Ala 355
lie Gly His
Thr Glu Leu
Leu Glu 工Ie 405
Glu Asp His
420 Glu Gly Val 435
Asp Phe Pro Gly
150 Asp
Gly
Glu
Leu
Ala 230 Leu
Trp
Pro
Asn
Gly 310 His
Gly
Leu
Leu
Ala 390 lie
Arg
Arg
Gln
Ala
Met
Val
Leu 215 Gly
Arg
Ser
Asp
Gly 295 Gly
Gly
lie
Cys
Arg 375 Lys
Pro
Met
Val
Leu 455
Leu Glu Leu
Leu
200 Val
His
Glu
lie
Leu 280 Thr
Lys
Glu
Asp
Thr 360 Gly
Val
Gly
Ala
Glu 440 Trp
Pro
185 lie
Gly
lie
Leu
Ala 265 Ser
Val
Trp
Asp
Tyr 345 Leu
His
Gly
Thr
Thr 425 Asn
Thr 170 Phe
Asp
Gln
Ala
Gly 250 Pro
Asn
Arg
Val
Gly 330 Ala
Ala
Glu
Ala
Leu 410 Ala
lie Thr Asp
155 Leu
Thr
Ala
Ala
Ser 235 Val
Gly
Ala
Val
Gln 315 Val
Asp
Asp
Thr
Thr 395 Gln
Gly
Ala
Met
Gly
Met
Ser
Leu 220 Pro
Glu
Gln
Gly
Pro 300 lie
Leu
Ala
Ser
Asp 380 Val
Ala
Ala
Thr
Ala 460
Ala Arg Asp
Gly 205 Pro
Asp
Val
Leu
Pro 285 Phe
Leu
Thr
Ser
Pro 365 Arg
Thr
Ala
Leu
Thr 445 Ala
Ala 190 Ser
Gly
His
Ala
Ser 270 Phe
Trp
Ser
Val
Glu 350 Ser
Leu
Ser
Asp
Leu 430 Ala
lie 175 Ser
Ser
Gly
lie
Val 255 Gly
Leu
Pro
Arg
Arg 335 Leu
Lys
Ala
Thr
Leu 415 Gly
Lys Thr Ala
160 Glu
Ala
Gln
Leu
Ala 240 Gly
Phe
Ala
Ala
Met 320 Gly
Ala
Leu
Ala
Asp 400 Asp
Leu
Thr
Lys
<210> SEQ ID NO: 3
<211> Comprimento: 1395
<212> Tipo: DNA
<213> Organismo: Arthrobacter ramosus
<220> Caracteristicas: <2 21> Nome/Chave: CDS <222> Localizagao: (1)
(1395)
<400> Seqiiencia: 3 atg cca gga acc ccc gcc Met Pro Gly Thr Pro Ala 1 5
acg cag Thr Gln
aca
Thr
gac Asp 10
gat Asp
tea Ser
ggg Gly
acg Thr
age
Ser 15
aca Thr
48
96
g 1 t a g V t P a S gA
gcc Ala
acg Thr 35
gtc
Val
acg
Thr
gtt Val
cct Pro
ggt Gly 40
tcg Ser
aag
Lys
tcg Ser
ctg Leu
acc Thr 45
aac Asn
cgc Arg
tat Tyr
144
ctg Leu
gtc
Val 50
ctg Leu
gcg Ala
gca
Ala
ttg Leu
gcc Ala 55
aac Asn
ggc Gly
ccc Pro
age
Ser
agg Arg 60
ttg Leu
cgt Arg
gca
Ala
CCC
Pro
192
ttg Leu 65
cat His
tcg Ser
cgc Arg
gat
Asp
tcg Ser 70
gcg Ala
ctg Leu
atg Met
gtc Val
gag Glu 75
gcc Ala
ctg Leu
cgc
Arg
egg Arg
ctt Leu 80
240
ggc Gly
gcc Ala
acc Thr
att lie
aca Thr 85
gag Glu
gtt Val
CCC
Pro
ggc Gly
gat Asp 90
a y g 1 g G
cag
Gln
tac Tyr
gga Gly
ccg
Pro 95
gac Asp
288
ctt Leu
gaa
Glu
gtc
Val
acc
Thr 100
ccg
Pro
ate
lie
gac
Asp
cct
Pro
ga 5 Clo g'A 1
gcg Ala
gcg Ala
gca
Ala
tcg
Ser
g U O
all gG 1
acc
Thr
gcc
Ala
336
ate lie
gac Asp
tgc Cys 115
ggc Gly
ctg Leu
gcc Ala
ggc Gly
acg Thr 120
gtc Val
atg
Met
cgc Arg
ttc Phe
g 1 5 t a 2
g V 1
ccg
Pro
ccg Pro
ctt Leu
384
gcg Ala
a a O C 1 3 A 1
ctt Leu
cgc
Arg
aac Asn
C y g1 gG
get
Ala 135
tcg Ser
g 1 t a g V
ttt Phe
gac
Asp
ggc Gly 140
gat Asp
ccg
Pro
cac
His
gca
Ala
432
cg5 g r 4 CAl
cag
Gln
cgt
Arg
ccc Pro
atg Met
ggc Gly 150
acc
Thr
ate
lie
ate
lie
gaa Glu
C a 5 C 1 5 g'A 1
ctc Leu
egg Arg
acc
Thr
ctc Leu
gga Gly 160
480
g1 t a g V
gac
Asp
gtc
Val
age
Ser
C a 5
C 1 6 g A 1
atg Met
gac
Asp
ggg Gly
aag
Lys
g a O C 1 7 g'A 1
ccg Pro
C y g 1 g G
tcc Ser
ttg Leu
ccg
Pro 175
ttc Phe
528
aag Lys
gtc
Val
tcc Ser
ggc Gly 180
acg Thr
C y g 1 gG
tea Ser
g 1 t a
gV
cgc Arg 185
ggt Gly
C y g 1 gG
cac His
ttg Leu
g 1 O t a 9 g V 1
ate
lie
gac Asp
576
gcg Ala
age
Ser
t a 5 C 1 9 g A 1
tcc
Ser
tcg Ser
cag
Gln
ttc Phe
Clo t a O gv.2
tcc Ser
gcc
Ala
ctg Leu
ctg Leu
ctc Leu 205
gtc Val
ggt Gly
gcc Ala
624
cgt Arg
ttc Phe 210
gaa
Glu
gag
Glu
ggc Gly
ctg Leu
cac
His 215
CtC
Leu
gag Glu
cat
His
gtc Val
ggc Gly 220
aag
Lys
ccc Pro
g1 t a
gV
ccg
Pro
672
age Ser 225
ctc Leu
gac Asp
cac His
ate lie
aac
Asn 230
atg Met
act
Thr
g 1 t a gV
gcg Ala
C 1 5 t a 3 gv.2
ctg Leu
cgc Arg
ggg
Gly
gtt Val
a y O gl 4 gG 2
720
gtc
Val
cag
Gln
gta Val
gat Asp
C P 5 a S 4 A 2
tcc Ser
g 1 t a gV
ccg Pro
aac Asn
cat
His 250
tgg Trp
cga
Arg
gtc
Val
tcc Ser
ccc Pro 255
ggc Gly
768
gcc Ala
ate lie
cag
Gln
g a O
C 1 6
A 2
ttc Phe
gac Asp
gag Glu
cga
Arg
ate lie 265
gaa
Glu
cag Gln
gac Asp
ctc Leu
tcc Ser 270
aac Asn
gcg Ala
816 tcc Ser
gag Glu
ate lie
ctg Leu
ggc Gly 330
gcg Ala
gac Asp
ttc Phe
gac
Asp
gaa
Glu 335
acg Thr
1008
aca gtc acc ggc
Thr Val Thr Gly
cat His
age
Ser 405
tac
Tyr
gcc Ala
gac Asp
cac His
Cgo g r 1 C A 4
atg Met
get Ala
acg
Thr
gcg Ala
C y 5 gl 1 g G 4
gcc Ala
1248
ate lie
ctt Leu
ggg Gly
CtC
Leu 420
gcc
Ala
gtc Val
gag Glu
ggt Gly
gtc Val 425
egg Arg
gtc
Val
gaa
Glu
gac Asp
Ceo t 1 3 a I 4
gcg Ala
acg
Thr
1296
acg Thr
tcc Ser
aag Lys 435
acc Thr
atg Met
CCC
Pro
gaa
Glu
ttc Phe 440
ccg Pro
cag Gln
ate lie
tgg Trp
acg Thr 445
tcg Ser
atg
Met
ctc Leu
1344
agt Ser
gca Ala 450
ggg Gly
cca Pro
gcg Ala
gcc Ala
gaLn
C 1 5 gA 4
gcc Ala
gcc Ala
ggt Gly
tea
Ser
acg Thr 460
gag Glu
aca
Thr
age
Ser
aac Asn
1392
tga
1395
<210> <211> <212> <213
SEQ 工D N〇:4 Comprimento: 464 Tipo: PRT > Organismo: Arthrobacter ramosus
<400> Seqilencia: 4
Met Pro Gly Thr Pro Ala Thr Gln Thr Asp Asp Ser Gly Thr Ser 10 15
Thr
age
Ser
gaa
Glu
ctc Leu
Cao C 1 4 g'A 3
ccc
Pro
acg
Thr
gta
Val
gcg Ala
a a 5 C 1 4 bi A 3
ttg Leu
tgc
Cys
gcc
Ala
ttg Leu
a a O C 1 5 9 A 3
acc
Thr
age Ser
1056
cct
Pro
tcc Ser
egg Arg 355
ctc Leu
acc Thr
C y g1 gG
ate
lie
gcg Ala 360
cac His
ctg Leu
cgc Arg
gga Gly
cac His 365
gag Glu
acg Thr
gac Asp
1104
agg Arg
ctg
Leu 370
gcc Ala
gcg Ala
ctc Leu
gtc
Val
C a 5 C 1 7 gA 3
gaa
Glu
ate
工Ie
aac Asn
egg Arg
ctt Leu 380
ggc Gly
C y g 1 gG
gac
Asp
gcc
Ala
1152
gu 5 a 1 8 g«G 3
gaa
Glu
acc
Thr
age
Ser
gac Asp
ggc Gly 390
ctg Leu
gta Val
ate
工Ie
egg Arg
ccc Pro 395
gca
Ala
gcg Ala
ctg Leu
cac
His
tcc Ser 400
1200
ggt ccc ttc ctc gcc gcg gcg ctc gcc acg aag gga acc gtg egg ate 864
Gly Pro Phe Leu Ala Ala Ala Leu Ala Thr Lys Gly Thr Val Arg 工Ie 275 280 285
ccc aac tgg cct gcc age acc acg caa gtc gga gat ctc tgg egg aac 912 Pro Asn Trp Pro Ala Ser Thr Thr Gln Val Gly Asp Leu Trp Arg Asn 290 295 300
att ctt gcc acc atg ggc get acc gtc acg ctg gac aac ggg acc ctg 960 lie Leu Ala Thr Met Gly Ala Thr Val Thr Leu Asp Asn Gly Thr Leu 305 310 315 320
t y 5 gl 2 O- G 3
g1 t a gV
gtc Val
g G Ala
Asp
Leu
Leu
65
Gly
Leu
lie
Ala
Arg 145 Val
Lys
Ala
Arg
Ser 225 Val
Ala
Gly
Pro
lie 305 Thr
Ser
Pro
Arg
Glu 385 Gly
工Ie
Thr
Ser
Ser Ala Ala
Val
50
His
Ala
Glu
Asp
Ala 130 Gln
Asp
Val
Ser
Phe 210 Leu
Gln
lie
Pro
Asn 290 Leu
Val
Glu
Ser
Leu 370 Glu
Val
Leu
Ser
Ala 450
Thr
35
Leu
Ser
Thr
Val
Cys 115 Leu
Arg
Val
Ser
Ala 195 Glu
Asp
Val
Gln
Phe 275 Trp
Ala
Thr
Leu
Arg 355 Ala
Thr
Val
Gly
Lys 435 Gly
Leu
20 Val
Ala
Arg
工Ie
Thr 100 Gly
Arg
Pro
Ser
Gly 180 Ser
Glu
His
Asp
Ala 260 Leu
Pro
Thr
Gly
Ala 340 Leu
Ala
Ser
His
Leu 420 Thr
Pro
Thr
Ala
Asp
Thr
85
Pro
Leu
Asn
Met
Ala 165 Thr
Ser
Gly
lie
Asp 245 Phe
Ala
Ala
Met
Gly 325 Pro
Thr
Leu
Asp
Ser 405 Ala
Met Pro Ala
Leu
Val
Leu
Ser
70
Glu
lie
Ala
Gly
Gly 150 Met
Gly
Gln
Leu
Asn 230 Ser
Asp
Ala
Ser
Gly 310 Ser
Thr
Gly
Val
Gly 390 Tyr
Val
Pro
Ala
Trp Pro Pro
Ala
55
Ala
Val
Asp
Gly
Ala 135 Thr
Asp
Ser
Phe
His 215 Met
Val
Glu
Ala
Thr 295 Ala
Glu
Val
lie
Ala 375 Leu
Ala
Glu
Glu
Ala 455
Gly
40
Asn
Leu
Pro
Pro
Thr 120 Ser
lie
Gly
Val
Val 200 Leu
Thr
Pro
Arg
Leu 280 Thr
Thr
lie
Ala
Ala 360 Glu
Val
Asp
Gly
Phe 440 Ala
Ala
25
Ser
Gly
Met
Gly
Ala 105 Val
Val
lie
Lys
Arg 185 Ser
Glu
Val
Asn
lie 265 Ala
Gln
Val
Leu
Ala 345 His
工Ie
工Ie
His
Val 425 Pro
Pro
Lys
Pro
Val
Asp
90
Ala
Met
Phe
Glu
Ala 170 Gly
Ala
His
Ala
His 250 Glu
Thr
Val
Thr
Gly 330 Leu
Leu
Asn
Arg
Arg 410 Arg
Gln Ala Gly
Phe
Ser
Ser
Glu
75
Gly
Ala
Arg
Asp
Ala 155 Pro
Gly
Leu
Val
Val 235 Trp
Gln
Lys
Gly
Leu 315 Ala
Cys
Arg
Arg
Pro 395 Met
Val
lie
Ser
Ala
Leu
Arg 60 Ala
Gln
Ala
Phe
Gly 140 Leu
Gly
His
Leu
Gly 220 Leu
Arg
Asp
Gly
Asp 300 Asp
Asp
Ala
Gly
Leu 380 Ala
Ala
Glu
Trp
Thr 460
Ser His Pro Val 30
Asn Arg Tyr
Thr
45
Leu
Leu
Tyr
Ser
Val 125 Asp
Arg
Ser
Leu
Leu 205 Lys
Arg
Val
Leu
Thr 285 Leu
Asn
Phe
Leu
His 365 Gly
Ala
Thr
Asp
Thr 445 Glu
Arg Ala Pro
Arg Arg Leu 80
Gly Pro Asp 95
Glu Thr Ala 110
Pro Pro Leu
Pro His Ala
Thr Leu Gly 160
Leu Pro Phe 175
Val lie Asp 190
Val Gly Ala
Pro Val Pro
Gly Val Gly 240
Ser Pro Gly
255 Ser Asn Ala 270
Val Arg lie
Trp Arg Asn
Gly Thr Leu 320
Asp Glu Thr 335
Ala Thr Ser 350
Glu Thr Asp
Gly Asp Ala
Leu His Ser 400
Ala Gly Ala
415 lie Ala Thr 430
Ser Met Leu Thr Ser Asn
<210> SEQ ID NO: 5 <211> Comprimento: 1368 <212> Tipo: DNA gcc act 96 Ala Thr
ccg gcc cct tac gcc aat ggg cca
Pro Ala Pro Tyr Ala Asn Gly Pro 25
ctc ccg cta Leu Pro Leu
g 1 t a g V
aca Thr
gtc Val 35
CCC
Pro
t y g1 gG
tea
Ser
aaa
Lys
tcg
Ser 40
ctg Leu
acc Thr
aac Asn
egg Arg
C e 5 t h 4 t P
ctg Leu
g1 t a gV
ctg Leu
144
gca
Ala
gcc Ala 50
ttg Leu
gcg Ala
gac
Asp
t y g1 g G
ccc Pro 55
tcg Ser
egg Arg
ctc Leu
egg Arg
gcc Ala 60
cca Pro
ctg Leu
cat His
tea Ser
192
cgc
Arg 65
gat Asp
tct Ser
gcc Ala
ctg Leu
atg
Met 70
ate
lie
caa
Gln
gcc Ala
ctt Leu
gg5 g r 7
C A
cag
Gln
ttg Leu
ggt Gly
gcc
Ala
acc
Thr 80
240
gtc Val
acc
Thr
gag Glu
gta
Val
CCC
Pro 85
ggt Gly
gac Asp
ggt Gly
gac Asp
tat Tyr 90
ggg Gly
ccc
Pro
gac
Asp
ctg Leu
gag Glu 95
ate 工Ie
288
acg Thr
CCC
Pro
ctg Leu
gac Asp 100
CCC
Pro
tcc Ser
gcc
Ala
gcg Ala
C y 5 g 1 O g G 1
tea
Ser
age
Ser
acc Thr
gcc Ala
ate lie 110
gac Asp
tgc Cys
336
ggc Gly
ctg Leu
gcg Ala 115
ggt Gly
acg Thr
gtc Val
atg Met
O-O-O
g r 2 a A 1
ttc Phe
gtt Val
ccc
Pro
ccg
Pro
ctt Leu 125
get Ala
gcc
Ala
ctg Leu
384
cgc
Arg
age
Ser 130
ggc Gly
gca
Ala
acc
Thr
gtc Val
ttc Phe 135
gac
Asp
C y g 1 g G
gat Asp
ccc Pro
cat His 140
gcc
Ala
cgc Arg
aac Asn
cgt Arg
432
CCC
Pro 145
atg
Met
gga Gly
acc Thr
ate lie
ate lie 150
gag Glu
gca Ala
ctt Leu
ctt Leu
C a 5 C 1 5 g A 1
ttg Leu
gga Gly
gtc Val
cct Pro
t 1 O t a 6
gv 1
480
gca
Ala
gcc Ala
gaa
Glu
ggc Gly
ggc Gly 165
agg Arg
acg Thr
ccg Pro
tcg Ser
Cao C 1 7 gA 1
Ctt
Leu
ccc Pro
ttc Phe
acg
Thr
9 15 t a 7 gv 1
gaa Glu
528
ggc Gly
acc
Thr
ggc Gly
gag Glu 180
g1 t a
gV
cgc
Arg
ggc Gly
ggc Gly
cac His 185
ttg Leu
gtc Val
ate lie
gac
Asp
Cao C 1 9 g'A 1
age
Ser
get Ala
576
<213> Organismo: bacteria Gram positiva
<220> Caracteristicas:
<221> Nome/Chave: misc_feature
<222> Localizagao: (0)...(O)
<223> Outras informagoes: bacteria Gram+
cepa desconhecida
<221> Nome/Chave: CDS <222> Localizagao: (1)
(1368)
<400> Seqliencia: atg aca ggt acc
Met 1
Thr Gly Thr
5
acc Thr 5
gcc Ala
gcc Ala
aat Asn
acc Thr
gaa Glu 10
ccg Pro
gac Asp
aaa Lys
gcc Ala
gcc
Ala 15
age
Ser
48
Cpo a S 3 g A
g1 t a g V gcc Ala
ctg Leu 370
gtt Val
gcc
Ala
gag Glu
ate
lie
aac
Asn 375
agg Arg
ctt Leu
t y g 1 gG
ggt Gly
gat Asp 380
gcg Ala
gaa
Glu
gag Glu
acc Thr
1152
gca
Ala 385
gat Asp
gga Gly
ctg Leu
ctt Leu
att lie 390
cgc
Arg
ccc Pro
gcc Ala
acc Thr
ctc Leu 395
cac
His
ggc Gly
ggc Gly
g1 t a
g V
ate
lie 400
1200
cac His
agt Ser
tac
Tyr
gca Ala
C P 5 a S O gA 4
cac His
egg Arg
atg Met
gcc
Ala
act Thr 410
gcc
Ala
ggc Gly
gcc Ala
ate
lie
ctg Leu 415
gy
^ 1 g G
1248
ctc Leu
gcc Ala
gtt Val
Cpo a S 2 g A 4
C y g 1 gG
gtc Val
cag
Gln
gtt Val
a U 5 a 1 2 g G 4
gac Asp
ate lie
gcc Ala
acg Thr
aca Thr 430
tcc Ser
aag
Lys
1296
cgc ctc gcc 1104 Arg Leu Ala
gga cac gag acg
Gly His Glu Thr
ctg act ggc ate gcc cac ctt Leu Thr Gly 工Ie Ala His Leu 355
ctc tcc Leu Ser
aat Asn
gcc Ala
gga Gly 270
CCC
Pro
ttc 816 Phe
get Ala
ttt Phe
gac Asp
cag Gln 260
egg Arg
ate
lie
gag Glu
cag
Gln
ctg Leu
gcc Ala
C a 5 C 1 7 g'A 2
gcc Ala
ctg Leu
gcc
Ala
act
Thr
cat
His 280
ggc Gly
act Thr
gtc
Val
cgc Arg
att lie 285
CCC
Pro
aac Asn
tgg Trp
864
CCC
Pro
att lie 290
ggc Gly
acc Thr
acg Thr
cag
Gln
gl 5 t a 9 gv 2
ggc Gly
gat Asp
ctc Leu
tgg Trp
egg Arg 300
acc Thr
ate
lie
ctc Leu
get Ala
912
C a 5 Clo g'A 3
atg Met
ggc Gly
gcg Ala
acc Thr
Clo t a 1 gv 3
acc Thr
ctc Leu
gac Asp
gy
g 1 gG
gga Gly 315
acg
Thr
ctg Leu
aca Thr
g 1 t a g V
acc Thr 320
960
ggc Gly
ggg
Gly
aat Asn
gag
Glu
ate
lie 325
aag
Lys
ggt Gly
gcc
Ala
gat Asp
ttc Phe 330
gac
Asp
gaa
Glu
acc
Thr
age
Ser
a U 5 ^13 gG 3
CtC Leu
1008
gcg Ala
ccg Pro
acg
Thr
a 1 O t a 4 gv 3
get
Ala
gcc Ala
ctt Leu
tgc
Cys
C a 5 C 1 4 0- A 3
ctg Leu
gcc Ala
acc Thr
ggt Gly
cca Pro 350
tcg Ser
cga Arg
1056
9/44
tcc tcc cag ttt gtt tcg gca ttg ctg ttg gtg ggc gcc cgc ttc acc 624 Ser Ser Gln Phe Val Ser Ala Leu Leu Leu Val Gly Ala Arg Phe Thr 195 200 205
gaa ggc ctg cac ttg gag cac gtg ggc aaa ccc gtt ccc age ctg gat 672 Glu Gly Leu His Leu Glu His Val Gly Lys Pro Val Pro Ser Leu Asp 210 215 220
cac ate acc atg acc gtt gag gtg ctt egg age gtg ggt gtc acc gtg 720 His lie Thr Met Thr Val Glu Val Leu Arg Ser Val Gly Val Thr Val 225 230 235 240
gat gac tcc gta ccc aac cac tgg cgc gta tcg cct ggc aag ate acc 768 Asp Asp Ser Val Pro Asn His Trp Arg Val Ser Pro Gly Lys 工Ie Thr 245 250 255
gat Asp 365
t P 5 a S 6 gA 2 aac
Asn 455
tga
1368
aac gag gcc Asn Glu Ala
<210> SEQ ID NO: 6
<211> Comprimento: 455
<212> Tipo: PRT
<213> Organismo: bacteria Gram positiva
<400> Seqiiencia : Met Thr Gly Thr 1
Leu
Val
Ala
Arg
65
Val
Thr
Gly
Arg
Pro 145 Ala
Gly
Ser
Glu
His 225 Asp
Ala
Leu
Pro
Ala 305 Gly
Ala
Leu
Pro Leu Thr
Ala
50
Asp
Thr
Pro
Leu
Ser 130 Met
Ala
Thr
Ser
Gly 210 lie
Asp
Phe
Ala
lie 290 Met
Gly
Pro
Thr
Val
35
Leu
Ser
Glu
Leu
Ala 115 Gly
Gly
Glu
Gly
Gln 195 Leu
Thr
Ser
Asp
Ala 275 Gly
Gly
Asn
Thr
Gly 355
Trp 20 Pro
Ala
Ala
Val
Asp 100 Gly
Ala
Thr
Gly
Glu 180 Phe
His
Met
Val
Gln 260 Ala
Thr
Ala
Glu
Val 340 lie
6
Thr
5 Pro
Gly
Asp
Leu
Pro
85
Pro
Thr
Thr
lie
Gly 165 Val
Val
Leu
Thr
Pro 245 Arg
Leu
Thr
Thr
lie 325 Ala
Ala
Ala
Ser
Gly
Met
70
Gly
Ser
Val
Val
lie 150 Arg
Arg
Ser
Glu
Val 230 Asn
lie
Ala
Gln
Val 310 Lys
Ala Ala His
Ala
Pro
Lys
Pro
55
lie
Asp
Ala
Met
Phe 135 Glu
Thr
Gly
Ala
His 215 Glu
His
Glu
Thr
Val 295 Thr
Gly
Leu
Leu
Asn Thr Tyr
Ser
40
Ser
Gln
Gly
Ala
Arg 120 Asp
Ala
Pro
Gly
Leu 200 Val
Val
Trp
Gln
His 280 Gly
Leu
Ala
Cys
Arg 360
Ala
25
Leu
Arg
Ala
Asp
Gly 105 Phe
Gly
Leu
Ser
His 185 Leu
Gly
Leu
Arg
Asp 265 Gly
Asp
Asp
Asp
Ala 345 Gly
Glu 10 Asn
Thr
Leu
Leu
Tyr
90
Ser
Val
Asp
Leu
Ala 170 Leu
Leu
Lys
Arg
Val 250 Leu
Thr
Leu
Gly
Phe 330 Leu
Pro
Gly
Asn
Arg
Arg
75
Gly
Ser
Pro
Pro
Ala 155 Leu
Val
Val
Pro
Ser 235 Ser
Ser
Val
Trp
Gly 315 Asp
Ala His Glu
Asp
Pro
Arg
Ala 60 Gln
Pro
Thr
Pro
His 140 Leu
Pro
lie
Gly
Val 220 Val
Pro
Asn
Arg
Arg 300 Thr
Glu
Thr
Thr
Lys Ala Val
Phe
45
Pro
Leu
Asp
Ala
Leu 125 Ala
Gly
Phe
Asp
Ala 205 Pro
Gly
Gly
Ala
lie 285 Thr
Leu
Thr
Gly
Asp 365
Asp
30
Leu
Leu
Gly
Leu
lie 110 Ala
Arg
Val
Thr
Ala 190 Arg
Ser
Val
Lys
Gly 270 Pro
lie
Thr
Ser
Pro 350 Arg
Ala
15
Ala
Val
His
Ala
Glu
95
Asp
Ala
Asn
Pro
Val 175 Ser
Phe
Leu
Thr
lie 255 Pro
Asn
Leu
Val
Glu 335 Ser
Ser
Thr
Leu
Ser
Thr 80 lie
Cys
Leu
Arg
Val 160 Glu
Ala
Thr
Asp
Val 240 Thr
Phe
Trp
Ala
Thr 320 Leu
Arg Leu Ala
acc atg
Thr Met
CCC
Pro 435
gag Glu
ttc Phe
ccg
Pro
gag Glu
atg tgg gca Met Trp Ala 440
aga
Arg
atg
Met
ctt Leu 445
gac Asp
tcc gcc Ser Ala
1344
ggc
Gly
ggc acg Gly Thr Ala
Ala 385 His
Leu
Thr
Gly
Leu 370 Asp
Ser
Ala
Met
Thr 450
Val
Gly
Tyr
Val
Pro 435 Asn
Ala
Leu
Ala
Asp 420 Glu
Glu lie Leu
P 5 y sol A 4 G
Phe Glu Ala
lie 390 His
Val
Pro
Gly
Asn
375 Arg
Arg
Gln
Glu
Asn 455
Arg
Pro
Met
Val
Met 440
Leu
Ala
Ala
Glu 425 Trp
Gly Gly Thr
Thr 410 Asp
Leu 395 Ala
lie Ala Arg
Asp
380 His
Gly
Ala
Met
Ala
Gly
Ala
Thr
Leu 445
Glu Glu Thr Gly lie
Thr 430 Asp
Val lie 400 Leu Gly 415
Ser Lys
Ser Ala
<210> SEQ ID NO: 7 <211> Comprimento: 1386 <212> Tipo: DNA
<213> Organismo: Arthrobacter ureafaciens
<220> Caracteristicas: <2 21> Nome/Chave: CDS <222> Localizagao: (1)
(1386)
<400> Sequencia: atg aca ggt acc
Met 1
Thr Gly Thr
7 acc Thr 5
gca
Ala
gca
Ala
aac Asn
acg
Thr
ggt Gly 10
tea Ser
aac Asn
tcc
Ser
gtc Val
gac Asp 15
acc Thr
48
ctg Leu
ccc Pro
ctc Leu
tgg Trp 20
gca Ala
get
Ala
CCC
Pro
tac
Tyr
gcc Ala 25
acc
Thr
agg Arg
cca Pro
gtg Val
gat Asp 30
gcc
Ala
aca 96
Thr
g 1 t a g V
acg Thr
gtg Val 35
ccg Pro
ggc Gly
tea Ser
aaa
Lys
tcg Ser 40
ctc Leu
acc Thr
aac Asn
cgt Arg
ttc Phe 45
ctg Leu
gtc Val
ctc Leu
144
gca Ala
gca Ala 50
ttg Leu
gcc
Ala
gac
Asp
C y g1 g G
cct Pro 55
tcc Ser
cgc
Arg
ctg Leu
egg Arg
gcc Ala 60
CCC
Pro
ctt Leu
cac
His
tcc Ser
192
cgc Arg
65
gat
Asp
tcc Ser
gtc
Val
ctt Leu
atg Met 70
att lie
cag Gln
gcg Ala
CtC
Leu
a g 5 Di r 7 a A
caa
Gln
ctg Leu
ggt Gly
gcc Ala
acc Thr 80
240
gtc
Val
acc Thr
gag Glu
gta
Val
ccc Pro 85
C y g 1 gG
gac Asp
ggt Gly
gat Asp
tat Tyr 90
a y g1 g G
ccg Pro
gac
Asp
ctt Leu
gu 5 a 1 9 g G
ate lie
288
act Thr
ccc Pro
atg Met
t P O a S O g A 1
cct
Pro
tcg Ser
get Ala
tcg
Ser
ggt Gly 105
gcg Ala
gag Glu
act Thr
gcc
Ala
ate lie 110
gat
Asp
tgc
Cys
336
ggc Gly
ctt Leu
gcc
Ala 115
ggt Gly
acg
Thr
gtt Val
atg
Met
Cgo g r 2
CAl
ttc Phe
gtt Val
cca Pro
cct Pro
tta Leu 125
get Ala
gcg Ala
cta Leu
384
cgc Arg
aat Asn 130
t y g1 gG
cca Pro
acc Thr
acg
Thr
ttc Phe 135
gac
Asp
C y g1 g G
gat Asp
ccc Pro
cat His 140
gcc Ala
cgt Arg
aag
Lys
egg Arg
432 egg ctc gcc 1104 Arg Leu Ala
ggc cat gaa acc Gly His Glu Thr
ctg acc ggc ate gcg cac ctc
Leu Thr Gly lie Ala His Leu 355
CCC
Pro 145
atg Met
gga Gly
acc Thr
ate
lie
ate lie 150
gaa Glu
gcg Ala
ctg Leu
CtC
Leu
C a 5
C 1 5 g A 1
ctc Leu
gga Gly
gtt Val
cct Pro
Clo t a 6 gv 1
480
gcc Ala
acc Thr
gaa
Glu
ggc Gly
gga Gly 165
agg Arg
acg Thr
ccg Pro
tcg Ser
Cao C 1 7 gA 1
Ctt
Leu
CCC
Pro
ttc Phe
tct Ser
gl 5 t a 7 gvl
gat
Asp
528
ggc Gly
act Thr
ggc Gly
gag Glu 180
gtt Val
egg Arg
ggc Gly
ggc Gly
cat
His 185
ctg Leu
g 1 t a gV
ate
lie
gat Asp
Cao C 1 9 gA 1
age
Ser
gca
Ala
576
tcg Ser
tcc Ser
cag
Gln 195
ttc Phe
gtt Val
tcg Ser
gcc Ala
ttg Leu 200
ctg Leu
ctt Leu
gta
Val
ggc Gly
gcc Ala 205
aga
Arg
ttc Phe
acc
Thr
624
gaa
Glu
ggc Gly 210
ctt Leu
cac His
ctg Leu
gaa
Glu
cac His 215
gtt Val
ggc Gly
aag
Lys
cct
Pro
Clo t a 2
g V 2
ccc Pro
age
Ser
ctg Leu
gac Asp
672
cac
His 225
ate
lie
aat Asn
atg Met
acc
Thr
t 1 O t a 3 gv 2
tcc Ser
gtc Val
ctt Leu
cgc Arg
gga Gly 235
gtg Val
ggc Gly
gtc
Val
aag
Lys
g 1 O t a 4 g V 2
720
gac
Asp
gat Asp
tcg
Ser
gta
Val
ccc Pro 245
aac Asn
cac
His
tgg Trp
egg Arg
gtc Val 250
gca
Ala
cct
Pro
ggc Gly
CCC
Pro
ate
工Ie 255
cac His
768
gcc Ala
ttc Phe
gac
Asp
cag
Gln 260
egg Arg
ate 工Ie
gaa
Glu
cag
Gln
C P 5 a S 6 ^ A 2
ctt Leu
tcc Ser
aac Asn
gcc Ala
ggc Gly 270
ccg Pro
ttc Phe
816
ctt Leu
gcc
Ala
aa 5 C 1 7 g A 2
gcc Ala
ctg Leu
gca
Ala
acc Thr
cgc
Arg 280
gga Gly
acc Thr
gtc Val
egg Arg
ate lie 285
CCC
Pro
aac Asn
tgg Trp
864
CCC
Pro
acc Thr 290
cag Gln
acc Thr
acc Thr
cag Gln
gl m t a 9 gv 2
t y g 1 gG
gat Asp
Ctt
Leu
tgg Trp
egg Arg 300
tcc Ser
ate
lie
ctg Leu
gtt Val
912
gu 5 a 1 O g'G 3
atg Met
t y g1 gG
gcc
Ala
acg Thr
gl O t a 1 g V 3
aca
Thr
ctc Leu
gaa
Glu
aac Asn
C y 5 9 11 g G 3
acg Thr
ctc Leu
acg
Thr
gtt Val
aag
Lys 320
960
ggc Gly
ggc Gly
ccg Pro
gaa
Glu
ate lie 325
aaa
Lys
ggc Gly
gcc Ala
gac Asp
ttc Phe 330
gac Asp
gaa Glu
acc Thr
age
Ser
Gi U 5 a 1 3 G 3
CtC
Leu
1008
gcg Ala
ccc
Pro
acg
Thr
Clo t a 4 gv 3
get
Ala
gcg Ala
ctg Leu
tgc
Cys
aa5 C 1 4 gA 3
ctg Leu
gcc Ala
aca Thr
C y g 1 gG
cct Pro 350
tea Ser
egg Arg
1056
gcg Ala
ctg Leu 370
gcc
Ala
get Ala
gaa
Glu
ate 工Ie
aat Asn 375
egg Arg
ctc Leu
ggc Gly
gga Gly
gac Asp 380
gca
Ala
gaa
Glu
gaa Glu
aca
Thr
1152
gat
Asp 365 get Ala 385
gac Asp
ggc Gly
ctg Leu
ate lie
ate lie 390
cgc Arg
ccg Pro
gcc Ala
act Thr
ctg Leu 395
cat His
ccc Pro
ggc Giy
gtc Val
a 1 O t a O g V 4
1200
cac
His
CtC
Leu
age
Ser
gcc
Ala
tac
Tyr
gtt Val
gcc Ala
gag Glu 420
C P 5 Cy a S O g 1 a- A 4gG
cac His
gtc
Val
cgc
Arg
cag Gln
atg Met
g1 t a g V
get Ala
gag Glu 425
acg
Thr 410
gat Asp
gcc Ala
ate lie
ggc Gly
get Ala
get Ala
acc Thr
att lie
acc Thr 430
ttg Leu 415
tcc Ser
ggg Gly
aag Lys
1248
丄296
acg Thr
acg
Thr
gtg Val
ggc Gly 450
CCC
Pro 435
gag Glu
gaa
Glu
gac Asp
ttt Phe
gaa Glu
ccg Pro
acc Thr
cag
Gln
C 1 5 t a 5 gv 4
atg Met 440
acc Thr
tgg Trp
agt Ser
gag Glu
gag Glu
gcc Ala
gcc Ala
atg
Met
Cro g e 6 a S 4
ctg Leu 445
aac Asn
cag
Gln
tga
cag
Gln
ggc Gly
1344
1386
<210> SEQ ID NO: 8 <211> Comprimento: 461 <212> Tipo: PRT
<213> Organismo: Arthrobacter ureafaciens
<400> Sequencia; Met Thr Gly Thr 1
Leu
Val
Ala
Arg
65
Val
Thr
Gly
Arg
Pro 145 Ala
Gly
Ser
Glu
His 225 Asp
Pro Leu Thr
Ala
50
Asp
Thr
Pro
Leu
Asn 130 Met
Thr
Thr
Ser
Gly 210 lie
Asp Ala Phe
Val
35
Leu
Ser
Glu
Met
Ala 115 Gly
Gly
Glu
Gly
Gln 195 Leu
Asn
Ser
Asp
Trp 20 Pro
Ala
Val
Val
Asp 100 Gly
Pro
Thr
Gly
Glu 180 Phe
His
Met
Val
Gln
8 Thr 5
Ala
Gly
Asp
Leu
Pro
85
Pro
Thr
Thr
lie
Gly 165 Val
Val
Leu
Thr
Pro 245 Arg
Ala
Ala
Ser
Gly
Met
70
Gly
Ser
Val
Thr
lie 150 Arg
Arg
Ser
Glu
Val 230 Asn
Ala
Pro
Lys
Pro
55
lie
Asp
Ala
Met
Phe 135 Glu
Thr
Gly
Ala
His 215 Ser
Asn Thr Tyr
His lie Glu
Ser
40
Ser
Gln
Gly
Ser
Arg 120 Asp
Ala
Pro
Gly
Leu 200 Val
Val
Trp
Gln
Ala
25
Leu
Arg
Ala
Asp
Gly 105 Phe
Gly
Leu
Ser
His 185 Leu
Gly
Leu
Arg
Asp
Gly 10 Thr
Thr
Leu
Leu
Tyr
90
Ala
Val
Asp
Leu
Ala 170 Leu
Leu
Lys
Arg
Val 250 Leu
Ser
Arg
Asn
Arg
Arg
75
Gly
Glu
Pro
Pro
Ala 155 Leu
Val
Val
Pro
Gly 235 Ala
Asn
Pro
Arg
Ala 60 Gln
Pro
Thr
Pro
His 140 Leu
Pro
lie
Gly
Val 220 Val
Pro Ser Asn
Ser
Val
Phe
45
Pro
Leu
Asp
Ala
Leu 125 Ala
Gly
Phe
Asp
Ala 205 Pro
Gly
Gly
Ala
Val Asp Thr 15
Ala Thr
Asp
30 Leu
Leu
Gly
Leu
lie 110 Ala
Arg
Val
Ser
Ala 190 Arg
Ser Val Lys Pro Gly
Val Leu
His Ser
Ala Thr 80
Glu lie 95
Asp Cys
Ala Leu
Lys Arg
Pro Val 160 Val Asp 175
Ser Ala Phe Thr Leu Asp
Val 240 工Ie His 255
Pro Phe ttc 288 Phe
gat gtg cgt gaa tta aat gta ggc aat
Asp Val Arg Glu Leu Asn Val Gly Asn 85
gcg ggt gca gtg ctg Ala Gly Ala Val Leu 90
Leu Ala Pro
Glu 305 Gly
Ala
Leu
Ala
Ala 385 His
Leu
Thr
Thr
Thr 290 Met
Gly
Pro
Thr
Leu 370 Asp
Ser
Ala
Val
Gly 450
Ala 275 Gln
Gly
Pro
Thr
Gly 355 Ala
Gly
Tyr
Val
Pro 435 Glu
260 Ala
Thr
Ala
Glu
Val 340 lie
Ala
Leu
Ala
Glu 420 Glu
Leu
Thr
Thr
lie 325 Ala
Ala
Glu
lie
Asp 405 Gly
Ala Thr Gln
Phe Asp Glu
Val 310 Lys
Ala
His
lie
lie 390 His
Val
Pro
Thr
Val 295 Thr
Gly
Leu
Leu
Asn 375 Arg
Arg
Gln
Gln
Val 455
Arg 280 Gly
Leu
Ala
Cys
Arg 360 Arg
Pro
Met
Val
Met 440 Thr
265 Gly
Asp
Glu
Asp
Ala 345 Gly
Leu
Ala
Ala
Glu 425 Trp
Thr
Leu
Asn
Phe 330 Leu
His
Gly
Thr
Thr 410 Asp
Val Arg Trp
Glu Ser Glu
Gly 315 Asp
Ala
Glu
Gly
Leu 395 Ala
lie
Ala
Ala
Arg 300 Thr
Glu
Thr
Thr
Asp 380 His
Gly
Ala
Met
Ser 460
lie 285 Ser
Leu
Thr
Gly
Asp 365 Ala
Pro
Ala
Thr
Leu 445 Asn
270 Pro
工Ie
Thr
Ser
Pro 350 Arg
Glu
Gly
lie
Thr 430 Gln
Asn
Leu
Val
Glu 335 Ser
Leu
Glu
Val
Leu 415 Ser
Trp
Val
Lys 320 Leu
Arg
Ala
Thr
Val 400 Gly
Lys
Gln Gly
<210> SEQ ID NO: 9 <211> Comprimento: 1296 <212> Tipo: DNA
<213> Organismo: Paenibacillus pabuli
<220> Caracteristicas:
<221> Nome/Chave: CDS <222> Localizagao: (1)
(1296)
<400> Seqiiencia: atg gac gtt ate
Met 1
Asp Val lie
9
gtt Val 5
aaa
Lys
cca
Pro
acc Thr
cca Pro
tcc Ser 10
ctg Leu
aac Asn
ggg Gly
gaa
Glu
att lie 15
gga Gly
48
get Ala
ttg Leu
tct Ser
tcc Ser 20
aag
Lys
aac Asn
tac Tyr
acc Thr
aca
Thr 25
cgc Arg
tac
Tyr
ttg Leu
cta Leu
get
Ala 30
get Ala
gcg Ala
96
ctg Leu
gca
Ala
gaa
Glu 35
ggc Gly
aca
Thr
agt
Ser
acg
Thr
att lie 40
cat
His
tac Tyr
cct
Pro
get Ala
cac
His 45
agt
Ser
gaa
Glu
gat Asp
144
agt
Ser
gac Asp 50
get
Ala
atg Met
cgc Arg
aga
Arg
tgt Cys 55
att lie
agt Ser
gat Asp
ctt Leu
gga Gly 60
gcg Ala
g1 t a g V
CtC
Leu
gaa
Glu
192
gaa
Glu 65
gat Asp
gat Asp
age
Ser
aaa
Lys
ate
lie 70
gtt Val
att lie
cag Gln
ggc Gly
ttc Phe 75
C y g1 gG
age Ser
cat
His
cca
Pro
cgt
Arg 80
240
t g 5 gr9
C A gcc Ala
gcg Ala
aca Thr
gac
Asp
g a O
Cll
gA 3
gtt Val
ttg Leu
gcc
Ala
atg Met
a 1 5 t a 1 gv 3
gcg Ala
gcg Ala
gca
Ala
g 1 t a gV
ttt Phe 320
960
gcg Ala
gaa
Glu
ggc Gly
acc Thr
tea Ser 325
egg Arg
ttc Phe
tat Tyr
aat Asn
a 1 O t a 3 gv3
gag Glu
aac Asn
tta Leu
cgt Arg
tac
Tyr 335
aag
Lys
1008
ctg Leu
atg
Met
ggg
Gly
gta
Val 100
acg
Thr
gca
Ala
ctt Leu
tgt Cys
cct Pro 105
gat Asp
gtt Val
acg
Thr
ttt Phe
a 1 O t a 1 g V 1
aat Asn
acg Thr
336
tac
Tyr
ccg Pro
t P 5 a S 1 A 1
tct Ser
ctg Leu
ggc Gly
aaa
Lys
cgo g r 2
CAl
cca Pro
cat His
t P a S gA
gac Asp
ctg Leu 125
ate
lie
gat
Asp
gcg Ala
384
ctt Leu
t y O gl 3 gG 1
cag
Gln
ctt Leu
ggt Gly
gtt Val
O- U 5 a 1 3 g G 1
gta Val
caa
Gln
cac His
gaa
Glu
caa Gln 140
gga Gly
cgc Arg
ttg Leu
cca Pro
432
ate lie 145
acg Thr
ate lie
aaa
Lys
ggg
Gly
ggt Gly 150
cag
Gln
gcc
Ala
aag
Lys
ggt Gly
gga Gly 155
cat His
ate lie
cgt Arg
gta Val
tcc
Ser 160
480
t y g1 g G
tcg Ser
gtc Val
age Ser
tct Ser 165
cag
Gln
tat Tyr
ttg Leu
age Ser
g a O C 1 7 g A 1
tta Leu
ctg Leu
ttt Phe
gta Val
act Thr 175
cct Pro
528
ctt Leu
ctg Leu
gcc
Ala
gaa Glu 180
gac Asp
age
Ser
acg Thr
att 工Ie
a U 5 a 1 8 gG 1
gta Val
tta Leu
aac Asn
gac
Asp
ttg Leu 190
aaa
Lys
tcc Ser
576
Lys
g 1 t a gV
t 1 5 t a 9 gv 1
att lie
ggc
Gly
cag
Gln
acg Thr
ctg Leu 200
gaa
Glu
gta
Val
ttg Leu
gaa
Glu
cag
Gln 205
gcg Ala
C y g 1 gG
ate lie
624
gtc
Val
att lie 210
cat
His
gcg Ala
agt
Ser
t P a S gA
t P 5 a S 1 g'A 2
tac Tyr
atg
Met
tcc
Ser
ttc Phe
cgc Arg 220
gta
Val
cct Pro
C y g 1 g G
ggt Gly
672
caa
Gln 225
gcc Ala
tat Tyr
aaa
Lys
cca Pro
caa
Gln 230
aca
Thr
tat Tyr
acg Thr
gtt Val
caa
Gln 235
gga Gly
gac
Asp
tat Tyr
ccg Pro
t y O gl 4 g G 2
720
tea
Ser
gca
Ala
get
Ala
gtc
Val
ctc Leu 245
gcg Ala
gcc Ala
gcg Ala
get Ala
Clo t a 5 g V 2
acc
Thr
caa
Gln
tcg Ser
gat Asp
t 1 5 t a 5
g仏2
aaa
Lys
768
att lie
ttg Leu
cga
Arg
ttg Leu 260
atg Met
gaa
Glu
cag Gln
age Ser
aaa Lys 265
caa
Gln
ggt Gly
gag Glu
cgt Arg
Cao C 1 7 gA 2
att lie
gta
Val
816
gac Asp
gtt Val
ctg Leu 275
cgc Arg
atg
Met
atg Met
gaa
Glu
Q-Io t a 8 g V 2
ccg Pro
ttg Leu
acg Thr
cat
His
a U 5 a 1 8 gG 2
aac Asn
t P a S g A
gtg Val
864
gta Val
cac
His 290
g 1 t a
gV
caa
Gln
ggt Gly
aac Asn
ggt Gly 295
aca
Thr
ttg Leu
aaa
Lys
gcc
Ala
g 1 O t a O gv3
gaa
Glu
ttc Phe
gat
Asp
a y g1 gG
912
t P 5 a S O g'A3 gcg ctt ggc gcc tcg gtt caa tgg gta aaa gag taa 1296 Ala Leu Gly Ala Ser Val Gln Trp Val Lys Glu * 425 430
gat cat ttg Asp His Leu
Asn
Leu
Ala
Gly 60 Gly
Ala
Thr
Asp
Gln 140 His
Leu
Asn
Glu
<210> SEQ ID NO: 10 <211> Comprimento: 431 <212> Tipo: PRT
<213> Organismo: Paenibacillus pabuli
<400> Sequencia: Met Asp Val 工Ie
1
Ala
Leu
Ser
Glu
65
Asp
Leu
Tyr
Leu
lie 145 Gly
Leu
Lys
Val
Gln
Leu Ser Ala
Asp
50 Asp
Val
Met
Pro
Gly 130 Thr
Ser
Leu
Val
lie 210 Ala
Glu
35
Ala
Asp
Arg
Gly
Asp 115 Gln
lie
Val
Ala
Val 195 His
Ser
20
Gly
Met
Ser
Glu
Val 100 Ser
Leu
Lys
Ser
Glu 180 lie
Ala Tyr Lys
10 Val
5 Lys
Thr
Arg
Lys
Leu
85
Thr
Leu
Gly
Gly
Ser 165 Asp
Gly
Ser
Pro
Lys
Asn
Ser
Arg
lie
70
Asn
Ala
Gly
Val
Gly 150 Gln
Ser
Gln
Asp
Gln
Pro
Tyr
Thr
Cys
55
Val
Val
Leu
Lys
Glu 135 Gln
Tyr
Thr
Thr
Asp 215 Thr
Thr Pro Thr
lie
40
lie
lie
Gly
Cys
Arg 120 Val
Ala
Leu
lie
Leu 200 Tyr
Tyr
Thr
25
His
Ser
Gln
Asn
Pro 105 Pro
Gln
Lys
Ser
Glu 185 Glu
Met
Thr
Ser Leu 10
Arg Tyr
Tyr Pro
Asp Leu
Gly Phe 75
Ala Gly 90
Asp Val
His Asp
His Glu
Gly Gly 155 Ala Leu 170
Val Leu Val Leu Ser Phe Val Gln
Gly Glu lie Gly 15
Leu Ala Ala Ala 30
His Ser Glu Asp 45
Ala Val Leu Glu
Ser His Pro Arg 80
Val Leu Arg Phe 95
Phe Val Asn Thr 110
Leu lie Asp Ala 125
Gly Arg Leu Pro
工Ie Arg Val Ser 160
Phe Val Thr Pro 175
Asp Leu Lys Ser 190
Gln Ala Gly lie 205
Val Pro Gly Gly Asp Tyr Pro Gly
gaa tgt gac cga att aca gat tat ttg aac gaa ctg egg aag gca gga 1056 Glu Cys Asp Arg 工Ie Thr Asp Tyr Leu Asn Glu Leu Arg Lys Ala Gly 340 345 350
gcc aac gta gaa gaa cgt cag gcc gag att ate gta cat ggt cgt ccg 1104 Ala Asn Val Glu Glu Arg Gln Ala Glu 工Ie lie Val His Gly Arg Pro 355 360 365
gaa ggc gtc gaa ggc ggc gtt gag att aac get cac tac gat cat cgc 1152 Glu Gly Val Glu Gly Gly Val Glu 工Ie Asn Ala His Tyr Asp His Arg 370 375 380
gta att atg gca ctg acc gtt gtc ggt ctg cgt tcc aaa gaa ccg ctt 1200 Val lie Met Ala Leu Thr Val Val Gly Leu Arg Ser Lys Glu Pro Leu 385 390 395 400
cgt att egg gat gca cac cat gta gcc aag tct tat ccg caa tat ttc 1248 Arg lie Arg Asp Ala His His Val Ala Lys Ser Tyr Pro Gln Tyr Phe 405 410 415
Arg
220 Gly gat gtg cgt gaa tta aat
Asp Val Arg Glu Leu Asn 85
gta ggc aat gcg ggt gca gtg ctg
Val Gly Asn Ala Gly Ala Val Leu 90
ttc 288 Phe
get Ala
atg Met
cgc Arg
aga
Arg
tgt Cys 55
att lie
cgc Arg
gat Asp
ctt Leu
gga Gly 60
gca
Ala
g 1 t a
g V
ctt Leu
gaa
Glu
192
gaa
Glu 65
gat
Asp
gac Asp
age Ser
aaa
Lys
att 工Ie 70
gtt Val
ate
lie
cag
Gln
ggc Gly
ttt Phe 75
ggc Gly
age Ser
cat
His
cca Pro
cat His 80
240
225 Ser
lie
Asp
Val
Asp 305 Ala
Glu
Ala
Glu
Val 385 Arg
Ala
Leu
Val
His 290 Ala
Glu
Cys
Asn
Gly 370 lie
Ala Val Arg
lie Asp His
Leu 275 Val
Ala
Gly
Asp
Val 355 Val
Met
Arg
Leu
Leu 260 Arg
Gln
Thr
Thr
Arg 340 Glu
Glu
Ala
Asp
Gln 420
Leu
245 Met
Met
Gly
Asp
Ser 325 lie
Glu
Gly
Leu
Ala 405 Ala
230 Ala
Glu
Met
Asn
Ala 310 Arg
Thr
Arg
Gly
Thr 390 His
Ala
Gln
Glu
Gly 295 Val
Phe
Asp
Gln
Val 375 Val
Ala Ala Ser
His Leu Gly
Val 280 Thr
Leu
Tyr
Tyr
Ala 360 Glu
Val
Val
Ala
Lys 265 Pro
Leu
Ala
Asn
Leu 345 Glu
lie
Gly
Ala
Ser 425
Val 250 Gln
Leu
Lys
Met
Val 330 Asn
lie
Asn
Leu
Lys 410 Val
235 Thr
Gly
Thr
Ala
Val 315 Glu
Glu
lie
Ala
Arg 395 Ser
Gln
Glu
His
Val 300 Ala
Asn
Leu
Val
His 380 Ser
Ser Asp Arg
Tyr Gln Trp
Glu 285 Glu
Ala
Leu
Arg
His 365 Tyr
Lys
Pro
Val
Ala 270 Asn
Phe
Ala
Arg
Lys 350 Gly
Asp
Glu
Gln
Lys 430
Val 255 lie
Asp
Asp
Val
Tyr 335 Ala
Arg
His
Pro
Tyr 415 Glu
240 Lys
Val
Val
Gly
Phe 320 Lys
Gly
Pro
Arg
Leu 400 Phe
<210> SEQ ID NO: 11 <211> Comprimento: 1296 <212> Tipo: DNA
<213> Organismo: Paenibacillus pabuli
<220> Caracteristicas:
<2 21> Nome/Chave: CDS <222> Localizagao: (1)
(1296)
<400> Sequencia: atg gac gtt ate
Met 1
Asp Val 工Ie
11 gtt Val 5
aaa
Lys
ccg
Pro
acc Thr
cca Pro
tcc Ser 10
ctg Leu
aac Asn
gga Gly
gaa
Glu
att lie 15
a y g1 g G
48
get Ala
ttg Leu
tct Ser
tcc Ser 20
aaa Lys
aac Asn
tac Tyr
acc
Thr
aca
Thr 25
cgc Arg
tac Tyr
ttg Leu
cta Leu
get Ala 30
get Ala
get Ala
96
ctg Leu
gca
Ala
gaa Glu 35
ggc Gly
acg Thr
agt Ser
acg Thr
ate lie 40
cat His
tac
Tyr
ccg Pro
get Ala
cac
His 45
agt
Ser
gaa Glu
gat Asp
144
cgt
Arg 95 gcc
Ala
gcg Ala
aca Thr
gac Asp
ga O
Cll
61A3
gtt Val
ttg Leu
gcc
Ala
atg Met
a 1 5 t a 1 g V 3
gcg Ala
gca Ala
gca
Ala
Di 1 t a
gV
ttt Phe 320
960
gcg Ala
gaa
Glu
ggc Gly
acc Thr
tea Ser 325
egg Arg
ttc Phe
tat Tyr
aat Asn
a 1 O ta3 g V 3
gag Glu
aac Asn
tta Leu
cgt Arg
tac Tyr 335
aag
Lys
1008
cta Leu
atg Met
ggg Gly
gta Val 100
aca
Thr
gca
Ala
ctt Leu
tgt Cys
cct Pro 105
gag Glu
g1 t a g V
acg Thr
ttt
Phe
a 1 O t a 1 g V 1
aat Asn
acg
Thr
336
tac
Tyr
ccg Pro
t P 5 a S 1 g A 1
tct Ser
ctt Leu
ggc Gly
aaa
Lys
cgc Arg 120
cca Pro
cat His
gat Asp
gac Asp
ctg
Leu 125
ate
lie
gat Asp
gcg Ala
384
ctt Leu
t y O gl 3 g G 1
cag Gln
ctc Leu
ggt Gly
gtt Val
gag Glu 135
gta Val
cag
Gln
cac His
gaa
Glu
caa
Gln 140
gga Gly
cgc Arg
ttg Leu
cca Pro
432
ate lie 145
acg
Thr
ate
lie
aaa Lys
t y g 1 gG
ggt Gly 150
cag
Gln
get Ala
aag
Lys
ggt Gly
gga Gly 155
cat
His
ate lie
cgt
Arg
gta
Val
tcc
Ser 160
480
t y g 1 gG
tct Ser
gtc Val
age
Ser
tcc Ser 165
cag
Gln
tat Tyr
ttg Leu
age
Ser
gcg Ala 170
ttg Leu
ctg Leu
ttt Phe
gta Val
act Thr 175
ccg Pro
528
ctt Leu
ctg Leu
gcc
Ala
a U O a 1 8 g G 1
gac
Asp
age
Ser
aca
Thr
att lie
a U 5 a 1 8 gG 1
gta Val
ttg Leu
aat Asn
gac
Asp
ttg Leu 190
aaa
Lys
tcc
Ser
576
aaa
Lys
g 1 t a gV
t 1 5 t a 9 gv 1
att lie
ggt Gly
cag
Gln
acg
Thr
ctg
Leu 200
gaa
Glu
gta
Val
ctg Leu
gaa
Glu
caa
Gln 205
gcg Ala
t y g 1 gG
ate
lie
624
gtc Val
att lie 210
cat His
gcg Ala
agt Ser
gat Asp
t P 5 a S 1 g'A 2
tac Tyr
atg
Met
tcc
Ser
ttc Phe
cgc Arg 220
gta Val
cct
Pro
C y g1 gG
ggc Gly
672
caa
Gln 225
gcc Ala
tat Tyr
aaa
Lys
ccg
Pro
caa
Gln 230
aca
Thr
tat Tyr
acg
Thr
gtt Val
caa
Gln 235
gga
Gly
gac
Asp
tat Tyr
ccg Pro
t y O 9 14 gG 2
720
tea Ser
gca Ala
get Ala
gtc Val
ctc Leu 245
gcg Ala
get Ala
gcg Ala
gcg Ala
Clo t a 5 gv 2
act
Thr
caa
Gln
tcc Ser
gat Asp
t 1 5 t a 5 g V 2
Lys
768
att lie
ttg Leu
cga
Arg
ttg Leu 260
atg
Met
gaa
Glu
cag
Gln
age
Ser
aaa
Lys 265
caa
Gln
ggt Gly
gag Glu
cgt
Arg
t a O C 1 7 gA 2
att lie
gtt Val
816
gac
Asp
gtt Val
ctg
Leu 275
cgc Arg
atg Met
atg Met
gaa
Glu
g 1 O t a 8 g V 2
ccg Pro
ttg Leu
acg Thr
cat His
gu 5 a 1 8 tn G 2
aac Asn
gat
Asp
gtg Val
864
gtt Val
cac His 290
g1 t a
gV
caa
Gln
ggt Gly
aac Asn
ggt Gly 295
act
Thr
ttg Leu
aaa
Lys
gcc
Ala
g 1 O t a O gv3
gaa
Glu
ttc Phe
gat
Asp
a y g1 g G
912
t P 5 a S O ^ A 3 gcc Ala
gaa Glu
gta Val 385
cgt Arg
gat
Asp
aac Asn
ggc Gly 370
att lie
ate
lie
cat His
a 1 5 Cl t a 5 t a gv.3gv
atg Met
egg Arg
ttg Leu
gaa Glu
gaa
Glu
gca
Ala
gat
Asp
cag Gln 420
gaa Glu
ggc Gly
ctg Leu
gca
Ala 405
gcg Ala
cgt Arg
ggc Gly
acc Thr 390
cac His
ctt Leu
cag Gln
gtt Val 375
gtt Val
cat His
ggc Gly
gcc
Ala 360
gag Glu
gtc
Val
gta
Val
gcc
Ala
gag Glu
att lie
ggt Gly
gcc
Ala
tcg Ser 425
att lie
aac Asn
ctg Leu
aag
Lys 410
gtt Val
ate lie
get Ala
cgt
Arg 395
tct Ser
caa
Gln
gta
Val
cac His 380
tcc Ser
tat Tyr
tgg Trp
cat His 365
tac Tyr
ggt Gly
gat
Asp
aaa
Lys
ccg Pro
gta Val
gaa Glu
caa
Gln
aaa
Lys 430
cgt Arg
cat His
ccg Pro
tat Tyr 415
gag
Glu
ccg Pro
cgc Arg
ctt Leu 400
ttc Phe
taa
1104
1152
1200
1248
1296
<210> SEQ ID NO: 12 <211> Comprimento: 431 <212> Tipo: PRT
<213> Organismo: Paenibacillus pabuli
<400> Seqiiencia Met Asp Val lie 1
Ala
Leu
Ser
Glu
65
Asp
Leu
Tyr
Leu
lie 145 Gly
Leu
Lys
Val
Gln
Leu Ser Ala
Asp
50
Asp
Val
Met
Pro
Gly 130 Thr
Ser
Leu
Val
lie 210 Ala
Glu
35
Ala
Asp
Arg
Gly
Asp 115 Gln
lie
Val
Ala
Val 195 His
Ser
20
Gly
Met
Ser
Glu
Val 100 Ser
Leu
Lys
Ser
Glu 180 lie
Ala Tyr Lys
12 Val 5
Lys
Thr
Arg
Lys
Leu
85
Thr
Leu
Gly
Gly
Ser 165 Asp
Gly
Ser
Pro
Lys
Asn
Ser
Arg
lie
70
Asn
Ala
Gly
Val
Gly 150 Gln
Ser
Gln
Asp
Gln
Pro
Tyr
Thr
Cys
55
Val
Val
Leu
Lys
Glu 135 Gln
Tyr
Thr
Thr
Asp 215 Thr
Thr Pro Thr
lie
40
lie
lie
Gly
Cys
Arg 120 Val
Ala
Leu
lie
Leu 200 Tyr
Thr
25
His
Arg
Gln
Asn
Pro 105 Pro
Gln
Lys
Ser
Glu 185 Glu
Met Tyr Thr
Ser 10 Arg
Tyr
Asp
Gly
Ala
90
Glu
His
His
Gly
Ala 170 Val
Val
Ser
Val
Leu
Tyr
Pro
Leu
Phe
75
Gly
Val
Asp
Glu
Gly 155 Leu
Leu
Leu
Phe
Gln
Asn Gly Glu Leu Ala
Gly 60 Gly
Ala
Thr
Asp
Gln 140 His
Leu
Asn
Glu
Arg 220 Gly
Leu Ala
30 His Ser 45
Ala Val
Ser His
Val Leu
Phe Val 110 Leu lie 125
Gly Arg
lie Arg
Phe Val
Asp Leu 190 Gln Ala 205
Val Pro
工Ie
15
Ala
Glu
Leu
Pro
Arg
95
Asn
Asp
Leu
Val
Thr 175 Lys
Gly Gly Asp Tyr Pro
Gly
Ala
Asp
Glu
His 80 Phe
Thr
Ala
Pro
Ser 160 Pro
Ser
lie
Gly
Gly
gaa
Glu
tgt
Cys
gac
Asp
cga
Arg 340
att lie
acg
Thr
gat Asp
tat Tyr
ttg Leu 345
aac Asn
gaa Glu
ctg Leu
egg Arg
aag
Lys 350
gca
Ala
1056
a y g1 g G 225 230 235 240
Ser Ala Ala Val Leu Ala Ala Ala Ala Val Thr Gln Ser Asp Val Lys
245 250 255
lie Leu Arg Leu Met Glu Gln Ser Lys Gln Gly Glu Arg Ala lie Val
260 265 270
Asp Val Leu Arg Met Met Glu Val Pro Leu Thr His Glu Asn Asp Val
275 280 285
Val His Val Gln Gly Asn Gly Thr Leu Lys Ala Val Glu Phe Asp Gly
290 295 300
Asp Ala Ala Thr Asp Ala Val Leu Ala Met Val Ala Ala Ala Val Phe 305 310 315 320
Ala Glu Gly Thr Ser Arg Phe Tyr Asn Val Glu Asn Leu Arg Tyr Lys
325 330 335
Glu Cys Asp Arg lie Thr Asp Tyr Leu Asn Glu Leu Arg Lys Ala Gly
340 345 350
Ala Asn Val Glu Glu Arg Gln Ala Glu lie lie Val His Gly Arg Pro
355 360 365
Glu Gly Val Glu Gly Gly Val Glu lie Asn Ala His Tyr Asp His Arg
370 375 380
Val lie Met Ala Leu Thr Val Val Gly Leu Arg Ser Lys Glu Pro Leu 385 390 395 400
Arg lie Arg Asp Als His His Val Als Lys Ser Tyx Pro Gln Tyx Phe
405 410 415
Asp His Leu Gln Ala Leu Gly Ala Ser Val Gln Trp Val Lys Glu 420 425 430
<210> SEQ ID NO: 13 <211> Comprimento: 1251 <212> Tipo: DNA
<213> Organismo: Sphingobacterium multivorum/faecium
<220> Caracteristicas: <221> Nome/Chave: CDS <222> Localizagao: (1)
(1251)
<400> Seqiiencia: atg aat caa caa
Met 1
Asn Gln Gln
13 gtc Val 5
ate lie
acg
Thr
ctg Leu
acg Thr
cat His 10
cct Pro
tea Ser
aaa
Lys
aaa
Lys
ata
lie 15
cag Gln
48
ggt Gly
acg Thr
gtt Val
caa Gln 20
ctc Leu
aca
Thr
ggt Gly
tea Ser
aaa
Lys 25
tct Ser
gag Glu
age Ser
aac Asn
cgt Arg 30
get
Ala
ctt Leu
96
att lie
ate
lie
cag
Gln 35
tea Ser
ttg Leu
age Ser
aaa
Lys
gga Gly 40
caa
Gln
gtt
Val
gaa
Glu
ata lie
gcc Ala 45
aac Asn
ctt Leu
tct Ser
144
gaa
Glu
get Ala 50
gca
Ala
gat Asp
acg Thr
gta
Val
acg
Thr 55
tta Leu
aac Asn
cgt
Arg
gtg
Val
cta
Leu 60
caa Gln
att lie
get Ala
tea
Ser
192
t P 5 a S 6 gA
ccg
Pro
aaa
Lys
cca Pro
a y g 1 g G
ttc Phe 70
aac Asn
aca Thr
att lie
gac Asp
ate lie 75
ggt Gly
cca
Pro
gcg Ala
gga Gly
acg Thr 80
240
gcc Ala
atg
Met
cga Arg
ttc Phe
tta Leu 85
acg Thr
get Ala
tac Tyr
ctc Leu
aac
Asn 90
ctt Leu
gtc Val
aaa
Lys
gga Gly
aat Asn 95
ttt Phe
288 gag ggt gaa
Glu Gly Glu
tta Leu 180
acc
Thr
tcc
Ser
aga cct
Arg Pro
ate gcg gca cta
lie Ala Ala Leu
caa Gln 335
aag 1008 Lys
gag
Glu
acc Thr
tta Leu
aaa
Lys
att 工Ie 325
aag
Lys
gag
Glu
act Thr
tea atg acc ttg gat atg 576
Ser Met Thr Leu Asp Met 190
ctg Leu
aaa
Lys
agt
Ser 195
gtc Val
gy
g1 g G
att lie
cag
Gln
cat
His 200
gaa
Glu
tgg Trp
aaa
Lys
aac Asn
aat
Asn 205
gcg Ala
att lie
aaa
Lys
624
att lie
Q- a O
Cll g'A 2
ccg Pro
cag Gln
gca
Ala
ttt Phe
gu5 all gG 2
aaa
Lys
caa
Gln
aca Thr
ata lie
tat Tyr 220
gtc Val
gag Glu
cca Pro
t P a S g A
672
tgg Trp 225
age
Ser
get
Ala
get Ala
tcc Ser
tat Tyr 230
tgg Trp
tac
Tyr
get
Ala
ate
工Ie
C a 5 C 1 3 g A 2
gca
Ala
cta Leu
gca
Ala
gat Asp
a a O C 1 4 g A 2
720
aac Asn
gca Ala
tcg
Ser
ate
lie
a 1 5 t a 4 gv 2
ttg Leu
ccc Pro
gga Gly
tta Leu
aga
Arg 250
aaa
Lys
aac Asn
age
Ser
tta Leu
cag
Gln 255
ggt Gly
768
gat Asp
att lie
get Ala
att lie 260
ata
lie
age Ser
att lie
atg
Met
g U 5
a 1 6 g'G 2
cat His
ttt Phe
ggt Gly
gta Val
caa
Gln 270
tcg
Ser
age
Ser
816
ttt Phe
gaa
Glu
tcg Ser 275
gac Asp
a y g·1 g G
tta Leu
cac His
tta Leu 280
aat Asn
aaa
Lys
aag
Lys
gta Val
ate
lie 285
ggt Gly
tcg Ser
t P a S gA
864
gta Val
age
Ser 290
tta Leu
ttt Phe
aac Asn
ttt Phe
aaa
Lys 295
gaa
Glu
tgt Cys
ccc Pro
gat Asp
ctc Leu 300
gca Ala
caa Gln
act Thr
gta Val
912
t 1 5 t a O g V 3
gtt Val
gtc
Val
gcg Ala
get
Ala
Q- a O
Cll
61A3
tta Leu
aaa Lys
cga Arg
gat Asp
a 1 5 t a 1 g V 3
tct Ser
ttt Phe
acg Thr
ggc Gly
ttg Leu 320
960
ate ctt aca ggt act gaa cgc atg caa cag cgt cct ata ggt ata tta 336 lie Leu Thr Gly Thr Glu Arg Met Gln Gln Arg Pro lie Gly lie Leu 100 105 110
gtt gat gcc atg aaa gaa att ggt gca gac ate cac tat gac aag aaa 384 Val Asp Ala Met Lys Glu 工Ie Gly Ala Asp lie His Tyr Asp Lys Lys 115 120 125
gtc gga tac cct cct ttg aaa att gag ggc ggg ctg ttt caa gaa aaa 432 Val Gly Tyr Pro Pro Leu Lys 工Ie Glu Gly Gly Leu Phe Gln Glu Lys 130 135 140
gac cgt gtc aag att aaa ggt aat ate age age caa tat ata tea gcc 480 Asp Arg Val Lys lie Lys Gly Asn lie Ser Ser Gln Tyr lie Ser Ala 145 150 155 160
ctc tta tta att gca cct gca tta aaa aaa ggg ctt act tta gag att 528 Leu Leu Leu lie Ala Pro Ala Leu Lys Lys Gly Leu Thr Leu Glu lie 165 170 175
tat gta
1 a
V
r 5 y 8 T 1 acc tac 1056 Thr Tyr
ttc gat 1104 Phe Asp
gaa
Glu
att
lie
gcg Ala
aaa
Lys 340
ttt
Phe
a y g1 g G
gcc Ala
gag Glu
cta Leu 345
att
lie
gaa Glu
aat Asn
cat
His
tta Leu
cag
Gln
σ- a O
Cll
gA4
caa
Gln
get
Ala
ttt
Phe
gtc
Val
att
工Ie
415
gaa
Glu
1248
tat cct gat ttt Tyr Pro Asp Phe
cag cct gaa gag gtt act
Gln Pro Glu Glu Val Thr 365
cat ctg aaa aca gcg cag
His Leu Lys Thr Ala Gln 355
tag
1251
<210> SEQ ID NO: 14 <211> Comprimento: 416 <212> Tipo: PRT
<213> Organismo: Sphingobacterium multivorum/faecium
<400> Seqiiencia Met Asn Gln Gln 1
Gly
lie
Glu
Asp
65
Ala
lie
Val
Val
Asp 145 Leu
Glu
Leu
lie
Trp 225
Thr Val lie
Ala
50
Pro
Met
Leu
Asp
Gly 130 Arg
Leu
Gly
Lys
Gln
35
Ala
Lys
Arg
Thr
Ala 115 Tyr
Val
Leu
Glu
Ser 195 Pro
Ala 210
Ser Ala
Gln
20
Ser
Asp
Pro
Phe
Gly 100 Met
Pro
Lys
工Ie
Leu 180 Val
Gln
Ala
14 Val 5
Leu
Leu
Thr
Gly
Leu
85
Thr
Lys
Pro
lie
Ala 165 Thr
Gly
Ala
lie
Thr
Ser
Val
Phe
70
Thr
Glu
Glu
Leu
Lys 150 Pro
Ser
lie
Phe
Ser Tyr 230
Thr
Gly
Lys
Thr
55
Asn
Ala
Arg
lie
Lys 135 Gly
Ala
Arg
Gln
Glu 215 Trp
Leu Thr Ser
Gly
40
Leu
Thr
Tyr
Met
Gly 120 工Ie
Asn
Leu
Pro
His 200 Lys
Lys
25
Gln
Asn
lie
Leu
Gln 105 Ala
Glu
lie
Lys
Tyr 185 Glu
Gln Tyr Ala
His 10 Ser
Val
Arg
Asp
Asn
90
Gln
Asp
Gly
Ser
Lys 170 Val
Trp
Thr
lie
Pro
Glu
Glu
Val
lie
75
Leu
Arg
工Ie
Gly
Ser 155 Gly
Ser
Lys
lie
Ala 235
Ser
Ser
lie
Leu 60 Gly
Val
Pro
His
Leu 140 Gln
Leu
Met
Asn
Tyr 220 Ala
Lys Lys Asn
Ala
45
Gln
Pro
Lys
lie
Tyr 125 Phe
Tyr
Thr
Thr
Asn 205 Val
Arg
30
Asn
lie
Ala
Gly
Gly 110 Asp
Gln
lie
Leu
Leu 190 Ala
Glu Leu Ala
lie
15
Ala
Leu
Ala
Gly
Asn
95
lie
Lys
Glu
Ser
Glu 175 Asp
lie
Pro
Asp
Gln
Leu
Ser
Ser
Thr 80 Phe
Leu
Lys
Lys
Ala 160 lie
Met
Lys
Asp
Ala 240
act tac gaa gat cat cgc atg gcg atg gcg ttc gca cca ctg gca tta 1152 Thr Tyr Glu Asp His Arg Met Ala Met Ala Phe Ala Pro Leu Ala Leu 370 375 380
gtt ttc gac cag att aag att get gaa cct caa gtt gta gaa aaa tea 1200 Val Phe Asp Gln 工Ie Lys 工Ie Ala Glu Pro Gln Val Val Glu Lys Ser 385 390 395 400
gat ggc gat Asp Gly Asp 350
tgg
Trp 405 Asn
Asp
Phe
Val
Val 305 Glu
Glu
His
Thr
Val 385 Tyr
Ala
lie
Glu
Ser 290 Val
Thr
lie
Leu
Tyr 370 Phe
Ser lie Ala
Ser 275 Leu
Val
Leu
Ala
Lys 355 Glu
Asp
Pro Asp
lie 260 Asp
Phe
Ala
Lys
Lys 340 Thr
Asp
Gln
Phe
Val 245 lie
Gly
Asn
Ala
工Ie 325 Phe
Ala
His
lie
Trp 405
Leu
Ser
Leu
Phe
Ala 310 Lys
Gly
Gln
Arg
Lys 390 Asn
Pro
lie
His
Lys 295 Leu
Glu
Ala
Val
Met 375 lie
Gly Leu Met
Leu 280 Glu
Lys
Thr
Glu
Tyr 360 Ala
Ala His Leu
Glu 265 Asn
Cys
Arg
Asp
Leu 345 Gln
Met
Glu
Gln
Arg
250 His
Lys
Pro
Asp
Arg 330 lie
Pro
Ala
Pro
Ala 410
Lys
Phe
Lys
Asp
Val 315 lie
Glu
Glu
Phe
Gln 395 Gln
Asn
Gly
Val
Leu 300 Ser
Ala
Asp
Glu
Ala 380 Val
Ser
Val
lie 285 Ala
Phe
Ala
Gly
Val 365 Pro
Leu Gln Gly 255
Ser Ser
Val Ala Phe
Gln 270 Gly
Gln
Thr
Leu
Asp 350 Thr
Leu
Glu
Val
Ser Asp
Thr Val
Gly Leu 320 Gln Lys 335
Thr Tyr
Phe Asp
Ala Leu
Lys Ser 400 lie Glu 415
<210> <211> <212> <213>
SEQ ID NO: 15 Comprimento: 431 Tipo: PRT
Organismo: Enterobacteriaceae sp.
<400> Met 1
Pro
Seqiiencia ; Val Thr
Ala
Lys
Gln
65
Ala
Thr
Gly
His
lie 145 Ser
Ala
lie
Glu
Asp 225 Gly
Lys Ala Ser Lys
Ala
50
Pro
Pro
Pro
Ser
Leu 130 Gln
Ser
Ser
Asp
Asn 210 Glu
Gly
35
Ala
Asp
Phe
lie
Leu 115 Gly
Gly
Gln
Asp
Leu 195 Arg
Thr Ala Phe
Lys
20 lie
Arg
Gly
lie
Val 100 Val
Val
Pro
Phe
Val 180 Thr
Asn
Lys
Leu
15 lie 5
Ser
Ser
Asp
Ser
Asp
85
Ala
Thr
Lys
Leu
Leu 165 Ala
Leu
Tyr
Met
Leu
Gln
Ser
Glu
lie
Leu
70
Cys
Leu
Arg
Val
Lys 150 Thr
lie
Asp
Glu
Gln 230 Val
Pro
Met
lie
Val
55
Gln
Gly
Ser
Pro
Lys 135 Pro
Gly
Lys
Val
Glu 215 Arg
Gly Asp Gln
lie
40
Ser
lie
Glu
Lys
Met 120 Ser
Ala
Leu
Val
Met 200 Phe
Tyr Ala Gly
Arg
25
Asn
Arg
Thr
Ser
Glu 105 Asp
Asn
Asp
Leu
Thr 185 Lys
Tyr
Thr
Ala
Leu 10 Ala
Pro
Leu
Ser
Gly
90
Glu
Phe
Gln
Val
Leu 170 Asn
Arg
Phe
Val
lie
Thr
Cys
Gly
Gly
Glu
75
Leu
Val
Phe
Gly
Thr 155 Ala
Leu
Phe
Lys
Glu 235 Ala
Gly
Ala
His
Ala 60 Gly
Ser
Thr
Asp
Lys 140 Val
Tyr
Lys
Gly
Ala 220 Gly
lie
Ala
Ser
45
Arg
Val
lie
lie
Glu 125 Leu
Asp
Ala
Ser
Leu 205 Gly
Leu Gln Ser 15
Leu Val
Asp
Gly Pro
Ala
30
Asn
Leu
Lys
Arg
Lys 110 lie
Pro
Gly
Ala
Arg 190 Lys
Asn
Trp
lie
Asp Asp
Glu Asp
Pro Val 80
Met Phe 95
Gly Ser
Leu Pro
Leu Val
Ser Leu 160 Ala Asp 175
Pro Tyr
Thr Pro
Val Tyr
Ser Gly 240 Thr Val Arg
Ala
Lys
Cys 305 Gly
Asp
lie
Lys
Cys 385 Ala
Gly Leu Leu
Leu
290 Pro
Glu
Arg
His
Gly 370 Ala
Glu Gln Leu
Met 275 His
Asp
Thr
Gly
Leu 355 Ala
Val
Ala
Gly
Asp
260 Ser
Pro
Leu
Lys
Leu 340 Glu
Glu
Ala
Val
Gly 420
245 lie
Ala
Ala
Phe
工Ie 325 Thr
Ala
Asn
Asp
Pro 310 Lys
Ser Thr Ala
Leu
Gly Asp
Val Ser
Ala Leu 390 Asn Lys 405
Val Val
Leu 295 Pro
Gly
Gln
Leu
Ser 375 Lys
Ser
Ser
Gly 280 Asn
Leu
Val
Asp
Met 360 Arg
Ala
Tyr
Leu
Gln 265 lie
Ala
Val
Ser
Glu 345 Arg
His
Val
Pro
Asn 425
250 Ala
Ala
Phe
Ala
Arg 330 Phe
Val
Asp
Gly
Asp 410 His
Asp Lys Ala lie Asp
Glu Phe 300 Leu Ala 315
Leu Ala
Gly Lys
lie Gly
His Arg 380 Glu Thr 395
Phe Tyr
Ala 285 Asp
Ser
His
Met
Gly 365 lie
Thr Ser Gln Phe Asn
lie 270 Lys
Ala
Tyr
Lys
Gly 350 Lys
Ala
lie
Asp
Phe 430
255 Val
Glu
Thr
Cys
Glu 335 Val
Gln
lie
Asp
Lys 320 Ser
Glu
Gly Val
Met Ala
Glu His 400 Leu Lys 415 Ser
<210> SEQ ID NO: 16 <211> Comprimento: 418 <212> Tipo: PRT
<213> Organismo : Pseudomonas syringae cepa 1448a
<400> Sequencia: Met Arg Pro Gln
1
Val
Leu
Leu
Gly
65
Ser
Gly
Asp
Pro
Ser 145 Gly
Leu
Thr
Ala
Trp 225
Gly Arg Leu
Lys
50 Val
Gly
Thr
Phe
Leu 130 Gly
Arg
Leu
Gly
Met 210 Lys
Leu
35 Ser
Gln
His
Ala
Val 115 Val
Cys
lie
Met
Ser 195 Gln
Val 20 Ala
Asp
Val
Trp
Thr 100 Val
Asp
Pro
Glu
Ala 180 Glu
Ala Val Ser
16 Ala 5
Ser
Gly
Asp
Asp
Gln
85
Arg
Asp
Ala
Pro
lie 165 Gly
lie
Phe
Ala
Thr
Pro
Leu
Thr
Glu
70
Ala
Phe
Gly
Leu
Val 150 Asp
Ala
Gly
Gly
Thr 230
Leu
Pro
Ala
Arg
55
Pro
Pro
Leu
Asp
Gln 135 Ala
Gly
Cys
Ala
Ala 215 Gly
Thr Val Gly
Lys
40
Val
Asp
Gln
Thr
Glu 120 Arg
lie
Asn
Gly
Arg 200 Glu
Ser
25 Gly
Met
Asp
Gln
Ala 105 Tyr
Met
Lys
Leu
Lys 185 Gly
Val Tyr Arg
Leu
10 Lys
Thr
Ser
Ser
Ala
90
Ala
Met
Gly
Gly
Ser 170 Gly
Tyr
Gln
Ala
Pro Val Glu Arg Ser Ser Glu
Thr
75
Leu
Leu
Arg
Val
Lys 155 Ser
Pro
Val
Ala
Thr 235
工Ie Thr Asn 30
Arg Leu Thr 45
Ala Leu Arg 60
Phe Val Val
Phe Leu Gly
Ala Asn Phe 110
Lys Arg Pro 125
Glu Val Ser 140
Gly Gly Leu
Gln Tyr Val
Val Glu Val 190
Asp Leu Thr
205 lie Gly Glu 220
Asp Phe His
Pro Leu
15
Arg Ala
Gly Ala
Leu Met
Thr Ser 80
Asn Ala 95
Glu Gly
lie Gly
Ala Pro
Glu Ala 160 Ser Ala 175
Ala Leu
Leu Ala
Thr Ala
lie Glu 240 Pro Asp
Glu Gly
Asp Ala
Val 工Ie 290 Leu Ala 305
Leu Arg
Cys Ala
Val His
Asp Thr 370 Leu Lys 385
Thr Tyr Gln Arg
Ala
Asp
Leu 275 Asp
Ala
Val
lie
Ala 355 His
lie
Pro
Ser
lie 260 Ala
Gly
Phe
Lys
Ala 340 Asn
Ser
Ala
Gly
Ala 245 Asp
Ser
Ser
Asn
Glu 325 Pro
Pro
Asp
Gly
Tyr 405
Ala
Leu
Gln
Gln
Arg 310 Cys
Gly
Ala
His
lie 390 Trp
Thr
Gly
lie
Met 295 Gln
Asp
Leu
Leu
Arg 375 Arg
Asp
Tyr
Val
lie 280 Gln
Pro
Arg
Ala
Ala 360 lie
lie
Ala
Leu
Ala 265 Ala
Asp
Val
lie
Val 345 Gly
Ala
Leu
Leu
Trp 250 Ser
Ser
Ala
Arg
Ser 330 Glu
Thr
Met
Asp
Ala 410
Ala
Asp
Phe
lie
Phe 315 Ala
Glu
Thr
Cys
Pro 395 Ser
Ala
Ala
Pro
Pro 300 Val
Leu
Gly
Val
Phe 380 Asp
Leu
Gln
Phe
Asn 285 Thr
Gly
Ser
Asp
Asp 365 Ala
Cys
Gly
Ala
Thr 270 Met
Leu
lie
His
Asp 350 Ala
Leu
Val
Val
Leu Thr 255
Gln Pro
Pro Ala
Ala Val
Ala Asn 320 Gly Leu 335
Leu Leu
Leu lie
Ala Gly
Gly Lys 400 Arg Val 415
<210> SEQ ID NO: 17 <211> Comprimento: 418 <212> Tipo: PRT
<213> Organismo : Pseudomonas syringae cepa DC3 000
<400> Seqiiencia: Met Arg Pro Gln 1
Val
Leu
Leu
Gly
65
Ser
Gly
Asp
Pro
Ser 145 Gly
Leu
Thr
Ala
Trp
Gly Arg Leu
Lys
50
Val
Gly
Thr
Phe
Leu 130 Gly
Arg
Leu
Gly
Met 210 Lys
Leu
35 Ser
Gln
His
Ala
Val 115 Val
Cys
lie
Met
Ser 195 Gln
Val 20 Ala
Asp
Val
Trp
Thr 100 Val
Asp
Pro
Glu
Ala 180 Glu
Ala Val Ser
17 Ala
5 Ser
Gly
Asp
Asp
Gln
85
Arg
Asp
Ala
Pro
lie 165 Gly
lie
Phe
Ala
Thr
Pro
Leu
Thr
Glu
70
Ala
Phe
Gly
Leu
Val 150 Asp
Ala
Gly
Gly
Thr
Leu
Pro
Ala
Arg
55
Pro
Pro
Leu
Asp
Gln 135 Ala
Gly
Cys
Ala
Ala 215 Gly
Thr Val Gly
Lys
40
Val
Asp
Gln
Thr
Glu 120 Arg
lie
Asn
Gly
Arg 200 Glu
Ser
25 Gly
Met
Asp
Gln
Ala 105 Tyr
Met
Lys
Leu
Lys 185 Gly
Val Tyr His
Met 10 Lys
Thr
Ser
Ser
Ala
90
Ala
Met
Gly
Gly
Ser 170 Gly
Tyr
Gln
Ala
Pro
Ser
Ser
Glu
Thr
75
Leu
Leu
Arg
Val
Lys 155 Ser
Ser
Val
Ala
Thr
Val
工Ie
Arg
Ala 60 Phe
Phe
Ala
Lys
Glu 140 Gly
Gln
Leu
Asp
lie 220 Asp
Glu Arg Thr
Leu
45
Leu
Val
Leu
Asn
Arg 125 lie
Gly
Tyr
Glu
Leu 205 Gly
Asn
30
Thr
Arg
Val
Gly
Phe 110 Pro
Ser
Leu
Val
Val 190 Thr
Asp
Phe His
Pro Leu 15
Arg Ala
Gly Ala
Leu Met
Thr Ser 80
Asn Ala 95
Glu Gly
工Ie Gly
Ala Pro
Gln Ala 160 Ser Ala 175
Ala Leu Leu Ala Ala Ala lie Glu 225 Pro
Glu
Asp
Val
Leu 305 Leu
Cys
Val
Asp
Leu 385 Thr
Asp
Gly
Ala
lie 290 Ala
Arg
Ala
His
Thr 370 Lys
Ala Ser Asn
Tyr Gln Arg
Leu 275 Asp
Ala
Val
lie
Ala 355 His
lie
Pro
lie 260 Ala
Gly
Phe
Lys
Ala 340 Asn
Ser
Lys
Gly
Ala 245 Asp
Ser
Ser
Asn
Glu 325 Pro
Pro
Asp
Gly
Tyr 405
230 Ala
Leu
Gln
Gln
Arg 310 Cys
Gly
Ala
His
工Ie 390 Trp
Thr
Gly
lie
Met 295 Gln
Asp
Leu
Leu
Arg 375 His
Tyr Leu
Val
lie 280 Gln
Pro
Arg
Ala
Ala 360 lie
lie Asp Ala
Ala 265 Asp
Asp
Val
lie
Val 345 Gly
Ala
Gln
Leu
Trp 250 Ser
Ser
Ala
Arg
Ser 330 Glu
Thr
Met
Asp
Ala 410
235 Ala
Asp
Phe
lie
Phe 315 Ala
Glu
Thr
Cys
Pro 395 Ser
Ala
Ala
Pro
Pro 300 Val
Leu
Gly
Val
Phe 380 Asp
Gln
Phe
Asn 285 Thr
Gly
Cys
Asp
Asn 365 Ala
240
Ala Leu Thr 255
Gln Pro
Cys Leu Gly
Thr 270 Met
Leu
lie
Asp
Asp 350 Ala
Leu
Val
Val
Pro Ala
Ala Val
Ala Asn 320 Gly Leu 335
Leu lie
Leu 工Ie
Ala Gly
Ala Lys 400 Ser Val 415
<210> SEQ ID NO: 18 <211> Comprimento: 418 <212> Tipo: PRT
<213> Organismo: Pseudomonas syringae cepa B728
<400> Seqiiencia: Met Arg Pro Gln 1
Val Gly Arg Leu Leu
Leu Lys
50 Gly Val 65
Ser Gly
Gly Thr
Asp Phe
Pro Leu 130 Ser Gly 145
Gly Arg
Leu Leu
Thr Gly
Ala Met 210
Leu
35
Ser
Gln
His
Ala
Val 115 Val
Cys
lie
Met
Ser 195 Arg
Val 20 Ala
Asp
Val
Trp
Thr 100 Val
Asp
Pro
Glu
Ala 180 Glu
18 Ala
5 Ser
Gly
Asp
Asp
Gln
85
Arg
Asp
Ala
Pro
lie 165 Gly
lie Ala Phe
Thr
Pro
Leu
Thr
Glu
70
Ala
Phe
Gly
Leu
Val 150 Asp
Ala
Gly
Gly
Leu
Pro
Ala
Arg
55
Pro
Pro
Leu
Asp
Gln 135 Ala
Gly
Cys
Ala
Ala 215
Thr Val Gly
Lys
40
Val
Asp
Gln
Thr
Glu 120 Arg
lie
Asn
Gly
Arg 200 Glu
Ser
25
Gly
Met
Asp
Gln
Ala 105 Tyr
Met
Lys
Leu
Lys 185 Gly
Leu
10 Lys
Thr
Ser
Ser
Ala
90
Ala
Met
Gly
Gly
Ser 170 Gly
Tyr
Val Gln
Pro
Ser
Ser
Glu
Thr
75
Leu
Leu
Arg
Val
Lys 155 Ser
Pro
Leu
Ala
Val
lie
Arg
Ala 60 Phe
Phe
Ala
Lys
Glu 140 Gly
Gln
Val
Asp
lie 220
Glu Arg Thr
Leu
45
Leu
Val
Leu
Asn
Arg 125 Val
Gly
Tyr
Glu
Leu 205 Gly
Asn
30 Thr
Arg
Val
Gly
Phe 110 Pro
Ser
Leu
Val
Val 190 Thr
Pro Leu 15
Arg Ala
Gly Ala
Leu Met
Thr Ser 80
Asn Ala 95
Glu Gly
lie Gly
Ala Pro
Glu Ala 160 Ser Ala 175
Ala Leu
Leu Ala Asp Ala Ala Trp 225 Pro
Glu
Asp
Val
Leu 305 Leu
Cys
Val
Asp
Leu 385 Thr
Lys
Asp
Gly
Ala
lie 290 Ala
Arg
Ala
Thr
Thr 370 Lys
Tyr Gln Arg
Val
Ala
Ala
Leu 275 Asp
Ala
Val
工Ie
Ala 355 His
lie
Pro
Ser Ala Ser
lie 260 Ala
Gly
Phe
Lys
Ala 340 Asn
Ser
Ala
Gly
Ala 245 Asp
Ser
Ser
Asn
Glu 325 Pro
Pro
Asp
Gly
Tyr 405
Thr 230 Ala
Leu
Gln
Gln
Arg 310 Cys
Gly
Thr
His
lie 390 Trp
Gly
Thr
Gly
lie
Met 295 Gln
Asp
Leu
Leu
Arg 375 Arg
Tyr
Tyr
Val
lie 280 Gln
Pro
Arg
Ala
Ala 360 lie
Arg Ala Leu
lie Asp Ala
Ala 265 Ala
Asp
Val
lie
Val 345 Gly
Ala
Leu
Leu
Trp
250 Ser
Ser
Ala
Arg
Ser 330 Glu
Thr
Met
Asp
Ala 410
Thr 235 Ala
Asn
Phe
lie
Phe 315 Ala
Glu
Thr
Cys
Pro 395 Ser
Asp
Ala
Ala
Pro
Pro 300 Val
Leu
Gly
Val
Phe 380 Asp
Phe
Gln
Phe
Asn 285 Thr
Gly
Ser
Asp
Asp 365 Ala
His 工Ie Ala
Cys Leu Gly
Thr 270 Met
Leu
lie
Asn
Asp 350 Ala
Leu
Val
Val
Leu
255 Gln
Pro
Ala
Ala
Gly 335 Leu
Leu
Ala
Ala
Ser 415
Glu 240 Thr
Pro
Ala
Val
Asn 320 Leu
lie
lie
Gly
Lys 400 Val
<210> SEQ ID NO: 19 <211> Comprimento: 419 <212> Tipo: PRT
<213> Organismo : Brevundomonas vesicularis
<400> Met 1
Leu
Seqiiencia: Met Gly
Ala
Ala
Met
65
Gly
Ala
Gly
Gly
Glu 145 Ala
Ala
Leu
Ala
Met
Thr Gly Leu
Leu
50
Gly
Ser
Gly
Lys
Pro 130 Thr
Ser
Leu
Leu
Ala
Leu
35
Lys
Val
Gly
Thr
Val 115 Leu
Gly
Arg
Leu
Gly 195 Met
Arg 20 Leu
Ser
Thr
Lys
Ala 100 lie
Val
Cys
Val
Met 180 Glu
Arg
19 Arg 5
Ala
Ala
Asp
lie
Leu
85
Thr
Val
Asp
Pro
Gln 165 Met
His
Ala
Ala
Met
Gly
Asp
Asp
70
Gln
Arg
Asp
Ala
Pro 150 lie
Ala
lie
Phe
Lys
Pro
Leu
Thr
55
Glu
Pro
Phe
Gly
Leu 135 Val
Asp
Ala
Gly
Gly
Leu Thr Pro
Ala
40
Arg
Pro
Pro
Leu
Asp 120 Arg
Thr
Gly
Gly
Ala 200 Ala
Gly
25
Lys
Tyr
Asp
Ala
Thr 105 Ala
Ser
lie
Gly
Gly 185 Leu
Lys
lie
10
Ser
Gly
Met
Asp
Ala
90
Ala
His
Leu
Asn
Leu 170 Asp
Gly
Val
lie
Lys
Thr
Ala
Thr
75
Pro
Ala
Met
Gly
Gly 155 Ser
Arg
Tyr
Glu
Pro
Ser
Ser
Glu 60 Thr
Leu
Ala
Arg
lie 140 Thr
Ser
Ala
lie
Arg
Pro Gly lie
Arg
45
Ala
Phe
Phe
Ala
Lys 125 Asp
Gly
Gln
Val
Asp 205 Val
Thr
30
Leu
Leu
lie
Leu
Leu 110 Arg
Ala
Arg
Tyr
Asp 190 Leu
Lys
15 Asn
Thr
Arg
Val
Gly
95
Val
Pro
Ser
Phe
Val 175 Val
Thr Ser Pro
Pro
Arg
Gly
Ala
Lys 80 Asn
Asp
lie
Ala
Glu 160 Ser
Glu
Val
Val Ala 225 Glu
Ser
Pro
Ala
Val 305 Asn
Leu
lie
lie
Gly 385 Lys
210 Trp
Pro
Gly
Asp
Val 290 Leu
Leu
Ser
lie
Asp 370 Leu
Thr Tyr Glu
Arg
Asp
Gly
Ala 275 lie
Ala
Arg
Arg
Ala 355 Ser
Lys
Phe
Asp
Val Glu Ala
Lys
260 Lys
Asp
Ala
Val
工Ie 340 Ser
Phe
lie
Pro
Ser 245 lie
Ala
Gly
Phe
Lys 325 Val
Asp
Ala
Gly
Ser 405
Pro 230 Ala
Asp
Tyr
Ser
Asn 310 Glu
Pro
Pro
Asp
Gly 390 Tyr
215 Thr
Ala
Leu
Asp
Gln 295 Glu
Cys
Asn
Ser
His 375 lie
Gly
Thr
Gly
Leu 280 Met
Met
Asp
Leu
Leu 360 Arg
Thr Trp Asn
Tyr His Tyr
Thr 265 lie
Gln
Pro
Arg
Gly 345 Ala
lie
工Ie
Val
Leu 250 Pro
Ser
Asp
Val
lie 330 Thr
Gly
Ala
Leu
Leu 410
Ala 235 Trp
Ala
Lys
Ala
Arg 315 Arg
Asp
395 Ser
220 Ala
Ala
Glu
Phe
lie 300 Phe
Asp
Ala
Gln
Pro 285 Pro
Glu Lys 工Ie Met
Val Ala Leu Glu Gly
Ser 380 Pro
Leu 365 Phe
Asp Ser Leu
Phe Val lie 240
Glu Val Leu
255 Phe Ser Gln 270
His Leu Pro
Thr Leu Ala
Gly 工Ie Glu 320
Ser Ser Gly 335
Asp Asp Leu 350
Thr Ala Glu
Ala Leu Ala
Cys Val Ala 400
Gly Val Ala 415
<210> SEQ ID NO: 20 <211> Comprimento: 425 <212> Tipo: PRT
<213> Organismo: Agrobacterium tumefaciens cepa C58
<400> Sequencia: Met 工Ie Glu Leu 1
Val
Ala
Asp
Val
65
Leu
Thr
lie
Gln
Pro 145 Val
Met
Glu
Glu Pro Gly
Asp
50
Thr
Gln
Arg
Asp
Ala 130 Pro
Thr
Ala
Glu
Leu
35 Thr
Glu
Gln
Phe
Gly 115 Leu
Val
lie
Ala
lie 195
Pro 20 Ala
Leu
Pro
Pro
Leu 100 Asp
Arg
Thr
Asp
Ala 180 Gly
:20 Thr 5
Gly
Lys
Tyr
Asp
Glu
85
Thr
Glu
Ala
Val
Ala 165 Cys
lie
Ser
Gly
Met
Ala
70
Lys
Ala
His
Leu
Arg 150 Asn
Gly Ala Lys
Thr
Lys
Lys
Ala
55
Thr
Pro
Ala
Met
Gly 135 Gly
Leu
Asp
Gly
Pro Pro
Ser
Ser
40
Glu
Thr
Leu
Gly
Arg 120 Val
Lys
Ser
Lys
Tyr 200
lie
25
His
Ala
Phe
Phe
Ala 105 Lys
Glu
Gly
Ser
Pro 185 lie
Gly 10 Thr
Leu
Leu
Val
Leu
90
Leu
Arg
Ala
Met
Gln 170 Val
His
Asn
Ser
Arg
Val
75
Gly
Val
Pro
Asp
Gly 155 Tyr
Pro Leu
Arg Ala
Gly Ala
45 Glu Met 60
Glu Gly Asn Ala Asp Gly lie
Asp
Asp Leu
Ala 140 Phe
Val
lie
Thr
Leu
125 Pro
Pro
Ser
lie
Thr 205
Ser Gly Lys 15
Leu Leu
Leu
30 Leu
Gly
Thr
Gly
Ala 110 Pro
Thr
Lys
Ala
Leu 190 Ser
Lys Ser
Val Lys
Gly Val 80 Thr Ala 95
Val lie
Leu Val
Gly Cys
Gly Ser 160 Leu Leu 175
Lys Gly Ala Met Glu
Val 225 Ala
Ala
Lys
Asp
Ala 305 Val
Ala 210 His
Ser
lie
Ala
Gly 290 Phe
Lys 工Ie Arg Ala Asp
Phe Ala 370 lie Gly 385
Pro Gly
Phe
Pro
Ala
Asp
Tyr 275 Ser
Asn
Glu
Glu
Pro 355 Asp
Gly Tyr Lys Glu Ser
Gly
Thr
Ala
工Ie 260 Glu
Gln
Glu
Cys
Gly 340 Ser
His
工Ie
Trp
Ala 420
Ala Lys Gly
Thr 245 Gly
Val
Met
Thr
Asp 325 Leu
Leu
Arg
Ala
Lys 405 Ala
Tyr 230 Tyr
Thr
Met
Gln
Pro 310 Arg
Ala
Ala
工Ie
lie 390 Ala
Val 215 Thr
Leu
Pro
Ala
Asp 295 Val
工Ie
His
Gly
Ala 375 Gln
Leu
Glu Pro
Glu
Ala
Trp
Ala
Gln 280 Ala
Arg
Arg
Glu
Gln 360 Met
Asn
Ala
Gln
Arg
Thr
Gly
Asp 265 Phe
lie
Phe
Ala
Glu 345 Thr
Ser
Pro
Ser
His 425
Val Ser Asp
Ala 250 Lys
Pro
Pro
Val
Val 330 Gly
Val
Phe
Ala
Leu 410
Phe 235 Glu
Phe
His
Thr
Gly 315 Ser
Asp
Asp
Ala
Cys 395 Gly
Asn
220 His
Leu
Thr
Leu
lie 300 lie
Leu
Asp
Ala
Leu 380 Val
Ala
lie
Leu
Gln
Pro 285 Ala
Ala
Gly
Leu
Ser 365 Ala
Ala Val Asp
lie
Glu
Thr
Pro 270 Ala
Val
Asn
Leu
lie 350 lie
Ala
Lys
Tyr
Trp Arg Pro
Gly 255 Asp
Glu
lie
Leu
Asn 335 Val
Asp
Leu
Thr
Thr 415
Poy a e a O-Ou S r S r O U S 4 1 1 1 1 r 2 1 i h y Yol A 2 G A I A A 3 G H T L T 4 G
<210> SEQ ID NO: 21 <211> Comprimento: 428 <212> Tipo: PRT <213 > Organismo
<400> Seqilencia: Met Asn Cys Val 1
lie
Leu
lie
Glu
65
Val
Val
Phe
Asn
Val 145 Leu
Leu
Glu
Pro Pro
Ser
Lys
50
Asp
Ser
Arg
Asp
lie 130 Leu
Pro
Pro
Ser
Glu
35
Ala
Ala
Lys
Phe
Gly 115 Phe
Pro
Gly
Phe
Val
Clostridium acetobutylicum Cys
Ser
20
Glu
Thr
Lys
Glu
Leu 100 Gln
Asp
Leu
Asn
Leu 180 Gly
21 Lys 5
Lys
Glu
Cys
Asp
Lys
85
lie
Gly
Glu
Gln
lie 165 Glu
lie
Ser
Ser
lie
Asn
70
Val
Pro
Lys
Lys
lie 150 Ser
Gly Tyr Val
Asn
Leu
Thr
Gly
55
Ser
Tyr
lie
Leu
Glu 135 Lys
Ser
Asp
Asp
Pro
Gly
lie
40
Met
Thr
lie
Ser
Ser 120 lie
Gly
Gln
Ser
Met
His
25
Glu
Ser
Leu
Asp
Leu 105 Tyr
Ala
Arg
Phe
工Ie 185 Thr
Cys 10 Arg
Asn
Lys
Lys
Cys
90
lie
Arg
Tyr
Leu
工Ie 170 lie
Leu
Ala
lie
Leu
lie
75
Ser
Glu
Pro
Ser
Lys 155 Ser
Asn
lie Asp
Lys
lie
Ser
Gly 60 Lys
Glu
Glu
Leu
His 140 Ala
Gly
lie
Met
Gly Asp lie
Tyr
45
Ala
Lys
Ser
Arg
Asp 125 Pro
Gly
Leu
Thr
Leu
Cys
30
Ser
Leu
Gln
Gly
Asn 110 Ser
Glu
Met
Met
Thr 190 Lys
lie
15
Ala
Lys
lie
Lys
Ser
95
Val
Tyr
Gly
Phe
Phe 175 Asn
Lys
Ala
Asp
lie
Leu 80 Thr
Val
Phe
Lys
Asn 160 Ser
Leu Lys Phe Gly
Asn 225 Gln
Cys
Asp
Ser
Pro 305 Thr
Arg
Val
Gly
Gly 385 Glu
lie 210 Gln
Ala
Lys
lie
Lys 290 Asp
Thr
Leu
Glu
Gly 370 lie
Cys Leu Gly
195 Glu
Lys
Ala
Asp
Leu 275 Lys
Leu
Lys
Lys
Leu 355 Glu
Ala
Val
Gly
lie
Cys
Phe
Leu 260 Lys
Ser
Val
lie
Ala 340 Glu
Val
Ala
Ser
Asp 420
Glu
Lys
Trp 245 Asn
Lys
His
Pro
Val 325 Met
Asp
Glu
Leu
Lys 405 Val
200
Asn Lys Ala
215 Gly Thr Lys 230
Leu Ser Ala
lie Ser Ser
Met Gly Gly 280
Thr His Gly
295 lie Leu Ser 310
Asn Ala Ala
Ala Thr Glu
Gly Leu Leu 360
Ser Trp Asn
375 Arg Cys Glu 390
Ser Tyr Pro His Glu Trp
Tyr
Tyr
Gly
Leu 265 Ala
工Ie
Val
Arg
Leu 345 lie
Asp
Glu
Gln
Ser 425
Lys Ser Lys
lie 250 Gln
lie
Val
Val
Leu 330 Asn
Glu
His
Ser
Phe 410 Leu
Val 235 Leu
Gly
Asp
lie
Ala 315 Arg
Lys
Gly
Arg
Val 395 Trp
Phe 220 Glu
Asn
Asp
Glu
Asp 300 Ala
lie
Leu
Lys
lie 380 Thr
Ser Gly Glu
205 Phe
Gly
Gly
Lys
Lys 285 Ala
Leu
Lys
Gly
Glu 365 Ala
lie
Asp
lie Lys Gly Asp Asn
Val 270 Ser
Ser
Ser
Glu
Ala 350 Lys
Met
Asn
Leu
Phe Ser 240 工Ie Asn 255
lie Leu
Phe Ser
Gln Cys
Glu Gly 320 Ser Asp 335
Glu Val
Leu Lys
Ala Leu
Gly Ser 400 Lys Gln 415
<210> SEQ ID NO: 22 <211> Comprimento: 444 <212> Tipo: PRT
< 213 > Organismo: Ochrobactrum/Brucella
<400> Seqiiencia; Met Ala Cys Leu 1
Pro
Val
Pro
Ala
65
Arg
Pro
Pro
Leu
Asp 145 Gly
Pro Cys Thr
Gly
50
Lys
His
Asp
Ala
Thr 130 Glu
Gln Thr Val
Val
35
Ser
Gly
Met
Asp
Gln 115 Ala
Tyr
Asn
His
Leu 20 Thr
Lys
Thr
Ser
Thr 100 Pro
Ala
Met
Gly
Gly 180
22 Pro 5
Asp
Pro
Ser
Ser
Val
85
Thr
Leu
Val
Gln
lie 165 Ala
Asp
Gln
Pro
lie
Arg
70
Ala
Phe
Phe
Ala
Lys 150 Gln
Asp
Glu
Asn
Thr
55
Leu
Leu
Val
Leu
Thr 135 Arg
Ser Gly Pro
Val Gly Lys
Phe
40
Asn
Ser
Arg
Val
Gly 120 Val
Pro
Asp
Val
Cys
25
Pro
Arg
Gly
Gln
Thr 105 Asn
Gln
lie
Ser
Gln 185
Pro 10 Thr
Leu
Ala
Ala
Met
90
Ser
Ala
Gly
Gly
Pro 170 Ala
His
Leu
Thr
Leu
Leu
75
Gly
Gln
Gly
Thr
Pro 155 Thr
Val
Ser
Gly
Leu 60 Lys
Val
Gly
Thr
Val 140 Leu
Gly Arg Arg
Gly
Ser
Lys
45
Leu
Ser
Thr
Ser
Ala 125 Val
Leu
Cys
Phe
His Ser Thr 15
Gln Lys Thr 30
Val Ala Pro
Ala Ala Leu
Asp Asp Thr 80
lie Asp Glu 95
Leu Gln Leu 110
Met Arg Phe
Leu Asp Gly
Ala Thr Leu 160
Pro Pro Val 175
Glu 工Ie Asp 190 Gly Gly Cys
Ala 225 Ala
Gly
Thr
Gly
Val 305 Met
Thr
Asp
Leu
Leu 385 Arg
Arg
Lys
Gly 210 Arg
Gln
Tyr
Tyr
Val 290 lie
Gln
Pro
Arg
Ala 370 Ala
lie
lie
Ala
Leu 195 Glu
Gly
Val
Thr
Leu 275 Ala
Ala
Asp
Val
Val 355 Thr
Gly
Ala
Gln
Leu 435
Ser
Ala
Tyr
Asp
Ala 260 Trp
Ala
Gln
Ala
Arg 340 Gln
工Ie
Thr
Met
Asp 420 Ala
Ser
Pro
Val
lie 245 His
Ala
Gln
Phe
工Ie 325 Phe
Ala
Glu
Ala
Cys 405 Pro
Gln Tyr lie
Asp 230 Val
Asp
Ala
Asp
Pro 310 Pro
Thr
Leu
Gly
Cys 390 Phe
Asp Ser Leu
Glu 215 Leu
Asp
Tyr
Glu
Phe 295 Asn
Thr
Glu
His
Asp 375 Thr
Ala
Cys
Gly
Val 200 Val
Thr
Asp
Leu
Val 280 Thr
Met
Leu
Leu
Asp 360 Asp
Ala
Leu
Val
Val 440
Ser
Ala
Leu
Thr
lie 265 Leu
Gln
Gln
Ala
Ala 345 Gly
Leu
Leu
Ala
Ala 425 His
Ala
Leu
Asp
Thr 250 Glu
Thr
Pro
Ala
Val 330 Asn
Leu
Leu
lie
Gly 410 Lys
Leu Leu
Thr
Cys 235 Trp
Pro
Gly
Asp
Thr 315 Leu
Leu
Asn
Val
Asp 395 Leu
Thr Leu Ser
Gly 220 Met
Arg
Asp
Gly
Ala 300 Val
Ala
Arg
Glu
Ala 380 Thr
Lys
Tyr
Tyr
Met 205 Lys
Arg
Val
Ala
Arg 285 Lys
Val
Ala
Val
工Ie 365 Ser
His
Val
Pro
Leu
Asp
Ala
Ala
Ser 270 lie
Ala
Gly
Phe
Lys 350 Arg
Asp
Ala
Ser
Asp 430
Ala Ala
lie Gly
Phe Gly 240 Pro Thr 255
Ala Ala
Asp lie
Gln Ala
Ser Gln 320 Asn Asn 335
Glu Cys
Pro Gly
Pro Ala
Asp His 400 Gly lie 415
Tyr Trp
<210> SEQ ID NO: 23 <211> Comprimento: 42 5 <212> Tipo: PRT
<213> Organismo : Agrobacterium tumefaciens cepa C58
<400> Sequencia: Met 工Ie Glu Leu
1
Val
Ala
Asp
Val
65
Leu
Thr
工Ie
Glu
Pro 145 Val
Glu Pro Gly
Asp
50
Thr
His
Arg
Asp
Ala 130 Pro
Leu
35
Thr
Glu
Gln
Phe
Gly 115 Leu
Val Thr lie
Pro
20
Ala
Leu
Pro
Pro
Leu 100 Asp
Arg
Thr
Asp
23 Thr 5
Gly
Lys
Tyr
Asp
Glu
85
Thr
Glu
Ser
Val
Ala
lie
Ser
Gly
Met
Ala
70
Lys
Ala
His
Leu
Cys 150 Asn
Thr
Lys
Lys
Ala
55
Thr
Pro
Ala
Met
Gly 135 Gly
Pro Pro Ser
Ser
40
Glu
Thr
Leu
Ala
Arg 120 Val
Lys Leu Ser
lie
25
Arg
Ala
Phe
Phe
Ala 105 Lys
Glu
Gly
Ser
Gly 10 Thr
Leu
Leu
Val
Leu
90
Leu
Arg
Ala
Thr
Gln
His
Asn
Thr
Arg
Val
75
Gly
Val
Pro
Glu
Pro
Arg
Gly
Glu 60 Glu
Asn
Asp
lie
Ala 140 Phe
Gly 155
Tyr Val
Leu
Ala
Ala
45
Met
Ser
Ala
Gly
Met 125 Pro
Pro
Ser
Ser Gly Lys 15
Leu Leu
Leu
30 Leu
Gly
Ser
Gly
Ala 110 Pro
Thr
Lys
Ala
Lys Ser
Val Lys
Gly Gly 80
Thr Ala 95
Val lie
Leu Val
Gly Cys
Gly Ser 160 Leu Leu Asp Phe
235 Ala Glu 250
Lys Phe Pro His Pro Thr
Arg Phe Val Gly 315
Arg Ala Val Ser 330
Glu Glu Gly Asp 345
Gln Thr Val Asn 360
Met Ser Phe Ala
Asn Pro Ala Cys 395
Ala Ser Leu Gly 410
Gln His 425
solfataricus
Ser Lys 工Ie Ser 10
lie Arg Leu lie 25
Leu Val Leu Ser 40
Leu Gly Val Lys
Leu Glu lie Lys 75
Leu Arg Met Leu 90
lie Asp Ala Asp 105
Gln Ala Leu Ser 120
Leu Thr 工Ie Thr
Asp Glu Ser Ser 155
170
Lys Pro Val Asp 185
Tyr lie Asp Leu 200
Glu Arg Val Ser
lie
Thr
Asn 220 His
Leu
Thr
Leu
lie 300 lie
Leu
Asp
Ala
Leu 380 Val
Val
Gly
Phe
Glu
Val 60 Glu
lie
Glu
Asn
Gly 140 Gln
lie
Thr 205 Ala
lie
Leu
Gln
Pro 285 Ala
Ala
Gly
Leu
Ser 365 Ala
Gly
Glu
lie
Leu
Asp
45
Lys
Arg
Pro
Ser
Tyr 125 Lys
Tyr
Leu 190 Ser
lie
Glu
Thr
Pro 270 Ala
Val
Asn
Leu
lie 350 lie
Ala
Lys
Tyr
lie
Ser
30
Val
Asn
Phe
lie
Leu 110 Gly
Leu
lie
175 Lys
Ala
Trp
Pro
Gly 255 Asp
Glu
Leu
Leu
Asn 335 Val
Asp
Leu
Thr
Ser 415
Lys
15
Leu
lie
Asn
lie
Leu
95
Arg
lie
Ser
Ser
Gly
Met
Arg
Asp 240 Gly
Ala
lie
Ala
Arg 320 Glu
His
Thr
Lys
Tyr 400 Glu
Ala
Phe
Asp
Ser
Lys 80 Ala
Arg
Ser
Ser
Gly 160
Met
Glu
Glu
Val 225 Ala
Ala
Lys
Asp
Ala 305 Val
工Ie
Ser
Phe
lie 385 Pro
Ala Ala Glu
Ala 210 His
Ser
lie
Ala
Gly 290 Phe
Lys
Arg
Asp
Ala 370 Gly
Gly Lys Glu
lie 195 Phe
Pro
Ala
Asp
His 275 Ser
Asn
Glu
Asp
Pro 355 Asp
Gly
Tyr
Thr
Ala 180 Gly
Gly
Thr
Ala
lie 260 Glu
Gln
Glu
Cys
Gly 340 Ser
His
lie
Trp
Ala 420
165 Cys
Ala
Ala
Gly
Thr 245 Gly
Val
Met
Thr
Asp 325 Leu
Leu
Arg
Ala
Lys 405 Ala
Gly
Lys
Lys
Tyr 230 Tyr
Thr
Met
Gln
Pro 310 Arg
Ala
Ala
lie
lie 390 Ala
Asp
Gly
Val 215 Thr
Leu
Pro
Ala
Asp 295 Val
lie
His
Gly
Ala 375 Gln
Leu Glu Pro
<210> SEQ 工D NO: 24 <211> Comprimento: 414 <212> Tipo: PRT <213> Organismo: Sulfolobus
<400> Seqiiencia: Met lie Val Lys 1
Pro
Thr
Ala
Glu
65
Leu
Ala
Arg
Phe
Asn 145
Gln Ser Arg
lie
50
Phe
Lys
lie
Pro
Ser 130 Glu
Val
35
Lys
lie
Gly
Gly
Leu 115 Ser
Lys 20 Tyr
Ser
Pro
Ser
Gly 100 Asn
Tyr
工Ie Lys
24 lie 5
Ser
Leu
Val
Pro
Ala
85
Glu
Arg
Ser
lie
Tyr
Leu
His
Arg
Glu
70
Thr
Val
lie
Leu
Ser 150
Pro
Ala
Asn
Ala
55
Lys
Thr
Thr
Val
Pro 135 Gly 工Ie
Gly
Arg
Leu 335 lie
Leu
Asn
Asn
Val 15 工Ie
Ser
Gly
Lys
Asn
95
Lys
Pro
Ser
Gly
Leu
lie 175 Leu
His
Gly
Gly
Gly
Glu 270 Pro
Ala
Glu
lie
Leu 350 Cys
Val
Pro
Glu
Leu
Tyr
30
lie
Leu
Ser
Cys
Val 110 Arg
Cys
Ser
Gly
Leu
Phe
Val
Tyr
Gly 240 His
Lys
Lys
Leu
Leu 320 Gly
Phe
Asn
Gly
Tyr 400
Gly
lie
Tyr
Ala
Thr 80 Glu
Glu
Leu
Ser
Val 160 Leu
Leu
Pro
Lys
Asn
Gly 225 lie
Ser
Asp
lie
Ser 305 Arg
Leu
Gly
Asp
Gly 385 Trp
lie
Pro
Arg
Pro 210 Leu
Thr
lie
Gly
Asp 290 Ala
lie
Tyr
lie
His 370 Val
Tyr Ala
lie
Phe 195 Asn
Ala
工Ie
Val
Arg 275 lie
lie
Lys
Gly
Asn 355 Arg
lie Gln Asp
Ser 180 Gly
Asn
Ser
Thr
Lys 260 Trp
Asp
Ala
Glu
Val 340 Lys
Val
Thr
Leu
Leu 165 Ser
Ser
Leu
Phe
Asn 245 lie
Phe
Asp
Glu
Ser 325 Gly
Gly
Ala
Ser
Leu 405
His
Lys
Asp
Val
Tyr 230 Leu
Phe
Val
Ala
Gly 310 Asp
Ser
Met
Met
Ala 390 Ser
lie
Ser
Val
Glu 215 Ala
Trp
Ser
Lys
Pro 295 Thr
Arg
Glu
Leu
Met 375 Glu
Leu Asn Tyr
Lys 200 Phe
Leu
Glu
Glu
Ala 280 Asp
Ser
lie
Val
Asn 360 Ser
Cys Leu Asn
工Ie 185 Phe
Gln
Ser
Pro
Met 265 Lys
Leu
Glu
Glu
Lys 345 Ser
Ser
Val
Ala
Gly 170 Leu
Tyr
Gly
Ala
Lys 250 Gly
Asp
Ala
lie
Ser 330 Tyr
Pro
Ala
Gly
Lys 410
Gly
Leu
Gly
Glu
Leu 235 Glu
Ala
Lys
Met
lie 315 lie
Asn
Val
Leu
Lys 395 lie
Ser
Thr
Ser
Val 220 Val
Tyr
Ser
Tyr
Thr 300 Gly
Arg
Ser
Thr
Ala 380 Ser
lie
lie
Lys 205 Ala
Ser
Phe
Ser
Ser 285 lie
lie
Lys
lie
Asp 365 Leu
Asn Ser 工Ie
<210> SEQ ID NO: 25 <211> Comprimento: 424 <212> Tipo: PRT
<213> Organismo: Fusobacterium nucleatum
<400> Seqiiencia: Met Arg Asn Met 1
Glu
Ala
Ser
Asn
65
Phe
Ser
Asn
Ser
lie 145 Tyr
Val Thr Ser
Asp 50 工Ie
Asp
Gly
Lys
Pro 130 Asn
Ser
35
Asp
Glu
Lys
Ser
lie 115 Tyr
Glu Glu 工Ie
Pro
20
Leu
lie
Lys
Glu
Thr 100 Leu
Phe
Asn
Asp
25 Asn
5 Pro
Ala
lie
Lys
Tyr
85
Leu
Phe
Glu
Lys
Gly
Lys
Pro
Lys
Ala
Asp
70
Leu
Arg
Lys
Asn
lie 150 Asn
Lys
Ser
Gly
Thr
55
Asn
Asn
Phe
Gly
Phe 135 Leu
工Ie lie Lys
lie
40
lie
Tyr
Asn
Leu
Lys 120 Asp
Leu lie Ser
Ser
25
Ser
Glu
Leu
Asp
Phe 105 Gly
Lys
Asp
Ser
Lys 10 Val
Lys
Ala
Leu
Ser
90
Pro
Lys
Tyr
Gly
Gln
Ala
Leu
lie
Met
lie
75
Glu
Leu
Leu
Gln
Glu 155 Phe
Asp
His
Glu
Lys 60 Asp
lie
Ser
Phe
lie 140 Leu
Lys
Arg
Asn
45
Lys
Gly
Asp
lie
Lys 125 Lys
Lys
lie Thr
Asp
Gly
Asp 255 Tyr Phe
Lys
Lys
Glu 225 Tyr
lie
lie
Leu
Leu 305 Arg
Leu
lie
Ser
Ala 385 Val
Ser Leu Leu
Phe 210 Gly
Ser
Lys
lie
lie 290 Lys
Leu
Ser
Asn
Leu 370 Ser
Lys Gly Lys
Glu 195 Gly
Asn
Gln
lie
Asp 275 Leu
Ala
Arg
Lys
Ser 355 Ser
Thr
Lys
工Ie
Pro 180 Ser
lie
Gln
Val
Asn 260 Phe
Asp
Cys
lie
Leu 340 Arg
Ser
Cys
Ser
Tyr 420
165 Leu
Ser
Asn
Thr
Ala 245 Gly
lie
Gly
lie
Lys 325 Gly
Lys
His
Tyr
Tyr 405 Glu
Leu
Ser
lie
Tyr 230 Phe
Leu
Ser
Ser
Ser 310 Glu
Phe
Asn
Ser
Glu 390 Pro
Asn
Tyr
lie 215 Lys
Phe Asn Val Glu
Gly Asn 185 lie Asp 200
Asn Asn Ser Gly Leu Val
Glu 295 Lys
Ser
Asp
Phe
Asp 375 Gly
lie 280 Thr
Asn 265 Asp
Pro Lys Glu Asp Arg Leu
Asn
Tyr Leu
Asn 360 His
Glu
Phe
Gly
lie 345 Glu
Arg
lie
Trp
170 Ser
工Ie
Ser
Asn
Ala 250 Ser
Asn
Asp
lie
Leu 330 Glu
lie
lie
lie
Glu 410
Lys
Thr
Tyr
Tyr 235 Asn
Leu
Trp
工Ie
Glu 315 Ser
Lys
Ser
Ala
Leu 395 Val
工Ie
Leu
Lys 220 Gln
Ser
Gln
Thr
lie 300 lie
Ala
Glu
Asn
Met 380 Asp
175
lie 工Ie Lys Gly 190
Cys Leu Asn
Asp
205 Glu
Val
lie
Gly
Lys 285 Pro
Val
Thr
Asp
Asn 365 Thr
Asn Phe Leu
Phe lie lie
Glu Ala Asp 240
Gly Ser Asn
255 Asp Lys Lys 270
Asn Glu Lys
lie Leu Ser
Asn lie Ala 320
Val Gln Glu
335 Ser lie Leu 350
Ser Pro 工Ie
Val Ala lie
Leu Asp Cys 400
Ser Leu Gly 415
<210> SEQ ID NO: 26 <211> Comprimento: 428 <212> Tipo: PRT
<213> Organismo: Methanopyrus kandleri
<400> Seqiiencia: Met Lys Arg Val 1
Cys
Ser
Asp
Asp
65
Asp
Thr
Thr
Leu
Val 145
Pro Pro Leu
Val
50
Val
Ser
Thr
lie
Leu 130 Arg
Cys
35
Arg
Asp
Pro
Leu
Leu 115 Ala
Pro
20
Asp
Ala
Gly
Arg
Arg 100 Thr
Ala Gly Glu
26 Glu
5 Ser
Gly
Thr
Glu
Ala
85
Leu
Gly
Leu
Glu
Leu
Lys
Ser
Leu
Glu
70
Pro
Gly
Asp
Arg
Tyr 150
Glu
Ser
Thr
Arg
55
Arg
Glu
Cys
Asp
Ser 135 Pro
Gly 工Ie Gly
Glu
40
Leu
Leu
Asp
Gly
Ser 120 Leu
Ser
25
Leu
Cys
Glu
Val
Leu 105 Leu
Gly Pro Val
Pro 10 His
Trp
Arg
Ala
Val
90
Ala
Arg
Val
Val
Glu
Arg
Asn
Met
Thr
75
Asp
Ala
Ser
Asp
工Ie 155
Val
Ala
Val
Leu 60 Val
Cys
Leu
Arg
Ala 140 Ser
Arg Gly Leu
Leu
45
Gly
Ser
Gly
Val
Pro 125 Arg
lie
30
Asp
Ala
Gly
Asn
Glu 110 Val
Gly Gly Arg
Thr
15
Ala
Ala
Glu
Phe
Ser
95
Gly
Gly
Arg
Pro
Val
Ala
Glu
Val
Gly 80 Gly
Thr
Asp
Val
Leu 160 Arg Glu Arg Val Ala Val Tyr Gly Asp Val Ser Ser Gln Phe Val Ser
165 170 175
Ala Leu Leu Phe Leu Gly Ala Gly Leu Gly Ala Leu Arg Val Asp Val
180 185 190
Val Gly Asp Leu Arg Ser Arg Pro Tyr Val Asp Met Thr Val Glu Thr
195 200 205
Leu Glu Arg Phe Gly Val Ser Val Val Arg Glu Gly Ser Ser Phe Glu
210 215 220
Val Glu Gly Arg Pro Arg Ser Pro Gly Lys Leu Arg Val Glu Asn Asp 225 230 235 240
Trp Ser Ser Ala Gly Tyr Phe Val Ala Leu Gly Ala 工Ie Gly Gly Glu
245 250 255
Met Arg 工Ie Glu Gly Val Asp Leu Asp Ser Ser His Pro Asp Arg Arg
260 265 270
lie Val Glu lie Thr Arg Glu Met Gly Ala Glu Val Arg Arg lie Asp
275 280 285
Gly Gly 工Ie Val Val Arg Ser Thr Gly Arg Leu Glu Gly Val Glu Val
290 295 300
Asp Leu Ser Asp Ser Pro Asp Leu Val Pro Thr Val Ala Ala Met Ala 305 310 315 320
Cys Phe Ala Glu Gly Val Thr Arg lie Glu Asn Val Gly His Leu Arg
325 330 335
Tyr Lys Glu Val Asp Arg Leu Arg Ala Leu Ala Ala Glu Leu Pro Lys
340 345 350
Phe Gly Val Glu Val Arg Glu Gly Lys Asp Trp Leu Glu lie Val Gly
355 360 365
Gly Glu Pro Val Gly Ala Arg Val Asp Ser Arg Gly Asp His Arg Met
370 375 380
Ala Met Ala Leu Ala Val Val Gly Ala Phe Ala Arg Gly Lys Thr Val 385 390 395 400
Val Glu Arg Ala Asp Ala Val Ser 工Ie Ser Tyr Pro Arg Phe Trp Glu
405 410 415
Asp Leu Ala Ser Val Gly Val Pro Val His Ser Val 420 425
<210> SEQ ID NO: 27 <211> Comprimento: 436 <212> Tipo: PRT
<213> Organismo: Arthrobacter globiformis <400> Seqiiencia: 27
Met Ala Leu Glu Arg Gly Gln His Gly Arg Ser Arg Arg Leu Phe Gly
10 15
Ala Ser Leu Glu Arg lie Thr Met Glu Thr Asp Arg Leu Val lie Pro
25 30
Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu Ala Ala Ala Ala
40 45
Lys Gly Thr Ser Val Leu Val Arg Pro Leu Val Ser Ala Asp Thr Ser
50 55 60
Ala Phe Lys Thr Ala lie Gln Ala Leu Gly Ala Asn Val Ser Ala Asp 65 70 75 80
Gly Asp Asn Trp Val Val Glu Gly Leu Gly Gln Ala Pro His Leu Asp
85 90 95
Ala Asp lie Trp Cys Glu Asp Ala Gly Thr Val Ala Arg Phe Leu Pro
100 105 110
Pro Phe Val Ala Ala Gly Gln Gly Lys Phe Thr Val Asp Gly Ser Glu
115 120 125
Gln Leu Arg Arg Arg Pro Leu Arg Pro Leu Val Asp Gly 工Ie Arg His
130 135 140
Leu Gly Ala Arg Val Ser Ser Glu Gln Leu Pro Leu Thr lie Glu Ala 145 Ser
Gln
Leu
Thr
Ala 225 lie
Val
Gln
Val
Asn 305 Thr
Asn
Glu
Trp
His 385 Val
Pro
Thr
Gly
Phe
Arg
Leu 210 Thr
Glu
Ser
Gly
His 290 Gly
Leu
lie
Thr
Met 370 Arg
Asp
Gly
Leu
Leu Ala Ala
Val 195 Arg
Val
Pro
Gly
Asp 275 Trp
Asp
Ala
Gly
Asn 355 Arg
Asp
Gly
Phe
Pro 435
Ser 180 Arg
Met
Ser
Asp
Arg 260 Thr
Ala
lie
Ala
His 340 Leu
lie
His
lie
Phe 420 Gly
Gly 165 Gly
lie
Met
Val
Ala 245 Ser
Ser
Pro
Glu
lie 325 Ma
Arg
Tyr
Arg
Thr 405 Asp
150 Gly
Leu
Pro
Arg
Pro 230 Ser
Phe
Phe
Asn
Val 310 Ala
Arg
Thr
Pro
lie 390 Leu
Glu
lie
Asn
Asp 215 Pro
Thr
Glu
Phe
Ser 295 Asp
Pro
Leu
Leu
Ser 375 Ala
Tyr Glu lie 170
Met Ala Ala 185
Pro Val Ser 200
Phe Gly Leu
Gly Arg Tyr
Ala Ser Tyr 250
Phe Gln Gly 265
Asn Val Leu 280
Val Thr lie
Met Gly Glu
Leu Ala Asp 330
Lys Glu Ser 345
Gly Val Gln 360
Thr Pro His Met Ala Phe
Asp Tyr Leu
155 Glu
Pro
Gln
Glu
Thr 235 Phe
Leu
Gly
Ser
lie 315 Gly
Asp
Thr
Gly
Ser 395 Cys
Asp Pro Gln 410
Gly Arg Leu Phe 425
Ala
Tyr
Pro
Thr 220 Ala
Ala
Gly
Arg
Gly 300 Ser
Pro
Arg
Asp
Gly 380 lie
Val
Pro
His Gln Ala
Tyr 205 Ser
Arg
Ala
Thr
Leu 285 Pro
Asp
lie
工Ie
Val 365 Arg
Leu
Gly
Glu
Arg 190 Leu
Thr
Arg
Ala
Asp 270 Gly
Glu
Thr
Thr
Ser 350 Gly
Val
Gly
Lys
Lys 430
Ser 175 Gln
Thr
Asp
Tyr
Ser 255 Ser
Ala
Arg
Phe
工Ie 335 Ala
His
Asn
Leu
Thr 415 Ala
160 Ser
Gly
Met
Gly
Glu 240 Ala
lie
Glu
Leu
Met 320 Thr
Met
Asp
Cys
Arg 400 Phe
Leu
<210> SEQ ID NO: 28 <211> Comprimento: 1251 <212> Tipo: DNA
<213> Organismo: Sequencia Artificial
<220> Caracteristicas:
<223> Outras informagoes: seqiiencia sintetica codificando GRG31 (syngrg31)
<400> Sequencia: 28 atgaaccagc aggtgatcac cttgacacat ctcaccggca gcaagagcga gagcaacagg caagtggaga tcgccaacct ctcagaagct caaattgctt cagatccaaa gcctggcttc gccatgaggt tcttgacggc ctacctcaac actgaaagga tgcagcagcg gcccatcggc gccgacatcc actacgacaa gaaggtgggc ttccaagaga aggaccgcgt caagatcaag ctgctgctca tcgcgccggc gctgaagaag acatcaaggc cttatgtgag catgacgctg gaatggaaga acaacgccat caagattgct gtggagccag attggagcgc cgcctcatat aatgcaagca tcgtgctgcc agggctgagg
ccaagcaaga agatccaagg caccgtgcag 60
gcgctcatca ttcagagctt gagcaagggc 120
gctgacaccg tcaccctcaa cagggtgctg 180
aacaccatcg acattgggcc ggccggcacc 240
ctggtgaagg gcaacttcat cctcaccggc 300 atcctggtgg acgccatgaa ggagatcggc 360
tacccgccgc taaagattga aggaggcctc 420
ggcaacatca gcagccagta catctcggcg 480
gggctgacgc tggagattga aggagagctg 540
gacatgctga agagcgtcgg catccagcat 600
cctcaagcat ttgagaagca gaccatctat 660
tggtacgcca tcgccgcgct ggctgatgca 720
aagaacagcc tccaaggaga catcgccatc 780 atcagcatca aacaagaagg gctcaaacag gagacgctga ttcggcgccg cagccagaag ccgctagctc tacccggact
tggagcattt tgattggaag tggtggtggt agatcaagga agctgattga aagtcacctt tggtgttcga tctggaacca
tggagttcaa tgatgtgagc ggcggcggcg gaccgacagg agatggagac cgacacctat ccagatcaag cctccaagct
agttcatttg ctcttcaact ctgaagagag atcgccgcgc acctaccacc gaagatcaca attgctgaac caagccttcg
agagcgacgg tcaaggagtg atgtgagctt tacagaagga tcaagacggc ggatggcaat ctcaagtggt tcatcgagta
cctccacctc cccagatctt caccggcctg gatcgccaag gcaggtgtac ggccttcgcg ggagaagagc
g
840 900 960 1020 1080 1140 1200 1251
<210> SEQ ID NO: 29 <211> Comprimento: 1401 <212> Tipo: DNA
<213> Organismo: Seqiiencia Artificial <220> Caracteristicas:
<223> Outras inf ormagoes: seqiiencia sintetica codif icando GRG2 5 (syngrg2 5)
<400> Sequencia: 29 atgctgctga ggacggtgaa gacctgcttg tcggcgccgg gctcgccgac ggacaaactt ccgcacgccg ccaccggcct ggacgccatc aacagatatt tgatcctggc ggcgctggca atctcaaggg acaccgagct gatgctggac aggacaactc aacctgatgg aagcaccacc gggccgctga gcatcgactg cggcctcgcc gccgccgtcg ccggcgcctc agtggcattt atggcgccgg tgctggacgc gctggagacg ccgggcatgc tgcccttcac aatggatgct attgatgctt ctggaagctc tcagttcatc cctggaggcc tcaagctccg cgccgccgcc atgacagttc aaacattgag ggagctcggc agctggagca tcgcgccggg gcagctctca agcaacgccg gccccttcct ggcggcggcg ttctggccgg caagcaccac tcaagttgga ggcgccgaga tctctcatgg agaagatggc cgcggcatcg actatgctga tgcttcagag ctcgccgact cgccaagcaa gctcaccggc cggctggcgg cgctggagac agagctggcc gacgcgctgg agatcatccc tggaactctt cacaggatgg ccaccgccgg cgcgctgctg aacatcgcca ccaccgccaa gaccatgccg gcgacggcca agggccaagg a
gagcccaagg acctgcccat ctgcaccgcc 60 cacaatgctg agaagacatg gtgggcggcg 120 gtctccgtgc cggcatcaaa gagcctcacc 180 agctcgccaa gcaccatcca caacaccttg 240 gcgctggcgg ccttcggcat cggcatcgag 3 00 gtcgccatca cgccgggcaa gctggccacc 3 60 ggcaccgtga tgaggttcgt gccgccgctc 420 gatggagatg aagcagcaag ggtgcggcca 480 ctgggagcaa ggattgagta cgccggcacg 540 tctgctcttc aagaaaggca tgaggtgctg 600 tcggcgctgc tgctggtggg ccaagctcta 660 ggccacatcg cctcgcctga tcacatcgcc 720 gtggaggtgg cggtgggaga agatgcaaga 780 ggcttcacca tcaccgtgga gcctgatttg 840 ctggcaacaa atggcaccgt ccgcgtgccc 900 ggaaaatggg tgcaaatcct ctcaaggatg 960 gtgctgaccg tccgcggcac cggcgtcatc 1020 ctggcgccga cgctggcggc gctctgcacc 1080 atcggccacc tccgcggcca tgaaacagat 1140 aaggtgggcg ccaccgtgac aagcaccgac 1200 caagctgctg atctggattc atatgaagat 1260 gggctggcca ttgaaggagt gagggtggag 1320 gacttcccgc agctgtggac ggacatggcg 1380
1401
<210> SEQ ID NO: 30 <211> Comprimento: 1392 <212> Tipo: DNA
<213> Organismo: Seqiiencia Artificial
<220> Caracteristicas: <223> Outras informagoes :
seqii 〜encia sintetica codif icando GRG2 6 (syngrg2 6)
<400> Sequencia: 30
atgcctggga ccgctgtggc agcaagagcc ctccgcgcgc ggcgccacca cccatcgacc gtgatgaggt gatcctcatg gtggatgttt
cgccggcgac cggcgccctt tcaccaacag cgcttcattc tcactgaagt cggcggcggc tcgtgccgcc caaggcagcg cagcaatgga
gcagacagat cgccagccat atatttggtg aagagattcg tcctggagat ggcgtcggag gctggcggcg gccaatgggc tggcaaggcg
gattctggaa cctgttgatg ctggcggcgc gcgctgatgg ggtcaatatg acggccatcg ctgaggaatg accatcatcg ccgggcagct
caagcaccgc ccaccgtcac tggcaaatgg tggaggcgct gaccagatct actgcggcct gagcttcagt aggcgctgag tgcccttcaa
ctcggcgctg cgtgcctgga gccatcaagg ccgccgcctc ggaggtgacg cgccggcacc ttttgatgga gacgctcggc ggtgagcggc
60
120
180
240
300
360
420
480
540 accggcagcg tccgcggcgg ccacctggtg tcggcgctgc tgctggtggg agcaagattt aagccggtgc caagcctgga ccacatcaac gtgcaagttg atgattcagt tccaaatcat tttgatgaaa gaattgagca agatctttca gccaccaagg gcaccgtcag gattccaaat ctttggagga acatcctggc aacaatgggc accgtcaccg gcggcagcga gatcctcggc ccgacggtgg cggcgctctg cgcgctagca cacctccgcg gccatgaaac agatcggctg ggcggcgacg ccgaggagac aagtgatggg ggagtggtgc acagctatgc tgatcacagg gccgtggaag gagtgagggt ggaggacatc ccgcagatct ggacaagcat gctctccgcc gagacaagca ac
attgatgctt cagcaagctc tcaatttgtg 600 gaagaaggcc tccacctgga gcatgttggc 660 atgacggtgg cggtgctgcg cggcgtcggc 720 tggagggtga gccccggcgc catccaagca 780 aatgctggac ccttcctggc ggcggcgctg 840 tggccggcaa gcaccactca agttggagat 900 gccaccgtga cgctggacaa tggcaccctc 960 gccgactttg atgaaacttc agagctggcg 1020 acctcgccat caaggctcac cggcattgct 1080 gcggcgctgg tggcggagat caacaggctc 1140 ctggtgatea ggccggcggc gctgcactca 1200 atggccaccg ccggcgccat cctcggcctc 1260 gccaccacca gcaagaccat gccggagttc 1320 gggccggcgg cggcggcggc cggcagcacc 1380
1392
<210> SEQ ID NO: 31 <211> Comprimento: 13 65 <212> Tipo: DNA
<213> Organismo: Seqiiencia Artificial <220> Caracteristicas:
<223> Outras inf ormagoes : seqiiencia sintetica codif icando GRG27 (syngrg27 )
<400> Seqiiencia: 31
atgaccggca ccggcgccat ctcaccaaca cctcttcatt gtcaccgagg ccaagcgccg ttcgtgccgc gcaaggaaca gctgctgaag gtgcgcggcg ctgctggtgg ccaagcctgg gatgattcag aggatcgagc ggcaccgtga accatcctgg ggcggcaatg gcggcgctct ggccatgaaa gctgaagaaa cacagctacg ggcgtccagg tgggcaagga
ccaccgccgc atgcaaatgg ggttcctggt caagagattc tgccaggaga ccggcagcag cgctggcggc ggccaatggg gaggaaggac gccacctggt gcgcgcgctt atcacatcac ttcccaacca aagatctttc ggattccaaa cggcaatggg agatcaaagg gcgcgctggc cagatcggct ctgctgatgg ccgaccacag tggaggacat tgctggacag
caacaccgag gccggtggac gctggcggcg ggcgctgatg tggagattat caccgccatc gctgagatca caccatcatc gccgtcggcg gattgatgct cacagaaggc catgacggtg ctggagggtg aaatgctgga ttggcccatc cgccaccgtc agctgatttt caccgggcca ggcggcgctg gctgctgatc gatggccacc cgccaccacc cgccggcacc
ccggacaagg gccaccgtca ctggctgatg atccaagctc ggacctgatc gactgcggcc ggcgccaccg gaggcgctgc ctgcccttca tcagcaagct ctccacctgg gaggtgctga tcgccgggca cccttcctgg ggcaccactc accttggacg gatgaaactt tcaaggctga gtggcggaga aggccggcga gccggcgcca agcaagacca aacgaggccg
cggcgtcgct ccgtgcctgg ggccatcaag ttcggcagct tggagatcac tcgccggcac tctttgatgg tggcgctggg ccgtggaagg ctcaatttgt agcatgttgg ggagcgtcgg agatcaccgc cggcggcgct aagttggtga gcggcaccct cagagctggc ccggcattgc tcaacaggct cgctacatgg tcctcggcct tgccggagtt gcaac
gccgctgtgg aagcaagagc gctccgcgcg cggcgcca.cc gccgctggac cgtgatgagg agatcctcat agttcctgtt caccggcgag gtcggcgctg caagccggtg cgtcaccgtg cttcgaccag ggcaactcat tctttggagg caccgtcacc gccgacggtg tcacctccgc gggaggagdt cggcgtcatc cgccgtcgac cccggagatg
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1365
<210> SEQ ID NO: 32 <211> Comprimento: 1383 <212> Tipo: DNA
<213> Organismo : Seqiiencia Artificial
<220> Caracteristicas:
<223> Outras informagoes: sequencia sintetica codificando GRG2 8 (syngrg2 8)
<400> Seqiiencia: 32
atgaccggca ccaccgccgc caacaccggc
gcggcgccat atgcaacaag gccggtggac
ctcaccaaca ggttcctggt gctggcggcg
agcaacagcg tggacacctt gccgctctgg 60 gccaccgtca ccgtgcctgg aagcaagagc 120 ctggctgatg ggccaagccg cctccgcgcg 180 cctcttcatt gtcaccgagg ccttcagcaa ttcgtgccgc gcaaggaaga gcaacagaag gtgcgcggcg ctgctggtgg ccaagcctgg gatgattcag aggatcgagc ggaacagtga agcatcctgg ggaggaccag gcggcgctct ggccatgaaa gctgaagaaa cattcatatg ggagttcaag tgggaggcca aac
caagagattc tgcccggcga gcggcgccga cgctggcggc ggccaatggg gaggaaggac gccacctggt gagcaaggtt atcacatcaa ttcccaacca aagatctttc ggattccaaa tggagatggg agatcaaagg gcgcgctggc cagatcggct ctgctgatgg ctgatcacag tggaggacat tgctgcaaca
tgtgctgatg cggcgactat gacggccatc gctgaggaat caccatcatc gccgtcggcg gattgatgct cacagaaggc catgaccgtc ctggagggtg aaatgctgga ttggccgacg cgccaccgtc agctgatttt caccgggcca ggcggcgctg cctcatcatc gatggccacc cgccaccacc aggaactgga
atccaggcgc ggacctgatc gactgcggcc gggccaacaa gaggcgctgc ctgcccttct tcagcaagct ctccacctgg tccgtgctgc gcgccgggcc cccttcctgg cagacaactc accttggaga gatgagacct tcaaggctga gcggcggaga aggccggcga gccggcgcca agcaagacgg gaagatgaga
tgcggcagct tggagatcac tcgccggcac catttgatgg tggcgctagg ccgtggatgg ctcaatttgt agcatgttgg gcggcgtcgg ccatccatgc cggcggcgct aagttggtga atggcaccct ccgagctggc ccggcattgc tcaacaggct cgctgcatcc tcctcggcct tgccagaatt ccgtcacctc
cggcgccacc gccgatggac cgtgatgagg agatcctcat agttcctgtg caccggcgag gtcggcgctg caagccggtg cgtcaaggtg cttcgaccag ggcaacaaga tctatggagg caccgtcaaa gccgacggtg tcacctccgc gggaggagat tggagtagtt cgccgtggaa tcctcaaatg agaagcaagc
240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1383
<210> SEQ ID NO: 33 <211> Comprimento: 1293 <212> Tipo: DNA
<213> Organismo: Sequencia Artificial
<220> Caracteristicas:
<223> Outras informagoes: sequencia sintetica codificando GRG2 9 (syngrg29)
<400> Sequencia: 33 atggatgtca tcgtcaagcc gacgccaagc aagaactaca caacaagata tttgctggcg cactaccctg ctcattcaga agattctgat gccgtgctgg aagaagatga cagcaagatc gatgtgaggg agctcaatgt tggaaatgct acggcgctct gccctgatgt caccttcgtc cctcatgatg acctcatcga cgcgctgggg ggaaggctgc ccatcaccat caaaggagga ggaagcgtca gctctcagta cctctcggcg gacagcacca tcgaggtgct aaatgacctc gaggtgctgg agcaagctgg catcgtcatc gtgcccggcg gccaagccta caagccgcag agcgccgccg tgctggccgc cgccgccgtc atggagcaat caaagcaagg agaaagagca ccgctcaccc atgaaaatga tgtggtgcat gagtttgatg gagatgctgc aacagatgct gctgaaggaa catcaagatt ctacaatgtg atcaccgact acctcaacga gctgaggaag gagatcattg ttcatggaag gccagaagga tacgaccacc gcgtcatcat ggcgctaaca aggatcagag atgctcatca tgtggccaag gctctcggcg cctccgtgca gtgggtgaag
ctcaatggag agatcggcgc gctgagcagc 60 gcggcgctgg cagaaggaac aagcaccatc 12 0 gccatgagaa gatgcatctc cgacctcggc 180 gtcatccaag gcttcggctc acatccaaga 240 ggcgccgtgc tgcgcttctt gatgggcgtg 300 aacacctacc ccgacagcct cggcaagagg 360 cagctaggag tggaggtgca gcatgagcaa 420 caagccaagg gcggccacat cagagtttct 480 ctgctcttcg tgacgccgct gctggcggag 540 aagagcaagg tggtgatcgg ccagacgctg 600 catgcttcag atgactacat gagcttccgc 660 acctacaccg tccaaggaga ttatcctgga 72 0 acccaaagtg atgtgaagat cctccggctg 780 attgttgatg tgctgaggat gatggaggtg 840 gttcaaggaa atggcacctt gaaggcggtg 900 gtgctggcaa tggtggcggc ggcggtgttt 960 gagaacttga gatacaagga atgtgacagg 1020 gccggcgcca atgtggagga gaggcaagct 1080 gtggagggcg gcgtggagat caatgctcac 1140 gtggtggggc tgaggagcaa ggagccgctg 1200 agctaccctc aatattttga tcatcttcaa 1260 gag 1293
<210> SEQ ID NO: 34 <211> Comprimento: 1293 <212> Tipo: DNA
<213> Organismo: Seqiiencia Artificial <220> Caracteristicas:
<223> Outras informagoes: sequencia sintetica codificando GRG3 0 (syngrg3 0) <400> Sequencia: 34 atggatgtca tcgtcaagcc gacgccaagc aagaactaca caacaagata tttgctggcg cactaccctg ctcattcaga agattctgat gccgtgctgg aagaagatga cagcaagatc gatgtgaggg agctcaatgt tggaaatgct acggcgctct gcccggaggt gaccttcgtc cctcatgatg acctcatcga cgcgctgggg ggaaggctgc ccatcaccat caaaggagga ggaagcgtca gctctcagta cctctcggcg gacagcacca tcgaggtgct aaatgacctc gaggtgctgg agcaagctgg catcgtcatc gtgcccggcg gccaagccta caagccgcag agcgccgccg tgctggcggc ggcggcggtg atggagcaat caaagcaagg agaaagagca ccgctcaccc atgaaaatga tgtggtgcat gagtttgatg gagatgctgc caccgacgcc gctgaaggaa catcaagatt ctacaatgtg atcaccgact acctcaacga gctgaggaag gagatcattg ttcatggaag gccagaagga tacgaccacc gcgtcatcat ggcgctaaca aggatcagag atgctcatca tgtggccaag gctctcggcg cctccgtgca gtgggtgaag
ctcaatggag agatcggcgc gctgagcagc 60 gcggcgctgg cagaaggaac aagcaccatc 120 gccatgagaa gatgcatcag ggacctcggc 180 gtcatccaag gcttcggctc acatcctcat 240 ggcgccgtgc tgcgcttctt gatgggcgtg 300 aacacctacc ccgacagcct cggcaagagg 3 60 cagctaggag tggaggtgca gcatgagcaa 420 caagcaaaag gaggccacat cagagtttct 480 ctgctcttcg tgacgccgct gctggcggag 540 aagagcaagg tggtgatcgg ccagacgctg 600 catgcttcag atgactacat gagcttccgc 660 acctacaccg tccaaggaga ttatcctgga 720 acacaaagtg atgtgaagat cctccggctg 780 attgttgatg tgctgaggat gatggaggtg 840 gttcaaggaa atggcacctt gaaggcggtg 900 gtgctggcaa tggtggcggc ggcggtgttt 960 gagaacttga gatacaagga atgtgacagg 1020 gccggcgcca atgtggagga gaggcaagct 1080 gtggagggcg gcgtggagat caatgctcac 1140 gtggtggggc tgaggagcaa ggagccgctg 1200 agctaccctc aatattttga tcatcttcaa 1260 gag 1293
<210> SEQ ID NO: 35 <211> Comprimento: 431 <212> Tipo: PRT
<213> Organismo: Enterobacteriaciae
<400> Sequencia: Met Lys Val Thr 1
Pro
Ala
Lys
Gln
65
Ala
Thr
Gly
His
lie 145 Ser
Ala
lie
Glu
Asp 225
Ala Ser Lys
Ala
50
Pro
Pro
Pro
Ser
Leu 130 Gln
Ser
Ser
Asp
Asn 210 Glu
Gly
35
Ala
Asp
Phe
lie
Leu 115 Gly
Gly
Gln
Asp
Leu 195 Arg
Lys
20 lie
Arg
Gly
lie
Val 100 Val
Val
Pro
Phe
Val 180 Thr
Asn
Thr Lys
35 lie 5
Ser
Ser
Asp
Ser
Asp
85
Ala
Thr
Lys
Leu
Leu 165 Ala
Leu
Tyr
Met
Gln
Ser
Glu
lie
Leu
70
Cys
Leu
Arg
Val
Lys 150 Thr
lie
Asp
Glu
Gln 230
Pro
Met
lie
Val
55
Gln
Gly
Ser
Pro
Lys 135 Pro
Gly
Lys
Val
Glu 215 Arg
Gly Asp Gln
lie
40
Ser
lie
Glu
Lys
Met 120 Ser
Ala
Leu
Val
Met 200 Phe
Arg
25 Asn
Arg
Thr
Ser
Glu 105 Asp
Asn
Asp
Leu
Thr 185 Lys
Tyr Tyr Thr
Leu 10 Ala
Pro
Leu
Ser
Gly
90
Glu
Phe
Gln
Val
Leu 170 Asn
Arg
Phe
Val
Thr
Cys
Gly
Gly
Glu
75
Leu
Val
Phe
Gly
Thr 155 Ala
Leu
Phe
Lys
Glu 235
Gly
Ala
His
Ala 60 Gly
Ser
Thr
Asp
Lys 140 Val
Tyr
Lys
Gly
Ala 220 Gly
lie lie Ala
Ser
45
Arg
Val
lie
lie
Glu 125 Leu
Asp
Ala
Ser
Leu 205 Gly
Ala
30
Asn
Leu
Lys
Arg
Lys 110 工Ie
Pro
Gly
Ala
Arg 190 Lys
Asn Asp Trp
Gln
15
Leu
Asp
Glu
Pro
Met
95
Gly
Leu
Leu
Ser
Ala 175 Pro
Thr
Val
Ser
Ser
Val
Asp
Asp
Val 80 Phe
Ser
Pro
Val
Leu 160 Asp
Tyr
Pro
Tyr
Gly 240 Gly
Arg
Ala
Lys
Cys 305 Gly
Asp
lie
Lys
Cys 385 Ala
Ala
Gly
Leu
Leu 290 Pro
Glu
Arg
His
Gly 370 Ala
Phe Leu Leu
Glu Gln Leu
Met 275 His
Asp
Thr
Gly
Leu 355 Ala
Val
Ala
Gly
Asp
260 Ser
Pro
Leu
Lys
Leu 340 Glu
Glu
Ala
Val
Gly 420
Leu
245 工Ie
Ala
Ala
Phe
工Ie 325 Thr
Gly
Val
Ala
Asn 405 Val
Val
Ala
Asn
Asp
Pro 310 Lys
Leu
Asp
Ser
Leu 390 Lys
Ala
Ser
Ala
Leu 295 Pro
Gly
Gln
Leu
Ser 375 Lys
Gly Ala Thr
Ser Val Ser
Gly 280 Asn
Leu
Val
Asp
Met 360 Arg
Ala
Tyr
Leu
Gln 265 工Ie
Ala
Val
Ser
Glu 345 Arg
His
Val
Pro
Asn 425
lie 250 Ala
Ala
Phe
Ala
Arg 330 Phe
Val
Asp
Gly
Asp 410 His
Ala
Asp
lie
Glu
Leu 315 Leu
Gly
lie
His
Glu 395 Phe
Gly
Lys
Asp
Phe 300 Ala
Ala
Lys
Gly
Arg 380 Thr
Tyr Gln Phe
Pro
Ala
Ala 285 Asp
Ser
His
Met
Gly 365 工Ie
Thr
Ser
Asn
<210> <211> <212> <213>
SEQ 工D NO: 36 Comprimento: 414 Tipo: PRT
Organismo: Sulfolobus solfataricus
<400> Met 1
Pro
Seqiiencia : Val Lys
Thr
Ala
Glu
65
Leu
Ala
Arg
Phe
Asn 145 Leu
Pro
Lys
Asn
Gly
工Ie Gln Ser Arg
lie
50
Phe
Lys
lie
Pro
Ser 130 Glu
lie
Pro
Arg
Pro 210 Leu
Val
35
Lys
lie
Gly
Gly
Leu 115 Ser
lie
Tyr
lie
Phe 195 Asn
Lys 20 Tyr
Ser
Pro
Ser
Gly 100 Asn
Tyr
Lys
Ala
Ser 180 Gly
Asn Ala Ser
36 工Ie
5 Ser
Leu
Val
Pro
Ala
85
Glu
Arg
Ser
lie
Leu 165 Ser
Ser
Leu
Phe
Tyr
Leu
His
Arg
Glu
70
Thr
Val
lie
Leu
Ser 150 His
Lys
Asp
Val
Tyr
Pro
Ala
Asn
Ala
55
Lys
Thr
Thr
Val
Pro 135 Gly
工Ie
Ser
Val
Glu 215 Ala
Ser Lys lie
Leu
40
Leu
Leu
Leu
lie
Gln 120 Leu
Asp
Leu
Tyr
Lys 200 Phe
Arg
25
Val
Gly
Glu
Arg
Asp 105 Ala
Thr
Glu
Asn
lie 185 Phe
Gln Leu Ser
工Ie 10 Leu
Leu
Val
lie
Met
90
Ala
Leu
lie
Ser
Gly 170 Leu
Tyr
Gly
Ala
Ser
lie
Ser
Lys
Lys
75
Leu
Asp
Ser
Thr
Ser 155 Gly
Leu
Gly
Glu
Leu
Gly Phe Glu
lie
Leu
Asp
45
Lys
Val 60
Glu Arg
lie Pro
Glu Ser
Asn Tyr 125 Gly Lys 140
Gln Tyr
Ser lie
Thr 工Ie
Ser Lys 205 Val Ala 220
Val Ser
lie
lie 270 Lys
Ala
Tyr
Lys
Gly 350 Lys
Ala
lie
Asp
Phe 430
lie
Ser
30
Val
Asn
Phe
lie
Leu 110 Gly
Leu
lie
Glu
Thr Val 255
Val Gln
Glu lie
Thr Asp
Cys Lys 320 Glu Ser 335
Val Glu
Gly Val
Met Ala
Glu His 400 Leu Lys 415 Ser
Lys Ala 15
Leu Phe
lie Asp
Asn Ser
lie Lys 80 Leu Ala 95
Arg Arg
lie Ser
Ser Ser
Ser Gly 160 lie Leu 175
Leu Phe His Val Asp Tyr Gly Gly
Asp
190 lie
Gly
Gly Gly
Arg
Leu 335 lie
Leu
Asn
Asn
Ser
15
Asp
Ser
Asp
Ala
Thr
95
Lys
Leu
Leu
Ala
Leu 175 Tyr
Met
Leu
lie
235 Glu
Ala
Lys
Met
lie 315 lie
Asn
Val
Leu
Lys 395 lie
Ala
Lys
Gln
Ala
Thr
75
Gly
His
lie
Ser
Ala 155 lie
Glu
225 lie
Ser
Asp
lie
Ser 305 Arg
Leu
Gly
Asp
Gly 385 Trp
Thr
lie
Gly
Asp 290 Ala
lie
Tyr
lie
His 370 Val
工Ie Thr Val
Arg 275 lie
lie
Lys
Gly
Asn 355 Arg
lie Gln Asp
Lys 260 Trp
Asp
Ala
Glu
Val 340 Lys
Val
Thr
Leu
Asn
245 lie
Phe
Asp
Glu
Ser 325 Gly
Gly
Ala
Ser
Leu 405
230 Leu
Phe
Val
Ala
Gly 310 Asp
Ser
Met
Met
Ala 390 Ser
Trp
Ser
Lys
Pro 295 Thr
Arg
Glu
Leu
Met 375 Glu
Glu Pro Glu
Ala 280 Asp
Ser
lie
Val
Asn 360 Ser
Cys Leu Asn
Met 265 Lys
Leu
Glu
Glu
Lys 345 Ser
Ser
Val
Ala
Lys 250 Gly
Asp
Ala
lie
Ser 330 Tyr
Pro
Ala
Gly
Lys 410
<210> SEQ ID NO: 37 <211> Comprimento: 409 <212> Tipo: PRT
<213 > Organismo : Pseudomonas putida
<400> Seqiiencia: Met Gln Arg Ala 1 lie
Val
Gln
Gly
65
Ser
Pro
Lys
Pro
Gly 145 Lys
Val
Glu
Arg
Ala 225
lie Asn Ser
lie
50
Glu
Lys
Met
Ser
Ala 130 Leu
Val
Met
Phe
Tyr 210 Gly
Arg
35 Thr
Ser
Glu
Asp
Asn 115 Asp
Leu
Thr
Lys
Tyr 195 Thr
Pro 20 Leu
Ser
Gly
Glu
Phe 100 Gln
Val
Leu
Asn
Arg 180 Phe
Val Ala lie
37 Cys 5
Gly
Gly
Glu
Leu
Val
85
Phe
Gly
Thr
Ala
Leu 165 Phe
Lys
Glu
Ala
Ala
His
Ala
Gly
Ser
70
Thr
Asp
Lys
Val
Tyr 150 Lys
Gly
Ala
Gly
Gly 230
Ala
Ser
Arg
Val
55
lie
lie
Glu
Leu
Asp 135 Ala
Ser
Leu
Gly
Asp 215 Pro
Ala Leu Asn
Leu
40
Lys
Arg
Lys
lie
Pro 120 Gly
Ala
Arg
Lys
Asn 200 Trp
Asp
25
Glu
Pro
Met
Gly
Leu 105 Leu
Ser
Ala
Pro
Thr 185 Val
Ser lie Thr
Val 10 Asp
Asp
Val
Phe
Ser
90
Pro
Val
Leu
Asp
Tyr 170 Pro
Tyr
Gly
Val
240 His
Lys
Lys
Leu
Leu 320 Gly
Phe
Asn
Gly
Tyr 400
Glu
lie
Leu
Cys
Leu 80 Arg
Val
Lys
Thr
工Ie 160 Asp
Glu
Gln
Val
Ala 240
Tyr Phe Gly
Ser Ser Glu 270
Tyr Ser Pro 285
Thr lie Ala 300
Gly 工Ie Glu
Arg Lys lie
Ser lie Leu 350
Thr Asp Cys 365
Ala Leu Val 380
Ser Asn Pro Ser lie Glu
Lys Gly 工Ie
Ala Ala Arg 30
Pro Asp Gly 45
Pro Phe lie 60
Pro lie Val
Ser Leu Val
Leu Gly Val 110
Gln Gly Pro
125 Ser Gln Phe 140
Ser Asp Val
Asp Leu Thr
Asn Arg Asn 190
Glu Thr Lys
205 Ala Phe Leu 220
Gly Leu Asp
Asp
255 Tyr
lie
Asp
Gly
Arg 235 Ser
Ala
Leu
Pro
Gly 305 Gln
Leu
Ser
Lys
Ser 385 Ser
Thr
Gly
Asn
Leu 290 Val
Asp
Met
Arg
Ala 370 Tyr
Gln Ala Asp 245
lie Ala lie 260 Ala Phe Glu 275
Val Ala Leu
Ser Arg Leu
Glu Phe Gly 325
Arg Val lie
340 His Asp His 355
Val Gly Glu Pro Asp Phe
Leu Asn His Gln 405
Lys
Asp
Phe
Ala
Ala 310 Lys
Gly
Arg
Thr
Tyr 390 Phe
Ala
Ala
Asp
Ser 295 His
Met
Gly
lie
Thr 375 Ser
lie Val Lys
Ala 280 Tyr
Lys
Gly
Lys
Ala 360 lie
Asp Asn Phe
Glu 265 Thr
Cys
Glu
Val
Gly 345 Met
Glu
Leu
Ser
Gln 250 lie
Asp
Lys
Ser
Glu 330 Val
Ala
His
Lys
Ala
Lys
Cys
Gly
Asp 315 lie
Lys
Cys
Ala
Gln 395
Leu
Leu
Pro
Glu 300 Arg
His
Gly
Ala
Glu 380 Leu
Met
His
Asp 285 Thr
Gly
Leu
Ala
Val 365 Ala
Ser Ala Asn
255 Pro Ala Asp 270
Leu Phe Pro
Lys lie Lys
Leu Thr Leu 320
Glu Gly Asp 335
Glu Val Ser 350
Ala Ala Leu Val Asn Lys
Gly Gly Val Val 400
<210> SEQ ID NO: 38 <211> Comprimento: 419 <212> Tipo: PRT
<213> Organismo: Brevundomonas vesicularis
<400> Seqiiencia: Met Met Met Gly 1
Leu
Ala
Ala
Met
65
Gly
Ala
Gly
Gly
Glu 145 Ala
Ala
Leu
Ala
Ala 225 Glu
Thr Gly Leu
Leu
50
Gly
Ser
Gly
Lys
Pro 130 Thr
Ser
Leu
Leu
Ala 210 Trp
Leu
35 Lys
Val
Gly
Thr
Val 115 Leu
Gly
Arg
Leu
Gly 195 Met
Arg Pro Asp
Arg 20 Leu
Ser
Thr
Lys
Ala 100 lie
Val
Cys
Val
Met 180 Glu
Arg
Val
Ala
38 Arg 5
Ala
Ala
Asp
lie
Leu
85
Thr
Val
Asp
Pro
Gln 165 Met
His
Ala
Glu
Ser
Ala
Met
Gly
Asp
Asp
70
Gln
Arg
Asp
Ala
Pro 150 lie
Ala
lie
Phe
Pro 230 Ala
Lys
Pro
Leu
Thr
55
Glu
Pro
Phe
Gly
Leu 135 Val
Asp
Ala
Gly
Gly 215 Thr
Leu Thr Pro
Ala
40
Arg
Pro
Pro
Leu
Asp 120 Arg
Thr
Gly
Gly
Ala 200 Ala
Gly Ala Thr
Gly
25
Lys
Tyr
Asp
Ala
Thr 105 Ala
Ser
lie
Gly
Gly 185 Leu
Lys
Tyr
Tyr
lie
10
Ser
Gly
Met
Asp
Ala
90
Ala
His
Leu
Asn
Leu 170 Asp
Gly
Val
His
Leu
lie
Lys
Thr
Ala
Thr
75
Pro
Ala
Met
Gly
Gly 155 Ser
Arg
Tyr
Glu
Ala 235 Trp
Pro
Ser
Ser
Glu 60 Thr
Leu
Ala
Arg
lie 140 Thr
Ser
Ala
lie
Arg 220 Ala
Pro
lie
Arg
45
Ala
Phe
Phe
Ala
Lys 125 Asp
Gly
Gln
Val
Asp 205 Val
Asp Ala Ala
Gly Lys Pro 15
Thr Asn Arg 30
Leu Thr Gly
Leu Arg Ala
lie Val Lys 80
Leu Gly Asn 95
Leu Val Asp 110
Arg Pro lie
Ala Ser Ala
Arg Phe Glu 160
Tyr Val Ser 175
Asp Val Glu 190
Leu Thr Val
Ser Pro Val
Phe Val 工Ie 240
Glu Val Leu Ser
Pro
Ala
Val 305 Asn
Leu
lie
lie
Gly 385 Lys
Gly Gly Asp
Val 290 Leu
Leu
Ser
lie
Asp 370 Leu
Thr Tyr Glu
Ala 275 lie
Ala
Arg
Arg
Ala 355 Ser
Lys
Phe
Asp
Lys 260 Lys
Asp
Ala
Val
lie 340 Ser
Phe
lie
Pro
245 lie
Ala
Gly
Phe
Lys 325 Val
Asp
Tyr
Ser
Asn 310 Glu
Leu Gly Asp
Pro Asp Pro Ala Asp
Gln 295 Glu
Cys
Asn
Ser
His 375 lie
Gly Gly 390 Ser Tyr Trp 405
Leu 280 Met
Met
Asp
Leu
Leu 360 Arg
Thr
Asn
Thr 265 lie
Gln
Pro
Arg
Gly 345 Ala
lie
lie
Val
250 Pro
Ser
Asp
Val
lie 330 Thr
Gly
Ala
Leu
Leu 410
Ala
Lys
Ala
Arg 315 Arg
Glu
Lys
Met
Asp 395 Ser
Glu
Phe
lie 300 Phe
Ala
Glu
lie
Ser 380 Pro
255
Gln Phe Ser Gln 270
His Leu Pro
Pro 285 Pro
Val
Leu
Gly
Leu 365 Phe
Asp Ser Leu
Thr Leu Ala
Gly 工Ie Glu 320
Ser Ser Gly
335 Asp Asp Leu 350
Thr Ala Glu
Ala Leu Ala
Cys Val Ala 400
Gly Val Ala 415

Claims (31)

1. Molecula de acido nucleico isolada caracterizada por compreender uma sequencia de nucleotideos selecionada a partir do grupo consistindo de: a) sequencia de nucleotideo de SEQ ID NOS: 13, 1, 3, 5, If 9, 11, 28, 29, 30, 31, 32, 33, ou 34, ou um complemento desta; b) seqiiencia de nucleotideos apresentando pelo menos 90% de identidade de sequencia com a seqiiencia de nucleotideo de SEQ ID NOS: 13, 1, 3, 5, If 9, 11, 28, 29,30, 31, 32, 33, ou 34, ou um complemento desta; c) seqiiencia de nucleotideos de resistencia a herbicida do insert〇 de DNA do plasmideo depositad〇 com os Nos. de Acesso NRRL B — 3〇915, NRRL B—30 911, NRRL B — 3O 912, NRRL B—30913, NRRL B—30914 N, NRRL B-30916 N, NRRL B-30917 N, ou um complemento destas; d) seqiiencia de nucleotideos que codif ica um polipeptideo compreendendo a sequencia de aminoacidos de SEQ ID NOS: 14, 2’ 4, 6, 8, 10, ou 12; e, e) seqüência de nucleotídeos que codifica um polipeptideo apresentando pelo menos 90% de identidade de seqüência com a seqüência de aminoácidos de SEQ ID NOS:14, 2, 4, 6, 8, 10, ou 12.
2. Ácido nucléico isolado de acordo com a reivindicação 1, caracterizado pelo fato de que a referida seqüência de ácido nucléico é uma seqüência sintética que foi projetada para expressão em uma planta.
3. Vetor caracterizado por compreender a molécula de ácido nucléico de acordo com a reivindicação 1.
4. Vetor de acordo com a reivindicação 3, caracterizado por ainda compreender uma molécula de ácido nucléico que codifica um polipeptideo heterólogo.
5. Célula hospedeira caracterizada por conter o vetor de acordo com a reivindicação 3.
6. Célula hospedeira de acordo com a reivindicação 5 caracterizada por ser uma célula hospedeira bacteriana.
7. Célula hospedeira de acordo com a reivindicação 5 caracterizada por ser uma célula vegetal.
8. Planta transgênica caracterizada por compreender a célula hospedeira de acordo com a reivindicação 7.
9. Planta de acordo com a reivindicação 8, caracterizada pelo fato de que a referida planta é selecionada do grupo consistindo em milho, sorgo, trigo, girassol, tomate, cruciferas, pimentas, batata, algodão, arroz, soja, beterraba, cana-de-açúcar, tabaco, cevada e colza.
10. Semente transformada caracterizada por ser da planta de acordo com a reivindicação 8.
11. Polipeptideo isolado, caracterizado por ser selecionado a partir do grupo consistindo de: a) polipeptideo compreendendo a seqüência de aminoácido de SEQ ID NOS: 14, 2, 4, 6, 8, 10, ou 12; b) polipeptideo codificado pela seqüência de nucleotideos de SEQ ID NOS: 13, 1, 3, 5, 7, 9, 11, 28, 29, 30, 31, 32, 33, ou 34; c) polipeptideo compreendendo uma seqüência de aminoácidos apresentando pelo menos 90% de identidade de seqüência com a seqüência de aminoácidos de SEQ ID NOS:14, 2, 4, 6, 8, 10, ou 12, aonde o referido polipeptideo tem atividade de resistência a herbicida. d) polipeptideo que é codificado por uma seqüência de nucleotideos que é pelo menos 90% idêntica a seqüência de nucleotideos de SEQ ID NOS: 13, 1, 3, 5, 7, 9, 11, 28, 29, 30, 31, 32, 33, ou 34; aonde o referido polipeptideo tem atividade de resistência a herbicida; e e) polipeptideo que é codificado pela seqüência de nucleotideos de resistência a herbicida do inserto de DNA do plasmideo depositado com os Nos. de Acesso NRRL B-30915, NRRL B-30911, NRRL B-30912, NRRL B-30913, NRRL B-30914 N, NRRL B-30916 N, NRRL B-30917 N.
12. Polipeptideo de acordo com a reivindicação 11 caracterizado por ainda compreender uma seqüência heteróloga de aminoácidos.
13. Método pára produzir um polipeptideo com atividade de resistência a herbicida, caracterizado por compreender cultivar a célula hospedeira de acordo com a reivindicação 5 sob condições nas quais uma molécula de ácido nucléico que codifica o polipeptideo é expressa, o referido polipeptideo sendo selecionado a partir do grupo consistindo de: a) polipeptideo compreendendo a seqüência de aminoácido de SEQ ID NOS: 14, 2, 4, 6, 8, 10, ou 12; b) polipeptideo codificado pela seqüência de nucleotideos de SEQ ID NOS: 13, 1, 3, 5, 7, 9, 11, 28, 29, 30, 31, 32, 33, ou 34; 15 c) polipeptideo compreendendo uma seqüência de aminoácidos apresentando pelo menos 90% de identidade de seqüência com a seqüência de aminoácidos de SEQ ID NOS:14, 2, 4, 6, 8, 10, ou 12, aonde o referido polipeptideo tem atividade de resistência a herbicida. d) polipeptideo codificado por uma molécula de ácido nucléico compreendendo uma seqüência de nucleotideos que é pelo menos 90% idêntica a seqüência de nucleotideos de SEQ ID NOS: 13, 1, 3, 5, 7, 9, 11, 28, 29, 30, 31, 32, 33, ou 34; aonde o referido polipeptídeo tem atividade de resistência a herbicida. e) polipeptídeo que é codificado pela seqüência de nucleotídeos de resistência a herbicida do inserto de DNA do plasmídeo depositado com os Nos. de Acesso NRRL B-30915, NRRL B-30911, NRRL B-30912, NRRL B-30913, NRRL B-30914 N, NRRL B-30916 N, NRRL B-30917 N.
14. Método para conferir resistência a um herbicida em uma planta, caracterizado por transformar a referida planta com uma construção de DNA, a referida construção compreendendo um promotor que conduz a expressão em uma célula vegetal, operacionalmente ligado à uma seqüência de nucleotídeos, e regenerar uma planta transformada, aonde a referida seqüência de nucleotídeos é selecionada a partir do grupo consistindo de: a) seqüência de nucleotídeo de SEQ ID NOS: 13, 1, 3, 5, 7, 9, 11, 28, 29, 30, 31, 32, 33, ou 34, ou um complemento desta; b) seqüência de nucleotídeos apresentando pelo menos 90% de identidade de seqüência com a seqüência de nucleotídeo de SEQ ID NOS: 13, 1, 3, 5, 7, 9, 11, 28, 29, .30, 31, 32, 33, ou 34, ou um complemento desta, aonde a referida seqüência de nucleotideos codifica um polipeptideo que apresenta atividade de resistência a herbicida. c) seqüência de nucleotideos de resistência a herbicida do inserto de DNA do plasmídeo depositado com os Nos. de Acesso NRRL B-30915, NRRL B-30911, NRRL B-30912, NRRL B-30913, NRRL B-30914 N, NRRL B-30916 N, NRRL B-30917 N, ou um complemento destas; d) seqüência de nucleotideos que codifica um polipeptideo compreendendo a seqüência de aminoácidos de SEQ ID NOS: 14, 2, 4, 6, 8, 10, ou 12; e, e) seqüência de nucleotideos que codifica um polipeptideo apresentando pelo menos 90% de identidade de seqüência com a seqüência de aminoácidos de SEQ ID NOS:14, 2, 4, 6, 8, 10, ou 12, em que o referido polipeptideo apresenta atividade de resistência a herbicida.
15. Método de acordo com a reivindicação 14, caracterizado pelo fato de que a referida planta produz um polipeptideo que apresenta atividade de resistência a herbicida.
16. Método de acordo com a reivindicação 14, caracterizado por o herbicida ser um glifosato.
17. Planta caracterizada por ter estavelmente incorporada em seu genoma uma construção de DNA compreendendo uma seqüência de nucleotideos que codifica uma proteína apresentando atividade de resistência a herbicida, em que a referida seqüência de nucleotídeo é selecionada a partir do grupo consistindo de: a) seqüência de nucleotídeo de SEQ ID NOS: 13, 1, 3, 5, 7, 9, 11, 28, 29, 30, 31, 32, 33, ou 34; b) seqüência de nucleotideos apresentando pelo menos 90% de identidade de seqüência com a seqüência de nucleotídeo de SEQ ID NOS: 13, 1, 3, 5, 7, 9, 11, 28, 29, 30, 31, 32, 33, ou 34, aonde a referida seqüência de nucleotideos codifica um polipeptídeo que apresenta atividade de resistência a herbicida; c) seqüência de nucleotideos que codifica um polipeptídeo compreendendo a seqüência de aminoácidos de SEQ ID NOS: 14, 2, 4, 6, 8, 10, ou 12; d) seqüência de nucleotídeos que codifica um polipeptideo apresentando pelo menos 90% de identidade de seqüência com a seqüência de aminoácidos de SEQ ID NOS:14, 2, 4, 6, 8, 10, ou 12, em que o referido polipeptideo apresenta atividade de resistência a herbicida; e e) seqüência de nucleotídeos de resistência a herbicida do inserto de DNA do plasmídeo depositado com os Nos. de Acesso NRRL B-30915, NRRL B-30911, NRRL B-30912, NRRL B-30913, NRRL B-30914 N, NRRL B-30916 N, NRRL B-30917 N; em que a referida seqüência de nucleotídeos está operacionalmente ligada a um promotor que conduz a expressão de uma seqüência codificante em uma célula vegetal.
18. Planta de acordo com a reivindicação 17, caracterizada pelo fato de que dita planta é uma célula vegetal.
19. Método para gerar uma variante de polinucleotídeo caracterizado por ser de um polinucleotídeo parental grg25, grg26, grg27, grg28, grg29, grg30, grg31, syngrg25, syngrg26, syngrg27, syngrg28, syngrg29, syngrg30, ou syngrg31, compreendendo usar a seqüência de nucleotídeos de SEQ ID NOS: 13, 1, 3, 5, 7, 9, 11, 28, 29, 30, 31, 32, 33, ou 34, ou um fragmento desta, em um procedimento recombinogênico, e testar um polipeptideo codificado pela seqüência de nucleotideo resultante para uma atividade de interesse.
20. Método de acordo com a reivindicação 19, caracterizado pelo fato de que a atividade de interesse é a atividade de resistência a glifosato.
21. Método de acordo com a reivindicação 20, caracterizado pelo fato de que o referido polipeptideo codificado pela seqüência de polinucleotideo resultante tem maior atividade de resistência ao glifosato do que um polipeptideo codificado pelo referido polinucleotideo parental.
22. Método de acordo com a reivindicação 19, caracterizado pelo fato de que o referido procedimento recombinogênico é embaralhamento de DNA.
23. Método para aumentar o vigor ou o rendimento em uma planta,caracterizado por: a) introduzir na referida planta uma seqüência de nucleotideos codificando uma enzima EPSP sintase de tolerância a glifosato diferente de SEQ ID NO:35, 36, ou 37 que apresentam uma temperatura ótima mais alta do que a temperatura ambiente. b) colocar a referida planta em contato com uma concentração efetiva de glifosato; e, c) crescer a referida planta sob condições em que a temperatura é mais alta do que a temperatura ambiente por pelo menos duas horas consecutivas por dia por pelo menos 4 dias após o contato com o referido glifosato, em que os referidos dias seguintes ao contato estão dentro da temporada de crescimento da planta, aonde o vigor ou o rendimento da referida planta é maior do que o vigor ou o rendimento de uma planta expressando uma EPSP sintase de tolerância a glifosato que não tem uma temperatura ótima mais alta do que a temperatura ambiente.
24. Método de acordo com a reivindicação 23, caracterizado pelo fato de que a referida EPSP sintase não é uma EPSP sintase derivada de planta.
25. Método de acordo com a reivindicação 23, caracterizado pelo fato de que a referida enzima EPSP sintase tem uma temperatura ótima em torno de 35°C a cerca de 55°C e a temperatura na etapa (c) é em torno de 35°C a cerca de 55°C.
26. Método de acordo com a reivindicação 23, caracterizado pelo fato de que a enzima EPSP sintase é definida em SEQ ID NO: 14 e a temperatura na etapa (b) é em torno de 45°C a cerca de 55°C.
27. Método para conferir resistência a glifosato em uma planta caracterizado por compreender: a) introduzir na referida planta uma seqüência de nucleotideos codificando uma enzima EPSP sintase de tolerância a glifosato diferente de SEQ ID NO:35, 36, ou 37 que apresentam uma temperatura ótima mais alta do que a temperatura ambiente. b) colocar a referida planta em contato com uma concentração efetiva de glifosato; e, c) crescer a referida planta sob condições em que a temperatura é mais alta do que a temperatura ambiente por pelo menos duas horas consecutivas por dia por pelo menos 4 dias após o contato com o referido glifosato, em que os referidos dias seguintes ao contato estão dentro da temporada de crescimento da planta.
28. Método de acordo com a reivindicação 27, caracterizado pelo fato de que a referida EPSP sintase não é uma EPSP sintase derivada de planta.
29. Método de acordo com a reivindicação 27, caracterizado pelo fato de que a referida enzima EPSP sintase tem estabilidade térmica a uma temperatura de cerca de 32°C até aproximadamente 60°C e a temperatura na etapa (b) e de cerca de 32°C até em torno de 60 °C.
30. Método de acordo com a reivindicação 29, caracterizado pelo fato de que a referida enzima EPSP sintase tem estabilidade térmica a uma temperatura de cerca de 35°C até aproximadamente 45°C e a temperatura na etapa (b) e de cerca de 35°C até em torno de 45 °C.
31. Método de acordo com a reivindicação 27, caracterizado pelo fato de que a referida enzima EPSP sintase está definida em SEQ ID NO:14 e a temperatura na etapa (b) é em torno de 37°C.
BRPI0712871-1A 2006-06-09 2007-06-08 molÉcula de Ácido nuclÉico e polipeptÍdeo isolados, vetor, cÉlula hospedeira, planta trasngÊnica, semente, mÉtodos para produzir um polipeptÍdeo com atividade de resistÊncia a herbicida, para conferir resistÊncia a um herbicida em uma planta, para gerar uma variante de polinucleotÍdeo, para aumentar o vigor ou o rendimento em uma planta, e para conferir resist~encia a glifosato em uma planta BRPI0712871A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US81236006P 2006-06-09 2006-06-09
US60/812,360 2006-06-09
PCT/US2007/070683 WO2007146765A2 (en) 2006-06-09 2007-06-08 Novel epsp synthase genes conferring herbicide resistance

Publications (1)

Publication Number Publication Date
BRPI0712871A2 true BRPI0712871A2 (pt) 2013-05-07

Family

ID=38832698

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0712871-1A BRPI0712871A2 (pt) 2006-06-09 2007-06-08 molÉcula de Ácido nuclÉico e polipeptÍdeo isolados, vetor, cÉlula hospedeira, planta trasngÊnica, semente, mÉtodos para produzir um polipeptÍdeo com atividade de resistÊncia a herbicida, para conferir resistÊncia a um herbicida em uma planta, para gerar uma variante de polinucleotÍdeo, para aumentar o vigor ou o rendimento em uma planta, e para conferir resist~encia a glifosato em uma planta

Country Status (11)

Country Link
EP (2) EP2027261B1 (pt)
CN (1) CN101490252A (pt)
AR (1) AR061313A1 (pt)
AT (1) ATE491786T1 (pt)
AU (1) AU2007257851A1 (pt)
BR (1) BRPI0712871A2 (pt)
CA (1) CA2654242A1 (pt)
DE (1) DE602007011258D1 (pt)
HK (1) HK1127784A1 (pt)
NZ (1) NZ573073A (pt)
WO (1) WO2007146765A2 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2713869A1 (en) 2008-02-01 2009-08-13 Athenix Corp. Directed evolution of grg31 and grg36 epsp synthase enzymes
IN2012DN00427A (pt) 2009-07-01 2015-05-15 Bayer Bioscience Nv
AR090418A1 (es) 2012-02-01 2014-11-12 Dow Agrosciences Llc Peptido de transito al cloroplasto
CN105874062B (zh) 2013-10-18 2021-07-20 先锋国际良种公司 草甘膦-n-乙酰转移酶(glyat)序列以及使用方法
AR100159A1 (es) 2014-04-22 2016-09-14 Du Pont Genes de anhidrasa carbónica plastídica para el incremento de aceite en semillas con expresión incrementada de dgat

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1330762C (zh) * 2002-05-10 2007-08-08 北京大学 新的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合酶及其编码基因
DE60336849D1 (de) * 2002-12-18 2011-06-01 Athenix Corp Herbizidresistenz verleihende gene

Also Published As

Publication number Publication date
AU2007257851A1 (en) 2007-12-21
EP2336306A3 (en) 2011-10-12
EP2027261B1 (en) 2010-12-15
EP2336306A2 (en) 2011-06-22
WO2007146765A3 (en) 2008-07-31
NZ573073A (en) 2012-01-12
WO2007146765A2 (en) 2007-12-21
CN101490252A (zh) 2009-07-22
AR061313A1 (es) 2008-08-20
EP2027261A2 (en) 2009-02-25
HK1127784A1 (en) 2009-10-09
ATE491786T1 (de) 2011-01-15
DE602007011258D1 (de) 2011-01-27
CA2654242A1 (en) 2007-12-21

Similar Documents

Publication Publication Date Title
US7960615B2 (en) GRG36: novel EPSP synthase gene conferring herbicide resistance
JP4879969B2 (ja) 新規なクラスのepspシンターゼの同定
US9045765B2 (en) EPSP synthase genes conferring herbicide resistance
US7674958B2 (en) GRG23 and GRG51 genes conferring herbicide resistance
CA2671203C (en) Improved grg23 epsp synthases: compositions and methods of use
US7538262B2 (en) GDC-2 genes conferring herbicide resistance
US8003854B2 (en) GRG32: a novel EPSP synthase gene conferring herbicide resistance
US7534937B2 (en) Genes conferring herbicide resistance
US20070295251A1 (en) Epsp synthases: compositions and methods of use
AU2009210450A1 (en) Directed evolution of GRG31 and GRG36 EPSP synthase enzymes
BRPI0712871A2 (pt) molÉcula de Ácido nuclÉico e polipeptÍdeo isolados, vetor, cÉlula hospedeira, planta trasngÊnica, semente, mÉtodos para produzir um polipeptÍdeo com atividade de resistÊncia a herbicida, para conferir resistÊncia a um herbicida em uma planta, para gerar uma variante de polinucleotÍdeo, para aumentar o vigor ou o rendimento em uma planta, e para conferir resist~encia a glifosato em uma planta
US20050204436A1 (en) Methods to confer herbicide resistance

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 7A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: REFERENTE AO DESPACHO 8.6 PUBLICADO NA RPI 2260 DE 29/04/2014.