BRPI0708673A2 - método para fabricação de polipeptìdeos com atividade de aldolase e polinucleotìdeos que codificam estes polipeptìdeos - Google Patents

método para fabricação de polipeptìdeos com atividade de aldolase e polinucleotìdeos que codificam estes polipeptìdeos Download PDF

Info

Publication number
BRPI0708673A2
BRPI0708673A2 BRPI0708673-3A BRPI0708673A BRPI0708673A2 BR PI0708673 A2 BRPI0708673 A2 BR PI0708673A2 BR PI0708673 A BRPI0708673 A BR PI0708673A BR PI0708673 A2 BRPI0708673 A2 BR PI0708673A2
Authority
BR
Brazil
Prior art keywords
seq
sequence
aldolase
monatin
nucleic acid
Prior art date
Application number
BRPI0708673-3A
Other languages
English (en)
Inventor
Ellen Burke
Steven John Gort
Paula M Hicks
Peter Luginbuhl
Sara C Mcfarlan
Toby Richardson
Christopher Solheid
Davi Weiner
Lishan Zhao
Original Assignee
Cargill Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cargill Inc filed Critical Cargill Inc
Publication of BRPI0708673A2 publication Critical patent/BRPI0708673A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Indole Compounds (AREA)
  • Seasonings (AREA)

Abstract

MéTODO PARA FABRICAçãO DE POLIPEPTIDEOS COM ATIVIDADE DE ALDOLASE E POLINUCLEOTìDEOS QUE CODIFICAM ESTES POLIPEPTìDEOS. Esta invenção refere-se aos polipeptídeos tendo atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de aldolase de HMG e/ou KHG, polinucleotídeos codificando estes polipeptídeos, e os métodos de preparar e empregar estes polinucleotídeos e polipeptídeos. Em algumas modalidades, a invenção é direcionada aos polipeptídeos tendo atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de aldolase de HMG e/ou KHG, incluindo atividade termoestável e termotolerante, e polinucleotídeos codificando estas enzimas, e preparar e empregar estes polinucleotídeos e polipeptídeos. Os polipeptídeos de acordo com a invenção podem ser empregados em uma variedade de contextos industriais, farmacêuticos e agrícolas. Em algumas modalidades, a invenção fornece polipeptídeos e trilhas biossintéticas que são úteis na produção de ácido R-2-hid róxi 2-(indol-3-ilmetil)-4-cetoglutárico (R-MP) e certos estereoisómeros de monatina, tais como R,R e S,R monatina, e sais destes, bem como certos estereoisómeros de derivados de monatina, tais como as configurações R3R e S5R, e sais destes.

Description

Relatório Descritivo da Patente de Invenção para "ALDOLA-SES, ÁCIDOS NUCLÉICOS CODIFICANDO-OS E MÉTODOS PARA PRE-PARAR E EMPREGÁ-LOS".
Campo de acordo com a invenção
Esta invenção se refere à biologia e bioquímica molecular e celu-lar. Mais especificamente, a invenção se refere aos polipeptídeos que têmatividade de aldolase, polinucleotídeos que codificam este polipeptídeos, emétodos de fabricação e uso destes polinucleotídeos e polipeptídeos.
ANTECEDENTES DA INVENÇÃO
Monatina é um adoçante de intensidade elevada que tem a fór-mula química:
<formula>formula see original document page 2</formula>
Monatina inclui dois centros quirais que levam a quatro configu-rações estereoisoméricas potenciais. A configuração R1R (o "estereoisômeroR,R" ou "monatina R1R"); a configuração S,S (o "estereoisômero S,S" ou"monatina S,S"); a configuração R,S (o "estereoisômero R,S" ou "monatinaR,S"); e a configuração S1R (o "estereoisômero S,R" ou "monatina S,R").Como usado aqui, a menos que de outro modo declarado, o termo "monati-na" é usado para se referir às composições que incluem todos os quatro es-tereoisômeros de monatina, composições que incluem qualquer combinaçãode estereoisômeros de monatina, (tal como uma composição que inclui so-mente os estereoisômeros R1Re S,S, de monatina), como também uma úni-ca forma isomérica.
Para propósitos desta descrição, a cadeia principal de carbonode monatina será numerada como ilustrado acima, com o carbono direta-mente covalentemente preso ao grupo de álcool sendo identificado como ocarbono da posição 2 e o carbono diretamente covalentemente preso aogrupo amino sendo identificado como o carbono da posição 4. Por conse-guinte, referências aqui a monatina R,R, monatina S,S, monatina R,S, e monatina S,R significam: monatina 2R,4R, monatina 2S,4S, monatina 2R,4S, emonatina 2S,4R, respectivamente, a menos que de outro modo indicado.
Deveria ser notado que na literatura, a cadeia principal de car-bono de monatina foi numerada também usando uma convenção alternativa,com o carbono preso ao grupo de álcool sendo o carbono da posição 4, e ocarbono preso ao grupo amino sendo o carbono da posição 2. Conseqüen-temente, por exemplo, referências a monatina 2S,4R nesta descrição seriamas mesmas referências a monatina 2R,4S na literatura que usa a convençãode numeração alternativa.
Além disso, por causa de várias convenções de nomenclatura, amonatina é conhecida por vários nomes químicos alternativos, incluindo: á-cido 2-hidróxi-2-(indol-3-ilmetil)-4-aminoglutárico; ácido 4-amino-2-hidróxi-2-(1H-indol-3-ilmetil)-pentanodióico; ácido 4-hidróxi-4-(3-indolilmetil)glutâmico;e, 3-(1-amino-1,3-dicarbóxi-3-hidróxi-but-4-il)indol.
Certas formas isoméricas de monatina podem ser encontradasna casca de raízes da planta Schlerochiton ilicifolius localizado na Região deTransvaal da África do Sul. Os Pedidos de Patente dos Estados Unidos Nos.10/422.366 ("o Pedido '366") e 10/979.821 ("o Pedido '821"), que estão des-se modo incorporados por referência, descrevem, inter alia, polipeptídeos,séries de reações, e microorganismos para produção in vitro e in vivo demonatina.
SUMÁRIO
A invenção fornece polipeptídeos que têm atividade de aldolase(a seguir "aldolases"), incluindo atividade de piruvate aldolase tal como, semlimitação, atividade de aldolase HMG e KHG, polinucleotídeos que codificamos polipeptídeos, e métodos para fabricação e uso dos polipeptídeos e poli-nucleotídeos. Em algumas modalidades, a invenção fornece também com-posições (tal como composições farmacêuticas, combustível e composiçõesaditivas de combustível, comidas e aditivos de comida, bebida e aditivos debebida, alimentos e aditivos de alimento, fármacos e aditivos de fármaco,suplementos dietéticos) compreendendo os polipeptídeos ou polinucleotí-deos de acordo com a invenção. Estas composições podem ser formuladasem uma variedade de formas, tal como, como comprimidos, géis, pílulas,implantes, líquidos, sprays, películas, micelas, pós, comida, péletes de ali-mento ou como qualquer tipo de forma encapsulada.
Em algumas modalidades, as aldolases e/ou composições des-tas podem ser úteis em contextos farmacêuticos, industriais, e/ou agrícolas.
Em algumas modalidades, as aldolases e/ou composições des-tas podem ser úteis para formar ou clivar ligações de carbono-carbono.
Em algumas modalidades, as aldolases são fornecidas as quaiscatalisam as reações de formação de ligação de carbono-carbono entre umaceptor de ácido alfa-ceto e um piruvato ou um doador derivado de piruvato(vide esquema de reação abaixo). Em algumas modalidades, o aceptor podeser também uma cetona ou um aldeído. Em algumas modalidades, as aldo-lases são fornecidas as quais têm atividade de 4-hidróxi-2-oxoglutarato aju-dante Aldolase ceto-4-hidroxiglutarato aldolase, aldolase 2-oxo-4-hidroxiglutarato, KHG-aldolase, EC 4.1.3.16) e catalisam a seguinte reação:4-hidróxi-2-oxoglutarato <= > piruvato + glioxilato. Em algumas modalidades,aldolases são fornecidas as quais têm atividade de HMG-aldolase (tal como4-hidróxi-4 -metil-2-oxoglutarato aldolase, piruvato aldolase, gama-metil-gama-hidróxi-alfa-cetoglutárico aldolase, 4-hidróxi-4-metil-2-cetoglutaratoaldolase, EC 4.1.3.17) e catalisa a seguinte reação: 4-hidróxi-4-metil-2-oxoglutarato <= > 2 piruvato. Uma HMG aldolase também agirá em 4-hidróxi-4-metil-2-oxoadipato e 4-carbóxi-4-hidróxi-2-oxoexadioato.
<formula>formula see original document page 4</formula>
R = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída
R2 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituídaR3 = Η, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída, ácido carboxílico.
Em algumas modalidades, aldolases, tal como um piruvato aldo-lase, tal como, sem limitação um HMG e/ou um KHG aldolase, são forneci-dos os quais facilitam a produção de um 2-ceto-glutarato 3, 4-substituído.
Em uma modalidade, a invenção fornece um método para fabricar um 2-ceto-glutarato 3, 4-substituído compreendendo: (a) fornecer um polipeptídeoque tem uma atividade de aldolase, tal como uma atividade de piruvato aldo-lase, tal como, sem limitação, uma atividade de HMG aldolase e/ou KMGaldolase; (b) fornecer um composto doador e um aceptor; e (c) contatar opolipeptídeo da etapa (a) com os compostos da etapa (b) sob condições nasquais a aldolase catalisa a síntese de um 2-ceto-glutarato 3, 4-substituído,em que opcionalmente o doador e o aceptor são um piruvato ou um doadorde piruvato e um aceptor de ácido α-ceto, uma cetona e/ou um aldeído.
Em algumas modalidades, aldolases são fornecidas as quaisfacilitam a produção de ácido R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico(R-MP), um precursor de monatina. Em algumas modalidades, um piruvatoaldolase, tal como um HMG e/ou um KHG aldolase, pode ser usado juntocom uma D-aminotransferase para fabricar um ácido D-glutâmico 4-substituído ou um derivado destes. Um ácido D-glutâmico 4-substituído e/ouum derivado deste pode ser usado como um antibiótico, uma vez que sedescobriu que estes compostos inibem o glutamato racemase bacteriano(W00214261A3). Em uma modalidade, a invenção fornece um método parafabricar um ácido D-glutâmico 4-substituído que compreende: (a) fornecerum polipeptídeo que tem uma atividade de aldolase, tal como uma atividadede piruvato aldolase, tal como, sem limitação, uma atividade de ECMG aldo-lase e/ou KMG aldolase; (b) fornecer um aceptor de ácido α-ceto e um piru-vato ou um doador de piruvato; e (c) contatar o polipeptídeo da etapa (a)com os compostos da etapa (b) sob condições nas quais a aldolase catalisaa síntese de um ácido D-glutâmico 4-substituído, em que opcionalmente opolipeptídeo tem atividade de piruvato aldolase, HMG aldolase e/ou KHGaldolase e em que opcionalmente o método também compreende uso deuma D-aminotransferase.
A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes que compreendem uma seqüência de ácido nucléico que tempelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%,59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%,72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,98%, 99%, ou mais, ou identidade de seqüência completa (100%) com umácido nucléico de acordo com a invenção, incluindo SEQ ID NO: 1, SEQ IDNO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO:21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO:39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO:57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO:75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO:93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ IDNO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO:119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127,SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ IDNO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO:153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161,SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ IDNO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO:187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195,SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQID NO: 205, SEQ ID NO: 207, SEO ID NO-.209, SEQ ID NO: 211, SEQ IDNO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO:221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229,SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ IDNO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO:255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263,SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ IDNO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO:289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297,SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ IDNO: 315, SEQ DD NQ: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO:323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331,SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337, eSEQ ID NO: 338, além de uma região de pelo menos cerca de 10, 15, 20,25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550,600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250,1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850,1900, 19505 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500,ou mais resíduos. Em algumas modalidades, um ou mais ácidos nucléicoscodificam pelo menos um polipeptídeo que tem uma atividade de aldolase,incluindo atividade de piruvato tal como, sem limitação, atividade de HMGe/ou KHG aldolase. Em algumas modalidades, as identidades de seqüênciasão determinadas por varredura com um algoritmo de comparação de se-qüência ou por uma inspeção visual.
Em modalidades alternativas, um ou mais ácidos nucléicos codi-ficam um pelo menos polipeptídeo capaz de gerar um anticorpo que especi-ficamente pode se ligar a um polipeptídeo da invenção, ou, estes ácidos nu-cléicos podem ser usados como sondas para identificar ou isolar ácidos nu-cléicos de codificação de~aldolase, ou inibir a expressão de ácidos nucléicosde expressão de aldolase.
Os ácidos nucléicos de acordo com a invenção também incluemácidos nucléicos isolados, sintéticos ou recombinantes codificando enzimasde acordo com a invenção, tal como enzimas incluindo um ou mais polipep-tídeos tendo uma seqüência como apresentado na SEQ ID NO: 2, SEQ IDNO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO:22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQID NO: 32, SEQ ID NO: 34, SEQ ID NO:36, SEQ ID NO: 38, SEQ ID NO: 40,SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ IDN0:50, SEQ ID NO:52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58,SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ IDNO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76,SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ IDNO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94,SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID N0:102, SEQ IDNO: 104, SEQ ID N0:106, SEQ ID NO: 108, SEQ ID N0:110, SEQ IDNO:112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO:120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128,SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ IDNO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO:154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162,SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ IDNO: 180, SEQ ID NO: 182, SEQ ID NO:184, SEQ ID NO: 186, SEQ ID NO:188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196,SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID N0:204, SEQID N0:206, SEQ ID NO: 208, SEQ ID N0:210, SEQ ID NO: 212, SEQ IDNO:214, SEQ ID NO:216, SEQ ID NO: 218, SEQ ID N0:220, SEQ ID NO:222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230,SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQID NO: 240, SEQ ID NO: 242, SEO ID NO: 244, SEQ ID NO: 246, SEQ IDNO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO:256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264,SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ IDNO: 282, SEQ ID NO:284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO:290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298,SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ IDNO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO:324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332,e SEQ ID NO: 334, e subseqüências destas, variantes destas e fragmentosenzimaticamente ativos destas. Em algumas modalidades, o polipeptídeotem uma atividade de aldolase, incluindo atividade de piruvato tal como, semlimitação, atividade de HMG e/ou KHG aldolase.
Em algumas modalidades, a invenção fornece ácidos nucléicosde codificação de aldolase, tal como ácidos nucléicos de codificação de piru-vato aldolase, e tal como de HMG e/ou KHG aldolase, preferivelmente deri-vados de culturas misturadas. Em algumas modalidades, a invenção forneceligação de carbono-carbono formando ou clivando ácidos nucléicos de codi-ficação de enzima isolados de culturas misturadas que compreendem poli-nucleotídeos de acordo com a invenção, tal como uma seqüência que tempelo menos cerca de 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%,51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%,77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%,90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais, ou identi-dade de seqüência completa (100%) com um ácido nucléico de acordo coma invenção, tal como SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ IDNO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15,SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ IDNO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33,SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ IDNO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51,SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ IDNO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69,SEQ ID NO: 71, SEQ ID NO:73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ IDNO: 793 SEQ ID NO: 81. SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87,SEQ ID N089, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ IDNO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO:105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113,SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ IDNO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO:139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147,SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQID NO: 157^SEQ ID-NO:459, SEQ ID NO. - 161, SEQ ID NO: 163, SEQ IDNO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO:173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181,SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ IDNO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO:207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215,SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ IDNO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO:241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249,SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ IDNO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO:275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283,SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ IDNO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO:309, SEQ ID Ν0311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317,SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ IDNO: 335, SEQ ID NO: 336, SEQ ID NO: 337, e SEQ ID NO: 338 além deuma região de pelo menos cerca de 50, 75, 100, 150, 200, 250, 300, 350,400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050,1100, 1150, ou mais.
Em algumas modalidades, a invenção fornece ácidos nucléicosde codificação de enzima aldolase, tal como ácidos nucléicos de codificaçãode enzima piruvato aldolase, enzima HMG e/ou KHG, incluindo seqüênciasde polinucleotídeo de acordo com a invenção e os polipeptídeos codificadospor eles, incluindo enzimas de acordo com a invenção, tal como polipeptí-deos de acordo com a invenção, tal como SEQ ID NO:2, SEQ ID NO: 4,SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO:14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO:22, SEQID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO:32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQID NO: 42, SEQ ID NO:44, SEQ ID NO: 463 SEQ ID NO: 48, SEQ ID NO:50, SEQ ID NO: 52, SEQ ID NO-54, SEQ ID NO: 56, SEQ ID NO :58, SEQID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ LD NO:66, SEQ ID NO:68, SEQ ID NO: 7Q, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO: 76, SEQID NO: 78, SEQ ID N0:80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86,SEQ ID NO: 88, SEQ ID N0:90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ IDNO:96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID N0:102, SEQ ID N0:104,SEQ EO N0:106, SEQ ID N0:108, SEQ ID N0:110, SEQ ID NO:112, SEQID NO:114, SEQ ID NO: 116, SEQ ID NO. - 118, SEQ ID NO: 120, SEQ IDNO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO:138,SEQ ID NO: 140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ IDNO:148, SEQ ID N0:150, SEQ ID NO:152, SEQ ID NO:154, SEQ IDNO: 156, SEQ ID NO:158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ IDNO: 164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID N0:170, SEQ IDΝΟ:172, SEQ ID ΝΟ:174, SEQ ID ΝΟ:176, SEQ ID ΝΟ:178, SEQ IDΝ0:180, SEQ ID NO: 182, SEQ ID ΝΟ:184, SEQ ID ΝΟ:186, SEQ ID Ν0:188, SEQ ID Ν0: 190, SEQ ID Ν0: 192, SEQ ID Ν0: 194, SEQ ID Ν0: 196,SEQ ID Ν0: 198, SEQ ID Ν0: 200, SEQ ID NO: 202, SEQ ID Ν0:204, SEQID NO: 206, SEQ ID NO: 208, SEQ ID Ν0: 210, SEQ ID Ν0: 212, SEQ IDNO: 214, SEQ ID NO: 216, SEQ ID Ν0: 218, SEQ ID Ν0: 220, SEQ ID Ν0:222, SEQ ID Ν0: 224, SEQ ID NO: 226, SEQ ID Ν0: 228, SEQ ID Ν0: 230,SEQ ID NO: 232, SEQ ID Ν0: 234, SEQ ID Ν0: 236, SEQ ID Ν0: 238, SEQID Ν0:240, SEQ ID Ν0: 242, SEQ ID Ν0: 244, SEQ ID Ν0: 246, SEQ IDΝ0: 248, SEQ EO ΝΟ: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO:256, SEQ ID ΝΟ: 258, SEQ ID ΝΟ: 260, SEQ ID ΝΟ: 262, SEQ ID ΝΟ: 264,SEQ ID ΝΟ: 266, SEQ ID ΝΟ: 268, SEQ ID ΝΟ: 270, SEQ ID ΝΟ: 272, SEQID ΝΟ:274, SEQ ID ΝΟ: 276, SEQ ID ΝΟ: 278, SEQ ID ΝΟ: 280, SEQ IDΝΟ: 282, SEQ ID ΝΟ: 284, SEQ ID ΝΟ:286, SEQ ID ΝΟ: 288, SEQ ID ΝΟ:290, SEQ ID ΝΟ: 292, SEQ ID ΝΟ: 294, SEQ ID ΝΟ: 296, SEQ ID ΝΟ: 298,SEQ ID ΝΟ: 300, SEQ ID ΝΟ: 302, SEQ ID ΝΟ: 304, SEQ ID ΝΟ: 306, SEQID ΝΟ: 308, SEQ ID Ν0:310, SEQ ID ΝΟ: 312, SEQ ID ΝΟ: 314, SEQ IDΝΟ: 316, SEQ ID ΝΟ: 318, SEQ ID ΝΟ: 320, SEQ ID ΝΟ: 322, SEQ ID ΝΟ:324, SEQ ID ΝΟ: 326, SEQ ID ΝΟ: 328, SEQ ID ΝΟ: 330, SEQ ID ΝΟ: 332,ou SEQ ID ΝΟ: 334, e fragmentos enzimaticamente ativos destes, preferi-velmente derivados de uma fonte comum, tal como uma fonte ambiental. Emalgumas modalidades, a invenção fornece também ácidos nucléicos de codi-ficação de enzima aldolase, tal como ácidos nucléicos de codificação de en-zima piruvato aldolase, enzima HMG e/ou KHG preferivelmente derivados defontes ambientais, tal como fontes ambientais misturadas.
Em algumas modalidades, o algoritmo de comparação de se-qüência é um algoritmo BLAST versão de 2.2.2 onde um parâmetro de filtra-ção é ajustado em blastall -p blastp -d "nr pataa" -F F, e todas as outrasopções são ajustadas para básico.
Outras modalidades da invenção são ácidos nucléicos isolados,sintéticos ou recombinantes que incluem pelo menos 10, 15, 20, 25, 30, 35,40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650,700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300,1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900,1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500, ou maisbases consecutivas de uma seqüência de ácido nucléico de acordo com ainvenção, seqüências substancialmente idênticas a estas, e as seqüênciascomplementares a estas.
Em algumas modalidades, os ácidos nucléicos isolados, sintéti-cos ou recombinantes de acordo com a invenção codificam um polipeptídeoque tem uma atividade de aldolase, incluindo atividade de piruvato tal como,sem limitação, atividade de HMG e/ou KHG aldolase que é termoestável. Opolipeptídeo termoestável de acordo com a invenção pode reter uma ativida-de de aldolase, tal como uma atividade de piruvato aldolase, tal como umaatividade de HMG e/ou KHG aldolase, sob condições que compreendemuma faixa de temperatura de cerca de -100°C a cerca de -80°C, cerca de -80°C a cerca de -40°C, cerca de -40°C a cerca de -20°C, cerca de - 20°C acerca de 0°C, cerca de 0°C a cerca de 37°C, cerca de 0°C a cerca de 5°C,cerca de 5°C a cerca de 15°C, cerca de 15°C a cerca de 25°C, cerca de25°C a cerca de 37°C, cerca de 37°C a cerca de 45°C, cerca de 45°C a cer-ca de 55°C, cerca de 55°C a cerca de 70°C, cerca de 70°C a cerca de 75°C,cerca de 75°C a cerca de 85°C, cerca de 85°C a cerca de 90°C, cerca de90°C a cerca de 95°C, cerca de 95°C a cerca de 100°C, cerca de 100°C acerca de 105°C, cerca de 105°C a cerca de 1100C, cerca de 110°C a cercade 120°C, ou 95°C, 96°C, 97°C, 98°C, 99°C, 100°C, 1010C, 102°C, 103°C,104°C, 105°C, 106°C, 107°C, 108°C, 109°C, 1100C, 111°C, 112°C, 113°C,114°C, 115°C ou mais. Os polipeptídeos termoestáveis de acordo com a in-venção podem reter uma atividade de aldolase, tal como uma atividade depiruvato aldolase, tal como uma atividade de HMG e/ou de KHG aldolase,em temperaturas na faixa de cerca de -100°C a cerca de -80°C, cerca de -80°C a cerca de -40°C, cerca de -40°C a cerca de -20°C, cerca de -20°C acerca de 0°C, cerca de 0°C a cerca de 5°C, cerca de 5°C a cerca de 15°C,cerca de 15°C a cerca de 25°C, cerca de 25°C a cerca de 37°C, cerca de37°C a cerca de 45°C, cerca de 45°C a cerca de 55°C, cerca de 55°C a cer-ca de 70°C, cerca de 70°C a cerca de 75°C, cerca de 75°C a cerca de 85°C,cerca de 85°C a cerca de 90°C, cerca de 90°C a cerca de 95°C, cerca de95°C a cerca de 100°C, cerca de 100°C a cerca de 105°C, cerca de 105°C acerca de 1 10°C, cerca de 1 10°C a cerca de 120°C, ou 95°C, 96°C, 97°C,98°C, 99°C, 100°C, 101°C, 102°C, 103°C3 104°C, 105°C, 106°C, 107°C,108°C, 109°C, 110°C, 111°C, 112°C, 113°C, 114°C, 115°C ou mais. Em al-gumas modalidades, os polipeptídeos termoestáveis de acordo com a inven-ção retêm uma atividade de aldolase a uma temperatura nas faixas descritasacima, em cerca de pH 3,0, cerca de pH 3,5, cerca de pH 4,0, cerca de pH4,5, cerca de pH 5,0, cerca de pH 5,5, cerca de pH 6,0, cerca de pH 6,5,cerca de pH 7,0, cerca de pH 7.5, cerca de pH 8,0, cerca de pH 8,5, cercade pH 9,0, cerca de pH 9,5, cerca de pH 10,0, cerca de pH 10,5, cerca de pH11,0, cerca de pH 11,5, cerca de pH 12,0 ou mais.
Em outras modalidades, os ácidos nucléicos isolados, sintéticosou recombinantes codificam um polipeptídeo que tem uma atividade de aldo-lase, incluindo atividade de piruvato tal como, sem limitação, atividade deHMQ e/ou KHG aldolase que é termotolerante. Os polipeptídeos termotole-rantes de acordo com a invenção podem reter uma atividade de aldolase, talcomo uma atividade de piruvato aldolase, tal como uma atividade de HMGe/ou KHG aldolase, após exposição às condições que compreendem umatemperatura na faixa de cerca de -100°C a cerca de -80°C, cerca de -80°C acerca de -40°C, cerca de -40°C a cerca de -20°C, cerca de -20°C a cerca de0°C, cerca de 0°C a cerca de 5°C, cerca de 5°C a cerca de 15°C, cerca de15°C a cerca de 25°C, cerca de 25°C a cerca de 37°C, cerca de 37°C a cer-ca de 45°C, cerca de 45°C a cerca de 55°C, cerca de 55°C a cerca de 70°C,cerca de 70°C a cerca de 75°C, cerca de 75°C a cerca de 85°C, cerca de85°C a cerca de 90°C, cerca de 90°C a cerca de 95°Ç, cerca de 95°C a cer-ca de 100°C, cerca de 100°C a cerca de 105°C, cerca de 105°C a cerca de110°C, cerca de 110°C a cerca de 120°C, ou 95°C, 96°C, 97°C, 98°C, 99°C,100°C, 101°C, 102°C5 103°C, 104°C, 105°C, 106°C, 107°C, 108°C, 109°C,110°C, 111°C, 112°C, 113°C, 114°C, 115°C ou mais. Os polipeptídeos ter-motolerantes de acordo com a invenção podem reter uma atividade de aldo-lase, tal como uma atividade de piruvato aldolase, tal como uma atividade deHMG e/ou KHG aldolase, após exposição a uma temperatura na faixa decerca de -100°C a cerca de -80°C, cerca de -80°C a cerca de -40°C, cercade -40°C a cerca de -20°C, cerca de -20°C a cerca de 0°C, cerca de 0°C acerca de 5°C, cerca de 5°C a cerca de 15°C, cerca de 15°C a cerca de25°C3 cerca de 25°C a cerca de 37°C, cerca de 37°C a cerca de 45°C, cercade 45°C a cerca de 55°C, cerca de 55°C a cerca de 70°C3 cerca de 70°C acerca de 75°C, cerca de 75°C a cerca de 85°C, cerca de 85°C a cerca de90°C, cerca de 90°C a cerca de 95°C, cerca de 95°C a cerca de 100°C, cer-ca de 100°C a cerca de 105°C, cerca de 105°C a cerca de 110°C, cerca de110°C a cerca de 120°C, ou 95°C, 96°C, 97°C, 98°C, 99°C, 100°C, 101°C,102°C, 103°C, 104°C, 105°C, 106°C, 107°C, 108°C, 109°C, 110°C, 111°C,112°C, 113°C, 114°C, 115°C ou mais. Os polipeptídeos termotolerantes deacordo com a invenção retêm uma atividade de aldolase após exposição auma temperatura nas faixas descritas acima em algumas modalidades, acerca de pH 3,0, cerca de pH 3,5, cerca de pH 4,0, cerca de pH 4,5, cercade pH 5,0, cerca de pH 5,5, cerca de pH 6,0, cerca de pH 6,5, cerca de pH7,0, cerca de pH 7,5, cerca de pH 8,0, cerca de pH 8,5, cerca de pH 9,0,cerca de pH 9,5, cerca de pH 10,0, cerca de pH 10,5, cerca de pH 11,0, cer-ca de pH 11,5, cerca de pH 12,0 ou mais.
A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes compreendendo uma seqüência que hibridisa sob condiçõesrigorosas para ácidos nucléicos de acordo com a invenção, incluindo umaseqüência como apresentado na SEQ ID NO:1, SEQ ID NO: 3, SEQ ID NO:5, SEQ ID NO: 7 SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ IDNO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23,SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ IDNO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41,SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ IDNO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59,SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ IDNO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77,SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ IDNO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95,SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID N0:101, SEQ ID NO:1Q3, SEQ IDNO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO:113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121,SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ IDNO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO:147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ IDNO:155,SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ IDNO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO:181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189,SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ IDNO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO:215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223,SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ IDNO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID.NO: 247, SEQ ID NO:249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257,SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ IDNO: 275, SEQ ID NO: 277, SEQ ID NO-279, SEQ ID NO: 281, SEQ ID NO:283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291,SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ IDNO: 309, SEQ ID NO:311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO:317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325,SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337, ou SEQ ID NO: 338, oufragmentos ou subseqüências destas. Em algumas modalidades, os ácidosnucléicos codificam polipeptídeos que têm uma atividade de aldolase, inclu-indo atividade de piruvato tal como, sem limitação, atividade de HMG e/ouKHG aldolase. Os ácidos nucléicos podem ser pelo menos cerca de 10, 15,20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500,550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200ou mais resíduos em comprimento ou o tamanho natural do gene ou trans-crição. Em algumas modalidades, as condições rigorosas compreendemuma etapa de lavagem que compreende uma lavagem em 0,2X de SSC auma temperatura de cerca de 65°C durante cerca de 15 minutos.
A invenção fornece sondas de ácido nucléico para identificar ouisolar os ácidos nucléicos que codificam os polipeptídeos que têm uma ativi-dade de aldolase, incluindo atividade de piruvato tal como, sem limitação,atividade de HMG e/ou KHG aldolase, em que as sondas compreendem cer-ca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95,100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800,850, 900, 950, 1000 ou mais, bases consecutivas de uma seqüência de a-cordo com a invenção, e em que as sondas identificam o ácido nucléico porligação ou hibridização. As sondas podem compreender um oligonucleotídeoque compreende entre cerca de 10-100 bases consecutivas de uma seqüên-cia de acordo com a invenção, ou fragmentos ou subseqüências destas, porexemplo, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95ou 100 bases ou mais, ou, qualquer comprimento desejado no meio.
A invenção fornece sondas de ácido nucléico para identificar ouisolar ácidos nucléicos que codificam polipeptídeos que têm uma atividadede aldolase, incluindo atividade de piruvato tal como, sem limitação, ativida-de de HMG e/ou KHG aldolase, em que as sondas compreendem ácidosnucléicos que compreendem uma seqüência de pelo menos cerca de 10, 15,20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500,550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 ou mais resíduos de umácido nucléico de acordo com a invenção, tal como um polinucleotídeo quetem pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%,59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%,72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,98%, 99%, ou mais, ou identidade de seqüência completa (100%) com umácido nucléico da invenção. Em algumas modalidades, as identidades deseqüência são determinadas por varredura com um algoritmo de compara-ção de seqüência ou através de inspeção visual. Em outras modalidades, assondas podem compreender um oligonucleotídeo que compreende entrepelo menos cerca de 10-100 bases consecutivas de uma seqüência de ácidonucléico de acordo com a invenção, ou uma subseqüência desta, por exem-pio 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, ou100 bases ou mais, ou, qualquer comprimento desejado no meio.
A invenção fornece pares de iniciador de amplificação para am-plificar (tal como por PCR) um ácido nucléico que codifica polipeptídeos quetem atividade de aldolase, incluindo atividade de piruvato tal como, sem Iimi-tação, atividade de HMG e/ou K-HG aldolase, em que cada par de iniciadoré capaz de amplificar um ácido nucléico que compreende uma seqüência deacordo com a invenção, ou fragmentos ou subseqüências destas (vide a Lis-tagem de Seqüência). Um ou cada membro do par de seqüência de iniciadorde amplificação pode compreender um oligonucleotídeo que compreendepelo menos cerca de 10 a 50, ou mais, bases consecutivas da seqüência, oucerca de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27,28, 29, 30, 31, 32, 33, 34, 35, 36 ou mais bases consecutivas da seqüência.Em algumas modalidades, a invenção fornece pares de iniciador de amplifi-cação, em que cada par de iniciador compreende um primeiro membro tendouma seqüência como apresentada por cerca dos primeiros (o 5') 12, 13, 14,15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,35, 36 ou mais resíduos de um ácido nucléico de acordo com a invenção, eum segundo membro tendo uma seqüência como apresentada por cerca dosprimeiros (o 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27,28, 29, 30, 31, 32, 33, 34, 35, 36 ou mais resíduos do filamento complemen-tar do primeiro membro.
A invenção fornece ácidos nucléicos de codificação de aldolase,tal como ácidos nucléicos de codificação de piruvato aldolase, codificação deHMG e/ou KHG aldolase, gerados por amplificação, tal como reação em ca-deia de polimerase (PCR), usando um par de iniciador de amplificação deacordo com a invenção. Em algumas modalidades, a invenção fornece áci-dos nucléicos de codificação de aldolase, tal como ácidos nucléicos de codi-ficação de piruvato aldolase, codificação de HMG e/ou KHG aldolase, gera-dos por amplificação, tal como reação em cadeia de polimerase (PCR), u-sando um par de iniciador de amplificação de acordo com a invenção. Emalgumas modalidades, a invenção fornece métodos para fabricar uma aldo-lase, tal como enzima piruvato aldolase, HMG e/ou KHG aldolase por ampli-ficação, tal como reação em cadeia de polimerase (PCR), usando um par deiniciador de amplificação de acordo com a invenção. Em algumas modalida-des, o par de iniciador de amplificação amplifica um ácido nucléico de umabiblioteca, tal como uma biblioteca de genes, tal como uma biblioteca ambi-ental.
A invenção fornece métodos para amplificar um ácido nucléicoque codifica um polipeptídeo que tem uma atividade de aldolase, incluindoatividade de piruvato tal como, sem limitação, atividade de HMG e/ou KHGaldolase que compreende amplificação de um ácido nucléico modelo comum par de seqüência iniciadora de amplificação capaz de amplificar umaseqüência de ácido nucléico de acordo com a invenção, ou fragmentos ousubseqüências destas.
A invenção fornece cassetes de expressão que compreendemum ácido nucléico de acordo com a invenção ou uma subseqüência destes.Em algumas modalidades, o cassete de expressão pode compreender o áci-do nucléico que é operavelmente unido a um promotor. O promotor pode serum promotor viral, bacteriano, mamífero, fúngico, de levedura, ou de planta.Em algumas modalidades, o promotor de planta pode ser um promotor debatata, arroz, milho, trigo, tabaco ou cevada. O promotor pode ser um pro-motor constitutivo. O promotor constitutivo pode compreender CaMV35S.Em outras modalidades, o promotor pode ser um promotor induzível. Emalgumas modalidades, o promotor pode ser um promotor específico de teci-do ou um promotor ambientalmente regulado ou um promotor progressiva-mente regulado. Desse modo, o promotor pode ser, tal como um específicode semente, um específico de folha, um específico de raiz, um específico detalo ou um promotor induzido por abscisão. Em algumas modalidades, ocassete de expressão pode também compreender um vetor de expressão devírus de planta ou planta.
A invenção fornece veículos de clonagem que compreendem umcassete de expressão (tal como um vetor) de acordo com a invenção ou umácido nucléico de acordo com a invenção. O veículo de clonagem pode serum vetor viral, um plasmídeo, um fago, um fagomídeo, um cosmídeo.umfosmídeo, um bacteriófago ou um cromossomo artificial. O vetor viral podecompreender um vetor de adenovírus, um vetor retroviral ou um vetor viraladeno-associado. O veículo de clonagem pode compreender um cromosso-mo artificial bacteriano (BAC), um plasmídeo, um vetor derivado de bacterió-fago Pl (PAC), um cromossomo artificial de levedura (YAC), ou um cromos-somo artificial de mamífero (MAC).
A invenção fornece células transformadas que compreendemácidos nucléicos de acordo com a invenção ou cassetes de expressão (talcomo vetores) de acordo com a invenção, ou veículos de clonagem de acor-do com a invenção. Em algumas modalidades, a célula transformada podeser uma célula bacteriana, uma célula de mamífero, uma célula fúngica, umacélula de levedura, uma célula de inseto ou uma célula de planta. Em algu-mas modalidades, a célula de planta pode ser célula de soja, semente decolza, semente de óleo, tomate, açúcar de cana, um cereal, uma batata, tri-go, arroz, milho, tabaco ou cevada.
A invenção fornece animais não-humanos transgênicos quecompreendem um ácido nucléico de acordo com a invenção ou um cassetede expressão (tal como um vetor) de acordo com a invenção. Em algumasmodalidades, o animal é um camundongo, um camundongo, um porco, umacabra ou uma ovelha.
A invenção fornece planta transgênica compreendendo um ácidonucléico de acordo com a invenção ou um cassete de expressão (tal comoum vetor) de acordo com a invenção. A planta transgênica pode ser umaplanta de cereal, uma planta de milho, uma planta de batata, uma planta detomate, uma planta de trigo, uma planta de de extração, uma planta de se-mente de colza, uma planta de soja, uma planta de arroz, uma planta de ce-vada ou uma planta de tabaco.
A invenção fornece sementes transgênicas compreendendo umácido nucléico de acordo com a invenção ou um cassete de expressão (talcomo um vetor) de acordo com a invenção. A semente transgênica pode seruma planta de cereal, uma semente de milho, um grão de trigo, uma semen-te de óleo, uma semente de colza, uma semente de soja, um grão de palma,uma semente de girassol, uma semente de gergelim, um amendoim ou umasemente de planta de tabaco.
A invenção fornece oligonucleotídeos de anti-sentido que com-preendem seqüências de ácido nucléico complementares a ou capazes dehibridizar sob condições rigorosas para ácidos nucléicos de acordo com ainvenção. Em algumas modalidades, a invenção fornece métodos para inibira translação de uma aldolase, tal como mensagem de enzima piruvato aldo-lase, HMG e/ou KHG aldolase em uma célula compreendendo administrar àcélula ou expressando na célula um oligonucleotídeo de anti-sentido quecompreende uma seqüência de ácido nucléico complementar a ou capaz dehibridizar sob condições rigorosas para um ácido nucléico de acordo com ainvenção. Em algumas modalidades, o oligonucleotídeo de anti-sentido écerca de 10 a cerca de 50, cerca de 20 a cerca de 60, cerca de 30 a cercade 70, cerca de 40 a cerca de 80, ou cerca de 60 a cerca de 100 bases emcomprimento, tal como 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75,80, 85, 90, 95, 100 ou mais bases em comprimento.
A invenção fornece métodos para inibir a translação de uma en-zima aldolase, tal como mensagem de enzima piruvato aldolase, tal comomensagem de enzima HMG e/ou KIHG aldolase em uma célula compreen-dendo administrar à célula ou expressar na célula um oligonucleotídeo deanti-sentido que compreende uma seqüência de ácido nucléico complemen-tar a ou capaz de hibridizar sob condições rigorosas para um ácido nucléicode acordo com a invenção.
A invenção fornece moléculas de RNA inibidor de filamento du-plo (RNAi, ou interferência de RNA) (incluindo RNA de interferência peque-no, ou siRNAs, para inibir transcrição, e microRNAs, ou miRNAs, para inibirtranslação) compreendendo uma subseqüência de uma seqüência de acor-do com a invenção. Em algumas modalidades, o siRNA é cerca de 21 a cer-ca de 24 resíduos, ou, cerca de pelo menos 15, 16, 17, 18, 19, 20, 21, 22,23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 40, 45, 50, 55, 60, 65, 70,75, 80, 85, 90, 95, 100 ou mais nucleotídeos dúplices em comprimento. Emalgumas modalidades, a invenção fornece métodos para inibir a expressãode uma enzima aldolase, tal como piruvato aldolase, tal como enzima HMGe/ou KHG aldolase em uma célula compreendendo administrar à célula ouexpressar na célula um RNA inibidor de filamento duplo (siRNA ou MiRNA),em que o RNA compreende uma subseqüência de uma seqüência de acordocom a invenção.
A invenção fornece polipeptídeos isolados, sintéticos ou recom-binantes que compreendem uma seqüência de aminoácido que tem pelomenos cerca de cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%,59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%,72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,98%, 99%, ou mais, ou identidade de seqüência completa (100%) com umpolipeptídeo ou peptídeo de acordo com a invenção além de uma região depelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75,80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350 oumais resíduos, ou além do tamanho natural do polipeptídeo. Em algumasmodalidades, as identidades de seqüência são determinadas por varreduracom um algoritmo de comparação de seqüência ou por uma inspeção visual.A seqüências de polipeptídeo ou peptídeo de acordo com a invenção inclu-em SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ IDNO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18,SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ IDNO: 28, SEQ ID NO: 30, SEO ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36,SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ IDNO: 46, SEQ ID NO:48, SEQ ID NO: 50, SÉQ ID NO: 52, SEQ ID NO: 54,SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ IDNO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72,SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ IDNO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90,SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ IDNO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO:108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116,SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQID NO:126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ IDNO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO:142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150,SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ IDNO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO:176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184,SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQID NO: 194, SEQ ID NO: 196, SEQ ID NO:198, SEQ ID NO: 200, SEQ IDNO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO:210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218,SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ IDNO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO:244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252,SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ IDNO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO:278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286,SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ IDNO: 304, SSEQ ID NO: 306, SEO ID NO: 308, SEQ ID NO: 310, SEQ ID NO:312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320,SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQID NO: 330, SEQ ID NO: 332, e SEQ ID NO: 334, e subseqüências destas,variantes destas e fragmentos enzimaticamente ativos destas. Os polipeptí-deos de acordo com a invenção também incluem fragmentos de pelo menoscerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 80, 85, 90, 95, 100, 150, 200,250, 300, 350, 400, 450, 500, 550, 600 ou mais resíduos em comprimento,ou além do tamanho natural de uma enzima. As seqüências de polipeptídeoou peptídeo de acordo com a invenção incluem seqüência codificada por umácido nucléico de acordo com a invenção. As seqüências de polipeptídeo oupeptídeo de acordo com a invenção incluem polipeptídeos ou peptídeos es-pecificamente ligados por um anticorpo de acordo com a invenção (tal comoepítopos), ou polipeptídeos ou peptídeos que podem gerar um anticorpo deacordo com a invenção (tal como um imunógeno).
Em algumas modalidades, um polipeptídeo de acordo com a in-venção tem pelo menos uma atividade de enzima aldolase, tal como ativida-de de enzima piruvato aldolase, tal como HMG e/ou KHG aldolase. Em ou-tras modalidades, um polinucleotídeo de acordo com a invenção codifica umpolipeptídeo que tem pelo menos uma atividade de enzima aldolase, tal co-mo piruvato aldolase, tal como atividade de enzima HMG e/ou KHG aldolase.
Outra modalidade da invenção fornece polipeptídeos ou peptí-deos isolados, sintéticos ou recombinantes que compreendem pelo menos10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125,150 ou mais bases consecutivas de seqüências de polipeptídeo ou peptídeode acordo com a invenção, seqüências substancialmente idênticas a estas, eas seqüências complementares a estas. O peptídeo pode ser, tal como umfragmento imunogênico, um motivo (tal como um sítio de ligação), uma se-qüência de sinal, uma seqüência prepro ou um sítio ativo.
A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes que compreendem uma seqüência que codifica um polipeptí-deo que tem uma atividade de enzima aldolase, tal como piruvato aldolase,tal como KHG e/ou HMG aldolase, e uma seqüência de sinal, em que o áci-do nucléico compreende uma seqüência de acordo com a invenção. Uma"seqüência de sinal" significa um sinal de secreção ou outro domínio quefacilite a secreção da aldolase de acordo com a invenção da célula hospe-deira. A seqüência de sinal pode ser derivada de outra enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase ou enzima não-aldolase, tal como não-piruvato aldolase, tal como não-HMG e/ou não-KHGaldolase (um heterólogo). Em algumas modalidades, a invenção fornece áci-dos nucléicos isolados, sintéticos ou recombinantes que compreendem umaseqüência que codifica um polipeptídeo que tem uma atividade de enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, emque a seqüência não contém uma seqüência de sinal e o ácido nucléicocompreende uma seqüência de acordo com a invenção. Em algumas moda-lidades, a invenção fornece polipeptídeos isolados, sintéticos ou recombi-nantes que compreendem polipeptídeos de acordo com a invenção despro-vido de toda ou parte de uma seqüência de sinal. Em algumas modalidades,o polipeptídeo isolado, sintético ou recombinante pode compreender o poli-peptídeo de acordo com a invenção que compreende uma seqüência de si-nal heteróloga, tal como uma seqüência de sinal de enzima aldolase heteró-loga, tal como piruvato aldolase, tal como HMG e/ou de KHG aldolase ouseqüência de sinal de enzima não-aldolase, tal como não-piruvato aldolase,tal como não-HMG e/ou não-KHG aldolase.
Em algumas modalidades, a invenção fornece proteínas quimé-ricas que compreendem um primeiro domínio compreendendo uma seqüên-cia de sinal de acordo com a invenção e pelo menos um segundo domínio. Aproteína pode ser uma proteína de fusão. O segundo domínio pode compre-ender uma enzima. A proteína pode ser uma não enzima.
A invenção fornece polipeptídeos quiméricos que compreendempelo menos um primeiro domínio compreendendo peptídeo de sinal (SP),uma seqüência prepro e/ou um domínio catalítico (CD) de acordo com ainvenção e pelo menos um segundo domínio compreendendo um polipeptí-deo ou peptídeo heterólogos, em que o polipeptídeo ou peptídeo heterólogonão está associado naturalmente com o peptídeo de sinal (SP), seqüênciaprepro e/ou domínio catalítico (CD). Em algumas modalidades, o polipeptí-deo ou peptídeo heterólogo não é uma enzima aldolase, tal como piruvatoaldolase, HMG e/ou KHG aldolase. O polipeptídeo ou peptídeo heterólogopode ser amino terminal para, carbóxi terminal para ou em ambas extremi-dades do peptídeo de sinal (SP), seqüência prepro e/ou domínio catalítico(CD).
A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes que codificam um polipeptídeo quimérico, em que o polipeptí-deo quimérico compreende pelo menos um primeiro domínio compreenden-do peptídeo de sinal (SP), um domínio prepro e/ou um domínio catalítico(CD) de acordo com a invenção e pelo menos um segundo domínio compre-endendo um polipeptídeo ou peptídeo heterólogo, em que o polipeptídeo oupeptídeo heterólogo não está naturalmente associado com o peptídeo desinal (SP), domínio prepro e/ou domínio catalítico (CD).
A invenção fornece seqüências de sinal isoladas, sintéticas ourecombinantes (tal como peptídeos de sinal) consistindo em ou compreen-dendo úm seqüência como apresentado nos resíduos 1 a 14, 1 a 15, 1 a 16,1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a37, 1 a 38, 1 a 40, 1 a 41, 1 a 42, 1 a 43, 1 a 44, 1 a 45, 1 a 46 ou 1 a 47, deum polipeptídeo de acordo com a invenção, tal como SEQ ID NO: 2, SEQ IDNO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO:22, SEQ ID NO: 243 SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO:403 SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO:58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO:76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQID NO: 86, SEQ ID NO: 88, SEO ID NO: 90, SEQ ID NO: 92, SEQ ID NO:94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102,SEQ ID NO: 104, SEQ ID NO: 106, SEQ [pi]> N0:108, SEQ ID NO: 110,SEQ ID NO:112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ IDNO: 128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO:136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144,SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ IDNO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO:170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178,SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ IDNO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO:204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212,SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQID NO: 222, SEQ ID NO:224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ IDNO: 2305 SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO:238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246,SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ IDNO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO:272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280,SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO : 296, SEQ IDNO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO:306S SEQ ID NO: 308, SEQ ID NO: 3105 SEQ ID NO: 312, SEQ ID NO:314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322,SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQID NO: 332, ou SEQ ID NO: 334. Em algumas modalidades, a invenção for-nece seqüências de sinal que compreendem o primeiro 14, 15, 16, 17, 18,19, 20, 21, 22, 23, 24, 25, 26, 273 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38,39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58,59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 ou mais resíduos amino termi-nais de um polipeptídeo de acordo com a invenção.
Em algumas modalidades, a aldolase, tal como piruvato aldola-se, tal como HMG e/ou KHG aldolase, compreende uma atividade específicade cerca de 10 a cerca de 12.000 unidades por miligrama de proteína. Emoutras modalidades, a atividade de enzima aldolase, tal como piruvato aldo-lase, tal como HMG e/ou KHG aldolase, compreende uma atividade especí-fica de cerca de 1000 a cerca de 10.000 unidádes por miligrama de proteína,ou, de cerca de 5000 a cerca de 7500 unidades por miligrama de proteína.Alternativamente, a atividade de enzima aldolase, tal como piruvato aldolase,tal como HMG e/ou KHG aldolase, compreende uma atividade específica nafaixa de cerca de 10 a cerca de 7500 unidades por miligrama de proteína,ou, de cerca de 5000 a cerca de 12.000 unidades por miligrama de proteína.Em algumas modalidades, a atividade de enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase, compreende uma atividade es-pecífica na faixa de cerca de 10 a cerca de 5000 unidades por miligrama deproteína, ou, de cerca de 7500 a cerca de 10.000 unidades por miligrama deproteína. Eni outras modalidades, a atividade de enzima aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldolase, compreende uma ativi-dade específica na faixa de cerca de 10 a cerca de 2500 unidades por mili-grama de proteína. Alternativamente, a atividade de enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase, compreende umaatividade específica na faixa de cerca de 10 a cerca de 1000 unidades pormiligrama de proteína. Um método exemplar para medir a atividade de en-zimas aldolases diferentes, tal como piruvatos aldolases, tal como HMG e/ouKHG aldolase, usa um substrato geral, 4-carbóxi-4-hidróxi-2-oxoadipat("CHA"). Um ensaio típico compreende 50 mM de fosfato de sódio, pH 7,5, 1mM de MgC12, 1 mM de CHA, 10 pg/ml de D-Iactato desidrogenase ("LDH")de Lactobacillus Ieichmanii (Sigma - Aldrich, St., Louis, MO), 0,5 mM de NA-DH. O ensaio é iniciado adicionando-se a enzima a ser medida. A liberaçãode piruvato, que juntou à formação de NAD+ é monitorada continuamenteem um espectrofotômetro a 340nm. Uma unidade de atividade de enzima édefinida como a quantidade que libera piruvato suficiente para reduzir a ab-sorbância em 340nm por 1 OD por minuto.
Em outras modalidades, a termotolerância da enzima aldolase,tal como piruvato aldolase, tal como HMG e/ou KHG aldose, compreenderetenção de pelo menos a metade da atividade específica da enzima aldola-se, tal como piruvato aldolase, tal como HMG e/ou KHG aldose, após seraquecida a uma temperatura elevada, tal como uma temperatura de cercade O0C a cerca de 20°C, cerca de 20°C a cerca de 37°C, cerca de 37°C acerca de 50°C, cerca de 50°C a cerca de 70°C, cerca de 70°C a cerca de75°C, cerca de 75°C a cerca de 80°C, cerca de 80°C a cerca de 85°C5 cercade 85°C a cerca de 90°C, cerca de 90°C a cerca de 95°C, cerca de 95°C acerca de IOO0C, cerca de IOO0C a cerca de 110°C, ou mais elevada. Alterna-tivamente, a termotolerância pode compreender retenção de atividade espe-cífica de cerca de 10 a cerca de 12.000 unidades por miligrama de proteína,ou, de cerca de 5000 a cerca de 10.000 unidades por miligrama de proteína,após ser aquecida a uma temperatura elevada, como descrito acima. Emoutras modalidades, a termotolerância pode compreender retenção de ativi-dade específica na faixa de cerca de 10 a cerca de 5000 unidades por mili-grama de proteína após ser aquecida a uma temperatura elevada, comodescrito acima.
A invenção fornece polipeptídeos isolados, sintéticos ou recom-binantes de acordo com a invenção, em que os polipeptídeos compreendempelo menos um sítio de glicosilação. Em algumas modalidades, a glicosila-ção pode ser uma glicosilação N-unida. Em algumas modalidades, o polipep-tídeo pode ser glicosilado após ser expresso em uma célula hospedeira deP. pastoris ou um S. pombe ou em uma célula hospedeira de mamífero.
Em algumas modalidades, o polipeptídeo pode reter atividade de.enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-se, sob condições que compreendem cerca de pH 6,5, pH 6, pH 5,5, pH 5,pH 4,5, pH 4,0, pH 3,5, pH 3,0 ou menos (mais ácido) pH. Em outras moda-lidades, o polipeptídeo pode reter uma atividade de enzima aldolase, tal co-mo piruvato aldolase, tal como HMG e/ou KHG aldose, sob condições quecompreendem cerca de pH 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10,pH 10,5, pH 11,0, pH 11,5, pH 12, pH 12,5 ou mais (mais básico) pH. Emalgumas modalidades, o polipeptídeo pode reter uma atividade de enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose, apósexposição às condições que compreendem cerca de pH 6,5, pH 6, pH 5,5,pH 5, pH 4,5, pH 4,0, pH 3,5, pH 3,0 ou menos (mais ácido) pH. Em outrasmodalidades, o polipeptídeo pode reter uma atividade de enzima aldolase,tal como piruvato aldolase, tal como HMG e/ou KHG aldose, após exposiçãoàs condições que compreendem cerca de pH 7, pH 7,5 pH 8,0, pH 8,5, pH 9,pH 9,5, pH 10, pH 10,5, pH 11,0, pH 11,5, pH 12, pH 12,5 ou mais (mais bá-sico) pH.
Em algumas modalidades, a enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldose de acordo com a invenção tematividade sob condições alcalinas, tal como as condições alcalinas do intes-tino, tal como o intestino delgado. Em algumas modalidades, o polipeptídeopode reter a atividade após exposição ao pH ácido do estômago.
A invenção fornece preparações de proteína que compreendemum polipeptídeo (incluindo peptídeos) de acordo com a invenção, em que apreparação de proteína compreende um líquido, um sólido ou um gel. Emalgumas modalidades, a invenção fornece heterodímeros que compreendemum polipeptídeo de acordo com a invenção e um segundo membro, tal comoum polipeptídeo ou outro (segundo) domínio. O segundo membro do hetero-dímero pode ser uma enzima aldolase diferente, tal como piruvato aldolase,tal como HMG e/ou KHG aldose, uma enzima diferente ou outra proteína.
Em algumas modalidades, o segundo domínio pode ser um polipeptídeo e oheterodímero pode ser uma proteína de fusão. Em algumas modalidades, osegundo domínio pode ser um epítopo ou um rótulo. Em algumas modalida-des, a invenção fornece homomultímeros, incluindo, porém não-limitados a,homodímeros, homotrímeros, homotetrâmeros, homopentâmeros, e homoe-xâmeros, compreendendo um polipeptídeo de acordo com a invenção.
A invenção fornece polipeptídeos imobilizados (incluindo peptí-deos) tendo atividade de enzima aldolase, tal como piruvato aldolase, talcomo HMG e/ou KHG aldose, em que o polipeptídeo imobilizado compreen-de um polipeptídeo de acordo com a invenção, um polipeptídeo codificadopor um ácido nucléico de acordo com a invenção, ou um polipeptídeo quecompreende um polipeptídeo de acordo com a invenção e um segundo do-mínio. Em algumas modalidades, o polipeptídeo pode ser imobilizado emuma célula, um metal, uma resina, um polímero, um cerâmico, um vidro, ummicroeletrodo, uma partícula grafítica, uma conta, um gel, uma placa, umadisposição ou um tubo capilar.
A invenção também fornece disposições que compreendem umácido nucléico imobilizado de acordo com a invenção, incluindo, tal comosondas de acordo com a invenção. Em algumas modalidades, a invençãofornece também disposições que compreendem um anticorpo de acordocom a invenção.
A invenção fornece anticorpos isolados, sintéticos ou recombi-nantes que especificamente se ligam a um polipeptídeo de acordo com ainvenção ou a um polipeptídeo codificado por um ácido nucléico de acordocom a invenção. Estes anticorpos de acordo com a invenção podem ser umanticorpo monoclonal ou policlonal. Em algumas modalidades, a invençãofornece hibridomas que compreendem um anticorpo de acordo com a inven-ção, tal como um anticorpo que especificamente se liga a um polipeptídeo deacordo com a invenção ou a um polipeptídeo codificado por um ácido nucléi-co de acordo com a invenção. Em algumas modalidades, a invenção forneceácidos nucléicos que codificam estes anticorpos.
A invenção fornece métodos para isolar ou identificar polipeptí-deos que têm atividade de enzima aldolase, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase, que compreende as etapas de: (a) fornecerum anticorpo de acordo com a invenção; (b) fornecer uma amostra quecompreende polipeptídeos; e (c) contatar a amostra da etapa (b) com o anti-corpo da etapa (a) sob condições em que o anticorpo especificamente possase ligar ao polipeptídeo, desse modo isolando ou identificando um polipeptí-deo que tenha uma atividade de enzima aldolase, tal como piruvato aldolase,tal como HMG e/ou KHG aldose.
A invenção fornece métodos para fabricar um anticorpo de en-zima anti-aldolase, tal como anti-piruvato aldolase, tal como anti-HMG e/ouanti-KHG aldolase compreendendo administrar a um animal não-humano umácido nucléico de acordo com a invenção ou um polipeptídeo de acordo coma invenção ou subseqüências destes em uma quantidade suficiente paragerar uma resposta imune humoral, desse modo fabricando um anticorpo deenzima anti-aldolase, tal como anti-piruvato aldolase, tal como anti-HMGe/ou anti-KHG aldolase. Em algumas modalidades, a invenção fornece mé-todos para fabricar uma resposta imune anti-aldolase, tal como anti-piruvatoaldolase, tal como anti-HMG e/ou anti-KHG aldolase (celular ou humoral)compreendendo administrar a um animal não-humano um ácido nucléico deacordo com a invenção ou um polipeptídeo de acordo com a invenção ousubseqüências destes em uma quantidade suficiente para gerar uma respos-ta imune (celular ou humoral).
A invenção fornece métodos para produzir um polipeptídeo re-combinante que compreende as etapas de: (a) fornecer um ácido nucléicode acordo com a invenção operavelmente ligado a um promotor; e (b) ex-pressar o ácido nucléico da etapa (a) sob condições que permitem a expres-são do polipeptídeo, desse modo produzindo um polipeptídeo recombinante.Em algumas modalidades, o método pode também compreender transformaruma célula hospedeira com o ácido nucléico da etapa (a) seguido por ex-pressão do ácido nucléico da etapa (a), desse modo produzindo um polipep-tídeo recombinante em uma célula transformada.
A invenção fornece métodos para identificar um polipeptídeo quetem atividade de enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldose, que compreende as seguintes etapas: (a) fornecer umpolipeptídeo de acordo com a invenção; ou um polipeptídeo codificado porum ácido nucléico de acordo com a invenção; (b) fornecer substrato de en-zima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose; e(c) contatar o polipeptídeo ou um fragmento ou variante deste da etapa (a)com o substrato da etapa (b) e detectar uma diminuição na quantidade dosubstrato ou um aumento na quantidade de um produto de reação, em queuma diminuição na quantidade do substrato ou um aumento na quantidadedo produto de reação detecta um polipeptídeo que tem uma atividade deenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-se. Em algumas modalidades, o substrato é um carboidrato, um compostocompreendendo carboidrato e/ou um mimético carboidrato.
A invenção fornece métodos para identificar substrato de enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose quecompreende as seguintes etapas: (a) fornecer um polipeptídeo de acordocom a invenção; ou um polipeptídeo codificado por um ácido nucléico deacordo com a invenção; (b) fornecer um substrato de teste; e (c) contatar opolipeptídeo da etapa (a) com o substrato de teste da etapa (b) e detectaruma diminuição na quantidade do substrato ou um aumento na quantidadedo produto de reação, em que uma diminuição na quantidade do substratoou um aumento na quantidade de um produto de reação identifica o substra-to de teste tal como um substrato de enzima aldolase, tal como piruvato al-dolase, HMG e/ou K-HG aldolase.
A invenção fornece métodos para determinar se um compostode teste especificamente se liga a um polipeptídeo que compreende as se-guintes etapas: (a) expressar um ácido nucléico ou um vetor que compreen-de o ácido nucléico sob condições permissivas para translação do ácido nu-cléico para um polipeptídeo, em que o ácido nucléico compreende um ácidonucléico de acordo com a invenção, ou, fornecer um polipeptídeo de acordocom a invenção; (b) fornecer um composto de teste; (c) contatar o polipeptí-deo com o composto de teste; e (d) determinar se o composto de teste daetapa (b) especificamente se liga ao polipeptídeo.
A invenção fornece métodos para identificar um modulador deuma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldose, que compreende as seguintes etapas: (a) fornecer umpolipeptídeo de acordo com a invenção ou um polipeptídeo codificado porum ácido nucléico de acordo com a invenção; (b) fornecer um composto deteste; (c) contatar o polipeptídeo da etapa (a) com o composto de teste daetapa (b) e medir uma atividade da enzima aldolase, tal como piruvato aldo-lase, tal como HMG e/ou KHG aldose, em que uma mudança na atividade deenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-se, medida na presença do composto de teste comparada à atividade naausência do composto de teste fornece uma determinação que o compostode teste modula a atividade de enzima aldolase, tal como piruvato aldolase,tal como HMG e/ou KHG aldose. Em algumas modalidades, a atividade deenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-se, pode ser medida fornecendo um substrato de enzima aldolase, tal comopiruvato aldolase, HMG e/ou KHG aldolase e detectando uma diminuição naquantidade do substrato ou um aumento na quantidade de um produto dereação, ou, um aumento na quantidade do substrato ou uma diminuição naquantidade de um produto de reação. Uma diminuição na quantidade dosubstrato ou um aumento na quantidade do produto de reação com o com-posto de teste quando comparado à quantidade do substrato ou produto dereação sem o composto de teste identifica o composto de teste como umativador de atividade de enzima aldolase, tal como piruvato aldolase, tal co-mo HMG e/ou KHG aldose. Um aumento na quantidade do substrato ou umadiminuição na quantidade do produto de reação com o composto de testecomo comparado à quantidade de substrato ou produto de reação sem ocomposto de teste identifica o composto de teste como um inibidor de ativi-dade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldose.
A invenção fornece sistemas de computador que compreendemum processador e um dispositivo de armazenamento de dados em que oreferido dispositivo de armazenamento de dados tem armazenado nele umaseqüência de polipeptídeo ou uma seqüência de ácido nucléico de acordocom a invenção (tal como um polipeptídeo ou peptídeo codificado por umácido nucléico de acordo com a invenção). Em algumas modalidades, o sis-tema de computador pode também compreender um algoritmo de compara-ção de seqüência e um dispositivo de armazenamento de dados que tempelo menos uma seqüência de referência armazenada nele. Em outras mo-dalidades, o algoritmo de comparação de seqüência compreende um pro-grama de computador que indica polimorfismos. Em algumas modalidades, osistema de computador pode também compreender um identificador queidentifica uma ou mais características na referida seqüência. Em algumasmodalidades, a invenção fornece meios legíveis de computador que têm ar-mazenado nele uma seqüência de polipeptídeo ou uma seqüência de ácidonucléico de acordo com a invenção. Em algumas modalidades, a invençãofornece métodos para identificar uma característica em uma seqüência quecompreende as etapas de: (a) ler a seqüência usando um programa decomputador que identifica uma ou mais características em uma seqüência,em que a seqüência compreende uma seqüência de polipeptídeo ou umaseqüência de ácido nucléico de acordo com a invenção; e (b) identificar umaou mais características na seqüência com o programa de computador. Emalgumas modalidades, a invenção fornece métodos para comparar uma pri-meira seqüência a uma segunda seqüência compreendendo as etapas de:(a) ler a primeira seqüência e a segunda seqüência do princípio ao fim usan-do um programa de computador que compara as seqüências, em que a pri-meira seqüência compreende uma seqüência de polipeptídeo ou uma se-qüência de ácido nucléico de acordo com a invenção; e (b) determinar asdiferenças entre a primeira seqüência e a segunda seqüência com o pro-grama de computador. A etapa de determinar diferenças entre a primeiraseqüência e a segunda seqüência pode também compreender a etapa deidentificar polimorfismos. Em algumas modalidades, o método pode tambémcompreender um identificador que identifica uma ou mais características emuma seqüência. Em outras modalidades, o método pode compreender ler aprimeira seqüência usando um programa de computador e identificando umaou mais características na seqüência.
A invenção fornece métodos para isolar ou recuperar um ácidonucléico que codifica um polipeptídeo que tem uma atividade de enzima al-dolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose, de umaamostra, tal como uma amostra ambiental, que compreende as etapas de:(a) fornecer um par de seqüências iniciadoras de amplificação para amplifi-car um ácido nucléico que codifica um polipeptídeo que tem uma atividadede aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose, emque o par de iniciador é capaz de amplificar um ácido nucléico de acordocom a invenção; (b) isolar um ácido nucléico da amostra ou tratar a amostratal que o ácido nucléico na amostra seja acessível para hibridização para opar de iniciador de amplificação; e, (c) combinar o ácido nucléico da etapa(b) com o par de iniciador de amplificação da etapa (a) e amplificar o ácidonucléico da amostra, desse modo isolando ou recuperando um ácido nucléi-co que codifica um polipeptídeo que tem uma atividade de enzima aldolase,tal como piruvato aldolase, tal como HMG e/ou KHG aldose, de uma amos-tra. Um ou cada membro do par de seqüências iniciadoras de amplificaçãopode compreender um oligonucleotídeo que compreende um par de seqüên-cias iniciadoras de amplificação de acordo com a invenção, tal como tendopelo menos cerca de 10 a 50 bases consecutivas de uma seqüência de a-cordo com a invenção. Em uma modalidade da invenção, a amostra é umaamostra ambiental.
A invenção fornece métodos para isolar ou recuperar um ácidonucléico que codifica um polipeptídeo que tem uma atividade de enzima al-dolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose de umaamostra, tal como uma amostra ambiental, que compreende as etapas de:(a) fornecer uma sonda de polinucleotídeo que compreende um ácido nu-cléico de acordo com a invenção ou uma subseqüência deste; (b) isolar umácido nucléico da amostra ou tratar a amostra tal que o ácido nucléico naamostra seja acessível para hibridização para uma sonda de polinucleotídeoda etapa (a); (c) combinar o ácido nucléico isolado ou a amostra tratada daetapa (b) com a sonda de polinucleotídeo da etapa (a); e (d) isolar um ácidonucléico que especificamente hibridiza com a sonda de polinucleotídeo daetapa (a), desse modo isolando ou recuperando um ácido nucléico que codi-fica um polipeptídeo que tem uma atividade de enzima aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldose de uma amostra. A amos-tra pode compreender uma amostra de água, uma amostra líquida, uma a-mostra de terra, uma amostra de ar ou uma amostra biológica. Em algumasmodalidades, a amostra biológica pode ser derivada de uma célula bacteria-na, uma célula de protozoário, uma célula de inseto, uma célula de levedura,uma célula de planta, uma célula fúngica ou uma célula de mamífero. Emuma modalidade da invenção, a amostra é uma amostra ambiental.
A invenção fornece métodos de gerar uma variante de um ácidonucléico que codifica um polipeptídeo que tem uma atividade de enzima al-dolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose quecompreende as etapas de: (a) fornecer um ácido nucléico modelo que com-preende um ácido nucléico de acordo com a invenção; e (b) modificar, dele-tar ou adicionar um ou mais nucleotídeos na seqüência modelo, ou umacombinação destes, para gerar uma variante do ácido nucléico modelo. Emalgumas modalidades, o método pode também compreender expressar oácido nucléico variante para gerar um polipeptídeo de enzima aldolase vari-ante, tal como piruvato aldolase, tal como HMG e/ou KHG aldose. As modifi-cações, adições ou deleções podem ser introduzidas por um método quecompreende PCR propenso ao erro, embaralhamento, mutagênese direcio-nada ao oligonucleotídeo, PCR de montagem, mutagênese de PCR sexual,mutagênese in vivo, mutagênese de cassete, mutagênese de conjunto re-cursivo, mutagênese de conjunto exponencial, mutagênese específica dolocal, remontagem de gene, Mutagênese de Saturação de Sítio de Gene(GSSM), remontagem de ligação sintético (SLR), Mutagênese de SaturaçãoCromossômica (CSM) ou uma combinação destes. Em outras modalidades,as modificações, adições ou deleções são introduzidas por um método quecompreende recombinação, recombinação de seqüência recursiva, mutagê-nese de DNA modificada por fosfotiotato, mutagênese modelo contendo ura-cila, mutagênese dúplex intervalada, mutagênese de reparo de má combina-ção de ponto, mutagênese de filamento hospedeiro deficiente de reparo, mu-tagênese química, mutagênese radiogênica, mutagênese de deleção, muta-gênese de seleção por restrição, mutagênese de purificação por restrição,síntese de gene artificial, mutagênese de conjunto, criação de multímero deácido nucléico quimérico e uma combinação destes.
Em algumas modalidades, o método pode ser iterativamenterepetido até uma enzima aldolase, tal como piruvato aldolase, HMG e/ouKHG aldolase que tem uma atividade alterada ou diferente ou uma estabili-dade alterada ou diferente daquela de um polipeptídeo codificado pelo ácidonucléico modelo, seja produzida. Em algumas modalidades, o polipeptídeode enzima aldolase variante, tal como piruvato aldolase, tal como HMG e/ouKHG aldose é termotolerante, e retém alguma atividade após ser exposto auma temperatura elevada. Em outras modalidades, o polipeptídeo de enzimaaldolase variante, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-se aumentou a glicosilação quando comparado à enzima aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldose codificada por um ácidonucléico modelo. Alternativamente, o polipeptídeo de aldolase variante, talcomo piruvato aldolase, tal como HMG e/ou KHG aldose tem uma atividadede enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHGaldose sob uma temperatura elevada, em que a enzima aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldose codificada pelo ácido nu-cléico modelo não é ativa sob temperatura elevada. Em algumas modalida-des, o método pode ser iterativãmente repetido até que uma enzima aldola-se, tal como piruvato aldolase, HMG e/ou KHG aldolase que codifica a se-qüência que tem um uso de códon alterado daquele do ácido nucléico mode-Io, seja produzida. Em outras modalidades, o método pode ser interativa-mente repetido até que um gene de enzima aldolase, tal como piruvato aldo-lase, HMG e/ou KHG aldolase que tem nível mais alto ou mais baixo de ex-pressão de mensagem ou estabilidade daquele ácido nucléico modelo, sejaproduzido.
A invenção fornece métodos para modificar códons em um ácidonucléico que codifica um polipeptídeo que tem um atividade de enzima aldo-lase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose para au-mentar sua expressão em uma célula hospedeira, o método compreende asseguintes etapas: (a) fornecer um ácido nucléico de acordo com a invençãoque codifica um polipeptídeo que tem um atividade de enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldose; e, (b) identificar umcódon não-preferido ou um códon menos preferido no ácido nucléico da eta-pa (a) e substituindo ele com um códon preferido ou neutralmente usado oqual codifica o mesmo aminoácido como o códon substituído, em que umcódon preferido é um códon super-representado codificando seqüências emgenes na célula hospedeiro e um códon não-preferido ou menos preferido éum códon sub-representado codificando seqüências em genes na célulahospedeira, desse modo modificando o ácido nucléico para aumentar suaexpressão em uma célula hospedeira.
A invenção fornece métodos para modificar códons em um ácidonucléico que codifica um polipeptídeo que tem um atividade de enzima aldo-lase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose; o métodocompreendendo as seguintes etapas: (a) fornecer um ácido nucléico de a-cordo com a invenção; e, (b) identificar um códon no ácido nucléico da etapa(a) e substituir com um códon diferente que codifica o mesmo aminoácidocomo o códon substituído, desse modo modificando os códons em um ácidonucléico que codifica uma enzima aldolase, tal como piruvato aldolase, HMGe/ou de KHG aldolase.
A invenção fornece métodos para modificar códons em um ácidonucléico que codifica um polipeptídeo que tem um atividade de enzima aldo-lase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose para au-mentar sua expressão em uma célula hospedeira, o método que compreen-de as seguintes etapas: (a) fornecer um ácido nucléico de acordo com a in-venção que codifica um polipeptídeo de enzima aldolase, tal como piruvatoaldolase, HMG e/ou de KHG aldolase; e, (b) identificar um códon não-preferido ou um menos preferido no ácido nucléico da etapa (a) e substituircom um códon preferido ou neutralmente usado que codifica o mesmo ami-noácido como o códon substituído, em que um códon preferido é um códonsuper-representasdo nas seqüências de codificação em genes na célulahospedeira e um códon não-preferido ou menos preferido é um códon sub-representado em seqüências de codificação em genes na célula hospedeira,desse modo modificando o ácido nucléico para aumentar sua expressão emuma célula hospedeira.
A invenção fornece métodos para modificar um códon em umácido nucléico que codifica um polipeptídeo que tem um atividade de enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose paradiminuir sua expressão em uma célula hospedeira, o método que compreen-de as seguintes etapas: (a) fornecer um ácido nucléico de acordo com a in-venção; e (b) identificar pelo menos um códon preferido no ácido nucléico daetapa (a) e substituir com um códon não-preferido ou menos preferido quecodifica o mesmo aminoácido como o códon substituído, em que um códonpreferido é um códon super-representado codificando seqüências em genesem uma célula hospedeira e um códon não-preferido ou menos preferido éum códon sub-representado codificando seqüências em genes na célulahospedeira, desse modo modificando o ácido nucléico para diminuir sua ex-pressão em uma célula hospedeira. Em algumas modalidades, a célula hos-pedeira pode ser uma célula bacteriana, uma célula fúngica, uma célula deinseto, uma célula de levedura, uma célula de planta ou uma célula de mamífero.
A invenção fornece métodos para produzir uma biblioteca deácidos nucléicos que codifica uma pluralidade de sítios ativos ou sítios deligação de substrato de enzima aldolase modificada, tal como piruvato aldo-lase, tal como HMG e/ou KHG aldose, em que os sítios ativos modificadosou sítios de ligação de substratos são derivados de um primeiro ácido nu-cléico compreendendo uma seqüência que codifica um primeiro sítio ativo ouum primeiro sítio de ligação de substrato do método que compreende as se-guintes etapas: (a) fornecer um primeiro ácido nucléico codificando um pri-meiro sítio ativo ou primeiro sítio de ligação de substrato, em que a primeiraseqüência de ácido nucléico compreende uma seqüência que hibridiza sobcondições rigorosas para um ácido nucléico de acordo com a invenção, e oácido nucléico codifica um sítio ativo de enzima aldolase, tal como piruvatoaldolase, HMG e/ou KHG aldolase ou um sítio de ligação de substrato deenzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase; (b)fornecer um conjunto de oligonucleotídeos mutagênicos que codificam vari-antes de aminoácido de ocorrência natural para uma pluralidade de códonsalvos no primeiro ácido nucléico; e, (c) usar o conjunto de oligonucleotídeosmutagênicos para gerar um conjunto de ácidos nucléicos variantes de codifi-cação de sítio ativo ou codificação de sítio de ligação de substrato codifican-do uma faixa de variações de aminoácido em cada códon de aminoácidoque foi mutagenizado, desse modo produzindo uma biblioteca de ácidos nu-cléicos que codificam uma pluralidade de sítios ativos ou sítios de ligação desubstrato de enzima aldolase modificada, tal como piruvato aldolase, tal co-mo HMG e/ou KHG aldose. Em algumas modalidades, o método compreen-de mutagenizar o primeiro ácido nucléico da etapa (um) por um método quecompreende um sistema de evolução direcionado otimizado, Mutagênese deSaturação de Sítio de Gene (GSSM), remontagem de ligação sintética(SLR), PCR propenso ao erro, embaralhamento, Mutagênese direcionada aooligonucleotídeo, PCR de montagem, mutagênese de PCR sexual, mutagê-nese in vivo, mutagênese de cassete, mutagênese de conjunto recursivo,mutagênese de conjunto exponencial, mutagênese específica do local, re-montagem de gene, e uma combinação destes. Em outras modalidades, ométodo compreende mutagenizar o primeiro ácido nucléico da etapa (a) ouvariantes por um método que compreende recombinação, recombinação deseqüência recursiva, mutagênese de DNA modificada por fosfotioato, muta-gênese de modelo contendo uracila, mutagênese dúplex intervalada, muta-gênese de reparo de má combinação de ponto, mutagênese de filamentohospedeiro deficiente de reparo, mutagênese química, mutagênese radiogê-nica, mutagênese de deleção, mutagênese de seleção por restrição, muta-gênese de purificação por restrição, síntese de gene artificial, mutagênesede conjunto, criação de multímero de ácido nucléico quimérico e uma combi-nação destes.
A invenção fornece métodos para fabricar uma molécula peque-na que compreende as seguintes etapas: (a) fornecer uma pluralidade deenzimas biossintéticas capaz de sintetizar ou modificar uma molécula pe-quena, em que um das enzimas compreende uma enzima aldolase, tal comopiruvato aldolase, HMG e/ou de KHG aldolase codificada por um ácido nu-cléico de acordo com a invenção; (b) fornecer pelo menos um substrato parauma das enzimas da etapa (a); e (c) reagir o substrato da etapa (b) com asenzimas sob condições que facilitam uma pluralidade de reações biocatalíti-cas para gerar uma molécula pequena por uma série de reações biocatalíti-cas. Em algumas modalidades, a invenção fornece métodos para modificaruma molécula pequena que compreende as seguintes etapas: (a) forneceruma enzima aldolase, tal como piruvato aldolase, HMG e/ou de KHG aldola-se, em que a enzima compreende um polipeptídeo de acordo com a inven-ção, ou, um polipeptídeo codificado por um ácido nucléico de acordo com ainvenção, ou uma subseqüência destes; (b) fornecer uma molécula pequena;e (c) reagir a enzima da etapa (a) com a molécula pequena da etapa (b) sobcondições que facilitem uma reação enzimática catalisadas pela enzima al-dolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose, dessemodo modificando uma molécula pequena por uma reação enzimática dealdolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. Em algumasmodalidades, o método pode compreender uma pluralidade de substratos demolécula pequena para á enzima da etapa (a), desse modo gerando umabiblioteca de moléculas pequenas modificadas produzida por pelo menosuma reação enzimática catalisada pela enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldose. Em algumas modalidades, o mé-todo pode compreender uma pluralidade de enzimas adicionais sob condi-ções que facilitam uma pluralidade de reações biocatalíticas pelas enzimaspara formar uma biblioteca de moléculas pequenas modificadas produzidaspela pluralidade de reações enzimáticas. Em outras modalidades, o métodotambém pode compreender a etapa de testar a biblioteca para determinar seuma molécula pequena modificada particular que exibe uma atividade dese-jada está presente dentro da biblioteca. A etapa de testar a biblioteca podetambém compreender as etapas de sistematicamente eliminar todos menosuma das reações biocatalíticas usadas para produzir uma porção da plurali-dade das moléculas pequenas modificadas dentro da biblioteca testando-sea porção da molécula pequena modificada quanto à presença ou ausênciada molécula pequena particular modificada com uma atividade desejada, eidentificando pelo menos uma reação biocatalítica específica que produz amolécula pequena modificada particular de atividade desejada.A invenção fornece métodos para determinar um fragmento fun-cional de uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHGaldolase que compreende as etapas de: (a) fornecer uma enzima aldolase,tal como piruvato aldolase, HMG e/ou KHG aldolase, em que a enzima com-preende um polipeptídeo de acordo com a invenção, ou um polipeptídeo co-dificado por um ácido nucléico de acordo com a invenção, ou uma subse-qüência desta; e (b) deletar uma pluralidade de resíduos de aminoácido daseqüência da etapa (a) e testar a subseqüência restante para uma atividadede enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHGaldose, desse modo determinando um fragmento funcional de uma enzimaaldolase, tal como piruvato aldolase, e/ou de HMG KHG aldolase. Em algu-mas modalidades, a atividade de enzima aldolase, tal como piruvato aldola-se, tal como HMG e/ou KHG aldose é medida fornecendo-se um substratode enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase edetectando-se uma diminuição na quantidade do substrato ou um aumentona quantidade de um produto de reação.
A invenção fornece métodos para engenharia de célula inteira defenótipos novos ou modificados usando varredura de fluxo metabólica emtempo real, o método compreendendo as seguintes etapas: (a) fabricar umacélula modificada modificando-se a composição genética de uma célula, emque a composição genética é modificada por adição à célula de um ácidonucléico de acordo com a invenção; (b) cultivar a célula modificada para ge-rar uma pluralidade de células modificadas; (c) medir pelo menos um parâ-metro metabólico da célula monitorando-se a cultura de célula da etapa (b)em tempo real; e, (d) analisar os dados da etapa (c) para determinar se oparâmetro medido difere de uma medida comparável em uma célula inalte-rada sob condições similarmentes, desse modo identificando um fenótipocriado na célula usando varredura de fluxo metabólico em tempo real. Emalgumas modalidades, a composição genética da célula pode ser modificadapor um método que compreende deleção de uma seqüência ou modificaçãode uma seqüência na célula, ou, nocauteando-se a expressão de um gene.Em algumas modalidades, o método pode também compreender selecionaruma célula que compreende um fenótipo recentemente criado. Em outrasmodalidades, o método pode compreender cultivar a célula selecionada,desse modo gerando uma nova linhagem de célula que compreende um fe-nótipo recentemente criado.
A invenção fornece métodos de termotolerância ou termoestabi-Iidade crescentes de um polipeptídeo de enzima aldolase, tal como piruvatoaldolase, HMG e/ou KHG aldolase, o método compreendendo glicosilaçãode um polipeptídeo de enzima aldolase, tal como piruvato aldolase, HMGe/ou KHG aldolase, em que o polipeptídeo compreende trinta aminoácidoscontíguos de pelo menos Um polipeptídeo de acordo com a invenção; ou umpolipeptídeo codificado por uma seqüência de ácido nucléico de acordo coma invenção, desse modo aumentando a termotolerância ou termoestabilidadedo polipeptídeo de aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldose. Em algumas modalidades, a atividade específica de enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose podeser termoestável ou termotolerante a uma temperatura na faixa maior do quecerca de 37°C a cerca de 95°C.
A invenção fornece métodos para super-expressar um polipeptí-deo de aldolase recombinante, tal como piruvato aldolase, tal como HMGe/ou KHG aldose em uma célula compreendendo expressar um vetor quecompreende um ácido nucléico que compreende um ácido nucléico de acor-do com a invenção ou uma seqüência de ácido nucléico de acordo com ainvenção, em que as identidades de seqüência são determinadas por varre-dura com um algoritmo de comparação de seqüência ou através de inspeçãovisual, em que a super-expressão é realizada por uso de um promotor deatividade elevada, um vetor dicistrônico ou por amplificação de gene do vetor.
A invenção fornece métodos para fabricar uma planta transgêni-ca compreendendo as seguintes etapas: (a) introduzir uma seqüência deácido nucléico heterólogo na célula, em que a seqüência nucléica heterólogacompreende uma seqüência de ácido nucléico de acordo com a invenção,desse modo produzindo uma célula de planta transformada; e (b) produziruma planta transgênica da célula transformada. Em algumas modalidades, aetapa (a) pode também compreender introduzir a seqüência de ácido nucléi-co heteróloga por eletroporação ou microinjeção de protoplastos de célula deplanta. Em outras modalidades, a etapa (a) pode também compreender in-troduzir diretamente a seqüência de ácido nucléico heteróloga no tecido deplanta através de bombardeio de partícula de DNA. Alternativamente, a eta-pa (a) pode também compreender introduzir a seqüência de ácido nucléicoheteróloga no DNA de célula de planta usando um hospedeiro Agrobacteri-um tumefaciens. Em algumas modalidades, a célula de planta pode ser umacélula de açúcar de cana, beterraba, soja, tomate, batata, milho, arroz, trigo,tabaco ou cevada.
A invenção fornece métodos para expressar uma seqüência deácido nucléico heteróloga em uma célula de planta que compreende as se-guintes etapas: (a) transformar a célula de planta com uma seqüência deácido nucléico heteróloga operavelmente ligada a um promotor, em que aseqüência nucléica heteróloga compreende um ácido nucléico de acordocom a invenção; (b) cultivar a planta sob condições em que a seqüência deácidos nucléicos heterólogas sejam expressas na célula de planta. Em al-gumas modalidades, a invenção fornece métodos para expressar uma se-qüência de ácido nucléico heteróloga em uma célula de planta que compre-ende as seguintes etapas: (a) transformar a célula de planta com uma se-qüência de ácido nucléico heteróloga operavelmente unida a um promotor,em que a seqüência nucléica heteróloga compreende uma seqüência deacordo com a invenção; (b) cultivar a planta sob condições em que a se-qüência de ácido nucléico heteróloga seja expressa na célula de planta.
A invenção fornece alimentos ou comidas que compreendem umpolipeptídeo de acordo com a invenção, ou um polipeptídeo codificou por umácido nucléico de acordo com a invenção. Em algumas modalidades, a in-venção fornece comidas, alimentos, líquidos, tal como bebidas (tal como su-cos de fruta ou cerveja), pães ou massas ou produtos de pão, ou precurso-res de bebida (tal como mosto de cerveja), compreendendo um polipeptídeode acordo com a invenção. Em outras modalidades, a invenção fornece co-midas, alimentos, ou aditivos de bebida que compreendem um polipeptídeode acordo com a invenção. Em algumas modalidades, a invenção fornececomidas ou suplementos nutricionais, tal como para um ser humano ou umanimal, compreendendo um polipeptídeo de acordo com a invenção, tal co-mo um polipeptídeo codificado pelo ácido nucléico de acordo com a invenção.
Em algumas modalidades, o polipeptídeo na comida ou suple-mento nutricional pode ser glicosilado. Em algumas modalidades, a invençãofornece matrizes de liberação de enzima comestível que compreendem umpolipeptídeo de acordo com a invenção, tal como um polipeptídeo codificadopelo ácido nucléico de acordo com a invenção. Em algumas modalidades, amatriz de liberação compreende um pélete. Em algumas modalidades, o po-lipeptídeo pode ser glicosilado. Em algumas modalidades, a atividade deenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldoseé termotolerante. Em outras modalidades, a atividade de enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldose é termoestável.
A invenção fornece comidas, alimentos ou suplementos nutricio-nais que compreendem um polipeptídeo de acordo com a invenção. Em al-gumas modalidades, a invenção fornece métodos para utilizar uma enzimaaldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase tal como umsuplemento nutricional em uma dieta animal, o método compreendendo:preparar um suplemento nutricional que contém uma enzima aldolase, talcomo piruvato aldolase, HMG e/ou KHG aldolase que compreende pelo me-nos trinta aminoácidos contíguos de um polipeptídeo de acordo com a in-venção; e administrar o suplemento nutricional a um animal. O animal podeser um ser humano, um ruminante ou um animal monogástrico. A enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose podeser preparada por expressão de um polinucleotídeo que codifica a enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose em umorganismo selecionado do grupo que consiste em uma bactéria, um levedu-ra, uma planta, um inseto, um fungo e um animal. O organismo pode ser se-lecionado do grupo que consiste em um S. pombe, S. cerevisiae, Pichia pas-toris, Ε. coli, Streptomyces sp., Bacilo sp., Pseudomonas sp., Aspergillus sp.e Lactobacillus sp.
A invenção fornece matrizes de liberação de enzima comestívelque compreendem uma enzima aldolase recombinante termoestável, tal co-mo piruvato aldolase, tal como HMG e/ou KHG aldose, como um polipeptí-deo de acordo com a invenção. Em algumas modalidades, a invenção forne-ce métodos para liberar um suplemento de enzima aldolase, tal como piruva-to aldolase, HMG e/ou KHG aldolase a um animal, o método compreenden-do: preparar uma matriz de liberação de enzima comestível na forma de pé-Ietes que compreendem um portador comestível granulado e uma enzimaaldolase recombinante termoestável, tal como piruvato aldolase, tal comoHMG e/ou KHG aldose, em que os péletes facilmente dispersam a enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldose contidanesta em meios aquosas, e administrando a matriz de liberação de enzimacomestível ao animal. A enzima aldolase recombinante, tal como piruvatoaldolase, tal como HMG e/ou KHG aldose pode compreender um polipeptí-deo de acordo com a invenção. A enzima aldolase, tal como piruvato aldola-se, tal como HMG e/ou KHG aldose pode ser glicosilada para fornecer ter-moestabilidade em condições de peletizado. A matriz de liberação pode serformada através de peletizado de uma mistura que compreende um germede grão e uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHGaldolase. As condições de peletizado podem incluir aplicação de vapor. Ascondições de peletizado podem compreender aplicação de uma temperaturamaior de cerca de 80°C durante cerca de 5 minutos e a enzima retém umaatividade específica de pelo menos 350 a cerca de 900 unidades por mili-grama de enzima.
Em algumas modalidades, a invenção fornece composições far-macêuticas que compreendem uma enzima aldolase, tal como piruvato aldo-lase, HMG e/ou KHG aldolase de acordo com a invenção, ou um polipeptí-deo codificado por um ácido nucléico de acordo com a invenção. Em algu-mas modalidades, a composição farmacêutica age como uma auxiliar digestivo.Em algumas modalidades, um composto contendo ligação decarbono-carbono é contatado com um polipeptídeo de acordo com a inven-ção tendo atividade de enzima aldolase, tal como atividade de enzima piru-vato aldolase, tal como HMG e/ou KHG aldose, a um pH que varia de cercade pH 3,0 a cerca de 9,0, cerca de 3,0 a cerca de 10,0, cerca de 3,0 a cercade 11,0 ou mais. Em outras modalidades, um composto contendo ligação decarbono-carbono é contatado com a enzima aldolase, tal como piruvato aldo-lase, tal como HMG e/ou KHG aldose, a uma temperatura de pelo menoscerca de 55°C, 60°C, 65°C, 70°C, 75°C, 80°C, 85°C, 90°C, ou mais.
Esta descrição fornece, entre outras coisas, polipeptídeos quesão úteis na facilitação de uma reação em processos para produzir monati-na, derivados de monatin, e sais destes, por exemplo na produção de ácidoR-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (também chamado monatina deácido R-alfa ceto, precursor de R-monatina, R-MP, e a forma alfa ceto demonatina), um precursor para certos estereoisômeros de monatina, tal comomonatina R,R e S,R. A descrição também fornece métodos para fabricarmonatina, derivados de monatina, e sais destes e produtos de condensaçãointernos que usam um ou mais polipeptídeos da invenção. Os métodos desintetização de R-MP, estereoisômeros de monatina e/ou estereoisômerosde derivados de monatina incluem o uso de um ou mais polipeptídeos comatividade aldolase de quaisquer das SEQ ID NO: 2, SEQ ID NO: 4, SEQ IDNO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14,SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ IDNO: 24, SEQ ID NO:26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 325SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ IDNO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50,SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ IDNO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68,SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ IDNO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86,SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ IDNO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO:104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112,SEQ ID NO: 114, SEQ ID NO:116, SEQ ID NO: 118, SEQ ID NO: 120, SEQID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ IDNO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO:138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146,SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ IDNO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO:172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180,SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ IDNO: 198, SEQ ID N0:200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO:206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214,SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID N0:230, SEQ IDNO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO-.238, SEQ ID NO:240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248,SEQ ID N0:250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQID NO: 258, SEQ ID NO: 260, SEQ ID NO-.262, SEQ ID NO: 264, SEQ IDNO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO:274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282,SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ IDNO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO:308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316,SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO:322, SEQ ID NO: 324, SEQID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332, e SEQ IDNO: 334, e fragmentos enzimaticamente ativos destes.
Além disso, os métodos de sintetizar R-MP, estereoisômeros demonatina e/ou estereoisômeros de derivados de monatina podem incluir ouso de um polipeptídeo com atividade aldolase codificada por uma seqüên-cia de ácido nucléico tendo pelo menos cerca de 50%, 51%, 52%, 53%,54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%,67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%,80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%,93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais, ou identidade de seqüênciacompleta (100%) com ácido nucléico de acordo com a invenção, incluindoSEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9,SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ IDNO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27,SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ IDNO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45,SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ IDNO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63,SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ IDNO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81,SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ IDNO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99,SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ IDNO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO:125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133,SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ IDNO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO:159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167,SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ IDNO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO:191, SEQ IDNO:193, SEQ ID NO:195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO:201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ EO N0:207, SEQ EO N0:209,SEQ ID NO:211, SEQ EO NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQEO NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ IDNO:227, SEQ ID NO: 229, SEQ ID NO:231, SEQ EO NO:233, SEQ IDΝΟ:235, SEQ ID NO: 237, SEQ ID ΝΟ:239, SEQ ID ΝΟ:241, SEQ IDΝΟ:243, SEQ ID ΝΟ:245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ IDΝΟ:251, SEQ ID ΝΟ:253, SEQ ID ΝΟ:255, SEQ ID ΝΟ:257, SEQ EOΝΟ:259, SEQ ID NO: 261, SEQ EO ΝΟ:263, SEQ ID ΝΟ:265, SEQ ID NO:267, SEQ ID NO: 269, SEQ ID ΝΟ:271, SEQ ID NO: 273, SEQ ID NO: 275,SEQ ID ΝΟ:277, SEQ ID NO: 2799 SEQ ID ΝΟ:281, SEQ ID ΝΟ:283, SEQID ΝΟ:285, SEQ ID NO: 287, SEQ EO ΝΟ:289, SEQ ID ΝΟ:291, SEQ IDΝΟ:293, SEQ EO ΝΟ:295, SEQ ID ΝΟ:297, SEQ ID NO: 299, SEQ IDΝ0:301, SEQ ID Ν0:303, SEQ ID NO: 305, SEQ ID Ν0:307, SEQ EOΝ.0:309, SEQ ID Ν0:311, SEQ ID ΝΟ:313, SEQ ID NO: 315, SEQ ID NO:317, SEQ ID NO: 319, SEQ ID ΝΟ:321, SEQ ID ΝΟ:323, SEQ ID NO: 325,SEQ ID ΝΟ:327, SEQ EO ΝΟ:329, SEQ ID ΝΟ:331, SEQ EO ΝΟ:333, SEQID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337, e SEQ ID ΝΟ:338 além deuma região de pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 75,100, 150, 2Q0, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800,850, 900, 950, 1000, 1050, 11005 1150, 1200, 1250, 1300, 1350, 1400,1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000,2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500, ou ais resíduos.
Além disso, os métodos de sintetização de R-MP, estereoisôme-ros de monatina e/ou estereoisômeros de derivados de monatina, podemincluir o uso de um polipeptídeo com atividade de aldolase codificada poruma seqüência de ácido nucléico que hibridiza sob condições rigorosas paraum ácido nucléico da SEQ EO NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ EONO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ IDNO:17, SEQ ID NO: 19, SEQ ID NO:21, SEQ ID NO: 23, SEQ EO NO:25,SEQ EO NO:27, SEQ ID NO:29, SEQ ID NO: 31, SEQ ID NO:33, SEQ IDNO:35, SEQ ID NO: 37, SEQ EO NO:39, SEQ ID NO:41, SEQ ID NO:43,SEQ EO NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ IDNO:53, SEQ ID NO:55, SEQ EO NO:57, SEQ ID NO: 59, SEQ ID NO:61,SEQ ID NO:63, SEQ EO NO:65, SEQ ID NO:67, SEQ ID NO: 69, SEQ IDNO:71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79,SEQ ID NO: 81 , SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ IDNO: 89, SEQ ID NO: 91, SEO ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97,SEQ ID NO: 99, SEQ ID NOrIOI1 SEQ ID NO: 103, SEQ ID NO: 105, SEQ IDNO: 107, SEQ ID NO: 109, SEQ ID NO-.III, SEQ ID NO: 113, SEQ ID NO:115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123,SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ IDNO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO:149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157,SEQ ID NO: 159, SEQ ID NO-.161, SEQ ID NO: 163, SEQ ID NO: 165, SEQID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ IDNO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO:183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191,SEQ ID NO: 193, SEQ BD NO: 195, SEQ ID NO: 197, SEQ ID NO: 199,SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQID NO-.209, SEQ ID NO-.211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ IDNO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO:225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233,SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ IDNO: 251, SEQ ID NO: 253, SEQ ID NO:255, SEQ ID NO: 257, SEQ ID NO:259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO:265, SEQ ID NO: 267,SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ IDNO: 277, SEQ ID NO:279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ IDNO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO: 291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO: 297, SEQ ID NO:299, SEQ ID NO: 301,SEQ ID N0:303, SEQ ID NOrSOS, SEQ ID N0:307, SEQ ID N0:309, SEQID NO-:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO: 317, SEQ IDNO:319, SEQ ID NO: 321, SEQ ID NO:323, SEQ ID NO:325, SEQ IDNO:327, SEQ ID NO:329, SEQ ID NOr3315 SEQ ID NO:333, SEQ IDNO:335, SEQ ID NO:336, SEQ ID NO: 337, e SEQ ID NO: 338.
A invenção fornece um método, compreendendo: produzir umproduto escolhido de monatina, derivados de monatina, sais destes, e com-binações destes em uma série de reações de multietapas, onde uma reaçãona série de reação é facilitada por um ou mais polipeptídeos escolhidos depolipeptídeos isolados ou recombinantes compreendendo a seqüência deaminoácido de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8,SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ IDNO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26,SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO :34, SEQ IDNO: 36, SEQ ID NO: 38, SEQ ID N0.40, SEQ ID NO: 42, SEQ ID NO: 44,SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ IDNO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 64,SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ IDNO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82,SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ IDNO: 92, SEQ ID NO-.94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100,SEQ ID NO: 102, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQID NO: 112, SEQ ID NO:114, SEQ ID NO-.116, SEQ ID NO: 118, SEQ IDNO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO:128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO:136,SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO-.142, SEQ ID NO-.144, SEQID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ IDNO: 154, SEQ ID NO: 156, SEQ ID NO:158, SEQ ID NO: 160, SEQ ID NO:162, SEQ ID NO: 164, SEQ ID NO-.166, SEQ ID NO: 168, SEQ ID NO: 170,SEQ ID NO:172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ IDNO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO:196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 204, SEQ ID NO: 206,SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ IDNO: 224, SEQ ID NO: 226, SEQ ID NO :228, SEQ ID NO: 230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO :236, SEQ ID NO: 238, SEQ ID NO: 240,SEQ ID NO :242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO :248, SEQID NO :250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO :256, SEQ IDNO: 258, SEQ ID NO: 260, SEQ ID NO :262, SEQ ID NO: 264, SEQ ID NO:2665 SEQ ID NO :268, SEQ ID NO :270, SEQ ID NO :272, SEQ ID NO: 274,SEQ ID NO: 276, SEQ ID NO :278, SEQ ID NO :282, SEQ ID NO :284, SEQID NO: 286, SEQ ID NO :288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ IDNO: 294, SEQ ID NO: 296, SEQ ID NO:298, SEQ ID NO: 300, SEQ ID NO:302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310,SEQ ID NO :312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ ID NO :318, SEQID NO-.320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ IDNO: 328, SEQ ID NO: 330, SEQ ID NO:332, or SEQ ID NO: 334, ou frag-mentos ou subseqüências destes tendo atividade de aldolase. Em algumasmodalidades, os fragmentos ou subseqüências destes têm uma atividade dealdolase de pelo menos 0,2 mg de MP/mg protem/h. Em outras modalida-des, os fragmentos ou subseqüências destes têm uma atividade de aldolasede pelo menos 0,1 mg MP/mg protein/h. Em algumas modalidades, a reaçãofacilitada por um ou mais polipeptídeos de acordo com a invenção é realiza-da em cerca de 1,0 a cerca de 10,0 mM de MgCI2. Em outras modalidades, areação facilitada por um ou mais polipeptídeos de acordo com a invenção érealizada a cerca de pH 7,0 a cerca de pH 11,5. Em ainda outras modalida-des, a reação facilitada por um ou mais polipeptídeos de acordo com a in-venção é realizada em cerca de 0,005% a cerca de 1% de detergente depolissorbato.
Em algumas modalidades, a reação é uma reação entre indol-3 -piruvato e uma fonte de carbono C3. Em algumas modalidades, a reaçãopreferencialmente produz ácido R-2 -hidróxi-2-(indol-3-il-metil)-4-cetoglutárico além de ácido S-2-hidróxi-2-(indol-3-il-metil)-4-cetoglutárico.
Em algumas modalidades, o produto feito pela série de reações de multietapa é monatina, sais desta e combinações desta.
Em outras modalidades, pelo menos um de monatina R,R, mo-natina R-S, ou uma combinação destas é produzido em maior quantidade doque monatin S,S ou monatina S,R na série de reação de multietapa. Em al-gumas modalidades, a monatina R,R é produzida em maior quantidade doque a monatin R,S, monatin S,S e monatin S,R na série de reações de mui-tietapa.
A invenção fornece um método, compreendendo: produzir umproduto escolhido de monatina, derivados de monatina, sais destes, e com-binações destes em uma série de reações de multietapa, onde uma reaçãona série de reações é facilitada por pelo menos um polipeptídeo codificadopor uma seqüência de ácido nucléico que compreende uma seqüência tendouma porcentagem de identidade de seqüência de pelo menos 50% paraSEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9,SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ IDNO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27,SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ IDNO;37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45,SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 61, SEQ IDNO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71,SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ IDNO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89,SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ IDNO: 99, SEQ ID NO :103, SEQ TD NQ:105, SEQ ID NO: 107, SEQ ID NO:109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117,SEQ ID NO-.119, SEQ ID NO:121, SEQ ID NO: 123, SEQ ID NO: 125, SEQID NO: 127, SEQ ID NO:129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ IDNO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO:143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151,SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ IDNO:169, SEQ ID NO: 1715 SSEQ ID NO:173, SEQ ID NO: 1755 SEQ ID NO:177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185,SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ BD NO:193, SEQID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 203, SEQ IDN0:205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ IDNO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO: 219, SEQ ID NO-221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO: 227, SEQ ID NO: 229,SEQ ID NO: 231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO: 237, SEQID NO: 239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255,SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQID NO: 265, SEQ ID NO: 267, SEQ ID NO-.269, SEQ ID NO: 271, SEQ IDNO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO: 287, SEQ ID NO:289, SEQ ID NO:291,SEQ ID NO: 293. SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQID NO: 301, SEQ ID NO: 303, SEQ ID N0:305, SEQ ID N0:307, SEQ IDN0:309, SEQ ID NO:311, SEQ ID NO: 313, SEQ ID NO:315, SEQ IDNO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID N0323, SEQ ID NO:325,SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO: 331, SEQ ID NO: 333, SEQID NO:335, SEQ ID NO:336, SEQ ID NO:337, ou SEQ ID NO:338. Em algu-mas modalidades, a porcentagem de identidade de seqüência é pelo menos 95%.
Em outras modalidades, a porcentagem de identidade de se-qüência é 100%.
A invenção fornece um método que compreende uma reaçãoque preferencialmente produz ácido R-2-hidróxi-2-(indol-3-il-metil)-4-cetoglutárico além de ácido S--2-hidróxi-2 - (indol-3-il-metil)-4-cetoglutáricoem que pelo menos um polipeptídeo codificado por uma seqüência de ácidonucléico que compreende uma seqüência que tem 95% de identidade deseqüência para SEQ ID NO: 28, SEQ ID NO: 116, SEQ ID NO: 298, SEQ IDNO: 44, SEQ ID NO: 54, SEQ ID NO: 148, SEQ ID NO: 46, SEQ ID NO: 134,SEQ ID NO: 142, SEQ ID NO: 122, SEQ ID NO: 74, SEQ ID NO: 64, SEQ IDNO: 108, SEQ ID NO: 96, SEQ ID NO: 126, SEQ ID NO: 80, SEQ ID NO: 36,SEQ ID NO:62, SEQ ID NO: 112, SEQ ID NO: 130, SEQ ID NO: 94, SEQ IDNO: 58, SEQ ID NO: 50, SEQ ID NO: 106, SEQ ID NO: 42, SEQ ID NO: 278,SEQ ID NO: 162, SEQ ID NO: 276, SEQ ID NO:178, SEQ ID NO: 166, SEQID NO: 218, SEQ ID NO:224, SEQ ID NO: 226, SEQ ID NO: 244, SEQ IDNO: 250, SEQ ID NO: 252, SEQ ID NO: 264, SEQ ID NO: 268, SEQ IDNO:272, SEQ ID NO: 184, SEQ ID NO: 282, SEQ ID NO: 186, SEQ ID NO:192, SEQ ID Ν0:200, SEQ ID NO: 284, SEQ ID NO: 172, SEQ ID NO: 180,SEQ ID NO: 168, SEQ ID NO: 228, SEQ ID NO: 236, SEQ ID NO: 238, SEQID N0:240, e SEQ ID NO: 156 é utilizado para facilitar uma reação em umasérie de reações de multietapa.
A invenção fornece um método compreendendo: produzir umproduto escolhido de monatina, derivados monatina, sais destes, e combina-ções destes em uma série de reações de multietapa, onde a reação na sériede reações é facilitada por pelo menos um polipeptídeo codificado por umaseqüência de ácido nudéico que compreende uma seqüência que hibridizasob condições rigorosas para um ácido nucléico da SEQ ID NO: 1, SEQ IDNO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO:21, SEQ ID NO: 23, SEQ ID NO:25, SEQ ID NO: 27, SEQ ID NO: 29, SEQID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO:39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO:45, SEQ ID NO: 47, SEQID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO:57, SEQ ID NO: 59, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO:77,SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ IDNO:87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95,SEQ ID NO:97, SEQ ID NO: 99, SEQ ID NO: 103, SEQ ID NO: 105, SEQ IDNO: 107, SEQ ID N0:109, SEQ ID NOrI I I, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO: 117, SEQ ID NO:119, SEQ ID NO: 121, SEQ ID NO:123, 'SEQ ID NO:125, SEQ ID NO :127, SEQ ID NO: 129, SEQ ID NO: 131, SEQID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO:139, SEQ IDNO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157,SEQ ID NO:159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ IDNO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ IDNO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ IDNO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID Ν0:203, SEQ ID Ν0:205, SEQ ID Ν0:207, SEQ ID Ν0:209,SEQ ID Ν0:211, SEQ ID ΝΟ:213, SEQ ID NO: 215, SEQ ID ΝΟ:217, SEQID ΝΟ:219, SEQ ID Ν0: 221, SEQ ID ΝΟ:223, SEQ ID ΝΟ:225, SEQ IDΝΟ:227, SEQ ID ΝΟ:229, SEQ ID Ν0: 231, SEQ ID ΝΟ:233, SEQ IDΝΟ:235, SEQ ID ΝΟ:237, SEQ ID ΝΟ:239, SEQ ID ΝΟ:241, SEQ ID Ν0:243, SEQ ID ΝΟ:245, SEQ ID ΝΟ:247, SEQ ID ΝΟ:249, SEQ ID Ν0: 251,SEQ ID Ν0: 253, SEQ ID ΝΟ:255, SEQ ID ΝΟ:257, SEQ ID ΝΟ:259, SEQID Ν0: 261, SEQ ID ΝΟ:263, SEQ ID ΝΟ:265, SEQ ID ΝΟ:267, SEQ IDΝΟ:269, SEQ ID Ν0: 271, SEQ ID ΝΟ:273, SEQ ID ΝΟ:275, SEQ IDΝΟ:277, SEQ ID ΝΟ:281, SEQ ID ΝΟ:283, SEQ ID ΝΟ:285, SEQ IDΝΟ:287, SEQ ID ΝΟ:289, SEQ ID ΝΟ:291, SEQ ID ΝΟ:293, SEQ IDΝΟ:295, SEQ ID ΝΟ:297, SEQ ID ΝΟ:2995 SEQ ID Ν0:301, SEQ IDΝ0:303, SEQ ID Ν0: 305, SEQ ID NO: 307, SEQ ID Ν0: 309, SEQ ID NO:311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319,SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ IDNO: 336, SEQ ID NO: 337, ou SEQ ID NO: 338.
A invenção também fornece um método compreendendo: produ-zir um produto escolhido de precursor de monatina, sais destes, e combina-ções destes, em uma série de reações de multietapa, onde a reação na sériede reações é facilitada por um ou mais polipeptídeos escolhidos de polipep-tídeos isolados ou recombinantes compreendendo a seqüência de aminoá-cido da SEQ ID N0:2, SEQ ID N0:4, SEQ EO N0:6, SEQ EO N0:8, SEQ IDNO: 10, SEQ ID N0:12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18,SEQ ID N0:20, SEQ EO NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ IDNO:28, SEQ ID N0:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQID NO:38, SEQ ID N0:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46,SEQ ID NO:48, SEQ ID N0:50, SEQ ID NO:52, SEQ ID NO:54, SEQ IDNO:56, SEQ ID NO:58, SEQ ID N0:60, SEQ ID NO:64, SEQ ID NO:66, SEQID NO:68, SEQ E> N0:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76,SEQ ID NO:78, SEQ ID N0:80, SEQ ID NO:82, SEQ ID NO:84, SEQ IDNO;86, SEQ ID NO:88, SEQ ID NO :90, SEQ ID NO:92, SEQ ID NO: 94,SEQ ID ΝΟ:96, SEQ ID ΝΟ:98, SEQ ID NO :100, SEQ ID Ν0: 104, SEQ IDNO: 106, SEQ ID NO :108, SEQ ID NO: 110, SEQ ID Ν0: 112, SEQ ID Ν0:114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID Ν0: 120, SEQ ID Ν0: 122,SEQ ID Ν0: 124, SEQ ID Ν0: 126, SEQ ID Ν0: 128, SEQ ID NO: 130, SEQID Ν0: 132, SEQ ID Ν0: 134, SEQ ID Ν0: 136, SEQ ID Ν0: 138, SEQ IDNO: 140, SEQ ID Ν0: 142, SEQ ID Ν0: 144, SEQ ID Ν0: 146, SEQ ID Ν0:148, SEQ ID Ν0: 150, SEQ ID Ν0: 152, SEQ ID Ν0: 154, SEQ ID NO: 156,SEQ ID Ν0: 158, SEQ ID Ν0: 160, SEQ ID Ν0: 162, SEQ ID NO: 164, SEQID Ν0: 166, SEQ ID Ν0: 168, SEQ ID Ν0: 170, SEQ ID Ν0: 172, SEQ IDNO: 174, SEQ ID Ν0: 176, SEQ ID Ν0: 178, SEQ ID Ν0: 180, SEQ ID Ν0:182, SEQ ID Ν0: 184, SEQ ID Ν0: 186, SEQ ID Ν0: 188, SEQ ID Ν0: 190,SEQ ID Ν0: 192, SEQ ID Ν0: 194, SEQ ID Ν0: 196, SEQ ID Ν0: 198, SEQID Ν0: 200, SEQ ID Ν0: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ IDNO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO:218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226,SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ IDNO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO:252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260,SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQID NO: 2705 SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ IDNO: 278, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO:288, SEQ ID Ν0:290, SEQ ID NO :292, SEQ ID NO :294, SEQ ID NO: 296,SEQ ID NO: 298, SEQ ID NO: 3005 SEQ ID NO :302, SEQ ID NO :304, SEQID NO :306, SEQ ID NO :308, SEQ ID NO :310, SEQ ID NO: 312, SEQ IDNO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO:322, SEQ ID NO :324, SEQ ID NO :326, SEQ ID NO :328, SEQ ID Ν0:330,SEQ ID NO :332, ou SEQ ID NO: 334, ou fragmentos ou subseqüências des-tes tendo atividade de aldolase, onde o referido precursor de monatina, saisdestes e combinações destes são doces.
A invenção fornece um método que compreende adicionalmente:produzir um produto escolhido de precursor de monatina, sais desta, e com-binações desta, em uma série de reações de multietapa, em que uma rea-ção na série de reações é facilitada por pelo menos um polipeptídeo codifi-cado por uma seqüência de ácido nucléico que compreende uma seqüênciaque tem uma porcentagem de identidade de seqüência de pelo menos 50%para SEQ ID NO :1, SEQ ID NO: 3, SEQ ID NO :5, SEQ ID NO :7, SEQ IDNO :9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO :15, SEQ ID NO :17,SEQ ID NO :19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ IDNO :27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO :33, SEQ ID NO :35,SEQ ID NO :37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ IDNO: 45,. SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53,SEQ ID NO: 55, SEQ ID NO:57, SEQ ID NO: 59, SEQ ID NO: 63, SEQ IDNO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73,SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ IDNO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91,SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ IDNO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO:111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119,SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ IDNO: 137, SEQ ID NO:139, SEQ ID NO: 1415 SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153,SEQ ID NO:155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ IDNO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO:179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187,SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQID NO: 197, SEQ ID NO: 199, SEQ ID NO: 203, SEQ ID NO: 205, SEQ IDNO: 207,,. SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO:215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223,SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ IDNO:241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID60 NO:249, SEQ ID NO:251, SEQ ID NO: 253, SEQ ID NO:255, SEQ IDNO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO: 263, SEQ IDNO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ IDNO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:281, SEQ IDNO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ IDNO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ IDNO:299, SEQ ID N0:301, SEQ ID N0:303, SEQ ID N0:305, SEQ IDN0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ ID NO:313, SEQ IDNO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ IDNO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ IDNO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID
NO:337, ou SEQ ID ΝΟ:338, em que o referido precursor de monatina, saisdestes, e combinações destes são doces.
A invenção também fornece um método, compreendendo: pro-duzir um produto escolhido de precursor de monatina, sais deste, e combi-nações destes, em uma série de reações de multietapa, onde a reação nasérie de reação é facilitada por pelo menos um polipeptídeo codificado poruma seqüência de ácido nucléico que compreende uma seqüência que hi-bridiza sob condições rigorosas para um ácido nucléico da SEQ ID NO: 1,SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO:29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO:47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQID NO: 57, SEQ ID NO: 59, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO:67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO:85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 103, SEQ ID NO:105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NOrIII1 SEQ ID NO: 113,SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQID NO: 123, SEQ ID NO: 125, SEO ID NO: 127, SEQ ID NO: 129, SEQ IDNO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO:139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147,SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ IDNO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO:173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181,SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQID NO: 191, SEQ ID NO:193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ IDNO: 199, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO:209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217,SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ IDNO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO:243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251,SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ IDNO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO:277, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287,SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ IDNO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO:313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321,SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ IDNO: 337, ou SEQ ID NO: 338, onde o referido precursor de monatina, saisdestes, e combinações destes são doce.
Em um esforço para ser conciso, onde sempre intermediá-rios/produtos são identificados no relatório descritivo e reivindicações (talcomo monatina, precursor de monatina, ou derivados de monatina) quandosendo formado, o termo "e/ou sais destes" deveria ser entendido ser incluídoonde aplicável. Em outras palavras, por exemplo, a frase "indol-3 - piruvato éconvertido para MP" deveria ser entendida ler "ácido indol-3-pirúvico é con-vertido para MP e/ou sais destes". Na realidade, uma pessoa de experiênciaordinária apreciaria que sob as condições de reação mostradas os sais dosintermediários/produtos estão de fato presentes.
De acordo com algumas modalidades, o método produz umamonatina ou composição de derivado de monatina em que a monatina oucomponente derivado de monatina da composição inclui somente as formasR,R e S,R de monatina ou derivados de monatina. O termo "somente" quan-do usado para indicar que somente certos isômeros são formados, significaque a série de reações produziria somente os isômeros identificados se aracemização não ocorresse. Por conseguinte, o termo "somente" não deve-ria ser considerado significar ausência de outros isômeros, porém de prefe-rência uma pessoa de experiência ordinária preferiria entender que outrasformas isoméricas podem estar presentes em uma quantia relativamentepequena devido a racemização que pode ocorrer. De acordo com algumasmodalidades, o método produz uma composição ém que a monatina oucomponente derivado de monatin da composição inclui somente a forma R,Rde monatina ou derivado de monatin (exceto na medida em que a racemiza-ção ocorre resultando em outras formas isoméricas).
Como usado aqui, a frase "composição de monatina" significacomposições que incluem um ou mais isômeros de monatina; o termo tam-bém pode significar somente uma única forma isomérica de monatina e nadamais.
Como usado aqui, a frase "composição de derivado de monati-na" significa composições que incluem um ou mais isômeros de um derivadode monatina; o termo também pode significar somente uma única forma i-somérica do derivado de monatina e nada mais.
Como usada aqui, a frase "derivado de monatina" tem a seguinteestrutura:<formula>formula see original document page 64</formula>
em que, Ra, Rb, Rc Rd, e Re cada representam qualquer substituinte selecio-nado de um átomo de hidrogênio, um grupo hidroxila, um grupo alquila C1-C3independentemente, um grupo alcóxi C1-C3, um grupo amino, ou um átomode halogênio, tal como um átomo de iodo, átomo de bromo, átomo de cloro,ou átomo de flúor. Porém, Ra, Rb, Rc Rd, e Re não podem todos simultane-amente ser hidrogênio. Alternativamente, Rb e Rc, e/ou Rd e Re podem for-mar juntos um grupo alquileno C1-C4, respectivamente.
Como usado aqui, "indol-3-piruvato substituído" significa um oumais átomos de carbono do anel de indol do indol-3-piruvato que é indepen-dentemente substituído por um ou mais dos grupos substituintes Ra, Rb, Rc,Rd, e Re definidos acima. Porém, Ra, Rb, Rc, Rd, e Re não podem todos si-multaneamente ser hidrogênio. Alternativamente, Rb e Rc, e/ou Rd e Re po-dem formar juntos um grupo C1-C4 alquileno, respectivamente.
Como usado aqui, "triptofano substituído" significa um ou maisátomos de carbono do anel de indol do triptofano que é substituído indepen-dentemente com um ou mais dos grupos Ra, Rb, Rc, Rd, e Re substituintesdefinidos acima. Porém, Ra, Rb, Rc, Rd, e Re não podem todos juntos simul-taneamente ser hidrogênio. Alternativamente, Rb e Rc, e/ou Rd e Re podemformar juntos um grupo alquileno C1-C4, respectivamente. Em uma modali-dade, o triptofano substituído contém o mesmo grupo de substituente no a-nel de indol como o derivado de monatina final.
Além disso, as séries de reações biossintéticas para produzirmonatina, descritos aqui podem utilizar um triptofano substituído para produ-zir derivados de monatina que são prováveis de ser doce. Em algumas mo·dalidades, o triptofano substituído a ser usado nas séries de reação biossin-téticas descritas aqui inclui o triptofano clorado e 5-hidroxitriptofan.
Por exemplo, D-triptofanos clorinados, que têm similaridadesestruturais a R,R monatina, foram identificados como adoçantes não nutriti-vos (particularmente 6-cloro-D- triptofano). Similarmente, formas substituídaspor hidróxi e halogenadas de monatina foram descobertas ser doces. Pedidode Patente Publicada dos Estados Unidos N0. 2005/0118317. Halogênios egrupos hidroxila podem ser substituíveis por hidrogênio, particularmente nasposições 1-4 do anel de benzeno no indol de triptofano, sem interferir emconversões subseqüentes em D- ou L-triptofano, indol-3-piruvato, MP, oumonatina. Indóis substituídos foram mostrados na literatura ser substratosadequados para PLP-enzimas e ter triptofanos substituídos produzidos. Fu-kuda, D. S., e outro, "Production of Substituted L-Tryptophans by Fermenta-tion," App!. Environ. Microbiol., 21:841-43 (1971). O halogênio não pareceestericamente impedir o mecanismo catalítico de subunidades de triptofanosintase beta e a enantioespecificidade ficou também intacta.
Em algumas modalidades da presente invenção, um processopara produção de uma composição de monatina é fornecido, que inclui pro-dução de indol-3-piruvato de L-triptofano, produção de ácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico ("precursor de monatina" ou "MP") de indol-3-piruvato, e produção de monatina de MP. A reação de L- triptofano para pro-duzir indol-3-piruvato é facilitada por uma enzima tendo maior especificida-de, maior atividade, ou ambas para L-triptofano do que para R-MP, R,R mo-natina, ou ambos. De acordo com certas modalidades, a reação de indol-3-piruvato é facilitada por uma enzima tendo atividade de aldolase R-específica e conseqüentemente produz R-MP. De acordo com certas moda-lidades, uma enzima racemase é fornecida a qual pode facilitar a epimeriza-ção do subproduto de aminoácido da reação de triptofano de uma forma i-somérica a outra forma isomérica.
Em algumas modalidade de acordo com a invenção, um proces-so para produção de uma composição de monatina é fornecido, que incluiprodução de indol-3-piruvato de L- triptofano, produção de ácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico ("precursor de monatina" ou "MP") de indol-3-piruvato, e produção de monatina de MP. A reação de L-triptofano para pro-duzir indol-3-piruvato é facilitada por uma enzima tendo maior especificida-de, maior atividade, ou ambos para L-triptofano do que para R-MP, R1R mo-natina, ou ambos, e a reação de MP para formar monatina é facilitada poruma enzima, que é estereosseletiva para R-MP. O termo "estereosseletiva"significa que uma enzima tem maior especificidade, maior atividade, ou am-bas para um isômero — neste caso para R-MP versus S-MP — sobre outro.Em modalidades preferidas, uma enzima estereosseletiva tem atividade limi-tada para um isômero quando comparada a outro. Atividade "limitada" signi-fica atividade que é minimamente ou não perceptível, por exemplo como de-terminado de acordo com experimentos fornecidos aqui.
Deve ser observado que, onde as referências são feitas a umasérie de reações tal como nos parágrafos precedentes, a invenção não re-quer cada etapa ser explicitamente realizada; é suficiente que as etapaspossam ser implicitamente realizadas. Em outras palavras, por exemplo, oprocesso para produção de uma composição de monatina, que inclui produ-ção de indol-3-piruvato de L-triptofano, produção de ácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico ("precursor de monatina" ou "MP") de indol-3-piruvato, e produção de monatina de MP, em que cada reação é facilitadapor uma enzima apropriada, pode ser realizado por combinação de L-triptofano com as enzimas e condições de fixação a fim de que as reaçõesenumeradas possam ocorrer. Em um tal exemplo L-triptofano pode reagirpara produzir indol-3-piruvato, o indol-3-piruvato produzido a partir da reaçãode L-triptofano pode reagir para formar MP, e o MP produzido a partir da re-ação de indol-3-piruvato pode reagir para formar monatina. O processo podetambém ser realizado, por meio de exemplo, fornécendo-se um compostoque pode produzir L-triptofano, sob condições adequadas para produção deL-triptofano ocorrer e combinando-se aquele composto com enzimas capa-zes de facilitar a série de reações mencionada sob condições que seriamadequadas para aquelas reações ocorrerem. Como ainda outro exemplo, oprocesso pode ser realizado fornecendo-se um microorganismo genetica-mente construído para produzir monatina de acordo com a série de reaçãodescrita, e fornecendo condições apropriadas para o processo de fermenta-ção ocorrer. Por exemplo, um microorganismo, que naturalmente produzgrandes quantidades de L-triptofano pode ser geneticamente construído pa-ra produzir ou superproduzir uma ou mais das enzimas utilizadas para facili-tar as reações na série de reação para monatina, e condições apropriadaspodem ser fornecidas a fim de que o microorganismo desse modo produzamonatina.
Em outras modalidades de acordo com a invenção, um processopara produção de monatina é fornecido, em que um substrato forma um L-aminoácido quando L-triptofano é convertido em indol-3-piruvato, indol-3-piruvato reage para formar MP (que pode incluir tanto R-MP quanto S-MPembora preferivelmente inclua apenas ou predominantemente R-MP), e o L-aminoácido reage para regenerar (também referido como "reciclo") o subs-trato quando R-MP é convertido em R,R monatina. A reação de R-MP paraformar R1R monatina é facilitada por uma aminotransferase de estereoinver-são tal como D-metionina aminotransferase (EC 2.6.1.41) ou uma enzimatendo atividade de D-fenilglicina aminotransferase.
Em outras modalidades de acordo com a invenção, um processopara produção de uma composição de monatina é fornecido, que inclui pro-dução de D-triptofano de L- triptofano, produção de indol-3-piruvato de D-triptofano, produção de R-MP de indol-3-piruvato, e produção de R,R mona-tina de R-MP. A produção do D-triptofano a partir do L-triptofano é facilitadapor uma triptofano racemase e equivalentes funcionais desta. Em certas ou-tras modalidades, as reações de D-triptofano para formar indol-3-piruvato ede MP para formar monatina são facilitadas pela mesma enzima. Em aindatambém outras modalidades, a reação de indol-3-piruvato é facilitada poruma enzima tendo atividade de aldolase R-específica e conseqüentementeR-MP é formado, e as reações de D-triptofano para formar indol-3-piruvato ede R-MP para formar R,R monatina são facilitadas pela mesma enzima.
Em algumas modalidade de acordo com a invenção, um proces-so para produção de um derivado de monatina é fornecido, que inclui produ-ção do derivado de monatina a partir de um indol-3-piruvato substituído epiruvato, utilizando-se uma enzima tendo atividade de aldolase R-específicapara catalisar a reação.
Os detalhes de uma ou mais modalidades da invenção sãomencionados nos desenhos acompanhantes e na descrição abaixo. Outrosaspectos, objetivos, e vantagens de acordo com a invenção ficarão eviden-tes a partir da descrição e desenhos, e a partir das reivindicações. Comodeve ser realizado a partir da descrição anexa, a invenção é capaz de modi-ficações em várias modalidades, todas sem afastar-se do espírito e escopoda presente invenção. Conseqüentemente, os desenhos e descrição deta-lhada devem ser considerados como ilustrativos em natureza e não restritivos.
Todas as publicações, patentes, pedidos de patente, seqüênciasGenBank e depósitos de ATCC, citados aqui são por meio deste expressa-mente incorporados por referência para todos os propósitos.
BREVE DESCRIÇÃO DOS DESENHOS
Os seguintes desenhos são ilustrativos das modalidades da in-venção e não se destinam a limitar o escopo da invenção quando abrangi-dos pelas reivindicações.
A Figura 1 é um diagrama de fluxo que mostra um exemplo deum processo enzimático para produção de R,R monatina de L-triptofano deacordo com a invenção. Neste exemplo, o processo inclui a utilização deuma L-amino transferase (exemplos da qual incluem uma L-triptofano amino-transferase, uma aminotransferase L-aromática, uma L-aspartato amino-transferase, e uma L-alanina aminotransferase) na reação de L-triptofanoque tem maior especificidade e/ou seletividade para L-triptofano como umsubstrato do que para R-MP e/ou o processo inclui utilização de uma L-aminoácido oxidase com atividade limitada e/ou especificidade para R,Rmonatina como um substrato. No exemplo específico diagramado na Figura1, uma L-aminotransferase ou L-aminoácido oxidase converte L-triptofanoem indol-3-piruvato, indol-3-piruvato é reagido com uma aldolase R-específica e piruvato para produzir R-alfa-cetoácido monatina (R-MP), e R-MP é convertido em R,R monatina por uma D-amino transferase ou uma D-aminoácido desidrogenase. Como mostrado na Figura 1, as reações sãòreversíveis, porém para os propósitos da invenção, não é requerido que asreações prossigam na direção inversa.
A Figura 2 é um diagrama de fluxo que mostra um exemplo deoutro processo para produção de R,R monatina de acordo com a invenção.Neste exemplo, o processo inclui utilização de uma enzima para converterR-MP em monatina que é estereosseletiva para R-MP. No exemplo específi-co diagramado na Figura 2, triptofano é mostrado ser convertido em indol-3-piruvato em uma reação reversível. O indol-3-piruvato pode ser reagido comuma aldolase não estereoespecífica para reversivelmente formar alfa-cetoácido monatina (tanto R- quanto S-MP). O R-MP é reversivelmente con-vertido em R,R monatina por uma D-aminotransferase estereosseletiva ouuma D-aminoácido desidrogenase estereosseletiva. Qualquer S-MP que éformado pela aldolase não estereoespecífica pode ser convertido outra vezem indol-3-piruvato se uma D-aminotransferase ou D-aminoácido desidroge-nase estereosseletiva é utilizada. Para os propósitos da invenção, não é re-querido que as reações mostradas como sendo reversíveis prossigam nadireção inversa.
A Figura 3 é um diagrama de fluxo que mostra um exemplo deainda outro processo para produção de R,R monatina de L-triptofano de a-cordo com a invenção. Neste exemplo, o processo inclui conversão de L-triptofano em D-triptofano utilizando-se uma triptofano racemase e utilizando-se um produto de D-aminoácido na reação acoplada à reação que formaindol-3-piruvato como um substrato na reação acoplada à reação que formaR,R monatina. No exemplo específico diagramado na Figura 3, L-triptofano éconvertido em D-triptofano por uma triptofano racemase em uma reação re-versível. O D-triptofano é reagido com alfa-cetoglutarato (α-KG) e uma D-aminotransferase de ampla especificidade para produzir indol-3-piruvato e D-glutamato. lndol-3-piruvato é reagido com piruvato e uma aldolase R-específica e convertido em R-alfa-cetoácido monatina (R-MP), e R-MP é re-agido com uma D-aminotransferase de ampla especificidade e D-glutamatopara formar R,R monatina e alfa-cetoglutarato (α-KG). Como mostrado naFigura 3, cada uma das reações é reversível, porém para os propósitos dainvenção, não é requerido que as reações prossigam na direção inversa.
A Figura 4 é um diagrama de fluxo que mostra um exemplo deainda outro processo para produção de R,R monatina de L-triptofano de a-cordo com a invenção. Neste exemplo, o processo inclui conversão do L-aminoácido formado na reação acoplada com a reação de L-triptofano emum D-aminoácido; este D-aminoácido age como um doador amino para areação em que R-MP é convertido em R1R monatina. No exemplo específicodiagramado na Figura 4, L-triptofano é reagido com uma L-aminotransferasee alfa-cetoglutarato para produzir indol-3-piruvato e L-glütamato. lndol-3-piruvato é reagido com piruvato e uma aldolase R-específica e convertidoem R-alfa-cetoácido monatina (R-MP), e R-MP é reagido com uma D-aminotransferase de ampla especificidade e D-glutamato para formar R,Rmonatina e alfa-cetoglutarato. Como mostrado na Figura 4, as reações sãoreversíveis, porém para os propósitos da invenção, não é requerido que asreações prossigam na direção inversa.
A Figura 5 é um diagrama de fluxo que mostra um exemplo deainda outro processo para produção de R,R monatina de L-triptofano de a-cordo com a invenção. Neste exemplo, o processo inclui enzimaticamentefacilitar a conversão de R-MP em R,R monatina utilizando-se uma enzima deestereoinversão a fim de que o L-aminoácido formado pela reação acopladaà reação de L-triptofano possa ser utilizado como um substrato para a rea-ção acoplada à reação de R-MP em R,R monatina. No exemplo específicodiagramado na Figura 5, L- triptofano é reagido com uma L-aminotransferasee oxaloacetato, piruvato ou alfa- cetoglutarato (α-KG) para produzir indol-3-piruvato, e L-aspartato (se oxaloacetato for utilizado), L-alanina (se piruvatofor utilizado) ou L-glutamato (se α-KG for utilizado), indol-3-piruvato é reagi-do com piruvato e uma aldolase R-específica e convertido em R-alfa-cetoácido monatina (R-MP), e R-MP é reagido com uma aminotransferasede estereoinversão e L-aspartato, L-alanina ou L-glutamato para formar R1Rmonatina e oxaloacetato (se L-aspartato for utilizado), piruvato (se L-alaninafor utilizada) ou alfa-cetoglutarato (α-KG, se L-glutamato for utilizado). Comomostrado na Figura 5, as reações são reversíveis, porém para os propósitosda invenção, não é requerido que as reações prossigam na direção inversa.
A Figura 6 é um diagrama de fluxo que mostra um exemplo deainda outro processo para produção de R1R monatína de acordo com a pre-sente invenção. Neste exemplo, o processo inclui reciclagem do L-aminoácido produzido na reação formando indol-3-piruvato com o D-aminoácido utilizado como um reagente com R-MP na reação formando R1Rmonatina através de uma série de reações de conversão. No exemplo espe-cífico diagramado na FIG. 6,4_-triptofano é reversivelmente reagido com umaL-aminotransferase e oxaloacetato para produzir indol-3-piruvato e L-aspartato. lndol-3-piruvato é reagido de uma maneira reversível com piruvatoe uma aldolase R-específica e convertido em R-alfa-cetoácido monatina (R-MP), e R-MP é reversivelmente reagido com uma D-aminotransferase e D-alanina para formar R,R monatina e piruvato. O L-aspartato é convertido emL-alanina e CO2 utilizando-se uma aspartato 4-descarboxilase. A L-alanina éconvertida em D-alanina com uma alanina racemase. Para os propósitos dainvenção, não é requerido que as reações mostradas como sendo reversí-veis prossigam na direção inversa.
A Figura 7 é um diagrama de fluxo que mostra um exemplo deainda outro processo para produção de R,R monatina de acordo com a pre-sente invenção. Neste exemplo, o processo inclui prosseguir a reação de L-triptofano adiante (isto é, conduzir a reação em direção à produção de indol-3-piruvato) por conversão do subproduto de L-aminoácido daquela reaçãoem outro produto. Neste exemplo, o subproduto L-aspartato de L-aminoácidoé convertido em L-alanina em uma reação irreversível utilizando-se umadescarboxilase. No exemplo específico diagramado na Figura 7, L-triptofanoé reversivelmente reagido com uma L-aminotransferase e com alfa-cetoglutarato (α-KG) ou oxaloacetato para produzir indol-3-piruvato e L-glutamato (se α-KG for utilizado) ou L-aspartato (se oxaloacetato for utiliza-do), lndol-3-piruvato é reversivelmente reagido com piruvato e uma aldolaseR-específica e convertido em R-alfa-cetoácido monatina (R-MP). R-MP éreagido de uma maneira reversível com uma D-aminotransferase e um D-aminoácido para formar R,R monatina e qualquer um de oxaloacetato, piru-vato ou α-KG. O L-glutamato ou L-aspartato que foi um produto da reaçãode L-aminotransferase é convertido em 4-aminobutanoato e CO2 (se L- glu-tamato for o substrato) ou em β-alanina e CO2 (se L-aspartato for o substra-to) utilizando-se um ácido glutâmico ou uma aspartato descarboxilase. Paraos propósitos da invenção, não é requerido que as reações mostradas comosendo reversíveis prossigam na direção inversa.
A Figura 8 é um diagrama de fluxo que mostra um exemplo deainda outro processo para produção de R,R monatina de acordo com a pre-sente invenção. Neste exemplo, o processo inclui reciclagem do subprodutode aminoácido da reação de L-triptofano com o reagente de aminoácido dareação de R-MP através de uma série de reações de conversão. No exem-plo específico diagramado na FIG. 8, L-triptofano é reagido reversivelmentecom uma L- aminotransferase e com alfa-cetoglutarato (α-KG) para produzirindol-3-piruvato e L-glutamato. lndol-3-piruvato é reversivelmente reagidocom piruvato e uma aldolase R-específica e convertido em R-alfa-cetoácidomonatina (R-MP). R-MP é reagido de uma maneira reversível com uma D-aminotransferase e D-alanina para formar R,R monatina e piruvato. Uma L-alanina aminotransferase e piruvato são utilizados para reversivelmente con-verter o L-glutamato que foi um produto da reação de L-aminotransferaseoutra vez em α-KG, com L- alanina como um co-produto. Uma alanina race-mase reversivelmente converte a L-alanina na D-alanina que é útil na tercei-ra reação, (a reação de D-aminotransferase). Para os propósitos da inven-ção, não é requerido que as reações mostradas como sendo reversíveisprossigam na direção inversa.
A Figura 9 é um diagrama de bloco de um sistema de computa-dor.
A Figura 10 é um diagrama de fluxo ilustrando uma modalidadede um processo para comparar uma nova seqüência de nucleotídeo ou pro-teína com uma base dados de seqüências a fim de determinar os níveis dehomologia entre a nova seqüência e as seqüências na base de dados.
A Figura 11 é um diagrama de fluxo ilustrando uma modalidadede um processo em um computador para determinar se duas seqüênciassão homólogas.
A Figura 12 é um diagrama de fluxo ilustrando uma modalidadede um processo identificador 300 para detectar a presença de uma caracte-rística em uma seqüência.
As Figuras 13 e 14 juntamente ilustram as atividades de 58 aldo-Iases diferentes (cada qual identificada por seu número SEQ ID específico)na formação de precursor de monatina (MP) como avaliado por LC/MS/MS.
A Figura 15 ilustra o efeito de ditiotreitol sobre a produção demonatina pelo polipeptídeo com atividade de aldolase de SEQ ID NO: 88.
Símbolos de referência similarmentes nos vários desenhos indi-cam elementos similarmentes.
DESCRIÇÃO DETALHADA
Diversas modalidades foram descritas acima e são descritas emmaiores detalhes infra. Modalidades da invenção incluem um ou mais dosaspectos descritos.
Abreviações e Termos
As seguintes explicações de termos e métodos são fornecidaspara melhor descrever a presente descrição e guiar aqueles versados natécnica na prática da presente descrição. Como utilizado aqui, "incluindo"significa "compreendendo." Além disso, as formas singulares "um" ou "uma"ou "o/a" incluem referências plurais a menos que o contexto claramente ditede outra maneira. Por exemplo, referência a "compreendendo uma proteína"inclui uma ou uma pluralidade de tais proteínas, e referência a "compreen-dendo a célula" inclui referência a uma ou mais células e equivalentes des-tas conhecidos por aqueles versados na técnica, e assim por diante. O termo"cerca de" abrange a faixa de erro experimental que ocorre em, qualquermedição. A menos que de outra maneira estabelecido, todos os números demedição são presumidos ter a palavra "cerca de" na frente deles mesmo sea palavra "cerca de" não for expressamente utilizada.
Substituição conservativa: uma substituição de um aminoácidopor outro aminoácido em um polipeptídeo, cuja substituição tem pouco a ne-nhum impacto sobre a atividade do polipeptídeo. A substituição é considera-da conservativa independente dos aminoácidos permutados parecerem es-truturalmente ou funcionalmente similares. Por exemplo, idealmente, um po-lipeptídeo de triptofano aminotransferase incluindo uma ou mais substitui-ções conservativas retém a atividade de triptofano aminotransferase. Umpolipeptídeo pode ser produzido para conter uma ou mais substituições con-servativas por manipulação da seqüência de nucleotídeo que codifica aquelepolipeptídeo utilizando-se, por exemplo, procedimentos padrão tal como mu-tagênese direcionada ao sítio ou PCR ou outros métodos conhecidos poraqueles na técnica.
Exemplos não-limitantes de aminoácidos que podem ser substi-tuídos por um aminoácido original em uma proteína e que podem ser consi-derados como substituições conservativas se existe pequeno a nenhum im-pacto sobre a atividade do polipeptídeo incluem: Ala substituído com ser outhr; arg substituído com gin, his, ou lys; asn substituído com glu, gin, lys, his,asp; asp substituído com asn, glu, ou gin; cys substituído com ser ou ala; ginsubstituído com asn, glu, lys, his, asp, ou arg; glu substituído com asn, ginlys, ou asp; gly substituído com pro; his substituído com asn, lys, gin, arg, tyr;ile substituído com leu, met, vai, phe; leu substituído com ile, met, vai, phe;lys substituído com asn, glu, gin, his, arg; met substituído com ile, leu, vai,phe; phe substituído com trp, tyr, met, ile, ou leu; ser substituído com thr, ala;thr substituído com ser ou ala; trp substituído com phe, tyr; tyr substituídocom his, phe, ou trp; e vai substituído com met, ile, leu.
Outra informação a cerca de substituições conservativas podeser encontrada em, entre outras localizações, Ben-Bassat e outro, (J. Bacte-riol. 169:751-7, 1987), O1Regan e outro, (Gene 77:237-51, 1989), Sahin-Tothe outro, (Protein Sei. 3:240-7, 1994), Hochuli e outro, (Bio/Technology6:1321-5, 1988), WO 00/67796 (Curd e outro) e em livros didáticos padrãode genética e biologia molecular.
Derivada: Para propósitos do relatório descritivo e reivindica-ções, uma substância é "derivada" de um organismo ou fonte se qualquerum ou mais dos seguintes são verdadeiros: 1) a substância está presente noorganismo/fonte; 2) a substância é removida do hospedeiro nativo; ou, 3) asubstância é removida do hospedeiro nativo e é desenvolvida, por exemplo,por mutagênese.
Isolado: O termo "isolado" como utilizado aqui refere-se a qual-quer substância removida de seu hospedeiro nativo; a substância não ne-cessita ser purificada. Por exemplo " ácido nucléico isolado " refere-se a umácido nucléico de ocorrência natural que não está imediatamente contíguocom ambas as seqüências com as quais está imediatamente contíguo (umana extremidade 5' e uma na extremidade 3') no genoma de ocorrência natu-ral do organismo do qual ele é derivado. Por exemplo, um ácido nucléicoisolado pode ser, sem limitação, uma molécula de DNA recombinante dequalquer comprimento, contanto que uma das seqüências de ácido nucléiconormalmente encontrada imediatamente flanqueando aquela molécula deDNA recombinante em um genoma de ocorrência natural esteja removida ouausente. Desse modo, um ácido nucléico isolado inclui, sem limitação, umDNA recombinante que existe como uma molécula separada (tal como umcDNA ou um fragmento de DNA genômico produzido por PCR ou tratamentode endonuclease de restrição) independente de outras seqüências bem co-mo DNA recombinante que é incorporado em um vetor, um plasmídeo auto-nomicamente de replicação, um vírus (tal como um retrovírus, adenovírus,ou herpes vírus), ou no DNA genômico de um procariota ou eucariota. Alémdisso, um ácido nucléico isolado pode incluir uma molécula de DNA recom-binante que é parte de uma seqüência de ácido nucléico de fusão ou híbrida.
Como utilizado aqui, o termo "isolado" significa que o material(tal como uma proteína ou ácido nucléico de acordo com a invenção) é re-movido de seu ambiente original (tal como o ambiente natural se for de ocor-rência natural). Por exemplo, um polipeptídeo ou polinucleotídeo de ocorrên-cia natural presente em um animal vivo não é isolado, porém o mesmo poli-nucleotídeo ou polipeptídeo, separado de algum ou todos os materiais coe-xistentes no sistema natural, é isolado. Tais polinucleotídeos podem ser par-te de um vetor e/ou tais polinucleotídeos ou polipeptídeos podem ser parteda composição e ainda ser isolados naquele tal vetor ou a composição não éparte de seu ambiente natural.
O termo "isolado" como utilizado aqui com referência a ácidonucléico também inclui qualquer ácido nucléico de ocorrência não naturalporque seqüências de ácido nucléico de ocorrência não natural não são en-contradas na natureza e não têm seqüências imediatamente contíguas emum genoma de ocorrência natural. Por exemplo, ácido nucléico de ocorrên-cia não natural tal como um ácido nucléico construído é considerado ser áci-do nucléico isolado. Ácido nucléico construído pode ser feito utilizando-setécnicas de clonagem molecular comum ou síntese de ácido nucléico quími-ca. Ácido nucléico isolado de ocorrência não natural pode ser independentede outras seqüências, ou incorporado em um vetor, um plasmídeo autono-micamente de replicação, um vírus (tal como um retrovírus, adenovírus, ouherpes vírus), ou no DNA genômico de um procariota ou eucariota. Alémdisso, um ácido nucléico de ocorrência não natural pode incluir uma molécu-Ia de ácido nucléico que é parte de uma seqüência de ácido nucléico de fu-são ou híbrida.
Purificado: O termo "purificado" como utilizado aqui não requerpureza absoluta, porém de preferência é pretendido como um termo relativo.Desse modo, por exemplo, uma preparação de polipeptídeo ou ácido nucléi-co purificado pode ser uma em que o polipeptídeo ou ácido nucléico do indi-víduo está em uma concentração maior do que o polipeptídeo ou ácido nu-cléico estaria em seu ambiente natural dentro de um organismo ou em umaconcentração maior do que no ambiente do qual foi removida.
Ácidos nucléicos individuais obtidos de uma biblioteca foramconvencionalmente purificados para homogeneidade eletroforética. As se-qüências obtidas destes clones não podem ser obtidas diretamente da biblio-teca ou do DNA humano total. Os ácidos nucléicos purificados de acordocom a invenção foram purificados do restante do DNA genômico no orga-nismo por pelo menos IO4-IO6 vezes. Em algumas modalidades, o termo"purificado" inclui ácidos nucléicos que foram purificados do restante do DNAgenômico ou de outras seqüências em uma biblioteca ou outro ambiente porpelo menos uma ordem de magnitude, tal como, em algumas modalidade,duas ou três ordens, ou, quatro ou cinco ordens de magnitude.
Aminoácido: "Aminoácido" ou "seqüência de aminoácido" comoutilizado aqui refere-se a um oligopeptídeo, peptídeo, polipeptídeo, ou se-qüência de proteína, ou a um fragmento, porção, ou subunidade de qualquerum destes e a moléculas sintéticas ou de ocorrência natural. "Aminoácido"ou "seqüência de aminoácido" incluem um oligopeptídeo, peptídeo, polipep-tídeo, ou seqüência de proteína, ou um fragmento, porção, ou subunidadede qualquer um destes, e moléculas sintéticas ou de ocorrência natural. Otermo "polipeptídeo" como utilizado aqui, refere-se a aminoácidos unidos umao outro por ligações de peptídeo ou ligações de peptídeo modificadas, istoé, isósteros de peptídeo e pode conter aminoácidos modificados exceto os20 aminoácidos codificados por gene. Os polipeptídeos podem ser modifica-dos por processos naturais, tal como processamento pós-translacional, oupor técnicas de modificação química que são bem-conhecidas na técnica.
Modificações podem ocorrer em qualquer parte no polipeptídeo, incluindo aestrutura principal de peptídeo, as cadeias laterais de aminoácido e os ter-minais amino ou carboxila. Será apreciado que o mesmo tipo de modificaçãopode estar presente no mesmo ou graus variantes em diversos sítios em umdeterminado polipeptídeo. Também, um determinado polipeptídeo pode termuitos tipos de modificações. Modificações incluem acetilação, acilação,ribosilação de ADP, amidação, ligação covalente de flavina, ligação covalen-te de uma porção heme, ligação covalente de um nucleotídeo ou derivado denucleotídeo, ligação covalente de um lipídeo ou derivado de lipídeo, ligaçãocovalente de um fosfatidilinositol, ciclização de reticulação, formação de Iiga-ção dissulfeto, desmetilação, formação de reticulações covalentes, formaçãode cisteína, formação de piroglutamato, formilação, gama-carboxilação, gli-cosilação, formação de âncora de GPI, hidroxilação, iodinação, metilação,miristoliação, oxidação, pegilação, processamento de glicano hidrolase, fos-forilação, prenilação, racemização, selenoilação, sulfação e adição mediadapor RNA de transferência de aminoácidos à proteína tal como arginilação.(Vide Creighton, T.E., Proteins — Structure and Molecular Properties 2- Ed.,W.H. Freeman e Company, Nova Iorque (1993); Posttranslational CovalentModification of Proteins, B.C. Johnson, Ed., Academic Press, Nova Iorque,páginas 1-12 (1983)). Os peptídeos e polipeptídeos de acordo com a inven-ção também incluem todas as formas "miméticas" e "peptidomiméticas", co-mo descrito em maiores detalhes, abaixo.
Polipeptídeo Tendo uma Atividade de Aldolase: Por um "polipep-tídeo tendo uma atividade de aldolase" entende-se um polipeptídeo que porsi próprio, ou em associação com um ou mais polipeptídeos adicionais (ten-do a mesma ou uma seqüência diferente), é uma proteína com a atividadeenzimática de uma aldolase.
Recombinante: Proteínas ou polipeptídeos "recombinantes" refe-rem-se a polipeptídeos ou proteínas produzidos por técnicas de DNA recom-binante; isto é, produzidos de células transformadas por um constructo deDNA exógeno codificando a proteína ou polipeptídeo desejado. Proteína oupolipeptídeos "sintéticos" são aqueles preparados por síntese química. Mé-todos de síntese de peptídeo química de fase sólida podem também ser uti-lizados para sintetizar o polipeptídeo ou fragmentos de acordo com a inven-ção. Tal método foi conhecido na técnica desde o início do ano 1960 (Merri-field, R. B., J. Am. Chem. Soe, 85:2149-2154, 1963) (Vide também Stewart,J. M. e Young, J. D., Solid Phase Peptide Synthesis, 2- Ed., Pierce ChemicalCo., Rockford, 111., páginas 11-12)) e foi recentemente empregado em kitsde síntese e projeto de peptídeo de laboratório comercialmente disponíveis(Cambridge Research Biochemicals). Tais /c/te de laboratório comercialmentedisponíveis têm geralmente utilizado os ensinamentos de Η. M. Geysen eoutro, Proc. Natl. Acad. Sci., USA, 81:3998 (1984) e provêm peptídeos desintetização nas pontas de uma multidão de "bastões" ou "alfinetes" todosdos quais são conectados a uma única placa.
Substancialmente idênticas: A frase "substancialmente idênticas"no contexto de dois ácido nucléicos ou polipeptídeos, refere-se a duas oumais seqüências que têm, tal como pelo menos cerca de 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais de identidade de nu-cleotídeo ou resíduo de aminoácido (seqüência), quando comparadas e ali-nhadas para correspondência máxima, quando avaliadas utilizando-se umdos algoritmos de comparação de seqüência conhecidos ou por inspeçãovisual. Em outras modalidades, a identidade substancial existe sobre umaregião de pelo menos cerca de 100 ou mais resíduos e mais comumente asseqüências são substancialmente idênticas sobre pelo menos cerca de 150a 200 ou mais resíduos. Em algumas modalidades, as seqüências são subs-tancialmente idênticas sobre o comprimento inteiro das regiões de codificação.
Adicionalmente uma seqüência de aminoácido "substancialmen-te idêntica" é uma seqüência que se difere de uma seqüência de referênciapor uma ou mais substituições, deleções, ou inserções de aminoácido con-servativas ou não conservativas. Em algumas modalidades, a substituiçãoocorre em um sítio que não é o sítio ativo da molécula, ou, alternativamentea substituição ocorre em um sítio que é o sítio ativo da molécula, contantoque o polipeptídeo essencialmente mantenha suas propriedades funcionais(enzimáticas). Uma substituição de aminoácido conservativa, por exemplo,substitui um aminoácido por outro da mesma classe (tal como substituiçãode um aminoácido hidrofóbico, tal como isoleucina, valina, leucina, ou metio-nina, por outro, ou substituição de um aminoácido polar por outro, tal comosubstituição de arginina por lisina, ácido glutâmico por ácido aspártico ouglutamina por asparagina). Um ou mais aminoácidos podem ser deletados,por exemplo, de um polipeptídeo de aldolase, tal como piruvato aldolase,HMG e/ou KHG aldolase, resultando em modificação da estrutura do poli-peptídeo, sem significantemente alterar sua atividade biológica. Por exem-plo, aminoácidos de amino- ou carboxil-terminal que não são requeridos pa-ra atividade biológica da enzima aldolase, tal como piruvato aldolase, tal co-mo HMG e/ou KHG aldolase, podem ser removidos. Seqüências de polipep-tídeo modificado de acordo com a invenção podem ser ensaiadas para ativi-dade biológica da enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase, por qualquer número de métodos, incluindo con-tactar a seqüência de polipeptídeo modificado com um substrato e determi-nar se o polipeptídeo modificado diminui a quantidade de substrato específi-co no ensaio ou aumenta os bioprodutos da reação enzimática de um poli-peptídeo de aldolase funcional, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase, com o substrato.
Fragmento: Um "fragmento" como utilizado aqui com referênciaa uma proteína ou polipeptídeo ou ácido nucléico é uma porção da proteína,polipeptídeo ou ácido nucléico, respectivamente. Os fragmentos podem ter amesma ou substancialmente a mesma seqüência de aminoácido ou ácidonucléico como a seqüência de proteína, polipeptídeo ou ácido nucléico maislonga da quai o fragmento é derivado. Fragmentos que têm estruturas tridi-mensionais diferentes quando comparados àquele da proteína, polipeptídeoou ácido nucléico mais longo são também incluídos. Um exemplo deste, éuma molécula de "pró-forma", tal como uma pró-proteína de atividade baixaque pode ser modificada por clivagem para produzir uma enzima maduracom atividade significantemente maior. Um fragmento de uma proteína oupolipeptídeo pode ser uma porção enzimaticamente ativa de uma proteínaou polipeptídeo.
Aminotransferase de estereoinversão: Uma "aminotransferasede estereoinversão" é um polipeptídeo capaz de preferencialmente ou seleti-vamente produzir um produto de aminoácido quiral (tal como monatina) aomesmo tempo utilizar um substrato de quiralidade oposta como o doadoramino. Por exemplo, uma aminotransferase de estereoinversão pode seruma D-fenilglicina aminotransferase (também chamada D-4-hidroxifenilglicina aminotransferase) que preferencialmente ou seletivamenteusa L-glutamato como um substrato para produzir R1R monatina. Exemplosnão-limitantes de aminotransferases de estereoinversão incluem D-metionina aminotransferase (EC 2.6.1.41) e enzimas tendo atividade de D-fenilglicina aminotransferase ou atividade de D-4-hidroxifenilglicina amino-transferase.
A invenção fornece polipeptídeos com aldolase, incluindo ativi-dade de piruvato tal como, sem limitação, atividade de HMG e/ou KHG aldo-lase, polinucleotídeos que os codificam, e métodos de preparação e utiliza-ção destes polinucleotídeos e polipeptídeos. Em algumas modalidades, ainvenção também fornece enzimas aldolase, tal como piruvato aldolase, talcomo enzimas HMG e/ou KHG aldolase, polinucleotídeos que codificam es-tas enzimas, o uso de tais polinucleotídeos e polipeptídeos.
Em algumas modalidades, a invenção fornece aldolases modifi-cadas ou desenvolvidas, tal como piruvato aldolases, HMG e/ou KHG aldo-lases, com uma atividade específica aumentada quando comparadas às al-dolases não modificadas ou não desenvolvidas, respectivamente.
Em algumas modalidades, aldolases, tal como uma piruvato al-dolase, tal como, sem limitação uma HMG e/ou uma KHG aldolase, são for-necidas as quais facilitam a produção de um 2-ceto-glutarato 3,4-substituído.Em uma modalidade, a invenção fornece um método de preparação de um2-ceto-glutarato 3,4-substituído compreendendo: (a) fornecer um polipeptí-deo tendo uma atividade de aldolase, tal como uma atividade de piruvatoaldolase, tal como, sem limitação, uma atividade de HMG aldolase e/ouKMG aldolase; (b) fornecer um composto doador e um aceptor; e (c) contac-tar o polipeptídeo de etapa (a) com os compostos de etapa (b) sob condi-ções nas quais a aldolase cataliza a síntese de um 2-ceto-glutarato 3,4-substituído, em que opcionalmente o doador e o aceptor são um piruvato ouum doador de piruvato e um aceptor de α-cetoácido, uma cetona e/ou umaldeído.
Em outra modalidade da invenção, uma piruvato aldolase, talcomo uma HMG e/ou uma KHG aldolase, pode ser utilizada em conjuntocom uma D-aminotransferase para preparar um ácido D-glutâmico 4-substituído ou um derivado deste. Um ácido D-glutâmico 4-substituído e/ouum derivado deste podem ser utilizados como um antibiótico, como estescompostos foram descobertos inibir glutamato racemase bacteriana. Emuma modalidade, a invenção fornece um método de preparar um ácido D-glutâmico 4-substituído compreendendo: (a) fornecer um polipeptídeo tendouma atividade de aldolase, tal como uma atividade de piruvato aldolase, talcomo, sem limitação, uma atividade de HMG aldolase e/ou KMG aldolase;(b) fornecer um aceptor de α-cetoácido e um piruvato ou um doador de piru-vato; e (c) contactar o polipeptídeo de etapa (a) com os compostos de etapa(b) sob condições nas quais a aldolase cataliza a síntese de um ácido D-glutâmico 4-substituído, em que opcionalmente o polipeptídeo tem atividadede piruvato aldolase, HMG aldolase e/ou KHG aldolase e em que opcional-mente o método também compreende o uso de uma D-aminotransferase.
Em algumas modalidade a invenção fornece composições (talcomo preparações de enzima, alimentos e aditivos alimentares, alimenta-ções e aditivos de alimentação, bebida e aditivos de bebida, fármacos e adi-tivos de fármaco, e suplementos dietéticos) compreendendo as enzimas,polipeptídeos ou polinucleotídeos de acordo com a invenção. Estas compo-sições podem ser formuladas em uma variedade de formas, tal como formaslíquidas, géis, pílulas, comprimidos, sprays, películas, micelas, pós, alimento,péletes de alimentação ou encapsuladas, incluindo formas nanoencapsula-das.
Ensaios para avaliar a atividade de aldolase, incluindo atividadede piruvato tal como, sem limitação, atividade de HMG e/ou KHG aldolase,tal como para determinar se um polipeptídeo tem atividade de aldolase, in-cluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ouKHG aldolase, são bem-conhecidos na técnica e incluem-se no escopo deacordo com a invenção; vide E.E. Dekker & R.P. Kitson, J. Biol. Chem. 267,10507-10514, 1992; Taha TS, Deits TL, Purificação e caracterização de 2-ceto- 3-desóxi-6- fosfuglunato aldolase a partir de Azotobacter vinelandir. aevidência de que a enzima é biofuncional diferenciada a clivagem de 2-ceto-4 hidróxi glutarato, Biochem Biophys Res Commun. 15 de abril de 1994;200(l):459-66; Dekker EE, Kobes RD, Grady SR, 2-ceto-4-hidroxiglutaratoaldolose de fígado bovino, Methods Enzymol. 1975; 42:280-5; Dekker EE1Nishihara H, Grady SR, Methods Enzymol. 1975; 42:285-90, 2-ceto-hidroxiglutarato aldolase a partir de Escherichia colr, Nishihara H, Dekker EE,Biochim Biophys Acta. 8 de Julho de 1969; 185(l):255-7, uma 2-ceto-4-hidroxiglutarato aldolase estero-específica a partir de Eseheriehia coli. Umexemplo de um ensaio adequado para determinar se um polipeptídeo tematividade de aldolase, tal como piruvato aldolase, tal como atividade de HMGe/ou KHG aldolase é descrito no Exemplo 3.
Em algumas modalidades, as aldolases da invenção podem serutilizadas eficazmente em uma variedade de condições de pH, incluindo porexemplo, de uma faixa de cerca de 3,0 a cerca de 12,0. Em outras modali-dades, as aldolases da invenção podem ser utilizadas em torno do pH 3,0,4,0, 4,5, 5,0, 5,5, 6,0, 6,5, 7,0, 7,5, 8,0, 8,5, 9,0, 9,5, 10,0, 10,5, 11,0, 11,5,ou cerca de 12,0. Condições de reação conduzidas sob condições acídicasou alcalinas também podem ser vantajosas, tal como em algumas aplica-ções industriais ou farmacêuticas de enzimas de acordo com a invenção.
A invenção fornece aldolase, tal como piruvato aldolase, tal co-mo HMG e/ou KHG aldolase de acordo com a invenção em uma variedadede formas e formulações. Nos métodos de acordo com a invenção, polipep-tídeos de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG al-dolase de acordo com a invenção são utilizados em uma variedade de for-mas e formulações. Por exemplo, polipeptídeos de aldolase purificada, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase podem ser utili-zados em preparações de enzima dispostas na produção de ácido R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (R-MP) e certos estereoisômeros demonatina, tal como R,R e S,R monatina, e sais destes, bem como certosestereoisômeros de derivados de monatina, tal como as configurações dederivado de R1R e S,R monatina, e sais destes, ou em aplicações auxiliaresde dieta ou farmacêuticas. Alternativamente, as enzimas de acordo com ainvenção podem ser utilizadas diretamente em processos pára produzir áci-do R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (R-MP) e certos estereoisô-meros de monatina, tal como R,R e S,R monatina, e sais destes, bem comocertos estereoisômeros de derivados de monatina, tal como as configura-ções de derivado de R1R e S1R monatina, e sais destes, para preparar ali-mentos, líquidos ou alimentações, e similares.
Em algumas modalidades, polipeptídeos de aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a inven-ção podem ser expressos em um microorganismoo utilizando-se procedi-mentos conhecidos na técnica. Em algumas modalidades, os polipeptídeosde aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolasede acordo com a invenção podem ser imobilizados sobre um suporte sólidoantes do uso nos métodos de acordo com a invenção. Métodos para imobili-zar enzimas sobre suportes sólidos são comumente conhecidos na técnica,por exemplo J. Mol. Cat. B: Enzymatic 6 (1999) 29-39; Chivata e outro. Bio-catalysis: Immobilized cells and Enzimas, J Mol. Cat. 37 (1986) 1-24: Shar-ma e outro, Immobilized Biomaterials Techniques and Applications, Angew.Chem. Int. Ed. Engl. 21 (1982) 837-54: Laskin (Ed.), Enzimas and Immobili-zed Cells in Biotechnology.
Ácidos nucléicos, Sondas e Moléculas Inibitórias
A invenção fornece ácido nucléicos recombinantes e isolados, talcomo vide
Listagem de Seqüência; ácidos nucléicos codificando polipeptídeos, incluin-do as seqüências de polinucleotídeo de acordo com a invenção, tal comovide Listagem de Seqüência; incluindo cassetes de expressão tal como veto-res de expressão e vários veículos de clonagem compreendendo ácido nu-cléicos de acordo com a invenção. Em algumas modalidades, a invençãotambém inclui métodos para descobrir, identificar ou isolar novas seqüênciasde polipeptídeo de aldolase, tal como piruvato aldolase, HMG e/ou KHG al-dolase utilizando-se os ácidos nucléicos de acordo com a invenção. Em al-gumas modalidades, a invenção também inclui métodos para inibir a expres-são de transcrições e genes que codificam aldolase, tal como piruvato aldo-lase, tal como HMG e/ou KHG aldolase utilizando-se os ácidos nucléicos deacordo com a invenção.
São também fornecidos métodos para modificar os ácidos nu-cléicos de acordo com a invenção, incluindo preparação de variantes de áci-dos nucléicos de acordo com a invenção, por, tal como remontagem de liga-ção sintética, sistema de evolução direcionado otimizado e/ou mutagênesepor saturação tal como mutagênese por saturação de sítio genético (GSSM).O termo "mutagênese por saturação", Mutagênese por Saturação de SítioGenético, ou "GSSM" inclui um método que usa iniciadores de oligonucleotí-deo degenerado para introduzir mutações pontuais em um polinucleotídeo,como descrito em detalhes, abaixo. O termo "sistema de evolução direcio-nado otimizado" ou "evolução direcionada otimizada" inclui um método pararemontar fragmentos de seqüências de ácido nucléico relacionadas, tal co-mo genes relacionados, e explicado em detalhes, abaixo. O termo "remonta-gem de ligação sintética" ou "SLR" inclui um método de ligar fragmentos deoligonucleotídeo em um modelo não estocástico, e explicado em detalhes,abaixo. O termo "variante" refere-se a polinucleotídeos ou polipeptídeos deacordo com a invenção modificados em um ou mais pares de base, códons,íntrons, éxons, ou resíduos de aminoácido (respectivamente) que contudoainda mantêm a atividade biológica de uma aldolase, tal como piruvato aldo-lase, HMG e/ou KHG aldolase de acordo com a invenção. Variantes podemser produzidos por qualquer número de recursos incluídos os métodos taiscomo, por exemplo, PCR propenso a erro, emaranhamento, mutagênesedirecionada ao oligonucleotídeo, PCR de montagem, mutagênese de PCRsexual, mutagênese in vivo, mutagênese de cassete, mutagênese de conjun-to recursivo, mutagênese de conjunto exponencial, mutagênese específicaao sítio, remontagem de gene, GSSM e qualquer combinação destes.
Os ácidos nucléicos de acordo com a invenção podem ser pro-duzidos, isolados e/ou manipulados por, tal como clonagem e expressão debibliotecas de cDNA, amplificação de mensagem ou DNA genômico por P-CR, e similares. Por exemplo, seqüências de acordo com a invenção foraminicialmente derivadas de fontes ambientais. Desse modo, em algumas mo-dalidades, a invenção fornece ácidos nucléicos codificando aldolase, tal co-mo piruvato aldolase, tal como enzima de HMG e/ou KHG aldolase, e os po-lipeptídeos codificados por eles, preferivelmente derivados de uma fontecomum, tal como uma cultura mista ambiental, ou uma fonte bacteriana.
Na prática dos métodos de acordo com a invenção, genes ho-mólogos podem ser modificados por manipulação de um ácido nucléico pa-drão, tal como descrito aqui. Em algumas modalidades, uma invenção podeser praticada em conjunto com qualquer método ou protocolo ou dispositivoconhecido na técnica, que são bem descritos na literatura científica e de pa-tente.
As frases "ácido nucléico" ou "seqüência de ácido nucléico" talcomo utilizado aqui referem-se a um oligonucleotídeo, nucleotídeo, polinu-cleotídeo, ou a um fragmento de qualquer um destes, a DNA ou RNA de ori-gem genômica ou sintética que pode ser de filamento único ou de filamentoduplo e pode representar um filamento de sentido ou anti-sentido (comple-mentar), a ácido nucléico de peptídeo (PNA), ou a qualquer material de tipoDNA ou de tipo RNA, natural ou sintético em origem. As frases "ácido nu-cléico" ou "seqüência de ácido nucléico" incluem oligonucleotídeo, nucleotí-deo, polinucleotídeo, ou um fragmento de qualquer um destes, DNA ou RNA(tal como mRNA, rRNA, tRNA, iRNA) de origem genômica ou sintética quepode ser de filamento único ou de filamento duplo e pode representar umfilamento de sentido ou anti-sentido, ácido nucléico de peptídeo (PNA), ouqualquer material de tipo DNA ou de tipo RNA, natural ou sintético em ori-gem, incluindo, tal como iRNA, ribonucleoproteínas (tal como iRNAs de fila-mento duplo, tal como iRNPs). O termo abrange ácidos nucléicos, isto é,oligonucleotídeos, contendo análogos conhecidos de nucleotídeos naturais.
O termo também abrange estruturas de tipo ácido nucléico com cadeiasprincipais sintéticas, vide tal como Mata (1997) Toxicol. Appl. Pharmacol.144:189-197; Strauss- Soukup (1997) Biochemistry 36:8692-8698; Samstag(1996) Antisense Nucleic Acid Drug Dev 6:153-156. Oligonucleotídeo" incluíou um polidesoxinucleotídeo de filamento único ou dois filamentos de polide-soxinucleotídeo complementares que pode ser quimicamente sintetizado.
Tais oligonucleotídeos sintéticos não possuem nenhum fosfato 5' e destemodo não se ligarão a outro oligonucleotídeo sem adição de um fosfato comum ATP na presença de uma cinase. Um oligonucleotídeo sintético podeligar-se a um fragmento que não foi desfosforilado.
Uma "seqüência de codificação de" ou uma "codificação de se-qüência de nucleotídeo", um polipeptídeo ou proteína particular, é uma se-qüência de ácido nucléico que pode ser transcrita e trasladada em um poli-peptídeo ou proteína quando colocada sob o controle de seqüências regula-doras apropriadas. O termo "gene" quer dizer o segmento de DNA envolvidoem produção de uma cadeia de polipeptídeo; ele inclui regiões precedente eseguintes à região de codificação (líder e fra/fef) assim como, onde aplicável,seqüências intermediárias (íntrons) entre segmentos de codificação individu-ais (exons). Uma seqüência promotora está "operavelmente ligada a" umaseqüência de codificação quando RNA polimerase que inicia transcrição nopromotor transcreverá a seqüência de codificação em mRNA. "Operavel-mente ligada" tal como utilizado aqui refere-se a uma relação funcional entredois ou mais segmentos de ácido nucléico (tal como DNA). Ele pode referir-se à relação funcional de seqüência reguladora transcricional para uma se-qüência transcrita. Por exemplo, um promotor está operavelmente ligado auma seqüência de codificação, tal como um ácido nucléico de acordo com ainvenção, se ele estimula ou modula a transcrição da seqüência de codifica-ção em uma célula hospedeira apropriada ou outro sistema de expressão.Geralmente, seqüências reguladoras transcricionais promotoras que estãooperavelmente ligadas a uma seqüência transcrita são fisicamente contíguasà seqüência transcrita, isto é, elas são eis-ativas. No entanto, algumas se-qüências reguladoras transcricionais, tais como realçadores, necessitam nãoser fisicamente contíguas ou localizadas em estreita proximidade às se-qüências de codificação cuja transcrição elas realçam.
O termo "cassete de expressão" tal como utilizado aqui refere-sea uma seqüência de nucleotídeo que é capaz de afeição de expressão deum gene estrutural (isto é, uma seqüência de codificação de proteína, talcomo uma aldolase, tal como piruvato aldolase, enzima de HMG e/ou KHGaldolase de acordo com a invenção) em um hospedeiro compatível com taisseqüências. Cassetes de expressão incluem pelo menos um promotor ope-ravelmente ligado com a seqüência de codificação de polipeptídeo; e, opcio-nalmente, com outras seqüências, tais como signais de terminação de trans-crição. Fatores adicionais necessários ou úteis em execução de expressãopodem também ser utilizados, tais como realçadores, alfa-fatores. Dessemodo, cassetes de expressão também incluem plasmídeos, vetores de ex-pressão, vírus recombinantes, qualquer forma de vetor de "DNA nu" recom-binante, e similares. Um "vetor" compreende um ácido nucléico que podeminfectar, transfectar, transitoriamente ou permanentemente transduzir umacélula. Será reconhecido que um vetor pode ser um ácido nucléico nu, ouum ácido nucléico complexado com proteína ou lipídeo. O vetor opcional-mente compreende ácidos nucléicos e/ou proteínas, e/ou membranas viraisou bacterianos (tal como uma membrana celular, um envelope de lipídeoviral, etc.). Vetores incluem, mas não são limitados a réplicons (tais comoréplicons de RNA, bacteriófagos) aos quais fragmentos de DNA podem serligados e tornam-se replicados. Vetores deste modo incluem, mas não sãolimitados a RNA, DNA ou RNA circular ou linear de auto-replicação autôno-mo (tal como plasmídeos, vírus, e similares, vide Patente dos Estados Uni-dos No. 5.217.879), e incluem ambos os plasmídeos de expressão e não-expressão. Onde um microorganismo recombinante ou cultura celular é des-crito como hospedando um "vetor de expressão" isto inclui tanto DNA circu-lar e linear extra-cromossômico quanto DNA que foi incorporado no(s) cro-mossoma(s) de hospedeiro. Onde um vetor está sendo mantido por umacélula hospedeira, o vetor pode ou ser estavelmente replicado pelas céluladurante mitose como uma estrutura autônoma, ou é incorporado dentro dogenoma do hospedeiro.
Tal como utilizado aqui, o termo "recombinante" abrange ácidosnucléicos adjacentes a um ácido nucléico de "cadeia principal" ao qual elesnão são adjacentes em seu ambiente natural. Em algumas modalidades, aser "enriquecido" os ácidos nucléicos representarão cerca de 5% ou mais donúmero de inserções de ácido nucléico na população de moléculas de ca-deia principal de ácido nucléico. Moléculas de cadeia principal de acordocom a invenção incluem ácidos nucléicos tais como vetores de expressão,ácidos nucléicos de auto-replicação, vírus, ácidos nucléicos integrantes eoutros vetores ou ácidos nucléicos utilizados para manter ou manipular umainserção de ácido nucléico de interesse. Em algumas modalidades, os áci-dos nucléicos enriquecidos representam cerca de 15% ou mais do númerode inserções de ácido nucléico na população de moléculas de cadeia princi-pal recombinantes. Em algumas modalidades, os ácidos nucléicos enrique-cidos representam cerca de 50% -ou mais do número de inserções de ácidonucléico na população de moléculas de cadeia principal recombinantes. Emalgumas modalidades, os ácidos nucléicos enriquecidos representam cercade 90% ou mais do número de inserções de ácido nucléico na população demoléculas de cadeia principal recombinantes.
Uma modalidade da invenção é um ácido nucléico sintético ourecombinante isolado compreendendo uma das seqüências de acordo com ainvenção, ou um fragmento compreendendo pelo menos 10, 15, 20, 25, 30,35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 ou mais bases consecutivasde um ácido nucléico de acordo com a invenção. Os ácidos nucléicos sintéti-cos ou recombinantes isolados podem compreender DNA, incluindo cDNA,DNA genômico e DNA sintético. O DNA pode ser de filamento duplo ou defilamento único e se de filamento único pode ser o filamento de codificaçãoou filamento de não codificação (anti-sentido). Alternativamente, os ácidosnucléicos sintéticos ou recombinantes isolados compreendem RNA.
Os ácidos nucléicos sintéticos ou recombinantes isolados de a-cordo com a invenção podem ser utilizados para preparar um dos polipeptí-deos de acordo com a invenção, ou fragmentos compreendendo pelo menos5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 ou mais aminoácidos con-secutivos de um dos polipeptídeos de acordo com a invenção. Conseqüen-temente, outra modalidade da invenção é um ácido nucléico sintético ou re-combinante isolado que codifica um dos polipeptídeos de acordo com a in-venção, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35,40, 50, 75, 100, ou 150 ou mais aminoácidos consecutivos de um dos poli-peptídeos de acordo com a invenção. As seqüências de codificação destesácidos nucléicos podem ser idênticas àquelas das seqüências de codificaçãode um dos ácidos nucléicos de acordo com a invenção ou podem ser dife-rentes seqüências de codificação que codificam uma de acordo com a in-venção tendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150ou mais aminoácidos consecutivos de um dos polipeptídeos de acordo coma invenção, como um resultado da redundância ou degeneração do códigogenético. O código genético é bem-conhecido àqueles de versatilidade natécnica e pode.ser obtido, tal como em page 214 de B. Lewin., Genes VI,Oxford University Press, 1997.
O ácido nucléico isolado que codifica um dos polipeptídeos dainvenção e seqüências substancialmente idênticas a isso, pode incluir, masnão é limitado a: a seqüência de codificação de um ácido nucléico de acordocom a invenção e seqüências de codificação adicionais, tais como seqüên-cias líderes ou seqüências de pró-proteína e seqüências de não codificação,tais como íntrons ou seqüências de não codificação 5' e/ou 3' da seqüênciade codificação. Desse modo, ia! como utilizado aqui, o termo "polinucleotí-deo codificando um polipeptídeo" abrange um polinucleotídeo que inclui aseqüência de codificação para o polipeptídeo bem como um polinucleotídeoque inclui seqüência de codificação e/ou não codificação adicional.
Alternativamente, as seqüências de ácido nucléico da invençãoe seqüências substancialmente idênticas a isso, podem ser mutagenizadasutilizando-se técnicas convencionais, tais como mutagênese direcionada asítio, ou outras técnicas familiares àqueles versados na técnica, para intro-duzir mudanças silenciosas nos polinucleotídeos de acordo com a invenção.Tal como utilizado aqui, "mudanças silenciosas" incluem, por exemplo, mu-danças que não alteram a seqüência de aminoácido codificada pelo polinu-cleotídeo. Tais mudanças podem ser desejáveis a fim de aumentar o níveldo polipeptídeo produzido pelas células hospedeiras contendo um vetor co-dificando o polipeptídeo por introdução de códons ou pares de códon quesão encontrados freqüentemente no organismo hospedeiro.
A invenção também refere-se a polinucleotídeos que possuemmudanças de nucleotídeo que resultam em substituições, adições, deleções,fusões e truncações de aminoácido nos polipeptídeos de acordo com a in-venção. Tais mudanças de nucleotídeo podem ser introduzidas utilizando-setécnicas tais como mutagênese direcionada a sítio, mutagênese químicaaleatória, deleção de Hl de exonuclease e outras técnicas de DNA recombi-nante. Alternativamente, tais mudanças de nucleotídeo podem ser variantesalélicas de ocorrência natural que são isoladas por identificação de ácidosnucléicos que especificamente hibridizam-se a sondas compreendendo pelomenos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500bases consecutivas de uma das seqüências de acordo com a invenção (ouas seqüências complementares a isso) sob condições de rigor alto, modera-do, ou baixo tal como fornecido aqui.
Técnicas gerais
Os ácidos nucléicos utilizados para praticar esta invenção, sejaRNA, siRNA, miRNA, ácido nucléico de anti-sentido, cDNA, DNA genômico,vetores, vírus ou híbridos destes, podem ser isolados de uma variedade defontes, geneticamente construídos, amplificados, e/ou expressados/ geradosrecombinantemente. Polipeptídeos recombinantes (tais como aldolase, talcomo piruvato aldolase, tal como enzimas de HMG e/ou KHG aldolase) ge-rados destes ácidos nucléicos podem ser individualmente isolados ou clona-dos e testados quanto à uma atividade desejada. Qualquer sistema de ex-pressão recombinante pode ser utilizado, incluindo sistemas de expressãocelular bacteriana, de mamífero, de levedura, de inseto ou de planta.
Alternativamente, estes ácidos nucléicos podem ser sintetizadosin vitro através de técnicas químicas de síntese bem-conhecidas, tal comodescrito em, tal como Adams (1983) J. Am. Chem. Soe. 105:661; Belousov(1997) Nucleic Acids Res. 25:3440-3444; Frenkel (1995) Free Radie. Biol.Med. 19:373-380; Blommers (1994) Biochemistry 33:7886-7896; Narang(1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68:109; Beau-cage (1981) Tetra. Lett. 22:1859; Patente dos Estados Unidos No.4.458.066.
Técnicas para a manipulação de ácidos nucléicos, tais comosubclonagem, rotulação de sondas (tal como rotulação de iniciador aleatórioutilizando -se polimerase Klenow, translação de corte, amplificação), seqüen-ciamento, hibridização e similares são bem descritas na literatura científica ede patente, vide Sambrook, ed., MOLECULAR CLONING: A LABORATORYMANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, (1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel, ed. JohnWiley & Sons, Inc., New York (1997); LABORATORY TECHNIQUES IN Bl-OCHEMISTRY e MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLE-IC ACID SONDAS, Part I. Theory and Nucleic Acid Preparation, Tijssen, ed.Elsevier, Ν. Υ. (1993).
Outro mecanismo útil de obtenção e manipulação de ácidos nu-cléicos utilizados para praticar os métodos de acordo com a invenção é clo-nar a partir de amostras genômicas, e, se desejado, analisar e reclonar in-serções isoladas ou amplificadas de, tal como clones genômicos ou clonesde cDNA. Fontes de ácido nucléico utilizadas nos métodos de acordo com ainvenção incluem bibliotecas genômicas ou de cDNA contidas em, tal comocromossomas artificiais de mamífero (MACs), vide Patente dos Estados Uni-dos Nos. 5.721.118; 6.025.155; cromossomas artificiais de humano, videRosenfeld (1997) Nat. Genet. 15:333-335; cromossomas artificiais de leve-dura (YAC); cromossomas artificiais de bacterianos (BAC); cromossomasartificiais de PI, vide Woon (1998) Genomics 50:306-316; vetores derivadosde PI(PACs), vide Kern (1997) Biotechniques 23:120-124; cosmídeos, vírusrecombinantes, fagos ou plasmídeos.
Em algumas modalidades, um ácido nucléico codificando umpolipeptídeo de acordo com a invenção é agrupado em fase apropriada comuma seqüência líder capaz de controle de secreção do polipeptídeo ou frag-mento trasladado destes.
A invenção fornece proteínas de fusão e ácidos nucléicos codifi-cando-os. Um polipeptídeo de acordo com a invenção pode ser fundido a umpeptídeo ou polipeptídeo heterólogo, tal como peptídeos identificação determinal N do qual transmite-se características desejadas, tais como estabili-dade aumentada ou purificação simplificada. Peptídeos e polipeptídeos deacordo com a invenção podem também ser sintetizados e expressados co-mo proteínas de fusão com um ou mais domínios adicionais ligados a isso,tal como produção de um peptídeo mais imunogênico, para isolar mais fa-cilmente um peptídeo recombinantemente sintetizado, para identificar e iso-lar anticorpos e células B de expressão de anticorpo, e similares. Domíniosfacilitando detecção e purificação incluem, tal como peptídeos de quelaçãode metal tais como tratos de polihistidina e módulo des histidina-triptofanoque permitem purificação em metais imobilizados, domínios de proteína Aque permitem purificação em imunoglobulina imobilizada, e o domínio utili-zado no sistema de purificação de extensão/afinidade FLAGS (ImmunexCorp, Seattle WA). A inclusão de umas seqüências Iiganteas cliváveis taiscomo Fator Xa ou enterocinase (Invitrogen, Carlsbad1 CA) entre um domíniodepurificação e o peptídeo ou polipeptídeo compreendendo motivo para faci-litar purificação. Por exemplo, um vetor de expressão pode incluir uma se-qüência codificando epítopo de ácido nucléico ligada a seis resíduos de his-tidina seguido por uma tioredoxina e um sítio de clivagem de enterocinase(Vide tal como Williams (1995) Biochemistry 34:1787-1797; Dobeli (1998)Protein Expr. Purif. 12:404-414). Os resíduos de histidina facilitam detecçãoe purificação enquanto o sítio de clivagem de enterocinase fornece meca-nismo para purificação do epítopo do restante da proteína de fusão. Tecno-logia relativa a vetores codificando proteínas de fusão e aplicação de proteí-nas de fusão são bem descritas na literatura científica e de patente, vide talcomo Kroll (1993) DNA Cell. Biol., 12:441 -53.
Seqüências de controle transcricionais e translacionais
A invenção fornece seqüências de ácido nucléico (tais comoDNA) de acordo com a invenção operativamente ligadas à(s) seqüência(s)de controle de expressão (tais como transcricional ou translacional), tais co-mo promotores ou realçadores, para direcionar ou modular síntese/ expres-são de RNA. A seqüência de controle de expressão pode estar em um vetorde expressão. Promotores bacterianos exemplares incluem lad, IacZ, T3, T7,gpt, PR lambda, PL e trp. Promotores eucarióticos exemplares incluem inicialimediato CMV, HSV timidina cinase, SV40 inicial e tardio, LTRs de retroví-rus, e metalotioneína I de camundongo.
Tal como utilizado aqui, o termo "promotor" inclui todas as se-qüências capazes de conduzir transcrição de uma seqüência de codificaçãoem uma célula, tal como uma célula de planta ou animal. Desse modo, pro-motores utilizados nos constructos de acordo com a invenção incluem ele-mentos de controle transcricionais eis-ativos e seqüências reguladoras quesão envolvidos em regulação ou modulação do momento e/ou taxa de trans-crição de um gene. Por exemplo, um promotor pode ser um elemento decontrole transcricional eis-ativo, incluindo um realçador, um promotor, umterminador de transcrição, uma origem de replicação, uma seqüência de in-tegração cromossômica, regiões não traduzidas 51 e 3 ou uma seqüênciaintrônica, que são envolvidos em regulação transcricional. Estas seqüênciaseis-ativas podem interagir com proteínas ou outras biomoléculas para reali-zar (ligar/desligar, regular, modular, etc.) transcrição. Promotores "constituti-vos" são aqueles que conduzem expressão continuamente sob a maior partedas condições e estados ambientais de desenvolvimento ou diferenciaçãocelular. Promotores "induzíveis" ou "reguláveis" direcionam expressão doácido nucléico de acordo com a invenção sob a influência de condições am-bientais ou condições de desenvolvimento. Exemplos de condições ambien-tais que podem afetar transcrição por promotores induzíveis incluem condi-ções anaeróbicas, temperatura elevada, seca, ou a presença de luz.
Promotores "específicos portecido" são elementos de controletranscricionais que são apenas ativos em células ou tecidos ou órgãos parti-culares, tais como em plantas ou animais. Regulação específica por tecidopode ser alcançada por certos fatores intrínsecos que asseguram que genescodificando proteínas específicas a um dado tecido são expressados. Taisfatores são constatados existirem em mamíferos e plantas a fim de permitirtecidos específicos desenvolverem-se.
Promotores adequados para expressão de um polipeptídeo embactérias incluem os promotores Iac ou trp de E. coli, o promotor de lad, opromotor de IacZ, o promotor de T3, o promotor de T7, o promotor de gpt, opromotor de PR lambda, o promotor de PL lambda, promotores de opéronscodificando enzimas glicolíticas tais como 3-fosfoglicerato cinase (PGK), e opromotor de ácido fosfatase. Promotores eucarióticos incluem o promotorinicial imediato CMV, o promotor de timidina cinase HSV, promotores dechoque térmico, o promotor SV40 inicial e tardio, LTRs de retrovírus, e opromotor de metalotioneína-l de camundongo. Outros promotores conheci-dos controlarem expressão de genes em células procarióticas ou eucarióti-cas ou seu vírus podem também ser utilizados. Promotores adequados paraexpressão do polipeptídeo ou fragmento deste em bactérias incluem os pro-motores Iac ou trp de E. coli, o promotor lacl, o promotor IacZ, o promotorΤ3, ο promotor ΤΙ, ο promotor gpt, ο promotor Pr lambda, o promotor Pllambda, promotores de opérons codificando enzimas glicolíticas tais como 3-fosfoglicerato cinase (PGK) e o promotor de ácido fosfatase. Promotoresfúngicos incluem o promotor de α-fator. Promotores eucarióticos incluem opromotor inicial imediato CMV, o promotor de timidina cinase HSV, promoto-res de choque térmico, o promotor SV40 inicial e tardio, LTRs de retrovírus eo promotor de metalotioneína-l de camundongo. Outros promotores conhe-cidos controlarem expressão de genes em células procarióticas ou eucarióti-cas ou seu vírus podem também ser utilizados.
Promotores de Planta Específica por Tecido
A invenção fornece cassetes de expressão que podem ser ex-pressados de uma maneira específica por tecido, tal como estes podem ex-pressar uma aldolase, tal como piruvato aldolase, enzima de HMG e/ou KHGaldolase de acordo com a invenção de uma maneira específica por tecido.Em algumas modalidades, a invenção também fornece plantas ou sementesque expressam uma aldolase, tal como piruvato aldolase, enzima de HMGe/ou KHG aldolase de acordo com a invenção de uma maneira específicapor tecido. A especificidade por tecido pode ser específica por semente, es-pecífica por caule, específica por folha, específica por raiz, específica porfruta e similares.
O termo "planta" inclui plantas inteiras, partes de planta (taiscomo folhas, caules, flores, raízes, etc.), protoplastos de planta, células desementes e planta e progênie dos mesmos. A classe de plantas as quaispodem ser utilizadas no método de acordo com a invenção é geralmente tãoampla quanto à classe de plantas maiores receptivas às técnicas de trans-formação, incluindo angiospermas (plantas monocotiledôneas e dicotiledô-neas), bem como gimnospermas. Ela inclui plantas de uma variedade deníveis de ploidia, incluindo poliplóide, diplóide, haplóide e estados de hemizi-goto. Tal como utilizado aqui, o termo "planta transgênica" inclui plantas oucélulas de planta nas quais uma seqüência heteróloga de ácido nucléico foiinserida, tal como os ácidos nucléicos e várias constructos recombinantes(tais como cassetes de expressão) de acordo com a invenção.Em algumas modalidades, um promotor constitutivo tal como opromotor CaMV 35S pode ser utilizado para expressão em partes específi-cas da planta ou semente ou por toda a planta. Por exemplo, para super-expressão, um fragmento promotor de planta pode ser empregado o qualdirecionará expressão de um ácido nucléico em alguns ou todos os tecidosde uma planta, tal como uma planta regerada. Tais promotores são referidosaqui como promotores "constitutivos" e são ativos sob a maior parte dascondições ambientais e estados de desenvolvimento de ou diferenciaçãocelular. Exemplos de promotores constitutivos incluem a região de iniciaçãode transcrição 35S de vírus em mosaico de couve-flor (CaMV), o derivadopromotor de 11 ou 2' de T-DNA de Agrobacterium tumefaciens, e outras regi-ões de iniciação de transcrição dé vários genes de planta conhecidos àque-les de versatilidade. Tais genes incluem, tais como ACT11 de Arabidopsis(Huang (1996) Plant Mot. BioL 33:125-139); Cat3 de Arabidopsis (GenBankNo. U43147, Zhong (1996) Mol.'Gen. Genet. 251 :196-203); o gene codifi-cando proteína desaturase portadora de estearoíla-acila de Brassica napus(Genbank No. X74782, Solocombe (1994) Piant Physiol. 104:1167-1176);GPcI de milho (GenBank No. X15596; Martinez (1989) J. Mol. Biol 208:551-565); o Gpc2 de milho (GenBank No. U45855, Manjunath (1997) Piant Mol.Biol. 33:97-112); promotores de planta descritos em Patente dos EstadosUnidos Nos. 4.962.028; 5.633.440.
A invenção usa promotores específicos por tecido ou constituti-vos derivados de vírus que podem incluir, tais como o promotor subgenômi-co de tobamovírus (Kumagai (1995) Proc. Natl. Acad. Sei. USA 92:1679-1683; o vírus baciloforme de tungro de arroz (RTBV)7 o qual replica-se ape-nas em células de floema em plantas de arroz infectadas, com seu promotorque conduz forte expressão de gene repórter específica por phloem; o pro-motor de vírus em mosaico de veia de mandioca (CVMV), com atividademais alta em elementos vasculares, em células mesófilo de folha, e em pon-tas de raiz (Verdaguer (1996) Plant Mol. Biol. 31:1129-1139).
Em algumas modalidades, o promotor de planta direciona ex-pressão de aldolase, tal como piruvato aldolase, tal como ácido nucléico deexpressão de enzima de HMG e/ou KHG aldolase em um tipo de tecido, ór-gão ou célula específico (isto é promotores específicos por tecido) ou podeestar de outra forma sob controle ambiental ou de desenvolvimento maispreciso ou sob o controle de um promotor induzível. Exemplos de condiçõesambientais que podem afetar transcrição incluem condições anaeróbicas,temperatura elevada, uma presença de luz, ou pulverizado com produtosquímicos/hormônios. Por exemplo, uma invenção incorpora o pVomotor indu-zível por seca de milho (Busk (1997) supra); o promotor induzível por frio,seca, e sal elevado de batata (Kirch (1997) Plant Mol. Biol. 33:897 909).
Em algumas modalidades, promotores específicos por tecidopromovem transcrição apenas dentro de uma certa estrutura de tempo deestágio de desenvolvimento dentro deste tecido. Vide Blazquez (1998) PlantCell 10:791-800, caracterizando o promotor de gene LEAFY de Arabidopsis.Vide também Cardon (1997) Plant J 12:367-77, descrevendo o fator detranscrição SPL3, que reconhece um motivo de seqüência conservado naregião promotora do gene de identidade de meristema floral A. thaliana API;e Mandei (1995) Plant Molecular Biology, Vol. 29, pp 995-1004, descrevendoo promotor de meristema elF4. Promotores específicos por tecido os quaissão ativos por todo o ciclo de vida de um tecido particular podem ser utiliza-dos. Em algumas modalidades, os ácidos nucléicos de acordo com a inven-ção são operavelmente ligados a um promotor ativo primariamente apenasem células de fibra de algodão. Em algumas modalidades, os ácidos nucléi-cos de acordo com a invenção são operavelmente ligados a um promotorativo primariamente durante os estágios de prolongamento de célula de fibrade algodão, tal como descrito por Rinehart (1996) supra. Os ácidos nucléicospodem ser operavelmente ligados ao promotor de gene Fbl2A a ser prefe-rencialmente expressado em células de fibra de algodão (Ibid). Vide tam-bém, John (1997) Proc. Natl. Acad. Sei. USA 89:5769-5773; John, e outros,Patente dos Estados Unidos Nos. 5.608.148 e 5.602.321, descrevendo pro-motores específicos por fibra de algodão e métodos para o constructodeplantas de algodão transgênicas. Promotores específicos por raiz podemtambém ser utilizados para expressar os ácidos nucléicos de acordo com ainvenção. Exemplos de promotores específicos por raiz incluem o promotordo gene de álcool desidrogenase (DeLisIe (1990) Int. Rev. Cytol. 123:39-60).Outros promotores que podem ser utilizados para expressar os ácidos nu-cléicos de acordo com a invenção incluem, tais como promotores específicospor óvulo, específicos por embrião, específicos por endosperma, específicospor integumento, integumento tegumento, ou alguma combinação destes;um promotor específico por folha (Vide Busk (1997) Plant J. 11 :1285 1295,descrevendo um promotor específico por folha em milho); o promotor ORF13de Agrobacterium rhizogenes (o qual exibe alta atividade em raízes, videHansen (1997) supra); um promotor específico por pólen de milho (VideGuerrero (1990) Mol. Gen. Genet. 224:161 168); um promotor de tomate ati-vo durante amadurecimento da fruta, senescência e abscissão de folhas e, aum nível menor, de flores pode ser utilizado (Vide Blume (1997) Plant J.12:731 746); um promotor específico por pistilo do gene SK2 de batata (VideFicker (1997) Plant Mol. Biol. 35:425 431); o gene Blec4 de pea, que é ativoem tecido epidérmico de ápices de broto vegetativo e floral de alfalfa trans-gênica tornando-o uma ferramenta útil para alvejar uma expressão de genesestrangeiros à camada epidérmica de brotos ou fibras ativamente crescen-tes; o gene de BEL 1 específico por óvulo (Vide Reiser (1995) Cell 83:735-742, GenBank No. U39944); e/ou, o promotor em Klee, Patente dos EstadosUnidos No. 5.589.583, descrevendo uma região promotora de planta sãocapazes de conferir altos níveis de transcrição em células de tecido meris-temático e/ou rapidamente dividindo-se.
Em algumas modalidades, promotores de planta os quais sãoinduzíveis em exposição a hormônios de planta, tais como auxinas, são utili-zados para expressar os ácidos nucléicos de acordo com a invenção. Porexemplo, uma invenção pode usar os elementos de resposta de auxina, frag-mento promotor El (AuxREs) na soja (Glicina max L.) (Liu (1997) Plant Phy-siol. 115:397-407); o promotor GST6 de Arabidopsis responsivo a auxina(também responsivo a ácido salicílico e peróxido de hidrogênio) (Chen(1996) Plant J. 10: 955-966); o promotor de parC induzível por auxina detabaco (Sakai (1996) Plant Cell Physiol. 37:906-913); um elemento de res-posta de biotina de planta (Streit (1997) Mol. Plant Microbe interagir. 10:933-937); e, o promotor responsivo ao ácido abscísico de hormônio de estresse(Sheen (1996) Science 274:1900-1902).
Os ácidos nucléicos de acordo com a invenção podem tambémser operavelmente ligados a promotores de planta que são induzíveis emexposição a reagentes químicos que podem ser aplicados à planta, tal comoherbicidas ou antibióticos. Por exemplo, o promotor de ln2-2 de milho, ativa-do por protetores herbicidas de benzeno-sulfonamida, pode ser utilizado (DeVeilder (1997) Plant Cell Physiol. 38:568-577); aplicação de diferentes prote-tores herbicidas induz distintos padrões de expressão de gene, incluindoexpressão na raiz, hydathodes, e o meristema apical de broto. Seqüência decodificação pode estar sob o controle de, tal como um promotor induzível portetraciclina, tal como descrito com plantas de tabaco transgênicas contendoo gene de arginina descarboxilase (Masgrau (1997) de Avena sativa L. (oat)Plant J. 11:465-473); ou, um elemento responsivo ao ácido salicílico (Stange(1997) Plant J. 11:1315-1324). Usando promotores quimicamente induzidos(tal como hormônio ou pesticida), isto é, promotor responsivo a um produtoquímico os quais podem ser aplicados à planta transgênica no campo, ex-pressão de um polipeptídeo de acordo com a invenção pode ser induzida emum estágio particular de desenvolvimento da planta. Desse modo, a inven-ção também fornece plantas transgênicas contendo um gene induzível codi-ficando polipeptídeos de acordo com a invenção cuja faixa de hospedeiro élimitada a espécie de planta alvo, tal como milho, arroz, cevada, soja, toma-te, trigo, batata ou outras culturas, induzível em qualquer estágio de desen-volvimento da cultura.
Aquele de versatilidade reconhecerá que um promotor de plantaespecífico por tecido pode conduzir expressão de seqüências operavelmenteligadas em tecidos diferente do tecido alvo. Desse modo, em algumas moda-lidades, um promotor específico por tecido é aquele que conduz expressãopreferencialmente no tipo de tecido ou célula alvo, mas pode também resul-tar em alguma expressão em outros tecidos também.
Os ácidos nucléicos de acordo com a invenção podem tambémser operavelmente ligados aos promotores de planta que são induzíveis emexposição a reagentes químicos. Estes reagentes incluem, tal como herbici-das, auxinas sintéticas, ou antibióticos que podem ser aplicados, tal comopulverizados, sobre plantas transgênicas. Expressão induzível de uma aldo-lase, tal como piruvato aldolase, tal como ácidos nucléicos de produção deenzima de HMG e/ou KHG aldolase de acordo com a invenção permitirá odesenvolvedor selecionar plantas com a aldolase ideal, tal como piruvatoaldolase, tal como expressão e/ou atividade de enzima de HMG e/ou KHGaldolase. O desenvolvimento de partes de planta pode deste modo ser con-trolado. Neste modo, uma invenção fornece o mecanismo para facilitar o co-lheita de plantas e partes de planta. Por exemplo, em várias modalidades, opromotor tie ln2-2 de milho, ativado por protetores de herbicida de benze-nossulfonamida, é utilizado (De Veilder (1997) Plant Cell Physiol. 38:568-577); aplicação de protetores herbicidas diferentes induz padrões de expres-são de gene distintos, incluindo expressão na raiz, hidatódeos, e o meriste-ma apical de broto. Seqüências de codificação de acordo com a invençãoestão também sob o controle de um promotor induzível por tetraciclina, talcomo descrito com plantas de tabaco transgênicas contendo o gene de argi-nina descarboxilase (Masgrau (1997) planta J. 11 :465-473) Avena sativa L(oat) ; ou, um elemento responsivo a ácido salicílico (Stange (1997) Plant J.11:1315-1324).
Em algumas modalidades, expressão de polipeptídeo própriapode requerer região de poliadenilação na extremidade de 3' da região decodificação. A região de poliadenilação pode ser derivada do gene natural,de uma variedade de outros genes de planta (ou animal ou outro), ou de ge-nes no T-DNA AgrobacteriaL
Vetores de expressão e veículos de clonagem
A invenção fornece vetores de expressão e veículos de clona-gem compreendendo ácidos nucléicos de acordo com a invenção, tais comoseqüências codificando uma aldolase, tal como piruvato aldolase, tal comoenzimas de HMG e/ou KHG aldolase de acordo com a invenção. Vetores deexpressão e veículos de clonagem de acordo com a invenção podem com-preender partícula virais, baculovírus, fago, plasmídeos, fagernídeos, cosmí-deos, fosmídeos, cromossomas artificiais bacterianos, DNA viral (tal comovacínia, adenovírus, vírus do epitelioma contagioso, pseudoraiva e derivadosde SV40), cromossomas artificiais com base em PI, plasmídeos de levedura,cromossomas artificiais de levedura, e quaisquer outros vetores específicospara hospedeiros específicos de interesse (tais como bacillus, Aspergillus elevedura). Vetores de acordo com a invenção podem incluir seqüências deDNA cromossômicas, não-cromossômicas e sintéticas. Números grandes devetores adequados são conhecidos àqueles de versatilidade na técnica, esão comercialmente disponíveis. Vetores exemplares incluem: bacterianos:vetores de pQE™ (Qiagen, Valencia, CA), plasmídeos de pBLUESCRIPT™,vetores de pNH, vetores de ZAP Iambda (Stratagene, La Jolla, CA); ptrc99a,pKK223-3, pDR540, pRIT2T (GE Healthcare, Piscataway, NJ), vetores depET (Novagen, Madison, Wl); eucarióticos: pXTI, pSG5 (Stratagene, La Jol-la, CA), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). No entanto, qual-quer outro plasmídeo ou outro vetor pode ser utilizado contanto que eles se-jam replicáveis e viáveis no hospedeiro. Vetores de número de reproduçãobaixo ou número de reprodução alto podem ser empregados com a presenteinvenção. "Plasmídeos" podem ser comercialmente disponíveis, publicamen-te disponíveis em uma base não-restrita, ou podem ser construídos de plas-mídeos disponíveis de acordo com procedimentos publicados. Plasmídeosequivalentes àqueles descritos aqui são conhecidos na técnica e serão apa-rentes ao técnico ordinariamente versado.
O vetor de expressão pode compreender um promotor, um sítiode ligação de ribossoma para iniciação de translação e um terminador detranscrição. O vetor pode também incluir seqüências apropriadas para ampli-ficação de expressão. Vetores de expressão de mamífero podem compreen-der uma origem de replicação, quaisquer sítios de ligação de ribossoma ne-cessários, um sítio de poliadenilação, sítios doadores e aceptores de união,seqüências de terminação transcricionais, e seqüências não-transcritas flan-queando 51. Em algumas modalidades, seqüências de DNA derivadas dossítios de poliadenilação e união de SV40 podem ser utilizadas para forneceros elementos genéticos não transcritos requeridos.
Em algumas modalidades, os vetores de expressão contém umou mais genes marcadores selecionáveis para permitir seleção de célulashospedeiras contendo o vetor. Tais marcadores selecionáveis incluem genescodificando dihidrofolato redutase ou genes conferindo resistência de neomi-cina para cultura celular eucariótica, genes conferindo resistência de tetraci-clina ou ampicilina em E. coli, e o gene de TRPI de S. cerevisiae. Regiõespromotoras podem ser selecionadas de qualquer gene desejado utilizando-se vetores de cloranfenicol transferase (CAT) ou outros vetores com marca-dores selecionáveis.
Em algumas modalidades, vetores para expressão do polipeptí-deo ou fragmento deste em células eucarióticas contêm realçadores paraaumentar níveis de expressão. Realçadores são elementos eis-ativos deDNA que podem ser de cerca de 10 a cerca de 300 bp de comprimento. Elespodem agir em um promotor para aumentar sua transcrição. Realçadoresexemplares incluem o realçador de SV40 no lado tardio da origem de repli-cação bp 100 a 270, o realçador de promotor inicial de citomegalovírus, orealçador de polioma no lado tardio da origem de replicação, e os realçado-res de adenovírus.
Uma seqüência de ácido nucléico pode ser inserida em um vetoratravés de uma variedade de procedimentos.
Em geral, a seqüência está ligada à posição desejada no vetorem seguida à digestão da inserção e do vetor com endonucleases de restri-ção apropriadas. Alternativamente, extremidades cegas em tanto a inserçãoquanto o vetor podem ser ligadas. Uma variedade de técnicas de clonagemé conhecida na técnica, tal como descrito em Ausubel e outros Current Pro-tocols in Molecular Biology, John Wiley & Sons, Inc. 1997 e Sambrook e ou-tros, Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring HarborLaboratory Press (1989). Tais procedimentos e outros são julgados estaremdentro do escopo daqueles versados na técnica.
O vetor pode estar na forma de um plasmídeo, uma partículaviral, ou um fago. Outros vetores incluem seqüências de DNA cromossômi-cas, não-cromossômicas e sintéticas, derivadas de S V40; plasmídeos bac-terianos, DNA de fago, baculovírus, plasmídeos de levedura, vetores deriva-dos de combinações de plasmídeos e DNA de fago, DNA viral tal como va-cínia, adenovírus, fowl pox vírus, e pseudorabies. Uma variedade de vetoresde clonagem e expressão para uso com hospedeiros procarióticos e eucarió-ticos é descrita por, tal como Sambrook.
Vetores bacterianos particulares os quais podem ser utilizadosincluem os plasmídeos comercialmente disponíveis compreendendo elemen-tos genéticos do vetor de clonagem bem-conhecido pBR322 (ATCC 37017),pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Sweden), GEMI (PromegaBiotec, Madison, Wl, USA) pQE70, pQE60, pQE-9 (Qiagen, Valencia, CA),pDIO, psiX174 pBLUESCRIPT Il KS, pNH8A, pNHIóa, pNH18A, pNH46A(Stratagene, La Jolla, CA), ptrc99a, pKK223-3, pKK233-3, DR540, pRIT5(Pharmacia), pKK232-8, pET (Novagen, Madison, Wl), e pCM7. Vetores eu-carióticos particulares incluem pSV2CAT, pOG44, pXTI, pSG (Stratagene, LaJolla, CA) pSVK3, pBPV, pMSG, e pSVL (Pharmacia). No entanto, qualqueroutro vetor pode ser utilizado contanto que ele seja replicável e viável nacélula hospedeira.
Os ácidos nucléicos de acordo com a invenção podem ser ex-pressados em cassetes, vetores ou vírus de expressão e transitoriamente ouestavelmente expressados em células e sementes de planta. Um sistema deexpressão transitório exemplar usa sistemas de expressão epissômica, taiscomo vírus em mosaico de couve-flor (CaMV) RNA viral gerado no núcleopor transcrição de um minicromossoma epissômico contendo DNA superes-piralado, vide Covey (1990) Proc. Natl. Acad. Sei. USA 87:1633-1637. Alter-nativamente, seqüências de codificação, isto é, toda ou sub-fragmentos deseqüências de acordo com a invenção podem ser inseridas em um genomade célula hospedeira de planta tornando-se uma parte integral do DNA cro-mossômico do hospedeiro. Transcrições de sentido ou anti-sentido podemser expressadas desta maneira. Um vetor compreendendo as seqüências(tal como promotores ou regiões de codificação) de ácidos nucléicos de a-cordo com a invenção podem compreender um gene marcador que confereum fenótipo selecionável em uma célula de planta ou uma semente. Por e-xemplo, o marcador pode codificar resistência de biocida, tal como resistên-cia de antibiótico, tal como resistência a canamicina, G418, bleomicina, hi-gromicina, ou resistência a herbicida, tal como resistência a clorossulfuronaou Basta.
Vetores de expressão capazes de expressão de ácidos nuciéi-cos e proteínas em plantas são bem-conhecidos na técnica, e podem incluir,tais como vetores de Agrobacterium spp., vírus X de batata (Vide Angell(1997) EMBO J. 16:3675-3684), vírus em mosaico de tabaco (Vide Casper(1996) Gene 173:69-73), vírus de interrupção da emergência do tomate (Vi-de Hillman (1989) Virology 169:42-50), vírus etch de tabaco (Vide Dolja(1997) Virology 234:243-252), vírus em mosaico dourado de feijão (Vide Mo-rinaga (1993) Microbiol Immunol. 37:471-476), vírus em mosaico de couve-flor (Vide Cecchini (1997) Mol. Plant Microbe Interact 10:1094-1101), ele-mento mutável de Ac/Ds de milho (Vide Rubin (1997) Mol. Cell. Biol.17:6294-6302; Kunze (1996) Curr. Top. Microbiol. Immunol. 204:161-194), eo elemento transportável supressor-mutante (Spm) de milho (Vide Schlappi(1996) Plant Mol. Biol. 32:717-725); e derivados destes.
Em algumas modalidades, o vetor de expressão pode possuirdois sistemas de replicação para permiti-lo ser mantido em dois organismos,por exemplo em células de mamífero ou inseto para expressão e em umhospedeiro procariótico para clonagem e amplificação. Além disso, para ve-tores de expressão integrantes, o vetor de expressão pode conter pelo me-nos uma seqüência homóloga ao genoma de célula hospedeira. Ele podeconter duas seqüências homólogas que flanqueiam o constructode expres-são. O vetor integrante pode ser direcionado a um local específico na célulahospedeira por seleção da seqüência homóloga apropriada para inclusão novetor. Constructos para vetores integrantes são bem-conhecidos na técnica.
Vetores de expressão de acordo com a invenção podem tam-bém incluir um gene marcador selecionável para permitir a seleção de cepasbacterianas que foram transformadas, tais como genes que tornam-se asbactérias resistentes aos fármacos tais como ampicilina, cloranfenicol, eri-tromicina, kanamicina, neomicina e tetraciclina. Marcadores selecionáveispodem também incluir genes biossintéticos, tais como aqueles nas trilhasbiossintéticas de histidina, triptofano e leucina.
A seqüência de DNA no vetor de expressão é operativamenteligada a uma seqüência(s) (promotor) de controle de expressão apropriadapara direcionar síntese de RNA. Promotores bacterianos mencionados parti-culares incluem lad, IacZ, T3, T7, gpt, Iambda Pr, Pl e trp. Promotores euca-rióticos incluem inicial imediato CMV, timidina cinase de HSV1 SV40 inicial etardio, LTRs de retrovírus e metalotioneína-l de camundongo. Seleção dovetor e promotor apropriado está bem dentro do nível de versatilidade ordi-nária na técnica. O vetor de expressão também contém um sítio de ligaçãode ribossoma para iniciação de translação e um terminador de transcrição. Ovetor pode também incluir seqüências apropriadas para amplificação de ex-pressão. Regiões promotoras podem ser selecionadas de qualquer genedesejado utilizando-se vetores de cloranfenicol transfeíase (CAT) ou outrosvetores com marcadores selecionáveis. Além disso, os vetores de expressãoem algumas modalidade contêm um ou mais genes marcadores selecioná-veis para fornecer uma característica fenotípica para seleção de célulashospedeiras transformadas tais como dihidrofolato redutase ou resistênciade neomicina para cultura celular eucariótica, ou tal como resistência de te-traciclina ou ampicilina em E. coli.
Vetores de expressão de mamífero podem também compreen-der uma origem de replicação, quaisquer sítios de ligação de ribossoma ne-cessários, um sítio de poliadenilação, sítios doadores e aceptores de união,seqüências de terminação transcricionais e seqüências não transcritas flan-queando 5'. Em algumas modalidades, seqüências de DNA derivadas dossítios de união e poliadenilação de SV40 podem ser utilizadas para forneceros elementos genéticos não transcritos requeridos.
Vetores para expressão do polipeptídeo ou fragmento deste emcélulas eucarióticas podem também conter realçadores para aumentar níveisde expressão. Realçadores são elementos c/s-ativos de DNA, geralmente decerca de 10 a cerca de 300 bp de comprimento que agem em um promotorpara aumentar sua transcrição. Exemplos incluem o realçador de SV40 nolado tardio da origem de replicação bp 100 a 270, o realçador de promotorinicial de citomegalovírus, o realçador de polioma no lado tardio da origemde replicação e os realçadores de adenovírus.
Além disso, os vetores de expressão podem conter um ou maisgenes marcadores selecionáveis para permitir seleção de células hospedei-ras contendo o vetor. Tais marcadores selecionáveis incluem genes codifi-cando dihidrofolato redutase ou genes conferindo resistência de neomicinapara cultura celular eucariótica, genes conferindo resistência de tetraciclinaou ampicilina em E. colie o gene de TRPI de S. cerevisiae.
Em algumas modalidades, o ácido nucléico codificando um dospolipeptídeos de acordo com a invenção, e seqüências substancialmenteidênticas a isso, ou fragmentos compreendendo pelo menos cerca de 5, 10,15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 ou mais aminoácidos consecuti-vos destes são agrupados em fase apropriada com uma seqüência líder ca-paz de controle de secreção do polipeptídeo ou fragmento trasladado des-tes. Em algumas modalidades, o ácido nucléico pode codificar um polipeptí-deo de fusão em que um dos polipeptídeos de acordo com a invenção, oufragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75,100, ou 150 ou mais aminoácidos consecutivos destes é fundido a peptídeosou polipeptídeos heterólogos, tais como peptídeos de identificação de termi-nal N os quais transmitem características desejadas, tais como estabilidadeaumentada ou purificação simplificada.
A seqüência de DNA apropriada pode ser inserida no vetor atra-vés de uma variedade de procedimentos. Em geral, a seqüência de DNAestá ligada à posição desejada no vetor após digestão da inserção e do ve-tor com endonucleases de restrição apropriadas. Alternativamente, extremi-dades cegas em tanto a inserção quanto o vetor podem ser ligadas.
Uma variedade de técnicas de clonagem é descrita em Ausubele outros Current Protocols in Molecular Biology, John Wiley & Sons, Inc.1997 e Sambrook e outros, Molecular Cloning: A Laboratory Manual 2nd Ed.,Cold Spring Harbor Laboratory Press (1989). Tais procedimentos e outrossão julgados estarem dentro do escopo daqueles versado na técnica.
O vetor pode estar, por exemplo, na forma de um plasmídeo,uma partícula viral, ou um fago. Outros vetores incluem seqüências de DNAcromossômicas, não-cromossômicas e sintéticas, derivadas de SV40; plas-mídeos bacterianos, DNA de fago, baculovírus, plasmídeos de levedura, ve-tores derivados de combinações de plasmídeos e DNA de fago, DNA viral talcomo vacínia, adenovírus, fowl pox vírus e pseudorabies. Uma variedade declonagem e vetores de expressão para uso com hospedeiros procarióticos eeucarióticos são descritos por Sambrook, e outros, Molecular Cloning: A La-boratory Manual, 2nd Ed., Cold Spring Harbor, N. Y., (1989).Células hospedeiras e células transformadas
A invenção também fornece células transformadas compreen-dendo seqüências de ácido nucléico de acordo com a invenção, tais comoseqüências codificando aldolases, tais como piruvato aldolases, enzimas deHMG e/ou KHG aldolase de acordo com a invenção, ou vetores de acordocom a invenção. A célula hospedeira pode ser qualquer uma das célulashospedeiras familiares àqueles versados na técnica, incluindo células proca-rióticas, células eucarióticas, tais como células bacterianas, células fúngicas,células de levedura, células de mamífero, células de inseto, ou células deplanta. Células bacterianas exemplares incluem qualquer espécie de Strep-tomyces, Staphilococcus, Pseudomonas ou Bacillus, incluindo E. coli, Bacil-lus subtilis, Pseudomonas fluorescens, Bacillus cereus, ou Salmonella ty-phimurium. Células fúngicas exemplares incluem qualquer espécie de As-pergillus. Células de levedura exemplares incluem qualquer espécie de Pi-chia, Saccharomyces, Schizosaccharomyces, ou Schwanniomyces, incluindoPiehia pastoris, Saccharomyces cerevisiae, ou Schizosaccharomyces pom-be. Células de inseto exemplares incluem qualquer espécie de Spodopteraou Drosophiia, incluindo Drosophila S2 e Spodoptera SfP. Células de animalexemplares incluem CHO, COS ou melanoma de Bowes ou qualquer Iinha-gem celular de camundongo ou humano. A seleção de um hospedeiro apro-priado está dentro das capacidades daqueles versados na técnica. Técnicaspara transformação de uma ampla variedade de espécie de planta maior sãobem-conhecidas e descritas na literatura técnica e científica. Vide Weising(1988) Ann. Rev. Genet. 22:421-477; Patente dos Estados Unidos No.5.750.870.
O vetor pode ser introduzido nas células hospedeiras utilizando-se qualquer uma de uma variedade de técnicas, incluindo transformação,transfecção, transdução, infecção viral, pistolas de gene, ou transferência degene mediada por Ti. Métodos particulares incluem transfecção de fosfato decálcio, transfecção mediada por DEAE-Dextrano, lipofecção, ou eletropora-ção (Davis, L., Dibner, M., Battey, L, Basic Methods in Molecular Biology,(1986)).
Em algumas modalidades, os ácidos nucléicos ou vetores deacordo com a invenção são introduzidos nas células para varredura, dessemodo, da entrada dos ácidos nucléicos nas células de uma maneira ade-quada para expressão subseqüente do ácido nucléico. O método de introdu-ção é grandemente ditado pelo tipo celular alvejado. Métodos exemplaresincluem precipitação de CaPO4, fusão de lipossoma, lipofecção (tal comoLIPOFECTIN®), eletroporação, infecção viral, etc. Os ácidos nucléicos can-didatos podem estavelmente integrar-se no genoma da célula hospedeira(por exemplo, com introdução retroviral) ou podem existir ou transitoriamenteou estavelmente no citoplasma (isto é por meio do uso de plasmídeos tradi-cionais, utilizando seqüências reguladoras padrões, marcadores de seleção,etc.). Como muitas varreduras farmaceuticamente importantes requeremalvos de célula de humano ou mamífero modelo, vetores retrovirais capazesde transfecção de tais alvos podem ser utilizados.
Onde apropriado, as células hospedeiras construídas podem sercultivadas em meios de nutriente convencionais modificados quando apro-priado para ativação de promotores, seleção de transformantes ou amplifica-ção dos genes de acordo com a invenção. Seguindo transformação de umacepa hospedeira adequada e desenvolvimento da cepa hospedeira a umadensidade celular apropriada, o promotor selecionado pode ser induzido pormecanismo apropriado (tal como mudança de temperatura ou indução quí-mica) e as células podem ser cultivadas por um período adicional para dei-xá-las produzirem o polipeptídeo desejado ou fragmento deste.
Células pode ser colhidas através de centrifugação, rompidaspor mecanismo físico ou químico, e o extrato bruto resultante é retido porpurificação adicional. Células microbianas empregadas para expressão deproteínas podem ser rompidas por qualquer método conveniente, incluindociclo de congelamento-descongelamento, sonicação, ruptura mecânica, ouuso de agentes de Iise celular. Tais métodos são bem-conhecidos por aque-les versados na técnica. O polipeptídeo expressado ou fragmento deste po-de ser recuperado, e purificado de culturas celulares recombinantes atravésde métodos incluindo precipitação de sulfato de amônio ou etanol, extraçãode ácido, cromatografia de permuta de ânion ou cátion, cromatografia defosfocelulose, cromatografia de interação hidrofóbica, cromatografia por afi-nidade, cromatografia de hidroxilapatíta e cromatografia de lectina. Etapasde reduplicação de proteína podem ser utilizadas, quando necessário, emconfiguração completa do polipeptídeo. Se desejado, cromatografia líquidade alto desempenho (HPLC) pode ser empregada para etapas de purificaçãofinais.
Os constructos em células hospedeiras podem ser utilizados deuma maneira convencional para produzir o produto de gene codificado pelaseqüência recombinante. Dependendo do hospedeiro empregado em umprocedimento de produção recombinante, os polipeptídeos produzidos porcélulas hospedeiras contendo o vetor podem ser glicosilados ou podem sernão glicosilados. Polipeptídeos de acordo com a invenção podem ou tam-bém podem não incluir um resíduo de aminoácido de metionina inicial.
Sistemas de translação livres de célula podem também ser em-pregados para produzir um polipeptídeo de acordo com a invenção. Siste-mas de translação livres de célula podem usar mRNAs transcritos de umconstructo de DNA compreendendo um promotor operavelmente ligado a umácido nucléico codificando o polipeptídeo ou fragmento deste. Em algumasmodalidades, o constructo de DNA pode ser Iinearizado antes de conduziruma reação de transcrição in vitro. O mRNA transcrito é então incubado comum extrato de translação livre de célula apropriado, tal como um extrato dereticulócito de coelho, para produzir o desejado polipeptídeo ou fragmentodeste.
Os vetores de expressão podem conter um ou mais genes mar-cadores selecionáveis para fornecer uma característica fenotípica para sele-ção de células hospedeiras transformadas tal como dihidrofolato redutase ouresistência de neomicina para cultura celular eucariótica, ou tal como resis-tência de tetraciclina ou ampicilina em E. coli.
Células hospedeiras contendo os polinucleotídeos de interesse,tais como ácidos nucléicos de acordo com a invenção, podem ser cultivadasem meios de nutriente convencionais modificados quando apropriado paraativação de promotores, seleção de transformantes ou amplificação de ge-nes. As condições de cultura, tais como temperatura, pH e similares, sãoaquelas previamente utilizadas com a célula hospedeira selecionada paraexpressão e será aparente ao técnico ordinariamente versado. Os clonesque são identificados como tendo a atividade de enzima especificada podementão ser sequenciados para identificar a seqüência de polinucleotídeo codi-ficando uma enzima tendo a atividade realçada.
A invenção fornece métodos para super-expressão de aldolasesrecombinantes, tais como piruvato aldolases, tais como enzimas de HMGe/ou KHG aldolase em células compreendendo expressão de um vetor com-preendendo um ácido nucléico de acordo com a invenção, tal como um áci-do nucléico compreendendo uma seqüência de ácido nucléico com pelo me-nos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%,61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%,25 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%,87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%,ou mais identidade de seqüência para uma seqüência de acordo com a in-venção sobre uma região de pelo menos cerca de 100 resíduos, em que asidentidades de seqüência são determinadas através de varredura com umalgoritmo de comparação de seqüência ou por inspeção visual, ou, um ácidonucléico que hibridiza-se sob condições rigorosas a uma seqüência de ácidonucléico de acordo com a invenção, ou uma subseqüência deste. A super-expressão pode ser efetuada por qualquer mecanismo, tal como uso de umpromotor de atividade alta, um vetor dicistrônico ou por amplificação de genedo vetor.
Os ácidos nucléicos de acordo com a invenção podem ser expressados, ou super-expressados, em qualquer sistema in vitro ou expres-são in vivo. Quaisquer sistemas de cultura celular podem ser empregadospara expressar, ou super-expressar, proteína recombinante, incluindo cultu-ras bacterianas, de inseto, de levedura, fúngicas çu de mamífero. Super-expressão pode ser efetuada por escolha apropriada de promotores, realça-dores, vetores (tal como uso de vetores de réplicon, vetores dicistrônicos(Vide Gurtu (1996) Biochem. Biophys. Res. Commun. 229:295-8), meios,sistemas de cultura e similares. Em algumas modalidades, amplificação degene utilizando-se marcadores de seleção, tais como glutamina sintetase(Vide Sanders (1987) Dev. Biol. Stand. 66:55-63), em sistemas celulares éutilizada para super-expressar os polipeptídeos de acordo com a invenção.
Detalhes adicionais com respeito a este método estão na litera-tura pública e/ou são conhecidos ao técnico versado. Em uma exemplifica-ção não-limitante particular, tal literatura publicamente disponível inclui EP0659215 (WO 9403612 Al) (Nevalainen e outros); Lapidot, A., Mechaly, A.,Shoham, Y., "Over-expression and single-step purification of a thermostablexilanase of Bacillus stearothermophilus T-6," J. Biotechnol. Nov 51:259-64(1996); Lüthi, E., Jasmat, N.B., Bergquist, P.L., "Xilanase from the extremelythermophilic bacterium Caldocellum saccharolyticum: over-expression of thegene in Escherichia coli and characterization of the gene product," Appl. En-viron. Microbiol. Sep 56:2677-83 (1990); e Sung, W.L., Luk, C.K., Zahab,D.M., Wakarchuk, W., "Over-expression of the Bacillus subtilis and circulansxilanases in Escherichia coli," proteína Expr. Purif. Jun 4:200-6 (1993), aindaque estas referências não apresentem as enzimas inventivas do presentepedido.
A célula hospedeira pode ser qualquer uma das células hospe-deiras familiares àqueles versados na técnica, incluindo células procarióti-cas, células eucarióticas, células de mamífero, células de inseto, ou célulasde planta. Como exemplos representativos de hospedeiros apropriados,nesse sentido podem ser mencionados: células bacterianas, tal como E. coli,Streptomyces, Bacillus subtilis, Bacillus cereus, Salmonella typhimurium evárias espécies dentro dos gêneros Pseudomonas, Streptomyces e Staphi-lococcus, células fúngicas, tais como Aspergillus, levedura tal como qualquerespécie de Pichia, Saccharomyces, Schizosaeeharomyees, Schwanniomy-ees, incluindo Piehia pastoris, Saccharomyees eerevisiae, ou Schizosaeeha-romyees pombe, células de inseto tais como Drosophila S2 e SpodopteraSfP, células de animal tais como CHO1 COS ou melanoma de Bowes e ade-novírus. A seleção de um hospedeiro apropriado está dentro das capacida-des daqueles versados na técnica.
O vetor pode ser introduzido nas células hospedeiras utilizando-se qualquer uma de uma variedade de técnicas, incluindo transformação,transfecção, transdução, infecção viral, pistolas de gene, ou transferência degene mediada por Ti. Métodos particulares incluem transfecção de fosfato decálcio, transfecção mediada por DEAE-Dextrano, lipofecção, ou eletropora-ção (Davis, L1 Dibner, M., Battey, L, Basic Methods in Molecular Biology,(1986)).
Onde apropriado, as células hospedeiras construídas pode sercultivadas em meios de nutriente convencionais modificados quando apro-priado para ativação de promotores, seleção de transformantes ou amplifica-ção do genes de acordo com a invenção. Seguindo transformação de umacepa hospedeira adequada e desenvolvimento da cepa hospedeira a umadensidade celular apropriada, o promotor selecionado pode ser induzido pormecanismo apropriado (tal como mudança de temperatura ou indução quí-mica) e as células podem ser cultivadas por um período adicional para dei-xá-las produzirem o polipeptídeo desejado ou fragmento deste.
Células podem ser colhidas através de centrifugação, rompidaspor mecanismo físico ou químico e o extrato bruto resultante é retido por pu-rificação adicional. Células microbianas empregadas para expressão de pro-teínas podem ser rompidas através de qualquer método conveniente, inclu-indo ciclo de congelamento-descongelamento, sonicação, ruptura mecânica,ou uso de agentes de Iise celular. Tais métodos são bem-conhecidos poraqueles versados na técnica. O polipeptídeo expressado ou fragmento destepode ser recuperado e purificado de culturas celulares recombinantes atra-vés de métodos incluindo precipitação de sulfato de amônio ou etanol, extra-ção de ácido, cromatografia de permuta de ânion ou cátion, cromatografia defosfocelulose, cromatografia de interação hidrofóbica, cromatografia por afi-nidade, cromatografia de hidroxilapatita e cromatografia de lectina. Etapasde reduplicação de proteína podem ser utilizadas, quando necessário, emconfiguração completa do polipeptídeo. Se desejado, cromatografia líquidade alto desempenho (HPLC) pode ser empregada para etapas de purificaçãofinais.
Vários sistemas de cultura celular de mamífero podem tambémser empregados para expressar proteína recombinante. Exemplos de siste-mas de expressão de mamífero incluem as linhagens de COS-7 de fibroblas-tos de rim de macaco (descrito por Gluzman, Cell1 23_:175, 1981) e outraslinhagens celulares capazes de expressão de proteínas de um vetor compa-tível, tal como as linhagens celulares de C 127, 3T3, CHO, HeLa e BHK.
Os constructos em células hospedeiras podem ser utilizadas deuma maneira convencional para produzir o produto de gene codificado pelaseqüência recombinante. Dependendo do hospedeiro empregado em umprocedimento de produção recombinante, os polipeptídeos produzidos porcélulas hospedeiras contendo o vetor podem ser glicosilados ou podem sernão-glicosilados. Polipeptídeos de acordo com a invenção podem ou tam-bém podem não incluir um resíduo de aminoácido de metionina inicial.
Alternativamente, os polipeptídeos de acordo com a invenção,ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50,75, 100, ou 150 ou mais aminoácidos consecutivos destes podem ser sinte-ticamente produzidos por sintetizadores de peptídeo convencionais, tal comodiscutido abaixo. Em outras modalidades, fragmentos ou porções dos poli-peptídeos podem ser empregados para produção do correspondente poli-peptídeo de tamanho natural por síntese de peptídeo; por esse motivo, osfragmentos podem ser empregados como intermediários para produção dospolipeptídeos de tamanho natural.
Sistemas de translação livres de célula podem também ser em-pregados para produzir um dos polipeptídeos de acordo com a invenção, oufragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75,100, ou 150 ou mais aminoácidos consecutivos destes utilizando-se mRNAstranscritos de umo constructo de DNA compreendendo um promotor opera-velmente ligado a um ácido nucléico codificando o polipeptídeo ou fragmentodeste. Em algumas modalidades, o constructo de DNA pode ser Iinearizadoantes de conduzir uma reação de transcrição in vitro. o transcrita mRNA éentão incubado com uma apropriado extrato de translação livre dè célula, talcomo uma extrato de reticulócito de coelho, para produzir o desejada poli-peptídeo ou fragmento deste.
Amplificação de Ácidos Nucléicos
Na prática da invenção, ácidos nucléicos de acordo com a in-venção e ácidos nucléicos codificando uma aldolase, tal como piruvato aldo-lase, tal como enzimas de HMG e/ou KHG aldolase de acordo com a inven-ção, ou ácidos nucléicos modificados de acordo com a invenção, podem serreproduzidos através de amplificação, tal como PCR. Amplificação podetambém ser utilizada para clonar ou modificar os ácidos nucléicos de acordocom a invenção. Desse modo, a invenção fornece pares de seqüência inici-adores de amplificação para amplificação de ácidos nucléicos de acordocom a invenção. Aquele de versatilidade na técnica pode desenhar pares deseqüência iniciadores de amplificação para qualquer parte de ou o compri-mento total destas seqüências.
Em algumas modalidades, uma invenção fornece ácidos nucléi-cos amplificados por pares iniciadores de amplificação de acordo com a in-venção, tais como pares iniciadores tal como mencionado em cerca do pri-meiro (o 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, ou 25 ou maisresíduos de ácidos nucléicos de acordo com a invenção, e cerca do primeiro(o 5') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, ou 25 ou mais resíduos do fila-mentos complementares. Em algumas modalidades, uma invenção fornecepares de seqüência iniciadores de amplificação para amplificação de um á-cido nucléico codificando um polipeptídeo tendo uma aldolase, tal como pi-ruvato aldolase, tal como enzima de HMG e/ou KHG aldolase, atividade, emque o par iniciador é capaz de amplificação de um ácido nucléico compreen-dendo uma seqüência de acordo com a invenção, ou fragmentos ou subse-qüências deste. Um ou cada membro do par de seqüência iniciador de am-plificação pode compreender um oligonucleotídeo compreendendo pelo me-nos cerca de 10 a 50 ou mais bases consecutivas da seqüência, ou cerca de12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, ou 25 ou mais bases con-secutivas da seqüência. Em algumas modalidades, a invenção fornece paresiniciadores de amplificação, em que o par iniciador compreende um primeiromembro tendo uma seqüência tal como mencionado em cerca do primeiro (o5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, ou 25 ou mais resíduosde um ácido nucléico de acordo com a invenção, e um segundo membrotendo uma seqüência tal como mencionado através de cerca do primeiro (o5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, ou 25 ou mais resíduosdo filamento complementar do primeiro membro.
A invenção fornece aldolase, tal como piruvato aldolase, tal co-mo enzimas de HMG e/ou KHG aldolase gerada através de amplificação, talcomo reação de cadeia de polimerase (PCR), utilizando-se um par iniciadorde amplificação de acordo com a invenção. Em algumas modalidades, umainvenção fornece métodos de making uma aldolase, tal como piruvato aldo-lase, enzima de HMG e/ou KHG aldolase através de amplificação, tal comoPCR, utilizando-se uma par iniciador de amplificação de acordo com a in-venção. Em algumas modalidades, o par iniciador de amplificação amplificaum ácido nucléico de uma biblioteca, tal como uma biblioteca de gene, talcomo uma biblioteca ambiental.
Reações de amplificação podem também ser utilizadas paraquantificar uma quantidade de ácido nucléico em uma amostra (tal comouma quantidade de mensagem em uma amostra de célula), rotular o ácidonucléico (tal como para aplicá-las a um grupo ou uma mancha), detectar oácido nucléico, ou quantificar uma quantidade de um ácido nucléico específi-co em uma amostra. Em algumas modalidade da invenção, mensagem iso-Iada de uma célula ou uma biblioteca de cDNA são amplificadas.
O técnico versado pode selecionar e desenhar iniciadores deamplificação de oligonucleotídeo adequados. Métodos de amplificação sãotambém bem-conhecidos na técnica, e incluem, tal como reação de cadeiade polimerase, PCR (Vide PCR PROTOCOLS, A GUIDE TO METHODS eAPPLICATIONS, ed. Innis, Academic Press, Ν. Y. (1990) e PCR STRATE-GIES (1995), ed. Innis, Academic Press, Inc., N. Y.), reação de cadeia deIigase (LCR) (Vide Wu (1989) Genomics 4:560; Landegren (1988) Science241:1077; Barringer (1990) Gene 89:117); amplificação de transcrição (VideKwoh (1989) Proc. Natl. Acad. Sei. USA 86:1173); e, replicação de seqüên-cia auto-sustentada (Vide Guatelli (1990) Proc. Natl. Acad. Sei. USA87:1874); amplificação de Q Beta replicase (Vide Smith (1997) J. Clin. Mi-crobiol. 35:1477- 1491), ensaio de amplificação de Q-beta replicase automa-tizado (Vide Burg (1996) Mol. Cell. Probes 10:257-271) e outras técnicasmediadas por RNA polimerase (tal como NASBA, Cangene, Mississauga,Ontario); vide também Berger (1987) Methods Enzymol. 152:307-316; Au-subel e outros Current Protocols in Molecular Biology, John Wiley & Sons,Inc. 1997 e Sambrook e outros, Molecular Cloning: A Laboratory Manual 2ndEd., Cold Spring Harbor Laboratory Press (1989). Patente dos Estados Uni-dos Nos. 4.683.195 e 4.683.202; Sooknanan (1995) Biotechnology 13:563-564.
Determinação de identidade de seqüência em ácidos nucléicos e poli-peptídeos
A invenção fornece ácidos nucléicos compreendendo seqüên-cias tendo pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%,57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%,83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,96%, 97%, 98%, 99%, ou mais, ou identidade(homologia) de seqüênciacompleta (100%) para um ácido nucléico de acordo com a invenção (VideLista de Seqüência) sobre uma região de pelo menos cerca de 50, 75, 100,150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850,900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450,1500, 1550 ou mais, resíduos. Em algumas modalidades, uma invenção for-nece polipeptídeos compreendendo seqüências tendo pelo menos cerca de50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%,63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%,76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais, ouidentidade de seqüênciacompleta (100%) para um polipeptídeo de acordocom a invenção (Vide Lista de Seqüência). O nível de identidade (homologi-
a) de seqüência pode ser determinado utilizando-se qualquer programa decomputador e parâmetros associados, incluindo aqueles descritos aqui, talcomo BLAST 2.2.2. ou versão 3.0t78 de FASTA, com os parâmetros bási-cos.
As seqüências de ácido nucléico de acordo com a invenção po-dem compreender pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150,200, 300, 400, ou 500 ou mais nucleotídeos consecutivos de uma seqüênciade acordo com a invenção e seqüências substancialmente idênticas a isso.Seqüências e fragmentos homólogos de seqüências de ácido nucléico deacordo com a invenção podem referir-se a uma seqüência tendo pelo menoscerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%,61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%,74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%,87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%,ou mais identidade (homologia) de seqüência para estas seqüências. Homo-logia (identidade de seqüência) pode ser determinada utilizando-se qualquerum dos programas de computador e parâmetros descritos aqui, incluindoversão 3,0t78 de FASTA com os parâmetros básicos. Seqüências homólo-gas também incluem seqüências de RNA em que uridinas substituem as ti-minas nas seqüências de ácido nucléico de acordo com a invenção. As se-qüências homólogas podem ser obtidas utilizando-se quaisquer um dos pro-cedimentos descritos aqui ou podem resultar da correção de um erro de se-qüenciamento. Será apreciado que as seqüências de ácido nucléico de a-cordo com a invenção possam ser reapresentadas no formato de carátersimples tradicional (Vide the inside back cover de Stryer, Lubert. Biochemis-try, 3rd Ed., W. H Freeman & Co., New York.) ou em qualquer outro formatoque registre a identidade dos nucleotídeos em uma seqüência.
Em algumas modalidades, programas de comparação de se-qüência identificados aqui são utilizados neste aspecto de acordo com a in-venção, isto é, para determinar se uma seqüência de ácido nucléico ou poli-peptídeo está dentro do escopo de acordo com a invenção. No entanto, i-dentidades (homologias) de seqüência de proteína e/ou ácido nucléico po-dem ser avaliadas utilizando-se qualquer algoritmo de comparação de se-qüência ou programa conhecido na técnica. Tais algoritmos e programasincluem, mas não são de modo algum limitados a, TBLASTN, BLASTP,FASTA, TFASTA e CLUSTALW (Vide Pearson e Lipman, Proc. Natl. Acad.Sei. USA 85(8):2444-2448, 1988; Altschul e outros, J. Mol. Biol. 215(3):403-410, 1990; Thompson Nucleic Acids Res. 22(2):4673-4680, 1994; Higgins eoutros, Methods Enzymol. 266:383- 402, 1996; Altschul e outros, J. Mol. Biol.215(3):403-410, 1990; Altschul e outros, Nature Genetics 3:266-272, 1993).
Em algumas modalidades, homologia ou identidade é medidautilizando-se software de varredura de seqüência (tal como Pacote de Soft-ware de Varredura de Seqüência do Grupo de Computador Genetics, Uni-versidade do Centro de Biotecnologia de Wisconsin, Avenida da Universida-de 1710, Madison, Wl 53705). Tal software compara seqüências similaresatravés de designação de graus de homologia para várias deleções, substi-tuições e outras modificações. Em algumas modalidades, os termos "homo-logia" e "identidade" no contexto de duas ou mais seqüências de ácidos nu-cléicos ou polipeptídeo, referem-se a duas ou mais seqüências ou subse-qüências que são as mesmas ou possuem uma porcentagem especificadade resíduo de aminoácidos ou nucleotídeos que são os mesmos quandocomparados e alinhados quanto à correspondência máxima sobre uma jane-la de comparação ou região desenhada quando medidos utilizando-se qual-quer número de algoritmos de comparação de seqüência ou através de ali-nhamento manual e inspeção visual. Em algumas modalidades, para compa-ração de seqüência, uma seqüência atua como uma seqüência de referên-cia, à qual seqüências de teste são comparadas. Quando utilizando-se deum algoritmo de comparação de seqüência, seqüência de teste e referênciassão registradas em um computador, coordenadas de subseqüência são de-senhadas, se necessário e parâmetros de programa de algoritmo de se-qüência são projetados. Parâmetros de programa básicos podem ser utiliza-dos, ou parâmetros alternativos podem ser projetados. O algoritmo de com-paração de seqüência então calcula as identidades de seqüência em por-centagem para as seqüências de teste relativas à seqüência de referência,com base nos parâmetros de programa.
Uma "janela de comparação", tal como utilizada aqui, inclui refe-rência a um segmento de qualquer um do número de posições contíguasselecionada do grupo consistindo em 20 a 600, geralmente cerca de 50 acerca de 200, mais geralmente cerca de 100 a cerca de 150 em que umaseqüência pode ser comparada a uma seqüência de referência do mesmonúmero de posições contíguas depois que as duas seqüências são ideal-mente alinhadas. Métodos de alinhamento de seqüência para comparaçãosão bem-conhecidos na técnica. Alinhamento ideal de seqüências para com-paração pode ser conduzido, tal como através do algoritmo de homologialocal Smith & Waterman, Adv. Appl. Math. 2:482, 1981, através do algoritmode alinhamento de homologia de Needleman & Wunsch, J. Mol. Biol 48:443.1970, através da pesquisa quanto ao método de similaridade de person &Lipman, Proc. Natl Acad. Sei. USA 85:2444, 1988, através de implementa-ções computadorizadas destes algoritmos (GAP, BESTFIT, FASTA e TFAS-TA no Pacote de Software Genetics de Wisconsin, Grupo de ComputadorGenetics, 575 Science Dr., Madison, Wl), ou através de alinhamento manuale inspeção visual. Outros algoritmos para determinar homologia ou identida-de incluem, por exemplo, além de um programa BLAST (Ferramenta dePesquisa de Alinhamento Local Básica no Centro Nacional para InformaçãoBiológica), ALIGN, AMAS (Varredura de Seqüências Multiplamente Alinha-das), AMPS (Alinhamento de Seqüência Múltipla de Proteína), ASSET (Fer-ramenta de Avaliação estatística de Segmento Alinhado), BANDS, BESTS-COR, BIOSCAN (Nodo de Varredura Comparativa de Seqüência Biológica),BLIMPS (Pesquisador de Blocks EVIProved), FASTA, Intervals & Points,BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCON-SENSUS, algoritmo de Smith-Waterman, DARWIN, algoritmo de Las Vegas,FNAT (Ferramenta de Alinhamento de Nucleotídeo Forçado), Framealign,Framesearch, DYNAMIC, FILTER, FSAP (Pacote de Varredura de Seqüên-cia de Fristensky), GAP (Programa de Alinhamento Global), GENAL, GIBBS,GenQuest, ISSC (Comparação de Seqüência Sensível), LALIGN (Alinha-mento de Seqüência Local), LCP (Programa de Conteúdo Local), MACAW(Consíructo & Varredura de Alinhamento Múltiplo Workbench), MAP (Pro-grama de Alinhamento Múltiplo), MBLKP, MBLKN, PIMA (Alinhamento deMultisseqüência Induzido por Padrão), SAGA (Alinhamento de Seqüênciaatravés de Algoritmo Genético) e WHAT-IF. Tais programas de alinhamentopodem também ser utilizados para analisar bases de dados de genoma paraidentificar seqüências de polinucleotídeo tendo seqüências substancialmenteidênticas. Várias bases de dados de genoma estão disponíveis, por exem-plo, uma porção substancial do genoma humano está disponível como partedo Projeto de Seqüenciamento de Genoma Humano (Gibbs, 1995). Pelomenos vinte e um outros genomas já foram sequenciados, incluindo, por e-xemplo, M. genitalium (Fraser e outros, Science 270:397-403 (1995)),M.jannaschii (Bult e outros, Science 23:1058-73 (1996)), H. influenzae(Fleischmann e outros, Science 269:496-512 (1995)), E. coli {Blattner e ou-tros, Science 277:1453-74 (1997)) e levedura (S. cerevisiae) (Mewes e ou-tros, Nature 387:7-65 (1997)) e D. melanogaster (Adams e outros, Science257:2185-95 (2000)). Significante progresso também foi feito no seqüencia-mento dos genomas de organismo modelo, tal como camundongo, C. ele-gans e Arabadopsis sp. Diversas bases de dados contendo informação ge-nômica annotada com algumas informação funcional são mantidas por dife-rentes organizações e podem estar acessíveis por meio da internet.
Em algumas modalidades, algoritmos BLAST e BLAST 2,0 sãoutilizados, os quais são descritos em Altschul e outros, Nuc. Acids Res.25:3389-3402, 1977 e Altschul e outros, J. Mol. Biol. 215:403-410, 1990,respectivamente. Software para execução de varreduras BLAST está publi-camente disponível por meio do Centro Nacional para Informação de Biotec-nologia. Este algoritmo envolve primeiro identificação de pares de seqüênciade classificação alta (HSPs) através de identificação de palavras curtas decomprimento W na seqüência indagada, que ou casa ou satisfaz algum es-core T de limiar de valor positivo quando alinhado com uma palavra domesmo comprimento em uma seqüência de base dados. T é referido como olimiar de escore de palavra de vizinhança (Altschul e outros, supra). Estesacertos de palavra de vizinhança inicial agem como sementes para pesqui-sas iniciais para encontrar HSPs mais longos contendo-os. Uns acertos depalavra são estendidos em ambas as direções ao longo de cada seqüênciaaté que o escore de alinhamento cumulativo possa ser aumentado. Escorescumulativos são calculados usando, para seqüências de nucleotídeo, os pa-râmetros M (escore de recompensa para um par de resíduos casando; sem-pre >0). Para seqüência de aminoácidos, uma matriz de classificação é utili-zada para calcular o escore cumulativo. Extensão de uns acertos de palavraem cada direção é detido quando: o escore de alinhamento cumulativo caipela quantidade X de seu valor máximo alcançado; o escore cumulativo vai azero ou abaixo, devido ao acúmulo de uma ou mais alinhamentos de resíduode classificação negativa; ou a extremidade de ou seqüência é alcançada.
Os parâmetros W, T e X de algoritmo BLAST determinam a sensibilidade evelocidade do alinhamento. O programa (para seqüências de nucleotídeo)BLASTN usa como padrões um tamanho de palavra (W) de 11, uma expec-tativa (E) de 10, M=5, N=- 4 e uma comparação de ambos os filamentos.
Para seqüência de aminoácidos, o programa BLASTP usa como padrões umtamanho de palavra de 3 e expectativas (E) de 10 e os alinhamentos (B) dematriz de classificação BLOSUM62 (Vide Henikoff & Henikoff, Proc. Natl.Acad. Sei. USA 89:10915, 1989) de 50, expectativa (E) de 10, M=5, N= -4 euma comparação de ambos os filamentos.
O algoritmo BLAST também desempenha uma varredura de es-tatística da similaridade entre duas seqüências (Vide Karlin & Altschul, Proc.Natl. Acad. Sei. USA 90:5873, 1993). Uma medição de similaridade forneci-da por algoritmo BLAST é a probabilidade de menor soma (P(N))1 que forne-ce uma indicação da probabilidade pela qual uma comparação entre duasseqüências de nucleotídeo ou aminoácido ocorreria por chance. Por exem-plo, um ácido nucléico é considerado similar a uma seqüência de referênciase a probabilidade de menor soma em uma comparação do ácido nucléicode teste para o ácido nucléico de referência é menor do que cerca de 0,2,em algumas modalidades menor do que cerca de 0,01 e em outras modali-dades menor do que cerca de 0,001.
Em algumas modalidades, homologias de seqüência de proteínae ácido nucléico são avaliadas utilizando-se da Ferramenta de Pesquisa deAlinhamento Local Básica ("BLAST") em particular, cinco programas BLASTespecíficos são utilizados para desempenhar a seguinte tarefa:
(1) BLASTP e BLAST3 comparam uma seqüência indagada poraminoácido contra uma base de dados de seqüência de proteína;
(2) BLASTN compara uma seqüência indagada por nucleotídeocontra uma base de dados de seqüência de nucleotídeo;
(3) BLASTX compara os produtos de translação conceituais deseis-estruturas de uma seqüência de nucleotídeo indagada (ambos os fila-mentos) contra uma base de dados de seqüência de proteína;
(4) TBLASTN compara uma seqüência de proteína indagadacontra uma base de dados de seqüência de nucleotídeo trasladada em todasas seis estruturas de leitura (ambos os filamentos); e
(5) TBLASTX compara as translações de seis estruturas de umaseqüência indagada de nucleotídeo contra as translações de seis estruturasde uma base de dados de seqüência de nucleotídeo.
Os programas BLAST identificam seqüências homólogas atravésde identificação de segmentos similares, os quais são referidos aqui como"pares de segmento de alto-classificação," entre uma seqüência de amino ouácido nucléico indagada e uma seqüência de teste que é, em algumas mo-dalidades, obtido de uma base de dados de seqüência de proteína ou ácidonucléico. Pares de segmento de alto-classificação são, em algumas modali-dades, identificados (isto é, alinhados) por meio de uma matriz de classifica-ção, muitos dos quais são conhecidos na técnica. Em algumas modalidades,a matriz de classificação utilizada é o B matriz LOSUM62 (Gonnet (1992)Science 256:1443-1445; Henikoff e Henikoff (1993) Proteins 17:49-61) Less.Em algumas modalidades, as matrizes de PAM ou PAM250 podem tambémser utilizadas (Vide Schwartz e Dayhoff, eds., 1978, Matrices for DetectindDistance Relationships: Atlas of Protein Se quence and Strusture, Washing-ton: National Biomedical Research Foundation). Programas BLAST são a-cessíveis por meio da Biblioteca Nacional dos Estados Unidos de Medicina.
Os parâmetros utilizados com os algoritmos acima podem seradaptados dependendo do comprimento de seqüência e grau de homologiaestudado. Em algumas modalidades, os parâmetros podem ser os parâme-tros básicos utilizados através dos algoritmos na ausência de instruções dousuário.
Sistemas de computador e produtos de programa de computador
A invenção fornece computadores, sistemas de computador,meios legíveis de computador, produtos de programas de computador e si-milares registrados ou armazenados neste, as seqüências de ácido nucléicoe polipeptídeo de acordo com a invenção. Adicionalmente, na prática dosmétodos de acordo com a invenção, tal como para determinar e identificaridentidades de seqüência (para determinar se um ácido nucléico está dentrodo escopo de acordo com a invenção), homologias estruturais, motivos esimilares in siiico, uma seqüência de ácido nucléico ou polipeptídeo de acor-do com a invenção pode ser armazenada, registrada, e manipulada emqualquer meio o qual pode ser lido e acessado através de um computador.
Tal como utilizado aqui, as palavras "registrados" e "armazena-dos" refere-se a um processo para armazenagem de informação em ummeio de computador. Um técnico versado pode facilmente adotar quaisquermétodos conhecidos para registro de informação em um meio interpretávelpor computador para gerar manufaturas compreendendo uma ou mais dasseqüências de ácido nucléico e/ou polipeptídeo de acordo com a invenção.Tal como utilizado aqui, os termos "computador," "programa de computador"e "processador" são utilizados em seus contextos gerais mais amplos e in-corporam todos os tais dispositivos, tal como descrito em detalhes, abaixo.Uma "seqüência de codificação de" ou uma "seqüência codifica" um polipep-tídeo ou proteína particular, é uma seqüência de ácido nucléico que é trans-crita e trasladada em um polipeptídeo ou proteína quando colocada sob ocontrole de seqüências reguladoras apropriadas.
Os polipeptídeos de acordo com a invenção incluem seqüênciasde acordo com a invenção e seqüências substancialmente idênticas a isso, esubseqüências e fragmentos enzimaticamente ativos de quaisquer uma dasseqüências precedentes. Em algumas modalidades, seqüências de polipep-tídeo substancialmente idênticas, ou homólogas, referem-se a uma seqüên-cia de polipeptídeo tendo pelo menos 50%, 51%, 52%, 53%, 54%, 55%,56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%,69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%,95%, 96%, 97%, 98%, 99%, ou mais, ou identidade completa (100%) de se-qüência (homologia) para seqüência de acordo com a invenção.
Homologia (identidade de seqüência) pode ser determinada utili-zando-se quaisquer um dos programas e parâmetros de computador descri-tos aqui. Uma seqüência de ácido nucléico ou polipeptídeo de acordo comuma invenção pode ser armazenada, registrada e manipulada em qualquermeio que possa ser lido e acessado através de um computador. Tal comoutilizado aqui, as palavras "registrados" e "armazenados" referem-se a umprocesso para armazenagem de informação em um meio de computador.Um técnico versado pode facilmente adotar qualquer um dos métodos pre-sentemente conhecidos para registro de informação em um meio interpretá-vel por computador para gerar fabricações compreendendo uma ou mais dasseqüências de ácido nucléico de acordo com a invenção, uma ou mais dasseqüências de polipeptídeo de acordo com a invenção. Outra modalidade dainvenção é um meio interpretável por computador tendo registrado nestepelo menos 2, 5, 10, 15, ou 20 ou mais seqüências de ácido nucléico ou po-lipeptídeo de acordo com a invenção.
Outra modalidade da invenção é um meio interpretável por com-putador tendo registrado neste uma ou mais das seqüências de ácido nu-cléico de acordo com a invenção. Outra modalidade da invenção é um meiointerpretável por computador tendo registrado neste uma ou mais das se-qüências de polipeptídeo de acordo com a invenção. Outra modalidade dainvenção é um meio interpretável por computador tendo registrado nestepelo menos 2, 5, 10, 15, ou 20 ou mais das seqüências de ácido nucléicó oupolipeptídeo tal como mencionado acima.
Meios legíveis de computador incluem meios magneticosamentelegíveis, meios opticamente legíveis, meios eletronicamente legíveis e meiosmagnéticos/óticos. Por exemplo, os meios legíveis de computador podemser um disco rígido, um disquete, uma fita magnética, CD-ROM, Disco Ver-sátil Digital (DVD), Memória de Acesso Aleatório (RAM), ou Memória Apenasde Leitura (ROM) bem como outros tipos de outros meios conhecidos poraqueles versados na técnica.
Algumas modalidades da invenção incluem sistemas (tais comosistemas com base em internet), tais como sistemas de computador que ar-mazenam e manipulam a informação de seqüência descrita aqui. Um exem-plo de um sistema de computador 100 é ilustrado em forma de diagrama debloco na Figura 9. Tal como utilizado aqui, "um sistema de computador" refe-re-se aos componentes de hardware, componentes de software e compo-nentes de armazenagem de dados utilizados para analisar uma seqüênciade nucleotídeo de uma seqüência de ácido nucléicó de acordo com a inven-ção, ou uma seqüência de polipeptídeo de acordo com a invenção. Em al-gumas modalidades, o sistema de computador 100 inclui um processadorpara processamento, acesso e manipulação dos dados de seqüência. Oprocessador 105 pode ser qualquer tipo bem-conhecido de unidade de pro-cessamento central, tal como, por exemplo, o Pentium Ill da Corporação In-tel, ou processador similar de Sun, Motorola, Compaq, AMD ou Máquinas deNegócio Internacionais.
Em algumas modalidades, o sistema de computador 100 é umsistema de propósito geral que compreende o processador 105 e um oumais componentes de armazenagem de dados internos 110 para armazena-gem de dados e um ou mais dispositivos de recuperação de dados para re-cuperação dos dados armazenados nos componentes de armazenagem dedados. Um técnico versado pode facilmente observar que qualquer um dossistemas de computador correntemente disponíveis são adequados.
Em uma modalidade, o sistema de computador 100 inclui umprocessador 105 conectado a um barramento que é conectado a uma me-mória principal 115 (em uma modalidade implementada como RAM) e um oumais dispositivos de armazenagem de dados internos 110, tal como um mei-os de unidade rígida e/ou outras interpretáveis por computador tendo dadosregistrados neste. Em algumas modalidades, o sistema de computador 100também inclui uma ou mais dispositivo de recuperação de dados 118 paraleitura dos dados armazenados nos dispositivos de armazenagem de dadosinternos 110.
O dispositivo de recuperação de dados 118 pode representar,por exemplo, um drive de disquete, um drive de disco laser, um dríve de fitamagnética, ou um modem capaz de conexão a um sistema de armazenagemde dados remoto (tal como por meio da internet) etc. Em algumas modalida-des, o dispositivo de armazenagem de dados interno 110 é um meio inter-pretável por computador removível tal como um disquete, um disco laser,uma fita magnética, etc. contendo controle lógico e/ou dados registradosneste. O sistema de computador 100 pode vantajosamente incluir ou serprogramado através de software apropriado para leitura do controle lógicoe/ou dos dados do componente de armazenagem de dados uma vez inseri-do no dispositivo de recuperação de dados.
O sistema de computador 100 inclui um visor 120 que é utilizadopara exibir saída a um usuário de computador. Deve também ser notado queo sistema de computador 100 pode ser ligado a outros sistemas de compu-tador 125a-c em uma rede ou rede de área ampla para fornecer acesso cen-tralizado ao sistema de computador 100.
Software para acesso e processamento das seqüência de nu-cleotídeo de uma seqüência de ácido nucléico de acordo com a invenção eseqüências substancialmente idênticas a isso, ou uma seqüência de polipep-tídeo de acordo com a invenção e seqüências substancialmente idênticas aisso, (tal como ferramentas de pesquisa, ferramentas de comparação e fer-ramentas de modelagem etc.) pode residir na memória principal 115 duranteexecução.
Em algumas modalidades, o sistema de computador 100 podetambém compreender um algoritmo de comparação de seqüência para com-parar uma seqüência de ácido nucléico de acordo com a invenção e se-qüências substancialmente idênticas a isso, ou uma seqüência de polipeptí-deo de acordo com a invenção e seqüências substancialmente idênticas aisso, armazenado em um legível de computador a uma seqüência(s) de nu-cleotídeo ou polipeptídeo de referência armazenada em um meio legível decomputador. Um "algoritmo de comparação de seqüência" refere-se a umaou mais programas que são implementados (localmente ou remotamente)nos sistema de computador 100 para comparação de uma seqüência de nu-cleotídeo com outras seqüências de nucleotídeo e/ou compostos armazena-dos dentro de um mecanismo de armazenagem de dados. Por exemplo, oalgoritmo de comparação de seqüência pode comparar as seqüências denucleotídeo de uma seqüência de ácido nucléico de acordo com a invençãoe seqüências substancialmente idênticas a isso, ou uma seqüência de poli-peptídeo de acordo com a invenção e seqüências substancialmente idênti-cas a isso, armazenadas em um meio interpretável por computador para se-qüência de referências armazenadas em um meio interpretável por compu-tador para identificar homologias ou motivos estruturais.
A Figura 10 é um diagrama de fluxo ilustrando uma modalidadede um processo 200 para comparar uma nova seqüência de nucleotídeo ouproteína com uma base dados de seqüências a fim de determinar os níveisde homologia entre a nova seqüência e as seqüências na base de dados. Abase de dados de seqüências pode ser uma base de dados privada armaze-nada dentro do sistema de computador 100, ou uma base de dados públicatal como GENBANEC que está disponível por meio da Internet.
O processo 200 começa em um estado de partida 201 e entãomuda-se para um estado 202 em que a nova seqüência a ser comparada éarmazenada a uma memória em um sistema de computador 100. Tal comodiscutido acima, a memória podia ser qualquer tipo de memória, incluindoRAM ou um dispositivo de armazenagem interno.
O processo 200 então muda-se para um estado 204 em queuma base dados de seqüências é aberta para varredura e comparação. Oprocesso 200 então muda-se para um estado 206 em que a primeira se-qüência armazenada na base de dados é lida em uma memória no compu-tador. Uma comparação é então realizada em um estado 210 para determi-nar se a primeira seqüência é a mesma como a segunda seqüência. É im-portante notar que esta etapa não é limitada a execução de uma compara-ção exata entre a nova seqüência e a primeira seqüência na base de dados.Métodos bem-conhecidos são conhecidos àqueles de versatilidade na técni-ca para comparar duas seqüências de nucleotídeo ou proteína, ainda se elasnão são idênticas. Por exemplo, intervalos podem ser introduzidos em umaseqüência a fim de aumentar o nível de homologia éntrè as duas seqüênciastestadas. Os parâmetros que controlam seja intervalos ou outros aspectossão introduzidos em uma seqüência, durante a comparação são normalmen-te registrados pelo usuário do sistema de computador.
Uma vez que uma comparação das duas seqüências foi realiza-da no estado 210, uma determinação é feita em um estado de decisão 210se as duas seqüências são as mesmas. Certamente, o termo "mesmo" não élimitado às seqüências que são absolutamente idênticas. Seqüências queestão dentro dos parâmetros de homologia registrados pelo usuário serãodesignadas como "mesma" no processo 200.
Se uma determinação é feita de que as duas seqüências são asmesmas, o processo 200 muda-se para um estado 214 em que o nome daseqüência da base de dados é exibido ao usuário. Este estado notifica o u-suário de que a seqüência com o nome exibido satisfaz os conceitos de ho-mologia que foram registrados. Uma vez que o nome da seqüência armaze-nada é exibido para o usuário, o processo 200 muda-se para um estado dedecisão 218 em que uma determinação é feita se mais seqüências existiremna base de dados. Se mais nenhuma seqüência existe na base de dados,então o processo 200 termina em um estado de término 220. No entanto, semais seqüências existem na base de dados, então o processo 200 muda-separa um estado 224 em que um apontador é movido para a próxima se-qüência na base de dados a fim de que ela possa ser comparada à novaseqüência. Desta maneira, a nova seqüência é alinhada e comparada comtoda seqüência na base de dados.
Deve ser observado que se uma determinação tinha sido feitanos estado de decisão 212 que as seqüências não eram homólogas, então oprocesso 200 mudaria imediatamente para o estado de decisão 218 a fim dedeterminar se quaisquer outras seqüências foram disponíveis na base dedados para comparação.
Conseqüentemente, uma modalidade da invenção é um sistemade computador compreendendo um processador, um dispositivo de armaze-nagem de dados tendo armazenado neste uma seqüência de ácido nucléicode acordo com a invenção e seqüências substancialmente idênticas a isso,ou uma seqüência de polipeptídeo de acordo com a invenção e seqüênciassubstancialmente idênticas a isso, um dispositivo de armazenagem de dadostendo recuperavelmente armazenados nesta seqüências de nucleotídeos ouseqüências de polipeptídeo de referência para ser comparada a uma se-qüência de ácido nucléico de acordo com a invenção e seqüências substan-cialmente idênticas a isso, ou uma seqüência de polipeptídeo de acordo coma invenção e seqüências substancialmente idênticas a isso e um compara-dor de seqüência para conduzir a comparação. O comparador de seqüênciapode indicar um nível de homologia entre as seqüências comparadas ou i-dentificar motivos estruturais no código de ácido nucléico descrito acima deuma seqüência de ácido nucléico de acordo com a invenção e seqüênciassubstancialmente idênticas a isso, ou uma seqüência de polipeptídeo de a-cordo com a invenção e seqüências substancialmente idênticas a isso, ouele pode identificar motivos estruturais em seqüências que são comparadasa estes códigos de ácido nucléico e códigos de polipeptídeo. Em algumasmodalidades, o dispositivo de armazenagem de dados pode possuir arma-zenadas neste as seqüências de pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40ou mais das seqüências de ácido nucléico de acordo com a invenção e se-qüências substancialmente idênticas a isso, ou as seqüências de polipeptí-deo de acordo com a invenção e seqüências substancialmente idênticas aisso.
Outra modalidade da invenção é um método para determinar onível de homologia entre uma seqüência de ácido nucléico de acordo com ainvenção e seqüências substancialmente idênticas a isso, ou uma seqüênciade polipeptídeo de acordo com a invenção e seqüências substancialmenteidênticas a isso e uma seqüência de nucleotídeo de referência. O métodoincluindo leitura do código de ácido nucléico ou do código de polipeptídeo eda seqüência de nucleotídeo ou polipeptídeo de referência por meio do usode um programa de computador que determina níveis de homologia e de-terminação de homologia entre o código de ácido nucléico ou código de poli-peptídeo e a seqüência de nucleotídeo ou polipeptídeo de referência com oprograma de computador. O programa de computador pode ser qualquer umde vários programas de computador para determinar níveis de homologia,incluindo aqueles especificamente enumerados aqui, (tal como BLAST2Ncom os parâmetros básicos ou com quaisquer parâmetros modificados). Ométodo pode ser implementado utilizando-se os sistemas de computadordescritos acima. O método pode também ser realizado através de leitura depelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácidonucléico descritas acima de acordo com a invenção e seqüências substanci-almente idênticas a isso, ou as seqüências de polipeptídeo de acordo com ainvenção e seqüências substancialmente idênticas a isso por meio de uso doprograma de computador e determinação de homologia entre os códigos deácido nucléico ou códigos de polipeptídeo e seqüências de de nucleotídeoou seqüências de polipeptídeo de referência.
A Figura 11 é um diagrama de fluxo ilustrando uma modalidadede um processo 250 em um computador para determinar se duas seqüên-cias são homólogas. O processo 250 começa em um estado de partida 252e então muda-se para um estado 254 em que uma primeira seqüência paraser comparada é armazenada a uma memória. A segunda seqüência a sercomparada é então armazenada a uma memória em um estado 256. O pro-cesso 250 então muda-se para um estado 260 em que o primeiro caracterna primeira seqüência é lido e então para um estado 262 em que o primeirocaracter da segunda seqüência é lido. Deve ser entendido que se a seqüên-cia é uma seqüência de nucleotídeo, então o caracter normalmente seria ouA1 T, C, G ou U. Se a seqüência é uma seqüência de proteína, então ela es-tá, ern algumas modalidades, no código de aminoácido de uma única letra afim de que a primeira e segunda seqüências possam ser facilmente comparadas.
Uma determinação é então feita em um estado de decisão 264se os dois caracteres são os mesmos. Se eles são os mesmos, então o pro-cesso 250 muda-se para um estado 268 em que os próximos caracteres naprimeira e segunda seqüências são lidos. Uma determinação é então feita seos próximos caracteres são os mesmos. Se eles são, então o processo 250continua este circuito até que dois caracteres não sejam os mesmos. Seuma determinação é feita que os próximos dois caracteres não são os mes-mos, o processo 250 muda-se para um estado de decisão 274 para determi-nar se há mais quaisquer caracteres ou seqüência para ler.
Se não há mais quaisquer caracteres para ler, então o processo250 muda-se para um estado 276 em que o nível de homologia entre a pri-meira e segunda seqüências é exibido para o usuário. O nível de homologiaé determinado através de cálculo da proporção de caracteres entre as se-qüências que foram as mesmas dentre o número total de seqüências naprimeira seqüência. Desse modo, se todo caracter em uma primeira 100 se-qüência de nucleotídeo alinhada com todo caracter em uma segunda se-qüência, o nível de homologia seria 100%.
Alternativamente, o programa de computador pode ser um pro-grama de computador que compara as seqüências de nucleotídeo de umaseqüência de ácido nucléico tal como mencionado em uma invenção, a umaou mais seqüências de de nucleotídeo de referência a fim de determinar se ocódigo de ácido nucléico de acordo com a invenção e seqüências substanci-almente idênticas a isso, diferem de uma seqüência de ácido nucléico dereferência em uma ou mais posições. Opcionalmente um tal programa regis-tra o comprimento e identidade de nucleotídeos inseridos, deletados ousubstituídos com respeito à seqüência ou do polinucleotídeo ou uma se-qüência de ácido nucléico de referência de acordo com a invenção e se-qüências substancialmente idênticas a isso. Em algumas modalidades, oprograma de computador pode ser um programa que determina se uma se-qüência de ácido nucléico de acordo com a invenção e seqüências substan-cialmente idênticas a isso, contêm um polimorfismo de nucleotídeo único(SNP) com respeito a uma seqüência de nucleotídeo de referência.
Conseqüentemente, outra modalidade da invenção é um métodopara determinar se uma seqüência de ácido nucléico de acordo com a in-venção e seqüências substancialmente idênticas a isso, diferem em um oumais nucleotídeos de uma seqüência de nucleotídeo de referência compre-endendo as etapas de leitura do código de ácido nucléico e da seqüência denucleotídeo de referência por meio de uso de um programa de computadorque identifica diferenças entre seqüências de ácido nucléico e identificaçãode diferenças entre o código de ácido nucléico e a seqüência de referênciade nucleotídeo com o programa de computador. Em algumas modalidades, oprograma de computador é um programa que identifica polimorfismos denucleotídeo único. O método pode ser implementado através dos sistemasde computador descritos acima e o método ilustrado na Figura 11.0 métodopode também ser realizado através de leitura pelo menos 2, 5, 10, 15, 20,25, 30, ou 40 ou mais das seqüências de ácido nucléico de acordo com ainvenção e seqüências substancialmente idênticas a isso e a seqüência dereferência de nucleotídeos por meio do uso do programa de computador eidentificação de diferenças entre o código de ácido nucléicos e a seqüênciade referência de nucleotídeos com o programa de computador.
Em outras modalidades, o sistema com base em computadorpode também compreender um identificador para identificação de aspectosdentro de uma seqüência de ácido nucléico de acordo com a invenção ouuma seqüência de polipeptídeo de acordo com a invenção e seqüênciassubstancialmente idênticas a isso. Um "identificador" refere-se a um ou maisprogramas que identifica certos aspectos dentro de uma seqüência de ácidonucléico de acordo com a invenção, ou uma seqüência de polipeptídeo deacordo com a invenção. Em algumas modalidades, o identificador pode com-preender um programa que identifica uma estrutura de leitura aberta em umaseqüência de ácido nucléico de acordo com a invenção e seqüências subs-tancialmente idênticas a isso.
A Figura 12 é um diagrama de fluxo ilustrando uma modalidadede um processo identificador 300 para detectar a presença de um caracterís-tica em uma seqüência. O processo 300 começa em um estado de partida302 e então muda-se para um estado 304 em que uma primeira seqüênciaque deve ser checada quanto à aspectos é armazenada a uma memória 115no sistema de computador 100. O processo 300 então muda-se para umestado 306 em que uma base dados de aspectos de seqüência é aberta.Uma tal base dados incluiria uma lista de cada atributo de aspecto junto como nome do aspecto. Por exemplo, um nome de aspecto podia ser "Códon deIniciação" e o atributo seria "ATG". Outro exemplo seria o nome de aspecto"TAATAA Box" e o aspecto atributo seria "TAATAA". Um exemplo de uma talbase dados é produzido pela Universidade do Grupo de Computador Gene-tics de Wisconsin. Alternativamente, os aspectos podem ser motivos de poli-peptídeo estruturais tais como hélices alfa, folhas beta, ou motivos de poli-peptídeo funcionais tais como sítios ativos enzimáticos, motivos de hélice-curva-hélice ou outros motivos conhecidos por aqueles versados na técnica.
Uma vez que a base de dados de aspectos é aberta no estado306, o processo 300 muda-se para um estado 308 em que o primeiro aspec-to é lido da base de dados. Uma comparação do atributo do primeiro aspectocom a primeira seqüência é então feita em um estado 310. Uma determina-ção é então feita em um estado de decisão 316 se o atributo do aspecto foiencontrado na primeira seqüência. Se o atributo foi encontrado, então o pro-cesso 300 muda-se para um estado 318 em que o nome do aspecto encon-trado é exibido para o usuário.
O processo 300 então muda-se para um estado de decisão 320em que uma determinação é feita se aspectos de mudança existirem na ba-se de dados. Se mais nenhum aspecto existir, então o processo 300 terminaem um estado de término 324. No entanto, se mais aspectos existirem nabase de dados, então o processo 300 lê o próximo aspecto de seqüência emum estado 326 e curva-se de volta para o estado 310 em que o atributo dopróximo aspecto é comparado contra a primeira seqüência. Deve ser notado,que se o atributo de aspecto não é encontrado na primeira seqüência no es-tado de decisão 316, o processo 300 muda-se diretamente para o estado dêdecisão 320 a fim de determinar se mais quaisquer aspectos existem na ba-se de dados.
Conseqüentemente, outra modalidade da invenção é um métodode identificação de um aspecto dentro de uma seqüência de ácido nucléicode acordo com a invenção e seqüências substancialmente idênticas a isso,ou uma seqüência de polipeptídeo de acordo com a invenção e seqüênciassubstancialmente idênticas a isso, compreendendo leitura do(s) código(s) deácido nucléico ou código(s) de polipeptídeo por meio do uso de um progra-ma de computador que identifica aspectos neste e identificação de aspectosdentro do(s) código(s) de ácido nucléico com o programa de computador.Em algumas modalidades, o programa de computador compreende um pro-grama de computador que identifica estrutura de leitura aberta. O métodopode ser realizado através de leitura de uma seqüência única ou pelo menos2, 5, 10, 15, 20, 25, 30, ou 40 ou mais das seqüências de ácido nucléico deacordo com a invenção e seqüências substancialmente idênticas a isso, ouas seqüências de polipeptídeo de acordo com a invenção e seqüênciassubstancialmente idênticas a isso, por meio do uso do programa de compu-tador e identificação de aspectos dentro dos códigos de ácido nucléico oucódigos de polipeptídeo com o programa de computador.
Uma seqüência de ácido nucléico de acordo com a invenção eseqüências substancialmente idênticas a isso, ou uma seqüência de polipep-tídeo de acordo com a invenção e seqüências substancialmente idênticas aisso, pode ser armazenada e manipulada em uma variedade de programasprocessadores de dados em uma variedade de formatos. Por exemplo, umaseqüência de ácido nucléico de acordo. com a invenção e seqüências subs-tancialmente idênticas a isso, ou uma seqüência de polipeptídeo de acordocom a invenção e seqüências substancialmente idênticas a isso, pode serarmazenada como texto em um arquivo de processamento de palavra, talcomo Microsoft WORD™ ou WORDPERFECT™ ou como um arquivo deASCII em uma variedade de programas de base de dados familiares àquelesde versatilidade na técnica, tal como DB2™, SYBASE™, ou ORACLE™.
Além disso, muitos programas de computador e bases de dados podem serutilizados como algoritmos de comparação de seqüência, identificadores, oufontes de seqüências de nucleotídeo ou seqüências de polipeptídeo de refe-rência para serem comparados a uma seqüência de ácido nucléico de acor-do com a invenção e seqüências substancialmente idênticas a isso, ou umaseqüência de polipeptídeo de acordo com a invenção e seqüências substan-cialmente idênticas a isso. A seguinte lista não-pretende limitar uma inven-ção mas para fornecer orientação para programas e bases de dados quesão úteis com as seqüências de ácido nucléico de acordo com a invenção eseqüências substancialmente idênticas a isso, ou as seqüências de polipep-tídeo de acordo com a invenção e seqüências substancialmente idênticas aisso. Os programas e bases de dados que podem ser utilizados incluem,mas não são limitados a:
MACPATTERN™ (EMBL)5 DISCOVERYBASE™ (Molecular ApplicationsGroup), GENEMINE™ (Molecular Applications Group), LOOK™ (MolecularApplications Group), MACLOOK™ (Molecular Applications Group), BLAST eBLAST2 (NCBI), BLASTN e BLASTX (Altschul e outros, J. MoL Biol. 215:403, 1990), FASTA (Pearson e Lipman, Proc. Natl. Acad. Sei. USA, 85:2444, 1988), FASTDB (Brutlag e outros Comp. App. Biosci. 6:237-245,1990), CATALYST™ (Molecular Simulations Inc.), Catalyst/SHAPE™ (Mole-cular Simulations Inc.), Cerius2. DB Access™ (Molecular Simulations Inc.),HYPOGEN™ (Molecular Simulations Inc.), INSIGHT II™, (Molecular Simula-tions Inc.), DISCOVER™ (Molecular Simulations Inc.), CHARMm™ (Molecu-lar Simulations Inc.), FELIX™ (Molecular Simulations Inc.), DELPHI™, {Mo-lecular Simulations Inc.), QuanteMM™, (Molecular Simulations Inc.), Homo-Iogy (Molecular Simulations Inc.), MODELER™ (Molecular Simulations Inc.),ISIS™ (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simu-lations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explo-rer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.),SeqFoId (Moleicular Simulations Inc.), a base de dados de Diretório de Pro-dutos Químicos Disponíveis por MDL, a base de dados de Relatório de Da-dos de Fármaco de MDL, a base de dados de Química Medicinal Global,base de dados de índice de Fármaco de Palavra de Derwents, a base dêdados deBioByteMasterFile, a base de dados de Genbank e a base de da-dos de Genseqn. Muitos outros programas e bases de dados seriam aparen-tes àquele de versatilidade na técnica dada a presente descrição.
Motivos que podem ser detectados utilizando-se os programasacima incluem seqüências codificando Ieucina zippers, motivos de hélice-turn-hélice, sítios de gíicosilação, sítios ubiquitinação, hélices alfa e folhasbeta, seqüências de sinal codificando peptídeos de sinal que direcionam asecreção das proteínas codificadas, seqüências implicadas em regulação detranscrição tal como homeocaixas, extensões acídicos, sítios ativos enzimá-ticos, sítios de ligação de substrato e enzimáticos sítios de clivagem.Hibridização de ácidos nucléicos
A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes que hibridizam sob condições rigorosas para uma seqüência deacordo com a invenção (tal como SEQ ID N0:1, SEQ ID N0:3, SEQ EDN0:5, SEQ ID N0:7, SEQ ID N0:9, SEQ ID N0:11, SEQ ID N0:13, SEQ IDN0:15, SEQ ID NO: 17, SEQ ID NO:19, SEQ ID N0:21, SEQ ID NO:23,SEQ ID NO:25, SEQ ID NO:275 SEQ ID NO:29, SEQ ID N0:31, SEQ IDNO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ JD N0:41, SEQID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID N0.-51,SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ IDN0:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQID N0:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79,SEQ ID N0:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ IDNO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQID.NO:99, SEQ ID NQ:101, SEQ ID NQ:103, SEQ ID NQ:105, SEQ IDΝ0:107, SEQ ED Ν0:109, SEQ ID Ν0:111, SEQ ID Ν0:113, SEQ IDΝ0:115, SEQ ID NOrI 17, SEQ ID Ν0:119, SEQ ID Ν0:121, SEQ IDΝΟ:123, SEQ ID ΝΟ:125, SEQ ID ΝΟ:127, SEQ ID ΝΟ:129, SEQ IDΝ0:131, SEQ ID ΝΟ:133, SEQ ID ΝΟ:135, SEQ ID ΝΟ:137, SEQ LDNO: 139, SEQ ED Ν0:141, SEQ ID ΝΟ:143, SEQ ID ΝΟ:145, SEQ IDNO: 147, SEQ ID ΝΟ:149, SEQ ID Ν0:151, SEQ ID ΝΟ:153, SEQ IDΝΟ:155, SEQ ED ΝΟ:157, SEQ ED ΝΟ:159, SEQ ID Ν0:161, SEQ IDNO: 163, SEQ ID ΝΟ:165, SEQ ID ΝΟ:167, SEQ ID ΝΟ:169, SEQ EDNO: 171, SEQ ID ΝΟ:173, SEQ ID ΝΟ:175, SEQ ED ΝΟ:177, SEQ EDΝΟ:179, SEQ ED Ν0:181, SEQ ID ΝΟ:183, SEQ ID NQ:185, SEQ IDΝΟ:187, SEQ ED ΝΟ:189, SEQ ED Ν0:191, SEQ DD ΝΟ:193, SEQ ID Ν0:195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID Ν0:201, SEQ ID Ν0:203,SEQ ID Ν0:205, SEQ ID Ν0:207, SEQ ID Ν0:209, SEQ BD Ν0:211, SEQID ΝΟ:213, SEQ DD ΝΟ:215, SEQ Η) ΝΟ:217, SEQ ID ΝΟ:219, SEQ IDΝΟ:221, SEQ ID ΝΟ:223, SEQ ID ΝΟ:225, SEQ ED ΝΟ:227, SEQ IDΝΟ:229, SEQ ID ΝΟ:231, SEQ ID ΝΟ:233, SEQ ID ΝΟ:235, SEQ IDΝΟ:237, SEQ ID ΝΟ:239, SEQ ID ΝΟ:241, SEQ ID ΝΟ:243, SEQ IDΝΟ:245, SEQ JD ΝΟ:247, SEQ ID ΝΟ:249, SEQ ID ΝΟ:251, SEQ BDΝΟ:253, SEQ BD Ν0.255, SEQ JD Ν0.257, SEQ ID ΝΟ:259, SEQ IDΝΟ:261, SEQ ID ΝΟ:263, SEQ ID ΝΟ:265, SEQ ID ΝΟ:267, SEQ IDΝΟ:269, SEQ ID ΝΟ:271, SEQ ID ΝΟ:273, SEQ ID ΝΟ:275, SEQ IDΝΟ:277, SEQ ID ΝΟ:279, SEQ ID ΝΟ:281, SEQ ID ΝΟ:283, SEQ IDΝΟ:285, SEQ ID ΝΟ:287, SEQ ID ΝΟ:289, SEQ ID ΝΟ:291, SEQ IDΝΟ:293, SEQ Η) ΝΟ:295, SEQ ED ΝΟ:2975 SEQ ID ΝΟ:299, SEQ IDΝ0:301, SEQ ID Ν0:303, SEQ ID NO:30S, SEQ ID Ν0:307, SEQ IDΝ0:309, SEQ ID ΝΟ:311, SEQ BD Ν0:313, SEQ ID ΝΟ:315, SEQ EDΝΟ:317, SEQ ID ΝΟ:319, SEQ ID ΝΟ:321, SEQ BD ΝΟ:323, SEQ IDΝΟ:325, SEQ ID ΝΟ:327, SEQ DD ΝΟ:329, SEQ ID ΝΟ:331, SEQ EDΝΟ:333, SEQ BD ΝΟ:335, SEQ ID ΝΟ:336, SEQ ID ΝΟ:337, ou SEQ EDΝΟ:338. As condições rigorosas podem ser condições altamente rigorosas,condições rigorosas médias e/ou condições rigorosas baixas, incluindo ascondições de rigor alto e reduzido descritas aqui. Em algumas modalidades,é o rigor das condições de lavagem que estabelece as condições que de-terminam se um ácido nucléico está dentro do escopo de acordo com a in-venção, tal como discutido abaixo.
"Hibridização" refere-se ao processo através do qual um filamen-to de ácido nucléico liga-se com um filamento complementar por meio depareamento de base. Reações de hibridização podem ser sensíveis e seleti-vas a fim de que uma seqüência particular de interesse possa ser identifica-da ainda em amostras em que ela esteja presente em concentrações baixas.
Condições adequadamente rigorosas podem ser definidas, por exemplo,pelas concentrações de sal ou formamida nas soluções de pré-hibridização ehibridização, ou pela temperatura de hibridização e são bem-conhecidas natécnica. Em outras modalidades, rigor pode ser aumentado através de redu-ção da concentração de sal, aumento da concentração de formamida, ouaumento da temperatura de hibridização. Em outras modalidades, ácidosnucléicos de acordo com a invenção são definidos através de sua capacida-de para hibridizar sob várias condições de rigor (tal como alto, médio, e bai-xo), tal como mencionado aqui.
Em algumas modalidades, hibridização sob condições de altorigor compreende cerca de 50% de formamida em cerca de 37°C a 42°C.
Em algumas modalidades, condições de hibridização compreendem condi-ções de rigor reduzido em cerca de 35% a 25% de formamida em cerca de30°C a 35°C. Em algumas modalidades, condições de hibridização compre-endem condições de alto rigor, tais como em 42°C em 50% de formamida,5X SSPE, 0,3% de SDS e 200 pg/ml de DNA de esperma de salmão subme-tido a cisalhamento e desnaturado. Em algumas modalidades, condições dehibridização compreendem estas condições de rigor reduzido, mas em 35%de formamida em uma temperatura reduzida de 35°C. A faixa de temperatu-ra correspondente a um nível particular de rigor pode ser também estreitadaatravés de cálculo da relação de purina para pirimidina do ácido nucléico deinteresse e ajuste da temperatura conseqüentemente. Variações nas faixase condições acima são bem-conhecidas na técnica.
Em outras modalidades, ácidos nucíéicos de acordo com a in-venção tal como definido através de sua capacidade para hibridizar sob con-dições rigorosas podem estar entre cerca de cinco resíduos e o comprimentototal de ácido nucléico de acordo com a invenção; tal como eles podem serpelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100,150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850,900, 950, 1000, ou mais, resíduos de comprimento. Ácidos nucléicos maiscurtos do que o comprimento total são também incluídos. Estes ácidos nu-cléicos podem ser úteis como, tais como sondas de hibridização, sondas derotulação, sondas de oligonucleoíídeo de PCR1 siRNA ou miRNA (de fila-menlo único ou duplo), anti-sentido ou seqüências codificando peptídeos deligação de anticorpo (epítopos), motivos, sítios ativos e similares.
Em algumas modalidades, ácidos nucléicos de acordo com ainvenção são definidos por sua capacidade para hibridizar sob condiçõesque compreende alto rigor de cerca de 50% de formamida em cerca de 37°Ca 42°C. Em algumas modalidades, ácidos nucléicos de acordo com a inven-ção são definidos por sua capacidade para hibridizar sob condições compre-endendo rigor reduzido em cerca de 35% a 25% de formamida em cerca de30°C a 35°C.
Alternativamente, ácidos nucléicos de acordo com a invençãosão definidos através de sua capacidade para hibridizar sob alto rigor com-preendendo condições em 42°C em 50% de formamida, 5X SSPE, 0,3% deSDS1 e um ácido nucléico de bloqueio de seqüência repetitiva, tal como cot-1 ou DNA de esperma de salmão (tal como 200 pg/ml de DNA de espermade salmão submetido a cisalhamento e desnaturado). Em algumas modali-dades, ácidos nucléicos de acordo com a invenção são definidos por suacapacidade para hibridizar sob condições de rigor reduzido compreendendo35% ou 40% de formamida em uma temperatura reduzida de 35°C ou 42°C.
Em reações de hibridização de ácido nucléico, as condições uti-lizadas para obter um nível particular de gravidade variarão, dependendo danatureza dos ácidos nucléicos que estão sendo hibridizados. Por exemplo, ocomprimento, do grau de complementaridade, composição de seqüência denucleotídeo (tal como teor de_ GC v. AT) e tipo de ácido nucléico (tal comoRNA ν. DNA) das regiões de hibridização dos ácidos nucléicos podem serconsiderados na seleção das condições de hibridização. Uma consideraçãoadicional é se um dos ácidos nucléicos é imobilizado, por exemplo, em umfiltro.
A hibridização pode ser realizada sob condições de baixa gravi-dade, gravidade moderada ou gravidade elevada. Como um exemplo de hi-bridização de ácidos nucléico, uma membrana polímera contendo ácidosnucléicos desnaturados imobilizados é primeiro pré-hibridizada durante 30minutos a 45°C em uma solução consistindo em 0,9 M de NaCI1 50 mM deNaH2PO4, pH 7,0, 5,0 mM de Na2EDTA, 0,5% de SDS, 10X de Denhardt1S e0,5 mg/ml de ácido poliriboadenílico. Aproximadamente 2 X de 107 cpm (ati-vidade específica 4-9 X 108 cpm/pg) de sonda de oligonucleotídeo rotuladana extremidade 32P são em seguida adicionados à solução. Após 12-16 ho-ras de incubação, a membrana foi lavada durante 30 minutos em temperatu-ra ambiente em IX SET (150 mM de NaCI5 20 mM de Tris cloridrato, pH 7,8,1 mM Na2EDTA) contendo 0,5% SDS, seguido por uma lavagem de 30 mi-nutos em IX SET fresco a Tm-10°C para a sonda de oligonucleotídeo. Amembrana é em seguida exposta à película auto-radiográfica para detecçãode sinais de hibridização. Todas as hibridizações anteriores seriam conside-radas serem sob condições de gravidade elevada.
Seguindo a hibridização, um filtro pode ser lavado para removerqualquer sonda detectável não especificamente ligada. A gravidade utilizadapara lavar os filtros pode ser variada dependendo da natureza dos ácidosnucléicos que estão sendo hibridizados, do comprimento dos ácidos nucléi-cos que estão sendo hibridizados, do grau de complementaridade, da com-posição de seqüência de nucleotídeo (tal como teor de GC v. AT) e do tipode ácido nucléico (tal como RNA v. DNA). Exemplos de lavagens de condi-ção de gravidade progressivamente maior são como segue: -2X SSC, 0,1%de SDS em temperatura ambiente durante 15 minutos (baixa gravidade);0,1 X SSC, 0,5% de SDS em temperatura ambiente durante 30 minutos a 1hora (gravidade moderada); 0,1 X SSC, 0,5% de SDS durante 15 a 30 minu-tos a entre a temperatura de hibridização e 68°C (gravidade elevada); e0,15Μ de NaCI durante 15 minutos a 72°C (gravidade muito elevada). Umalavagem de baixa gravidade final pode ser conduzida em 0,1 X SSC em tem-peratura ambiente. Os exemplos acima são meramente ilustrativos de umasérie de condições que podem ser utilizadas para lavar filtros. Alguém ver-sado na técnica saberia que existem numerosas receitas para diferentes la-vagens de gravidade. - alguns outros exemplos são fornecidos abaixo.
Em algumas modalidades, condições de hibridização compreen-dem uma etapa de lavagem compreendendo uma lavagem durante 30 minu-tos em temperatura ambiente em uma solução compreendendo 1X 150 mMde NaCI, 20 mM de Tris hidrocloreto, pH 7,8, 1 mM de Na2EDTA, 0,5% SDS,seguido por uma lavagem de 30 minutos em solução fresca.
Ácidos nucléicos que hibridizaram para a sonda são identifica-dos por auto radiografia ou outras técnicas convencionais. 3
Os procedimentos acima podem ser modificados para identificaros ácidos nucléicos tendo níveis diminuídos de identidade de seqüência(homologia) para a seqüência de sonda. Por exemplo, para obter ácidos nu-cléicos de identidade de seqüência diminuída (homologia) para a sonda de-tectável, condições menos severas podem ser usadas. Por exemplo, a tem-peratura de hibridização pode ser diminuída em incrementos de 5°C a partirde 68°C a 42°C em um tampão de hibridização tendo uma concentração Na+de aproximadamente IM. Seguindo a hibridização, o filtro pode ser lavadocom 2X SSC, 0,5% de SDS na temperatura de hibridização. Estas condiçõessão consideradas serem condições "moderadas" acima de 50°C e condições"baixas" abaixo de 508C. Um exemplo específico de condições de hibridiza-ção "moderadas" é quando a hibridização acima é conduzida a 55°C. Umexemplo específico de condições de "baixa gravidade" de hibridização équando a hibridização acima é conduzida a 45°C.
Alternativamente, a hibridização pode ser realizada em tampões,tal como 6X SSC, contendo formamida em uma temperatura de 42°C. Nestecaso, a concentração de formamida no tampão de hibridização pode ser re-duzida em 5% de incrementos de 50% a 0% para identificar clones tendoníveis diminuídos de homologia para a sonda. Seguindo a hibridização, ofiltro pode ser lavado com 6X SSC1 0,5% de SDS a 50gC. Estas condiçõessão consideradas serem condições "moderadas" acima de 25% de formami-da e condições "baixas" abaixo de 25% de formamida. Um exemplo especí-fico de condições de hibridização "moderada" é quando a hibridização acimaé conduzida em 30% de formamida. Um exemplo específico de "baixa gravi-dade" condições de hibridização é quando a hibridização acima é conduzidaem 10% de formamida.
Entretanto, a seleção de um formato de hibridização não podeser crítico - isto é a gravidade das condições de lavagem que mencionam ãscondições para determinar se um ácido nucléico inclui-se no escopo dé a-cordo com a invenção. Condições de lavagem utilizadas para identificar áci-dos nucléicos dentro do escopo de acordo com a invenção incluem, tais co-mo: uma concentração de cerca de 0,02 molar a pH 7 e uma temperatura dêpelo menos cerca de 50°C ou de cerca de 55°C a cerca de 60°C; ou, umaconcentração de cerca de 0,15 M de NaCI a 72°C a cerca de 15 minutos; ou,uma concentração de cerca de 0.2X SSC em uma temperatura de pelo me-nos cerca de 50°C ou de cerca de 55°C a cerca de 60°C acerca de 15 a cer-ca de 20 minutos; ou, o complexo de hibridização é lavado duas vezes comuma solução com uma concentração de cerca de 2X SSC contendo 0,1% deSDS em temperatura ambiente durante 15 minutos e em seguida lavada du-as vezes por 0.1 X SSC contendo 0,1% de SDS a 68°C durante 15 minutos;ou, condições equivalentes. Vide Sambrook ed., MOLECULAR CLONING: ALABORATORY MANUAL (29 edição), vols. 1-3, Cold Spring Harbor Labora-tory (1989), LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MO-LECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES,Part I. Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevier, Ν. Y.(1993) and Ausubel, ed. John Wiley & Sons, Inc., Nova Iorque (1997) parauma descrição de tampão SSC e condições equivalentes. Estes métodospodem ser utilizados para isolar ou identificar ácidos nucléicos de acordocom a invenção e seqüências substancialmente idênticas a eles. Por exem-plo, os métodos anteriores podem ser utilizados para isolar ou identificar áci-dos nucléicos tendo uma seqüência com pelo menos cerca de 50%, 51%,52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%,65%, 66%, 61%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%,78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%,91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais identidade deseqüência (homologia) para uma seqüência de ácido nucléico selecionadodo grupo consistindo em uma das seqüências de acordo com a invenção eseqüências substancialmente idênticas a ele, ou fragmentos compreendendopelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300,400, ou 500 bases consecutivas destes e as seqüências complementaresdestes. A identidade de seqüência (homologia) pode ser avaliada utilizandoo algoritmo de alinhamento. Por exemplo, os polinucleotídeos homólogospodem ter uma seqüência de código que é uma variante alélica de ocorrên-cia natural do uma das seqüências de código descrita aqui. Tais variantesalélicas podem ter uma substituição, deleção ou adição de um ou mais nu-cleotídeos quando comparados aos ácidos nucléicos de acordo com a in-venção. Adicionalmente, os procedimentos acima podem ser usados paraisolar os ácidos nucléicos que codificam polipeptídeos tendo pelo menoscerca de 99%, 95%, pelo menos 90%, pelo menos 85%, pelo menos 80%,pelo menos 75%, pelo menos 70%, pelo menos 65%, pelo menos 60%, pelomenos 55%, ou pelo menos 50% de identidade de seqüência (homologia)para um polipeptídeo de acordo com a invenção, ou fragmentos compreen-dendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoá-cidos consecutivos destes como determinado utilizando um algoritmo de ali-nhamento de seqüência (tal como the FASTA version 3.0t78 algorithm withthe default parameters).
Sondas de oligonucleotídeos e métodos para utilizá-los:
A invenção também fornece sondas de ácido nucléico que po-dem ser utilizadas, tal como para identificar, amplificar ou isolar ácidos nu-cléicos codificando um polipeptídeo tendo um aldolase, tal como piruvatoaldolase, tal como atividade de enzima HMG e/ou KHG aldolase ou fragmen-tos destes ou para identificar aldolase, tal como piruvato aldolase, tal comogenes, enzima HMG e/ou KHG aldolase. Em algumas modalidades, a sondacompreende pelo menos cerca de 10 bases consecutivas de um ácido nu-cléico de acordo com a invenção. Alternativamente, uma sonda de acordocom a invenção pode ser pelo menos cerca de 5, 6, 7, 8, 9, 10, 11, 12, 13,14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80,90, 100, 110, 120, 130, 150 ou de cerca de 10 a 50, cerca de 20 a 60 cercade 30 a 70, bases consecutivas de uma seqüência como mencionadas emum ácido nucléico de acordo com a invenção. As sondas identificam um áci-do nucléico por ligação e/ou hibridização. As sondas podem ser utilizadasem disposições de acordo com a invenção, vide a descrição acima, incluin-do, tal como disposições capilares. As sondas de acordo com a invençãopodem também ser utilizadas para isolar outros ácidos nucléicos ou polipep-tídeos.
Os ácidos nucléicos isolados, sintéticos ou recombinantes áci-dos nucléicos de acordo com a invenção, as seqüências complementaresdestes, ou um fragmento compreendendo pelo menos cerca de 10, 15, 20,25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 bases consecutivasde uma das seqüências de acordo com a invenção, ou as seqüências com-plementares destes podem ser utilizados como sondas para determinar seuma amostra biológica, tal como uma amostra de óleo, contém um organis-mo tendo uma seqüência de ácido nucléico de acordo com a invenção ouum organismo do qual o ácido nucléico foi obtido. Em tais procedimentos,uma amostra biológica potencialmente alojando o organismo do qual o ácidonucléico foi isolado é obtido e os ácidos nucléicos são obtidos a partir daamostra. Os ácidos nucléicos são contatados com a sonda sob condiçõesque permitem a sonda especificamente hibridizar para quaisquer seqüênciascomplementares as quais estão presentes aqui.
Onde necessário, as condições que permitem a sonda especifi-camente hibridizar para seqüências complementares podem ser determina-das colocando a sonda em contato com seqüências complementares deamostras conhecidas conter a seqüência complementar bem como seqüên-cias de controle que não contêm a seqüência complementar. Condições dehibridização, tais como a concentração de sal de um tampão de hibridização,a concentração de formamida de um tampão de hibridização, ou uma tempe-ratura de hibridização, podem ser variadas para identificar condições quepermitem a sonda hibridizar especificamente para ácidos nucléicos comple-mentares.
Se a amostra contiver o organismo do qual o ácido nucléico foiisolado, a hibridização específica da sonda é então detectada. A hibridizaçãopode ser detectada rotulando-se a sonda com um agente detectável tal co-mo isótopo radioativo, uma tintura fluorescente ou uma enzima capaz decatalisar a formação de um produto detectável.
Muitos métodos para usar as sondas rotuladas para detector apresença de ácidos nucléicos complementares em uma amostra são familia-res para aqueles versados na técnica. Estes incluem Southern Blots, Norternblot, procedimentos de hibridização de colônia e blots por ponto. Protocolospara cada um destes procedimentos são fornecidos em Ausubel e outro,Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1997) andSambrook e outro, Molecular Cloning: A Laboratory Manual 2ã Edição, ColdSpring Harbor Laboratory Press (1989).
Alternativamente, mais do que uma sonda (pelo menos uma dasquais seja capaz de hibridizar para quaisquer seqüências complementaresque estão presentes na amostra de ácidos nucléicos), podem ser utilizadasem uma reação de amplificação para determinar se a amostra contém umorganismo contendo uma seqüência de ácido nucléico de acordo com a in-venção (tal como um organismo do qual o ácido nucléico foi isolado). Emalgumas modalidades, as sondas compreendem oligonucleotídeos. Em al-gumas modalidades, a reação de amplificação pode compreender uma rea-ção PCR. Protocolos de PCR são descritos em Ausubel and Sambrook, su-pra. Alternativamente, a amplificação pode compreender uma reação de ca-deia de ligase, 3SR, ou uma reação de deslocamento. (Vide Barany, F., "TheLigase Chain Reaction in a PCR World", PCR Methods and Applications 1:5-16, 1991; E. Fahy e outro,, "Self-sustained Sequence Replication (3SR): AnIsothermal Transcription-based Amplification System Alternative to PCR",PCR Methods and Applications 1:25-33, 1991; and Walker G.T. e outro, nS-trand Displacement Amplification-an Isothermal in vitro DNA AmplificationTeehnique", Nueleic Acid Research 20:1691-1696, 1992). Em tais procedi-mentos, os ácidos nucléicos na amostra são contatados com as sondas, areação de amplificação é realizada e qualquer produto de amplificação é de-tectado. O produto de amplificação pode ser detectado realizando-se eletro-forese de gel nos produtos de reação e manchando o gel com um intercala-dor tal como brometo de etídio. Alternativamente, uma ou mais das sondaspodem ser rotuladas com um isótopo radioativo e a presença de um produtode amplificação radiativo pode ser detectada por auto-radiografia após ele-troforese de gel.
As sondas derivadas de seqüências perto das terminações dasseqüências de acordo com a invenção, podem também ser utilizadas emprocedimentos de caminhada de cromossoma para identificar clones tendoseqüências genômicas localizadas adjacentes às seqüências de acordo coma invenção. Tais métodos permitem o isolamento dos genes que codificamas proteínas adicionais do organismo hospedeiro.
Em algumas modalidades, os ácidos isolados, sintéticos ou re-combinantes de acordo com a invenção, as seqüências complementaresdestes, ou um fragmento compreendendo pelo menos 10, 15, 20, 25, 30, 35,40, 50, 75, 100, 150, 200, 300, 400, ou 500 ou mais bases consecutivas deuma das seqüências de acordo com a invenção, ou as seqüências comple-mentares destes são utilizados para identificar e isolar os ácidos nucléicos.Em algumas modalidades, os ácidos nucléicos relacionados podem ser cD-NAs ou DNAs genômicos de organismos diferentes daquele do qual o ácidonucléico foi isolado. Por exemplo, os outros organismos podem ser organis-mos relacionados. Em tais procedimentos, uma amostra de ácido nucléico écontatada com a sonda sob condições que permitem a sonda especifica-mente hibridizar para as seqüências relacionadas. A hibridização da sondapara ácidos nucléicos de organismos relacionados é então detectada utili-zando quaisquer dos métodos acima descritos.
Variando a gravidade das condições de hibridização utilizadaspara identificar ácidos nucléicos, tais como cDNAs ou DNAs genômicos, quehibridizam para a sonda detectável, ácidos nucléicos tendo diferentes níveisde homologia para a sonda podem ser identificados e isolados. A gravidadepode ser variada conduzindo a hibridização em temperaturas abaixo dastemperaturas de fusão das sondas. A temperatura de fusão, Tmi é a tempe-ratura (sob comprimento tônico definido e pH) em que 50% da seqüênciaalvo hibridiza para uma sonda perfeitamente complementar. Condições demuita resistência são selecionadas serem iguais a ou de cerca de 5°C menordo que Tm para a sonda particular. A temperatura de fusão da sonda podeser calculada utilizando as seguintes Fórmulas:
Para sondas entre 14 e 70 nucleotídeos em comprimento a tem-peratura de fusão (Tm) é calculada utilizando a Fórmula: Tm=81,5+16,6(log[Na+])+0.41 (fração G+C)-(600/N) em que N é o comprimento da sonda.
Se a hibridização for realizada em uma solução contendo for-mamida, a temperatura de fusão pode ser calculada utilizando a equação:Tm=81,5+16,6(log [Na+])+0,41 (fração G+C)-(0,63% de formamida)-(600/N)em que N é o comprimento da sonda.
Pré-hibridização pode ser realizada em 6X SSC, 5X de reagentede Denhardt1 0,5% de SDS, I00pg/ml de DNA de esperma de salmão defragmento desnaturado ou 6X SSC, 5X de reagente de Denhardt, 0,5% deSDS, lOOpg/ml de DNA de esperma de salmão de fragmento desnaturado,50% de formamida. As Fórmulas para soluções de Denhart e SSC são lista-das em Sambrook e outro, supra.
Em algumas modalidades, hibridização é conduzida adicionan-do-se a sonda detectável às soluções de pré-hibridização listadas acima.Onde a sonda compreende DNA de filamento duplo, ele é desnaturado antesda adição à solução de hibridização. Em algumas modalidades, o filtro écontatado com a solução de hibridização durante um período suficiente detempo para permitir a sonda hibridizar para cDNAs ou DNAs genômicos con-tendo seqüências complementares destes ou homólogos destes. Para son-das sobre 200 nucleotídeos em comprimento, a hibridização pode ser reali-zada a 15-25°C abaixo de Tm. Para sondas menores, tais como sonda deoligonucleotídeos, a hibridização pode ser conduzida a 5-100C abaixo de Tm.Em algumas modalidades, para hibridizações em 6X SSC, a hibridização éconduzida a aproximadamente 68°C. Geralmente, para hibridizações em50% de formamida contendo soluções, a hibridização é conduzida a aproxi-madamente 42°C.
Expressão de Inibição de Enzimas de Aldolase
A invenção fornece ácidos nucléicos complementares aos (talcomo seqüências anti-sentido aos) ácidos nucléicos de acordo com a inven-ção, tal como ácidos nucléicos codificando enzima de aldolase, tal como áci-dos nucléicos compreendendo ribozimas, anti-sentido, siRNA, miRNA. Áci-dos nucléicos de acordo com a invenção compreendendo seqüências anti-sentido podem ser capazes de inibir o transporte, ligação ou transcrição degenes codificando enzima de aldolase. A inibição pode ser realizada atravésde alvejamento de DNA genômico ou mensagem de RNA. A transcrição oufunção de ácido nucléico pode ser inibida, por exemplo, por hibridização e/ouclivagem. Um grupo exemplar de inibidores fornecido pela presente invençãoinclui oligonucleotídeos que são capazes de ligar aldolase, tal como piruvatoaldolase, tal como enzimas de aldolase HGM e/ou gene ou mensagem KHG,no caso de prevenção ou inibição de produção ou função de um aldolase, talcomo piruvato aldolase, enzimas de aldolase HGM e/ou KHG. A associaçãopode ser através da hibridização específica de seqüência. Outra classe útilde inibidores inclui oligonucleotídeos que causam a inativação ou clivagemde aldolase, tal como piruvato aldolase, tal como mensagem de enzimas dealdolase HGM e/ou KHG. O oligonucleotídeo pode ter a atividade de enzimaque causa tal clivagem, tal como ribozimas. O oligonucleotídeo pode serquimicamente modificado ou conjugado a uma enzima ou composição capazde clivar o ácido nucléico complementar. Um lago de muitos diferentes taisoligonucleotídeos pode ser analisado por aqueles com atividade desejada.
Desse modo, a invenção fornece várias composições para a inibição de al-dolase, tal como piruvato aldolase, tal como expressão de enzimas de aldo-lase HGM e/ou KHG sobre um nível de ácido nucléico e/ou proteína, tal co-mo anti-sentido, siRNA, miRNA e ribozimas compreendendo aldolase, talcomo piruvato aldolase, tal como seqüências de enzimas de aldolase HGMe/ou KHG de acordo com a invenção e o anti-aldolase, tal como anti-piruvatoaldolase, tal como anti- HMG e/ou anticorpos anti-KHG aldolase de acordocom a invenção. A inibição de aldolase, tal como piruvato aldolase, tal comoexpressão de enzimas de aldolase HGM e/ou KHG pode ter uma variedadede aplicações industriais. Por exemplo, inibição de aldolase, tal como piruva-to aldolase, tal como expressão de enzimas de aldolase HGM e/ou KHG po-de diminuir ou prevenir a deterioração. Em algumas modalidades, uso decomposições de acordo com a invenção que inibe a expressão e/ou ativida-de de aldolase, tal como piruvato aldolase, tal como HMG e/ou enzimas dealdolase KHG, tal como anticorpos, oligonucleotídeo anti-sentido, ribozimas,siRNA e miRNA são utilizados para diminuir ou prevenir a deterioração.Desse modo, em algumas modalidades, a invenção fornece métodos e com-posições compreendendo aplicação em uma planta ou produto de planta (talcomo um cereal, um grão, uma fruta, semente, raiz, folha, etc.) anticorpos,oligonucleotídeo anti-sentido, ribozimas, siRNA e miRNA de acordo com ainvenção para diminuir ou prevenir a deterioração. Estas composições tam-bém podem ser expressas pela planta (tal como uma planta transgênica) ououtro organismo (tal como uma bactéria ou outro microorganismo transfor-mado com um aldolase, tal como piruvato aldolase, gene de enzima de aldo-lase HGM e/ou KHG de acordo com a invenção).
As composições de acordo com a invenção para a inibição dealdolase, tal como piruvato aldolase, tal como expressão de enzimas de al-dolase HGM e/ou KHG (tal como anti-sentido, IRNA, ribozimas, anticorpos)podem ser utilizadas como composições farmacêuticas, tais como agentesanti-patógenos ou em outras terapias, tal como anti-microbianas para, talcomo Salmonella.
Oligonucleotídeo anti-sentido
A invenção fornece oligonucleotídeo anti-sentido capaz de ligaraldolase, tal como piruvato aldolase, tal como Mensagem de enzimas dealdolase HGM e/ou KHG que, em algumas modalidades, pode inibir aldola-se, tal como piruvato aldolase, tal como atividade de enzimas de aldolaseHGM e/ou KHG, alvejando mRNA. Estratégias para planejamento de oligo-nucleotídeo anti-sentido são bem descritas na literatura de patente e especí-fica, e o técnico versado pode planejar tal aldolase, tal como piruvato aldola-se, tal como oligonucleotídeos de enzimas de aldolase HGM e/ou KHG utili-zando os novos reagentes de acordo com a invenção. Por exemplo, protoco-Ios de caminhada de gene / mapeamento de RNA to screen for oligonucleo-tídeo anti-sentido eficaz são bem-conhecidos na técnica, vide Ho (2000) Me-thods Enzymol. 314:168-183, descrevendo um ensaio de mapeamento deRNA1 que é baseado em técnicas moleculares padrão para fornecer um mé-todo fácil e seguro para seleção de seqüência anti-sentido potente. Videtambém Smith (2000) Eur. J. Pharm. Sei. 11:191-198.
Ácidos nucléicos de ocorrência natural são utilizados como oli-gonucleotídeo anti-sentido. O oligonucleotídeo anti-sentido pode ser dequalquer comprimento; por exemplo, em outras modalidades, os oligonucleo-tídeos anti-sentido são de cerca de 5 a cerca de 100, cerca de 10 a cerca de80, cerca de 15 a cerca de 60, cerca de 18 a cerca de 40. O comprimentoideal pode ser determinado por varredura de rotina. O oligonucleotídeo anti-sentido pode estar presente em qualquer concentração. A concentração ide-al pode ser determinada por varredura de rotina. Uma ampla variedade denucleotídeo de ocorrência não natural, sintético e análogos de ácido nucléicpé conhecida o que pode causar este problema potencial. Por exemplo, áci-dos nucléicos de peptídeos (PNAs) contendo cadeias principais não iônicas,tais como unidades de N-(2-aminoetil) glicina podem ser utilizados. Oligonu-cleotídeo anti-sentido tendo ligações de fosforotioato pode também ser utili-zado, como descrito WO 97/03211; WO 96/39154; Mata (1997) Toxicol ApplPharmacol 144:189-197; Antisense Therapeutics, ed. Agrawal (HumanaPress, Totowa, N. J., 1996). Oligonucleotídeo anti-sentido tendo análogos decadeia principal de DNA sintética fornecido pela invenção pode também in-cluir ácidos nucléicos de carbamato de morfolino, fosforo-ditioato, metilfosfo-nato, fosforamidato, fosfotriéster de alquila, sulfamato, 3'-tioacetal, metile-no(metilimino), e 3'-N-carbamato como descrito acima.
Metodologia química combinatória pode ser utilizada para criarvastos números de oligonucleotídeos que podem ser rapidamente analisa-dos para olinucleotídeos específicos que têm afinidades e especificidades deligação apropriadas com respeito a qualquer alvo, tal como a aldolase senti-do ou anti-sentido, tal como piruvato aldolase, tal como seqüências de enzi-mas de aldolase HGM e/ou KHG de acordo com a invenção (Vide, Gold(1995) J. of Biol. Chem. 270:13581-13584).
Ribozimas Inibidoras
A invenção fornece ribozimas capazes de ligar aldolase, tal co-mo piruvato aldolase, tal como mensagem de enzimas de aldolase HGMe/ou KHG. Estas ribozimas podem inibir aldolase, tal como piruvato aldolase,tal como atividade de enzimas de aldolase HGM e/ou KHG, tal como alve-jando mRNA. Estratégias para planejar e selecionar a aldolase, tal como pi-ruvato aldolase, tal como seqüência anti-sentido específica de enzimas dealdolase HGM e/ou KHG para alvejamento são bem descritas na literaturade patente e específica, e o técnico versado pode planejar tais ribozimasutilizando os novos reagentes de acordo com a invenção. Ribozimas agemligante-se a um RNA alvo através de uma porção de ligação de RNA de umaque é segurada em proximidade íntima a uma porção enzimática do RNAque cliva o RNA alvo. Desse modo, a ribozima reconhece e liga um RNAalvo através de emparelhamento de base complementar, e uma vez ligadaao sítio correto, age enzimaticamente para clivar e inativar o RNA alvo. Aclivagem de RNA alvo em uma tal maneira destruirá sua capacidade de con-trolar a síntese de uma proteína codificada se a clivagem ocorrer na seqüên-cia de codificação. Após a ribozima ter ligado e clivado seu RNA alvo, elapode ser liberada daquele RNA para ligar e clivar novos alvos repetidamen-te.
Em algumas circunstâncias, a natureza enzimática de uma ribo-zima pode ser vantajosa sobre outras tecnologias, tais como tecnologia anti-sentido (onde uma molécula de ácido nucléico simplesmente Iiga--Se a umalvo de ácido nucléico para bloquear sua transcrição, translação ou associa-ção com outra molécula) como a concentração eficaz de ribozima necessáriapara realizar um tratamento terapêutico pode ser menor do que aquela deum olinucleotídeo anti-sentido. Esta vantagem potencial reflete a capacidadeda ribozima de agir enzimaticamente. Desse modo, uma molécula de ribozi-ma simples é capaz de clivar muitas moléculas de RNA alvo. Em algumasmodalidades, a ribozima é um inibidor altamente específico, com a especifi-cidade de inibição dependendo não apenas do mecanismo de emparelha-mento de base de ligação, mas também do mecanismo pelo qual a moléculainibe a expressão do RNA ao qual ele liga-se. Isto é, a inibição é causadapor clivagem do RNA alvo e assim a especificidade é definida como a taxade clivagem do RNA alvejado sobre a tava de clivagem do RNA em não al-vejado. Este mecanismo de clivagem é dependente de fatores adicionaisaqueles envolvidos no emparelhamento de base. Desse modo, a especifici-dade de ação de uma ribozima pode ser maior do que aquela de olifonucleo-tídeo anti-sentido Iigante o mesmo sítio de RNA.
A ribozima de acordo com a invenção, tal como uma moléculade RNA de ribozima enzimática, pode ser formada em um motiv (cabeça demartelo (hammerhead) motivo, um motivo de grampo ("hairpin motif"), comoum motivo de hepatite delta, um motivo íntron de grupo I e/ou RNA similar-mente a RNaseP em associação com uma seqüência de orientação de RNA.Exemplos de motivos hammerhead são descritos por, tal como Rossi (1992)Aids Research and Human Retroviruses 8:183; motivos de grampo de cabe-lo por Hampel (1989) Biochemistry 28:4929, e Hampel (1990) Nuc. AcidsRes. 18:299; O motivo hepatite delta vírus por Perrotta (1992) Biochemistry31:16; the RNaseP motivo by Guerrier-Takada (1983) Cell 35:849; e o íntornde grupo I por Cech Patente dos Estados Unidos No. 4.987.071. A descriçãodestes motivos específicos não se destina a ser limitante. Aqueles versadosna técnica reconhecerão que uma ribozima de acordo com a invenção, talcomo uma molécula de RNA enzimática desta invenção, pode ter um sítio deligação de substrato específico complementar a uma ou mais das regiões deRNA de gene alvo. A ribozima de acordo com a invenção tem uma seqüên-cia de nucleotídeo inclusa ou circundante aquele sítio de ligação de substra-to que confere uma atividade de clivagem de RNA à molécula.Interferência de RNA (RNAi)
Em algumas modalidades, a invenção fornece moléculas inibido-ras de RNA, assim chamadas moléculas "RNAi", compreendendo aldolase,tal como piruvato aldolase, seqüências de enzimas de aldolase HGM e/ouKHG de acordo com a invenção. A molécula de RNAi pode compreenderuma molécula de RNA de filamento duplo (dsRNA), tal como moléculas desiRNA, miRNA e/ou RNA de grampo de cabelo curto (shRNA). A moléculade RNAi, tal como siRNA (pequeno RNA inibidor) e/ou miRNA (micro RNA)rpode inibir a expressão de um aldolase, tal como piruvato aldolase, gene deenzima de aldolase HGM e/ou KHG. Em algumas modalidades, a moléculade RNAi, tal como siRNA e/ou miRNA, é de cerca de 11, 12, 13, 14, 15, 16,17, 18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou mais nucleotídeos dúplexno comprimento. Enquanto a invenção não estiver limitada por qualquer me-canismo particular de ação, o RNAi pode entrar em uma célula e causar adegradação de um RNA de filamento único (ssRNA) de seqüências similaresou idênticas, incluindo mRNAs endógenos. Quando uma célula é exposta aRNA de filamento duplo (dsRNA), o mRNA do gene homólogo é seletiva-mente degradado por um processo chamado de interferência de RNA(RNAi). Um possível mecanismo básico atrás do RNAi é o rompimento deum RNA de filamento duplo (dsRNA) adaptando uma seqüência de geneespecífica em pequenas partes chamadas de RNA de curta interferência,que dispara a degradação de mRNA que iguala sua seqüência. Em algumasmodalidades, os RNAi1S de acordo com a invenção são utilizados em tera-pêuticos de silenciamento de gene, vide Shuey (2002) Drug Discov. Today7:1040-1046. Em algumas modalidades, a invenção fornece métodos paraseletivamente degradar RNA utilizando moléculas de RNAi's, tais como siR-NA e/ou miRNA, de acordo com a invenção. O processo pode ser praticadoin vitro, ex vivo ou in vivo. Em algumas modalidades, as moléculas de RNAide acordo com a invenção podem ser utilizadas para gerar uma mutação deperda de função em uma células, um órgão ou um animal.
Em um aspecto, a introdução intracelular do RNAi é por interna-lização de um Iigante específico de célula alvo ligado a uma proteína de liga-ção de RNA compreendendo que um RNAi (tal como micro RNA) é absorvi-do. O Iigante é específico para um antígeno de superfície celular alvo única.O ligante pode ser espontaneamente internalizado após ligação ao antígenode superfície celular. Se o antígeno de superfície celular única não for natu-ralmente internalizado após ligação a seus ligante, a internalização pode serpromovida por incorporação de um peptídeo rico em arginina, ou outro pep-tídeo permeável à membrana, na estrutura do ligante ou proteína de ligaçãode RNA ou ligação de um tal peptídeo ao ligante ou proteína de ligação deRNA. Vide, Publicação de Pedido de Patente dos Estados Unidos Nes..20060030003; 20060025361; 20060019286; 20060019258. Em um escopo,a invenção fornece formulações com base em lipídeo para liberação, tal co-mo introduzindo ácidos nucléicos da invenção como partículas de ácido nu-cléico-lípídeo compreendendo uma molécula de RNAi a uma célula, vide, porexemplo, Publicação de Pedido de Patentes No. 20060008910.Modificação de Ácidos nucléicos — Fabricação de Enzimas Variantesda Invenção.
A invenção fornece métodos de geração de variantes dos ácidosnucléicos de acordo com a invenção, tal como aqueles codificando aldolase,tal como piruvato aldolase, enzimas de aldolase HGM e/ou KHG. Estes mé-todos podem ser repetidos ou utilizados em várias combinações para geraraldolase, tal como piruvato aldolase, tal como enzimas de aldolase HMGe/ou KHG tendo uma atividade alterada ou diferente ou uma estabilidadealterada ou diferente daquela de uma aldolase, enzima tal como piruvatoaldolase, HMG e/ou KHG aldolase codificada pelo ácido nucléico padrão.Estes métodos também podem ser repetidos ou usados em várias combina-ções, tal como para gerar variações em expressão de gene/ mensagem,translação de mensagem ou estabilidade de mensagem. Em outras modali-dades, a composição genética de uma célula é alterada através de, tal comomodificação de um gene homólogo ex vivo, seguido por sua re-inserção nacélula.
Um ácido nucléico de acordo com a invenção pode ser alteradopor quaisquer métodos. Por exemplo, métodos aleatórios ou estocásticos,ou, não-estocástico, ou métodos de "evolução direcionada", vide Patentedos Estados Unidos No. 6.361.974. Métodos para mutação aleatória de ge-nes são bem-conhecidos na técnica, vide Patente dos Estados Unidos No.5.830.696. Por exemplo, mutagênicos podem ser usados para mutar aleato-riamente um gene. Mutagênicos incluem, tal como luz ultravioleta ou irradia-ção gama, ou um mutagênico químico, tal como mitomicina, ácido nitroso,psoralens fotoativados, sozinhos ou em combinação, para induzir quebrasde DNA tratáveis a reparar-se por recombinação. Outros mutagênicos quí-micos incluem, por exemplo, bissulfeto de sódio, ácido nitroso, hidroxilaminã,hidrazina ou ácido fórmico. Outros mutagênicos são análogos de precurso-res de nucleotídeo, tal como nitrosoguanidina, 5-bromouracila, 2-aminopurina, ou acridina. Estes agentes podem ser adicionados a uma rea-ção de PCR no lugar do precursor de nucleotídeo desse modo mutandõ aseqüência. Agentes de intercalação tal como proflavina, acriflavina, quinacri-na e outros mais podem também ser usados.
Qualquer técnica em biologia molecular pode ser usada, tal co-mo mutagênese de PCR aleatória, vide Rice (1992) Proc. Natl. Acad. Sei.USA 89:5467-5471; ou, mutagênese de cassete múltiplo combinatório, videCrameri (1995) Biotechniques 18:194- 196. Alternativamente, ácidos nucléi-cos, tais como genes, podem ser reagrupados depois de fragmentação alea-tória, ou "estocástico", vide Patente dos Estados Unidos Nos. 6.291.242;6.287.862; 6.287.861; 5.955.358; 5.830.721; 5.824.514; 5.811.238;5.605.793. Em outras modalidades, modificações, adições ou deleções sãointroduzidas por PCR propensa a erro, rearranjo, mutagênese direcionada aoligonucleotídeo, PCR de montagem, mutagênese de PCR sexual, mutagê-nese in vivo, mutagênese de cassete, mutagênese de conjunto recursivo,mutagênese de conjunto exponencial, mutagênese específica por sítio, re-montagem de gene (tal como GeneRemontagem, vide Patente dos EstadosUnidos No. 6.537.776), Mutagênese de Saturação de Sítio de Gene (GSSM),remontagem de ligação sintética (SLR), recombinação, recombinação deseqüência recursiva, mutagênese de DNA modificado por fosfotioato, muta-gênese de padrão contendo uracila, mutagênese dupla intervalada, mutagê-nese de reparo de desequilíbrio pontual, mutagênese de cepa hospedeiradeficiente de reparo, mutagênese química, mutagênese radiogênica, muta-gênese de deleção, mutagênese de seleção de restrição, mutagênese depurificação de restrição, síntese de gene artificial, mutagênese de conjunto,criação de multímero de ácido nucléico quimérico, Mutagênese de SaturaçãoCromossômica (CSM) e/ou uma combinação destes e outros métodos.
As seguintes publicações descrevem uma variedade de proce-dimentos e/ou métodos de recombinação recursiva os quais podem ser in-corporados nos métodos de acordo com a invenção: Stemmer (1999) "Mole-cular breeding of viruses for targeting and other clinicai properties" TumorTargeting 4:1-4; Ness (1999) Nature Biotechnology 17:893-896; Chang(1999) "Evolution of a cytokine using DNA family shuffling" Nature Biotechno-Iogy 17:793-797; Minshull (1999) "Protein evolution by molecular breeding"Current Opinion in Chemical Biology 3:284-290; Christians (1999) "Directedevolution of thymidine kinase for AZT phosphorylation using DNA family shuf-fling" Nature Biotechnology 17:259-264; Crameri (1998) "DNA shuffling of afamily of genes from diverse species accelerates directed evolution" Nature391:288-291; Crameri (1997) "Molecular evolution of an arsenate detoxifica-tion pathway by DNA shuffling," Nature Biotechnology 15:436-438; Zhang(1997) "Directed evolution of an effective fucosidase from a galactosidase byDNA shuffling and screening" Proc. Natl. Acad. Sei. USA 94:4504-4509; Pat-ten e outros (1997) "Applications of DNA Shuffling to Pharmaceuticals andVaccines" Current Opinion in Biotechnology 8:724-733; Crameri e outros(1996) "Construction and evolution of antibody-phage Iibraries by DNA shuf-fling" Nature Medicine 2:100-103; Gates e outros (1996) "Affinity selectiveisolation of Iigands from peptide Iibraries through display on a Iac repressor'headpiece dimer1^ Journal of Molecular Biology 255:373-386; Stemmer(1996) "Sexual PCR and Assembly PCR" In: The Encyclopedia of MolecularBiology. VCH Publishers, New York, pp.447-457; Çrameri and Stemmer(1995) "Combinatorial multiple cassette mutagenesis creates ali the permuta-tions of mutant and tipo selvagem cassettes" BioTechniques 18:194-195;Stemmer e outros (1995) "Single-step assembly of a gene and entire plasmidform Iarge numbers of oligodeoxyribonucleotides" Gene, 164:49-53; Stem-mer (1995) "The Evolution of Molecular Computation" Science 270: 1510;Stemmer (1995) "Searching Sequence Space" Bio/Technology 13:549-553;Stemmer (1994) "Rapid evolution of a protein in vitro by DNA shuffling" Natu-re 370:389-391; and Stemmer (1994) "DNA shuffling by random fragmentati-on and reassembly: In vitro recombination for molecular evolution." Proc. Na-tl. Acad. Sei. USA 91 :10747-10751.
Métodos mutacionais de geração de diversidade incluem, porexemplo, mutagênese direcionada a sítio (Ling e outros (1997) "Approachèsto DNA mutagenesis: an overview" Anal Biochem. 254(2): 157-178; Dalé eoutros (1996) "Oligonucleotide-directed random mutagenesis using thephosphorothioate method" Methods Mol.-Biol. 57:369-374; Smith (1985) "Invitro mutagenesis" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985)"Strategies and applications of in vitro mutagenesis" Science 229:1193-1201;Carter (1986) "Site-directed mutagenesis" Biochem. J. 237:1-7; and Kunkel(1987) "The efficiency of oligonucleotide directed mutagenesis" in NucleicAcids & Molecular Biology (Eckstein, F. and Lilley, D. M. J. eds., SpringerVerlag, Berlin)); mutagênese usando padrões contendo uracila (Kunkel(1985) "Rapid and efficient site-specific mutagenesis without phenotypic se-lection" Proc. Natl. Acad. Sei. USA 82:488-492; Kunkel e outros (1987) "Ra-pid and efficient site-specific mutagenesis without phenotypic selection" Mfe-thods in Enzymol. 154, 367-382; and Bass e outros (1988) "Mutant Trp re-pressors with new DNA-binding specificities" Science 242:240-245); mutagê-nese direcionada a oligonucleotídeo (Methods in Enzymol. 100: 468-500(1983); Methods in Enzymol. 154: 329-350 (1987); Zoller (1982) "Oligonucle-otide-directed mutagenesis using M13- derived vectors: an efficient and ge-neral procedure for the produetion of point mutations in any DNA fragment"Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983) "Oligonucleotide-directed mutagenesis of DNA fragments cloned into Ml 3 vectors" Methods inEnzymol. 100:468-500; and Zoller (1987) Oligonucleotide-directed mutage-nesis: a simple method using two oligonucleotide primers and a single-stranded DNA template" Methods in Enzymol. 154:329-350); mutagênese deDNA modificado por fosforotioato (Taylor (1985) "The use of phosphorothioa-te-modified DNA in restriction Enzima reactions to prepare nicked DNA" Nu-cl. Acids Res. 13: 8749-8764; Taylor (1985) "The rapid generation of oligo-nucleotide-directed mutations at high frequency using phosphorothioate-modified DNA" Nucl. Acids Res. 13: 8765-8787 (1985); Nakamaye (1986)"lnhibition of restriction endonuclease Nci I cleavage by phosphorothioategroups and its application to oligonucleotide-directed mutagenesis" Nucl. A-cids Res. 14: 9679-9698; Sayers (1988) "Y-T Exonucleases in phosphorothi-oate· based oligonucleotide-directed mutagenesis" Nucl. Acids Res. 16:791-802; and Sayers e outros (1988) "Strand specific cleavage of phosphorothio-ate-containing DNA by reaction with restriction endonucleases in the presen-ce of ethidium bromide" Nucl. Acids Res. 16: 803-814); mutagênese usandoDNA duplo intervalado (Kramer e outros (1984) "The gapped duplex DNAapproach to oligonucleotide-directed mutation construction" Nucl. Acids Res.12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. "Oligonucleotide-directed construction of mutations via gapped dúplex DNA" 154:350-367;Kramer (1988) "Improved enzymatic in vitro reactions in the gapped dúplexDNA approach to oligonucleotide-directed construction of mutations" Nucl.Acids Res. 16: 7207; and Fritz (1988) "Oligonucleotide-directed constructionof mutations: a gapped dúplex DNA procedure without enzymatic reactions invitro" Nucl. Acids Res. 16: 6987-6999).
Protocolos adicionais que podem ser usados para praticar a in-venção incluem mutagênese de reparo de desequilíbrio pontual (Kramer(1984)"Point Mismatch Repair" Cell 38:879-887), usando cepas hospedeirasdeficientes de reparo (Carter e outros (1985) "Improved oligonucleotide site-directed mutagenesis using Ml 3 vectors" Nucl. Acids Res. 13: 4431-4443;and Carter (1987) "Improved oligonucleotide-directed mutagenesis usingM13 vectors" Methods in Enzymol. 154: 382-403), mutagênese de deleção(Eghtedarzadeh (1986) "Use of oligonucleotides to generate Iarge deletions"Nucl. Acids Res. 14: 5115), seleção de restrição e seleção de restrição epurificação de restrição (Wells e outros (1986) "Importance of hydrogen-bondformation in stabilizing the transition state of subtilisin" Phil. Trans. R. Soe.Lond. A 317: 415-423), mutagenêse por síntese de gene total (Nambiar eoutros (1984) "Total synthesis and cloning of a gene coding for the ribonu-clease S protein" Science 223: 1299-1301; Sakamar and Khorana (1988)"Total synthesis and expression of a gene for the a-subunit of bovine rod ou-ter segment guanine nucleotide- binding protein (transducin)" Nucl. AcidsRes. 14: 6361-6372; Wells e outros (1985) "Cassette mutagenesis: an effici-ent method for generation of multiple mutations at defined sites" Gene34:315-323; and Grundstrom e outros (1985) "Oligonucleotide-directed mu-tagenesis by microscale "shot-gun1 gene synthesis" Nucl. Acids Res. 13:3305-3316), reparo de quebra de filamento duplo (Mandecki (1986); Arnold(1993) "Protein engineering for unusual environments" Current Opinion inBiotechnology 4:450-455. "Oligonucleotide- directed double-strand break re-pair in plasmids of Eseherichia coli: a method for site- specific mutagenesis"Proc. Natl. Acad. Sei. USA, 83:7177-7181). Detalhes adicionais em muitosdos métodos acima podem ser encontrados em Métodos em EnzimologiaVolume 154, que também descreve controles úteis para problemas de diag-nóstico e solução de problemas com vários métodos de mutagênese.
Protocolos que podem ser usados para praticar a invenção sãodescritos, tais como em Patente dos Estados Unidos Nos. 5.605.793 paraStemmer (Feb. 25, 1997), "Methods for In Vitro Recombination;" Patente dosEstados Unidos ns 5.811.238 to Stemmer e outros (22 de setembro de 1998)"Methods for generating Polynucleotides having Desired Characteristics byIterative Selection and Recombination;" Patente dos Estados Unidos ns5,830,721 to Stemmer e outros (3 de novembro de 1998), "DNA Mutagene-sis by Random Fragmentation and Reassembly;" Patente dos Estados Uni-dos ng 5,834,252 to Stemmer, e outros (Nov. 10, 1998) "End-ComplementaryPolymerase Reaction;" Patente dos Estados Unidos n9 5,837,458 to Min-shull, e outros (17 de Nov. de 1998), "Methods and Compositions for Cellularand Metabolic Engineering;" WO 95/22625, Stemmer and Crameri, "Mutage-nesis by Random Fragmentation and Reassembly;" WO 96/33207 by Stem-mer and Lipschutz "End Complementary Polymerase Chain Reaction;" WO97/20078 by Stemmer and Crameri "Methods for generating Polynucleotideshaving Desired Characteristics by Iterative Selection and Recombination;"WO 97/35966 by Minshull and Stemmer, "Methods and Compositions forCellular and Metabolic Engineering;" WO 99/41402 by Punnonen e outros"Targeting of Genetic Vaeeine Veetors;" WO 99/41383 by Punnonen e outros"Antigen Library Immunization;" WO 99/41369 by Punnonen e outros "Gene-tic Vaeeine Veetor Engineering;" WO 99/41368 by Punnonen e outros "Opti-mization of Immunomodulatory Properties of Genetie Vaeeines;" EP 752008by Stemmer and Crameri, "DNA Mutagenesis by Random Fragmentation andReassembly;" EP 0932670 by Stemmer "Evolving Cellular DNA Uptake byReeursive Sequenee Reeombination;" WO 99/23107 by Stemmer e outros,"Modification of Virus Tropism and Host Range by Viral Genome Shuffling;"WO 99/21979 by Apt e outros, "Human Papillomavirus Veetors;" WO98/31837 by dei Cardayre e outros "Evolution of Whole Cells and Organismsby Reeursive Sequenee Reeombination;" WO 98/27230 by Patten andStemmer, "Methods and Compositions for Polipeptídeo Engineering;" WO98/27230 by Stemmer e outros, "Methods for Optimization of Gene Therapyby Reeursive Sequenee Shuffling and Selection," WO 00/00632, "Methodsfor generating Highly Diverse Libraries," WO 00/09679, "Methods for Obtai-ning in Vitro Reeombined Polynucleotide Sequenee Banks and Resulting Se-quences," WO 98/42832 by Arnold e outros, "Recombination of Polynucleoti-de Sequenees Using Random or Defined Primers," WO 99/29902 by Arnolde outros, "Method for Creating Polynucleotide and Polipeptídeo Sequences,"WO 98/41653 by Vind, "An in Vitro Method for Construetion of a DNA Li-brary," WO 98/41622 by Borehert e outros, "Method for Construeting a Li-brary Using DNA Shuffling," and WO 98/42727 by Pati and Zarling, "Sequen-ce Alterations using Homologous Recombination."
Protocolos que podem ser usados para praticar a invenção (for-necendo detalhes com respeito a vários métodos de geração de diversidade)são descritos, tais como em Pedido de Patente dos Estados Unidos No. deSérie (USSN) 09/407.800, "SHUFFLING OF CODON ALTERED GENES"por Patente e outros depositado em 28 de setembro de 1999; "EVOLUTIONOF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RE-COMBINATION" por dei Cardayre e outros, Patente dos Estados Unidos No.6.379.964; "OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBI-NATION" por Crameri e outros, Patente dos Estados Unidos Nos. 6.319.714;6.368.861; 6.376.246; 6.423.542; 6.426.224 e PCT/USOO/01203; "USE OFCODON- VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETICSHUFFLING" por Welch e outros, Patente dos Estados Unidos No.6.436.675; "METHODS FOR MAKING CARACTER STRINGS, POLYNU-CLEOTIDES & POLIPEPTÍDEOS HAVING DESIRED CHARACTERISTICS"por Selifonov e outros, depositado em 18 de janeiro de 2000,(PCT/USOO/01202) e, tais como "METHODS FOR MAKING CARACTERSTRINGS, POLYNUCLEOTIDES & POLIPEPTÍDEOS HAVING DESIREDCHARACTERISTICS" por Selifonov e outros, depositado em 18 de julho dê2000 (Estados Unidos No. de Série 09/618.579); "METHODS OF POPULA-TING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS"por Selifonov and Stemmer, depositado em 18 de janeiro de 2000(PCT/USOO/O1138); e "SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLA-TION" por Affholter, depositado em 6 de setembro de 2000 (Estados UnidosNo. de Série 09/656.549); e Patente dos Estados Unidos Nos. 6.177.263;6.153.410.
Métodos não estocástico ou "evolução direcionada" incluem, talcomo mutagênese de saturação, tal como Mutagênese de Saturação de Sí-tio de Gene (SSM de G nucléico), remontagem de ligação sintética (SLR), ouuma combinação destes são usados para modificar os ácidos nucléicos deacordo com a invenção para gerar aldolase, tal como piruvato aldolase, talcomo enzimas HMG e/ou KHG aldolase com propriedades novas ou altera-das (tais como atividade sob condições altamente acídicas ou alcalinas,temperaturas altas ou baixas, e outros mais). Polipeptídeos codificados pe-los ácidos nucléicos modificados podem ser analisados quanto a uma ativi-dade antes de teste quanto à formação ou clivagem de ligação de carbono-carbono ou outra atividade. Qualquer modalidade ou protocolo de teste podeser usado, tal como uso de uma plataforma de formação capilar. Vide Paten-te dos Estados Unidos Nos. 6.361.974; 6.280.926; 5.939.250.Mutagênese de Saturação de Sítio de Gene, ou, GSSMA invenção também fornece métodos para produção de enzimausando mutagênese de Saturação de Sítio de Gene, ou, GSSM1 tal comodescrito aqui, e também em Patente dos Estados Unidos Nos. 6.171.820 e6.579.258. Em algumas modalidades, iniciadores de códon contendo umaseqüência de N5N, G/T degenerada são usados para introduzir mutaçõespontuais em um polinucleotídeo, tal como uma aldolase, tal como enzimapiruvato aldolase, HMG e/ou KHG aldolase ou um anticorpo de acordo coma invenção, a fim de gerar uma série de polipeptídeos de progênie na qualuma faixa completa de substituições de aminoácido único é representada emcada posição de aminoácido, tal como um resíduo de aminoácido em umsítio ativo de enzima ou sítio de ligação de Iigante alvejado a ser modificada.Estes oligonucleotídeos podem compreender uma seqüência homóloga pri-mária contígua, uma seqüência de N,N,G/T degenerada, e, opcionalmente,uma segunda seqüência homóloga. Os produtos translacionais de progêniea jusante do uso de tais oligonucleotídeos incluem todas as mudanças deaminoácido possíveis em cada sítio de aminoácido ao longo do polipeptídeo,porque a degeneração da seqüência de N,N,G/T inclui códons para todos osaminoácidos. Em algumas modalidades, um tal oligonucleotídeo degene-rado (compreendido de, tal como um cassete de N,N,G/T degenerado) é u-sado para submissão de cada códon original em um padrão de polinucleotí-deo parental a uma faixa completa de substituições de códon. Em outrasmodalidades, pelo menos dois cassetes degenerados são usados — ou nomesmo oligonucleotídeo ou não, para submissão de pelo menos dois códonsoriginais em um padrão de polinucleotídeo parental a uma faixa completa desubstituições de códon. Por exemplo, mais do que uma seqüência deN,N,G/T pode estar contida em um oligonucleotídeo para introduzir muta-ções de aminoácido em mais do que um sítio. Esta pluralidade de seqüên-cias de N,N,G/T podem ser diretamente contíguas, ou separadas por uma oumais seqüência(s) de nucleotídeo adicionais. Em outras modalidades, oligo-nucleotídeos aproveitáveis para introdução de adições e deleções podemser usados ou sozinhos ou em combinação com os códons contendo umaseqüência de N,N,G/T, para introduzir qualquer combinação ou permutaçãode adições, deleções, e/ou substituições de aminoácido.
Em algumas modalidades, mutagênese simultânea de duas oumais posições de aminoácido contíguas é feita usando um oligonucleotídeoque contenha tripletos de N,N,G/T contíguos, isto é, uma seqüência de(N,N,G/T)n degenerada. Em outras modalidades, cassetes degeneradospossuindo menos degeneração do que a seqüência de N,N,G/T são usados.
Por exemplo, pode ser desejável em alguns exemplos usar (tal como em umoligonucleotídeo) uma seqüência de tripleto degenerada compreendida deapenas um N5 onde o referido N pode estar na primeira, segunda ou terceiraposição do tripleto. Quaisquer outras bases incluindo quaisquer combina-ções e permutações destas podem ser usadas nas duas posições restantesdo tripleto. Alternativamente, pode ser desejável em alguns exemplos usar(tal como em um oligo) uma seqüência de tripleto de N5N5N degenerada.
Em algumas modalidades, uso de tripletos degenerados (tal co-mo tripletos de N5N5 G/T) permite geração sistemática e fácil de uma faixacompleta de possíveis aminoácidos naturais (para um total de 20 aminoáci-dos) em cada e toda posição de aminoácido em um polipeptídeo (em outrasmodalidades, os métodos também incluem geração de menos do que todasas possíveis substituições por resíduo, ou códon, posição de aminoácido).
Por exemplo, para um polipeptídeo de aminoácido 100, 2000 espécies distin-tas (isto é, 20 possíveis aminoácidos por posição X 100 posições de amino-ácido) podem ser geradas. Por meio do uso de um oligonucleotídeo ou sériede oligonucleotídeos contendo um tripleto de N,N,G/T degenerado, 32 se-qüências individuais podem codificar todos os 20 possíveis aminoácidos na-turais. Deste modo, em um vaso de reação no qual uma seqüência de poli-nucleotídeo parental é submetida à mutagênese de saturação usando pelomenos um tal oligonucleotídeo, nesse sentido são gerados 32 polinucleotí-deos de progênie distintos codificando 20 polipeptídeos distintos. Em con-traste, o uso de um oligonucleotídeo não degenerado em mutagênese dire-cionada a sítio resulta em apenas um produto de polipeptídeo de progêniepor vaso de reação. Oligonucleotídeos não degenerados podem opcional-mente ser usados em combinação com iniciadores degenerados descritos;por exemplo, oligonucleotídeos não degenerados podem ser usados paragerar mutações pontuais específicas em uma preparação de polinucleotídeo.Isto fornece um mecanismo para gerar mutações pontuais silenciosas espe-cíficas, mutações pontuais resultando em mudanças de aminoácido corres-pondentes, e mutações pontuais que causam a geração de códons de inter-rupção e a correspondente expressão de fragmentos de polipeptídeo.
Em algumas modalidades, cada vaso de reação de mutagênesede saturação contém poünucleotídeos codificando pelo menos 20 moléculasde polipeptídeo de progênie (tal como aldolase, tal como piruvato aldolase,tal como enzimas de HMG e/ou KHG aldolase) de modo que todos os 20aminoácidos naturais sejam representados naquela posição de aminoácidoespecífica correspondente à posição de códon mutagenizada no polinucleo-tídeo parental (outras modalidades usam menos do que todas as 20 combi-nações naturais). Os polipeptídeos de progênie degenerados 32 vezes gera-dos de cada vaso de reação de mutagênese de saturação podem ser sub-metidos à amplificação clonal (tais como clonados em um hospedeiro ade-quado, tal como hospedeiro de E. coli, usando, tal como um vetor de expres-são) e submetidos à varredura de expressão. Quando um polipeptídeo deprogênie individual é identificado através de varredura para exibir uma mu-dança favorável na propriedade (quando comparado ao polipeptídeo paren-tal, tal como atividade de formação ou clivagem de carbono-carbono aumen-tada sob condições alcalinas ou acídicas), ele pode ser seqüenciado paraidentificar a substituição de aminoácido correspondentemente favorável con-tida aqui.
Em algumas modalidades, na mutagenização de cada e todaposição de aminoácido em um polipeptídeo parental usando mutagênese desaturação tal como descrito aqui, mudanças de aminoácido favoráveis po-dem ser identificadas em mais do que uma posição de aminoácido. Uma oumais novas moléculas de progênie podem ser geradas que contenham umacombinação de todas ou parte destas substituições de aminoácido favorá-veis. Por exemplo, se 2 mudanças de aminoácido favoráveis específicas sãoidentificadas em cada uma de 3 posições de aminoácido em um polipeptí-deo, as permutações incluem 3 possibilidades em cada posição (nenhumamudança do aminoácido original, e cada uma das duas mudanças favorá-veis) e 3 posições. Deste modo, há 3 χ 3 χ 3 ou 27 possibilidades totais, in-cluindo 7 que foram previamente examinadas - 6 mutações pontuais únicas(isto é, 2 em cada uma das três posições) e nenhuma mudança em qualquerposição.
Em ainda outra modalidade, mutagênese de saturação de sítiopode ser usada junta com rearranjo, quimerização, recombinação e outrosprocessos de mutagenização, junto com varredura. Esta invenção fornece ouso de qualquer processo(s) de mutagenização, incluindo mutagênese desaturação, de uma maneira iterativa. Em uma exemplificação, o uso iterativode qualquer processo(s) de mutagenização é usado em combinação comvarredura.
A invenção também fornece o uso de iniciadores de códon pro-prietários (contendo uma seqüência de Ν,Ν,Ν degenerada) para introduzirmutações pontuais em um polinucleotídeo, a fim de gerar uma série de poll·peptídeos de progênie em que uma faixa completa de substituições de ami-noácido únicas é representada em cada posição de aminoácido (Mutagêne-se de Saturação de Sítio de ( GeneGSSM)). Os oligos usados são compre-endidos contiguamente de uma primeira seqüência homóloga, uma seqüên-cia de Ν,Ν,Ν degenerada e, em algumas modalidades mas não necessaria-mente, uma segunda seqüência homóloga. Os produtos translacionais deprogênie a jusante do uso de oligos de tais incluem todas as possíveis mu-danças de aminoácido em cada sítio de aminoácido ao longo do polipeptí-deo, porque a degeneração da seqüência de Ν,Ν,Ν inclui códons para todosos 20 aminoácidos.
Em algumas modalidades, um tal oligo degenerado (compreen-dido de um cassete de N5N5N degenerado) é usado para submissão de cadacódon original em um padrão de polinucleotídeo parental a uma faixa com-pleta de substituições de códon. Em outras modalidades, pelo menos doisdegenerada Ν,Ν,Ν cassetes são usados — ou no mesmo oligo ou não, parasubmissão pelo menos dois original códons em um padrão de polinucleotí-deo parental a uma faixa completa de substituições de códon. Deste modo,mais do que uma seqüência de N1N1N pode estar contida em um oligo paraintroduzir mutações de aminoácido em mais do que um sítio. Esta pluralida-de de seqüências de N1N1N pode ser diretamente contígua, ou separada poruma ou mais seqüência(s) de nucleotídeo adicionais. Em outras modalida-des, oligos aproveitáveis para introdução de adições e deleções podem serusados ou sozinhos ou em combinação com os códons contendo uma se-qüência de Ν,Ν,Ν, para introduzir qualquer combinação ou permutação deadições, deleções e/ou substituições de aminoácido.
Em algumas modalidades, é possível mutagenizar simultanea-mente duas ou mais posições de aminoácido contíguas usando um oligo quecontenha tripletos de Ν,Ν,Ν contíguos, isto é, uma seqüência de (N,N,N)ndegenerada. Em outras modalidades, a presente invenção fornece o uso decassetes degenerados possuindo menos degeneração do que a seqüênciade N5N5N. Por exemplo, pode ser desejável em alguns exemplos usar (talcomo em um oligo) uma seqüência de tripleto degenerada compreendida deapenas um N1 onde o N pode estar na primeira segunda ou terceira posiçãodo tripleto. Quaisquer outras bases incluindo quaisquer combinações e per-mutações destas podem ser usadas nas duas posições restantes do tripleto.Alternativamente, pode ser desejável em alguns exemplos usar (tal como emum oligo) uma seqüência de tripleto de Ν,Ν,Ν degenerada, N,N,G/T, ou umaseqüência de tripleto de N,N, G/C.
Em algumas modalidades, uso de um tripleto degenerado (talcomo N,N,G/T ou uma seqüência de tripleto de N,N, G/C) é vantajoso pordiversas razões. Em algumas modalidades, esta invenção fornece mecanis-mo para facilmente gerar sistematicamente e razoavelmente a substituiçãoda faixa completa de possíveis aminoácidos (para um total de 20 aminoáci-dos) em cada e toda posição de aminoácido em um polipeptídeo. Deste mo-do, para um polipeptídeo de aminoácido 100, a invenção fornece modos pa-ra facilmente gerar sistematicamente e razoavelmente 2000 espécies distin-tas (isto é, 20 possíveis aminoácidos por posição vezes 100 posições deaminoácido). É observado que nesse sentido é fornecido, por meio do usode um oligo contendo uma seqüência de tripleto de N,N,G/T degenerada ouuma de N5N, G/C, 32 seqüências individuais que codificam 20 aminoácidospossíveis. Deste modo, em um vaso de reação no qual uma seqüência depolinucleotídeo parentaí é submetida à mutagênese de saturação usando umtal oligo, nesse ponto são geradas 32 polinucleotídeos de progênie distintoscodificando 20 polipeptídeos distintos. Em contraste, o uso de um oligo nãodegenerado em mutagênese direcionada a sítio resulta em apenas um pro-duto de polipeptídeo de progênie por vaso de reação.
Esta invenção também fornece o uso de oligos não degenera-dos, que podem opcionalmente ser usados em combinação com iniciadoresdegenerados descritos. É observado que em algumas situações, é vantajosousar oligos não degenerados para gerar mutações pontuais específicas emuma preparação de polinucleotídeo. Isto fornece mecanismo para gerar mu-tações pontuais silenciosas específicas, mutações pontuais resultando emcorrespondentes mudanças de aminoácido e mutações pontuais que cau-sam a geração de códons de interrupção e a correspondente expressão defragmentos de polipeptídeo.
Deste modo, em algumas modalidades desta invenção, cadavaso de reação de mutagênese de saturação contém polinucleotídeos codifi-cando pelo menos 20 moléculas de polipeptídeo de progênie de modo quetodos os 20 aminoácidos sejam representados naquela posição específicade aminoácido correspondente à posição de códon mutagenizado no polinu-cleotídeo parental. Os polipeptídeos de progênie degenerados de 32 vezesgerados de cada vaso de reação de mutagênese de saturação podem sersubmetidos à amplificação clonal (tal como clonados em um hospedeiro deE. coli adequado usando um vetor de expressão) e submetidos à varredurade expressão. Quando um polipeptídeo de progênie individual é identificadoatravés de varredura para exibir uma mudança favorável na propriedade(quando comparado ao polipeptídeo parental), ele pode ser seqüenciadopara identificar a substituição correspondentemente favorável de aminoácidocontido aqui.
Em algumas modalidades, na mutagenização de cada e todaposição de aminoácido em um polipeptídeo parental usando mutagênese desaturação tal como descrito aqui, mudanças de aminoácido favoráveis sãoidentificadas em mais do que uma posição de aminoácido. Uma ou mais no-vas moléculas de progênie podem ser geradas que contenham uma combi-nação de todas ou parte destas substituições de aminoácido favoráveis. Porexemplo, se 2 mudanças favoráveis específicas de aminoácido são identifi-cadas em cada uma das 3 posições de aminoácido em um polipeptídeo, aspermutações incluem 3 possibilidades em cada posição (nenhuma mudançado aminoácido original e cada uma das duas mudanças favoráveis) e 3 posi-ções. Deste modo, há 3 χ 3 χ 3 ou 27 possibilidades totais, incluindo 7 queforam previamente examinadas - 6 mutações pontuais únicas (isto é, 2 emcada uma das três posições) e nenhuma mudança em qualquer posição.
A invenção fornece o uso de mutagênese de saturação em com-binação com processos de mutagenização adicionais, tal como processoonde dois ou mais polinucleotídeos relacionados são introduzidos em umacélula hospedeira adequada de modo que um polinucleotídeo híbrido é ge-rado através de recombinação e reclassificação redutiva.
Além de execução de mutagênese ao longo da seqüência inteirade um gene, a presente invenção provê que mutagênese possa ser usadapara substituir cada um de qualquer número de bases em uma seqüência depolinucleotídeo, em que o número de bases a ser mutagenizado é, em al-gumas modalidades todo número inteiro de 15 a 100.000. Deste modo, nolugar de mutagenização de toda posição ao longo de uma molécula, alguémpode submetir todo ou um número distinto de bases (em algumas modalida-des um subgrupo totalizando de 15 a 100.000) à mutagênese. Em algumasmodalidades, um nucleotídeo separado é usado para mutagenização de ca-da posição ou grupo de posições ao longo de uma seqüência de polinucleo-tídeo. Um grupo de 3 posições a ser mutagenizado pode ser um códon. Asmutações podem ser introduzidas usando um iniciador mutagênico, conten-do um cassete heterólogo, também referido como um cassete mutagênico.Cassetes exemplares podem possuir de 1 a 500 bases. Cada posição denucleotídeo em tais cassetes heterólogos são N, A, C, G, T, AJC, AJG, AJT,C/G, CfT, Gπ, C/GÍT, A/G/T, A/C/T, A/C/G, ou E5 onde E é qualquer baseque não seja A, C, G, ou T (E pode ser referido como um oligo de desenho).
Em algumas modalidades, mutagênese de saturação é compre-endida de mutagenização de uma série completa de cassetes mutagênicos(em que cada cassete é, em algumas modalidades, cerca de 1 a 500 basesde comprimento) em seqüência definida de polinucleotídeo a ser mutageni-zada (em que a seqüência a ser mutagenizada é, em algumas modalidades,de cerca de 15 a 100.000 bases de comprimento). Deste modo, um grupo demutações (variando de 1 a 100 mutações) é introduzido em cada cassete aser mutagenizado. Um agrupamento de mutações a ser introduzido em umcassete pode ser diferente ou o mesmo de um segundo agrupamento demutações a ser introduzido em um segundo cassete durante a aplicação deum rodada de mutagênese de saturação. Tais agrupamentos são exemplifi-cados através de deleções, adições, agrupamentos de códons particulares eagrupamentos de cassetes de nucleotídeo particulares.
Em algumas modalidades, seqüências definidas a serem muta-genizadas incluem um gene inteiro, trilha, cDNA, uma estrutura de leituraaberta (ORF) inteira e promotor inteiro, realçador, repressor/transativador,origem de replicação, íntron, operador, ou qualquer grupo funcional de poli-nucleotídeo. Geralmente, uma "seqüência definida" para este propósito podeser qualquer polinucleotídeo que uma seqüência de base 15 de polinucleotí-deo e seqüências de polinucleotídeo de comprimentos entre 15 bases e15.000 bases (esta invenção especificamente indica todo número inteiro en-tre). Considerações na escolha de agrupamentos de códons incluem tiposde aminoácidos codificados por um cassete mutagênico degenerado.
Em algumas modalidades, um grupo de mutações que pode serintroduzido em um cassete mutagênico, esta invenção especificamente for-nece substituições degeneradas de códon (usando oligos degenerados) quecodificam 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 e 20 ami-noácidos em cada posição e uma biblioteca de polipeptídeos codificada des-se modo.
Remontagem de Ligação Sintética (SLR)A invenção fornece um sistema de modificação de gene não-estocástico chamado "remontagem de ligação sintética," ou simplesmente"SLR5", um "processo de evolução direcionada" para gerar polipeptídeos,tais como aldolase, tal como piruvato aldolase, tal como enzimas de HMGe/ou KHG aldolase ou anticorpos de acordo com a invenção, com proprieda-des novas ou alteradas.
SLR é um método de ligação de fragmentos de oligonucleotídeoentre si não estocasticamente. Este método difere de rearranjo de oligonu-cleotídeo estocástico em que os blocos de constructo de ácido nucléico nãosão rearranjados, concatenados ou quimerizados aleatoriamente, mas depreferência são agrupados não-estocásticoally. Vide Patente dos EstadosUnidos Nos. 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449;6.537.776. Em algumas modalidades, SLR compreende as seguintes eta-pas: (a) fornecimento de um polinucleotídeo padrão, em que o polinucleotí-deo padrão compreende seqüência codificando um gene homólogo; (b) for-necimento de uma pluralidade de polinucleotídeos de bloco de constructo,em que os polinucleotídeos de bloco de constructo são projetados para ocruzamento reagrupar-se com o polinucleotídeo padrão em uma seqüênciapredeterminada, e um polinucleotídeo de bloco de constructo compreendeuma seqüência que é uma variante do gene homólogo e uma seqüênciahomóloga ao polinucleotídeo padrão flanqueando a seqüência variante; (c)combinação de um polinucleotídeo de bloco de constructo com um polinu-cleotídeo padrão de modo que o cruzamento de polinucleotídeo de bloco deconstructo reagrupe-se com o polinucleotídeo padrão para gerar polinucleo-tídeos compreendendo variações de seqüência de gene homólogo.
SLR não depende da presença de altos níveis de homologia en-tre polinucleotídeos a serem recombinados. Deste modo, este método podeser usado para gerar não-estocásticoally bibliotecas (ou grupos) de molécu-las de progênie compreendidas de mais de 10100 quimeras diferentes. SLRpode ser usada para gerar bibliotecas compreendidas de mais de ίο1000quimeras de progênie diferentes. Deste modo, modalidades da presente in-venção incluem métodos não-estocástico de produção de uma série de mo-lécula de ácido nucléico quimérica finalizada aparando uma ordem de mon-tagem total que é escolhida por desenho. Este método inclui as etapas degeração por desenho de uma pluralidade de blocos de constructo de ácidonucléico específicos possuindo extremidades ligáveis mutuamente compatí-veis aproveitáveis, e montagem destes blocos de constructo de ácido nucléi-co, de modo que uma ordem de montagem total projetada seja alcançada.
As extremidades ligáveis mutuamente compatíveis dos blocosde constructo de ácido nucléico a serem agrupados são consideradas serem"aproveitáveis" para este tipo de montagem ordenada se elas permitirem osblocos de constructo serem acoplados em ordens predeterminadas. Destemodo, a ordem de montagem total na qual os blocos de constructo de ácidonucléico podem ser acoplados é especificada pelo desenho das extremida-des ligáveis. Se mais do que uma etapa de montagem deve ser usada, en-tão a ordem de montagem total na qual os blocos de constructo de ácidonucléico podem ser acoplados é também especificada pela ordem seqüenci-al da etapa de montagem(ns). Em algumas modalidades, as peças de cons-tructo aneladas são tratadas com uma enzima, tal como uma Iigase (tal co-mo DNA Iigase de T4), para obter ligação covalente das peças de constructo.
Em algumas modalidades, o desenho dos blocos de constructode oligonucleotídeo é obtido através de varredura de uma série de padrõesde seqüência de ácido nucléico progenitores que servem como uma par debasea produção de uma série de progênie de polinucleotídeos quiméricosfinalizados. Estes padrões de oligonucleotídeos parentais deste modo ser-vem como uma fonte de informação de seqüência que auxilia no desenhodos blocos de constructo de ácido nucléico que devem ser mutagenizados,tal como quimerizados ou rearranjados. Em algumas modalidades deste mé-todo, as seqüências de uma pluralidade de padrões de ácido nucléico paren-tal são alinhadas a fim de selecionar um ou mais pontos de demarcação. Ospontos de demarcação podem ser localizados em uma área de homologia, esão compreendidos de um ou mais nucleotídeos. Estes pontos de demarca-ção são, em algumas modalidades, compartilhados por pelo menos dois dospadrões progenitores. Os pontos de demarcação podem desse modo serusados para delinear os limites de blocos de constructo de oligonucleotídeoa serem gerados a fim de recombinar os polinucleotídeos parentais. Os pon-tos de demarcação identificados e selecionados nas moléculas progenitorasservem como pontos de quimerização potenciais na montagem das molécu-las de progênie quiméricas finais. Um ponto de demarcação pode ser umaárea de homologia (compreendida de pelo menos uma base de nucleotídeohomóloga) compartilhada por pelo menos duas seqüências de polinucleotí-deo parentais. Alternativamente, um ponto de demarcação pode ser umaárea de homologia que é compartilhada por pelo menos metade das se-qüências de polinucleotídeo parental, ou, ele pode ser uma área de homolo-gia que é compartilhada por pelo menos dois terços das seqüências de poli-nucleotídeo parental. Ainda mais, em algumas modalidades, uns pontos dedemarcação aproveitáveis são uma área de homologia que é compartilhadapor pelo menos três quartos das seqüências de polinucleotídeo parental, ou,eles podem ser compartilhados por quase a totalidade das seqüências depolinucleotídeo parental. Em algumas modalidades, um ponto de demarca-ção é uma área de homologia que é compartilhada pela totalidade das se-qüências de polinucleotídeo parental.
Em algumas modalidades, um processo de remontagem de liga-ção é desempenhado exaustivamente a fim de gerar uma biblioteca exausti-va de polinucleotídeos quiméricos de progênie. Em outras palavras, todas ascombinações ordenadas possíveis dos blocos de constructo de ácido nucléi-co são representadas na série de moléculas de ácido nucléico quiméricasfinalizadas. Ao mesmo tempo, em outras modalidades, a ordem de monta-gem (isto é, a ordem de montagem de cada bloco de constructo na seqüên-cia 5' a 3 de cada ácido nucléico quimérico finalizado) em cada combinaçãoé por desenho (ou não-estocástica) tal como descrito acima. Por causa danatureza não-estocástico desta invenção, a possibilidade de produtos se-cundários indesejáveis é grandemente reduzida.
Em outras modalidades, o método de remontagem de ligação édesempenhado sistematicamente. Por exemplo, o método é desempenhadoa fim de gerar uma biblioteca sistematicamente compartimentalizada de mo-léculas de progênie, com compartimentos que podem ser analisados siste-maticamente, tal como um por um. Em outras palavras esta invenção forne-ce, por meio do uso seletivo e judicioso de blocos de constructo de ácidonucléico específicos, acoplados com o uso seletivo e judicioso de reações demontagem seqüencialmente escalonadas, um desenho pode ser alcançadoonde grupos específicos de produtos de progênie são produzidos em cadaum dos diversos vasos de reação. Isto permite um procedimento de exame evarredura sistemático ser desempenhado. Deste modo, estes métodos per-mitem um número potencialmente muito grande de moléculas de progênieser examinado sistematicamente em grupos menores. Por causa de sua ca-pacidade para desempenhar quimerizações de uma maneira que seja alta-mente flexível, ainda exhaustive e sistemática também, particularmentequando há um baixo nível de homologia entre as moléculas, estes métodosfornecem a geração de uma biblioteca (ou série) compreendida de um gran-de número de moléculas de progênie. Por causa da natureza não-estocástico da presente invenção de remontagem de ligação, as moléculasde progênie geradas em algumas modalidades compreendem uma bibliotecade moléculas de ácido nucléico quiméricas finalizadas possuindo uma ordemde montagem total que é escolhida por desenho. Os métodos de mutagêne-se de saturação e evolução direcionada otimizada também podem ser usa-dos para gerar espécies moleculares de progênie diferentes. É observadoque a invenção fornece liberdade de escolha e controle com respeito à sele-ção de pontos de demarcação, ao tamanho e número dos blocos de cons-tructo de ácido nucléico, e ao tamanho e desenho dos acoplamentos. É ob-servado, além disso, que o requerimento para homologia intermolecular éaltamente afrouxado para a operabilidade desta invenção. De fato, pontos dedemarcação podem ainda ser escolhidos em áreas de pouca ou nenhumahomologia intermolecular. Por exemplo, por causa da oscilação de códon,isto é, a degeneração de códons, substituições de nucleotídeo podem serintroduzidas em blocos de constructo de ácido nucléico sem alteração doaminoácido originalmente codificado no padrão correspondente. Alternati-vãmente, um códon pode ser alterado de modo que a codificação de um a-minoácido originalmente seja alterada. Esta invenção provê que tais substi-tuições possam ser introduzidas no bloco de constructo de ácido nucléico afim de aumentar a incidência de pontos de demarcação homólogos intermo-leculares e deste modo permitir um número aumentado de acoplamentosserem alcançados entre os blocos de constructo, o que por sua vez permiteum número maior de moléculas quiméricas de progênie ser gerado.Remontagem de gene sintético
Em algumas modalidades, a presente invenção fornece um mé-todo não-estocástico chamado remontagem de gene sintético, que está umpouco relacionado ao rearranjo estocástico, salvo que os blocos de construc-to de ácido nucléico não são rearranjados ou concatenados ou quimerizadosaleatoriamente, mas de preferência são agrupados não-estocásticoally. VidePatente dos Estados Unidos No. 6.537.776.
O método de remontagem de gene sintético não depende dapresença de um alto nível de homologia entre polinucleotídeos a serem rear-ranjados. A invenção pode ser usada para gerar não-estocásticoally bibliote-cas (ou grupos) de moléculas de progênie compreendidas de mais de 10100quimeras diferentes. Concebivelmente, remontagem de gene sintético podeainda ser usada para gerar bibliotecas compreendidas de mais de 1o1000quimeras de progênie diferentes.
Deste modo, em algumas modalidades, a invenção fornece ummétodo não-estocástico de produção de uma série de moléculas de ácidonucléico quiméricas finalizadas possuindo uma ordem de montagem totalque é escolhida por desenho, cujo método é compreendido das etapas degeração por desenho de uma pluralidade de blocos de constructo de ácidonucléico específicos possuindo extremidades ligáveis mutuamente compatí-veis aproveitáveis e montagem destes blocos de constructo de ácido nucléi-co, de modo que uma ordem de montagem total projetada seja alcançada.
As extremidades ligáveis mutuamente compatíveis dos blocosde constructo de ácido nucléico a serem agrupados são consideradas serem"aproveitáveis" para este tipo de montagem ordenada se elas permitirem osblocos de constructo serem acoplados em ordens predeterminadas. Destemodo, em algumas modalidades, a ordem de montagem total na qual os blo-cos de constructo de ácido nucléico podem ser acoplados é especificadapelo desenho das extremidades ligáveis e, se mais do que uma etapa demontagem deve ser usada, então a ordem de montagem total na qual osblocos de constructo de ácido nucléico podem ser acoplados é também es-pecificada pela ordem seqüencial da(s) etapa(s) de montagem. Em uma mo-dalidade, da invenção, as peças de constructo aneladas são tratadas comuma enzima, tal como uma Iigase (tal como DNA Iigase de T4) para obterligação covalente das peças de constructo!
Em uma outra modalidade, o desenho de blocos de constructode ácido nucléico é obtido na varredura das seqüências de uma série de pa-drões de ácido nucléico progenitores que servem como uma par de baseaprodução de uma série de progênie de moléculas de ácido nucléico quiméri-cas finalizadas. Estes padrões de ácido nucléico progenitores deste modoservem como uma fonte de informação de seqüência que auxilia no desenhodos blocos de constructo de ácido nucléico que devem ser mutagenizados,isto é, quimerizados ou rearranjados.
Em uma exemplificação, a invenção fornece a quimerização deuma família de genes relacionados e sua família codificada de produtos rela-cionados. Em uma exemplificação particular, os produtos codificados sãoenzimas. A aldolase, tal como piruvato aldolase, tal como enzimas de HMGe/ou KHG aldolase da presente invenção pode ser mutagenizada de acordocom os métodos descritos aqui.
Deste modo de acordo com uma modalidade da invenção, asseqüências de uma pluralidade de padrões de ácido nucléico progenitores(tais como polinucleotídeos de acordo com a invenção) são alinhadas a fimde selecionar um ou mais pontos de demarcação, cujos pontos de demarca-ção podem ser localizados em uma área de homologia. Os pontos de de-marcação podem ser usados para delinear os limites de blocos de construc-to de ácido nucléico a serem gerados. Deste modo, os pontos de demarca-ção identificados e selecionados nas moléculas progenitoras servem comopontos de quimerização potenciais na montagem das moléculas de progê-nie.
Em algumas modalidades, um ponto aproveitável de demarca-ção é uma área de homologia (compreendida de pelo menos uma base denucleotídeo homóloga) compartilhada por pelo menos dois padrões progeni-tores, mas o ponto de demarcação pode ser uma área de homologia que écompartilhada por pelo menos metade dos padrões progenitores, pelo me-nos dois terços dos padrões progenitores, pelo menos três quartos dos pa-drões progenitores e em algumas modalidades em quase a totalidade dospadrões progenitores. Ainda mais em algumas modalidades ainda um pontoaproveitável de demarcação é uma área de homologia que é compartilhadapela totalidade dos padrões progenitores.
Em uma modalidade, o processo de remontagem de gene é de-sempenhado exaustivamente a fim de gerar uma biblioteca exhaustive. Emoutras palavras, todas as combinações ordenadas possíveis dos blocos deconstructo de ácido nucléico são representadas na série de moléculas deácido nucléico quiméricas finalizadas. Ao mesmo tempo, a ordem de monta-gem (isto é, a ordem de montagem de cada bloco de constructo na seqüên-cia 5' a 3 de cada ácido nucléico quimérico finalizado) em cada combinaçãoé por desenho (ou não-estocástico). Por causa da natureza não-estocásticodo método, a possibilidade de produtos secundários indesejáveis é grande-mente reduzida.
Em outras modalidades, o método fornece o processo de remon-tagem de gene é desempenhado sistematicamente, por exemplo para geraruma biblioteca sistematicamente compartimentalizada, com compartimentosque podem ser analisados sistematicamente, tal como um por um. Em ou-tras palavras a invenção fornece, por meio do uso seletivo e judicioso deblocos de constructo de ácido nucléico específicos, acoplados com o usoseletivo e judicioso de reações de montagem seqüencialmente escalonadas,um desenho experimental pode ser alcançado onde grupos específicos deprodutos de progênie são produzidos em cada um de diversos vasos de rea-ção. Isto permite um procedimento de exame e varredura sistemático serdesempenhado. Deste modo, ele permite um número potencialmente muitogrande de moléculas de progênie ser examinado sistematicamente em gru-pos menores.
Por causa de sua capacidade para desempenhar quimerizaçõesde uma maneira que seja altamente flexível, ainda exhaustive e sistemáticatambém, particularmente quando há um baixo nível de homologia entre asmoléculas progenitoras, a presente invenção fornece a geração de uma bi-blioteca (ou série) compreendida de um grande número de moléculas deprogênie. Por causa da natureza non- estocástico da presente invenção deremontagem de gene, as moléculas de progênie geradas em algumas moda-lidades compreendem uma biblioteca de moléculas de ácido nucléico quimé-ricas finalizadas possuindo uma ordem de montagem total que é escolhidapor desenho. Em algumas modalidades, uma tal biblioteca gerada é com-preendida de mais do que 103 a mais do que 101000 espécies moleculares deprogênie diferentes.
Em algumas modalidades, uma série de moléculas de ácido nu-cléico quiméricas finalizadas, produzida tal como descrito é compreendidade um polinucleotídeo codificando um polipeptídeo. Em uma modalidade,este polinucleotídeo é um gene, que pode ser um gene produzido pelo ho-mem. Em outra modalidade, este polinucleotídeo é uma trilha de gene, quepode ser uma trilha de gene produzida pelo homem. Em algumas modalida-des, a invenção provê que um ou mais genes produzidos pelo homem gera-dos pela invenção podem ser incorporados em uma trilha de gene produzidapelo homem, tal como trilha operável em um organismo eucariótico (incluin-do uma planta).
Em outra exemplificação, a natureza sintética da etapa na qualos blocos de constructo são gerados permite o desenho e introdução de nu-cleotídeos (tais como um ou mais nucleotídeos, que podem ser, por exem-plo, códons ou íntrons ou seqüências reguladoras) que podem mais tardeser opcionalmente removidos em um processo in vitro (tal como por mutagê-nese) ou em um processo in vivo (tal como por utilização da capacidade deligação de gene de um organismo hospedeiro). É observado que em muitosexemplos, a introdução destes nucleotídeos pode também ser desejável pormuitas outras razões além do benefício potencial de criação de um ponto dedemarcação aproveitável.
Deste modo, em algumas modalidades, a invenção provê queum bloco de constructo de ácido nucléico pode ser usado para introduzir umíntron. Deste modo, a invenção provê que íntrons funcionais podem ser in-troduzidos em um gene produzido pelo homem de acordo com a invenção.Em algumas modalidades, a invenção também provê que íntrons funcionaispodem ser introduzidos em uma trilha de gene produzida pelo homem deacordo com a invenção. Conseqüentemente, a invenção fornece a geraçãode um polinucleotídeo quimérico que é um gene produzido pelo homem con-tendo um (ou mais) íntron(s) artificialmente introduzidos.
A invenção também fornece a geração de um polinucleotídeoquimérico que é uma trilha de gene produzida pelo homem contendo um (oumais) íntron(s) artificialmente introduzidos. Em algumas modalidades, o(s)íntron(s) artificialmente introduzidos são funcionais em uma ou mais célulashospedeiras para ligação de gene, muito no modo que íntrons de ocorrêncianatural servem funcionalmente na ligação de gene. Em algumas modalida-des, a invenção fornece processos de produção de polinucleotídeos conten-do íntron produzido pelo homem a ser introduzido em organismos hospedei-ros para recombinação e/ou ligação.
Um gene produzido pelo homem produzido usando a invençãopode também servir como um substrato para recombinação com outro ácidonucléico. Da mesma maneira, uma trilha de gene produzida pelo homemproduzida usando a invenção pode também servir como um substrato pararecombinação com outro ácido nucléico. Em algumas modalidades, a re-combinação é facilitada por, ou ocorre em, áreas de homologia entre o genecontendo íntron produzido pelo homem e um ácido nucléico, que serve comouma recombinação parceiro. Em algumas modalidades, o parceiro de re-combinação pode também ser um ácido nucléico gerado pela invenção, in-cluindo um gene produzido pelo homem ou uma trilha de gene produzidapelo homem. Recombinação pode ser facilitada por ou pode ocorrer em á-reas de homologia que existem em um (ou mais) íntron(s) artificialmente in-troduzido(s) no gene produzido pelo homem.
Em algumas modalidades, o método de remontagem de genesintético de acordo com a invenção utiliza uma pluralidade de blocos deconstructo de ácido nucléico, cada um dos quais, em algumas modalidades,possui duas extremidades ligáveis. As duas extremidades ligáveis em cadabloco de constructo de ácido nucléico podem ser duas extremidades cegas(isto é, cada uma possuindo uma projeção de zero nucleotídeos), ou em al-gumas modalidades uma extremidade cega e uma projeção, ou mais emalgumas modalidades ainda duas projeções. Em algumas modalidades, umprojeção útil para este propósito pode ser uma projeção 3' ou uma projeção5'. Deste modo, um bloco de constructo de ácido nucléico pode possuir umaprojeção 3' ou alternativamente uma projeção 5' ou alternativamente duasprojeções 3' ou alternativamente duas projeções 5'. A ordem total na qual osblocos de constructo de ácido nucléico são agrupados para formar uma mo-lécula de ácido nucléico quimérica finalizada é determinada por desenhoexperimental propositado e não é aleatória.
Em algumas modalidades, um bloco de constructo de ácido nu-cléico é gerado por síntese química de dois ácidos nucléicos de filamentoúnico (também referido como oligos de filamento único) e contato deles a fimde deixá-los anelarem-se para formar um bloco de constructo de ácido nu-cléico de filamento duplo. Um bloco de constructo de ácido nucléico de fila-mento duplo pode ser de tamanho variável. Os tamanhos destes blocos deconstructo podem ser pequenos ou grandes. Tamanhos exemplares parabloco de constructo varia de 1 par de base (não incluindo quaisquer proje-ções) a 100.000 pares de base (não incluindo quaisquer projeções). Outrasfaixas de tamanho exemplares são também fornecidas, as quais possuemlimites inferiores de 1 bp a 10.000 bp (incluindo todo valor de número inteiroentre) e limites superiores de 2 bp a 100.000 bp (incluindo todo valor de nú-mero inteiro entre).
Muitos métodos existem pelos quais um bloco de constructo deácido nucléico de filamento duplo pode ser gerado, isto é, aproveitável paraa invenção; e estes são conhecidos na técnica e podem ser facilmente de-sempenhados pelo técnico versado. Em algumas modalidades, um bloco deconstructo de ácido nucléico de filamento duplo é gerado por primeiro gera-ção de dois ácidos nucléicos de filamento único e permissão deles anela-rem-se para formar um bloco de constructo de ácido nucléico de filamentoduplo. Os dois filamentos de um bloco de constructo de ácido nucléico defilamento duplo podem ser complementares em todo nucleotídeo com exce-ção de quaisquer que formem uma projeção; deste modo não contendo de-sequilíbrios, com exceção de qualquer projeção(s). Em outra modalidade, osdois filamentos de um bloco de constructo de ácido nucléico de filamentoduplo são complementares em menos de todo nucleotídeo com exceção dequaisquer que formem uma projeção. Deste modo, de acordo com esta mo-dalidade, um bloco de constructo de ácido nucléico de filamento duplo podeser usado para introduzir degeneração de códon. Em algumas modalidades,a degeneração.de códon é introduzida usando a mutagênese de saturaçãode sítio descrita aqui, usando um ou mais cassetes de N,N,G/T ou alternati-vamente usando um ou mais cassetes de N5N5N.
O método de recombinação in vivo de acordo com a invençãopode ser desempenhado cegamente em uma mistura de híbridos ou alelosdesconhecidos de um polinucleotídeo ou seqüência específica. No entanto,não é necessário conhecer a seqüência de DNA ou RNA atual do polinucleo-tídeo específico. O método de uso de recombinação dentro de uma popula-ção mista de genes pode ser útil para a geração de quaisquer proteínas ú-teis, por exemplo, uma aldolase de acordo com a invenção ou uma variantedesta. Este método pode ser usado para gerar proteínas possuindo especifi-cidade ou atividade alterada. O método pode também ser útil para a geraçãode seqüências de ácido nucléico híbrido, por exemplo, regiões de promoto-ras, íntrons, exons, seqüências de realçador, 31 regiões não traduzidas ou51 regiões não traduzidas de genes. Deste modo este método pode ser usa-do para gerar genes possuindo taxas aumentadas de expressão. Este méto-do pode também ser útil no estudo de seqüências de DNA repetitivas. Fi-nalmente, este método pode ser útil para produzir ribozimas ou aptâmerosde acordo com a invenção.
Em algumas modalidades a invenção descrita aqui é direcionadaao uso de ciclos repetidos de reclassificação, recombinação e seleção redu-tivos que permitem a evolução molecular direcionada de seqüências linearesaltamente complexas, tal como recombinação completa de DNA, RNA ouproteínas.
Sistema de Evolução Direcionada Otimizada
A invenção fornece um sistema de modificação de gene não-estocástico chamado "sistema de evolução direcionada otimizada" para ge-rar polipeptídeos, tais como aldolase, tal como piruvato aldolase, tal comoenzimas de HMG e/ou KHG aldolase ou anticorpos de acordo com a inven-ção, com propriedades novas ou alteradas. Em algumas modalidades, evo-lução direcionada otimizada é direcionada ao uso de ciclos repetidos de re-classificação, recombinação e seleção redutivos que permitem a evoluçãomolecular direcionada de ácidos nucléicos por meio de recombinação.
Evolução direcionada otimizada permite geração de uma grandepopulação de seqüências quiméricas evoluídas, em que a população geradaé significantemente enriquecida por seqüências que possuam um númeropredeterminado de eventos de cruzamento. Um evento de cruzamento é umponto em uma seqüência quimérica onde uma mudança na seqüência ocor-re de uma variante parental a outra variante parental. Um tal ponto é nor-malmente na junção de onde oligonucleotídeos de dois parentes são ligadosjuntos para formar uma seqüência única. Este método permite cálculo dasconcentrações corretas de seqüências de oligonucleotídeo de modo que apopulação quimérica final de seqüências seja enriquecida pelo número esco-lhido de eventos de cruzamento. Isto fornece mais controle sobre escolha devariantes quiméricas possuindo um número predeterminado de eventos decruzamento.
Além disso, este método fornece mecanismo conveniente paraexploração de uma quantidade tremenda do espaço variante de proteínapossível em comparação com outros sistemas. Previamente, se alguns gera-ram, por exemplo, 1013 moléculas quiméricas durante uma reação, seria ex-tremamente difícil testar um tal número alto de variantes quiméricas parauma atividade particular. Além do mais, uma porção significante da popula-ção de progênie possuiria um número muito alto de eventos de cruzamentoque resultaram em proteínas que eram menos prováveis possuírem níveisaumentados de uma atividade particular. Por uso destes métodos, a popula-ção de moléculas quiméricas pode ser enriquecida por aquelas variantesque possuam um número particular de eventos de cruzamento. Deste modo,ainda que alguns possamm ainda gerar 1013 moléculas quiméricas duranteuma reação, cada uma das moléculas escolhidas para varredura adicionalmais provavelmente possuem, por exemplo, apenas três eventos de cruza-mento. Porque a população resultante de progênie pode ser firmada possuirum número predeterminado de eventos de cruzamento, os limites na varie-dade funcional entre as moléculas quiméricas são reduzidos. Isto fornece umnúmero mais manejável de variáveis quando calculando que oligonucleotí-deo dos polinucleotídeos parentais originais poderiam ser responsáveis porafeição de uma característica particular.
Um método para criação de uma seqüência de polinucleotídeode progênie quimérica é criar oligonucleotídeos correspondentes a fragmen-tos ou porções de cada seqüência parental. Cada oligonucleotídeo em al-gumas modalidades inclui uma região única de sobreposição de modo que amistura dos oligonucleotídeos juntos resulte em uma nova variante que pos-sua cada fragmento de oligonucleotídeo agrupado na ordem correta. Alterna-tivamente protocolos para prática destes métodos de acordo com a invençãopodem ser encontrados em Patente dos Estados Unidos Nos. 6.773.900;6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776; 6.361.974.
O número de oligonucleotídeos gerados para cada variante pa-rental transporta uma relação ao número total de cruzamentos resultantes namolécula quimérica que é finalmente criada. Por exemplo, três variantes deseqüência de nucleotídeo parental poderiam ser fornecidas para passar poruma reação de ligação a fim de fornecer uma variante quimérica possuindo,por exemplo, maior atividade em alta temperatura. Como um exemplo, umasérie de 50 seqüências de oligonucleotídeo pode ser gerada correspondentea cada porções de cada variante parental. Conseqüentemente, durante oprocesso de remontagem de ligação nesse sentido podia ser até 50 eventosde cruzamento dentro de cada uma das seqüências quiméricas. A probabili-dade que cada um dos polinucleotídeos quiméricos gerados conterá oligo-nucleotídeos de cada variante parental em ordem alternada é muito baixa.
Se cada fragmento de oligonucleotídeo está presente na reação de ligaçãona mesma quantidade molar, é provável que em algumas posições, oligonu-cleotídeos do mesmo polinucleotídeo parental se ligarão junto a um outro edeste modo não resultarão em um evento de cruzamento. Se a concentra-ção de cada oligonucleotídeo de cada parente é mantida constante durantequalquer etapa de ligação neste exemplo, há uma chance de 1/3 (assumindo3 parentes) que um oligonucleotídeo da mesma variante parental se ligarádentro da seqüência quimérica e não produzirá nenhum cruzamento.
Conseqüentemente, uma função de densidade de probabilidade(PDF) pode ser determinada predizer a população de eventos de cruzamen-to que são prováveis ocorrer durante cada etapa em uma reação de ligaçãodado um número de série de variantes parentais, um número de oligonucleo-tídeos correspondentes a cada variante, e as concentrações de cada varian-te durante cada etapa na reação de ligação. As estatísticas e matemáticasatrás da determinação da PDF são descritas abaixo. Por utilização destesmétodos, alguém pode calcular uma tal função de densidade de probabilida-de, e deste modo enriquecer a população de progênie quimérica para umnúmero predeterminado de eventos de cruzamento resultantes de uma rea-ção de ligação particular. Além do mais, um número alvo de eventos de cru-zamento pode ser predeterminado, e o sistema então programado para cal-cular as quantidades de partida de cada oligonucleotídeo parental durantecada etapa na reação de ligação para resultar em uma função de densidadede probabilidade que centros no número predeterminado de eventos de cru-zamento. Estes métodos são direcionados ao uso de ciclos repetidos de re-classificação, recombinação e seleção redutivos que permitem a evoluçãomolecular direcionada de um ácido nucléico codificando um polipeptídeo pormeio de recombinação. Este sistema permite geração de uma grande popu-lação de seqüências quiméricas evoluídas, em que a população gerada ésignificantemente enriquecida por seqüências que possuam um número pre-determinado de eventos de cruzamento. Um evento de cruzamento é umponto em uma seqüência quimérica onde uma mudança em seqüência ocor-re de um variante parental a outra variante parental. Um tal ponto é normal-mente na junção de onde oligonucleotídeos de dois parentes são ligadosjuntos para formar uma seqüência única. O método permite cálculo das con-centrações corretas de seqüências de oligonucleotídeo de modo que a popu-lação quimérica final de seqüências seja enriquecida pelo número escolhidode eventos de cruzamento. Isto fornece mais controle sobre escolha de vari-antes quiméricas possuindo um número predeterminado de eventos de cru-zamento.
Além disso, estes métodos fornecem um mecanismo convenien-te para exploração de uma quantidade tremenda do espaço variante de pro-teína possível em comparação a outros sistemas. Por uso dos métodos des-critos aqui, a população de moléculas quiméricas pode ser enriquecida poraquelas variantes que possuam um número particular de eventos de cruza-mento. Deste modo, ainda que alguém possa ainda gerar 1013 moléculasquiméricas durante uma reação, cada uma das moléculas escolhidas paravarredura adicional mais provavelmente possuem, por exemplo, apenas trêseventos de cruzamento. Porque a população de progênie resultante podeser firmada possuir um número predeterminado de eventos de cruzamento,os limites na variedade funcional entre as moléculas quiméricas são reduzi-dos. Isto fornece um número mais manejável de variáveis quando calculandoque oligonucleotídeo dos polinucleotídeos parentais originais poderia serresponsável por afeição de uma característica particular.
Em algumas modalidades, o método cria uma seqüência de po-linucleotídeo de progênie quimérica por criação de oligonucleotídeos corres-pondentes a fragmentos ou porções de cada seqüência parental. Cada oli-gonucleotídeo em algumas modalidades inclui uma única região de sobrepo-sição de modo que a mistura dos oligonucleotídeos juntos resulte em umanova variante que possua cada fragmento de oligonucleotídeo agrupado naordem correta. Vide também Patente dos Estados Unidos Nos. 6.773.900;6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776; 6.361.974.
Determinação de Eventos de Cruzamento
Modalidades da invenção incluem um sistema e software querecebem uma função de densidade de probabilidade (PDF) de cruzamentodesejada, o número de genes parentes a ser reagrupado, e o número defragmentos na remontagem como entradas. A produção deste programa éuma "PDF de fragmento" que pode ser usada para determinar uma receitapara produção de genes reagrupados, e a PDF de cruzamento estimada da-queles genes. O processamento descrito aqui é em algumas modalidadesdesempenhado em MATLAB™ (The Mathworks, Natick, Massachusetts),uma linguagem de programação e meio de desenvolvimento para computa-ção técnica.
Processos iterativos
Qualquer processo de acordo com a invenção pode ser iterati-vamente repetido, tal como um ácido nucléico codificando um fenótipo dealdolase alterada ou nova, tal como piruvato aldolase, tal como enzima deHMG e/ou KHG aldolase de acordo com a invenção, pode ser identificado,reisolado, modificado de novo, retestado quanto à atividade. Este processopode ser iterativamente repetido até que um fenótipo desejado seja projeta-do. Por exemplo, uma trilha anabólica ou catabólica bioquímica inteira podeser projetada em uma célula, incluindo atividade de enzima, tal como aldola-se, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase.
Similarmente, se é determinado que um oligonucleotídeo particu-lar não possui nenhuma afeição na totalidade da característica desejada (talcomo uma nova aldolase, tal como piruvato aldolase, tal como fenótipo deenzima de HMG e/ou KHG aldolase), ele pode ser removido como uma vari-ável através de sintetização de oligonucleotídeos parentais maiores que in-cluem a seqüência a ser removida. Porque a incorporação da seqüênciadentro de uma seqüência maior previne quaisquer eventos de cruzamento,já não haverá qualquer variação desta seqüência nos polinucleotídeos deprogênie. Esta prática iterativa de determinação de que oligonucleotídeossão mais relacionados à característica desejada, e os quais são não relacio-nados, permite exploração mais eficiente da totalidade das variantes de pro-teína possíveis que poderiam fornecer uma característica ou atividade parti-cular.
Rearranjo em vivo
Em várias modalidades, rearranjo in vivo de moléculas é usadoem métodos de acordo com a invenção para fornecer variantes de polipeptí-deos de acordo com a invenção, tais como anticorpos de acordo com a in-venção ou aldolases de acordo com a invenção, tais como piruvato aldolase,enzimas de MMG e/ou KHG aldolase, e outros mais. Rearranjo in vivo podeser desempenhado utilizando a propriedade natural de células para recom-binar multímeros. Embora recombinação in vivo tenha fornecido a principalrotina natural para diversidade molecular, recombinação genética subsiste aum processo relativamente complexo que envolve 1) o reconhecimento dehomologias; 2) clivagem de filamento, invasão de filamento, e etapas meta-bólicas resultando na produção de quiasma recombinante; e finalmente 3) aresolução de quiasma em moléculas recombinadas distintas. A formação doquiasma requer o reconhecimento de seqüências homólogas.
Em outras modalidades, a invenção inclui um método para pro-dução de um polinucleotídeo híbrido de pelo menos um primeiro polinucleo-tídeo e um segundo polinucleotídeo. Em algumas modalidades, a invençãopode ser usada para produzir um polinucleotídeo híbrido através de introdu-ção de pelo menos um primeiro polinucleotídeo e um segundo polinucleotí-deo (tal como um, ou ambos, sendo uma aldolase, tal como piruvato aldola-se, tal como seqüência codificando enzima de HMG e/ou KHG aldolase deacordo com a invenção) que compartilham pelo menos uma região de homo-logia de seqüência parcial em uma célula hospedeira adequada. As regiõesde homologia de seqüência parcial promovem processos que resultam emreorganização de seqüência produzindo um polinucleotídeo híbrido. O termo"polinucleotídeo híbrido", tal como usado aqui, é qualquer seqüência de nu-cleotídeo que resulte do método da presente invenção e contenha seqüênciade pelo menos duas seqüências de polinucleotídeo originais. Tais polinu-cleotídeos híbridos podem resultar de eventos de recombinação intermolecu-Iar que promovem integração de seqüência entre moléculas de DNA. Alémdisso, tais polinucleotídeos híbridos podem resultar de processos de reclas-sificação redutiva intramolecular que utilizam seqüências repetidas para alte-rar uma seqüência de nucleotídeo dentro de uma molécula de DNA.
Em algumas modalidades, reclassificação vivo focaliza em pro-cessos "inter-moleculares" coletivamente referidos como "recombinação";que em bactérias, é geralmente visto como um fenômeno "dependente deRecA". Em algumas modalidades, a invenção pode contar com processos derecombinação de uma célula hospedeira para recombinar e reclassificár se-qüências, ou a capacidade das células para mediar processos redutivos paradiminuir a complexidade de seqüências quasi-repetidas na célula por dele-ção. Este processo de "reclassificação redutiva" ocorre por um processo in-dependente de RecA "intra-molecular".
Em outras modalidades da invenção, novos polinucleotídeos po-dem ser gerados pelo processo de reclassificação redutiva. O método envol-ve a geração de constructos contendo seqüências consecutivas (seqüênciasde codificação original), sua inserção em um vetor apropriado e sua subse-qüente introdução em uma célula hospedeira apropriada. A reclassificaçãodas identidades moleculares individuais ocorre por processos combinatóriosentre as seqüências consecutivas nas regiões possuindo constructo de ho-mologia, ou entre unidades quasi-repetidas. O processo de reclassificaçãorecombina e/ou reduz a complexidade e extensão das seqüências repetidase resulta na produção de novas espécies moleculares. Vários tratamentospodem ser aplicados para realçar a taxa de reclassificação. Estes poderiamincluir tratamento com luz ultravioleta, ou produtos químicos danificandoDNA e/ou o uso de linhagens celulares hospedeiras exibindo níveis realça-dos de "instabilidade genética". Deste modo o processo de reclassificaçãopode envolver recombinação homóloga ou a propriedade natural de seqüên-cias quasi-repetidas para direcionar sua própria evolução.
Seqüências repetidas ou "quasi-repetidasf desempenham umpapel na instabilidade genética. Em algumas modalidades, "quasi-repetições" são repetições que não estão restritas a sua estrutura unitáriaoriginal. Unidades quasi-repetidas podem ser apresentadas como uma sériede seqüências em um constructo; unidades consecutivas de seqüências si-milares. Uma vez ligadas, as junções entre as seqüências consecutivas tor-nam-se essencialmente invisíveis e a natureza quasi-repetitiva do construc-toresultante é agora contínua no nível molecular. O processo de deleção dacélula desempenha reduzir a complexidade dos operados de constructo re-sultantes entre as seqüências quasi- repetidas. As unidades quasi-repetidãsfornecem um repertório praticamente ilimitado de padrões no qual eventosde deslize podem ocorrer. Em algumas modalidades, os constructos conten-do as quasi-repetições deste modo eficazmente fornecem elasticidade mole-cular suficiente em que eventos de deleção (e potencialmente inserção) po-dem ocorrer virtualmente em qualquer lugar dentro das unidades quasi- re-petitivas.
Quando as seqüências quasi-repetidas estão todas ligadas namesma orientação, por exemplo cabeça a cauda ou vice versa, a célula nãopode distinguir unidades individuais. Por conseguinte, o processo redutivopode ocorrer por todas as seqüências. Em contraste, quando por exemplo,as unidades são apresentadas cabeça a cabeça, em vez de cabeça a cauda,a inversão delineia as finalidades da unidade adjacente de modo que forma-ção de deleção favoreça a perda de unidades distintas. Deste modo, é prefe-rível com o presente método que as seqüências estejam na mesma orienta-ção. Orientação aleatória de seqüências quasi-repetidas resultará na perdade eficiência de reclassificação, enquanto orientação consistente das se-qüências oferecerá a eficiência mais alta. No entanto, embora possuir algu-mas das seqüências contíguas na mesma orientação diminua a eficiência,elas podem ainda fornecer elasticidade suficiente para a recuperação eficazde novas moléculas. Constructos podem ser feitas com as seqüências quasi-repetidas na mesma orientação para permitir eficiência mais alta.
Seqüências podem ser agrupadas em uma orientação de cabe-ça a cauda usando qualquer de uma variedade de métodos, incluindo osseguintes:a) Iniciadores que incluem uma cabeça poli-A e cauda poli-T que quandofeitos de filamento único forneceriam orientação, podem ser utilizados. Isto érealizado possuindo as primeiras poucas bases dos iniciadores feitas deRNA e em conseqüência RNaseH facilmente removido.
b) Iniciadores que incluem sítios de clivagem de restrição únicos podem serutilizados. Sítios múltiplos, uma bateria de seqüências únicas e etapas deligação e síntese repetidas e seriam requeridos.
c) As poucas bases internas do iniciador podiam ser tioladas e uma exonu-clease usada para produzir moléculas propriamente de cauda.
Em algumas modalidades, a recuperação das seqüências re-ordenadas conta com a identificação de vetores de clonagem com um índicerepetitivo (RI) reduzido. As seqüências de codificação re-ordenadas podementão ser recuperadas por amplificação. Os produtos são re-clonados e ex-pressados. A recuperação de vetores de clonagem com Rl reduzido podeser afetada por:
1) O uso de vetores apenas estavelmente mantido quando o constructo éreduzido em complexidade.
2) A recuperação física de vetores encurtados por procedimentos físicos.
Neste caso, o vetor de clonagem seria recuperado usando procedimentos deisolamento de plasmídeo padrões e tamanho fracionado em ou um gel deagarose, ou coluna com um baixo peso molecular reduzido utilizando proce-dimentos padrões.
3) A recuperação de vetores contendo genes interrompidos que podem serselecionados quando o tamanho de inserção diminui.
4) O uso de técnicas de seleção direta com um vetor de expressão e a sele-ção apropriada.
Seqüências de codificação (por exemplo, genes) de organismosrelacionados podem demonstrar um alto grau de homologia e codificar pro-dutos de proteína bastante diversos. Estes tipos de seqüências são particu-larmente úteis na presente invenção como quasi-repetições. No entanto,embora os exemplos ilustrados abaixo demonstrem a reclassificação de se-qüências de codificação originais quase idênticas (quasi-repetições), esteprocesso não é limitado a tais repetições quase idênticas.
O seguinte exemplo demonstra um método exemplar de acordocom a invenção. Seqüências de ácido nucléico de codificação (quasi-repetições) derivadas de três (3) espécies únicas são descritas. Cada se-qüência codifica uma proteína com uma série distinta de propriedades. Cadauma das seqüências difere por um único ou alguns pares de base em umaposição única na seqüência. As seqüências quasi-repetidas são separada-mente ou coletivamente amplificadas e ligadas em montagens aleatórias demodo que todas as possíveis permutações e combinações estejam disponí-veis na população de moléculas ligadas. O número de unidades de quasi-repetição pode ser controlado pelas condições de montagem. O númeromédio de unidades quasi-repetidas em um constructo é definido como o ín-dice repetitivo (RI).
Uma vez formadas, os constructos podem, ou não podem serfracionados por tamanho em um gel de agarose de acordo com protocolospublicados, inseridos em um vetor de clonagem e transfectados em uma cé-lula hospedeira apropriada. As células são então propagadas e "reclassifica-ção redutiva" é efetuado. A taxa do processo de reclassificação redutiva po-de ser estimulada pela introdução de dano de DNA se desejado. Se a redu-ção em Rl é mediada por formação de deleção entre seqüências repetidaspor um mecanismo "intra-molecular", ou mediada por eventos de tipo re-combinação por meio de mecanismos "inter-moleculares" é imaterial. O re-sultado final é uma reclassificação das moléculas em todas as combinaçõespossíveis.
Opcionalmente, o método compreende a etapa adicional de var-redura dos membros de biblioteca da mistura rearranjada para identificarmembros de biblioteca rearanjados individuais possuindo a capacidade paraligar-se ou interagir de outra forma, ou catalisar uma reação particular (talcomo domínio catalítico de uma enzima) com uma macromolécula predeter-minada, tal como por exemplo um receptor proteináceo, um oligossacarídeo,vírion, ou outro composto ou estrutura predeterminada.
Os polipeptídeos que são identificados de tais bibliotecas podemser usados para propósitos terapêuticos, de diagnóstico, de pesquisa e rela-cionados (tal como catalisadores, solutos para aumento da osmolaridade deuma solução aquosa e outros mais) e/ou podem ser submetidos a um oumais ciclos adicionais de rearranjo e/ou seleção.
Em outras modalidades, é previsto que antes de ou durante re-combinação ou reclassificação, polinucleotídeos gerados pelo método deacordo com a invenção podem ser submetidos a agentes ou processos osquais promovem a introdução de mutações nos polinucleotídeos originais. Aintrodução de tais mutações aumentaria a diversidade de polinucleotídeos epolipeptídeos híbridos resultantes codificados disso. Os agentes ou proces-sos os quais promovem mutagênese podem incluir, mas não são limitados a:(+)- CC-1065, ou um análogo sintético tal como (+)-CC-1065-(N3-Adenina(Vide Sun e Hurley, (1992); um aduzido de 4'-fluro-4-aminobifenila N-acetilada ou desacetilada capaz de inibição de síntese de DNA (Vide, porexemplo, van de Poll e outros (1992)); ou um aduzido de 4-aminobifenila N-acetilada ou desacetilada capaz de inibição de síntese de DNA (Vide tam-bém, van de Poll e outros (1992), pp. 751-758); cromo trivalente, um sal decromo trivalente, um aduzido de DNA de hidrocarboneto aromático policíclico(PAH) capaz de inibição de replicação de DNA, tal como 7-bromometil-benz[a]antraceno ("BMA"), tris(2,3- dibromopropil)fosfato ("Tris-BP"), 1,2-dibromo-3-cloropropano ("DBCP"), 2- bromoacroleína (2BA), benzo[a]pireno-7,8-dihidrodiol-9-10-epóxido ("BPDE"), um sal de halogênio de platina(ll), N-hidróxi-2-amino-3-metilimidazo[4,5-/|-quinolina ("N- hidróxi-IQ") e N-hidróxi-2-amino-1-metil-6-fenilimidazo[4,5-/|-piridina ("N- hidróxi-PhlP"). Mecanismoexemplar para retardamento ou parada de amplificação de PCR consiste deluz UV (+)-CC-1065 e (+)-CC-1065-(N3-Adenina). Métodos particularmenteabrangidos são aduzidos de DNA ou polinucleotídeos compreendendo osaduzidos de DNA dos polinucleotídeos ou mistura de polinucleotídeos, osquais podem ser liberados ou removidos por um processo incluindo aqueci-mento da solução compreendendo os polinucleotídeos antes de processa-mento adicional.
Em outras modalidades a invenção é direcionada a um métodode produção de proteínas recombinantes possuindo atividade biológica atra-vés de tratamento de uma amostra compreendendo padrões de polinucleotí-deo de filamento duplo codificando uma proteína de tipo selvagem sob con-dições de acordo com a invenção que fornecem a produção de polinucleotí-deos híbridos ou re-assorted.
Produção de variantes de seqüência
A invenção também fornece métodos adicionais para produçãode variantes de seqüência das seqüências de ácido nucléico (tal como aldo-lase, tal como piruvato aldolase, tal como enzima de HMG e/ou KHG aldola-se) de acordo com a invenção. Em algumas modalidades, a invenção tam-bém fornece métodos adicionais para isolamento de aldolase, tal como piru-vato aldolase, tal como enzimas de HMG e/ou KHG aldolase usando os áci-dos nucléicos e polipeptídeos de acordo com a invenção. Em algumas mo-dalidades, a invenção fornece variantes de uma aldolase, tal como piruvatoaldolase, seqüência de codificação de enzima de HMG e/ou KHG aldolase(tal como um gene, cDNA ou mensagem) de acordo com a invenção, quepodem ser alteradas por qualquer mecanismo, incluindo, tal como métodosaleatórios ou estocástico, ou, não-estocástico, ou "evolução direcionada,"métodos, tais como descritos acima.
As variantes isoladas podem ser de ocorrência natural. Variantepode também ser criada in vitro. Variantes podem ser criadas usando técni-cas de engenharia genética tal como mutagênese direcionada a sítio, muta-gênese química aleatória, procedimentos de deleção de Exonuclease III, etécnicas de clonagem padrões. Alternativamente, tais variantes, fragmentos,análogos, ou derivados podem ser criados usando procedimentos de sínteseou modificação química. Outros métodos de produção de variantes são tam-bém familiares àqueles versados na técnica. Isto inclui procedimentos nosquais seqüências de ácido nucléico obtidas de isolados naturais são modifi-cadas para gerar ácidos nucléicos que codificam polipeptídeos possuindocaracterísticas que realçam seu valor em aplicações industriais ou de labora-tório. Em tais procedimentos, um grande número de variantes de seqüênciapossuindo uma ou mais diferenças de nucleotídeo com respeito à seqüênciaobtida do isolado natural é gerado e caracterizado. Estas diferenças de nu-cleotídeo podem resultar em mudanças de aminoácido com respeito aospolipeptídeos codificados pelos ácidos nucléicos dos isolados naturais.
Por exemplo, variantes podem ser criadas usando PCR propen-sa a erro. Em algumas modalidades de PCR propensa a erro, a PCR é de-sempenhada sob condições onde a fidelidade de reprodução do DNA poli-merase é baixa, de modo que uma alta taxa de mutações pontuais seja obti-da ao longo do comprimento inteiro do produto de PCR. PCR propensa aerro é descrita, tal como em Leung, D.W. e outros, (1989) Technique 1:11-15; e Caldwell, R.C. & Joyce, G.F., (1992) PCR Methods Applic. 2:28-33.Resumidamente, em tais procedimentos, ácidos nucléicos a serem mutage-nizados são misturados com iniciadores de PCR, tampão de reação, MgCI2,MnCI2, Taq polimerase e uma concentração apropriada de dNTPs para ob-tenção de uma alta taxa de mutação de ponto ao longo do comprimento in-teiro do produto de PCR. Por exemplo, a reação pode ser desempenhadausando 20 fmols de ácido nucléico a ser mutagenizado, 30 pmols de cadainiciador de PCR, um tampão de reação compreendendo 50 mM de KCI, 10mM de HCI de Tris (pH 8,3) e 0,01% de gelatina, 7 mM de MgCI2, 0,5 mMMnCI2, 5 unidades de Taq polimerase, 0,2 mM de dGTP, 0,2 mM de dATP, 1mM de dCTP, e 1 mM de dTTP. PCR pode ser desempenhada por 30 ciclosde 94°C durante 1 minuto, 45°C durante 1 minuto, e 72°C durante 1 minuto.No entanto, será observado que estes parâmetros podem ser variadosquando apropriado. Os ácidos nucléicos mutagenizados são clonados emum vetor apropriado e as atividades dos polipeptídeos codificados pelos áci-dos nucléicos mutagenizados são avaliadas.
Em algumas modalidades, variantes são criadas usando muta-gênese direcionada a oligonucleotídeo para gerar mutações específicas porsítio em qualquer DNA clonado de interesse.
Mutagênese de oligonucleotídeo é descrita, tal como em Rei-dhaar-Olson (1988) Science 241:53-57. Em síntese, em tais procedimentosuma pluralidade de oligonucleotídeos de filamento duplo transportando umaou mais mutações a ser introduzidas dentro do DNA cionado é sintetizada einserida dentro do DNA clonado a ser mutagenizado. Em algumas modalida-des, clones contendo o DNA mutagenizado são recuperados, expressados,e as atividades do polipeptídeo codificado nestes avaliadas.
Outro método para geração de variantes é PCR de montagem.PCR de montagem envolve a montagem de um produto de PCR de umamistura de pequenos fragmentos de DNA. Um grande número de reaçõesPCR diferentes ocorrem em paralelo no mesmo frasco, com os produtos deuma reação provendo os produtos de outra reação. PCR de montagem édescrita na técnica, tal como em Patente dos Estados Unidos No. 5.965.408.
Em algumas modalidades, mutagênese de PCR sexual é ummétodo exemplar de geração de variantes de acordo com a invenção. Emalgumas modalidades de mutagênese de PCR sexual forçada, recombina-ção homóloga ocorre entre moléculas de DNA de seqüência de DNA in vitrodiferentes mas altamente relacionadas, como um resultado de fragmentaçãoaleatória da molécula de DNA com base em homologia de seqüência, segui-do por fixação do cruzamento por extensão iniciadora em uma reação PCR.Mutagênese de PCR sexual é descrita, tal como em Stemmer (1994) Proc.Natl. Acad. Sei. USA 91:10747-10751. Resumidamente, em tais procedimen-tos uma pluralidade de ácidos nucléicos a serem recombinados são digeri-dos com DNase para gerar fragmentos possuindo um tamanho médio de 50a 200 nucleotídeos. Fragmentos do tamanho médio desejado são purificadose resuspensos em uma mistura de PCR. A PCR é conduzida sob condiçõesas quais facilitam recombinação entre os fragmentos de ácido nucléico. Porexemplo, PCR pode ser desempenhada por resuspensão dos fragmentospurificados em uma concentração de 10 a 30 ng/μΙ em uma solução de 0,2mM de cada dNTP, 2,2 mM de MgCI2, 50 mM de KCL, 10 mM de Tris HCI,pH 9,0, e 0,1% de Triton X-100. 2,5 unidades de Taq polimerase por 100 μΙde mistura de reação são adicionadas e PCR é desempenhada usando oseguinte regime: 94°C durante 60 segundos, 94°C durante 30 segundos, 50a 55°C durante 30 segundos, 72°C durante 30 segundos (30 a 45 vezes) e72°C durante 5 minutos. No entanto, será observado que estes parâmetrospodem ser variados quando apropriado. Em algumas modalidades, oligonu-cleotídeos podem ser incluídos nas reações PCR. Em outras modalidades, ofragmento Klenow de DNA polimerase I pode ser usado em uma primeirasérie de reações PCR e Taq polimerase pode ser usada em uma subse-qüente série de reações PCR. Seqüências recombinantes são isoladas e asatividades dos polipeptídeos que elas codificam são avaliadas.
Em algumas modalidades, variantes são criadas por mutagêne-se in vivo. Em algumas modalidades, mutações aleatórias em uma seqüên-cia de interesse são geradas por propagação da seqüência de interesse emuma cepa bacteriana, tal como uma cepa E. coli, que transporta mutaçõesem uma ou mais das trilhas de reparo de DNA. Tais cepas "mutantes" pos-suem uma taxa de mutação aleatória maior do que aquela de uma origem dotipo selvagem. Propagação do DNA em uma destas cepas eventualmentegerará mutações aleatórias dentro do DNA. Cepas mutantes adequadas pa-ra uso para mutagênese in vivo são descritas em Publicação de PCT No.WO 91/16427, publicada em 31 de outubro de 1991, intitulada "Métodos pa-ra Criação de Fenótipo de Populações de Gene Múltiplo".
Variantes podem também ser geradas usando mutagênese decassete. Em mutagênese de cassete, uma pequena região de uma moléculade DNA de filamento duplo é substituída com um "cassete" de oligonucleotí-deo sintético que difere da seqüência nativa. O oligonucleotídeo freqüente-mente contém seqüência nativa completamente e/ou parcialmente aleatori-zada.
Mutagênese em conjunto recursivo pode também ser usada paragerar variantes. Mutagênese de ensemble Recursive é um algoritmo paraengenharia de proteína (mutagênese de proteína) desenvolvido para produ-zir diversas populações de mutantes fenotipicamente relacionados cujosmembros diferem em seqüência de aminoácido. Este método usa um meca-nismo de realimentação para controlar rodadas sucessivas de mutagênesede cassete combinatória. Mutagênese de em conjunto recursivo é descrita,tal como em Arkin (1992) Proc. Natl. Acad. Sei. USA 89:7811- 7815.
Em algumas modalidades, variantes são criadas usando muta-gênese em conjunto exponencial. Mutagênese em conjunto exponencial éum processo para geração de bibliotecas combinatórias com uma alta por-centagem de mutantes únicos e funcionais, em que pequenos grupos deresíduos são aleatorizados em paralelo para identificar, em cada posiçãoalterada, aminoácidos que resultam em proteínas funcionais. Mutagêneseem conjunto exponencial é descrita, tal como em Delegrave (1993) Biotech-nology Res. 11 :1548-1552. Mutagênese aleatória e direcionada a sítio sãodescritas, tal como em Arnold (1993) Current Opinion in Biotechnology4:450-455.
Em algumas modalidades, as variantes são criadas usando pro-cedimentos de rearranjo em que porções de uma pluralidade de ácidos nu-cléicos que codificam polipeptídeos distintos são fundidas juntas para criarseqüências de ácido nucléico quiméricas que codificam polipeptídeos quimé-ricos tal como descrito na Patente dos Estados Unidos No. 5.965.408, depo-sitada em 9 de julho de 1996, intitulada, "Método de Remontagem de DNApor Interrupção de Síntese" e Patente dos Estados Unidos No. 5.939.250,depositada em 22 de maio de 1996, intitulada, "Produção de Enzimas Pos-suindo Atividades Desejadas por Mutagênese.
As variantes dos polipeptídeos de acordo com a invenção po-dem ser variantes nas quais um ou mais dos resíduos de aminoácido dospolipeptídeos das seqüências de acordo com a invenção são substituídoscom um resíduo de aminoácido conservado ou não conservado (em algumasmodalidades, um resíduo de aminoácido conservado) e tal resíduo de ami-noácido substituído pode ou pode não ser um codificado pelo código genéti-co.
Em algumas modalidades, substituições conservadoras são a-quelas que substituem um dado aminoácido em um polipeptídeo por outroaminoácido de características iguais. Em algumas modalidades, substitui-ções conservadoras de acordo com a invenção compreendem as seguintessubstituições: substituições de um aminoácido alifático tal como Alanina, Va-lina, Leucina e Isoleucina com outro aminoácido alifático; substituição deuma Serina com uma Treonina ou vice versa; substituição de um resíduoacídico tal como Ácido aspártico e Ácido glutâmico com outro resíduo acídi-co; substituição de um resíduo transportando um grupo de amida, tal comoAsparagina e Glutamina, com outro resíduo transportando um grupo de ami-da; permuta de um resíduo básico tal como Lisina e Arginina com outro resí-duo básico; e substituição de um resíduo aromático tal como Fenilalanina,Tirosina com outro resíduo aromático.
Outras variantes são aquelas nas quais um ou mais dos resí-duos de aminoácido de um polipeptídeo de acordo com a invenção inclui umgrupo substituinte. Em algumas modalidades, outras variantes são aquelasnas quais o polipeptídeo está associado com outro composto, tal como umcomposto para aumentar a meia vida do polipeptídeo (por exemplo, polietile-no glicol). Variantes adicionais são aquelas nas quais aminoácidos adicio-nais são fundidos ao polipeptídeo, tal como uma seqüência líder, uma se-qüência secretória, uma seqüência de pró-proteína ou uma seqüência quefacilita purificação, enriquecimento, ou estabilização do polipeptídeo.
Em algumas modalidades, os fragmentos, derivados e análogosretêm a mesma função ou atividade biológica como os polipeptídeos de a -cordo com a invenção e seqüências substancialmente idênticas a estes. Emoutras modalidades, o fragmento, derivado, ou análogo inclui uma pró-proteína, de modo que o fragmento, derivado, ou análogo possa ser ativadopor clivagem da porção de pró-proteína para produzir um polipeptídeo ativo.Otimização de códons para obter altos níveis de expressão de proteínaem céiulas hospedeiras
A invenção fornece métodos para modificação de ácidos nucléi-cos de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldola-se, codificando enzima para modificar (tal como otimizar) uso de códon. Emalgumas modalidades, a invenção fornece métodos para modificação de có-dons em um ácido nucléico codificando uma enzima aldolase, tal como piru-vato aldolase, HMG e/ou KHG aldolase para aumentar ou diminuir sua ex-pressão em uma célula hospedeira. Em algumas modalidades, a invençãotambém fornece ácidos nucléicos codificando uma enzima aldolase, tal comopiruvato aldolase, HMG e/ou KHG aldolase modificada para aumentar suaexpressão em uma célula hospedeira, enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase também modificada, e métodosde produção das enzimas aldolase modificadas, tal como piruvato aldolase,tal como HMG e/ou KHG aldolase. O método compreende identificação deum códon "não-preferido" ou um "menos preferido" em ácido nucléico dealdolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, codi-ficando enzima e substituição de um ou mais destes códons não-preferidosou menos preferidos com um "códon preferido" codificando o mesmo amino-ácido como o códon substituído e pelo menos um códon não-preferido oumenos preferido no ácido nucléico foi substituído por um códon preferidocodificando o mesmo aminoácido. Um códon preferido é um códon super-representado em seqüências de codificação em genes na célula hospedeirae um códon não-preferido ou menos preferido é um códon sub-representadoem seqüências de codificação em genes na célula hospedeira.
Células hospedeiras para expressão dos ácidos nucléicos, cas-setes de expressão e vetores de acordo com a invenção incluem bactérias,levedura, fungos, células de planta, células de inseto e células de mamífero(vide discussão, acima). Desta forma, a invenção fornece métodos para oti-mização de uso de códon de na totalidade destas células, ácidos nucléicosalterados por códon e polipeptídeos feitos pelos ácidos nucléicos alteradospor códon. Células hospedeiras exemplares incluem bactérias gram negati-vas, tais como Escherichia colr, bactérias gram positivas, tais como Strep-tomyces sp., Lactobacillus gasseri, Lactococcus laetis, Laetococeus eremo-ris, Bacillus subtilis, Bacillus eereus. Células hospedeiras exemplares tam-bém incluem organismos eucarióticos, tais como várias leveduras, tais comoSaccharomyees sp., incluindo Saccharomyees eerevisiae, Sehizosaeeha-romyees pombe, Piehia pastoris, e Kluyveromyces laetis, Hansenula poli-morpha, Aspergillus niger, e células de mamífero e linhagens celulares ecélulas de inseto e linhagens celulares. Desta forma, a invenção tambéminclui ácidos nucléicos e polipeptídeos otimizados para expressão nestesorganismos e espécies.
Por exemplo, os códons de um ácido nucléico codificando umaenzima aldolase, tal como piruvato aldolase, ΉΜΰ e/ou KHG aldolase isola-da de uma célula bacteriana são modificados de modo que o ácido nucléicoseja otimamente expressado em uma célula bacteriana diferente das bacté-rias das quais a enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase foi derivada, uma levedura, uns fungos, uma célula deplanta, uma célula de inseto ou uma célula de mamífero. Métodos para oti-mização de códons são bem-conhecidos na técnica, vide Patente dos Esta-dos Unidos No. 5.795.737; Baca (2000) Int. J. Parasitol. 30:113-118; Hale(1998) Protein Expr. Purif. 12:185-188; Narum (2001) Infect. Immun.69:7250-7253. Vide também Narum (2001) Infect Irnmun. 69:7250-7253,descrevendo otimização de códons em sistemas de camundongo; Outchkou-rov (2002) Protein Expr. Purif. 24:18-24, descrevendo otimização de códonsem levedura; Feng (2000) Biochemistry 39:15399-15409, descrevendo otimi-zação de códons em E. colr, Humphreys (2000) Protein Expr. Purif. 20:252-264, descrevendo otimização de uso de códon que afeta secreção em E. coli.
Animais não-humanos transgênicos
A invenção fornece animais não-humanos transgênicos compre-endendo um ácido nucléico, um polipeptídeo (tal como uma enzima aldolase,tal como piruvato aldolase, HMG e/ou KHG aldolase), um cassete de ex-pressão ou vetor ou uma célula transfectada ou transformada de acordo coma invenção. Em algumas modalidades, a invenção também fornece métodosde produção e uso destes animais não-humanos transgênicos.
Os animais não-humanos transgênicos podem ser, tais comocães, cabras, coelhos, carneiro, cavalos, peixe, porcos (incluindo todos ossuínos, porcos e animais relacionados), vacas, ratos e camungongos, com-preendendo os ácidos nucléicos de acordo com a invenção. Estes animaispodem ser usados, tais como modelos in vivo para estudar atividade de en-zima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase,ou, como modelos para analisar quanto à agentes que mudam a atividade invivo de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase. As seqüências de codificação para os polipeptídeos a seremexpressados nos animais não-humanos transgênicos podem ser determina-das serem constitutivas, ou, sob o controle de fatores específicos de tecido,específicos de desenvolvimento ou reguladores transcricional induzíveis.
Animais não-humanos transgênicos podem ser determinados egerados usando qualquer método conhecido na técnica; vide Patente dosEstados Unidos Nos. 6.211.428; 6.187.992; 6.156.952; 6.118.044;6.111,166; 6.107.541; 5.959.171; 5.922.854; 5.892.070; 5.880.327;5.891.698; 5.639.940; 5.573.933; 5.387.742; 5.087.571, descrevendo produ-ção e uso de células e ovos transformados e camungongos, ratos, coelhos,carneiro, porcos, galinhas, cabras, peixe e vacas transgênicos. Vide tam-bém, tal como Pollock (1999) J. Immunol. Methods 231:147-157, descreven-do a produção de proteínas recombinantes no leite de animais leiteirostransgênicos; Baguisi (1999) Nat. Biotechnol. 17:456-461, demonstrando aprodução de cabras transgênicas. Patente dos Estados Unidos No.6.211.428, descreve produção e uso de mamíferos não-humanos transgêni-cos que expressam em seus cérebros um constructode ácido nucléico com-preendendo uma seqüência de DNA. Patente dos Estados Unidos No.5.387.742, descreve injeção de seqüências de DNA recombinante ou sintéti-co clonado dentro de ovos de camundongo fertilizados, implante dos ovosinjetados em fêmeas pseudo-grávida, e desenvolvimento para denominarcamungongos transgênicos. Patente dos Estados Unidos No. 6.187.992,descreve produção e uso de um camungongo transgênico.
"Animais de nocaute" podem também ser usados para praticaros métodos de acordo com a invenção. Por exemplo, em algumas modalida-des, os animais transgênicos ou modificados de acordo com a invençãocompreendem um "animal de nocaute," tal como um "camundongo de no-caute," planejado não para expressar um gene endógeno, que é substituídocom um gene expressando uma enzima aldolase, tal como piruvato aldolase,HMG e/ou KHG aldolase de acordo com a invenção, ou, uma proteína defusão compreendendo uma enzima aldolase, tal como piruvato aldolase,HMG e/ou KHG aldolase de acordo com a invenção.
Plantas e Sementes Transgênicas
A invenção fornece plantas e sementes transgênicas compreen-dendo um ácido nucléico, um polipeptídeo (tal como uma enzima aldolase,tal como piruvato aldolase, HMG e/ou KHG aldolase), um cassete de ex-pressão ou vetor ou uma célula transfectada ou transformada de acordo coma invenção. A invenção também fornece produtos ou subprodutos de planta,tais como frutas, óleos, sementes, folhas, extratos e outros mais, incluindoqualquer parte de planta, compreendendo um ácido nucléico e/ou um poli-peptídeo (tal como uma xilanase) da invenção, tal como em que o ácido nu-cléico ou polipeptídeo da invenção é heterológo à planta, parte de planta,semente etc. A planta transgênica (que inclui partes de planta, frutas, se-mentes etc.) pode ser dicotiledônea (um dicotilédone) ou monocotiledônèa(um monocotilédone). Em algumas modalidades, a invenção também forne-ce métodos de produção e uso destas plantas e sementes transgênicos. Aplanta ou célula de planta transgênica expressando um polipeptídeo da pre-sente invenção pode ser construída de acordo com qualquer método conhe-cido na técnica. Vide, por exemplo, Patente dos Estados Unidos No.6.309.872.
Ácidos nucléicos e constructos de expressão de acordo coma invenção podem ser introduzidos dentro de uma célula de planta atravésde quaisquer métodos. Por exemplo, ácidos nucléicos ou constructos de ex-pressão podem ser introduzidos dentro do genoma de uma planta hospedei-ra desejada, ou, os ácidos nucléicos ou constructos de expressão podem serepissomas. Introdução dentro do genoma de uma planta desejada pode serde modo que a produção de enzima aldolase do hospedeiro, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase seja regulada por elemen-tos de controle translacionais ou transcricionais endógenos. Em algumasmodalidades, a invenção também fornece "plantas de nocaute" onde inser-ção de seqüência de gene por, tal como recombinação homóloga, tem inter-rompido a expressão do gene endógeno. Métodos para gerar plantas "denocaute" são bem-conhecidos na técnica, vide Strepp (1998) Proc Natl. A-cad. Sei. USA 95:4368-4373; Miao (1995) Plant J 7:359-365. Vide discussãoem plantas transgênicas, abaixo.
Os ácidos nucléicos de acordo com a invenção podem ser usa-dos para conferir características desejadas em essencialmente qualquerplanta, tal como em plantas produzindo amido, tal como batata, tomate, soja,beterrabas, milho, trigo, arroz, cevada, e outros mais. Ácidos nucléicos deacordo com a invenção podem ser usados para manipular trilhas metabóli-cas de uma planta a fim de otimizar ou alterar expressão de hospedeiro deenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase. Os ácidos nucléicos de acordo com a invenção podem mudar níveis deexpressão ou atividade ou alterar características de compostos ou enzimasnaturalmente produzidos em uma planta. Alternativamente, uma enzima al-dolase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo coma invenção pode ser usada na produção de uma planta transgênica para pro-duzir um composto não naturalmente produzido por esta planta. Isto podediminuir custos de produção ou criar um novo produto.
Em algumas modalidades, a primeira etapa na produção de umaplanta transgênica envolve produção de um constructo de expressão paraexpressão em uma célula de planta. Estas técnicas são bem-conhecidas natécnica. Elas podem incluir seleção e clonagem de um promotor, uma se-qüência de codificação para facilitar ligação eficiente de ribossomas a mRNAe seleção das seqüências terminadoras de gene apropriadas. Um promotorconstitutivo exemplar é CaMV35S, do vírus em mosáico de couve-flor, quegeralmente resulta em um alto grau de expressão em plantas. Outros promo-tores são mais específicos e respondem à dicas no ambiente interno ou ex-terno da planta. Um promotor induzível a luz exemplar é o promotor do genecab, codificando a principal proteína de ligação a/b de clorofila.
Em algumas modalidades, o ácido nucléico é modificado paraobter maior expressão em uma célula de planta. Por exemplo, uma seqüên-cia de acordo com a invenção é provavelmente para possuir uma porcenta-gem elevada de pares de nucleotídeo A-T comparada àquela vista em umaplanta, algumas das quais preferem pares de nucleotídeo G-C. Por esse mo-tivo, nucleotídeos A-T na seqüência de codificação podem ser substituídoscom nucleotídeos G-C sem mudança significantemente da seqüência de a-minoácido para realçar produção do produto de gene em células de planta.Gene marcador selecionável pode ser adicionado ao constructode gene a fim de identificar células ou tecidos de planta que bem sucedida-mene integraram-se ao transgene. Isto pode ser necessário porque obten-ção de incorporação e expressão de genes em células de planta é um raroevento, ocorrendo em apenas alguns por centos dos tecidos ou células alve-jados. Genes marcadores selecionáveis codificam proteínas que fornecemresistência a agentes que são normalmente tóxicos às plantas, tais comoantibióticos ou herbicidas. Apenas células de planta que integraram-se aogene marcador selecionável sobreviverão quando cultivadas em um meiocontendo o antibiótico ou herbicida apropriado. Tal como para outros genesinseridos, genes marcadores também requerem seqüências de promotor eterminação para função própria.
Em algumas modalidades, produção de plantas ou sementestransgênicas compreende incorporação de seqüências de acordo com a in-venção e, opcionalmente, genes marcadores dentro de um constructode ex-pressão alvo (tal como um plasmídeo), junto com posicionamento do promo-tor e das seqüências, terminadoras. Isto pode envolver transferência do genemodificado para dentro da planta por meio de um método adequado. Porexemplo, um constructo pode ser introduzida diretamente dentro do DNAgenômico da célula de planta usando técnicas tais como eletroporação emicroinjeção de protoplastos de célula de planta, ou os constructos podemser introduzidos diretamente ao tecido de planta usando métodos balísticos,tais como bombardeio de partícula de DNA. Por exemplo, vide Christou(1997) Plant Mol. Biol. 35:197-203; Pawlowski (1996) Mol. Biotechnol. 6:17-30; Klein (1987) Nature 327:70-73; Takumi (1997) Genes Genet. Syst. 72:63-69, discutindo uso de bombardeio de partícula para introduzir transgenesdentro de trigo; e Adam (1997) supra, quanto ao uso de bombardeio de par-tícula para introduzir YACs dentro de células de planta. Por exemplo, Rine-hart (1997) supra, bombardeio de partícula usado para gerar plantas de aí-godão transgênicas. Aparelho para aceleração de partículas é descrito emPatente dos Estados Unidos No. 5.015.580; e, o instrumento de aceleraçãode partícula (Bio-Rad, Hercules, CA) Bio-Rad (BioIistics) PDS-2000 comerci-almente disponível; vide também, John, Patente dos Estados Unidos No.5.608.148; e Ellis, Patente dos Estados Unidos No. 5.681.730, descrevendotransformação mediada por partícula de gimnosperma.
Em algumas modalidades, protoplastos podem ser imobilizadose injetados com um constructo de ácidos nucléicos, tal como uma de ex-pressão. Ainda que regeneração de planta de protoplastos não seja fácilcom cereais, regeneração de planta é possível em legumes usando embrio-gênese somática de calo derivado de protoplasto. Tecidos organizados po-dem ser transformados com DNA nu usando técnica de pistola de gene, on-de DNA é revestido sobre microprojéteis de tungstênio, disparados 1/100 dotamanho das células, que transportam o DNA plenamente para dentro dascélulas e organelas. Tecido transformado é então induzido para regerar-se,geralmente por embriogênese somática. Esta técnica tem sido bem sucedidaem diversas espécies de cereal incluindo milho e arroz.
Ácidos nucléicos, tais como constructos de expressão, podemtambém ser introduzidas dentro de células de planta usando vírus recombi-nantes. Células de planta podem ser transformadas usando vetores virais,tais como vetores derivados de vírus em mosaico de tabaco (Rouwendal(1997) Plant Mol. Biol. 33:989-999), vide Porta (1996) "Use of viral repliconsforthe expressão of genes in plantas," Mol. Biotechnol. 5:209-221.
Alternativamente, constructos de ácidos nucléicos, tais comouma de expressão, pode ser combinada com regiões de flanqueamento deT-DNA adequadas e introduzida dentro de um vetor de hospedeiro de Agro-bacterium tumefaciens convencional. As funções de virulência do hospedeirode Agrobacterium tumefaciens controlarão a inserção do constructo e adja-cente marcador para dentro do DNA de célula de planta quando a célula forinfectada pelas bactérias. Técnicas de transformação mediada por Agrobac-terium tumefaciens, incluindo desarmamento e uso de vetores binários, sãobem descritas na literatura científica. Vide Horsch (1984) Science 233:496-498; Fraley (1983) Proc. Nati Acad. Sei. USA 80:4803 (1983); Gene Trans-fer to Plants, Potrykus, ed. (Springer-Verlag, Berlin 1995). O DNA em umacélula de A. tumefaciens está contido no cromossoma bacteriano assim co-mo em outra estrutura conhecida como um plasmídeo Ti (indutor de tumor).
O plasmídeo Ti contém um trecho de DNA chamado T-DNA (-20 kb decomprimento) que é transferido à célula de planta no processo de infecção euma série de genes de vir (virulência) que controlam o processo de infecção.
A. tumefaciens pode apenas infectar uma planta por meio de ferimentos:quando uma raiz ou caule de planta é ferida ela produz certos sinais quími-cos, em resposta ao que, os genes de vir de A. tumefaciens vêm a ser ativa-dos e controlam uma série de eventos necessários para a transferência doT-DNA do plasmídeo Ti ao cromossoma da planta.
O T-DNA então entra na célula de planta por meio do ferimento.
Uma especulação é que o T-DNA espere até que o DNA de planta estejasendo replicado ou transcrito, então insira-se dentro do DNA de planta ex-posto. A fim de usar A. tumefaciens como um vetor de transgene, a seçãoindutora de tumor de T-DNA tem de ser removida, enquanto retendo as regi-ões de borda de T-DNA e os genes de vir. O transgene é então inserido en-tre as regiões de borda de T-DNA, onde ele é transferido à célula de planta evem a ser integrado dentro dos cromossomas da planta.
A invenção fornece a transformação dè plantas monocotiledô-neas usando os ácidos nucléicos de acordo com a invenção, incluindo cere-ais importantes, vide Hiei (1997) Plant Mol. Biol. 35:205-218. Vide também,Horsch, Science (1984) 233:496; Fraley (1983) Proc. Natl. Acad. Sci USA80:4803; Thykjaer (1997) supra; Park (1996) Plant Mol. Biol: 32:1135-1148,discutindo integração de T-DNA dentro de DNA genômico. Vide tambémD1IHaIIuin, Patente dos Estados Unidos No. 5.712.135, descrevendo um pro-cesso para a integração estável de um DNA compreendendo um gene que éfuncional em uma célula de uma cereal, ou outra planta monocotiledônea.
Em algumas modalidades, a terceira etapa envolve seleção eregeneração de plantas inteiras capazes de transmissão do gene alvo incor-porado à próxima geração. Tais técnicas de regeneração podem usar mani-pulação de certos fitohormônios em um meio de desenvolvimento de culturade tecido. Em algumas modalidades, o método usa um marcador biocidae/ou herbicida que foi introduzido junto com as seqüências de nucleotídeodesejadas. Regeneração de planta de protoplastos cultivados é descrita emEvans e outros, Protoplasts Isolation and Culture, Handbook of Plant CellCulture, pp. 124-176, MacMiIIiIan Publishing Company, New York, 1983; eLigação, Regeneration of Plantsl Plant Protoplasts, pp. 21-73, CRC Press,Boca Raton, 1985. Regeneração pode também ser obtida de calo de planta,explantes, órgãos, ou partes desta. Tais técnicas de regeneração são descri-tas geralmente em Klee (1987) Ann. Rev. of Plant Phys. 38:467-486. Paraobter plantas inteiras de tecidos transgênicos tais como embriões imaturos,elas podem ser cultivadas sob condições ambientais controladas em umasérie de meios contendo nutrientes e hormônios, um processo conhecidocomo cultura de tecido. Uma vez que plantas inteiras são geradas e produ-zem semente, avaliação da progênia começa.
Em algumas modalidades, depois que o cassete de expressão éestavelmente incorporado em plantas transgênicas, ele pode ser introduzidodentro de outras plantas por cruzamento sexual. Quaisquer de várias técni-cas de reprodução padrões podem ser usadas, dependendo das espécies aserem cruzadas. Porque expressão transgênica dos ácidos nucléicos de a-cordo com a invenção resulta em mudanças fenotípicas, plantas compreen-dendo os ácidos nucléicos recombinantes de acordo com a invenção podemser sexualmente cruzadas com uma segunda planta para obter um produtofinal. Desta forma, a semente de acordo com a invenção pode ser derivadade um cruzamento entre duas plantas transgênicas de acordo com a inven-ção, ou um cruzamento entre uma planta de acordo com a invenção e outraplanta. Os efeitos desejados (tais como expressão dos polipeptídeos de a-cordo com a invenção para produzir uma planta na qual comportamento deflorescimento é alterado) podem ser realçados quando ambas as plantasparentais expressam os polipeptídeos (tais como uma enzima aldolase, talcomo piruvato aldolase, HMG e/ou KHG aldolase) de acordo com a inven-ção. Os efeitos desejados podem ser passados a gerações de planta futurasatravés de métodos de propagação padrões.
Em algumas modalidades, os ácidos nucléicos e polipeptídeosde acordo com a invenção são expressados em ou inseridos em qualquerplanta ou semente. Plantas transgênicas de acordo com a invenção podemser dicotiledôneas ou monocotiledôneas. Exemplos de plantas transgênicasmonocotiledôneas de acordo com a invenção são gramas, tais como gramado prado (grama azul, Pod), grama forragem tal como festuca, lólio, gramatemperada, tal como Agrostis, e cereais, tais como trigo, aveias, centeio, ce-vada, arroz, sorgo, e milho. Exemplos de plantas transgênicas dicotilédonesde acordo com a invenção são tabaco, legumes, tais como tremoços, batata,beterraba açucareira, ervilha, feijão e soja, e plantas crucífero (família Bras-sicaceae), tais como couve-flor, semente de colza, e o organismo modeloestritamente relacionado Arabidopsis ihaliana. Desta forma, as plantas esementes transgênicas de acordo com a invenção incluem uma ampla faixade plantas, incluindo, mas não-limitado a, espécies dos gêneros Anacardi-um, Arachis, Asparagus, Atropa, Avena, Brassica, Citrus, Citrullusl Capsi-cum, Carihamus, Cocos, Coffea, Cucumis, Cucurbita, Daucus, Elaeis, Fraga-ria, Glycine, Gossypium, Helianthus, Heterocallis, Hordeum, Hyoscyamus,Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Malus, Manihot, principála-na, Medicago, Nicotiana, Olea, Oryza, Panieum, Pannisetum, Persea, Pha-seolus, Pistachia, Pisum, Pyrus, Prunus, Raphanus, Ricinus, Secale, Sene-cio, Sinapis, Solatium, Sorghum, Theobromus, Trigonella, Triticum, Vicia,Vitis, Vigna, e Zea.
Em modalidades alternativas, os ácidos nucléicos de acordocom a invenção são expressados em plantas as quais contêm células defibra, incluindo, tais como algodão, árvore de algodão de seda (Kapok, Ceibapentandra), salgueiro deserto, arbusto creosoto, "winterfaf pau-de-balsa,rami, kenaf, cânhamo, roselle, juta, abacá de sisal e linho. Em modalidadesalternativas, as plantas transgênicas de acordo com a invenção podem sermembros do gênero Gossypium, incluindo membros de quaisquer espéciesde Gossypium, tais como G. arboreum; G. herbaceum, G. barbadense, e G.hirsutum.
A invenção também fornece plantas transgênicas para seremusadas para produção de grandes quantidades dos polipeptídeos (tais comouma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolaseou anticorpo) de acordo com a invenção. Por exemplo, vide Palmgren (1997)Trends Genet. 13:348; Chong (1997) Transgenic Res.' 6:289-296 (produçãode proteína de leite humano beta-caseína em plantas de batata transgênicasusando um promotor de manopina sintase (mas V,2') direcional induzíveispor auxina com métodos de transformação de disco de folha mediada porAgrobacterium tumefaciens).
Usando procedimentos conhecidos, aquele de versatilidade pode anali-sar quanto à plantas de acordo com a invenção por detecção do aumento oudiminuição de mRNA de transgene ou proteína em plantas transgênicas.Métodos para detecção e quantificação de mRNAs ou proteínas são bem-conhecidos na técnica.
Polipeptídeos e oeptídeos
Em algumas modalidades, a invenção fornece polipeptídeos iso-lados, sintéticos ou recombinantes possuindo uma identidade de seqüência(tal como pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%,58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%,71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%,84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%,97%, 98%, 99% de identidade de seqüência, ou mais, ou completa (100%),ou homologia) a uma seqüência de acordo com a invenção, tais como prote-ínas possuindo uma seqüência tal como apresentado em SEQ ID NO:2,SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ ID NO:12,SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID N0:20, SEQ IDNO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID N0:30, SEQID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID N0:40,SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ IDN0:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQID N0:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68,SEQ ID N0:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ IDNO:78, SEQ ID N0:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQID NO:88, SEQ ID N0:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96,SEQ ID NO:98, SEQ ID NO: 100, SEQ ID N0:102, SEQ ID N0:104, SEQ IDΝ0:106, SEQ ID Ν0:108, SEQ ID Ν0:110, SEQ ID ΝΟ:112, SEQ IDΝΟ:114, SEQ ID ΝΟ:116, SEQ ID ΝΟ:118, SEQ ID Ν0:120, SEQ BDΝο:122, SEQ ID ΝΟ:124, SEQ ID ΝΟ:126, SEQ ID ΝΟ:128, SEQ ID Ν0:130,SEQ ID ΝΟ:132, SEQ ID ΝΟ:134, SEQ ID ΝΟ:136, SEQ ID ΝΟ:138, SEQ IDΝ0:140, SEQ ID ΝΟ:142, SEQ ID ΝΟ:144, SEQ ID ΝΟ:146, SEQ ID NO:148, SEQ ID NO: 150, SEQ ID ΝΟ:152, SEQ ID ΝΟ:154, SEQ ID ΝΟ:156,SEQ ID NO: 158, SEQ ID Ν0:160, SEQ ID ΝΟ:162, SEQ ID ΝΟ:164, SEQID ΝΟ:166, SEQ ID ΝΟ:168, SEQ ID Ν0:170, SEQ ID ΝΟ:172, SEQ IDNO: 174, SEQ ID ΝΟ:176, SEQ ID ΝΟ:178, SEQ ID Ν0:180, SEQ IDNO: 182, SEQ ID ΝΟ:184, SEQ ID Ν0:186, SEQ ID ΝΟ:188, SEQ IDNO: 190, SEQ ID ΝΟ:192, SEQ ID ΝΟ:194, SEQ ID ΝΟ:196, SEQ IDNO: 198, SEQ ID Ν0:200, SEQ ID Ν0:202, SEQ ID Ν0:204, SEQ IDΝ0:206, SEQ ID Ν0:208, SEQ ID Ν0:210, SEQ ID ΝΟ:212, SEQ IDΝΟ:214, SEQ ID ΝΟ:216, SEQ ID ΝΟ:218, SEQ ID Ν0:220, SEQ IDΝΟ:222, SEQ ID ΝΟ:224, SEQ ID ΝΟ:226, SEQ ID ΝΟ:228, SEQ IDΝ0:230, SEQ ID ΝΟ:232, SEQ ID ΝΟ:234, SEQ ID ΝΟ:236, SEQ IDΝΟ:238, SEQ ID Ν0:240, SEQ ID ΝΟ:242, SEQ ID ΝΟ:244, SEQ IDΝΟ:246, SEQ ID ΝΟ:248, SEQ ID Ν0:250, SEQ ID ΝΟ:252, SEQ IDΝΟ:254, SEQ ID ΝΟ:256, SEQ ID ΝΟ:258, SEQ ID Ν0:260, SEQ IDΝΟ:262, SEQ ID ΝΟ:264, SEQ ID Ν0:266, SEQ ID ΝΟ:268, SEQ EDΝο:270, SEQ ID ΝΟ:272, SEQ ID ΝΟ:274, SEQ ID ΝΟ:276, SEQ ID ΝΟ:278,SEQ ID Ν0:280, SEQ ID ΝΟ:282, SEQ ID ΝΟ:284, SEQ ID ΝΟ:286, SEQ IDΝΟ:288, SEQ ID Ν0:290, SEQ ID ΝΟ:292, SEQ ID ΝΟ:294, SEQ IDΝΟ:296, SEQ ID ΝΟ:298, SEQ ID Ν0:300, SEQ ID Ν0:302, SEQ IDΝ0:304, SEQ ID Ν0:306, SEQ ID Ν0:308, SEQ ID Ν0:310, SEQ IDΝΟ:312, SEQ ID ΝΟ:314, SEQ ID ΝΟ:316, SEQ ID ΝΟ:318, SEQ IDΝ0:320, SEQ ID ΝΟ:322, SEQ ID ΝΟ:324, SEQ ID ΝΟ:326, SEQ IDΝΟ:328, SEQ ID Ν0:330, SEQ ID ΝΟ:332, ou SEQ ID ΝΟ:334 e fragmentosenzimaticamente ativos destas. A identidade de seqüência em porcentagempode ser sobre o comprimento total do polipeptídeo, ou, a identidade podeser sobre uma região de pelo menos cerca de 50, 60, 70, 80, 90, 100, 150,200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 ou mais resíduos. Po-lipeptídeos de acordo com algumas modalidades da invenção pode tambémser mais curtos do que o comprimento total dos polipeptídeos. Em outrasmodalidades, a invenção fornece polipeptídeos (peptídeos, fragmentos) vari-ando no tamanho entre cerca de 5 e o comprimento total de um polipeptídeo,tal como uma enzima, tal como uma enzima aldolase, tal como piruvato aldo-lase, HMG e/ou EIHG aldolase; tamanhos exemplares sendo de cerca de 5,10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125,150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, ou maisresíduos, tais como resíduos contíguos de uma aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase enzima de acordo com a inven-ção. Peptídeos de acordo com a invenção (tais como uma subseqüência deum polipeptídeo de acordo com a invenção) podem ser úteis como, tais co-mo sondas de rotlação, antígenos (imunógenos), toleragens, motivos, sítiosativos de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase (tais como "domínios catalíticos"), seqüências de sinal e/oudomínios "prepro".
Em outras modalidades, polipeptídeos de acordo com a inven-ção possuindo atividade de aldolase, tal como atividade de piruvato aldolase,tal como HMG e/ou KHG aldolase são membros de um gênero de polipeptí-deos compartilhando elementos estruturais específicos, tais como resíduosde aminoácido, que correlacionam-se com atividade de aldolase, incluindoatividade de piruvato tal como, sem limitação, atividade de HMG e/ou KHGaldolase. Estes elementos estruturais compartilhados podem ser usados pa-ra a geração de rotina de variantes de aldolase, tal como piruvato aldolase,tal como HMG e/ou KHG aldolase. Estes elementos estruturais compartilha-dos de enzimas aldolase, tais como piruvato aldolase, tal como HMG e/ouKHG aldolase de acordo com a invenção podem ser usados como orienta-ção para a geração de rotina de variantes de enzimas aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldolase dentro do escopo dogênero de polipeptídeos de acordo com a invenção.
Tal como usado aqui, os termos "aldolase, tal como piruvato al-dolase, tal como HMG e/ou KHG aldolase" abrangem qualquer polipeptídéòou enzimas capazes de catálise da reação de adição de aldol ou da reaçãode retro-aldol (tal como polipeptídeos de acordo com a invenção, vide tam-bém Tabela 1 e Exemplos 4, 5 e 6, abaixo), ou qualquer modificação de ummaterial contendo ligação carbono-carbono, tal como na produção de ácidoglutárico de 2-(indol-3ilmetil)-4-ceto de R-2-hidróxi (R-MP) e certos estereoi-sômeros de monatina, tais como R1R e S,R monatina, e sais destes.
Polipeptídeos de acordo com algumas modalidades da invençãocatalisam a formação de ligações de carbono-carbono em uma reação dealdol e possuem a capacidade de utilizar piruvato ou fosfoenolpiruvato comoo componente nucleofílico na síntese de uma estrutura de 4-hidróxi-2-cetobutirato tal como mostrado no esquema geral abaixo.
<formula>formula see original document page 211</formula>
a-ceto áci-do, cetonaou aceptor derivado dede aldeído piruvato
R = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída
R2 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída
R3 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída, ácido carboxílico.
Sem ficar preso à teoria, acredita-se que o fragmento de quatro-carbono conservado preparado em todas as condensações catalisadas porpiruvato aldolase é tanto densamente quanto diferencialmente funcionaliza-do. Além do mais, em cada aduzido, quatro diferentes estados de oxidaçãode carbono estão contidos em quatro carbonos contíguos. A estrutura prepa-rada por piruvato aldolases desta forma permite a preparação de ácidos a-amino-y-hidroxicarboxílicos, ácidos β- hidroxicarboxílicos, ácidos α,γ-dihidroxicarboxílicos, e açúcares de 2-desoxialdose tal como mostrado noesquema abaixo.<formula>formula see original document page 212</formula>
Por esse motivo, piruvato aldolases de acordo com algumasmodalidades da invenção podem ser sinteticamente versáteis e podem serusadas na preparação de uma ampla faixa de produtos para uso em alimen-tações animais, alimentos humanos, processos industriais, e produtos far-macêuticos (vide, por exemplo, Gijsen, H.J.M. e outros, Recent Advances inthe Chemoenzimatic Synthesis of Carbohydrates abd Carbohydrate Mime-tics, Chem. Rev. 1996, 96, 443-473; Henderson, D.P. e outros J. Org.Chem., Stereospecific Preparation Of the N-Terminal Amino Acid Moiety ofNikkomycins KX e KZ via a Multiple Enzima Synthesis, 1997, 62, 7910-7911;Wymer, N. & Toone, EJ. Enzima-catalyzed Synthesis of Carbohydrates. Cur-rent Opin. Chemical Biology, 2000, 4, 110-119).
Polipeptídeos de acordo com algumas modalidades da invençãopodem possuir mais do que um tipo de atividade enzimática, especificamen-te atividade de aldolase e uma atividade adicional, por exemplo, tal comoapresentado na Tabela 1, abaixo. Por exemplo, um polipeptídeo de acordocom a invenção pode possuir atividade de aldolase, atividade de piruvatoaldolase, HMG e/ou KHG aldolase. Adicionalmente, o polipeptídeo podepossuir, ou pode ser acreditado possuir, atividade de enzima adicional combase em sua classificação EC. A Tabela 1 inclui a coluna "Número EC Predi-to". Um número EC é o número designado a um tipo de enzima de acordocom um esquema de nomenclatura de enzima padronizado desenvolvidopela de Comissão de Enzima do Comitê de Nomenclatura da União Interna-cional de Bioquímica e Biologia Molecular (IUBMB). Os resultados na colunade "Número EC Predito" são determinados por uma busca BLAST contra abase de dados Kegg (Kyoto Encyclopedia of Genes and Genomes). Se acomparação BLAST de acerto (também chamado um "acerto") possui umvalor de E igual a ou menos do que e"6, o número EC designado para com-paração de topo é registrada dentro da tabela. O número EC do top hit é u-sado como um guia ao que o número EC da seqüência da invenção poderiaser. Em exemplos onde apenas um número EC parcial é dado, apenas umaampla classificação pode ser designada com base no acerto de nível maisalto. Por exemplo, na primeira fileira, para SEQ ID N0:2, codificada por SEQID NO:1, ò número EC predito é listado como "2...". Por esse motivo, a clas-sificação designada é amplamente uma transferase. Para SEQ ID NO:26,codificada por SEQ ID NO:25, a classificação mais específica que pode serdesignada com base no acerto de nível mais alto é como uma aldeído-liase.
Tabela 1
SEQ ID Atividade Subclasse de Número SinaIP Sinal Fonte
NO: aldolase EC Predi- to (AA = Ami- noácido) 1,2 Aldolase HMG 2... Bactérias 3,4 Aldolase HMG 2... Desconhecido 5, 6 Aldolase HMG 2... Desconhecido 7,8 Aldolase HMG 2... Desconhecido 9, 10 Alaolase HMG 2... Desconhecido 11, 12 Aldolase HMG 2... Desconhecido 13, 14 Aldolase HMG 2... Desconhecido 15, 16 Aldolase HMG 2... Desconhecido 17, 18 Aldolase HMG 2... Desconhecido 19,20 Aldolase HMG 2... Desconhecido 21,22 Aldolase HMG Desconhecido 23,24 Aldolase HMG 2... Desconhecido 25,26 Aldolase HMG 4.1.2. Desconhecido 27,28 Aldolase HMG 2... Desconhecido 29,30 Aldolase HMG 2... Desconhecido 31,32 Aldolase HMG 2... Desconhecido 33,34 Aldolase HMG 2... Desconhecido35,36 Aldolase HMG 2... Desconhecido 37,38 Aldolase HMG 2... Desconhecido 39,40 Aldolase HMG 2... Desconhecido 41,42 Aldolase HMG 2... Desconhecido 43,44 Aldolase HMG 2... Desconhecido 45,46 Aldolase HMG 2... Desconhecido 47,48 Aldolase HMG 2... Desconhecido 49,50 Aldolase HMG 2... Desconhecido 51,52 Aldolase HMG 2... Desconhecido 53,54 Aldolase HMG 2... Desconhecido 55,56 Aldolase HMG 2... Desconhecido 57,58 Aldolase HMG 2... Desconhecido 59,60 Aldolase HMG 2... Desconhecido 61,62 Aldolase HMG 2... Desconhecido 63,64 Aldolase HMG 2... Desconhecido 65,66 Aldolase HMG AA1-27 Desconhecido 67,68 Aldolase HMG 2... Desconhecido 69,70 Aldolase HMG 2... Desconhecido 71,72 Aldolase HMG 2... Desconhecido 73,74 Aldolase HMG 2... Desconhecido 75,76 Aldolase HMG 2... Desconhecido 77,78 Aldolase HMG 2... Desconhecido 79,80 Aldolase HMG 2... Desconhecido 81,82 Aldolase HMG 2... Desconhecido 83.84 Aldolase HMG 2... Desconhecido 85,86 Aldolase HMG 2... Desconhecido 87,88 Aldolase HMG 2... Desconhecido 89,90 Aldolase HMG 2... Desconhecido 91,92 Aldolase HMG 2... Desconhecido 93,94 Aldolase HMG 2... Desconhecido 95,96 Aldolase HMG 2... Desconhecido 97,98 Aldolase HMG 2... Desconhecido99, 100 Aldolase HMG 2... Desconhecido 101, 102 Aldolase HMG 2... Desconhecido 103 104 Aldolase HMG 2... Desconhecido 105 106 Aldolase HMG 2... Desconhecido 107 108 Aldolase HMG 2... Desconhecido 109 110 Aldolase HMG 2... Desconhecido 111 112 Aldolase HMG 2... Desconhecido 113 114 Aldolase HMG 2... Desconhecido 115 116 Aldolase HMG 2... Desconhecido 117 118 Aldolase HMG 2... Desconhecido 119 120 Aldolase HMG 2... Desconhecido 121 122 Aldolase HMG 2... Desconhecido 123 124 Aldolase HMG 2... Desconhecido 125 126 Aldolase HMG 2... Desconhecido 127 128 Aldolase HMG 2... Desconhecido 129 130 Aldolase HMG 2... Desconhecido 131 132 Aldolase HMG 2... Desconhecido 133 134 Aldolase HMG 2... Desconhecido 135 136 Aldolase HMG 2... Desconhecido 137 138 Aldolase HMG 2... Desconhecido 139 140 Aldolase HMG 2... Desconhecido 141 142 Aldolase HMG 2... Desconhecido 143 144 Aldolase HMG 2... Desconhecido 145 146 Aldolase HMG 2... Desconhecido 147 148 Aldolase HMG 2... Desconhecido 149 150 Aldolase HMG 2... Desconhecido 151 152 Aldolase HMG 2... Desconhecido 153 154 Aldolase HMG 2... Desconhecido 155 156 Aldolase HMG 2... Desconhecido 157 158 Aldolase HMG 2... Desconhecido 159 160 Aldolase HMG 2... Desconhecido 161 162 Aldolase HMG 2... Desconhecido163 164 Aldolase HMG 2... Desconhecido 165 166 Aldolase HMG 2... Desconhecido 167 168 Aldolase HMG 2... Desconhecido 169 170 Aldolase HMG 2... Desconhecido 171 172 Aldolase HMG 2... Desconhecido 173 174 Aldolase HMG 2... Desconhecido 175 176 Aldolase HMG 2... Desconhecido 177 178 Aldolase HMG 2... Desconhecido 179 180 Aldolase HMG 2... Desconhecido 181 182 Aldolase HMG ΑΑ1-31 Desconhecido 183 184 Aldolase HMG 2... Desconhecido 185 186 Aldolase HMG 2... Desconhecido 187 188 Aldolase HMG 2... Desconhecido 189 190 Aldolase HMG 2... Desconhecido 191 192 Aldolase HMG 2... Desconhecido 193 194 Aldolase HMG 2... Desconhecido 195 196 Aldolase HMG 2... Desconhecido 197 198 Aldolase HMG 2... Desconhecido 199 200 Aldolase HMG 2... Desconhecido 201 202 Aldolase HMG 2... Desconhecido 203 204 Aldolase HMG 2... Desconhecido 205 206 Aldolase HMG 2... Desconhecido 207 208 Aldolase HMG 2... Desconhecido 209 210 Aldolase HMG 2... Desconhecido 211 212 Aldolase HMG 2... Desconhecido 213 214 Aldolase HMG 2... Desconhecido 215 216 Aldolase HMG 2... Desconhecido 217 218 Aldolase HMG 2... Desconhecido 219 220 Aldolase HMG 2... Desconhecido 221 222 Aldolase HMG 2... Desconhecido 223 224 Aldolase HMG 2... Desconhecido 225, 226 Aldolase HMG 2... Desconhecido227 228 Aldolase HMG 2... Desconhecido 229 230 Aldolase HMG 2... Desconhecido 231 232 Aldolase HMG 2... Desconhecido 233 234 Aldolase HMG 2... Desconhecido 235 236 Aldolase HMG 2... Desconhecido 237 238 Aldolase HMG 2... Desconhecido 239 240 Aldolase HMG 2... Desconhecido 241 242 Aldolase HMG 2... Desconhecido 243 244 Aldolase HMG 2... Desconhecido 245 246 Aldolase HMG 2... Desconhecido 247 248 Aldolase HMG 2... Desconhecido 249 250 Aldolase HMG 2... Desconhecido 251 252 Aldolase HMG 2... Desconhecido 253 254 Aldolase HMG 2... Desconhecido 255 256 Aldolase HMG 2... Desconhecido 257 258 Aldolase HMG 2... Desconhecido 259 260 Aldolase HMG ΑΑ1-18 Desconhecido 261 262 Aldolase HMG 2... Desconhecido 263 264 Aldolase HMG 2... Desconhecido 265 266 Aldolase HMG 2... Desconhecido 267 268 Aldolase HMG 2... Desconhecido 269 270 Aldolase HMG 2... Desconhecido 271 272 Aldolase HMG 2... Desconhecido 273 274 Aldolase HMG 2... Desconhecido 275 276 Aldolase HMG 2... Desconhecido 277 278 Aldolase HMG 2... Desconhecido 279 280 Aldolase HMG 2... Desconhecido 281 282 Aldolase HMG 2... Desconhecido 283 284 Aldolase HMG 2... Desconhecido 285 286 Aldolase HMG 2... Desconhecido 287 288 Aldolase HMG 2... Desconhecido 289, 290 Aldolase HMG 2... Desconhecido291, 292 Aldolase HMG 2... Desconhecido293, 294 Aldolase HMG 2... Desconhecido295, 296 Aldolase HMG 2... Desconhecido297, 298 Aldolase HMG 2... Desconhecido299, 300 Aldolase HMG 2.1.. Desconhecido301,302 Aldolase HMG 2.1.. Desconhecido303, 304 Aldolase HMG 2.1.. Desconhecido305, 306 Aldolase HMG 4.1.2 .14 Desconhecido307, 308 Aldolase HMG 4.1.2 .14 Desconhecido309, 310 Aldolase HMG 4.1.2 .14 Desconhecido311, 312 Aldolase HMG 4.1.2 .14 Desconhecido313, 314 Aldolase HMG 4.1.2 .14 Desconhecido315, 316 Aldolase HMG 4.1.2 .14 Desconhecido317, 318 Aldolase HMG 4.1.2 .14 Desconhecido319, 320 Aldolase HMG 4.1.3 .16 Desconhecido321, 322 Aldolase HMG 4.1.2 .14 Desconhecido323, 324 Aldolase HMG 4.1.2 .14 Desconhecido325, 326 Aldolase HMG 4.1.2 .14 Desconhecido327, 328 Aldolase HMG 4.1.2 .14 Desconhecido329,330 Aldolase HMG 4.1.3 .16 Desconhecido331, 332 Aldolase HMG 4.1.2 .14 Desconhecido333, 334 Aldolase HMG 4.1.2 .14 Desconhecido
Polipeptídeos e peptídeos de acordo com a invenção podem ser poli-peptídeos isolados de fontes naturais, ser sintéticos, ou ser recombinante-mente gerados. Peptídeos e proteínas podem ser recombinantemente ex-pressados in vitro ou in vivo. Os peptídeos e polipeptídeos de acordo com ainvenção podem ser produzidos e isolados usando qualquer método conhe-cido na técnica. Polipeptídeo e peptídeos de acordo com a invenção podemtambém ser sintetizados, na totalidade ou em parte, usando métodos quími-cos bem-conhecidos na técnica. Vide tal como Caruthers (1980) Nucleic A-cids Res. Symp. Ser. 215-223; Horn (1980) Nucleic Acids Res. Symp. Ser.225-232; Banga, A.K., Therapeutic Peptides and Proteins, Formulation, Pro-cessing and Delivery Systems (1995) Technomic Publishing Co., Lancaster1PA. Por exemplo, síntese de peptídeo pode ser desempenhada usando vá-rias técnicas de fase sólida (vide tal como Roberge (1995) Science 269:202;Merrifield (1997) Methods Enzymol. 289:3-13) e síntese automatizada podeser obtida, tal como usando o Sintetizador de Peptídeo ABI 431A (PerkinElmer) de acordo com as instruções fornecidas pelo fabricante.
Peptídeos e polipeptídeos de acordo com a invenção podemtambém ser glicosilados. A glicosilação pode ser adicionada pós-translacionalmente ou quimicamente ou por mecanismos biossintéticos celu-lares, em que o último incorpora o uso de motivos de glicosilação conheci-dos, que podem ser nativos à seqüência ou podem ser adicionados comoum peptídeo ou adicionados na seqüência de codificação de ácido nucléico.A glicosilação pode ser ligada a O ou ligada a N.
Em algumas modalidades, quando indicado, peptídeos e poli-peptídeos de acordo com a invenção podem incluir todas as formas "miméti-cas" e "peptidomiméticas". Os termos "mimético" e "peptidomimético" refe-rem-se a um composto químico sintético que possui substancialmente asmesmas características estruturais e/ou funcionais dos polipeptídeos de a-cordo com a invenção. O mimético pode ser ou totalmente composto de aná-logos não naturais sintéticos de aminoácidos, ou, é uma molécula quiméricade aminoácidos de peptídeo parcialmente naturais e análogos parcialmentenão naturais de aminoácidos. O mimético pode também incorporar qualquerquantidade de substituições conservadoras de aminoácido natural contantoque tais substituições também não alterem substancialmente a estruturae/ou atividade do mimético. Tal como com polipeptídeos de acordo com ainvenção que são variantes conservadoras ou membros de um gênero depolipeptídeos de acordo com a invenção (tais como possuindo cerca de 50%ou mais identidade de seqüência a uma seqüência de acordo com a inven-ção), experimentação de rotina determinará se um mimético está dentro doescopo de acordo com a invenção, isto é, que sua estrutura e/ou função nãoé substancialmente alterada. Desta forma, em algumas modalidades, umacomposição de mimético está dentro do escopo de acordo com a invençãoe ela possui uma atividade de enzima aldolase, tal como piruvato aldolase,tal como HMG e/ou KHG aldolase.
Composições de mimético de polipeptídeo de acordo com a invençãopodem conter qualquer combinação de componentes estruturais não natu-rais. Em uma modalidade alternativa, composições de mimético de acordocom a invenção incluem um ou todos dos seguintes três grupos estruturais:a) grupos de ligação de resíduo outro que não as ligações de ligação de a-mida natural ("ligação de peptídeo"); b) resíduos não naturais em vez de re-síduos de aminoácido de ocorrência natural; ou c) resíduos que induzemarremedo estrutural secundário, isto é, para induzir ou estabilizar uma estru-tura secundária, tal como uma conformação helicoidal beta, helicoidal gama,lâmina beta, hélice alfa, e outros mais. Por exemplo, um polipeptídeo de a-cordo com a invenção pode ser caracterizado como um mimético quandotodos ou alguns de seus resíduos são ligados por métodos químicos outrosque não ligações de peptídeo natural. Resíduos de peptidomimético indivi-duais podem ser ligados por ligações de peptídeo, outras ligações químicasou métodos de acoplamento, tais como glutaraldeído, ésteres de N-hidroxissucinimida, maleimidas bifuncionais, Ν,Ν'-diciclohexilcarbodiimida(DCC) ou Ν,Ν'-diisopropilcarbodiimida (DIC). Grupos de ligação que podemser uma alternativa às ligações de ligação de amida tradicional ("ligação depeptídeo") incluem, tais como cetometileno (tal como -C(=0)-CH2- para -C(=0)-NH-), aminometileno (CH2-NH), etileno, olefina (CH=CH), éter (CH2-O), tioéter (CH2-S), tetrazol (CN4-), tiazol, retroamida, tioamida, ou éster (vi-de Spatola (1983) in Chemistry and Biochemistry of Amino Acids, Peptidesand Proteins, Vol. 7, pp 267-357, " Peptide Backbone Modifications," MarcellDekker, NY).
Um polipeptídeo de acordo com a invenção pode também sercaracterizado como um mimético por conter todos ou alguns resíduos nãonaturais em vez de resíduos de aminoácido de ocorrência natural. Resíduosnão naturais são bem descritos na literatura científica e de patente; algumascomposições não naturais exemplares úteis como miméticos de resíduos deaminoácido naturais e normas são descritas abaixo. Miméticos de aminoáei-dos aromáticos podem ser gerados por substituição por, tal como D- ou L-nafilalanina; D- ou L- fenilglicina; D- ou L-2 tieneilalanina; D- ou L-1, -2, 3-,ou 4- pireneilalanina; D- ou L-3 tieneilalanina; D- ou L-(2-piridinil)-alanina; D-ou L-(3-piridinil)-alanina; D- ou L-(2-pirazinil)- alanina; D- ou L-(4-isopropil)-5 fenilglicina; D-(trifluorometil)-fenilglicina; D- (trifluorometil)-fenilalanina; D-p-flúor-fenilalanina; D- ou L-p- bifenilfenilalanina; D- ou L-p-metóxi-bifenilfenilalanina; D- ou L-2- indol(alquil)alaninas; e, D- ou L-alquilaininas,onde alquila pode ser metila, etila, propila, hexila, butila, pentila, isopropila,iso-butila, sec-isotila, iso-pentila substituída ou não substituída, ou um ami-10 noácido não-acídico. Anéis aromáticos de um aminoácido não natural inclu-em, tais como anéis aromáticos de tiazolila, tiofenila, pirazolila, benzimidazo-lila, naftila, furanila, pirrolila, e piridila. Miméticos de aminoácidos acídicospodem ser gerados por substituição por, tais como aminoácidos de não car-boxilato enquanto mantendo uma carga negativa; (fosfono)alanina; treonina15 sulfatada. Grupos laterais de carboxila (tais como aspartila ou glutamil) po-dem também ser seletivamente modificados por reação com carbodiimidas(R1-N-C-N-R') tais como 1-ciclohexil-3(2-morfolinil-(4-etil)carbodiimida ou I-etil-3(4-azonia- 4,4- dimetolpentil)carbodiimida. Aspartila ou glutamila podetambém ser convertida a resíduos de asparaginila e glutaminila por reação20 com íons de amônio. Miméticos de aminoácidos básicos podem ser geradospor substituição com, tal como (além de Iisina e arginina) os aminoácidosornitina, citrulina, ou ácido (guanidino)-acético, ou ácido (guanidino)alquil-acético, onde alquila é definida acima. Derivado de nitiila (tal como contendoa porção de CN em vez de COOH) pode ser substituído por asparagina ou25 glutamina. Resíduos de asparaginila e glutaminila podem ser desaminadosaos resíduos de aspartila ou glutamila correspondentes. Miméticos de resí-duo de arginina podem ser gerados por reação de arginila com, tal como umou mais reagentes convencionais, incluindo, tais como fenilglioxal, 2,3-butanodiona, 1,2-ciclo- hexanodiona, ou ninidrina, em algumas modalidades30 sob condições alcalinas. Miméticos de resíduo de tirosina podem ser gera-dos por reação de tirosila com, tal como compostos de diazônio aromáticosou tetranitrometano. N-acetilimidizol e tetranitrometano podem ser usadospara formar espécies de tirosila de O-acetila e derivados de 3-nitro, respecti-vamente. Miméticos de resíduo de cisteína podem ser gerados por reaçãode resíduos de cisteinila com, tal como alfa-haloacetatos tal como ácido 2-cloroacético ou cloroacetamida e aminas correspondentes; para produzirderivados de carboximetila ou carboxiamidometila. Miméticos de resíduo decisteína podem também ser gerados por reação de resíduos de cisteinilacom, tal como bromo-trifluoroacetona, ácido alfa- bromo-beta-(5-imidozoil)propiônico; fosfato de cloroacetila, N-alquilmaleimidas, dissulfeto de 3-nitro-2-piridila; dissulfeto de 2-piridila de metila; p-cloromercuribenzoato; 2-cloromercuri-4 nitrofenol; ou, cloro-7-nitrobenzo-oxa-l,3-diazol. Miméticos deIisina podem ser gerados (e resíduos terminais de amino podem ser altera-dos) por reação de Iisinila com, tal como anidridos de ácido sucínico ou outrocarboxílico. Miméticos de Iisina e outros de resíduo contendo alfa-amino po-dem também ser gerados por reação com imidoésteres, tais como picolini-midato de metila, fosfato de piridoxal, piridoxal, cloroborohidreto, ácido trini-tro- benzenosulfônico, O-metilisouréia, 2,4, pentanodiona, e reações catali-sadas por transamidase com glioxilato. Miméticos de metionina podem sergerados por reação com, tal como sulfóxido de metionina. Miméticos de pro-Iina incluem, tais como ácido pipecólico, tiazolidina ácido carboxílico, prolinade 3- ou 4- hidróxi, desidroprolina, 3- ou 4- metilprolina, ou 3,3,-dimetilprolina. Miméticos de resíduo de histidina podem ser gerados por rea-ção de histidila com, tal como dietilprocarbonato ou brometo de para-bromofenacila. Outros miméticos incluem, tais como aqueles gerados atra-vés de hidroxilação de prolina e lisina; fosforilação dos grupos de hidroxilade resíduos de serila ou treonila; metilação dos grupos de alfa-amino de lisi-na, arginina e histidina; acetilação da amina de terminal N; metilação de re-síduos de amida de cadeia principal ou substituição com aminoácidos de N-metila; ou amidação de grupos de carboxila de terminal C.
Em algumas modalidades, um resíduo, tal como um aminoácido,de um polipeptídeo de acordo com a invenção pode também ser substituídopor um aminoácido (ou resíduo de peptidomimético) da quiralidade oposta.-Em algumas modalidades, qualquer aminoácido de ocorrência natural naconfiguração L (que pode também ser referido como o R ou S, dependendoda estrutura da entidade química) pode ser substituído com o aminoácido domesmo tipo estrutural químico ou um peptidomimético, mas da quiralidadeoposta, referido como o D- aminoácido, mas também pode ser referido comoa forma R ou S.
A invenção também fornece métodos para modificação dos poli-peptídeos de acordo com a invenção por ou processos naturais, tais comoprocessamento pós-translacional (tal como fosforilação, acilação, etc), oupor técnicas de modificação química, e os polipeptídeos modificados resul-tantes. Modificações podem ocorrer em qualquer parte no polipeptídeo, in-cluindo a cadeia principal de peptídeo, as cadeias laterais de aminoácido eos terminais de amino ou carboxila. Será observado que o mesmo tipo demodificação pode estar presente no mesmo ou graus variados em diversossítios em um dado polipeptídeo. Também um dado polipeptídeo pode possu-ir muitos tipos de modificações. Em algumas modalidades, modificações in-cluem acetilação, acilação, ribosilação de ADP1 amidação, ligação covalentede flavina, ligação covalente de uma porção de heme, covalente ligação deum nucleotídeo ou derivado de nucleotídeo, ligação covalente de um lipídeoou derivado de lipídeo, ligação covalente de um fosfatidilinositol, ciclizaçãode reticulação, formação de ligação de dissulfeto, desmetilação, formação dereticulações covalentes, formação de cisteína, formação de piroglutamato,formilação, gama-carboxilação, glicosilação, formação de âncora de GPI,hidroxilação, iodinação, metilação, miristoliação, oxidação, pegilação, pro-cessamento proteolítico, fosforilação, prenilação, racemização, selenoilação,sulfação, e adição mediada por RNA de transferência de aminoácidos a pro-teína tal como arginilação. Vide, Creighton, T.E., Proteins — Structure andMolecular Properties 2nd Ed., W.H. Freeman and Company, New York(1993); Posttranslational Covalent Modification of Proteins, B.C. Johnson,Ed., Academic Press, New York, pp. 1-12 (1983).
Métodos de síntese de peptídeo químicos de fase sólida podetambém ser usados para sintetizar o polipeptídeo ou fragmentos de acordocom a invenção. Tal método foi conhecido na técnica desde o início de 1960(Merrifield, R. B., J. Am. Chem. Soe, 85:2149- 2154, 1963) (vide tambémStewart, J. M. e Young, J. D., Solid Phase Peptide Synthesis, 2nd Ed., Pier-ce Chemical Co., Rockford, 111., pp. 11-12)) e foi recentemente empregadoem kits de projeto e síntese de peptídeo de laboratório comercialmente dis-poníveis (Cambridge Research Biochemicals). Tais kits de laboratório co-mercialmente disponíveis geralmente utilizaram os ensinamentos de Η. M.Geysen e outros, Proc. Natl. Acad. ScL, USA, 81:3998 (1984) e forneceramsintetização de peptídeos nas pontas de uma multidão de "bastões" ou "alfi-netes", a totalidade dos quais é conectada a uma placa única. Quando umtal sistema é utilizado, uma placa de rods ou pins é invertida e inserida den-tro de uma segunda placa de cavidades ou resevatórios correspondentes, osquais contêm soluções para ligação ou ancoramento de um aminoácido a-propriado aos tips de alfinetes ou bastões. Por repetição de uma tal etapa deprocesso, isto é, inversão e inserção das pontas de bastão e alfinete dentrode soluções apropriadas, aminoácidos são incorporados dentro de peptídeosdesejados. Além disso, vários sistemas de síntese de peptídeo FMOC dis-ponível estão disponíveis. Por exemplo, montagem de um polipeptídeo oufragmento pode ser realizada em um suporte sólido usando um sintetizadorde peptídeo automatizado Applied Biosystems, Inc. Modelo 431 A™. Tal e-quipamento fornece pronto acesso aos peptídeos de acordo com a invenção,ou por síntese direta ou por síntese de uma série de fragmentos que podemser acoplados usando outras técnicas conhecidas.
Os polipeptídeos de acordo com a invenção incluem enzimasaldolase, tais como piruvato aldolase, tal como HMG e/ou KHG aldolase emuma forma ativa ou inativa. Por exemplo, os polipeptídeos de acordo com ainvenção incluem pró-proteínas antes de "maturação" ou processamento deseqüências de prepro, tal como por uma enzima de processamento de pró-proteína, tal como uma pró-proteína convertase para gerar uma proteínamadura "ativa". Os polipeptídeos de acordo com a invenção incluem enzi-mas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolaseinativas por outros razões, tal como antes de "ativação" por um evento deprocessamento pós-translacional, tal como uma ação de endo= ou exo-peptidase ou proteinase, um evento de fosforilação, uma amidação, umaglicosilação ou uma sulfação, um evento de dimerização, e outros mais. Ospolipeptídeos de acordo com a invenção incluem todas as formas ativas,incluindo subseqüências ativas, tais como domínios catalíticos ou sítios ati-vos, da enzima.
A invenção inclui enzimas aldolase imobilizadas, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase, anticorpos anti-aldolase,tais como anti-piruvato aldolase, tal como anti-HMG e/ou anti-KHG aldolasee fragmentos destes. Em algumas modalidades, a invenção fornece métodospara inibição de atividade de enzima aldolase, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase, tal como uso de mutantes negativos domi-nantes ou anticorpos anti-aldolase, tal como anti-piruvato aldolase, tal comoanti-HMG e/ou anti-KHG aldolase de acordo com a invenção. Em algumasmodalidades, a invenção inclui heterocomplexos, tais como proteínas de fu-são, heterodímeros, etc., compreendendo as enzimas aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a inven-ção.
Em algumas modalidades, polipeptídeos de acordo com a inven-ção podem possuir uma atividade de enzima aldolase, tal como piruvato al-dolase, tal como HMG e/ou KHG aldolase sob várias condições, tais comoem extremas em pH e/ou temperatura ou, em algumas modalidades, na pre-sença de agentes de oxidação. Em algumas modalidades, a invenção forne-ce métodos resultando em preparações de enzima aldolase alternativa, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase com diferenteseficiências e estabilidades catalíticas, tais como para temperatura, agentesde oxidação e mudança de condições de lavagem. Em algumas modalida-des, variantes de enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase podem ser produzidas, usando técnicas de mutagênesedirecionadas a sítio e/ou mutagênese aleatória. Em algumas modalidades,evolução direcionada pode ser usada para produzir uma grande variedadede variantes de enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase com especificidades e estabilidade alternativas.As proteínas de acordo com a invenção são também úteis comoreagentes de pesquisa para identificar moduladores de enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase, tal como ativado-res ou inibidores de atividade de enzima aldolase, tal como piruvato aldola-se, tal como HMG e/ou KHG aldolase. Resumidamente, amostras de teste(compostos, caldos, extratos, e outros similares) são adicionadas aos ensai-os de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHGaldolase para determinar sua capacidade para inibir clivagem de substrato.Inibidores identificados deste modo podem ser usados em indústria e pes-quisa para reduzir ou prevenir proteólise indesejada. Tal como com enzimasaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, ini-bidores podem ser combinados para aumentar o espectro de atividade.
As enzimas de acordo com a invenção são também úteis comoreagentes de pesquisa para digerir proteínas ou em seqüenciamento de pro-teína. Por exemplo, as enzimas aldolase, tal como piruvato aldolase, tal co-mo HMG e/ou KHG aldolase podem ser usadas para quebrar polipeptídeosdentro de fragmentos menores para seqüenciamento usando, tal como umseqüenciador automatizado.
A invenção também fornece métodos de descoberta de novasenzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase usando os ácidos nucléicos, polipeptídeos e anticorpos de acordo coma invenção, em algumas modalidades, bibliotecas de fagemídeo são anali-sadas quanto à descoberta com base em expressão de enzimas aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase. Em outras! moda-lidades, bibliotecas de fago Iambda são analisadas quanto à descoberta combase em expressão de enzimas aldolase, tal como piruvato aldolase, tal co-mo HMG e/ou KHG aldolase. Varredura do fago ou bibliotecas de fagemídeopode permitir a detecção de clones tóxicos; acesso melhorado a substrato;necessidade reduzida por engenharia de um hospedeira, desvio do potencialpara quaisquer tendências resultantes de excisão de massa da biblioteca; e,desenvolvimento mais rápido em densidades de clone baixas. Varredura defago ou bibliotecas de fagemídeo pode ser em fase líquida ou em fase sóli-da. Em algumas modalidades, a invenção fornece varredura em fase líquida.Isto produz uma flexibilidade maior em condições de ensaio; flexibilidade desubstrato adicional; sensibilidade elevada por clones fracos; e facilidade deautomação sobre varredura de fase sólida.
A invenção fornece métodos de avaliação utilizando-se as prote-ínas e ácidos nucléicos de acordo com a invenção e automatização robóticapara permitir a execução de muitos milhares de reações biocatalíticas e en-saios de avaliação em um período curto de tempo, ta-1 como por dia, bemcomo assegurando um nível alto de precisão e reprodutibilidade (vide a dis-cussão de disposições, abaixo). Como um resultado, uma biblioteca decompostos derivados pode ser produzida em um questão de semanas. Paraoutros ensinamentos sobre a modificação de moléculas, incluindo moléculaspequenas, vide PCT/US94/09174; Pat. U.S. No. 6.245.547.
Em algumas modalidades, polipeptídeos ou fragmentos de acor-do com a invenção, são obtidos através de procedimentos de purificação ouenriquecimento bioquímico. A seqüência de polipeptídeos potencialmentehomólogos ou fragmentos, pode ser determinada por aldolase, tal como pi-ruvato aldolase, tal como ensaio de enzima HMG e/ou KHG aldolase (videos Exemplos 3, 4 e 5, abaixo), eletroforese em gel e/ou microseqüenciamen-to. A seqüência do polipeptídeo previdente ou fragmento de acordo com ainvenção, pode ser comparada a um polipeptídeo de acordo com a invençãoou um fragmento, tal como compreendendo pelo menos cerca de 5, 10, 15,20, 25, 30, 35, 40, 50, 75, 100 ou 150, ou aminoácidos consecutivos destes,utilizando-se quaisquer dos programas descritos acima.
Outra modalidade da invenção, é um ensaio para identificar frag-mentos ou variantes de acordo com a invenção, que mantém a função enzi-mática dos polipeptídeos de acordo com a invenção. Por exemplo, os frag-mentos ou variantes dos referidos polipeptídeos, podem ser utilizados paracatalisar reações bioquímicas, que indicam que o fragmento ou variantemantém a atividade enzimática de um polipeptídeo de acordo com a inven-ção. Um ensaio exemplar para determinar se os fragmentos de variantesmantêm a atividade enzimática dos polipeptídeos de acordo com a invenção,inclui as etapas de: contatar o fragmento de polipeptídeo ou variante comuma molécula de substrato sob condições que permitem a variante ou frag-mento de polipeptídeo funcionar e detectar uma diminuição no nível de subs-trato ou um aumento no nível do produto de reação específico da reaçãoentre o polipeptídeo e o substrato.
A presente invenção explora as propriedades catalíticas únicasde enzimas. Considerando que o uso de biocatalisadores (isto é, enzimaspurificadas ou cruas, células não-vivas ou vivas) em transformações quími-cas, normalmente requer a identificação de um biocatalisador particular, quereage com um composto de partida específico, a presente invenção utilizabiocatalisadores selecionados e condições de reação que são específicaspara grupos funcionais que estão presentes em muitos compostos de parti-da, tais como moléculas pequenas. Cada biocatalisador é específico paraum grupo funcional ou vários grupos funcionais relacionados, e pode reagircom muitos compostos de partida que contêm este grupo funcional.
Em algumas modalidades, as reações biocatalíticas produzemuma população de derivados a partir de um único composto de partida. Es-tes derivados podem ser submetidos a outro ciclo de ciclo de reações bioca-talíticas para produzir uma segunda população de compostos derivados. Mi-Ihares de variações da molécula pequena original ou composto, podem serproduzidas com cada iteração de derivação biocatalítica.
As enzimas reagem em sítios específicos de um composto departida sem afetar o resto da molécula, um processo que é muito difícil dealcançar utilizando-se métodos químicos tradicionais. Este alto grau de es-pecificidade biocatalítica fornece o meio para identificar um único compostoativo dentro da biblioteca. A biblioteca é caracterizada pelas séries de rea-ções biocatalíticas utilizadas para produzi-la, uma denominada "história bi-ossintética". A avaliação da biblioteca quanto às atividades biológicas e re-presentação da história biossintética, identificam a seqüência de reação es-pecífica que produz o composto ativo. A seqüência de reação é repetida e aestrutura do composto sintetizado determinada. Este modo de identificação,diferente de outra síntese e métodos de avaliação, não requer tecnologiasde imobilização, e os compostos podem ser sintetizados e testados livres nasolução utilizando-se virtualmente qualquer tipo de ensaio de avaliação. Éimportante notar, que o alto grau de especificidade de reações de enzimaem grupos funcionais, permite o "rastreamento" de reações enzimáticas es-pecíficas que compõem o biblioteca biocataliticamente produzida.
Em algumas modalidades, as etapas processuais são realizadasutilizando-se automatização robótica, permitindo a execução de muitos mi-lhares de reações biocatalíticas e/ou ensaios de avaliação por dia, bem co-mo assegurando um alto nível de precisão e reprodutibilidade. A automatiza-ção robótica também pode ser utilizada para avaliar a atividade de aldolase,para determinar se um polipeptídeo está dentro do escopo de acordo com ainvenção. Como um resultado, em algumas modalidades, uma biblioteca decompostos derivados pode ser produzida em uma questão de semanas, oque levaria anos para produzir utilizando-se "métodos de avaliação "tradicio-nais" ou "enzimáticos" tradicionais.
Em uma modalidade, a invenção fornece métodos para modificarmoléculas pequenas, compreendendo contatar um polipeptídeo codificadopor um polinucleotídeo aqui descrito ou fragmentos enzimaticamente ativosdestes, com uma molécula pequena para produzir uma molécula pequenamodificada. Uma biblioteca de moléculas pequenas modificadas é testadapara determinar se uma molécula pequena modificada está presente dentroda biblioteca, que exibe uma atividade desejada. Uma reação biocatalíticaespecífica que produz a molécula pequena modificada de atividade deseja-da, é identificada sistematicamente por eliminação de cada uma das reaçõesbiocatalíticas utilizadas para produzir uma porção da biblioteca e em seguidatestar as moléculas pequenas produzidas na porção da biblioteca quanto àpresença ou ausência da molécula pequena modificada com a atividade de-sejada. As reações biocatalíticas específicas que produzem a molécula pe-quena modificada de atividade desejada são opcionalmente repetidas. Asreações biocatalíticas são conduzidas com um grupo de biocatalisadoresque reage com porções estruturais distintas encontradas dentro da estruturade uma molécula pequena, cada biocatalisador é específico para uma por-ção estrutural ou um grupo de porções estruturais relacionadas; e cada bio-catalisador reage com muitas moléculas pequenas diferentes que contêm aporção estrutural distinta.
Aldolasef tal como piruvato aldolase, tal como seqüências sinal de en-zima HMG e/ou KHG aldolase, domínios pré-pró e catalíticos.
A invenção fornece aldolase, tal como piruvato aldolase, taiscomo seqüências sinal de enzima HMG e/ou KHG aldolase (tais como peptí-deos sinal (SPs)), domínios pré-pró e domínios catalíticos (CDs). Os SPs,domínios pré-pró e/ou CDs, de acordo com a invenção podem ser isolados,peptídeos sintéticos ou recombinantes, ou podem fazer parte de uma proteí-na de fusão, tal como um domínio heterólogo em uma proteína quimérica.Em algumas modalidades, a invenção fornece ácidos nucléicos que codifi-cam estes domínios catalíticos (os CDs), domínios pré-pró e seqüências si-nal (SPs, tal como um peptídeo que tem uma seqüência que compreende /consiste em resíduos de aminoterminal de um polipeptídeo de acordo com ainvenção).
A invenção fornece seqüências sinal isoladas, sintéticas ou re-combinantes (tal como peptídeos sinal) consistindo em ou compreendendouma seqüência como mencionado nos resíduos 1 a 14, 1 a 15, 1 a 16, 1 a17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a37, 1 a 38, 1 a 40, 1 a 41, 1 a 42, 1 a 43, 1 a 44, 1 a 45, 1 a 46 ou 1 a 47 oumais, de um polipeptídeo de acordo com a invenção, tais como polipeptídeosde acordo com a invenção, também vide a Tabela 1, Exemplos 4, 5 e 6, a-baixo, e Listagem de Seqüência. Por exemplo, a Tabela 1, acima, apresentaseqüências sinal exemplar (líder) de acordo com a invenção, tal como nopolipeptídeo que tem uma seqüência como mencionado em SEQ ID NO: 66,codificada, tal como por SEQ ID NO: 65, tem uma seqüência sinal que com-preende (ou consiste em) 27 resíduos de aminotérminal, ou, MSIVVTKIE-RAGAAAVAALRTSGVATV (SEQ ID NO: 407) que corresponde aos primei-ros 27 aminoácidos de SEQ ID NO: 66.
Em algumas modalidades, a invenção fornece seqüências sinalque compreendem os primeiros 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25,26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45,46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65,66, 61, 68, 69, 70 ou mais resíduos de aminoterminal de um polipeptídeo deacordo com a invenção.
A invenção inclui polipeptídeos com ou sem uma seqüência sinale/ou uma pré-pró-seqüência. Em algumas modalidades, a invenção incluipolipeptídeos com seqüências sinal heterólogas e/ou pré-pró-seqüências. Apré-pró-seqüência (incluindo uma seqüência de acordo com a invenção, uti-Iizada como um pré-pró-domínio heterólogo) pode ser localizada no amino-términal ou na extremidade de carbóxi-terminal da proteína. Em algumasmodalidades, a invenção também inclui seqüências sinal isoladas, sintéticasou recombinantes, pré-pró-seqüências e domínios catalíticos (tais como "sí-tios ativos") compreendendo seqüências de acordo com a invenção. O poli-peptídeo que compreendem uma seqüência sinal de acordo com a invenção,pode ser uma aldolase, tal como piruvato aldolase, enzima HMG e/ou KHGaldolase de acordo com a invenção ou outra aldolase, tal como piruvato al-dolase, tal como enzima HMG e/ou KHG aldolase ou outra enzima ou outropolipeptídeo. Métodos para identificar seqüências de "prépró-"domínio e se-qüências sinal, são bem-conhecidos na técnica, vide Van de Ven (1993) Crit.Rev. Oncog. 4(2): 115-136. Por exemplo, para identificar uma pré-pró-seqüência, a proteína é purificada a partir do espaço extracelular e a se-qüência de proteína de N-terminal é determinada e comparada à forma nãoprocessada.
A aldolase, tal como piruvato aldolase, tais como seqüênciassinal de enzima HMG e/ou KHG aldolase (SPs) e/ou pré-pró-seqüências deacordo com a invenção, podem ser peptídeos isolados, sintéticos ou recom-binantes, ou, seqüências unidas à outra aldolase, tal como piruvato aldolase,tal como enzima HMG e/ou KHG aldolase ou uma não-aldolase, tal comonão-piruvato aldolase, por exemplo, polipeptídeo de não-HMG e/ou não-KHG aldolase, tal como uma proteína de fusão (quimérica). Em algumasmodalidades, a invenção fornece polipeptídeos que compreendem aldolase,tal como piruvato aldolase, tais como seqüências sinal de enzima HMG e/ouKHG aldolase de acordo com a invenção. Em algumas modalidades, poli-peptídeos que compreende aldolase, tal como piruvato aldolase, tal comoseqüências sinal de enzima HMG e/ou KHG aldolase SPs e/ou pré-pró- deacordo com a invenção, compreendem seqüências heterólogas a uma aldo-lase, tal como piruvato aldolase, enzima HMG e/ou KHG aldolase de acordocom a invenção (tal como uma proteína de fusão que compreende uma SPe/ou pré-pró- de acordo com a invenção e seqüências a partir de outra aldo-lase, tal como piruvato aldolase, tal como enzima HMG e/ou KHG aldolaseou uma não-aldolase, tal como não-piruvato aldolase, por exemplo, proteínánão-HMG e/ou não-KHG aldolase). Em algumas modalidades, a invençãofornece aldolase, tal como piruvato aldolase, tal como enzimas HMG e/ouKHG aldolase de acordo com a invenção com SPs heterólogas e/ou pré-pró-seqüências, tais como seqüências com uma seqüência sinal de levedura.Uma aldolase, tal como piruvato aldolase, enzima HMG e/ou KHG aldolasede acordo com a invenção, pode compreender uma SP heteróloga e/ou pré-pró- em um vetor, tal como um vetor de séries de pPIC (Invitrogen, Carlsbad,CA).
Em algumas modalidades, SPs e/ou pré-pró-seqüências de a-cordo com a invenção, são identificadas depois da identificação de nava al-dolase, tal como piruvato aldolase, tal como polipeptídeos de HMG e/ouKHG aldolase. Os séries de reação pelas quais as proteínas são classifica-das e transportadas para seu próprio local celular, são freqüentemente cha-madas séries de reação de alvejamento de proteína. Um dos elementosmais importantes em todos estes sistemas de alvejamento, é uma seqüênciade aminoácido curta no aminotérminal de um polipeptídeo recentemente sin-tetizado chamado a seqüência sinal. Esta seqüência sinal direciona uma pro-teína para seu |oca| apropriado na célula e é removida durante o transporteou quando a proteína alcança seu destino final. A maioria das proteínas li-sossômicas, de membrana ou segregadas têm uma seqüência sinal de ami-notérminal que as marca para translocação no lúmen do retículo endoplás-mico. As seqüências sinal podem variar em comprimento a partir de cerca de10 a 65, ou mais, resíduos de aminoácido. Vários métodos de reconheci-mento de seqüências sinal, são conhecidos por aqueles versados na técni-ca. Por exemplo, em algumas modalidades, nova aldolase, tal como piruvatoaldolase, tais como peptídeos sinal de enzima HMG e/ou KHG aldolase sãoidentificados por um método chamado SignalP. SignaIP utiliza uma redeneural combinada que reconhece igualmente peptídeos sinal e seus locaisde clivagem. (Nielsen (1997) "Identification of prokaryotic and eukaryotic sig-nal peptides and prediction of their cleavage sites". Protein Engineering 10:1-6.
Em algumas modalidades, aldolase, tal como piruvato aldolase,tais como enzimas HMG e/ou KHG aldolase de acordo com a invenção, nãotêm SPs e/ou pré-pró-seqüências ou "domínios". Em algumas modalidades,a invenção fornece a aldolase, tal como piruvato aldolase, tal como enzimasHMG e/ou KHG aldolase de acordo com a invenção, precisando de toda ouparte de uma SP e/ou um pré-pró-domínio. Em algumas modalidades, a in-venção fornece seqüências de ácido nucléico que codificam uma seqüênciasinal (SP) e/ou pré-pró- a partir de uma aldolase, tal como piruvato aldolase,tal como enzima HMG e/ou KHG aldolase operavelmente ligada a uma se-qüência de ácido nucléico de uma aldolase diferente, tal como piruvato aldo-lase, tal como enzima HMG e/ou KHG aldolase ou, opcionalmente, uma se-qüência sinal (SPs) e/ou pré-pró-domínio a partir de uma não-aldolase, talcomo não-piruvato aldolase, por exemplo, proteína não-HMG e/ou não-KHGaldolase, pode ser desejada.
A invenção também fornece polipeptídeos isolados, sintéticos ourecombinante que compreendem seqüências sinal (SPs), pré-pró-domínioe/ou domínios catalíticos (CDs) de acordo com a invenção e seqüências he-terólogas. As seqüências heterólogas são seqüências não naturalmente as-sociadas (tal como a uma enzima) com uma SP, pré-pró-domínio e/ou CD. Aseqüência a qual a SP, pré-pró-domínio e/ou CD não está naturalmente as-sociado, pode estar nas SP's, pré-pró-domínio e/ou o extremidade de amino-términal de CD, extremidade de carbóxi-terminal, e/ou em ambas extremida-des da SP e/ou CD. Em algumas modalidades, a invenção fornece polipeptí-deos isolados, sintéticos ou recombinantes, que compreendem (ou consis-tem em) um polipeptídeo que compreende uma seqüência sinal (SP), pré-pró-domínio e/ou domínio catalítico (CD) de acordo com a invenção, com acondição que não esteja associado com qualquer seqüência a qual está na-turalmente associado (tal como uma aldolase, tal como piruvato aldolase,seqüência de enzima HMG e/ou KHG aldolase). Similarmente, em algumasmodalidades, a invenção fornece ácidos nucléicos isolados, sintéticos ourecombinante que codificam estes polipeptídeos. Desse modo, em algumasmodalidades, o ácido nucléico isolado, sintético ou recombinante de acordocom a invenção, compreende seqüência de codificação para uma seqüênciasinal (SP), pré-pró-domínio e/ou domínio catalítico (CD) de acordo com ainvenção, e uma seqüência heteróloga (isto é, uma seqüência não natural-mente associada com uma seqüência sinal (SP), pré-pró-domínio e/ou do-mínio catalítico (CD) de acordo com a invenção). A seqüência heterólogapode estar na extremidade terminal 3', extremidade terminal 5" e/ou em am-bas extremidades da SP, pré-pró-domínio e/ou seqüência de codificação deCD.
Aldolase híbrida (quimérica), tal como piruvato aldolase, tais como en-zimas HMG e/ou KHG aldolase e bibliotecas de peptídeo
Em algumas modalidades, a invenção fornece aldolase híbrida,tal como piruvato aldolase, tal como enzimas HMG e/ou KHG aldolase e pro-teínas de fusão, incluindo bibliotecas de peptídeo, que compreendem se-qüências de acordo com a invenção. As bibliotecas de peptídeo de acordocom a invenção podem ser utilizadas para isolar moduladores de peptídeo(tais como ativadores ou inibidores) de alvos, tal como aldolase, tal comopiruvato aldolase, tal como substratos de enzima HMG e/ou KHG aldolase,receptores, enzimas. As bibliotecas de peptídeo podem ser utilizadas de a-cordo com a invenção para identificar parceiros de ligação formais de alvos,tais como ligantes, tais como citocinas, hormônios, e similares. Em algumasmodalidades, a invenção fornece proteínas quiméricas que compreendemuma seqüência sinal (SP)1 pré-pró-domínio e/ou domínio catalítico (CD) deacordo com a invenção, ou uma combinação destes, e uma seqüência hete-róloga (vide acima).
Em algumas modalidades, as proteínas de fusão de acordo coma invenção (tal como a porção de peptídeo), são conformacionalmente esta-bilizadas (relativo aos peptídeos lineares) para permitir uma afinidade deligação mais alta para os alvos. Em algumas modalidades, a invenção forne-ce fusões de aldolase, tal como piruvato aldolase, tais como enzimas HMGe/ou KHG aldolase de acordo com a invenção e outros, peptídeos, incluindopeptídeos conhecidos e aleatórios. Eles podem ser fundidos de uma tal ma-neira, que a estrutura da aldolase, tal como piruvato aldolase, tais como en-zimas HMG e/ou KHG aldolase, não é significativamente perturbada, e opeptídeo é metabolicamente ou estruturalmente conformacionalmente esta-bilizado. Isto permite a criação de uma biblioteca de peptídeo, que é monito-rada facilmente igualmente quanto à sua presença dentro das células e suaquantidade.
Variantes dê seqüência de aminoácido de acordo com a inven-ção, podem ser caracterizadas por uma natureza predeterminada da varia-ção, um aspecto que coloca-os à parte de uma forma de ocorrência natural,tal como uma variação alélica ou interespécies de uma aldolase, tal comopiruvato aldolase, seqüência de enzima HMG e/ou KHG aldolase. Em algu-mas modalidades, as variantes de acordo com a invenção exibem a mesmaatividade biológica qualitativa como o análogo de ocorrência natural. Alterna-tivamente, as variantes podem ser selecionadas por ter características modi-ficadas. Em algumas modalidades, ao mesmo tempo que o sítio ou regiãopara introdução de uma variação de seqüência de aminoácido é predetermi-nada, a mutação por si própria não-precisa ser predeterminada. Por exem-plo, para aperfeiçoar o desempenho de uma mutação em um determinadosítio, a mutagênese aleatória pode ser conduzida na região ou códon alvo, ea aldolase expressa, tal como piruvato aldolase, tais como variantes de en-zima HMG e/ou KHG aldolase avaliadas quanto à combinação ideal da ativi-dade desejada. As técnicas para preparar mutações de substituição em sí-tios predeterminados em DNA que tem uma seqüência conhecida são bem-conhecidas, como discutido aqui por exemplo, mutagênese de iniciador Ml 3e mutagênese de PCR. A avaliação dos mutantes pode ser feita utilizando-se, tais como ensaios de formação de ligação carbono-carbono ou clivagem.Em outras modalidades, as substituições de aminoácido podem ser resíduossimples; as inserções podem estar na ordem a partir de cerca de 1 a 20 a -minoácidos, embora podem ser feitas inserções consideravelmente maiores.As deleções podem variar a partir de cerca de 1 a cerca de 20, 30, 40, 50,60, 70 resíduos ou mais. Para obter um derivado final com as propriedadesideais, substituições, deleções, inserções ou qualquer combinação destas,podem ser utilizadas. Geralmente, estas mudanças são terminadas em al-guns aminoácidos para minimizar a alteração da molécula. Entretanto, gran-des mudanças podem ser toleradas em certas circunstâncias.
A invenção fornece aldolase, tal como piruvato aldolase, taiscomo enzimas HMG e/ou KHG aldolase, onde a estrutura da cadeia principalde polipeptídeo, a estrutura secundário ou terciária, tal como um estruturaalfa-helicoidal ou de folha beta, foram modificadas. Em algumas modalida-des, o custo ou hidrofobicidade foi modificado. Em algumas modalidades, foimodificado o volume de uma cadeia lateral foi modificado. Mudanças signifi-cativas na função ou identidade imunológica são feitas selecionando-sesubstituições que são menos conservadoras. Por exemplo, substituiçõespodem ser feitas, as quais mais significativamente afetam: a estrutura dacadeia principal de polipeptídeo na área da alteração, por exemplo, um umaestrutura alfa-helicoidal ou de beta-folha; um custo ou um sítio hidrofóbico damolécula, que pode estar em um sítio ativo; ou uma cadeia lateral. Em algu-mas modalidades, a invenção fornece substituições em polipeptídeo de a-cordó com a invenção onde (a) um resíduo hidrófilo, tal como serila ou treo-nila, é substituído para (ou por) um resíduo hidrofóbico, tal como leucila, iso-leucila, fenilalanila, valila ou alanila; (b) uma cisteína ou prolina é substituídapara (ou por) qualquer outro resíduo; (c) um resíduo que tem uma cadeialateral eletropositiva, tal como lisila, arginila ou histidila, é substituído para(ou por) um resíduo eletronegativo, tal como glutamila ou aspartila; ou <d) umresíduo que tem uma cadeia lateral volumosa, tal como fenilalanina, é substi-tuído para .(ou por) um não tendo uma cadeia lateral, tal como glicina. Asvariantes podem exibir a mesma atividade biológica qualitativa (isto é, umaaldolase, tal como piruvato aldolase, tal como atividade de enzima HMG e/ouKHG aldolase) embora as variantes possam ser selecionadas para modificaras características da aldolase, tal como piruvato aldolase, tais como enzimasHMG e/ou KHG aldolase, quando necessário.
Em algumas modalidades, aldolase, tal como piruvato aldolase,tal como enzimas HMG e/ou KHG aldolase de acordo com a invenção, com-preende epítopos ou rótulos de purificação, seqüências sinal ou outras se-qüências de fusão, etc. Em algumas modalidades, a aldolase, tal como piru-vato aldolase, tais como enzimas HMG e/ou KHG aldolase, de acordo com ainvenção podem ser fundidas a um peptídeo aleatório para formar um poli-peptídeo de fusão. Por "fundido" ou "operavelmente ligado" aqui, entende-seque o peptídeo aleatório e a aldolase, tal como piruvato aldolase, tal comoenzima HMG e/ou KHG aldolase, são ligados juntos, de tal uma maneira talpara minimizar o rompimento para a estabilidade da aldolase, tal como piru-vato aldolase, tal como estrutura de enzima HMG e/ou KHG aldolase, talcomo mantém a aldolase, tal como piruvato aldolase, tal como atividade deenzima HMG e/ou KHG aldolase. O polipeptídeo de fusão (ou polinucleotí-deo de fusão que codifica o polipeptídeo de fusão) pode compreender outroscomponentes bem como, incluindo peptídeos múltiplos em alças múltiplas.
Em algumas modalidades, os peptídeos e ácidos nucléicos queos codificam, são aleatorizados ou completamente aleatorizados, ou elessão parciais em sua aleatorização, tal como na freqüência de nucleotí-deo/resíduo geralmente ou por posição. "Aleatorizado" significa que cadaácido nucléico e peptídeo consiste em nucleotídeos e aminoácidos essenci-almente aleatórios, respectivamente. Em algumas modalidades, os ácidosnucléicos que dão origem aos peptídeos podem ser quimicamente sintetiza-dos, e desse modo pode incorporar qualquer nucleotídeo a qualquer posi-ção. Desse modo, quando os ácidos nucléicos são expressos para formarpeptídeos, qualquer resíduo de aminoácido pode ser incorporado a qualquerposição. O processo sintético pode ser projetado para gerar ácidos nucléicosaleatorizados, para permitir a formação de todas ou a maioria das possíveiscombinações no comprimento do ácido nucléico, desse modo formando umabiblioteca de ácidos nucléicos aleatorizados. A biblioteca pode fornecer umpopulação suficientemente estruturalmente diversa de produtos de expres-são aleatorizados, para afetar uma faixa probabilisticamente suficiente derespostas celulares, para fornecer uma ou mais células que exibem umaresposta desejada. Desse modo, a invenção fornece bibliotecas de interaçãogrande o bastante, de modo que pelo menos um de seus membros terá umaestrutura que dá afinidade para alguma molécula, proteína ou outro fator.
Em algumas modalidades, uma aldolase, tal como piruvato aldo-lase, enzima HMG e/ou KHG aldolase de acordo com a invenção, é umaenzima de multidomínio que compreende um peptídeo sinal, um módulo deligação de carboidrato, uma aldolase, tal como piruvato aldolase, domíniocatalítico de enzima HMG e/ou KHG aldolase, um Iigante e/ou outro domíniocatai ítico.
A invenção fornece métodos e seqüências para geração de poli-peptídeos quiméricos que pode codificar polipeptídeos híbridos biologica-mente ativos (tal como aldolase híbrida, tal como piruvato aldolase, tais co-mo enzimas HMG e/ou KHG aldolase). Em algumas modalidades, os polinu-cleotídeos originais (tal como um ácido nucléico de acordo com a invenção)codificam polipeptídeos biologicamente ativos. Em algumas modalidades,um método de acordo com a invenção produz novos polipeptídeos híbridosutilizando-se processos celulares que integram a seqüência dos polinucleo-tídeos originais, tal que o polinucleotídeo híbrido resultante codifica um poli-peptídeo que demonstra atividades derivadas, porém diferentes, a partir dospolipeptídeos biologicamente ativos originais (tal como a aldolase ou anti-corpo de acordo com a invenção). Por exemplo, os polinucleotídeos originaispodem codificar uma enzima particular (tal como aldolase) a partir de ouconstatado em microorganismos diferentes. Uma enzima codificada por umprimeiro polinucleotídeo a partir de um organismo ou variante pode, por e-xemplo, funcionar efetivamente sob uma condição ambiental particular, talcomo salinidade alta. Uma enzima codificada por um segundo polinucleotí-deo a partir de um organismo diferente ou variante, pode funcionar eficien-temente sob uma condição ambiental diferente, tal como temperaturas ex-tremamente altas. Um polinucleotídeo híbrido que contém seqüências doprimeiro e segundos polinucleotídeos originais, pode codificar uma enzimaque exibe características de ambas as enzimas codificadas pelos polinucleo-tídeos originais. Desse modo, a enzima codificada pelo polinucleotídeo híbri-do de acordo com a invenção, pode funcionar eficazmente sob condiçõesambientais compartilhadas por cada uma das enzimas codificadas pelo pri-meiro e segundos polinucleotídeos, tal como salinidade alta e temperaturasextremas.
Em algumas modalidades, um polipeptídeo híbrido gerado porum método de acordo com a invenção, pode exibir atividade de enzima es-pecializada não exibida nas enzimas originais. Por exemplo, depois da re-combinação e/ou reclassificação redutiva de polinucleotídeos que codificaaldolase, tal como piruvato aldolase, tais como enzimas HMG e/ou KHG al-dolase, o polipeptídeo híbrido resultante codificado por um polinucleotídeohíbrido, pode ser avaliado quanto à não-aldolase especializada, tal comonão-piruvato aldolase, tal como atividades de enzima não-HMG e/ou não-KHG-aldolase, tal como hidrolase, peptidase, fosforilase, etc., atividades,obtidas a partir de cada uma das enzimas originais. Em algumas modalida-des, o polipeptídeo híbrido é avaliado para averiguar aquelas funcionalida-des químicas que distinguem o polipeptídeo híbrido dos polipeptídeos deorigem original, tal como a temperatura, pH ou concentração de sal, em queo polipeptídeo híbrido funciona.
Em algumas modalidades, a invenção se refere a um métodopara produzir um polipeptídeo híbrido biologicamente ativo e avaliar um talpolipeptídeo para atividade aumentada por:
1) introdução de pelo menos um primeiro polinucleotídeo em liga-ção operável e um segundo polinucleotídeo em ligação operável, o pelo me-nos primeiro polinucleotídeo e segundo polinucleotídeo que compartilhampelo menos uma região de homologia de seqüência parcial, em uma célulahospedeira adequada;
2) cultivo de a célula hospedeira sob condições que promovem areorganização de seqüência que resulta em um polinucleotídeo híbrido emligação operável;
3) expressão de um polipeptídeo híbrido codificado pelo polinucleo-tídeo híbrido;
4) avaliação do polipeptídeo híbrido sob condições que promovema identificação de atividade biológica aumentada; e
5) isolamento de um polinucleotídeo que codifica o polipeptídeohíbrido.
Isolamento e descoberta de enzimas aldolase
A invenção fornece métodos para isolar e descobrir aldolase, talcomo piruvato aldolase, enzimas HMG e/ou KHG aldolase e os ácidos nu-cléicos que os codificam. Polinucleotídeos ou enzimas podem ser isoladas apartir de organismos individuais ("isola"), coleções de organismos que foramcultivados em meios definidos ("culturas de enriquecimento"), ou, organis-mos não-cultivados ("amostras ambientais"). Os organismos podem ser iso-lados por, tal como em biopaniculação in vivo {vide a discussão, abaixo). Ouso de um médodo independente de cultura para derivar polinucleotídeosque codificam novas bioatividades a partir de amostras ambientais, é maispreferível porque permite a pessoa acessar recursos inexplorados de biodi-versidade. Os polinucleotídeos ou enzimas também podem ser isolados apartir de qualquer um dos numerosos organismos, tais como bactérias. Alémde células totais, os polinucleotídeos ou enzimas também pode ser isoladosa partir de preparações de enzima bruta derivadas a partir de culturas destesorganismos, tais como bactérias.
"Bibliotecas ambientais" são geradas a partir de amostras ambi-entais e representam os genomas coletivos de organismos de ocorrêncianatural arquivados vetores de clonagem que podem ser propagados emhospedeiros procarióticos adequados. Porque o DNA clonado é inicialmenteextraído diretamente a partir de amostras ambientais, as bibliotecas não sãolimitadas à fração pequena de procariotas, que podem ser cultivados emcultura pura. Adicionalmente, uma normalização do DNA ambiental presentenestes amostras, podo permitir a representação mais parecida do DNA apartir de todas as espécies presentes na amostra original. Isto pode aumen-tar dramaticamente a eficiência de descoberta de genes interessantes a par-tir de componentes menores da amostra, que podem ser sub-representadospor várias ordens de magnitude comparadas às espécies dominantes.
Em algumas modalidades, bibliotecas de genes geradas a partirde um ou mais microorganismos não-cultivados são avaliadas quanto à umaatividade de interesse. As séries de reação potenciais que codificam molécu-las bioativas de interesse são primeiro capturadas em células procarióticasna forma de bibliotecas de expressão de gene. Em algumas modalidades, ospolinucleotídeos que codificam as atividades de interesse, são isolados ápartir de tais bibliotecas e introduzidos em uma célula hospedeira. A célulahospedeira é cultivada sob condições que promovem a recombinação e/oureclassificação redutiva que cria biomoléculas potencialmente ativas comatividades novas ou realçadas.
O biopaniculação in vivo pode ser realizado utilizando um má-quina com base em FACS e com base não-óptica (tal como magnética). Emalgumas modalidades, bibliotecas de genes complexas são construídas comvetores que contêm elementos que estabilizam o RNA transcrito. Por exem-plo, a inclusão de seqüências que resultam em estruturas secundárias talcomo grampos de cabelo que são projetados para flanquear as regiõestranscritas do RNA, serviria para realçar sua estabilidade, desse modo au-mentando sua meia vida dentro da célula. As moléculas de sonda utilizadasno processo de biopaniculação, consistem em oligonucleotídeos rotuladoscom moléculas repórter que só fluorescem ao ligar a sonda a uma moléculaalvo. Estas sondas são introduzidas nas células recombinantes a partir dabiblioteca, utilizando-se um dos vários métodos de transformação. As molé-culas de sonda, ligam-se ao mRNA alvo transcrito, que resulta em moléculasheterodúplex de DNA/RNA. A Ligação da sonda a um alvo produzirão umsinal fluorescente que é detectado e classificado pela máquina de FACS du-rante o processo de avaliação.
Em algumas modalidades, a subclonagem é realizada para tam-bém isolar as seqüências de interesse. Na subclonagem, uma porção deDNA é ampliada, digerida, geralmente por enzimas de restrição, para recor-tar a seqüência desejada, a seqüência desejada é ligada em um vetor derecipiente e é ampliada. Em cada etapa na subclonagem, a porção é exami-nada quanto à atividade de interesse, para assegurar que o DNA que codifi-ca a proteína estrutural não foi excluído. A inserção pode ser purificada emqualquer etapa da subclonagem, por exemplo, por eletroforese em gel antesda ligação em um vetor ou onde as células que contêm o vetor de recipientee células que não contêm o vetor de recipiente são colocadas em meios se-letivos que contém, por exemplo, um antibiótico que exterminará as célulasque não contêm o vetor de recipiente. Métodos específicos de subclonagemde inserção de cDNA em vetores, são bem-conhecidos na técnica (Sambro-ok e outro, Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold SpringHarbor Laboratory Press (1989)). Em outras modalidades, as enzimas deacordo com a invenção são subclones. Tais subclones podem diferir do clo-ne de origem por, por exemplo, comprimento, uma mutação, um rótulo ouum rótulo.
Os microorganismos a partir dos quais o polinucleotídeo podeser descoberto, isolado ou preparado, incluem microorganismos procarióti-cos, tais como Eubacteria e Archaebacteria e microorganismos eucarióticosinferiores tais como fungos, algumas algas e protozoários. Polinucleotídeospodem ser descobertos, isolados ou preparados a partir de amostras ambi-entais, no caso em que o ácido nucléico pode ser recuperado sem o cultivode um organismo ou pode ser recuperado a partir de um ou mais organis-mos de cultura. Em algumas modalidades, tais microorganismos podem serextremófilos, tais como hipertermófilos, psicrófilos, psicrótrofos, alópilos, ba-rófilos e acidófilos. Polinucleotídeos que codificam enzimas isoladas a partirde microorganismos extremofílicos podem ser utilizados. As enzimas destainvenção podem funcionar em temperaturas acima de 100°C, tais como a-quelas encontradas em fontes termais terrestres e fontes hidrotermais deoceano profundo ou em temperaturas abaixo de 0°C, tais como aquelas en-contradas em águas árticas, em um ambiente salino saturado, tais como a-quelas encontradas no Mar Morto, em valores de pH em torno de 0, tais co-mo aquelas encontradas em depósitos de carvão e fontes ricas em enxofregeotermais ou em valores de pH maiores do que 11, tais como aquelas en-contradas em lodo de esgoto. Em algumas modalidades, as enzimas de a-cordo com a invenção têm atividade alta ao longo de uma ampla faixa detemperaturas e pHs.
Os polinucleotídeos selecionados e isolados como acima descri-to, são introduzidos em uma célula hospedeira adequada. Uma célula hos-pedeira adequada é qualquer célula que seja capaz de promover recombi-nação e/ou reclassificação redutiva. Os polinucleotídeos selecionados estão,em algumas modalidades, já em um vetor que inclui seqüências de controleapropriadas. A célula hospedeira pode ser uma célula eucariótica superior,tal como uma célula de mamífero ou uma célula eucariótica, tal como umacélula de levedura, ou, em algumas modalidades, a célula hospedeira podeser uma célula procariótica, tal como uma célula bacteriana. A introdução doconstructo na célula hospedeira pode ser efetuada por transfecção de fosfa-to de cálcio, transfecção mediada por DEAE-Dextrana ou eletroporação.
Os hospedeiros exemplares incluem células bacterianas, taiscomo de E. coli, Streptomyces, Salmonella typhimurium·, células fúngicas, talcomo levedura; células de inseto tal como Drosophila S2 e Spodoptera Sf9,células de animal tal como CHO, COS ou melanoma de Bowes; adenovírus;e células de planta; vide a discussão, acima. A seleção de um hospedeiroapropriado é julgada estar dentro do escopo daqueles versados na técnica apartir dos ensinamentos inclusos.
Vários sistemas de cultura celular de mamífero, podem ser em-pregados para expressar proteína recombinante; os exemplos de sistemasde expressão de mamífero incluem as linhagens COS-7 de fibroblastos derim de macaco, descritas em "SV40-transformed simian cells support thereplication of early SV40 mutants" (Gluzman, 1981) e outras linhagens celu-lares capazes de expressar um vetor compatível, por exemplo, célula Iinha-gens C127, 3T3, CHO, HeLa e BHK. Vetores de expressão de mamífero po-dem compreender uma origem de réplica, um realçador e promotor adequa-do e também quaisquer sítios de ligação de ribossoma necessários, sítio depoliadenilação, sítios receptores e doadores de união, seqüências de termi-nação transcricionais e seqüências não transcritas de flanqueamento em 5'.Seqüências de DNA derivadas a partir da união de SV40 e sítios de poliade-nilação, podem ser utilizados para fornecer os elementos genéticos nãotranscritos requeridos.
Em outras modalidades, ácidos nucléico, polipeptídeos e méto-dos de acordo com a invenção, são utilizados em séries de reação bioquími-cas, ou para gerar novos polinucleotídeos que codificam séries de reaçãobioquímicas a partir de um ou mais opérons ou grupo de gene, ou porçõesdestes. Por exemplo, bactérias e muitas eucariotas têm um mecanismo co-ordenado para regular genes cujos produtos estão envolvidos em processosrelacionados. Os genes são agrupados, em estruturas chamadas "grupos degene", em um único cromossomo e são transcritos juntos sob o controle deuma única seqüência reguladors, incluindo um único promotor que inicia atranscrição do grupo total. Desse modo, um grupo de gene é um grupo degenes adjacentes que são idênticos ou relacionados, normalmente quanto àsua função (um exemplo de uma série de reação bioquímica codificada porgrupos de gene são policetídeos).
Em algumas modalidades, o DNA de grupo de gene é isolado apartir de organismos diferentes e ligado em vetores, tais como vetores quecontêm seqüências reguladoras de expressão que pode controlar e regular aprodução de uma proteína detectável ou atividade de disposição relacionadaà proteína a partir dos grupos de gene ligados. O uso de vetores que têmuma capacidade excepcionalmente grande para introdução de DNA exóge-no, pode ser apropriado para uso com tais grupos de gene, e é descrito aquipor meio de exemplo para incluir o fator f (ou fator de fertilidade) de E. coli.Este factor f de E. coli é um plasmídeo que afeta transferência em alta fre-qüência de si próprio durante a conjugação e é ideal para obter e estavel-mente propagar grandes fragmentos de DNA, tais como grupos de gene apartir de amostras microbianas mistas. Em uma modalidade, os vetores declonagem, chamados "fosmídeos" ou vetores de cromossomo artificial bacte-riano (BAC) são utilizados. Estes são derivados a partir de fator f de E. colique é capaz de estavelmente integrar segmentos grandes de DNA genômi-co. Quando integrado com o DNA a partir de uma amostra ambiental não-cultivada mista, isto torna-o possível de obter fragmentos genômicos gran-des na forma de uma "biblioteca de DNA ambiental" estável. Outro tipo devetor para uso na presente invenção é um vetor de cosmídeo. Os vetores decosmídeo foram projetados originalmente para clonar e propagar segmentosgrandes de DNA genômico. A clonagem em vetores de cosmídeo é descritaem detalhes em Sambrook e outro, Molecular Cloning: A Laboratory Manual,2nd Ed., Cold Spring Harbor Laboratory Press (1989). Uma vez ligados emum vetor apropriado, dois ou mais vetores que contêm grupos de gene depolicetídeo sintase diferentes, podem ser introduzidos em uma célula hospe-deira adequada. Regiões de homologia de seqüência parcial compartilhadaspelos grupos de gene, promoverão processos que resultam na reorganiza-ção de seqüência que resulta em um grupo de gene híbrido. O novo grupode gene híbrido pode em seguida ser avaliado quanto às atividades realça-das não encontradas nos grupos de gene originais.
Os métodos para avaliar várias atividades de enzima são conhe-cidos por aqueles versados na técnica, e são discutidos ao longo da presen-te especificação, vide os Exemplos 1, 2 e 3, abaixo. Tais métodos podem serempregados ao isolar os polipeptídeos e polinucleotídeos de acordo com ainvenção.
Em algumas modalidades, a invenção fornece métodos paradescobrir e isolar aldolases, tal como piruvato aldolase, tal como HMG e/ouKIHG aldolase ou compostos para modificar a atividade destas enzimas, uti-lizando-se um médodo de célula total (vide a discussão, abaixo). Os clonesputativos que codificam aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase a partir de biblioteca de DNA genômica, podem ser avali-ados.
Metodologias de Avaliação e Dispositivos de Monitoramento "On-line"
Na prática dos métodos de acordo com a invenção, uma varie-dade de mecanismo e metodologias pode ser utilizada junto com os polipep-tídeos e ácidos nucléicos de acordo com a invenção, tais como polipeptídeosde avaliação para aldolase, tal como piruvato aldolase, tal como atividade deenzima HMG e/ou KHG aldolase, para avaliar compostos como moduladorespotenciais, tais como ativadores ou inibidores, de uma aldolase, tal comopiruvato aldolase, tal como atividade de enzima HMG e/ou KHG aldolase,para anticorpos de ligam-se a um polipeptídeo de acordo com a invenção,para ácidos nucléicos que hibridizam para um ácido nucléico de acordo coma invenção, para avaliar quanto às células que expressam um polipeptídeode acordo com a invenção, e similares. Além dos formatos de disposiçãodescritos em detalhes abaixo para avaliar amostras, formatos alternativospodem ser também utilizados para praticar os métodos de acordo com a in-venção. Tais formatos incluem, por exemplo, espectrômetros de massa,cromatógrafos, tal como HPLC de alta produtividade e outras formas decromatografia líquida, e formatos menores, tais como placas de 1536 cavi-dades, placas de 384 cavidades, e assim por diante. Mecanismo de avalia-ção de alta produtividade pode ser adaptado e utilizado para praticar os mé-todos de acordo com a invenção, vide Pedido de Patente U.S. Nos.20020001809;20050272044.
Disposições dos Capilares
Ácidos nucléicos ou polipeptídeos de acordo com a invenção,podem ser imobilizados ou aplicados em uma disposição. As disposiçõespodem ser utilizadas para avaliar ou monitoras bibliotecas de composições(tais como moléculas pequenas, anticorpos, ácidos nucléico, etc.) quanto àsua capacidade de ligar ou modular a atividade de um ácido nucléico ou umpolipeptídeo de acordo com a invenção. Disposições capilares, tal como aGIGAMATRIX., Diversa Corporation, San Diego, CA; e disposições descritasem, tal como Pedido de Patente dos Estados Unidos ne 20020080350 A1;WO 0231203 A; WO 0244336 A, fornecem um mecanismo alternativo parasegurar e avaliar as amostras. Em algumas modalidades, a disposição doscapilar inclui uma pluralidade de capilares formados em uma disposição decapilares adjacentes, em que cada capilar compreende pelo menos uma pa-rede que define um lúmen para reter uma amostra. O lúmen pode ser cilín-drico, quadrado, hexagonal ou qualquer outra forma geométrica já que asparedes formam um lúmen para retenção de um líquido ou amostra. Os capi-lares da disposição dos capilares podem ser mantidos em proximidade jun-tos para formar uma estrutura planar. Os capilares podem ser ligados entresi, sendo fundidos (tal como onde os vasos capilares são feitos de vidro),colados, ligados, ou presos lado a lado. Adicionalmente, a disposição capilarpode incluir material intersticial disposto entre os capilares adjacentes nadisposição, desse modo formando um dispositivo de planar sólido contendouma pluralidade de buracos lado a lado.
Uma disposição capilar pode ser formada de qualquer númerode capilares individuais, por exemplo, uma faixa de 100 a 4.000.000 capila-res. Além disso, uma disposição capilar que tem cerca de 100.000 ou capila-res mais individuais pode ser formada no tamanho padrão e forma de umplaca de Microtiter® para móvel em equipamento de laboratório padrão. Oslúmens são preenchidos manualmente ou automaticamente utilizando açãocapilar ou microinjeção utilizando uma agulha fina. Amostras de interessepodem subseqüentemente ser removidas de capilares individuais para outravarredura ou caracterização. Por exemplo, uma sonda como agulha, fina éposicionado na comunicação de fluido com um capilar selecionado para adi-cionar ou retirar o material do lúmem.
Em um ensaio de avaliação de um pote, os componentes de en-saio são misturados produzindo uma solução de interesse, antes da inserçãona disposição do capilar. O lúmem é preenchido por ação capilar quandopelo menos uma porção da disposição é imersa em uma solução de interes-se. Atividade e/ou reações biológicas ou químicas em cada capilar são moni-toradas quanto aos eventos detectáveis. Um evento detectável é freqüente-mente referido como um "golpe", que normalmente pode ser distinguido apartir de capilares produtores de "não-golpe" por detecção ótica. Desse mo-do, disposições capilares permitem a detecção maciçamente paralela dos"golpes."
Em um ensaio de avaliação de múltiplos potes, um polipeptídeoou ácido nucléico, tal como um ligante, pode ser introduzido em um primeirocomponente, que é introduzido em pelo menos uma porção de capilar deuma disposição capilar. Uma bolha de ar pode, em seguida, ser introduzidano capilar após o primeiro componente. Um segundo componente pode, emseguida, ser introduzido capilar, em que o segundo componente é separadodo primeiro componente pela bolha de ar. O primeiro e segundo componen-tes podem, em seguida, ser misturados aplicando-se pressão hidrostáticaem ambos os lados da disposição capilar para desmoronar a bolha. A dispo-sição capilar é, em seguida, monitorada para um evento detectável que é oresultado de reação ou não-reação dos dois componentes.
Em um ensaio de avaliação de ligação, uma amostra de interes-se pode ser introduzida como um primeiro líquido rotulado com uma partícu-la detectável em um capilar de uma disposição capilar, em que o lúmen dovaso capilar é revestido com um material de ligação para ligar a partículadetectável ao lúmem. O primeiro líquido pode, em seguida, ser removido dotubo capilar, em que a partícula detectável ligada é mantida dentro do capi-lar, e um segundo líquido pode ser introduzido no tubo capilar. O capilar é,em seguida, monitorado quanto à um evento detectável que resulta da rea-ção ou não reação da partícula com o segundo líquido.
Disposições ou "Biochips"
Ácidos nucléicos ou polipeptídeos de acordo com a invençãopodem ser imobilizados ou aplicados em uma disposição. Disposições po-dem ser utilizadas ára avaliar ou monitorar as bibliotecas de composições(tais como moléculas pequenas, anticorpos, ácidos nucléico, etc.) quanto àsua capacidade de ligar-se ou modular a atividade de um ácido nucléico ouum polipeptídeo de acordo com a invenção. Por exemplo, em algumas mo-dalidades da invenção, um parâmetro monitorado é expressão de transcri-ção de uma aldolase, tal como gene de enzima piruvato aldolase, HMG e/ouKHG aldolase. Uma ou mais, ou, todas as transcrições de uma célula podemser medidas por hibridização de uma amostra que compreende transcriçõesda célula, ou, ácidos nucléicos representativos de ou complementares àstranscrições de uma célula, por hibridização para ácidos nucléico imobiliza-dos em uma disposição, ou "biochip". Utilizando-se uma "disposição" de áci-dos nucléicos em um microchip, algumas ou todas as transcrições de umacélula podem ser quantificados simultaneamente. Alternativamente, disposi-ções que compreendem ácido nucléico genômico podem ser utilizadas paradeterminar o genótipo de uma cepa recentemente construída feito pelos mé-todos de acordo com a invenção. "Disposições de polipeptídeo" podem damesma forma ser utilizadas para simultaneamente quantificar uma pluralida-de de proteínas. A presente invenção pode ser praticada com qualquer "dis-posição" conhecida", da mesma forma referida como uma "microdisposiçãõ"ou "disposição de ácido nucléico" ou "disposição de polipeptídeo" ou "dispo-sição de anticorpo" ou "biochip," ou variação destes. Disposição são generi-camente uma pluralidade de "manchas" ou "elementos alvos," cada elemen-to alvo compreendendo uma quantidade definida de um ou mais moléculasbiológicas, tais como oligonucleotídeos, imobilizados sobre uma área defini-da de uma superfície de substrato para ligação específica a uma moléculade amostra, tais como transcrições de mRNA.
Os termos "disposição" ou "microdisposição" ou "biochip" ou"chip" quando utilizados aqui são uma pluralidade de elementos alvos, cadaelemento alvo compreendendo uma quantidade definida de um ou mais poli-peptídeos (incluindo anticorpos) ou ácidos nucléicos imobilizados sobre umaárea definida de uma superfície de substrato, como discutido em mais deta-lhes, abaixo.
Na prática dos métodos de acordo com a invenção, qualquerdisposição conhecida e/ou método de preparar e utilizar disposições podeser incorporada no todo ou em parte, ou variações destes, como descrito,por exemplo, na Patente U.S. Nos. 6.277.628; 6.277.489; 6.261.776;6.258.606; 6.054.270; 6.048.695; 6.045.996; 6.022.963; 6.013.440;5.965.452; 5.959.098; 5.856.174; 5.830.645; 5.770.456; 5.632.957;5.556.752; 5.143.854; 5.807.522; 5.800.992; 5.744.305; 5.700.637;5.556.752; 5.434.049; vide da mesma forma, tal como WO 99/51773; WO99/09217; WO 97/46313; WO 96/17958; vide da mesma forma, tal comoJohnston (1998) Curr. Biol. 8:R171-R174; Schummer (1997) Biotechniques23:1087-1092; Kern (1997) Biotechniques 23:120-124; Solinas-Toldo (1997)Genes, Chromosomes & Câncer 20:399-407; Bowtell (1999) Nature GeneticsSupp. 21:25-32. Vide da mesma forma pedidos de patente U.S. publicadosNos. 20010018642; 20010019827; 20010016322; 20010014449;20010014448; 20010012537; 20010008765.Anticorpos e métodos de avaliação com base em anticorpo
A invenção fornece anticorpos isolados, sintéticos ou recombi-nantes que especificamente ligam-se a uma aldolase, tais como piruvatoaldolase, enzima HMG e/ou KHG aldolase de acordo com a invenção. Estesanticorpos podem ser utilizados para isolar, identificar ou quantificar a aldo-lase, tal como piruvato aldolase, tais como enzimas HMG e/ou KHG aldolasede acordo com a invenção ou polipeptídeos relacionados. Estes anticorpospodem ser utilizados para isolar outros polipeptídeos dentro do escopo dainvenção ou outra aldolase relacionada, tal como piruvato aldolase, tal comoenzimas HMG e/ou KHG aldolase. Os anticorpos podem ser designados pa-ra ligar-se a um sítio ativo de uma aldolase, tal como piruvato aldolase, en-zima HMG e/ou KHG aldolase. Desse modo, a invenção fornece métodos deinibir aldolase, tal como piruvato aldolase, tais como as enzimas HMG e/ouKHG aldolase utilizando os anticorpos de acordo com a invenção (vide dis-cussão acima relativa às aplicações para anti-aldolase, tal como anti-piruvato aldolase, tal como composições de enzima anti-HMG e/ou anti-KHGaldolase de acordo com a invenção).
O termo "anticorpo" inclui um peptídeo ou polipeptídeo derivadode, modelados depois ou substancialmente codificado por um gene de imu-noglobulina ou genes de imunoglobulina, ou fragmentos destes, capazes deespecificamente ligar um antígeno ou epítopo, vide Fundamental Immuno-logy, Terceira Edição, W.E. Paul, ed., Raven Press, Ν. Y. (1993); Wilson(1994) J. Immunol. Methods 175:267-273; Yarmush (1992) J. Biochem. Bio-phys. Methods 25:85 - 97. O termo anticorpo inclui porções de ligação deantígeno, isto é, "sítios de ligação de antígeno", (tais como fragmentos, sub-seqüências, regiões de determinação de complementaridade (CDRs)) quemantêm capacidade de ligar antígeno, incluindo (i) um fragmento de Fab, umfragmento monovalente, consistindo nos domínios VL, VH, CL e CH1; (ii) umfragmento de um F<ab')2, um fragmento bivalente compreendendo doisfragmentos de Fab ligados por uma ponte de dissulfeto na região de articu-lação; (iii) um fragmento de Fd que consiste nos domínios VH e CH1; (iv) umfragmento de Fv que consiste nos domínios VL e VH de uma único ramifica-ção de um anticorpo, (v) um fragmento de dAb (Ward e outros, (1989) Natu-re 341:544-546) que consiste em um domínio VH; e (vi) uma região de de-terminação de complementaridade isolada (CDR). Anticorpos de cadeia sim-ples estão da mesma forma incluídos por referência no termo "anticorpo."
A invenção fornece fragmentos das enzimas de acordo com ainvenção (tais como peptídeos) incluindo fragmentos imunogênicos (tais co-mo subseqüências) de um polipeptídeo de acordo com a invenção. Em al-gumas modalidades, a invenção fornece composições que compreendemum polipeptídeo ou peptídeo de acordo com a invenção e adjuvantes ou veí-culos e similares.
Os anticorpos podem ser utilizados em imunoprecipitação, man-chamento, colunas de imunoafinidade, e similares. Se desejado, seqüênciasde ácido nucléico que codificam para antígenos específicos podem ser gera-das por imunização seguida por isolamento de polipeptídeo ou ácido nucléi-co, amplificação ou clonagem e imobilização de polipeptídeo sobre uma dis-posição de acordo com a invenção. Alternativamente, os métodos de acordocom a invenção podem ser utilizados para modificar a estrutura de um anti-corpo produzido por uma célula a ser modificada, tal como uma afinidade deanticorpo pode ser aumentada ou diminuída. Além disso, a capacidade depreparar ou modificar anticorpos pode ser um fenótipo criado em uma célulapelos métodos de acordo com a invenção.
Métodos de imunização, produção e isolamento de anticorpos(policlonal e monoclonal) são conhecidos por aqueles versados na técnica edescritos na literatura científica e patente, vide Coligan, CURRENT PRO-TOCOLS IN IMMUNOLOGY, Wiley/Greene, NY (1991); Stites (eds.) BASICAND CLINICAL IMMUNOLOGY (7a ed.) Lange Medicai Publications, LosAltos, CA ("Stites"); Goding, MONOCLONAL ANTIBODIES: PRINCIPLESAND PRATICE (2d ed.) Academic Press, New York, NY (1986); Kohler(1975) Nature 256:495; Harlow (1988) ANTIBODIES, A LABORATORY MA-NUAL, Cold Spring Harbor Publications1 New York. Anticorpos, da mesmaforma, podem ser gerados in vitro, tal como utilizando sítio de ligação de an-ticorpo recombinante expressando bibliotecas de exibição de fago, além dosmétodos in vivo tradicionais utilizando animais. Vide, Hoogenboom (1997)Trends Biotechnol. 15:62-70; Katz (1997) Annu. Rev. Biophys. Biomol. S-truct. 26:27-45.
Os polipeptídeos de acordo com a invenção ou fragmentos quecompreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150aminoácidos consecutivos destes, podem da mesma forma ser utilizadospara gerar anticorpos que especificamente ligam-se aos polipeptídeos oufragmentos. Os anticorpos resultantes podem ser utilizados nos procedimen-tos de cromatografia de imunoafinidade para isolar ou purificar o polipeptí-deo ou para determinar se o polipeptídeo está presente em uma amostrabiológica. Em tais procedimentos, uma preparação de proteína, tal como umextrato, ou uma amostra biológica é contatada com um anticorpo capaz deespecificamente ligar-se a um dos polipeptídeos de acordo com a invenção,ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40,50, 75, 100, ou 150 aminoácidos consecutivos destes.
Em procedimentos de imunoafinidade, o anticorpo é ligado a umsuporte sólido, tal como uma conta ou outra matriz de coluna. A preparaçãode proteína é colocada em contato com o anticorpo sob condições em que oanticorpo especificamente liga-se a um dos polipeptídeos de acordo com ainvenção, ou fragmentos destes. Depois de uma lavagem para remover pro-teínas não especificamente ligadas, os polipeptídeos especificamente liga-dos são eluídos.
A capacidade de proteínas em uma amostra biológica de ligar-seao anticorpo pode ser determinada utilizando-se qualquer dentre uma varie-dade de procedimentos familiares aqueles versados na técnica. Por exem-plo, ligação pode ser determinada rotulando-se o anticorpo com um rótulodetectável tal como agente fluorescente, um rótulo enzimático, ou um radioi-sótopo. Alternativamente, ligação do anticorpo à amostra pode ser detectadautilizando-se um anticorpo secundário tendo um tal rótulo detectável neste.Ensaios particulares incluem ensaios de ELISA, ensaios sanduíche, radioi-munoensaios e Wester Blots.
Anticorpos policlonais gerados contra os polipeptídeos de acordocom a invenção, ou fragmentos compreendendo pelo menos 5, 10, 15, 20,25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podemser obtidos por injeção direta dos polipeptídeos em um animal ou adminis-trando-se os polipeptídeos a um animal, por exemplo, um não-humano. Oanticorpo desse modo obtido pode ligar o próprio polipeptídeo. Desta manei-ra, ainda uma seqüência codificando apenas um fragmento do polipeptídeopode ser utilizada para gerar anticorpos que podem ligar-se ao polipeptídeonativo inteiro. Tais anticorpos podem, em seguida, ser utilizados para isolar opolipeptídeo de células que expressam esse polipeptídeo.
Para preparação de anticorpos monoclonais, qualquer técnicaque fornece anticorpos produzidos por culturas de linhagem celular contínuapode ser utilizada. Exemplos incluem a técnica de hibridoma (Kohler e Mils-tein, Nature, 256:495-497. 1975), a técnica de trioma, a técnica de hibridomade célula B humana (Kozbor e outros, Immunology Today 4:72, 1983) e atécnica de EBV-hibridoma (Cole, e outros, 1985, em Monoclonal Antibodiesand CancerTherapy, Alan R. Liss, Inc., pp. 77-96).
Técnicas descritas para a produção de anticorpos de cadeiasimples (Patente dos Estados Unidos ne 4.946.778) podem ser adaptadaspara produzir anticorpos de cadeia simples aos polipeptídeos de acordo coma invenção, ou fragmentos compreendendo pelo menos 5, 10,15, 20, 25, 30,35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes. Alternativa-mente, ratos transgênicos podem ser utilizados para expressar anticorposhumanizados destes polipeptídeos ou fragmentos destes.
Anticorpos gerados contra os polipeptídeos de acordo com ainvenção, ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25,30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podem serutilizados na avaliação quanto aos polipeptídeos similares a partir de outrosorganismos e amostras. Em tais técnicas, polipeptídeos a partir do organis-mo são contatados com o anticorpo e aqueles polipeptídeos que especifica-mente ligam o anticorpo são detectados. Quaisquer dos procedimentos des-critos acima podem ser utilizados para detectar ligação de anticorpo. Um talensaio de avaliação é descrito em Shulman H, Eberhard A, Eberhard C, Ulit-zur S, Keinan E, Bioorg Med Chem Lett. 2000 Oct 16;10(20):2353-6, detec-ção altamente sensível e rápida de catálise de anticorpo por bactérias Iumi-nescentes.
Kits
A invenção fornece kits que compreendem as composições, taiscomo ácidos nucléico, cassetes de expressão, vetores, células, sementes ouplantas transgênicas ou partes de plantas, polipeptídeos (tal como uma en-zima aldolase) e/ou anticorpos de acordo com a invenção. Os kits da mesmaforma podem conter material instrutivo que ensina as metodologias e usosindustriais, médicos e dietéticos de acordo com a invenção, como descritoaqui.
Parâmetros metabólicos de medição e engenharia de célula total
Os métodos de acordo com a invenção fornecem evolução celu-lar total, ou engenharia celular total, de uma célula para desenvolver umanova cepa celular tendo um novo fenótipo, tal como uma aldolase nova oumodificada, tal como piruvato aldolase, tais como enzima HMG e/ou KHGaldolase, atividade, modificando-se a composição genética da célula. Videpedido de patente U.S no.. 20040033975.
A composição genética pode ser modificada por adição à célulade um ácido nucléico de acordo com a invenção, tal como uma seqüência decodificação para uma enzima de acordo com a invenção. Vide W00229032;W00196551.
Para detectar o novo fenótipo, pelo menos um parâmetro meta-bólico de uma célula modificada é monitorado na célula em uma estrutura detempo de "on-line ou "tempo real". Em algumas modalidades, uma pluralida-de de células, tal como uma cultura celular, é monitorada em "tempo real" ou"on-line." Em algumas modalidades, uma pluralidade de parâmetros metabó-licos é monitorada em "tempo real" ou "on-line." Parâmetros metabólicos po-dem ser monitorados utilizando a aldolase, tal como piruvato aldolase, taiscomo enzimas HMG e/ou KHG aldolase de acordo com a invenção.
Varredura de fluxo metabólica (MFA) é baseada em uma estrutu-ra bioquímica conhecida. Uma matriz metabólica linearmente independenteé construída com base na lei de conservação de massa e na hipótese emestado pseudo-estável (PSSH) nos metabólitos intracelulares. Praticando-seos métodos de acordo com a invenção, redes metabólicas são estabeleci-das, incluindo a:
• identidade de todos os substratos de série de reação, produtos e metabóli-tos intermediários
· identidade de todas as reações químicas interconvertendo os metabólitosde série de reação, a estequiometria das reações de série de reação,
• identidade de todas as enzimas catalisando as reações, as cinéticas dereação de enzima,
• as interações reguladoras entre componentes de série de reação, tais σο-mo interações alostéricas, interações enzima-enzima etc,
• compartimentalização intracelular de enzimas ou qualquer outra organiza-ção supramolecular das enzimas, e,
• a presença de quaisquer gradientes de concentração de metabólitos, en-zimas ou moléculas efetoras ou barreiras de difusão para seu movimento.
Uma vez que a rede metabólica para uma determinada cepa éconstruída, apresentação matemática por noção de matriz pode ser introdu-zida para calcular os fluxos metabólicos intracelulares se os dados de meta-boloma on-line estiverem disponíveis. Fenótipo metabólico depende dasmudanças da rede metabólica total dentro de uma célula. Fenótipo metabóli-co depende da mudança de utilização de série de reação com respeito acondições ambientais, regulamento genético, estado de desenvolvimento e ogenótipo, etc. Em algumas modalidades dos métodos de acordo com a in-venção, depois do cálculo de MFA on-line, do comportamento dinâmico dascélulas, seu fenótipo e outras propriedades são analisadas investigando-se autilização de série de reação. Por exemplo, se o fornecimento de glicose éaumentado e o oxigênio diminuído durante a fermentação de fermento, autilização de séries de reações respiratórias será reduzida e/ou interrompida,e a utilização das séries de reações fermentativas dominará. Controle deestado fisiológico de culturas celulares tornará possível depois da varredurade série de reação. Os métodos de acordo com a invenção podem ajudar adeterminar como manipular a fermentação determinando-se como mudar ofornecimento de substrato, temperatura, uso de indutores, etc. para controlaro estado fisiológico de células para remover a direção desejável. Praticando-se os métodos de acordo com a invenção, os resultados de MFA podem sercomparados com dados de proteoma e transcriptoma para projetar experi-ências e protocolos para engenharia metabólica ou rearranjo de gene, etc.
Praticando-se os métodos de acordo com a invenção, qualquerfenótipo modificado ou novo pode ser conferido e detectado, enquanto inclu-indo características novas e melhoradas na célula. Qualquer aspecto de me-tabolismo ou crescimento pode ser monitorado.
Expressão de monitoramento de uma transcrição de mRNA
Em algumas modalidades da invenção, o fenótipo planejadocompreende aumentar ou diminuir a expressão de uma transcrição de mR-NA (tal como um aldolase, tal como piruvato aldolase, mensagem de enzimaHMG e/ou KHG aldolase) ou gerar novas transcrições (tal como aldolase, talcomo piruvato aldolase, tal como enzima HMG e/ou KHG aldolase) em umacélula. Esta expressão aumentada ou diminuída pode ser localizada testan-do quanto à presença de uma aldolase, tal como piruvato aldolase, enzimaHMG e/ou KHG aldolase de acordo com a invenção ou quanto aldolase, talcomo piruvato aldolase, tal como ensaios de atividade de enzima HMG e/ouKHG aldolase. Transcrições de mRNA, ou mensagens, da mesma formapodem ser detectadas e quantificadas por qualquer método conhecido natécnica, incluindo, tal como Northern blots, reações de amplificação quantita-tivas, hibridização para disposições, e similares. Reações de amplificaçãoquantitativas incluem, tal como PCR quantitativa, incluindo, tal como reaçãoem cadeia de polimerase de transcrição reversa quantitativa, ou RT-PCR;RT-PCR de tempo real quantitativa, ou "RT-PCR cinética de tempo real" (vi-de Kreuzer (2001) Br. J. Haematol. 114:313-318; Xia <2001) Transplantation72:907-914).Em algumas modalidades da invenção, o fenótipo planejado égerado nocauteando-se a expressão de um gene homólogo. A seqüência decodificação de gene ou um ou mais elementos de controle transcricionaispodem ser nocauteada, tais como promotores ou realçadores. Desse modo,a expressão de uma transcrição pode ser completamente removida ou ape-nas diminuída.
Em algumas modalidades da invenção, o fenótipo criado com-preende aumentar a expressão de um gene homólogo. Isto pode ser realiza-do nocautendo-se um elemento de controle negativo, incluindo um elementoregulador transcricional agindo em eis- ou trans-, ou, mutagenizando um e-lemento de controle positivo. Um ou mais, ou, todas as transcrições de umacélula podem ser medidas por hibridização de uma amostra que compreen-de transcrições da célula, ou, ácidos nucléicos representativos de ou com-plementares às transcrições de uma célula, por hibridização para ácidos nu-cléicos imobilizados em uma disposição.
Expressão de monitoramento de polipeptídeos, peptídeos e aminoáci-dos
Em algumas modalidades da invenção, o fenótipo construídocompreende aumentar ou diminuir a expressão de um polipeptídeo (tal comoum aldolase, tal como enzima piruvato aldolase, HMG e/ou ECHG aldolase)ou gerar novos polipeptídeos em uma célula. Esta expressão aumentada oudiminuída pode ser localizada determinando-se a quantidade de aldolase, talcomo piruvato aldolase, tal como enzima HMG e/ou KHG aldolase presenteou por aldolase, tal como piruvato aldolase, tais como ensaios de atividadede enzima HMG e/ou KHG aldolase. Polipeptídeos, peptídeos e aminoácidosda mesma forma podem ser detectados e quantificados por qualquer métodoconhecido na técnica, incluindo, tal como ressonância magnética nuclear(NMR), espectrofotometria, radiografia (radiorrotulagem de proteína), eletro-forese, eletroforese capilar, cromatografia líquida de alto desempenho {H-PLC), cromatografia de camada fina (TLC), cromatografia de hiperdifusão,vários métodos imunológicos, tais como imunoprecipitação, imunodifusão,imunoelectroforese, radioimunoensaios (RIAs), ensaios imunossorventesligados à enzima (ELISAs)1 ensaios imunofluorescentes, eletroforese em gel(tal como SDS-PAGE), manchando com anticorpos, separador celular ativa-do por fluorescência (FACS), espectrometria de massa de pirólise, espec-troscopia de Infra-Vermelho de Transformação Fourier, espectrometria deRaman, GC-MS, e espectrometrias de massa de eIetrovaporização cap-LC-tandem e LC-Electrovaporização, e similares. Novas bioatividades podem damesma forma ser avaliadas utilizando métodos, ou variações destes, descri-tos em Patente dos Estados Unidos ns 6.057.103. Além disso, como discuti-do abaixo em detalhes, um ou mais, ou, todos os polipeptídeos de uma célu-la podem ser medidos utilizando uma disposição de proteína.
Aplicações Industriais. Farmacêuticas e outras
Polipeptídeos de acordo com a invenção (tal como tendo aldola-se, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase) podemcatalisar a formação ou clivagem de ligações carbono-carbono. As enzimasde acordo com a invenção podem ser catalisadores altamente seletivos. Emalgumas modalidades, a invenção fornece processos industriais utilizandoenzimas de acordo com a invenção, tal como na indústria de fornecimentofarmacêutico ou nutriente (dieta), nas indústrias de alimento e alimentícias,tal como em métodos para preparar podutos de alimento e produtos alimen-tícios e aditivos de alimento e alimentícios. Em algumas modalidades, a in-venção fornece processos utilizando enzimas de acordo com a invenção naindústria médica, tal como para preparar suplementos ou auxiliares farma-cêuticos ou dietéticos, ou suplementos alimentares e aditivos.
Conversão de biomassa e produção de biocombustíveis de limpeza
A invenção fornece enzimas, tais como aldolases, incluindo piru-vato aldolases tal como, sem limitação, HMG e/ou KHG aldolases (incluindomisturas, ou "coquetéis" de enzimas) e métodos para a conversão de umabiomassa ou qualquer material lignocelulósico (por exemplo, qualquer com-posição compreendendo celulose, hemicelulose e lignina), em combustíveis(por exemplo, bioetanol, biobutanol, biopropanol, biometanol, biodiesel), utili-zando as enzimas da invenção, além de alimentações, alimentos e químicas.
Desse modo, as composições e métodos da invenção fornecem alternativaseficazes e sustentáveis ou suplementos para uso de produtos com base empetróleo, por exemplo, como uma mistura de bioetanol e gasolina. A inven-ção fornece organismos expressando enzimas da invenção para participa-ção em ciclos químicos envolvendo conversão de biomassa natural. Em umamodalidade, enzimas e métodos para a conversão são empregados em con-juntos de enzima para a despolimerização eficiente de polímeros celulósicose hemicelulósicos em porções de carbono metabolizáveis. A invenção forne-ce métodos para descobrir e implementar as mais eficaz de enzimas paracapacitar esta nova "conversão de biomassa" importante e processos indus-triais de energia alternativa.
Os métodos da invenção da mesma forma incluem pegar o ma-terial lignocelulósico convertido (processado por enzimas da invenção) eprepará-los em um combustível (por exemplo, bioetanol, biobutanol, biopro-panol, biometanol, biodiesel) por fragmentação e/ou por síntese química. Emuma modalidade, os açúcares produzidos são fermentados e/ou os produtosnão fermentáveis são gaseificados.
As enzimas da invenção (incluindo, por exemplo, organismos,tais como microorganismos, por exemplo, fungos, leveduras ou bactérias,preparando e em algumas modalidades secretando enzimas recombinantesda invenção) podem ser utilizadas em ou incluídas / integradas em qualquerestágio de qualquer processo de conversão de biomassa, por exemplo, emqualquer uma etapa, várias etapas, ou incluídas em todas as etapas, ou to-dos os seguintes métodos de processo de conversão de biomassa, ou todasestas alternativas de biocombustível:
• Combustão Direta: a queima de material por aquecimento direto e é a tec-nologia de biomassa mais simples; pode ser muito econômica se uma fontede biomassa estiver próxima.
• Pirólises: é a degradação térmica de biomassa por calor na ausência deoxigênio. Em uma modalidade, biomassa é aquecida em uma temperaturaentre cerca de 426 e 760°C (800 e 140°F), porém nenhum oxigênio é intro-duzido para suportar combustão resultando na criação de gás, óleo combus-tível e carvão.• Gaseificação: biomassa pode ser utilizada para produzir metano através doaquecimento ou digestão anaeróbia. Singas, uma mistura de monóxido decarbono e hidrogênio, pode ser derivada a partir de biomassa.
• Gás de aterro de lixo: é gerado pela decadência (digestão anaeróbia) delixo enterrado em aterros de lixo. Quando o resíduo orgânico se decompõe,gera gás consistindo em aproximadamente 50% de metano, o componenteprincipal de gás natural.
• Digestão Anaeróbia: converte matéria orgânica em um uma mistura de me-tano, componente principal de gás natural, e dióxido de carbono. Em umamodalidade, biomassa tal como água residual (despejos), esterco, ou resí-duo de processamento de alimento, é misturada com água e alimentada emum tanque digestor sem ar.
• Fermentação
• Fermentação de álcool: álcool combustível é produzido convertendo-seamido em açúcar, fermentando o açúcar em álcool, em seguida separandouma mistura de álcool água por destilação. Cargas de alimentação tais comotrigo, cevada, batatas, e papel residual, serragem, e palha contendo açúcar,goma, ou celulose podem ser convertidas em álcool por fermentação comlevedura.
• Transesterificação: Uma reação exemplar para converter óleo para biodie-sel é chamada transesterificação. O processo de transesterificação reageum álcool (como metanol) com os óleos de triglicerídeo contidos em óleosvegetais, gorduras animais, ou graxas recicladas, formando alquil ésteres deácido graxo (biodiesel) e glicerina. A reação requer calor e um catalisador debase forte, tal como hidróxido de sódio ou hidróxido de potássio.
• Biodiesel: biodiesel é uma mistura de alquil ésteres de ácido graxo feita apartir de óleos vegetais, gorduras animais ou graxas recicladas. Biodieselpode ser utilizado como um combustível para veículos em sua forma pura,porém é normalmente utilizado como um aditivo de diesel de petróleo parareduzir níveis de particulados, monóxido de carbono, hidrocarbonetos e artóxicos de veículos motorizados a diesel.
• Hidrólise: inclui hidrólise de um composto, por exemplo, uma biomassa, talcomo um material lignocelulósico, catalisado utilizando uma enzima da pre-sente invenção.
• Congeração: é a produção simultânea de mais do que uma forma de ener-gia utilizando um único combustível e facilidade. Em uma modalidade, coge-ração de biomassa tem crescimento mais potencial do que geração de bio-massa apenas porque cogeração produz calor e eletricidade.
Em uma modalidade, os polipeptídeos da invenção têm uma ati-vidade de aldolase, inclusive atividade de piruvato aldolase, tal como, semlimitação, atividade de HMG e/ou KHG aldolase, ou outra atividade enzimáti-ca para gerar biodiesel, bioetanol, biobutanol, biopropanol, ou biometanol, apartir de um material orgânico, por exemplo, uma biomassa, tais como com-posições derivadas de plantas e animais, incluindo qualquer safra agrícolaou outra carga de alimentação renovável, um resíduo agrícola ou um resíduoanimal, ou os componentes orgânicos de resíduos municipais e industriais,ou microorganismos tal como algas ou levedura. Em uma modalidade, poli-peptídeos da invenção são utilizados em processos para converter biomassalignocelulósica para etanol, butanol, propanol, metanol ou de outra maneirasão utilizados em processos para hidrolisar ou digerir biomateriais tal queeles podem ser utilizados como um biocombustível (incluindo bioetanol, bio-butanol, biopropanol, biometanol, ou biodiesel), ou para tornar mais fácil pa-ra a biomassa ser processada em um combustível. Em uma modalidade al-ternativa, os polipeptídeos da invenção são utilizados em processos para umprocesso de transesterificação reagindo um álcool (como metanol) com umóleo de triglicerídeo contido em um óleo vegetal, gordura animal ou graxareciclada, formando alquil ésteres de ácido graxo (biodiesel) e glicerina. Emuma modalidade, biodiesel é feito a partir de óleo de soja ou óleos de arteculinária reciclados. Gorduras animais, outros óleos vegetais, e outros óleosreciclados para da mesma forma ser utilizado para produzir biodiesel, de-pendendo de seus custos e disponibilidade. Em outra modalidade, misturasde todos os tipos de gorduras e óleos são utilizadas para produzir um com-bustível de biodiesel da invenção.
Enzimas da invenção podem da mesma forma ser utilizadas emrefinamento de glicerina. O subproduto de glicerina contém catalisador não-reagido e sabões que são neutralizados com um ácido. Água e álcool sãoremovidos para produzir 50% a 80% de glicerina bruta. Os contaminantesrestantes incluem óleos e gorduras não-reagidos, que podem ser processosutilizando os polipeptídeos da invenção. Em plantas de biodiesel grandes dainvenção, a glicerina pode ser também purificada, por exemplo, a 99% oupureza mais alta, para as indústrias farmacêuticas e cosméticas.
Bioetanol, biobutanol, biopropanol, biometanol, e/ou biodieselsão feitos utilizando os polipeptídeos da invenção, podem ser utilizados comoxigenados de combustível para melhorar características de combustão. A-dição de oxigênio resulta em combustão mais completa, que reduz emissõesde monóxido de carbono. Este é outro benefício ambiental de substituir com-bustíveis de petróleo com biocombustíveis (por exemplo, um combustível dainvenção). Um bioetanol, biobutanol, biopropanol, biometanol, e/ou biodieselpreparado(s) utilizando as composições e/ou métodos desta invenção po-de(m) ser misturado(s) com gasolina para formar uma mistura de E10 (cercade 5% a 10% de etanol e cerca de 90% a 95% de gasolina), porém pode(m)ser utilizado(s) em concentrações mais altas tal como E85 ou em sua formapura. Um bioetanol, biobutanol, biopropanol, biometanol, e/ou biodiesel pre-parados utilizando as composições e/ou métodos desta invenção podem sermisturados com diesel de petróleo para formar uma mistura de B20 (20% deBiodiesel e 80% de diesel de petróleo), embora outros níveis de mistura po-dem ser utilizados até B100 (biodiesel puro).
A invenção da mesma forma fornece processos para prepararetanol ("bioetanol"), butanol ("biobutanol"), propanol ("biopropanol"), metanol("biometanol"), e/ou diesel ("biodiesel") a partir de composições compreen-dendo biomassa lignocelulósica. O material de biomassa de Iignocelulosepode ser obtido a partir de colheitas agrícolas, como um subproduto de ali-mento ou produção de alimentação, ou como produtos residuais lignoceluló-sicos, tal como resíduos de planta e papel residual. Exemplos de fontes deplanta adequadas ou resíduos de planta para tratamento com polipeptídeosda invenção incluem alga marinha, algas, grãos, sementes, caules, folhas,cascas, palhas, espigas de milho, palha de milho, palha, gramas (por exem-plo, grama indiana, tal como Sorghastrum nutans] ou, "switch grass", porexemplo, Panicum species, tal como Panicum virgatum), e similares, bemcomo madeira, lascas de madeira, polpa de madeira, e serragem. Exemplosde resíduo de papel adequado para tratamento com polipeptídeos da inven-ção incluem papel de fotocópia de descarte, papel de impressora de compu-tador, papel de caderno, papel de bloco de notas, papel de máquina de es-crever, e similares, bem como jornais, revistas, papelão, e materiais de em-balagem com base em papel.
Em uma modalidade, as enzimas e métodos da invenção podemser utilizadas juntamente com meios mais "tradicionais" de preparar etanol,metanol, butanol, propanol e/ou diesel a partir de biomassa, por exemplo,como métodos compreendendo hidrolisar materiais lignocelulósicos subme-tendo-se material lignocelulósico secado em um reator a um catalisadorcompreendido de uma solução diluída de um ácido forte e um sal de metal;isto pode diminuir a energia de ativação, ou a temperatura, de hidrólise decelulose para obter rendimentos de açúcar mais altos; vide, por exemplo,
Patente dos Estados Unidos ns 6.660.506; e 6.423.145.
Outra modalidade que incorpora uso de enzimas da invençãocompreende hidrolisar material lignocelulósico contendo hemicelulose, celu-lose e Iignina submetendo-se o material a etapa de hidrólise de primeiro es-tágio em um meio aquoso em uma temperatura e uma pressão escolhidapara efetuar principalmente despolimerização de hemicelulose sem despoli-merização principal de celulose para glicose. Esta etapa resulta em umasuspensão em que a fase aquosa líquida contém monossacarídeos dissolvi-dos resultando em despolimerização de hemicelulose e uma fase sólida con-tendo celulose e lignina. Uma segunda etapa de hidrólise de estágio podecompreender condições tal que pelo menos uma porção principal da celulo-se é despolimerizada, tal etapa resultando em uma fase aquosa líquida con-tendo produtos de despolimerização dissolvidos/solúveis de celulose. Vide,por exemplo, Patente dos Estados Unidos n2 5.536.325. Enzimas da inven-ção podem ser adicionadas em qualquer estágio deste processo exemplar.Outra modalidade que incorpora uso de enzimas da invençãocompreende processamento de um material de biomassa contendo Iignoce-Iulose por um ou mais estágios de hidrólise de ácido diluído com cerca de0,4% a 2% de ácido forte; e tratamento de um componente lignocelulósicosólido não-reagido do material de biomassa hidrolisado de ácido por deslig-nificação alcalina para produzir precursores para termoplásticos biodegradá-veis e derivados. Vide, por exemplo, Patente dos Estados Unidos ns6.409.841. Enzimas da invenção podem ser adicionadas em qualquer está-gio deste processo exemplar.
Outra modalidade que incorpora uso de enzimas da invençãocompreende pré-hidrolisar material lignocelulósico em um reator de pré-hidrólise; adicionando um líquido ácido ao material lignocelulósico sólido pa-ra preparar uma mistura; aquecendo a mistura a temperatura de reação;mantendo temperatura de reação durante tempo suficiente para para fracio-nar o material lignocelulósico em uma porção solubilizada contendo pelomenos cerca de 20% da Iignina a partir do material lignocelulósico e umafração sólida contendo celulose; remover uma porção solubilizada a partir dafração sólida enquanto na ou próxima temperatura de reação em que a celu-lose na fração sólida é tornada mais amena para digestão enzimática; e re-cuperar uma porção solubilizada. Vide, por exemplo, Patente dos EstadosUnidos ne 5.705.369. Enzimas da invenção podem ser adicionadas em qual-quer estágio deste processo exemplar.
A invenção fornece métodos para preparar composições decombustível de motor (por exemplo, para motores de ignição à centelhas)com base em hidrocarbonetos líquidos misturados com um álcool de grau decombustível feito utilizando-se uma enzima ou um método da invenção. Emuma modalidade, os combustíveis feitos por uso de uma enzima da invençãocompreendem, por exemplo, etanol líquido de gás natural ou líquido de gásde carvão, metanol, butanol, propanol e/ou misturas de diesel. Em uma mo-dalidade, um co-solvente é 2-metiltetraidrofurano derivado de biomassa (M-THF). Vide, por exemplo, Patente dos Estados Unidos ne 6.712.866.
Em uma modalidade, métodos da invenção para a degradaçãoenzimática de lignocelulose, por exemplo, para produção de etanol a partirde material lignocelulósico, podem da mesma forma compreender uso detratamento ultrassônico do material de biomassa; vide, por exemplo, Patentedos Estados Unidos n9 6.333.181.
Em outra modalidade, métodos da invenção para produzir bioe-tanol, biobutanol, biopropanol, biometanol, e/ou biodiesel a partir de umsubstrato celulósico compreendem fornecer uma mistura de reação na formade uma suspensão compreendendo substrato celulósico, uma enzima destainvenção e um agente de fermentação (por exemplo, dentro de um vaso dereação, tal como um biorreator alimentado por sóiidos semicontinuamente),e a mistura de reação é reagida sob condições suficientes para iniciar emanter uma reação de fermentação (como descrito, por exemplo, em Ped.de Pat. U.S. No. 20060014260). Em uma modalidade, experiência ou cálcu-los teóricos podem determinar uma freqüência de alimentação ideal. Emuma modalidade, quantidades adicionais do substrato celulósico e da enzi-ma são fornecidas no vaso de reação em um intervalo de acordo com a fre-qüência de alimentação utilizada.
Um processo exemplar para preparar biocombustíveis (tal comobioetanol, biobutanol, biopropanol, biometanol, e/ou biodiesel) da invenção édescrito em Publicação de Pedido de Patente U.S. Nos. 20050069998;20020164730; e em uma modalidade compreende estágios de moer a bio-massa lignocelulósica (por exemplo, em um tamanho de 15-30 mm), subme-tendo o produto obtido ao pré-tratamento de explosão à vapor (por exemplo,em uma temperatura de 190-230°C) durante entre 1 e 10 minutos em umreator; coletando o material pré-tratado em um ciclone ou produto relaciona-do de fabricação; e separar as frações líquidas e sólidas por filtração emuma prensa filtro, introduzindo a fração sólida em um depósito de fermenta-ção e adicionando uma ou mais enzimas da invenção, por exemplo, umaenzima de celulase e/ou beta-glicosidase (por exemplo, dissolvido em tam-pão de citrato pH 4,8).
Outro processo exemplar para preparar biocombustíveis (tal co-mo bioetanol, biobutanol, biopropanol, biometanol, e/ou biodiesel) da inven-ção compreender utilizar enzimas da invenção compreende pré-tratar ummaterial de partida compreendendo uma carga de alimentação lignocelulósi-ca compreendendo pelo menos hemicelulose e celulose. Em uma modalida-de, o material de partida compreende batatas, soja (semente de colza), ce-5 vada, centeio, milho, aveia, trigo, beterrabas ou cana-de-açúcar ou um com-ponente ou resíduo ou alimento ou subproduto de produção de alimentação.O material de partida ("carga de alimentação") é reagido em condições querompem a estrutura de fibra da planta para efetuar pelo menos uma hidróliseparcial da hemicelulose e celulose. Condições disruptivas podem compreen-10 der, por exemplo, submeter o material de partida a uma temperatura médiade 180°C a 270°C em pH 0,5 a 2,5 durante um período de cerca de 5 se-gundos a 60 minutos; ou, temperatura de 220°C a 270°C, em pH 0,5 a 2,5durante um período de 5 segundos a 120 segundos, ou equivalente. Isto ge-ra uma carga de alimentação com acessibilidade aumentada para ser digeri-15 do por uma enzima, por exemplo, uma enzima de celulase da invenção. Pa-tente dos Estados Unidos n9 6.090.595.
Condições exemplares para hidrólise de material lignocelulósicoincluem reações em temperaturas entre cerca de 30°C e 48°C, e/ou um pHentre cerca de 4,0 e 6,0. Outras condições exemplares incluem uma tempe-20 ratura entre cerca de 30°C e 60°C e um pH entre cerca de 4,0 e 8,0.
As enzimas de acordo com a invenção podem catalisar reaçõescom estereo, regio e quimiosseletividades refinadas. A aldolase, tal comopiruvato aldolase, tal como enzimas HMG e/ou KHG aldolase de acordo coma invenção podem ser planejadas para funcionar em vários solventes, operar25 em pHs extremos (por exemplo, pHs altos e pHs baixos) temperaturas ex-tremas (por exemplo, temperaturas altas e baixas temperaturas), níveis desalinidade extremos (por exemplo, salinidade alta e salinidade baixa) e cata-lisar reações com compostos que são estruturalmente não relacionadas aossubstratos naturais, fisiológicos.30 Alimentações e alimento ou aditivos de alimentação ou alimento
Além de fornecer auxiliares dietéticos ou suplementos, ou su-plementos de alimeno e aditivos, a invenção da mesma forma fornece com-posições e métodos para tratar alimentos e alimentações humanos e ani-mais e aditivos de alimento ou alimentação utilizando um polipeptídeo deacordo com a invenção, tal como uma proteína tendo atividade de aldolase,tal como piruvato aldolase, tal como enzimas de EDvIG e/ou KHG aldolasede acordo com a invenção, e/ou os anticorpos de acordo com a invenção.
Em algumas modalidades, a invenção fornece alimentações de animais, ali-mentos, e aditivos compreendendo aldolase, tal como piruvato aldolase, taiscomo enzimas HMG e/ou KHG aldolase de acordo com a invenção e/ou an-ticorpos de acordo com a invenção. O animal pode ser qualquer animal defazenda ou qualquer animal.
O aditivo de alimentação animal de acordo com a invenção podeser um produto de enzima granulado que pode ser facilmente ser misturadocom componentes de alimentação. Alternativamente, aditivos de alimenta-ção de acordo com a invenção podem formar um componente de uma pré-mistura. O produto de enzima granulado de acordo com a invenção pode serrevestido ou não-revestido. O tamanho de partícula dos granulados de enzi-ma pode ser compatível com aquela alimentação e componentes de pré-mistura. Isto fornece um meio seguro e conveniente de incorporar enzimasem alimentações. Alternativamente, o aditivo de alimentação animal de a-cordo com a invenção pode ser uma composição líquida estabilizada. Estespodem ser uma suspensão aquosa ou com base em óleo. Vide Patente dosEstados Unidos ns 6.245.546.
Aldolase, tal como piruvato aldolase, tais como enzimas HMGe/ou KHG aldolase da presente invenção, na modificação de alimentação ouum alimento, podem processar o alimento ou alimentação in vitro (modifi-cando-se componentes da alimentação ou alimento) ou in vivo. Polipeptí-deos de acordo com a invenção podem ser adicionados à composições dealimentação ou alimento.
Em algumas modalidades, uma enzima de acordo com a inven-ção é adicionada em combinação com outra enzima, tal como beta-galactosidases, catalases, lacases, celulases, outras aldolases, endoglicosi-dases, endo-beta-1,4-lacases, amiloglicosidases, glicosidases, glicose iso-merases, glicosiltransferases, lipases, fosfolipases, lipooxigenases, beta-lacases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, fitases,glicoamilases, pectinases, reductases, oxidases, descarboxilases, fenoloxi-dases, Iigninases1 pululanases, arabinanases, hemicelulases, mananases,xilolacases, xilanases, pectil acetil esterases, ramnogalacturonan acetil este-rases, protease, peptidases, proteinases, poligalacturonases, ramnogalactu-ronases, galactanases, pectina liases, transglutaminases, pectina metileste-rases, celobioidrolases e/ou transglutaminases. Estes produtos de digestãode enzima são mais digeríveis pelo animal. Desse modo, aldolase, tal comopiruvato aldolase, tal como enzimas HMG e/ou KHG aldolase de acordo coma invenção podem contribuir à energia disponível a partir da alimentação oualimento, ou para a capacidade de digestão do alimento ou alimentaçãorompendo-se celulose.
Em outras modalidades, aldolase, tal como piruvato aldolase, talcomo enzima HMG e/ou KHG aldolase de acordo com a invenção pode serfornecida expressando-se as enzimas diretamente em colheitas de alimenta-ção transgênica (como, tal como plantas transgênicas, sementes e simila-res), tal como grãos, cereais, milho, soja, semente de colza, tremoço e simi-lares. Como discutido acima, a invenção fornece plantas transgênicas, par-tes de planta e células de planta compreendendo uma seqüência de ácidonucléico codificando um polipeptídeo de acordo com a invenção. Em algu-mas modalidades, o ácido nucléico é expresso tal que a aldolase, tal comopiruvato aldolase, tal como enzima HMG e/ou KHG aldolase de acordo coma invenção é produzida em quantidades recuperáveis. A aldolase, tal comopiruvato aldolase, tal como enzima HMG e/ou KHG aldolase pode ser recu-perada a partir de qualquer planta ou parte de planta. Alternativamente, aplanta ou parte de planta contendo o polipeptídeo recombinante pode serutilizada como tal para melhorar a qualidade de um alimento ou alimentação,tal como melhorar valor nutricional, palatabilidade, etc.
Em algumas modalidades, a matriz de liberação de enzima deacordo com a invenção está na forma de partículas plurais discretas, péletesou grânulos. Por "grânulos" é significado partículas que são comprimidas oucompactadas, tal como por uma peletização, extrusão, ou compactação simi-lar para remover água da matriz. Tal compressão ou compactação das partí-culas da mesma forma promove coesão de intrapartícula das partículas. Porexemplo, os grânulos podem ser preparados peletizando-se o substrato combase em grão em um moinho de pélete. Os péletes preparadas desse modosão moídas ou esmigalhadas em um tamanho de grânulo adequado parauso como um adjuvante em alimentação animal. Porque a matriz é por siprópria aprovada para uso em alimentação animal, pode ser utilizada comoum diluente para liberação de enzimas em alimentação animal.
Em algumas modalidades, a aldolase, tal como piruvato aldola-se, tal como enzima HMG e/ou KHG aldolase contida na invenção, métodose matriz de liberação de enzima são uma aldolase termoestável, tal comopiruvato aldolase, tal como enzima HMG e/ou KIHG aldolase, como descritoaqui, para resistir a inativação da aldolase, tal como piruvato aldolase, talcomo enzima HMG e/ou KHG aldolase durante a fabricação onde temperatu-ras elevadas e/ou vapor podem ser empregadom para preparar a matriz deliberação de enzima peletizada. Durante a digestão de alimentação contendoa matriz de liberação de enzima da invenção, fluidos digestivos aquososcausarão liberação da enzima ativa. Outros tipos de enzimas termoestáveise suplementos nutricionais que são termoestáveis podem da mesma formaestar incorporados na matriz de liberação para liberação sob qualquer tipode condições aquosas.
Em algumas modalidades, um revestimento é aplicado às partí-culas de matriz de enzima para muitos propósitos diferentes, tal como paraadicionar um sabor ou suplemento de nutrição à alimentação animal, paraliberação atrasada de suplementos de alimentação animal e enzimas emcondições gástricas, e similares. Em algumas modalidades, o revestimento éaplicado para alcançar uma meta funcional, por exemplo, sempre que fordesejável para reduzir a liberação da enzima a partir das partículas de matrizou para controlar as condições sob as quais a enzima será libertada. A com-posição do material de revestimento pode ser tal que seja seletivamenterompido por um agente ao qual é suscetível (tal como calor, ácido ou base,enzimas ou outras químicas). Alternativamente, dois ou mais revestimentossuscetíveis a diferentes tais agentes de ruptura podem ser aplicados conse-cutivamente às partículas matriz.
A invenção também é da mesma forma dirigida para um proces-so para preparar uma matriz de liberação de enzima. De acordo com a in-venção, o processo compreende fornecer partículas plurais discretas de umsubstrato com base em grão em um tamanho de partícula adequado parauso como uma matriz de liberação de enzima, em que as partículas compre-endem uma aldolase, tal como piruvato aldolase, enzima HMG e/ou KHGaldolase codificada por uma seqüência de aminoácido de acordo com a in-venção. Em algumas modalidades, o processo inclui compactação ou com-pressão das partículas de matriz de liberação de enzima em grânulos, quemais em algumas modalidades é realizado por peletização. O inibidor demolde e agente de coerência, quando utilizado, pode ser adicionado emqúalquer momento adequado, e, em algumas modalidades são misturadoscom o substrato com base em grão nas proporções desejadas antes da pe-letização do substrato com base em grão. Teor de umidade na alimentaçãode moinho de pélete em algumas modalidades está nas faixas mencionadasacima com respeito ao teor de umidade no produto acabado, e, em algumasmodalidades, é cerca de 14-15%. Em algumas modalidades, umidade é adi-cionada à carga de alimentação na forma de uma preparação aquosa daenzima para trazer a carga de alimentação a este teor de umidade. A tempe-ratura no moinho de pélete em algumas modalidades é trazida para cerca de82°C com vapor. O moinho de pélete pode ser operado sob qualquer condi-ção que concede trabalho suficiente à carga de alimentação para fornecerpéletes. O processo de peletização por si próprio é um processo custo-eficazpara remover água da composição contendo enzima.
As composições e métodos de acordo com a invenção podemser praticados juntamente com administração de pré-bióticos, que são açú-cares de peso molecular alto, tal como material de fruto-oligossacarídeos(FOS); galacto-oligossacarídeos (GOS), GRAS {Geralmente ReconhecidoComo Seguro). Estes pré-bióticos podem ser metabolizados por algumasbactérias de ácido láctico pró-bióticas (LAB). Eles não são digeríveis pelamaioria de micróbios intestinais.
Tratar alimentos e processar alimentos
A invenção fornece alimentos e alimentações compreendendoenzimas de acordo com a invenção, e métodos para utilizar enzimas de a-cordo com a invenção processando-se alimentos e alimentações. Aldolase,tal como piruvato aldolase, enzimas HMG e/ou KHG aldolase de acordo coma invenção têm numerosas aplicações em indústria de processamento dealimento. Em algumas modalidades, a invenção fornece métodos para hidro-Iisar composições compreendendo celulose, incluindo, tal como uma célulade planta, uma célula bacteriana, uma célula de levedura, uma célula de in-seto, ou uma célula animal, ou qualquer planta ou parte de planta, ou qual-quer alimento ou alimentação, um produto residual e similares.
Por exemplo, a invenção fornece alimentações ou alimentoscompreendendo uma aldolase, tal como piruvato aldolase, enzima HMG e/ouKHG aldolase da invenção, tal como em uma alimentação, um líquido, talcomo uma bebida (tal como um suco de fruta ou uma cerveja), um pão ouuma massa ou um produto de pão, ou uma bebida (tal como uma cerveja) ouum precursor de bebida (tal como uma erva).
Os processos de tratamento de alimento de acordo com a inven-ção podem da mesma forma incluir o uso de qualquer combinação de outrasenzimas tal como triptofanoases ou tirosina descarboxilases, lacases, cata-lases, lacases, outras aldolases, celulases, endoglicosidases, endo-beta-1,4-lacases, amiloglicosidases, glicosidases, glicose isomerases, glicosiltransfe-rases, lipases, fosfolipases, lipooxigenases, beta-lacases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, fitases, glicoamilases, pectinases,reductases, oxidases, descarboxilases, fenoloxidases, ligninases, pululana-ses, arabinanases, hemicelulases, mananases, xilolacases, xilanases, pecti-na acetila esterases, ramnogalactufonan acetil esterases, protease, peptida-ses, proteinases, poligalacturonases, ramnogalacturonases, galactanases,pectina liases, transglutaminases, pectina metilesterases, celobioidrolasese/ou transglutaminases.Composições farmacêuticas e suplementos dietéticos
A invenção da mesma forma fornece composições farmacêuti-cas e suplementos dietéticos (tal como ajudas dietéticas) compreendendoum aldolase de acordo com a invenção. A atividade de aldolase compreendepiruvato aldolase, atividade de HMG e/ou KHG aldolase. Em algumas moda-lidades, as composições farmacêuticas e suplementos dietéticos (tais comoauxiliares dietéticos) são formulados para ingestão oral.
Compostos de tratamento periodontal podem compreender umaenzima de acordo com a invenção, tal como descrito na Patente dos EstadosUnidos n9 6.776.979. Composições e métodos para o tratamento ou profila-xia de síndrome de intestino ácida podem compreender uma enzima de a-cordo com a invenção, tal como descrito em Patente dos Estados Unidos nQ6.468.964.
Em outras modalidades, curativos de ferida, implantes e simila-res compreendem enzimas antimicrobiana (tal como ação antibiótica), inclu-indo uma enzima de acordo com a invenção (incluindo, tal como seqüênciasde acordo com a invenção). Enzimas de acordo com a invenção podem damesma forma ser utilizadas em curativos de alginato, curativos de barreiraantimicrobiana, curativos de queimadura, bandagens de compressão, ins-trumentos diagnósticos, curativos em gel, curativos hidro-seletivos, curativoshidrocelulares (espuma), curativos hidrocolóides, curativos I.V, campo cirúr-gico de incisão, curativos de baixa aderência, curativos de absorção de odor,bandagens em pasta, curativos pós operatórios, controle de cicatriz, cuidadode pele, curativos de película transparentes e/ou fechamento de ferida. En-zimas de acordo com a invenção podem ser utilizados em limpeza de ferida,preparação de leito de ferida, para tratar úlceras de pressão, úlceras da per-na, queimaduras, úlceras diabéticas do pé, cicatrizes, fixação IV, feridas ci-rúrgicas e feridas menores. Enzimas de acordo com a invenção podem serutilizadas em composições de debridamento enzimático estéreis, tal comoungüentos. Em várias modalidades, a aldolase é formulada como um com-primido, gel, pílula, implante, líquido, spray, película, micelas, pó, alimento,pélete de alimentação ou como uma formulação encapsulada.As composições farmacêuticas e suplementos dietéticos de a-cordo com a invenção podem da mesma forma incluir o uso de qualquercombinação de outras enzimas tais como beta-galactosidases, catalases,lacases, celulases, outras aldolases, endoglicosidases, endo-beta-1,4-lacases, amiloglicosidases, glicosidases, glicose isomerases, glicosiltransfe-rases, lipases, fosfolipases, lipooxigenases, beta-lacases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, fitases, glicoamilases, pectinases,reductases, oxidases, descarboxilases, fenoloxidases, ligninases, pululanã-ses, arabinanases, hemicelulases, mananases, xilolacases, xilanases, pectinacetil esterases, ramnogalacturonan acetil esterases, protease, peptidases,proteinases, poligalacturonases, ramnogalacturonases, galactanases, pectl·na liases, transglutaminases, pectina metilesterases, celobioidrolases e/outransglutaminases.
Séries de reações Biossintéticas para Produzir RfR e Outros Estereol·sômeros de Monatina.
Como descrito, entre outros, em WO 03/091396 A2 (vide Figura
1-3 e 11-13), monatina pode ser produzida a partir de triptofano por uma sé-rie de reação de múltiplas etapas envolvendo conversões biológicas (isto éfacilitando a reação de um substrato a um produto com um polipeptídeo).
Uma série de reação descrita envolve biologicamente converter triptofanopara indol-3-piruvato, biologicamente convertendo indol-3-piruvato em ácido
2-hidróxi 2-(indol-3-ilmetil)-4-ceto glutárico ("MP"), e biologicamente conver-ter MP para monatina. Em algumas modalidades, polipeptídeos da invençãopodem ser utilizados para facilitar a reação de indol-3-piruvato para formar
MP. Em algumas modalidades, polipeptídeos da invenção podem ser utiliza-dos para preferencialmente facilitar a produção de R-MP.
Em algumas modalidades, um ou mais polipeptídeos escolhidosa partir de polipeptídeos recombinantes ou isolados de SEQ ID NO:2, SEQID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NENHUM: 10, SEQ ID NO:12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID N0:20, SEQID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID N0:30,SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ IDΝ0:40, SEQ ID ΝΟ:42, SEQ ID ΝΟ:44, SEQ ID ΝΟ:46, SEQ ID ΝΟ:48, SEQID Ν0:50, SEQ ID ΝΟ:52, SEQ ID ΝΟ:54, SEQ ID ΝΟ:56, SEQ ID ΝΟ:58,SEQ ID Ν0:60, SEQ ID ΝΟ:62, SEQ ID ΝΟ:64, SEQ ID ΝΟ:66, SEQ IDΝΟ:68, SEQ 3D Ν0:70, SEQ ID ΝΟ:72, SEQ ID ΝΟ:74, SEQ ID ΝΟ:76,SEQ ID ΝΟ:78, SEQ ID Ν0:80, SEQ ID ΝΟ:82, SEQ ID ΝΟ:84, SEQ IDΝΟ:86, SEQ ID ΝΟ:88, SEQ ID Ν0:90, SEQ ID ΝΟ:92, SEQ ID ΝΟ:94, SEQID ΝΟ:96, SEQ ID ΝΟ:98, SEQ ID Ν0:100, SEQ ID Ν0:102, SEQ IDNO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ IDΝΟ:112, SEQ ID ΝΟ:114, SEQ ID ΝΟ:116, SEQ ID Ν0: 118, SEQ IDΝ0:120, SEQ ID ΝΟ:122, SEQ ID ΝΟ:124, SEQ ID ΝΟ:126, SEQ IDΝΟ:128, SEQ ID Ν0:130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO:136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID Ν0: 142, SEQ ID Ν0: 144,SEQ ID NO: 146, SEQ ID Ν0: 148, SEQ ID Ν0: 150, SEQ ID Ν0: 152, SEQID Ν0: 154, SEQ ID Ν0: 156, SEQ ID Ν0: 158, SEQ ID Ν0: 160, SEQ IDΝ0: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID Ν0: 168, SEQ ID NO:170, SEQ ID Ν0: 172, SEQ ID Ν0: 174, SEQ ID NO: 176, SEQ ID Ν0: 178,SEQ ID Ν0: 180, SEQ ID Ν0: 182, SEQ ID Ν0: 184, SEQ ID Ν0: 186, SEQID Ν0: 188, SEQ ID Ν0: 190, SEQ ID Ν0: 192, SEQ ID Ν0: 194, SEQ IDΝ0: 196, SEQ ID Ν0: 198, SEQ ID Ν0: 200, SEQ ID Ν0: 202, SEQ ID NO:204, SEQ ID NO: 206, SEQ ID Ν0: 208, SEQ ID Ν0: 210, SEQ ID Ν0: 212,SEQ ID Ν0: 214, SEQ ID Ν0: 216, SEQ ID Ν0: 218, SEQ ID Ν0: 220, SEQID Ν0: 222, SEQ ID Ν0: 224, SEQ ID Ν0: 226, SEQ ID Ν0: 228, SEQ IDΝ0: 230, SEQ ID NO: 232, SEQ ID Ν0: 234, SEQ ID Ν0: 236, SEQ ID Ν0:238, SEQ ID Ν0: 240, SEQ ID Ν0: 242, SEQ ID Ν0: 244, SEQ ID Ν0: 246,SEQ ID Ν0: 248, SEQ ID Ν0: 250, SEQ ID Ν0: 252, SEQ ID Ν0: 254, SEQID Ν0: 256, SEQ ID Ν0: 258, SEQ ID Ν0: 260, SEQ ID Ν0: 262, SEQ IDΝ0: 264, SEQ ID Ν0: 266, SEQ ID Ν0: 268, SEQ ID Ν0: 270, SEQ ID Ν0:272, SEQ ID Ν0: 274, SEQ ID Ν0: 276, SEQ ID Ν0: 278, SEQ ID Ν0: 280,SEQ ID NO: 282, SEQ ID Ν0: 284, SEQ ID Ν0: 286, SEQ ID Ν0: 288, SEQID Ν0: 290, SEQ ID Ν0: 292, SEQ ID Ν0: 294, SEQ ID Ν0: 296, SEQ IDΝ0: 298, SEQ ID Ν0: 300, SEQ ID Ν0: 302, SEQ ID Ν0: 304, SEQ ID NO:306, SEQ ID NO: 308, SEQ ID Ν0: 310, SEQ ID Ν0: 312, SEQ ID Ν0: 314,SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ IDNO: 332 ou SEQ ID NO: 334 ou fragmentos ou subseqüências destes, quetêm atividade de aldolase, pode(m) ser útil(eis) na facilitação de uma reaçãodentro de uma série de reação de multietapas, para produzir um produto se-lecionado a partir de monatina, derivados de monatina, sais destes e combi-nações destes. Em uma modalidade, os polipeptídeos com atividade de al-dolase, pode(m) ser útil(eis) na facilitação de uma reação, em que indol-3-piruvato é convertido para MP como uma etapa dentro de uma série de rea-ção de multietapas, para produzir um produto selecionado a partir de mona-tina, derivados de monatina, sais destes e combinações destes.
Em outra modalidade, um ou mais polipeptídeo(s) selecionadosa partir de polipeptídeos isolados ou recombinantes com atividade de HMGaldolase de qualquer um dentre, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO:6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ IDNO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24,SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ IDNO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42,SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ IDNO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60,SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ IDNO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78,SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ IDNO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96,SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ IDNO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO:122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130,SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO: 138, SEQID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ IDNO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO:156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164,SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ IDNO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO:190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO: 198,SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ IDNO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO:224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232,SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ IDNO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO:258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266,SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ IDNO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO:292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300,SEQ ID NO: 302, SEQ ID NO: 304 ou fragmentos ou subseqüências destes,que têm atividade de aldolase, pode(m) ser útil(eis) na facilitação de umareação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapadentro de uma série de reação de multietapas, para produzir um produto se-lecionado a partir de monatina, derivados de monatina, sais destes e combi-nações destes. Em uma modalidade, os polipeptídeos com atividade deHMG aldolase pode(m) ser útil(eis) na facilitação de uma reação, em queindol-3-piruvato é convertido para MP, como uma etapa dentro de uma sériede reação de multietapas, para produzir um produto selecionado a partir demonatina, derivados de monatina, sais destes e combinações destes.
Em ainda outra modalidade, um ou mais polipeptídeo(s) selecio-nados a partir de polipeptídeos isolados ou recombinantes com atividade deKHG aldolase de qualquer um dentre, SEQ ID NO: 306, SEQ ID NO: 308,SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ IDNO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 ou SEQ IDNO: 334 ou fragmentos ou subseqüências destes, que têm atividade de al-dolase, pode(m) ser útil(eis) na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma série dereação de multietapas para produzir um produto selecionado a partir de mo-natina, derivados de monatina, sais destes e combinações destes. Em umamodalidade, os polipeptídeos com atividade de KHG aldolase pode(m) serútil(eis) na facilitação de uma reação, em que indol-3-piruvato é convertidopara MP como uma etapa dentro de uma série de reação de multietapas,para produzir um produto selecionado a partir de monatina, derivados demonatina, sais destes e combinações destes.
Adicionalmente, um ou mais polipeptídeo(s) codificados por umaou mais seqüências de ácidos nucléicos que têm pelo menos cerca de 50%,51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%,77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%,90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais, ou identi-dade de seqüência completa (100%) para um ácido nucléico de acordo coma invenção, incluindo SEQ ID NO: 1, SEO ID NO: 3, SEQ ID NO: 5, SEQ IDNO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15,SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ IDNO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33,SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ IDNO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51,SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ IDNO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69,SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ IDNO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87,SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ IDNO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO:105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113,SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, S€Q ID NO: 129, SEQ IDNO: 131, SEQ ID NO: 133, SEO ID NO: 135, SEQ ID NO: 137, SEQ ID NO:139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147,SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ IDNO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO:173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO:179, SEQ ID NO: 181,SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ IDNO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO:207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215,SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ IDNO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO:241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249,SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ IDNO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO:275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283,SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ IDNO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO:309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317,SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ IDNO: 335, SEQ ID NO: 336, SEQ ID NO: 337 e SEQ ID NO: 338 em uma re-gião de pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150,200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900,950, 1000, 1050; 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500,1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100,2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos, pode(m) serútil(eis) na facilitação de uma reação entre indol-3-piruvato e uma fonte decarbono C3 como uma etapa dentro de uma série de reação de multietapaspara produzir um produto selecionado a partir de monatina, derivados demonatina, sais destes e combinações destes. Em uma modalidade, o um oumais polipeptídeo(s) ou fragmentos ou subseqüências destes com atividadede aldolase, pode(m) ser útil(eis) na facilitação de uma reação, em que indol-3-piruvato é convertido para MP como uma etapa dentro de uma série dereação de multietapas, para produzir um produto selecionado a partir de mo-natina, derivados de monatina, sais destes e combinações destes.
Em outra modalidade da invenção, um ou mais polipeptídeo(s)com atividade de HMG aldolase codificada por uma seqüência de ácido nu-cléico que tem pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%,57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%,83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,96%, 97%, 98%, 99% ou mais ou identidade de seqüência completa (100%)para um ácido nucléico de acordo com a invenção, incluindo SEQ ID NO: 1,SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO:29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO:47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO:65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO:83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO:101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109,SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ IDNO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO:135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143,SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ IDNO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO:169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177,SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ IDNO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO:203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211,SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ IDNO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO:237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245,SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ IDNO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO:271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279,SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ IDNO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO:305, em uma região de pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45,50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750,800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400,1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000,2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos,pode(m) ser útil(eis) na facilitação de uma reação entre indol-3-piruvato euma fonte de carbono 03 como uma etapa dentro de uma série de reaçãode multietapas para produzir um produto selecionado a partir de monatina,derivados de monatina, sais destes e combinações destes. Em uma modali-dade, o um ou mais polipeptídeo(s) com atividade de HMG aldolase, po-de(m) ser útil(eis) na facilitação de uma reação, em que indol-3-piruvato éconvertido para MP como uma etapa dentro de uma série de reação de mul-tietapas, para produzir um produto selecionado a partir de monatina, deriva-dos de monatina, sais destes e combinações destes.Em ainda outra modalidade da invenção, um ou mais polipeptí-deo(s) com atividade de KHG aldolase codificada por uma seqüência de áci-do nucléico que tem pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%,56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%,69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%,95%, 96%, 97%, 98%, 99% ou mais ou identidade de seqüência completa(100%) para um ácido nucléico de acordo com a invenção, incluindo SEQ IDNO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO:315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323,SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 e SEQ IDNO: 338 em uma região de pelo menos cerca de 10, 15, 20, 25, 30, 35, 40,45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700,750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350,1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950,2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resí-duos, pode(m) ser útil(eis) na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma série dereação de multietapas para produzir um produto selecionado a partir de mo-natina, derivados de monatina, sais destes e combinações destes. Em umamodalidade, o um ou mais polipeptídeo(s) com atividade de KHG aldolase,pode(m) ser útil(eis) na facilitação de uma reação, em que indol-3-piruvato éconvertido para MP como uma etapa dentro de uma série de reação de mul-tietapas, para produzir um produto selecionado a partir de monatina, deriva-dos de monatina, sais destes e combinações destes.
Além disso, um ou mais polipeptídeo(s) com atividade de aldola-se codificada por uma seqüência de ácido nucléico que hibridiza sob condi-ção severa para um ácido nucléico de SEQ ID NO: 1, SEQ ID NO: 3, SEQ IDNO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO:23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQID NO: 33, SEQ ID NO: 35, SEO ID NO: 37, SEQ ID NO: 39, SEQ ID NO:41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO:59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO:77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO:95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103,SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ IDNO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO:129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137,SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ IDNO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO:163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171,SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ IDNO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO:197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205,SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ IDNO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO:231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239,SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ IDNO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO:265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273,SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ IDNO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO:299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307,SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ IDNO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO:333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 e SEQ ID NO:338, pode(m) ser útil(eis) na facilitação de uma reação entre indol-3-piruvatòe uma fonte de carbono C3 como uma etapa dentro de uma série de reaçãode multietapas para produzir um produto selecionado a partir de monatina,derivados de monatina, sais destes e combinações destes. Em uma modali-dade, o um ou mais polipeptídeo(s) com atividade de aldolase, pode(m) serútil(eis) na facilitação de uma reação, em que indol-3-piruvato é convertidopara MP como uma etapa dentro de uma série de reação de multietapas,para produzir um produto selecionado a partir de monatina, derivados demonatina, sais destes e combinações destes.
Em outra modalidade da invenção, um ou mais polipeptídeo(s)com atividade de HMG aldolase codificada por uma seqüência de ácido nu-cléico que hibridiza sob condição severa para um ácido nucléico de SEQ IDNO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ IDNO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19,SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ IDNO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37,SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ IDNO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55,SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ IDNO:65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73,SEQ ID NO:75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ IDNO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91,SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ IDNO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO:109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117,SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ IDNO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 1-41, SEQ ID NO:143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151,SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ IDNO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO:177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 1S3, SEQ ID NO: 185,SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ IDNO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO:211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219,SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ IDNO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO:245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253,SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ IDNO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO:279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287,SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ IDNO: 305, pode(m) ser útil(eis) na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma sériedéreação de multietapas para produzir um produto selecionado a partir de mo-natina, derivados de monatina, sais destes e combinações destes. Em umamodalidade, o um ou mais polipeptídeo(s) com atividade de HMG aldolase,pode(m) ser útil(eis) na facilitação de uma reação, em que indol-3-piruvato éconvertido para MP como uma etapa dentro de uma série de reação de mul-tietapas, para produzir um produto selecionado a partir de monatina, deriva-dos de monatina, sais destes e combinações destes.
Em ainda outra modalidade da invenção, um ou mais polipeptí-deo(s) com atividade de KHG aldolase codificada por uma seqüência de áci-do nucléico que hibridiza sob condição severa para um ácido nucléico deSEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQID NO: 315, SEQ ID NO: 317, SEO ID NO: 319, SEQ ID NO: 321, SEQ IDNO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO:331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337e SEQ ID NO: 338, pode(m) ser útil(eis) na facilitação de uma reação entreindol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de umasérie de reação de multietapas para produzir um produto selecionado a partirde monatina, derivados de monatina, sais destes e combinações destes. Emuma modalidade, o um ou mais polipeptídeo(s) com atividade de KHG aldo-lase, pode(m) ser útil(eis) na facilitação de uma reação, em que indol-3-piruvato é convertido para MP como uma etapa dentro de uma série de rea-ção de multietapas, para produzir um produto selecionado a partir de mona-tina, derivados de monatina, sais destes e combinações destes.
Os polipeptídeos com atividade de aldolase descrita aqui podemser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte decarbono C3. A fonte de carbono C3 pode ser, porém não é limitada a, oxalo-acetato, piruvato ou um derivado de piruvato, tal como fosfoenolpiruvato. Emuma modalidade, a fonte de carbono C3 é piruvato.
Enzimas exemplares úteis para a conversão do produto de rea-ção entre indol-3-piruvato e a fonte de carbono C3 para monatina, incluemos membros das classes de enzima: triptofano aminotransferases (2.6.1.27),triptofano desidrogenases (1.4.1.19), D-aminoácido desidrogenases(1.4.99.1), glutamato desidrogenases (1.4.1.2-4), fenilalanina desidrogenase(EC 1.4.1.20), triptofano-fenilpiruvato transaminases (2.6.1.28), ou mais ge-ralmente os membros da família de aminotransferase (2.6.1.-), tal como as-partato aminotransferase (EC 2.6.1.1), tirosina (aromática) aminotransferase(2.6.1.5), D-triptofano aminotransferase, ou D-alanina (2.6.1.21) aminotrans-ferase (vide a Figura 2 de WO 03/091396 A2). Esta reação também pode serrealizada utiizando-se reações químicas. A aminação do cetoácido (MP) érealizada por aminação redutiva que utiliza amônio e cianoboroidreto de só-dio. As Figuras 11-13 de WO 03/091396 A2 mostram polipeptídeos adicio-nais que podem ser utilizado para converter MP -em monatina, bem comofornecer rendimentos aumentados de monatina a partir de indol-3-piruvatoou triptofano. Em uma modalidade, estas enzimas são utilizadas para catali-sar a conversão de MP, o produto de reação entre indol-3-piruvato e piruva-to, em monatina.
O perfil de sabor de uma composição de monatina, pode ser al-terado controlando-se a quantidade relativa dos vários estereoisômeros demonatina na composição. A presente descrição fornece séries de reação esubstâncias para produzir composições de monatina com uma porcentagemdesejada de R,R monatina e/ou S,R monatina.
A quiralidade dos compostos de monatina produzidos pelas sé-ries de reação descritas, pode ser afetada igualmente por pH e pelos poli-peptídeos utilizados para as conversões biológicas. Os polipeptídeos comatividade de aldolase descritos aqui, podem ser utilizados para controlar aquiralidade do carbono-2 de monatina (vide Fórmula I, acima) na reação emque indol-3-piruvato é convertido em MP.
Logo que o produto de reação da reação entre indol-3-piruvato ea fonte de carbono C3 carbono é produzido, o grupo amino pode ser adicio-nado estereoespecificamente. A configuração R ou S de carbono-4 {videFórmula I acima) pode ser gerado dependendo se uma aminotransferase deácido D- ou L-aromático é utilizado. Muitas aminotransferases são específi-cas para o L-isômero, entretanto, D-triptofano aminotransferases existem emcertas plantas (Kohiba e Mito, Proceedings of the 8th International Symposi-um on Vitamin B6 and Carbonyl Catalysis, Osaka, Japão 1990). Além disso,D-alanina aminotransferases (2.6.1.21), D-metionina-piruvato aminotransfe-rases (2.6.1.41) e ambas (R)-3-amino-2-metilpropanoato aminotransferase(2.6.1.61), <S)-3-amino-2-metilpropanoato aminotransferase (2.6.1.22), e D-fenilglicina aminotransferase foram identificadas. Certas aminotransferasespodem apenas aceitar o substrato para esta reação com uma configuraçãoparticular no carbono C2. Portanto, mesmo que a conversão ao produto dereação entre indol-3-piruvato e a fonte de carbono C3 não seja estereoespe-cífica, a estereoquímica do produto final pode ser controlada através da se-leção apropriada de uma aminotransferase. Porque as reações são reversí-veis, o produto de reação não-reagido (isômero indesejado) pode ser reci-ciado novamente aos seus constituintes^ uma mistura racêmica do produtode reação pode ser reformada.
Um exemplo de um doador de amino adequado para a adição deum grupo de amino ao produto de reação da reação entre o indol-3-piruvatoe a fonte de carbono C3 inclui, porém não está limitado a um aminoácido,tais como alanina, aspartato, lisina, glutamato, glicina, e triptofano.
Referindo-se agora às figuras, os seguintes deveriam ser nota-dos. Os fluxogramas identificam, séries de reações para produzir monatina,porém não são limitadas a qualquer método particular para praticar as sériesde reações. Por exemplo, as séries de reações podem ser praticados in vivo,in vitro, ou uma combinação destes.
Além disso, a prática das séries de reações não requer que cadaum dos componentes identificados (tais como reagentes e enzimas) sejamfornecidos explicitamente pelo médico, contanto que componentes suficien-tes, ou fontes de componentes, e condições de reação sejam fornecidos deforma que a série de reação possa proceder potencialmente. Em outras pa-lavras, por exemplo, se uma figura descreve um processo para produzir umacomposição de monatina que inclui produzir indol-3-piruvato a partir de L-triptofano, produzir ácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico ("precur-sor de monatina" ou "MP") a partir de indol-3-piruvato, e produzir monatina apartir de MP, em que cada reação é facilitada por uma enzima apropriada, éconsiderado que prática dessa série de reação inclui combinar L-triptofanocom α-cetoglutarato e enzimas consideradas para facilitar as reações identi-ficadas, e sob condições adequadas para cada uma das reações ocorrersem fornecer da mesma forma explicitamente indol-3-piruvato ou MP. Emum tal exemplo, L-triptofano poderia reagir com α-cetoglutarato para produzirindol-3-piruvato. Devido às condições fixas e a enzima fornecida, o indol-3-piruvato produzido a partir da reação de L-triptofano poderia reagir para for-mar MP, e em seguida devido às condições fixas e a enzima fornecida, o MPproduzido a partir da reação de indol-3-piruvato poderia reagir para formarmonatina.
Deveria da mesma forma ser notado que a prática das séries dereação descritos não requer o médico forencer explicitamente materiais departida identificados ou enzimas. Em outras palavras, é considerado que aprática de qualquer série de reação que identifica L-triptofano como um ma-terial de partida incluiria fornecer um composto que pode produzir L-triptofano, sob condições adequadas para produção de L-triptofano ocorrer ecombinar esse composto com enzimas capazes de facilitar as séries de rea-ções mencionadas sob condições que seriam adequadas para estas reaçõesocorrerem. Como outro exemplo, é da mesma forma considerado que a prá-tica da série de reação identificada incluiria fornecer um microorganismo ge-neticamente construído para produzir monatina de acordo com a série dereação descrita, e fornecer condições apropriadas para o processo de fer-mentação ocorrer. Por exemplo, um microorganismo, que naturalmente pro-duz quantidades grandes de L-triptofano pode ser geneticamente construídopara produzir ou superproduzir uma ou mais das enzimas utilizadas parafacilitar reações na série de reação para monatina, e condições apropriadaspodem ser fornecidas de forma que o microorganismo produza desse modoa monatina.
Figura 1 identifica a modalidade particular em que um aldolaseR-específica facilita a reação de indol-3-piruvato e piruvato para formar R-MP. O fluxograma da Figura 1 esquematicamente descreve um processo deacordo com a invenção para constituir uma composição de monatina incluin-do R,R monatina. Como mostrado na Figura 1, a série de reação global en-volve uma reação de triptofano para formar indol-3-piruvato, uma reação deindol-3-piruvato para produzir MP, e uma reação de MP para produzir mona-tina, incluindo R,R monatina.
Figura 1 também ilustra permutações específicas desta série dereação global, projetadas para aumentar a produção da forma de R,R demonatina às custas das formas de S,S, R1S e S,R de monatina. Em particu-lar, Figura 1 ilustra a modalidade em que: a enzima aminotransferase utiliza-da na reação de L-triptofano tem maior atividade e/ou especificidade paraessa reação versus as reações de MP e 4S monatina ou a oxidase tem mai-or atividade e/ou especificidade para L-triptofano do que para 4R monatina;a enzima que facilita a reação de indol-3-piruvato é um polipeptídeo comatividade de aldolase descrita aqui, e, a enzima que facilita a reação de MPé uma D-enzima de ampla especificidade, preferivelmente evoluída para tra-balhar mais eficazmente com o isômero de R de MP.
Figura 1 da mesma forma ilustra permutações particulares proje-tadas para tornar a produção de R,R monatina mais econômica. Por exem-plo, na Figura 1, L-triptofano— ao invés de D-triptofano ou combinações deL- e D-triptofano— é identificado como o material de partida. Enquanto a es-colha da forma específica de triptofano não impacta a quiralidade dos últi-mos compostos de monatina na composição de monatina (porque a reaçãode triptofano forma indol-3-piruvato, que não tem quiralidade), alguns podempreferir utilizar L-triptofano como um material de partida pelo menos porqueL-triptofano é atualmente menos caro e mais facilmente obtenível do que D-triptofano
Focalizar-se agora na primeira reação mostrada na Figura 1,quando triptofano é convertido em indol-3-piruvato, qualquer um ou maisdentre alfa-cetoglutarato, oxaloacetato, e piruvato reage para formar um a-minoácido (glutamato, aspartato, e alanina respectivamente). Figura 1 des-creve a modalidade em que o material de partida de triptofano é L-triptofano,e o alfa-cetoglutarato, oxaloacetato, e/ou piruvato produzem a forma de L-isômero do aminoácido (tal como L-glutamato, L-aspartato, e/ou L-alanina,respectivamente).
Como mostrado na Figura 1, um método de realçar a produçãode R,R monatina envolve facilitar a reação de L-triptofano com uma enzimaque tem maior especificidade, maior atividade, ou ambas para triptofano aoinvés de MP ou monatina, e facilitar a reação de MP com uma D-enzima.Como é descrito em WO 03/091396 A2, certas enzimas podem facilitar areação de triptofano produzir indol-3-piruvato, bem como a reação de anima-ção de MP para produzir monatina. Uso de uma L-aminotransferase na eta-pa de aminação cria um centro quiral S na posição C-4 de monatina, consi-derando que uso de uma D-enzima cria um centro quiral D na posição C-4de monatina. Desse modo, no exemplo onde uma L-aminotransferase, quefacilita a reação de triptofano, é da mesma forma ativa na reação de MP1 R1Se S1S monatina podem ser formadas, dependendo da forma de MP presente.Além disso, certas outras enzimas - as L-aminoácido oxidases - podem nãoapenas facilitar um reação de triptofano em indol-3-piruvato, porém podemter uma atividade lateral para a degradação de R1R monatina. De acordocom algumas modalidades, esta atividade lateral de 4R é minimizada ou eli-minada. Uma atividade lateral de oxidase em formas 4S de monatina diminu-iria-a ou minimizaria-a a partir do produto final e pode ser desejável depen-dendo da composição final desejada. Por conseguinte, quanto maior a espe-cificidade e/ou atividade da L-enzima escolhida para triptofano versus MP oumonatina, maior a quantidade de R,R e S,R produzida versus S,S e R,S mo-natina.
Enzimas adequadas para a reação de triptofano, de acordo coma modalidade ilustrada na Figura 1, incluem: L-aminotransferases capazesde facilitar uma reação de L-triptofano formar indol-3-piruvato, e que têmmaior especificidade para essa reação sobre a reação de R-MP para formarisômeros 4S de monatina; e, L-aminoácido oxidases capazes de facilitaruma reação de L-triptofano formar indol-3-piruvato, e que têm maior especi-ficidade e/ou atividade para essa reação versus a reação de isômeros 4R demonatina para formar MP, e equivalentes funcionais de quaisquer das ante-cedentes. Mais especificamente, exemplos não-limitantes de enzimas ade-quadas podem ser escolhidos a partir de L-triptofano aminotransferases(E.C. 2.6.1.27) e tirosina (aromática) aminotransferases (EC 2.6.1.5) e L-aminoácido oxidases (EC 1.4.3.2), e mutantes derivados a partir de enzimasque têm atividade de aspartato aminotransferase.
Exemplo 16 identifica uma enzima específica, um polipeptídeode HEXaspC mutante que inclui uma substituição de Pro 9 em Tyr e umasubstituição de Arg 122 em Gly úteis para facilitar as reações de L-triptofanoe α-KG, oxaloacetato, piruvato, ou combinações destes para formar indol-3-piruvato e L-glutamato, L-aspartato, e L - alanina, respectivamente. Outraenzima específica que tem atividade "limitada" é TatA, a L-triptofano amino-transferase de S. meliloti. Outras enzimas adxequadas para a reação de trip-tofano de acordo com as modalidades preferidas da série de reação mostra-da na Figura 1 incluem aquelas com as seguintes características: uma enzi-ma que transamina MP na taxa de 1/10 ou menos que a taxa de L-triptofanocomo no Exemplo 16 ou uma enzima quando empregada com uma racema-se, como no Exemplo 18, que produz mais que 90% dos isômeros 4R demonatina.
Exemplos de enzimas que não têm maior especificidade para aconversão de L-triptofano em indol-3-piruvato comparada à conversão deMP em monatina incluem: HEXAspC (Exemplo 16), aminotransferase deampla especificidade de Leishmania major (WO 03/091396 A2), a amino-transferase de Porcino (WO 03/091396 A2) e TatA de Rhodobacter sphae-roides (Exemplo 18). Estas enzimas podem, entretanto, ser evoluídas, porexemplo através de mutagênese para ter atividade limitada para R-MP e/ouR,R monatina versus triptofano.
Focalizando-se agora na segunda reação identificada na Figura1, a escolha de enzima para facilitar a reação de indol-3-piruvato em MP in-fluencia a quantidade relativa de R,R monatina versus S,R monatina produ-zida. Em geral, quanto maior a quantidade relativa de R-MP versus S-MPproduzida, maior a quantidade relativa de R,R monatina versus S,R monati-na produzida (quando uma D-enzima facilita a reação de MP em monatina).Onde uma composição de monatina que tem a forma R1R de monatina comoseu único componente de monatina é desejada, uma enzima que seletiva-mente produz R-MP ao invés de S-MP (uma "enzima R-específica") deveriaser utilizada. Os polipeptídeos com atividade de aldolase descritos aqui sãoúteis produzindo-se seletivamente R-MP, ao invés de S-MP. Vários exem-plos de enzimas aldolase altamente R-específicas são demonstrados na Ta-bela 1, acima, Exemplos 4, 5 e 6, abaixo, e na Listagem de Seqüência.
Focalizando agora na última etapa da série de reação identifica-da na Figura 1, a reação de R-MP para formar R,R monatina mostrou serfacilitada por uma D-aminotransferase de ampla especificidade, por exem-plo, D-alanina aminotransferase (E.C. 2.6.1.21, da mesma forma conhecidacomo D-aminoácido aminotransferase ou D-aspartato aminotransferase) ouuma D-aminoácido desidrogenase. Como discutido acima, a conversão deMP em monatina é uma reação de aminação, que cria um centro quiral nocarbono C-4 de monatina. Onde a forma R-quiral é desejada na posição C-4,enzimas deveriam ser utilizadas, as quais produzem centros quirais "R" emaminoácidos.
De acordo com algumas modalidades, a D-aminotransferase temmaior especificidade, maior atividade, ou ambas para a R-MP do que paraindol-3-piruvato. De acordo com algumas modalidades, a D-aminotransferase limitou a atividade para o indol-3-piruvato. Enzimas comtais características podem ser evoluídas ou mutadas a partir de enzimas e-xistentes, por exemplo, como mostrado no Exemplo 16.
Exemplos 9 a 12 ilustram a produção de R,R-monatina de D-triptofano.
Figura 2 ilustra um método de produzir R,R monatina e S1R mo-natina. Considerando a modalidade da Figura 1, a aldolase utilizada na rea-ção de indol-3 - piruvato para formar R-MP influencia a relação de R,R:S,Rformada, na modalidade da Figura 2, a D-enzima que facilita a conversão deMP em monatina influencia a relação de R,R:S,R formada. De acordo com asérie de reação da Figura 2, se uma enzima não estereoespecífica é utiliza-da para facilitar a conversão de indol-3 - piruvato em MP1 em seguida S-MPe R-MP podem ser formados. Se um aldolase não estereosseletiva é utiliza-da para converter indol-3-piruvato em MP1 em seguida uma transaminaseestereosseletiva é requerida para converter MP em R1R monatina ou S1Rmonatina. Como mostrado na Figura 2, uso de uma D-aminotransferase ouD-aminoácido desidrogenase que é estereoespecífica para R-MP resulta naprodução de R,R monatina.
A Figura 3 ilustra outra série de reação alternativa para alvejar aprodução de R,R monatina. A série de reação da Figura 3 é uma modifica-ção da série de reação da Figura 1, em que indol-3 - piruvato é produzidoindiretamente, em vez de diretamente, a partir de L-triptofano. Mais especifi-camente, L-triptofano é convertido em D-triptofano, e D-triptofano é converti-do em seguida em indol-3-piruvato.A conversão de L-triptofano em D-triptofano pode ser facilitadapor uma triptofano racemase ou equivalente funcional desta. Exemplo 15fornece fontes potenciais de triptofano racemases e métodos de avaliaçãopara para identificar tais enzimas. É da mesma forma considerado que umatriptofano racemase pode ser evoluída (tal como por mutagênese ou enge-nharia recombinante) para desempenho melhorado a partir de uma aminoá-cido racemase existente.
Exemplos não-limitantes de triptofano racemases incluem homó-logo ou mutantes de aminoácido racemases (EC 5.1.1. -), por exemplo seri-na racemase, em que os homólogos ou mutantes são capazes de converterL-triptofano em D-triptofano. Exemplos não-limitantes de fontes das quais aaminoácido racemase pode ser derivada incluem: microorganismos tais co-mo Salmonella typhimurium, Escherichia coli, Bacillus subtilis, Pseudomonasaeruginosa, Vibrio eholerae, Schizosaccaroyces pombe, Bacillus eereus, En-teroeoeeus gallinarum, Pedioeoceus pentosaeeus, Bacillus pumilus, Laetoba-eillus fermenti, Lactobacillus brevis, Aquifex pyrophilus, Laetobaeilli, Strepto-eoeeus, Anabaena sp., Pseudomonas striata, Lentinus edodes, Seaphareabrouhtonii Desulfuroeoeeus sp., Thermocoeeus sp., e Pseudomonas striata.
Exemplos não-limitantes adicionais de fontes das quais a aminoácido race-mase pode ser derivada incluem bicho-da-seda, cérebro de camundongo, oucérebro de camundongo.
Exemplos não-limitantes de fontes potenciais das quais triptofa-no racemases podem ser derivadas adequado incluem: microorganismostais como Pseudomonas, por exemplo, Pseudomonas ehlororaphis (Pseu-domonas aurereofaeiens) (ATCC1 5926), e Burkholderia pyrroeina (ATCC15958). Exemplos não-limitantes adicionais de fontes potenciais das quaistriptofano racemases adequadas podem ser derivadas incluem plantas, porexemplo, plantas de tabaco, tal como Nieotiana tabaeum, plantas de trigo, talcomo Tritieum aestivum, beterrabas, tomates, e Scleroehiton ilieifolius.
A rota mostrada na Figura 3 tem certos benefícios, incluindo es-tes até mesmo onde R,R monatina é o produto desejado, a mesma enzimapode ser utilizada para a reação que produz indol-3-piruvato em relação àreação que produz monatina. Isto é, na série de reação ilustrada na Figura 1,uma L-aminotransferase (ou L-enzima adequada) facilita a reação que pro-duz indol-3-piruvato, porém uma D-aminotransferase facilita a reação queproduz monatina. Ao contrário da série de reação da Figura 3, certa D-aminotransferase que facilita a reação que produz indol-3-piruvato, pode damesma forma facilitar a reação que produz monatina. Por conseguinte, nasseries de reação de acordo com a Figura 3, as D-aminotransferases de am-pla especificidade podem ser preferidas onde há um desejo de utilizar amesma enzima para a reação que forma indol-3-piruvato em relação à rea-ção que forma monatina. Ao contrário, nas séries de reações de acordo comas Figuras 1,2,4, 6, 7, e 8, produção de monatina pode proceder adiantemais eficazmente quando uma D-aminotransferase for escolhida, a qual tematividade limitada e/ou especificidade para indol-3-piruvato quando compa-rada ao R-MP.
Outro benefício da série de reação esquematicamente represen-tada na Figura 3 é que o produto de aminoácido da reação acoplada à rea-ção que produz indol-3-piruvato pode ser utilizado agora como um materialde partida na reação acoplada à reação que produz monatina. Isto é, na sé-rie de reação ilustrada na Figura 1, L-triptofano reage para produzir indol-3-piruvato e ao mesmo tempo oxaloacetato, alfa-cetoglutarato e/ou piruvatoreagem para produzir um L-aminoácido. Porque a reação de R-MP para for-mar monatina é acoplada com uma reação que utiliza um D-aminoácido co-mo um substrato, o L-aminoácido da reação que forma indol-3-piruvato nãoé, sob condições mostradas, reciclado para uso na reação acoplada á rea-ção de R-MP. Ao contrário, na série de reação ilustrada na Figura 3, a rea-ção de D-triptofano para formar indol-3-piruvato é acoplada a uma reaçãoque forma um produto de D-aminoácido, cujo D-aminoácido pode ser reci-clado para uso na reação acoplada à reação de R-MP. Isto permite alguémutilizar quantidades não estequiométricas do aceptor de amino na etapa um.Em algumas modalidades da invenção, o D-aminoácido é D-alanina.
As Figuras 4 e 5 ilustram modificações adicionais da série dereação mostrada na Figura 1, cujas modificações são direcionada à recicla-gem do produto de aminoácido formado pela reação acoplada com a reaçãode L-triptofano com o reagente de aminoácido da reação acoplada ao MP àreação de monatina.
Referindo-se à Figura 4, a reciclagem é realizada fornecendo-seuma enzima que pode facilitar a conversão de um L-aminoácido em um D-aminoácido e vice-versa. Mais especificamente, onde como é mostrado naFigura 4, α-KG reage para formar L-glutamato quando L-triptofano reage pa-ra formar indol-3-piruvato, uma glutamato racemase (EC 5.1.1.3) ou equiva-lente funcional pode ser fornecida, a qual pode facilitar a conversão de L-glutamato em D-glutamato e vice-versa. Em um tal exemplo, o L-glutamatoformado ao lado da produção de indol-3-piruvato é removido em virtude desua conversão em D-glutamato, e o D-glutamato formado a partir da conver-são de L-glutamato está, em seguida, disponível como um substrato para areação acoplada com o MP à reação de monatina. Similarmentemente, o a-KG formado na reação de D-glutamato está disponível como um substratopara a reação acoplada ao L-triptofano à reação de indol-3-piruvato.
Exemplos não-limitantes de fontes potenciais a partir das quaisum glutamato racemase pode ser derivada incluem Pediococcus pentosa-eeus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis, E. eoli,Aquifex pyrophilus, e Bacillus subtilis. Mais especificamente (da mesma for-ma não-limitante), o glutamato racemase pode ser expresso a partir de umácido nucléico tal como gene de pediococeus pentaosaeeus murl (GenbankAccession No. L22789), ou glutamato racemase de Lactobacillus brevis.
Onde o oxaloacetato reage para formar L-aspartato quando L-triptofano reage para formar indol-3-piruvato, um aspartato racemase (EC5.1.1.13) ou equivalente funcional pode ser fornecida para converter L-aspartato em D-aspartato. Em tal um exemplo, o L-aspartato ao lado da pro-dução de indol-3-piruvato é removido em virtude de sua conversão em D-aspartato, e o D-aspartato formado a partir da conversão de L-aspartato es-tá, em seguida, disponível como um substrato para a reação acoplada aoMP à reação de monatina. Similarmentemente, o oxaloacetato formado nareação de D-aspartato é disponível para agir como um substrato para a rea-ção acoplada ao L-triptofano à reação de indol-3-piruvato.
Exemplos não-limitantes de enzimas adequadas que têm ativi-dade de aspartato racemase incluem ASPR-101 (BioCatalytics, Inc., Pasa-dena, CA) e homólogos ou mutantes de um aminoácido racemase (EC 5.1.1.que são capazes de facilitar a conversão de L-aspartato em D-aspartato.
Exemplos não-limitantes de fontes potenciais a partir das quaisaspartato racemases pode ser derivada incluem: Desulfurococcus, Thermo--coccus,. Scapharca, brouhtonii de molusco bivalve, Acinetohacter, Agrobac-terium, Archaeoglobus, Bacillus, Bordetella, Bradyrhizobium, Brevibacterium,Burkholdería, Campylobacter, Candida, Caulobacter, Clostridium, Desulfito-bacterium, Desulfotalea, Enterococcus, Erwinia, Escherichia, Ferroplasma,Helicobacter, Klebsiella, Lactobacillus, Mannheimia, Medicago, Mesorhizobi-um, Methanococcus, Methanosarcina, Oceanobaciilus, Oenococcus, Pedio-coccus, Polaribacter, Pseudomonas, Pyrococcus, Raisonia, Shigella, Sino-rhizobium, Salmoneila, Sphingomonas, Streptococcus, Thermoanaerobacter,Vibrio, Wolineila, Xanthomonas, Xanthobacter, Yersinia e Zymomonas.
Onde piruvato reage para formar L-alanina quando L-triptofanoreage para formar indol-3-piruvato, uma alanina racemase ou funcional equi-valente pode ser fornecida para converter L-alanina em D-alanina. Em um talexemplo, a L-alanina formada ao lado da produção de indol-3-piruvato é re-movida em virtude de sua conversão em D-alanina, e a D-alanina formada apartir da conversão de L-alanina está, em seguida, disponível para agir comoum substrato para a reação acoplada ao MP à reação de monatina. Similar-mentemente, o piruvato formado na reação de D-alanina está disponível pa-ra agir como um substrato para a reação acoplada com o L-triptofano à rea-ção de indol-3-piruvato.
Exemplos não-limitantes de alanina racemases adequadas in-cluem A8936 (Sigma - Aldrich, St. Louis, MO).
Exemplos não-limitantes de fontes potenciais a partir das quaisas alanina racemase podem ser derivadas incluem: Brucelia abortus, Strep-tococcus faecalis, Salmoneila typhimurium, Escherichia coli, Bacillus subtilis,Bacillus stearothermophilus, Pseudomonas aeruginosa, Vibrio cholerae, S-chizosaccaroyces pombe, Bacillus cereus e Lentinus edodes.
Exemplos 18 e 21 ilustram o uso das racemases acima, seu im-pacto no aumento da relação do produto de monatina desejado, e fornecefontes potenciais para as enzimas racemase.
Referindo-se à Figura 5, uma aminotransferase estereoinvertidaé utilizada para facilitar a reação de R-MP em monatina. Embora tipicamentea reação de R-MP (ou S-MP) para formar a R1R monatina (ou S1R monatina)seja acoplada com a reação de um D-aminoácido, uma aminotransferaseestereoinvertida pode facilitar as reações acopladas de R-MP (ou S-MP) pa-ra formar R,R monatina (ou S1R monatina) utilizando um L-aminoácido . Des-te modo, o produto de L-aminoácido da reação de L-triptofano aminotransfe-rase pode ser utilizado como um substrato para o transaminação de MP àmonatina, e o produto (isto é, oxaloacetato, piruvato, e/ou α-KG) da reaçãoacoplada à reação de MP à monatina pode ser utilizado como um materialde partida para a reação acoplada à reação de L-triptofano a indol-3- piruva-to. Exemplos não-limitantes de aminotransferases estereoinvertida que po-dem ser utilizados incluem D-fenilglicina aminotransferase (EC 2.6.1.72, damesma forma conhecida como D-4-hidroxifenilglicina aminotransferase) e D-metionina aminotransferase (EC 2.6.1.41, da mesma forma conhecida comoD-met-aminotransferase e D-metionina-piruvato aminotransferase). Exem-plos não-limitantes de fontes potenciais a partir das quais a D-fenilglicinaaminotransferase pode ser derivada incluem Pseudomonas, tais comoPseudomonas putida LW-4 e Pseudomonas stutzeri ST-201. Exemplos não-limitantes de fontes potenciais a partir de qual a D-metionina aminotransfe-rase pode ser derivada incluem inclua couve-flor e amendoim.
Exemplos 19 e 20 juntos fornecem fontes potenciais de enzimasestereoinvertidas, e métodos de preparar tais enzimas. Os exemplos damesma forma fornecem métodos de avaliação para identificar tais enzimas.É da mesma forma considerado que tais enzimas podem ser evoluídas deenzimas estereoinvertidas conhecidas ou encontradas na natureza. Comoum exemplo não-limitante, a aminotransferase estereoinvertida pode ser umhomólogo ou mutante de uma D-aminoácido aminotransferase ou um homó-logo ou mutante de um aminoácido racemase (EC 5.1.1.-)·
Figuras 6-8 da mesma forma ilustram modificações para a sériede reação da Figura 1. As séries de reações ilustradas nas Figuras 6-8 for-necem métodos para empurrar reações de equilíbrio dianteiras removendo-se o subproduto da reação de triptofano e em alguns casos fornecendo-sesubstrato para a reação de MP.
Referindo-se à Figura 6, a série de reação mostrado remove oproduto de L-aminoácido da reação acoplada à reação de triptofano conver-te ndo-a a um L-aminoácido diferente, e em seguida fornece um substratopara reação acoplada à reação de MP convertendo-se o L-aminoácido re-centemente formado em um D-aminoácido. Especificamente, L-triptofano émostrado para reagir ao lado do oxaloacetato para formar indol-3-piruvato eL-aspartato. Uma aspartato 4-descarboxilase (EC 4.1.1.12) ou equivalentefuncional é utilizada para facilitar a conversão de L-aspartato em L-alanina edióxido de carbono, e uma enzima com atividade de alanina racemase é uti-lizada para facilitar a conversão de L-alanina em D-alanina, cuja D-alaninapode servir como um doador de amino para a conversão de R-MP em mona-tina.
Referindo-se à Figura 7, a série de reação mostrada ilustra mé-todos adicionais para remover o produto de L-aminoácido da reação acopla-da à reação de triptofano. Modalidades como apresentadas na figura produ-zem um(uns) subproduto(s) que é(são) indisponível(eis) para reagir na dire-ção reversa, por exemplo, devido à volatilidade (tal como dióxido de carbo-no) ou por conversão espontânea em um produto final não reativo. Um e-xemplo de um tal método inclui onde o α-KG reage ao lado de L-triptofanopara produzir L-glutamato, uma glutamato descarboxilase (EC 4.1.1.15) ouequivalente funcional pode ser fornecida, que pode facilitar a conversão deL-glutamato em 4-aminobutanoato (com dióxido de carbono como um sub-produto). Exemplos não-limitantes de fontes potenciais a partir das quais aL-glutamato descarboxilase pode ser derivada incluem: Clostridium perfrin-gens, C. welchii, ou E. coli.
Outro exemplo de um tal método para mover a reação de tripto-fano dianteira inclui onde o oxaloacetato reage aolado de L-triptofano, umaspartato decarboxilase (EC 4.1.1.11) ou equivalente funcional pode ser for-necido para facililar a conversão de L-aspartato em β-alanina (com dióxidode carbono como um subproduto).
Referindo-se à Figura 8, a série de reação mostrada ainda ilustramétodos adicionais para remover o produto de L-aminoácido da reação aco-plada à reação de triptofano e fornecer um substrato para a reação acopladaà reação de MP. Especificamente, onde α-KG reage ao lado de L-triptofanopara formar L-glutamato, uma enzima com atividade de L-alanina amino-transferase e piruvato pode ser fornecida, em que a enzima de L-alaninaaminotransferase facilita a reação de piruvato e L-glutamato formar L-alanina. Uma alanina racemase ou equivalente funcional pode da mesmaforma ser fornecida para facilitar a conversão da L-alanina em D-aJanina,cuja D-alanina pode ser utilizada como um substrato junto com MP para for-mar monatina e piruvato. Vide Exemplos 18 e 21.
Séries de Reações Biossintéticas para Produzir R1R e Outros Estereoisôme-ros de Derivados de Monatina.
Os métodos da invenção descrita que incluem a utilização dospolipeptídeos com atividade de aldolase descrita aqui podem ser utilizadopara facilitar a reação entre um indol-3-piruvato substituído e uma fonte decarbono C3.
Enzimas úteis para a facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3 incluem um ou mais polipep-tídeos com atividade de aldolase de qualquer dentre SEQ ID NO: 2, SEQ IDNO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO:22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO:40, SEQ DD NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ 3D NO:58, SEQ ID NO: 60, SEQ BD NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO:76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO:94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102,SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116,. SEQ ID NO: 118, SEQ IDNO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO:128, SEQ ID NO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136,SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ IDNO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO:162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170,SEQ ID NO: 172, SEQ ED NENHUM: 174, SEQ ID NO: 176, SEQ ID NO:178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186,SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQID NO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ IDNO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO:212, SEQ EO NO: 214, SEQ ID NO: 216, SEQ ID NQ:218, SEQ ID NO: 220,SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ IDNO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO:246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254,SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ IDNO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO:280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288,SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ IDNO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO:314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322,SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQID NO: 332 ou SEQ ID NO: 334 ou fragmentos ou subseqüências destes,que têm atividade de aldolase destes.Em uma modalidade, um ou mais polipeptídeo(s) com atividadede HMG aldolase de qualquer um dentre, SEQ ID NO: 2, SEQ ID NO: 4,SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO:14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO:32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO:50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO:68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO:86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO:104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112,SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ IDNO: 130, SEQ ID NO: 132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID NO:138, SEQ ID NO: 140, SEQ ID NO: 142, SEQ ID NO: 144, SEQ ID NO: 146,SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ IDNO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO:172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180,SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ IDNO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO:206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214,SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ IDNO: 232, SEQ ID NO:234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO:240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248,SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ IDNO: 266, SEQ ID NO: 268, SEO ID NO: 270, SEQ ID NO: 272, SEQ ID NO:274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282,SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ IDNO: 300, SEQ ID NO: 302, SEQ ID NO: 304 ou fragmentos ou subseqüên-cias destes, que têm atividade de aldolase, pode(m) ser útil(eis) na facilita-ção de uma reação entre um indol-3-piruvato substituído e uma fonte de car-bono C3.
Em outra modalidade, um ou mais polipeptídeo(s) com atividadede KHG aldolase de qualquer um dentre, SEQ ID NO: 306, SEQ IO NO: 308,SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ IDNO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332 ou SEQ IDNO: 334 ou fragmentos ou subseqüências destes, que têm atividade de al-dolase, pode(m) ser útil(eis) na facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
Alternativamente, um ou mais polipeptídeo(s) com atividade dealdolase codificada por uma seqüência de ácido nucléico que tem pelo me-nos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%,61%, 62%, 63%, 64%, 65%, 66%, 61%, 68%, 69%, 70%, 71%, 72%, 73%,74%, 75%,"76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%,87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% oumais, ou identidade de seqüência completa (100%) para um ácido nucléicode acordo com a invenção, incluindo SEQ ID NO: 1, SEQ ID NO: 3, SEQ IDNO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO:23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID MO: 39, SEQ ID NO:41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO:59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO:77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO:95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103,SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ IDNO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO:129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137,SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ IDNO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO:163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171,SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ IDNO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ IDNO:197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO:205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213,SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ IDNO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO:239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247,SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ IDNO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO:273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281,SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ IDNO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO:307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315,SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ IDNO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 e SEQ ID NO:338, em uma região de pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45,50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750,800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400,1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000,2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500, ou mais resíduospode(m) ser útil(eis) na facilitação de uma reação entre um indol-3-piruvatosubstituído e uma fonte de carbono C3.
Em uma modalidade da invenção, um ou mais polipeptídeo(s)com atividade de HMG aldolase codificada por uma seqüência de ácido nu-cléico que tem pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%,57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%,83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,96%, 97%, 98%, 99%, ou mais, ou identidade de seqüência completa(100%) para um ácido nucléico de acordo com a invenção, incluindo SEQ IDNO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ IDNO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19,SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ IDNO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37,SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ IDNO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55,SEQ ID NO: 57, SEQ iD NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ IDNO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO:71, SEQ ID NO: 73,SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ IDNO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91,SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ IDNO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO:109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117,SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ IDNO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO:143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151,SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQID NO: 161, SEQ ID NO: 163, SEO ID NO: 165, SEQ ID NO: 167, SEQ IDNO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO:177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185,SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ IDNO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO:211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219,SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQ IDNO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO:245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253,SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ IDNO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO:279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287,SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ IDNO: 305, em uma região de pelo menos cerca de 10, 15, 20, 25, 30, 35, 40,45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700,750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350,1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950,2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500, ou mais resí-duos, pode(m) ser útil(eis) na facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
Em outra modalidade da invenção, um ou mais polipeptídeo(s)com atividade de KHG aldolase codificada por uma seqüência de ácido nu-cléico que tem pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%,57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%,83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,96%, 97%, 98%, 99%, ou mais, ou identidade de seqüência completa(100%) para um ácido nucléico de acordo com a invenção, incluindo SEQ IDNO: 307, SEQ ID NO: 309, SEO ID NO: 311, SEQ ID NO: 313, SEQ ID NO:315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323,SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 e SEQ IDNO: 338, em uma região de pelo menos cerca de 10, 15, 20, 25, 30, 35, 40,45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700,750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350,1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950,2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500, ou mais resí-duos, pode(m) ser útil(eis) na facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
Um ou mais polipeptídeo(s) com atividade de aldolase codificadapor uma seqüência de ácido nucléico que hibridiza sob condição severa paraum ácido nucléico de SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ IDNO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15,SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ IDNO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO:33,SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ IDNO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51,SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ IDNO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69,SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ IDNO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87,SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ IDNO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO:105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113,SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ IDNO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO:139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147,SEQ ID NO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ IDNO: 165, SEQ ID NO: 167, SEO ID NO: 169, SEQ ID NO: 171, SEQ ID NO:173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181,SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ IDNO: 199, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO:207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215,SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQID NO: 225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ IDNO: 233, SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO:241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ JD NO: 247, SEQ ID NO: 249,SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ IDNO: 267, SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO:275, SEQ ID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283,SEQ ID NO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQID NO: 293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ IDNO: 301, SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO:309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317,SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ IDNO: 335, SEQ ID NO: 336, SEQ ID NO: 337 e SEQ ID NO: 338 pode(m) serútil(eis) na facilitação de uma reação entre um indol-3-piruvato substituído euma fonte de carbono C3.
Em uma modalidade da invenção, um ou mais polipeptídeo(s)com atividade de HMG aldolase codificada por uma seqüência de ácido nu-cléico que hibridiza sob condição severa para um ácido nucléico de SEQ IDNO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ IDNO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19,SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ IDNO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37,SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ IDNO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55,SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ IDNO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73,SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ IDNO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91,SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ IDNO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO:109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117,SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ IDNO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO:143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151,SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ IDNO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO:177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185,SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQ IDNO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO:211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219,SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227, SEQID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235/SEQ IDNO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO:245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253,SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQ IDNO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ ID NO:279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287,SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295, SEQID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQ IDNO: 305, pode(m) ser útil(eis) na facilitação de uma reação entre o indol-3-piruvato substituído e a fonte de carbono C3.
Em outra modalidade da invenção, um ou mais polipeptídeo(s)com atividade de KHG aldolase codificada por uma seqüência de ácido nu-cléico que hibridiza sob condição severa para um ácido nucléico de SEQ IDNO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ ID NO: 313, SEQ ID NO:315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO: 321, SEQ ID NO: 323,SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329, SEQ ID NO: 331, SEQID NO: 333, SEQ ID NO: 335, SEQ ID NO: 336, SEQ ID NO: 337 e SEQ IDNO: 338, pode(m) ser útil(eis) na facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
Em uma modalidade, o grupo substituinte do indol-3-piruvatosubstituído é um átomo de halogênio ligado a qualquer átomo de carbono doanel de indol. Em outra modalidade, o grupo substituinte é um átomo de clo-ro ligado a qualquer carbono do anel de indol. Em ainda outra modalidade, oderivado de monatina é ácido 4-hidróxi-4-{6-metilindol-3-ilmetil)glutâmico.
Polipeptídeos que têm atividade de aldolase, e conforme algu-mas modalidades da invenção, podem ser utilizados em uma série de rea-ção de multietapas em que, uma ou mais etapa(s) é(são) uma reação desíntese química. Por exemplo, em algumas modalidades, um ou mais poli-peptídeo(s) que têm atividade de aldolase, pode facilitar uma reação entrepiruvato e indol-3-piruvato, para produzir precursor de monatina. O precursorde monatina pode ser em seguida purificado. Uma reação de aminação re-dutiva do precursor de monatina pode ser em seguida utilizada para produzirmonatina.
Polipeptídeos que tem atividade de aldolase, e conforme algu-mas modalidades da invenção, bem como as outras enzimas utilizadas noprocesso para produzir monatina e derivados de monatina, pode ser utiliza-dos forma de suspensão de sulfato de amônio, pura, bruta ou isolada.
Polipeptídeos que tem atividade de aldolase, e conforme algu-mas modalidades da invenção, podem ser otimizados utilizando-se agentesde estabilização, incluindo ditiotreitol ("DTT") e β-mercaptoetanol.
Monatina ou derivado de monatina que é produzido utilizando-seum ou mais dos polipeptídeos descritos aqui, é geralmente pelo menos cer-ca de 50 a cerca de 99% de R,R-monatina ou derivado de R,R-monatina, empeso da monatina total ou derivado de monatina produzido. Em outras mo-dalidades, a monatina ou derivado de monatina produzido utilizando-se umou mais dos polipeptídeos descritos aqui, é maior que 60% de R,R-monatinaou derivado de R,R-monatina, em peso da monatina total produzido; por e-xemplo, a R,R-monatina ou derivado de R,R-monatina é 70%, 75%, 80%,85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% da monati-na total ou derivado de monatina produzida. Alternativamente, várias quanti-dades de duas ou mais preparações de monatina ou derivado de monatinapodem ser combinadas para resultar em uma preparação que é uma porcen-tagem desejada de R,R-monatina ou derivado de R,R-monatina. Por exem-plo, uma preparação de monatina que é 60% de R,R-monatina pode sercombinada com uma preparação de monatina que é 90% de R,R-monatina;se quantidades iguais de 60% e 90% de preparações de R,R-monatina sãocombinadas, a preparação de monatina resultante seria 75% de R,R-monatina.
A monatina ou derivado de monatina, ou um intermediário (inclu-indo precursor de monatina), produzido utilizando-se um ou mais dos poli-peptídeos descritos aqui, pode ser purificado a partir dos componentes dareação. Em uma modalidade, a monatina, derivado de monatina ou interme-diário, tal como precursor de monatina, pode ser purificado simplesmenteremovendo-se a substância que deve ser purificada da preparação de enzi-ma na qual foi sintetizada.
Em outras modalidades, o intermediário, precursor de monatina,monatina ou derivado de monatina é purificado de uma preparação na qualfoi sintetizada para que a que a preparação ou composição "purificada" re-sultante é pelo menos cerca de 5-60% de monatina em peso dos compostosorgânicos totais. Em outra modalidade, a monatina, derivado de monatina ouintermediário, tal como precursor de monatina, pode ser purificado em umgrau de pureza de pelo menos cerca de 70%, 80%, 90%, 95% ou 99% empeso dos compostos orgânicos totais. O monatina, derivado de monatina ouo intermediário (incluindo precursor de monatina), produzido utilizando-seum ou mais dos polipeptídeos descritos aqui, pode ser purificado dos com-ponentes da reação por qualquer método conhecido por uma pessoa de ex-periência ordinária na técnica. Otimamente1 a monatina purificada ou inter-mediário pode ser repetidamente recristallizado até que grau desejado depureza seja alcançado.
Os exemplos seguintes são oferecidos para ilustrar, porém não-Iimitar a invenção reivindicada.
EXEMPLOS
Exemplo 1
Detecção de Monatina, Precursor de Monatina, Triptofano, Alanina, As-partato e Glutamato.
Este exemplo descreve métodos utilizados para detectar a pre-sença de monatina, precursor de monatina ("MP"), triptofano, aspartato, ala-nina e glutamato. Da mesma forma descreve um método para a separação edetecção dos quatro estereoisômeros de monatina.
Varredura de Monitoramento de Reação Múltipla de LC/MS/MS ("MRM")e Triptofano.
Varreduras de misturas para monatina e triptofano derivados apartir de reações bioquímicas in vitro ou in vivo foram realizadas utilizandoum instrumento de espectrometria de massa em série de cromatografia Ii-quida Waters/Micromass incluindo uma cromatografia líquida Waters 2795com um monitor de absorvência de Disposição de Foto-Diodo Waters 996(PDA) colocado em série entre ao cromatógrafo e um espectrômetro demassa quadripolar triplo Micromass Quattro Ultima. Separações de LC foramfeitas utilizando uma coluna de cromatografia de fase reversa de C8 XterraMS, 2,1 mm χ 250 mm a 40°C. A fase móvel de LC consiste em A) água con-tendo (i) 0,05% (v/v) de ácido trifluoracético ou (ii) 0,3% de ácido fórmico e10 mM de formato de amônio e B) metanol contendo (i) 0,05% (v/v) de ácidotrifiuoracético ou (ii) 0,3% de ácido fórmico e 10 mM de formato de amônio.
Se a fase móvel de LC consistiu em A) água contendo 0,05%(v/v) de ácido trifiuoracético e B) metanol contendo 0,05% (v/v) de ácido tri-fluoracético, eluição de gradiente foi linear de 5% de B a 35% de B, 0-4 mi-nutos, linear de 35% de B a 60% de B1 4-6,5 minutos, linear de 60% de B a90% de B1 6,5-7 minutos, isocrática em 90% de B, 7-11 minutos, linear de90% de B a 95% de B, 11-12 minutos, linear de 95% de B a 5% de B, 12-13minutos, com um período de re-equilíbrio de 2 minuto entre os ciclos. A taxade fluxo foi 0,25 mL/min, e a absorvência de PDA foi monitorado de 200 nma 400 nm. Todos os parâmetros de ESI-MS foram otimizados e selecionadoscom base na geração de íons moleculares protonados ([M + H]+) dos anali-sados de interesse, e produção de íons de fragmento característicos. Osseguintes parâmetros instrumentais foram empregados para varredura deMonitoramento de Reação Múltipla LC/MS/MS (MRM) de monatina de tripto-faNO: Capilar: 3,5 kV; Cone: 40 V; Hex: 20 V; Abertura: 0 V; Hex 2: 0 V;Temperatura da Fonte: 100°C; Temperatura de dissolvatação: 350 0C; Gásde dissolvatação: 500 L/h; Gás do cone: 50 L/h; Resolução de massa baixa(Q1): 12.0; Resolução de massa alta (Q1): 12.0; Energia de íon: 0.2; Entra-da: -5 V; Energia de Colisão: 8; Saída: IV; Resolução de massa baixa (Q2):15; Resoluçãp de massa alta (Q2): 15; Energia de íon (Q2): 3,5; Multiplica-dor: 650. Cinco transições de MRM de pai para filha específicas de monatinasão utilizados para especificamente detectar monatina em reações in vitro ein vivo. As transições monitoradas são 293,1 a 158,3, 293,1 a 168,2, 293,1 a211,2, 293,1 a 230,2, e 293,1 a 257,2. Triptofano é monitorado com a transi-ção de MRM 204,7 a 146,4. Para quantificação padrão interna de monatina etriptofano, quatro padrões de calibre contendo quatro relações diferentes decada analisado em d5-triptofano e d5-monatina, são analisados. Estes dadossão submetidos a uma varredura dos mínimos quadrados linear para formaruma curva de calibre para monatina e triptofano. A cada amostra é adiciona-da uma quantidade fixa de d5-triptofano e d5-monatina (d5-monatina foi sin-tetizada de d5-triptofano de acordo com os métodos a partir deW003/091396 A2), e as relações de resposta (monatina/d5-monatina; tripto-fano/d5-triptofano) utilizadas junto com as curvas de calibre descritas acimapara calcular a quantidade de cada analisado nas misturas.
Se a fase móvel de LC foi A) água contendo 0,3% de ácido fór-mico e 10 mM de formato de amônio e B) metanol contendo 0,3% de ácidofórmico e 10 mM de formato de amônio, a eluição de gradiente foi linear de5% de B a 45% de B, 0-8,5 minutos, linear de 45% de B a 90% de B, 8,5-9minutos, isocrática a partir de 90% de B a 90% de B, 9-12,5 minutos, linearde 95% de B a 5% de B, 12,5-13 minutos, com um período de re-equilíbriode 4 minuto entre os cilcos. A taxa de fluxo foi 0,27 mL/min, e absorvênciade PDA foi monitorada a partir de 210 nm a 400 nm. Todos os parâmetrosdo ESI-MS foram otimizados e selecionados com base na geração de íonsmoleculares protonados ([M + H]+) dos analisados de interesse, e produçãode íons de fragmento característicos. Os parâmetros instrumentais utilizadospara esta fase móvel secundária são iguais ao anterior. Quatro transições deMRM de pai para filha específicas de monatina e uma de pai para filha espe-cífica de triptofano são utilizadas para especificamente detectar monatina etriptofano em reações in vitro e in vivo. As transições monitoradas são 293,1a 158,0, 293,1 a 168,0, 293,1 a 211,5 e 293,1 a 257,0. Triptofano é monito-rado com a transição de MRM 205,2 a 146,1. Para quantificação padrão in-terna de monatina e triptofano, quatro padrões de calibre contendo quatrorelações diferentes de cada analisado para d5-triptofano e d5-monatina, sãoanalisados. Estes dados são submetidos a uma varredura de mínimos qua-drados linear para formar uma curva de calibre para monatina e triptofano. Acada amostra é adicionada uma quantidade fixa de d5-triptofano e d5-monatina (d5-monatina foi sintetizada a partir de d5-triptofano de acordo comos métodos de W003/091396 A2), e as relações de resposta (monatina/d5-monatin; triptofano/d5-triptofano) junto com as curvas de calibre descritasacima são utilizadas para calcular a quantidade de cada analisado nas mis-turas. Transições de massa de pai para filha monitoradas para d5-triptofanoe d5-monatina são 210,2 a 151,1, e 298,1 a 172,0 respectivamente.Medida de Massa Precisa de Monatina
Varredura de MS de alta resolução foi realizada utilizando umespectrômetro de massa de tempo de trajetória/quadrupolar híbrido AppliedBiosystems-Perkin Elmer Q-Star. A massa medida para monatina protonadausou triptofano como um padrão de calibre de massa interno. A massa cal-culada de monatina protonada, baseada na composição elementarCi4Hi7N2O5 é 293,1137. Monatina produzida utilizando o processo biocatalí-tico descrito nos Exemplos 2 e 3 mostrou uma massa medida de 293,1144.Este é um erro de medida de massa menor que 2 partes por milhões("ppm"), fornecendo evidência conclusiva da composição elementar de mo-natina produzida enzimaticamente.
Medida de LC/MS/MS ("MRM") Quiral de Monatina
Determinação da distribuição de estereoisômero de monatinaem reações in vitro e in vivo foi realizada por derivação com 1 -flúor-2-4-dinitrofenil-5-L-alanina amida ("FDAA"), seguido por medida de LC/MS/MSMRM de fase reversa.
Derivação de Monatina com FDAA
Para 50 μL de amostra ou padrão e 10 μL de padrão interno foiadicionado 100 μL ou 200 μL de uma solução a 1% de FDAA em acetona.Vinte ou quarenta μL respectivamente, de 1,0 M de bicarbonato de sódioforam adicionados, e a mistura incubada durante 1 h a 40°C com misturaçãoocasional. A amostra foi removida e resfriada, e neutralizada com 20 μL de2,0 M de HCI (mais HCI pode ser requerido para realizar a neutralização deuma mistura biológica tamponada). Depois que a desgaseificação foi conclu-ída, as amostras ficaram prontas para varredura por LC/MS/MS.
Monitoramento de Reação Múltipla de LC/MS/MS para a Determinaçãoda Distribuição de Estereoisômero de Monatina em em Reações in vitroe in vivo.
Varreduras foram realizadas utilizando a instrumentação deLC/MS/MS descrita acima. Separações de LC capazes de separar todos osquatro estereoisômeros de monatina (especificamente FDAA-monatina) fo-ram realizadas em uma coluna de cromatografia de fase reversa C18 (2) de2,0 χ 250 mm (3 μπι) Phenomenex Luna a 40°C. A fase móvel de LC consis-tiu em A) água contendo 0,05% (massa/volume) de acetato de amônio e B)acetonitrila. A eluição foi isocrática^m 13% de B, 0-2 minutos, linear de 13%de B a 30% de B, 2-15 minutos, linear de 30% de B a 80% de B, 15-16 minu-tos, isocrática-em 80% de B 16-21 minutos, e linear de 80% de B a 13% deB, 21-22 minutos, com um período <te reequilíbrio de 8 minutos entre os ci-clos. A taxa de fluxo foi 0,23 mUmin, e absorvência de PDA foi monitorada apartir de 200 nm a 400 nm. Todos os parâmetros de ESI-MS foram utilizadose selecionados com base na geração de íons moleculares desprotonados([M - H]-) de FDAA-monatina, e produção de íons de fragmento característicos.
Os seguintes parâmetros instrumentais foram utilizados paravarredura de LC/MS de monatina no modo de ESI/MS de íon negativo: Capi-lar: 2.0 kV; Cone: 25 V; Hex 1: 10 V; Abertura: 0 V; Hex 2: 0 V; Temperaturada fonte: IOOO0C; Temperatura de dissolvatação: 350°C; Gás de dissolvata-ção: 500 L/h; Gás do cone: 50 Uh; Resolução de massa baixa (Q1): 12,0;Resolução de massa alta (Q1): 12,0; Energia de íon: 0.2; Entrada: -5V; E-nergia de Colisão: 20; Saída: IV; Resolução de massa baixa (Q2): 12; Reso-lução de massa alta (Q2): 12; Energia de íon (Q2): 3,0; Multiplicador: 650.
Três transições de pai para filha específicas de FDAA-monatina são utiliza-das para especificamente detectar a FDAA-monatina em reações in vitro e invivo. As transições monitoradas para monatina são 543,2 a 268,1, 543,2 a499,3, e 543,2 a 525,3. Transição de massa derivada de padrão interno demonatina monitorada foi 548,2 a 530,3. Identificação de estereoisômeros deFDAA-monatina é baseada no tempo de retenção cromatográfico quandocomparada aos estereoisômeros de monatina sintética purificada, e dadosespectrais de massa. Um padrão interno é utilizado para monitorar o pro-gresso da reação e para confirmação de tempo de retenção do S,S estereoi-sômero.
Detecção de Fluorescência Cromatografia Pós-Coluna Líquida de Ami-noácidos Incluindo Glutamato e Alanina.
Cromatografia líquida com detecção de fluorescência pós-coluna(LC/OPA) para a determinação de glutamato e alanina em reações in vitro ein vivo foi realizada em um sistema de LC Waters 2690 ou equivalente com-binado com um detector de fluorescência de varredura Waters 474, e ummódulo de reação pós-coluna Waters. Varreduras semiquantitativas de mo·natina e triptofano foram da mesma forma realizadas utilizando este método.
Separações de LC foram realizadas em uma coluna de troca iônica carrega-da com Sódio-lnteração a 60°C. Fase móvel A foi tampão Pickering Na 328(Pickering Laboratories, Inc.; Mountain View, CA). Fase móvel B era tampãoPickering Na 740. A eluição de gradiente foi de 0% de B a 100% de B, 0-20minutos, isocrática em 100% de B, 20-36 minutos, e linear de 100% de B a0% de B, 36-37 minutos, com pelo menos um período de reequilíbrio de 5minutos entre os ciclos, dependendo da matriz de amostra. A taxa de fluxopara a fase móvel foi 0,5 mL/min. A taxa de fluxo para a solução de deriva-ção pós-coluna de OPA foi 0,5 mL/min. As colocações do detector de fluo-rescência foram EX 338-340 nm e Em 420-425 nm. Norleucina foi emprega-da como um padrão interno para a varredura. Identificação de aminoácidosfoi baseada em dados de tempo de retenção cromatográficos para padrõespurificados.
Detecção de L- e D-Aminoácidos por LC/MS/MS
Amostras contendo uma mistura de L- e D-aminoácidos tais co-mo lisina, alanina, metionina, tirosina, leucina, fenilalanina, triptofano, gluta-mato, e aspartato de experiências de reação bioquímica foram primeiro tra-tadas com ácido fórmico para desnaturar a proteína. A amostra foi, em se-guida, centrifugada e filtrada através de um filtro de seringa de náilon de0,45 μιτι para varredura de LC/MS/MS. Identificação de L- e D-aminoácidosfoi baseada no tempo de retenção e detecção seletiva de massa. Separaçãode LC foi realizada utilizando-se sistema de cromatografia líquida Waters2690 e uma coluna de cromatografia Chirobiotic TAG de 2,1 mm χ 250 mmASTEC com temperatura de coluna fixada a 45°C. Fase móvel de LC A e Bforam 0,25% de ácido acético e 0,25% de ácido acético em metanol, respec-tivamente. Eluição isocrática foi utilizada para todos os métodos para sepa-rar os isômeros LeD. Lisina foi eluída utilizando 80% de fase móvel A, e20% de B. Glutamato, alanina e metionina foram separados com eluição de60% de fase móvel A e 40% de B e uma taxa de fluxo de 0,25 mL/min. As-partato, triptofano, tirosina, leucina e fenilalanina foram separados isomeri-camente com 30% de fase móvel A e 70% de B com uma taxa de fluxo de0,3 mL/min para todos menos fenilalanina, que foi conduzida em uma taxade fluxo de 0,25 mL/min.
O sistema de detecção para varredura de L- e D-aminoácidosincluiu um detector de Disposição de Foto-Diodo Waters 996 (PDA) e umespectrômetro de massa quadripolar triplo Micromass Quattro Ultima. 0PDA, varredura de 195 a 350 nm, foi colocado em série entre o sistema decromatografia e o espectrômetro de massa. Parâmetros para o espectrôme-tro de massa quadripolar triplo Micromass Quattro Ultima operando em mo-do de ionização por eletrovaporização positiva (+ESI) foram fixados como oseguinte: Capilar: 3.0 kV; Cone: 20 V; Hex 1: 15 V; Abertura: 1 V; Hex 2: 0 V;Temperatura da fonte: 100°C; Temperatura de dissolvatação: 350°C; Gás dedissolvatação: 530 L/h; Gás do cone: 30 L/h; Massa resolução baixa Q1:12.5; Resolução de massa alta Q1: 12,5; Energia de íon energia 1: 0.2; En-trada: -5; Colisão: 8; Saída 1: 10; Resolução de massa baixa Q2: 12.5; Re-solução de massa alta Q2: 12.5; Energia de íon 2: 0.5; Multiplicador: 650 V.Experiências de MS/MS com modo de Monitoramento de Reação Múltipla(MRM) foram fixadas para seletivamente monitorar as transições de reaçãode 147,8 a 84,2 e 147,8 a 102,1 para glutamato, 134,00 a 74,30, e 134,00 a88,2 para aspartato, 147,3 a 85,0 para Usina, 150,3 a 104,8 para metionina,182,3 a 137,0 para tirosina, 132,3 a 87,0 para leucina, e 166,3 a 121,0 parafenilalanina. No caso onde duas transições são listadas, as transições poste-riores foram utilizadas para quantificação. Para triptofano, experiências deMS/MS com modo de Monitoramento de Reação Múltipla (MRM) foram fixa-das para seletivamente monitorar as transições de reação de 205,2 a 118,2,205,2 a 146,1, e 205,2 a 188,2, e a transição de 212,1 a 151,1 para d8-DLtriptofano. A quantificação de triptofano foi alcançada determinando-se a re-lação de resposta do analisado de transição 205,2 a 146,1 para aquelas dopadrão interno, d8-D,L triptofano. Alternativamente, a quantificação de tripto-fano, glutamato, e ácidos aspárticos foi baseada nas respostas de sinal dem/z=146,5, m/z=102,1, e m/z=88,2, respectivamente.Produção de Monatina e Precursor de Monatina ("MP") para Produçãode Ensaios de Monatina Padrões.
Uma mistura racêmica de R,R e S,S monatina foi produzida sin-teticamente como descrito na Patente dos Estados Unidos ne 5.128.482.
As R,R e S,S monatina foram separadas por uma etapa de hi-drólise e derivação. Brevemente, a mistura racêmica de monatina foi esterifi-cada, o grupo amino livre foi bloqueado com Cbz, uma Iactona foi formada, ea S,S Iactona foi hidrolizada seletivamente utilizando uma enzima proteaseimobilizada. A monatina pode da mesma forma ser separada como descritoem Bassoli, A. e outro, Eur. J. Org. Chem., 8:1652-1658, (2005).
Produção de MP
R-MP foi produzido pela transaminação de R,R monatina utili-zando D-aminotransferase de ampla faixa A-103 (BioCatalytics, Pasadena,CA) em 0,1 M de tampão de fosfato de sódio, utilizando piruvato de sódiocomo o aceptor de amino. S-MP foi produzido pela transaminação de S,Smonatina utilizando L-minotransferase de A-102 (BioCatalytics, Pasadena,CA) em 0,1 M de tampão de fosfato de sódio, utilizando piruvato de sódiocomo o aceptor de amino. Ambas as reações foram realizadas a 30°C e aum pH de cerca de 8,0-8,3, durante cerca de 20 horas. Ambos os compostosforam purificados utilizando-se HPLC de escala preparativa com uma resinahidrofóbica de Rohm e Haas (Philadelphia, PA) (XADTMI 600), eluindo emágua. Amostras contendo mais que 90% de pureza do precursor de monati-na foram coletadas e secadas por congelamento.
Exemplo 2
Detecção de Precursor de Monatina
Este exemplo descreve métodos utilizados para a separação edetecção de dois enantiômeros de precursor de monatina.
Método Não-quiral para Detecção de Precursor de Monatina
Amostras de reação de placas de 96 cavidades foram injetadassobre uma coluna Agilent Zorbax RX-C 18, 3,5 um, 3,0 χ 150 mm utilizandoum auto-amostrador CTCPaI (LEAP Technologies, Carrboro, N.C.). Os pro-dutos foram separados utilizando um gradiente de H20/ACN (0,1% de ácidofórmico):
Tempo: 0,00 min 5% de B
Tempo: 4,00 min 100% de B
Tempo: 5,00 min 100% de B
Tempo: 5,10 min 5% de BTempo: 6,50 min 5% de B
O gradiente foi fornecido por bombas de LC-1 OADvp (Shimadzu,Kyoto, Japan) em 0,8 mL/min. Os produtos foram detectados utilizando es-pectrômetro de massa triple-quad API4000 Turbolon-Spray (Applied Biosys-tems, Foster City, CA). Spray de íon e monitoramento de íon Múltiplo foramrealizados para os analisados de interesse no modo de íon negativo, e cadavarredura durou 6,5 minutos.
Piruvati = 87,1 [M-H+]-
lndol-3-piruvato = 202,1 [M - H+] -
Produto = 290,0 [M - H+] -
Varredura de CE Quiral de Precursores de R & S Monatina
Um instrumento de eletroforese capilar P/ACE™ MDQ (BeckmanCoulter, Fullerton, CA) foi utilizado. O kit de Desenvolvimento Quiral foi utili-zado e inclui quantidades pequenas de vários seletores quirais, tampõesnecessários e 2 capilares (Beckman Coulter, Fullerton, CA). Alternativamen-te, apenas para o ensaio de MP, os seguintes reagentes e outros fornecedo-res podem ser obtidos separadamente de Beckman Coulter (Fullerton, CA)ou em outro lugar:
Capilar revestido N-CHO; 50 um de ID, 65 cm de comprimentototal ou capilar de sílica fundido.
25 mM de tampão de fosfato, pH 5,
25 mg de hidroxypropil-P-ciclodextrina
Solução de condicionamento capilar, 10 ml_ (alternativamente,pode utilizar 0,5% de solução de óxido de polietileno, Mw 600.000 ou300.000 Dáltons)
Varredura de Eletroforese Capilar ("CE")
Um capilar revestido neutro, 50 um de ID, 60 cm (50 cm paradetecção) ou 30 (20) foi utilizado junto com detecção de DAD (ou UV sim-ples) em 214 nm. O capilar de separação foi regulado a 15°C, amostras a40°C. O tampão de separação foi 20 mM de hidroxipropil-β- cicilodextrina, 25mM de fosfato, pH 5. Injeção de amostra foi tipicamente 0,035 kg/cm2, 5 s. Aseparação foi em 500 V/cm, polaridade reversa (15 kV para 30 cm de capi-lar, 30 kV para 60 cm). Corrente típica utilizada durante a separação foi -28μΑ. Os tempos de migração típicos para picos de MP estavam em torno de3,5 minutos (20 cm de comprimento eficaz) ou 8 minutos (50 cm)
Uma etapa de limpeza/lavagem/condicionamento capilar opcional, antes dos cilcos de amostra utilizou H2O 4 minutos, 0,1 M de HCl 1 mi-nuto, H2O 1,5 minuto, solução de condicionamento capilar 4 minutos, H2O1 1minuto, tampão de separação 4 minutos.
Um resumo do método de funcionamento foi: enxágüe do tam-pão de separação 1-2 minutos, injeção de amostra 5 s em 0,035 kg/cm2, se-paração 5-10 minutos em polaridade de voltagem reversa 15 ou 30 kV, de-pendendo do comprimento capilar.
Exemplo 3
Ensaio geral para piruvato aldolases
Um método exemplar para medir a atividade de piruvato aldola-ses diferente utiliza um substrato geral, 4-Carbóxi-4-hidróxi-2-oxoadipato(CHA). O ensaio de CHA foi adaptado a partir de ensaios de literatura (porexemplo, Vide E.E. Dekker & R.P. Kitson, J. Biol. Chem. 267, 10507-10514,1992). Um ensaio típico compreendeu 50 mM de fosfato de sódio pH 7,5, 1mM de MgCI2, 1 mM de CHA, 10 μg/ml de D-lactato desidrogenase (LDH) apartir de Lactobacillus Ieichmanii (Sigma-Aldrich, St. Louis, MO), 0,5 mM deNADH. O ensaio foi iniciado adicionando-se a enzima (tipicamente entre 1 a5 μL). Liberação de piruvato, acoplado à formação que NAD+ foi monitoradacontinuamente em um espectrofotômetro em 340nm.
O CHA foi sintetizado de acordo com o procedimento descritoem Tack, B.F. Chapman, PJ., e S. Dagley. J. Biol. Chem. 247 6438-6443(1972).
Uma unidade de atividade de enzima, tal como piruvato aldola-se, tal como a enzima HMG e/ou KHG aldolase, é definida como a quantida-de que libera piruvato suficiente para diminuir a absorvência em 340nm por 1OD por minuto.
Exemplo 4
Descoberta de Novas Ceto-hidróxi-glutarato (KHG) e Hidróxi-metil-ceto-glutarato (HMG) aldolases de Diversas Bibliotecas ambientais.
Mais de 150 HMG aldolases raras e 15 KHG aldolases foramdescritas avaliando-se Diversas bibliotecas de DNA. Estes genes de aldola-se foram seqüenciados e subclonados em um vetor de expressão adequado.Este vetor foi em seguida transformado em um hospedeiro de expressãoadequado para produção de quantidades suficientes do aldolase para a ca-racterização da enzima. Um grupo selecionado de aldolases foi testadoquanto à atividade em CHA e da mesma forma para a formação de precur-sor de monatina (MP). Todas as enzimas descobertas e descritas nesta pa-tente têm potencial para uso em outras reações de formação de ligação decarbono-carbono entre um aceptor de alfa-ceto ácido e piruvato ou doadorde derivado de piruvato como exemplificado no esquema de reação geralabaixo.
Aldolase
COOH
a-cetoácidocetona oualdeídoaceptor
R2
piruvato ouderivado depiruvato
JOH
COOH
COOH
R = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída Ffe = H, alquila, alquila substituída, arila, arila substituída, benzila,benzila substituída R3 = H, alquila, alquila substituída, arila, arila substituída,benzila, benzila substituída, ácido carboxílico.Exemplo 5
Caracterização de Aldolases Selecionadas
Aldolases selecionadas foram caracterizadas com respeito a suacapacidade de catalisar a conversão de indol-3-piruvato e piruvato em pre-cursor de monatina <MP) como mostrado no seguinte esquema:<formula>formula see original document page 322</formula>
Figuras 13 e 14 mostram as atividades de 58 aldolases diferen-tes na formação de MP como medido por LC/MS/MS.
Reações de Aldol foram realizadas com 20 mM de indol-3-piruvato ("I3P"), 50 mM de piruvato, 100 mM de fosfato de sódio pH 7, 1 mMde MgCI2, 100 μg/rτϊL de aldolase. Reações foram incubadas em temperatu-ra ambiente no escuro. Alíquotas (30 μΙ_) foram removidas em vários mo-mentos e as reações foram interrompidas armazenando-se as amostras emgelo. Uma porção de cada alíquota foi submetida à varredura de CE enquan-to a porção restante foi diluída 1: 1000 em 50% de acetonitrila e submetida àvarredura de LC/MS.
Tabela 2: Enantiosseletividade de aldolases diferentes para a formaçãode MP de I3P e piruvato como determinado por CE quiral.
<table>table see original document page 322</column></row><table><table>table see original document page 323</column></row><table>
Nota-se que seletividades para R-MP de 98+% indicam que ne-
nhuma S-MP foi detectada. Dada a sensibilidade do ensaio de CE1 os resul-tados indicam que pelo menos 98% de MP formados são o R-enantiômero.Desse modo, as enzimas que são listadas como 98+% são pelo menos 98%seletiva para R-MP e podem ser até 100% seletiva.
Tabela 2 da mesma forma mostra a atividade das enzimas emum substrato de aldolase geral, CHA1 bem como a expressão relativa de ca-da enzima, quando determinada por SDS-PAGE. Nota-se que várias enzi-mas não mostraram atividade detectável em CHA todavia eles exibiram aatividade na preparação de MP.Em síntese, as aldolases mostram uma ampla faixa de ativida-des, expressão e seletividades. Além disso, há numerosas aldolases quemostram seletividades perfeitamente altas (98% ou maior) para R-MP.
Exemplo 6
Descoberta de piruvato aldolases de planta
Iniciadores de PCR degenerados (vide abaixo) foram projetado eutilizados para extrair genes de aldolase de cDNA preparado de Sclerochitonilicifolius. As extremidades 5' e 3' dos genes foram recuperadas e os genesde tamanho natural foram em seguida amplificados por PCR.
SEQ ID NO: nome do iniciador Iniciador
335 F1 AARGTBTWYGARGACAATG (SEQ ID NO: 335)
336 F2 GCDCAGAWCAAYGGRTGG (SEQ ID NO: 336)
337 R1 CCATCRSYATCDGCRTADAGCCA (SEQ ID NO: 337)
338 R2 GCRTADAGCCAYTCNCCRTC (SEQ ID NO: 338)
Exemplo 7
Clonagem de D-aminoácido aminotransferase Bacillus sphaericus.
D-aminoácido aminotransferase de B. sphaericus (EC 2.6.1.21,da mesma forma conhecida como D-alanina aminotransferase ou D-aspartato aminotransferase) foi produzida recombinantemente para uso emensaios acoplados com as várias aldolases. Esta enzima é homóloga à D-aminotransferases previamente descritas para produção de monatina (Publi-cação U.S. No. 20040063175 e Publicação U.S. No. 20050282260).Cepas
B. sphaericus (número de ATCC 10208) foi crescida em ÁgarNutriente a 30°C. Grupos de colônias foram colocados em 100 μί de águaestéril e aquecidos durante 5 minutos a 95°C, para romper as células. TrêsμΙ_ foram utilizados em amplificações de Reação em Cadeia de Polimerasesubseqüente (PCR).
Protocolo de Reação em Cadeia de Polimerase
Iniciadores foram projetados para clonar em vetores pET 28b epET 30a vetores (Novagen, Madison, Wl), utilizando os sítios Ncol e BamHI.
A contrução de pET 30 contém um rótulo de N-terminal e rótulo de S, consi-derando que a contrução de pET 28 é não-rotulada.Iniciadores dat de Bacillus sphaericus
Terminal N: 5'-GATATACCATGGCATACTCATTATGGAATG-3' (SEQ ID NO:383) e
Terminal C: 5'-GTTATCGGATCCTTAGGCATTAATTGAAATTG-3' (SEQ IDNO: 384).
A região de codificação foi amplificada utilizando seguinte proto-colo de PCR. Em uma reação de 50 μ^ 3 μΙ_ de padrão, 1,6 μΜ de cada ini-ciador, 0,25 mM de cada dNTP, 3,5 U de Polimerase de Alta Fidelidade Ex-pand (Roche, Indianapolis, IN), e 1X de tampão Expand™ com Mg foramutilizados. O programa termociclizador utilizado incluiu uma partida quente a94°C durante 3 minutos, seguido por 8 repetições das etapas seguintes:94°C durante 30 segundos, 52°C durante 30 segundos, e 72°C durante 2minutos. Vinte e dois ciclos subseqüentes foram realizados com uma tempe-ratura de recozimento a 58°C. Depois de 30 ciclos, a amostra foi mantida a72°C durante 7 minutos e em seguida armazenada a 4°C. Produtos de PCRlimpos de tamanho correto foram obtidos (aproximadamente 850 bp para ogene dat).Clonagem
Os produtos de PCR foram purificados utilizando o kit de prepa-ração de PCR Qiagen QIAquick (Qiagen, Valencia, CA), e digeridos comBamHI e Ncol em tampão de BamHI (New England Biolabs, Ipswich, MA).
Inserções e vetor digeridos foram purificados utilizando o Kit deExtração de Gel Qiagen QIAquick (Qiagen, Valencia, CA). Ligações foramfeitas utilizando o Kit de Ligação de DNA Rápido Roche (Roche, Indianapo-lis, IN) e purificadas utilizando o kit de purificação de PCR QIAquick (Qiagen,Valencia, CA). As ligações foram transformadas em DH10B de Escherichiacoli utilizando uma cubeta de 0,2 cm e um sistema Bio-Rad Gene Pulser Ilcomo descrito no manual de eletroporação Bio-Rad (Bio-Rad, Hercules, CA).As células foram permitidas recuperar-se em 900 μί de meio de SOC duran-te 30 minutos a 37°C em 225 rpm. As células foram semadas em placas deLB-ágar contendo canamicina (25 μg/mL).DNA de Plasmídeo foi purificado utilizando o kit miniprep spinQiagen (Qiagen1 Valencia, CA) e avaliado quanto as inserções corretas pordigesto de restrição com BamHI e Ncol. As seqüências de plasmídeos quepareceram ter a inserção correta foram verificadas por seqüenciamento deDNA de terminação de cadeia de didesóxi em Agencourt BioScience Corpo-ration (Beverly, MA). O seqüenciamento verificou a seqüência de codificaçãoencontrada no número de acesso de NCBI AF081278 Região: 134..985 (gi:3513754) que produz uma proteína com seqüência de aminoácido como lis-tado no número de acessão AAC33964 (gi: 3513755).
Ensaio se Expressao de Gene
DNA de plasmídeo foi subclonado em hospedeiro de expressãode E. coli BL21(DE3) (Novagen, Madison, Wl). As culturas foram crescidas eos plasmídeos foram isolados utilizando kit miniprep Qiagen (Qiagen, Valen-ce, CA), e analisados por digesto de restrição para confirmar a identidade. Aindução foi realizada tipicamente em meio de LB contendo canamicina (50μg/mL). As células foram crescidas em um OD6oo de 0,4-0,8, induzidas com0,1 mM de IPTG (isopropil tiogalacatosídeo) e testadas em 4 horas após in-dução. Extratos celulares foram preparados de acordo com o protocolo queacompanha o reagente Novagen BugBuster™ (Novagen, Madison, Wl) (combenzonase nuclease e coquetel inibidor de protease completo Roche (Ro-che, lndianapolis, IN)). Níveis muito altos de proteína solúvel foram õbtidosno peso molecular predito, como julgado por SDS-PAGE. Para algumas rea-ções, o produto de gene de pET 30 foi purficado utilizando cartuchos His-Bind seguindo os protocolos do fabricante (Novagen, Madison, Wl). As fra-ções de eluente foram dessalinizadas em colunas de PD-10 (GE Healthcare,Piscataway, NJ) e eluídas em 25-100 mM de tampão de fosfato de sódio, pH 7.5.
Extratos celulares foram analisados quanto à atividade de D-aminotransferase seguindo-se a produção de alanina a partir de piruvato eD-triptofano utilizando o protocolo seguinte. Reações de um mL foram tipi-camente realizadas em 100 mM de tampão de fosfato de sódio (pH 7,5), 50μΜ de fosfato piridoxal, 25 mM de piruvato de sódio, e 50 mM de D-triptofano. As reações foram iniciadas pela adição de extratos livres de célulaou enzima purificada e foram incubadas 15 minutos durante a noite a 30°C,com suave agitação. Ácido fórmico foi adicionado em uma concentração finalde dois por cento para interromper a reação, e a proteína precipitada foi re-movida por centrifugação. Reações de controle sem proteína adicionada fo-ram da mesma forma realizadas. Pontos de tempo zero foram da mesmaforma utilizados como controles negativos. Alanina foi detectada utilizandoderivação de OPA como descrito no Exemplo 1.
Exemplo 8
Comparação de produção de monatina total e distribuição isomérica para ospolipeptídeos com atividade de aldolase de SEQ ID NO: 8, SEQ ID NO: 4,SEQ ID
NENHUM: 12, e SEQ ID NO: 28, e ProA de C. testosteroni
AT-103 transaminase (uma D-aminotransferase de ampla espe-cificidade) foi adquirida de BioCataIytics (Pasadena, CA) e esta enzima ou aenzima recombinante produzida no Exemplo 7 foi utilizada em reações aco-pladas com HMG aldolases para produzir monatina a partir de D-triptofano epiruvato como descrito no Pedido Publicado U.S. No. 20050282260. A ProAaldolase de C. testosteroni foi utilizada como uma aldolase de referência pa-ra propósitos comparativos, e foi preparada como descrito no Pedido Publi-cado U.S. No. 20040063175 e WO 03091396 A2. As aldolases testadas fo-ram isolados e transformadas como descrito acima no Exemplo 4.
Para produzir quantidades teste de cada aldolase, 50 mL de cul-turas foram crescidas em meio de LB contendo ampicilina (100 μg/mL), emum OD6Oo de aproximadamente 0,5. As cepas contendo constructos de SEQID NO: 7, SEQ ID NO: 3, e SEQ ID NO: 11 foram induzidas com 100 μΜ deIPTG. A cepa contendo o constructode SEQ ID NO: 27 foi induzida com 200μg/L de anidrotetraciclina. As células foram crescidas 5 horas após indução,e extratos celulares foram preparados de acordo com os protocolos do fabri-cante (Novagen, Madison, WI1 reagente de Bugbuster). Inibidor de benzonu-clease e protease foram da mesma forma adicionados. As proteínas solúveisnos extratos celulares foram separadas em um Bio-Rad Laboratories Experi-on Automated Electrophoresis Station (Bio-Rad, Hercules, CA) e analisadasquanto à concentração e expressão percentual utilizando o Software Experi-on versão 1.1.98.0.
Os seguintes foram adicionado por 1 mL de mistura de reação:aproximadamente 50 μς de aldolase (fornecidos em extratos celulares amenos que de outra maneira notado), 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase de B. sphaericus purificada, 200mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5,e 0,05 mM de PLP. Experiências foram conduzidas em duplicata, com con-troles negativos em que nenhuma aldolase foi adicionada. Amostras foramincubadas 1 h, 2 horas s, e durante a noite (17-20 horas) a 30 0C com suaveagitação. Quantidades pequenas de monatina (< 0,5 ppm) são produzidassem aldolase em reações durante a noite, devido às reações não enzimáti-cas catalisadas por magnésio e fosfato. Aqueles valores foram subtraídosdps números mostrados abaixo, e os resultados determinados pela médiasão mostrados. Os únicos estereoisômeros detectados quando produzindomonatina utilizando estes métodos são R,R e S,R. O percentual de R,R élistado abaixo e foi determinado por área de pico de LC de fase reversa.
Tabela 3: Monatina total produzida de D-triptofano e % de RjR.
<table>table see original document page 328</column></row><table>
A amostra de 18 horas de SEQ ID NO: 28 foi da mesma formaalisada quanto à distribuição estereoisomérica pelo método de derivação deFDAA listado no Exemplo 1, que produziu um resultado de 94,9% de R,R e5,1% de S1R monatina.
As mesmas experiências foram realizadas, lado a lado, utilizan-do L-triptofano como o substrato de partida e acoplando as aldolases com L-aminotransferase de ampla especificidade HexAspC produzida como descri-to no Pedido Publicado U.S. No. 20050282260 e purificadas. Estas reaçõesdeveriam produzir principalmente S1S monatina e R1S monatina. As reaçõesforam da mesma forma suplementadas com 10 mM de alfa-cetoglutaratocomo o aceptor de amino para transaminação de L-triptofano. Novamente,resultados duplicados são calculados pela média abaixo para monatina total(subtraindo níveis base sem aldolase presente), e o percentual de S1S mo-natina é mostrado com base na área de pico de LC de fase reversa. Em al-guns casos, porque as aldolases são inteiramente R-específicas e produzempouca monatina total, as estimativas de fase reversa de distribuição estere-oisomérica são menos precisas devido a algumas medições do pico de trip-tofano que pode co-eluir com o pico de S,S/R,R monatina. As tendênciasainda são informativas comparando-se a R-especificidade das aldolases.Resultados de outra varredura utilizando o método de derivação de FPAAsão mostrados em parênteses para várias amostras, e são mais precisos.Números de monatina totais acima de aproximadamente 400 ppm são maisaltos que a faixa linear da escala dos padrões utilizados para quantificar osresultados, assim são resultados qualitativos. A ProA aldolase de C. testos-teroni produz tipicamente 95-100% de S,S monatina, como mostrado no Pe-dido Publicado U.S. No. 20050282260.
Tabela 4: Monatina total produzida de L-triptofano e % de S,S.
Aldolase (ponto de tempo) Monatina total (ppm) % S,S monatinaSEQ ID NO:8 (1 h) 138,65 78,9SEQ ID NO:8 (18 h) 600,3 78,15SEQ ID NO:4 (1 h) controle negativo abaixo 95,65SEQ ID NO:4 (18 h) 28,5 87,6SEQ ID NO:12 (1 h) controle negativo abaixo 93,55SEQ ID NO:12 (18 h) 24,9 75 (59,35)SEQ ID NO:28 (1 h) 17,85 55,05(18,9)SEQ ID NO:28 (18 h) 135,5 27,25(19,1)
C. testosteroni ProA (1 h) purified enzyme 440,35 92,5Aldolase (ponto de tempo) Monatina total (ppm) % S1S monatina
C. testosteroni ProA (18 h) purified enzyme 958,3 92,15
Alguém pode observar que a a R-especificidade do polipeptídeocom atividade de aldolase de SEQ ID NO: 28 é bastante alta comparada àenzima ProA de referência, isto é da mesma forma refletido no baixo % de S,S monatina produzido, apesar do alto grau de especificidade de HexAspCaminotransferase para S-MP nestas reações. Os números de monatina to-tais, ao comparar a produção de S,S monatina versus produção de R,R mo-natina, não são indicativo da atividade de aldolase. A D-aminotransferase émenos ativo que HexAspC, particularmente nas concentrações de MP queestá presente nestas reações.
Para outra comparação do polipeptídeo com atividade de aldola-se de SEQ ID NO: 28 à enzima ProA de C. testosteroni, relações variadasde D-aminotransferase para aldolase foram utilizadas em reações que co-meçam com D-triptofano (nenhuma amostra duplicada para estas experiên-cias). Reações foram realizadas como acima. Para reações onde concentra-ção de aldolase foi mantida constante, aproximadamente 50 μg foram utili-zados. Para reações onde D- aminotransferase foi mantida constante, 0,5mg foi utilizado. Para concentração de 2 e 10 mg/mL de D-aminotransferase,enzima Iiofilizada foi utilizada. Paras as 2 concentrações de D-aminotransferase mais altas, duplicatas foram conduzidas.
Tabela 5: Efeito de concentração de D-aminotransferase sobre a produ-ção de R,R monatina.
<table>table see original document page 330</column></row><table><table>table see original document page 331</column></row><table><table>table see original document page 332</column></row><table>
Para níveis de monatina acima de 400 ppm, os resultados nãoestão na faixa linear da curva padrão e são apenas valores aproximados. Aquantidade máxima de R,R monatina produzida, quando diluída adequada-mente, foi de 1100 ppm. Varredura estereoisomérica de FDAA foi feita parao polipeptídeo com atividade de aldolase de SEQ ID NO: 28 com 10 mg/mLamostras de D-aminotransferase. Em duas horas, a amostra continha 98,5%de R1R monatina. Em 17 horas, a amostra continha 95,9% de R,R monatina.
O polipeptídeo com atividade de aldolase de SEQ ID NO: 28 produziu por-centagens altas de R,R monatina, até mesmo depois de tempos de incuba-ção longos e utilizando quantidades grandes de aminotransferase. Se D-aminotransferase adequada é fornecida, o polipeptídeo com atividade dealdolase de SEQ ID NO: 28 produz tanta monatina total quanto ProA aldola-se de C. testosteroni, indicando uma atividade específica similar.
Tabela 6: Efeito de concentração de aldolase sobre a produção de R,Rmonatina.
<table>table see original document page 332</column></row><table><table>table see original document page 333</column></row><table>
Quando a concentração de aldolase é variada, não há muitoaumento na monatina total. O percentual de R,R diminui com tempo e amesma forma com a concentração de aldolase, particularmente quando a D-aminotransferase é limitante.
Para também examinar a R-especificidade das aldolases testa-das, experiências foram feitas começando com L-triptofano e HexAspC ami-notransferase, que foram produzidas e purificadas como descrito no PedidoPublicado U.S. No. 20050282260. A HexAspC mostra uma seletividade fortepara transaminação de S-MP versus R-MP1 assim porcentagens acima de50% de R1S monatina indicam uma aldolase altamente estereoespecífica.Dez mM de alfa-cetoglutarato foi adquirido como um aceptor de amino; po-rém, em concentrações altas, piruvato é utilizado também pela L-aminotransferase. Nestas reações, tipicamente apenas S,S e R,S monatinasão produzidas dentro dos limites de detecção do protocolo de derivação deFDAA.
Tabela 7: Efeito de concentração de L-aminotransferase sobre produ-ção de S,S monatina.
<table>table see original document page 333</column></row><table><table>table see original document page 334</column></row><table>
Tabela 8: Efeito de concentração de aldolase sobre produção de S9Smonatina,<table>table see original document page 334</column></row><table><table>table see original document page 335</column></row><table>
Para aldolases que são altamente R-específicas, tal como o po-lipeptídeo com atividade de aldolase de SEQ ID NO: 28, menos monatinatotal é produzida e aumentar a quantidade de aldolase aumenta a monatinatotal (bem como % de S,S). Estas aldolases produzem menos substrato deS-MP1 o substrato preferido para a L-aminotransferase utilizado. Para enzi-mas que são menos R-específicas, tal como ProA, aumentar a aldolase nãomelhora significativamente a produção de monatina total ou % de S1S mona-tina. Aumentar a quantidade de L-aminotransferase adicionada diminui aporcentagem de S1S monatina produzida. Com base na varredura anterior, opolipeptídeo com atividade de aldolase de SEQ ID NO: 8 está entre ProA e opolipeptídeo com atividade de aldolase de SEQ ID NO: 28 em termos de R-especificidade, que concorda com os dados onde o % de R-MP é medidoapenas para a etapa de aldol.
Subcionagem de SEQ ID NO: 27
Os iniciadores seguintes foram utilizados em PCR para amplifi-car o gene de aldolase: 5'-gaggagctcgagtcagacgtatttcagtcctttttc-3' (SEQ IDNO: 385) e 5'- agaagacatatgatttatcagccggggac-3" (SEQ ID NO: 386). A SEQID NO: 27 do gene de aldolase codifica o polipeptídeo com atividade de al-dolase de SEQ ID NO: 28. O produto de PCR resultante foi digerido comXho\ e NdeI para cortar nos sítios que tinham sido construídos nos iniciado-res. O fragmento foi purificado por gel (Kit de extração de Gel QIAquick (Qi-agen, Valencia, CA)) e ligado (utilizando T4 DNA ligase) com pET28b que foidigerido com Xho\ e Nde\ e purificado por gel. A ligação foi transformada nascélulas quimicamente competentes TOPIOF. Colônias que crescem nasplacas foram avaliadas quanto as inserções e vários isolados com inserçõesforam submetidos à varredura de seqüência de DNA (Agencourt, Beverly, MA).
Purificação do Polipeptídeo com Atividade de Aldolase de SEQ ID NO: 28
Clones de aldolase confirmados foram transformados em BL21DE3 ou BL21 DE3 pLysS. Culturas da noite crescidas com o antibiótico a-propriado foram diluídas em meios frescos (tipicamente 1:100) e crescidasem um OD6oo -0,6 com aeração a 37°C. Culturas foram em seguida induzi-das com 1 mM de IPTG e trocadas a 30°C (com aeração) e a incubação foicontinuada durante a noite. As células foram colhidas por centrifugação. Opélete celular foi submetido tipicamente a um ciclo de congelamento des-congelamento para ajudar com a Iise celular. O pélete celular foi Iisada emBugBuster e Benzonase (Novagen, Madison, Wl) (de acordo com o protoco-Io do fabricante). Resíduos celulares foram removidos por centrifugação. Oextrato de proteína bruto foi aplicado a uma coluna de HisBind (Novagen,Madison, Wl) que foi preparada de acordo com o protocolo do fabricante. Acoluna foi lavada e a proteína foi eluída de acordo com o protocolo do fabri-cante. A proteína purificada foi dessalinizada com colunas de PD-10 (GEHealthcare, Piscataway1 NJ). O tampão utilizado para a troca foi de 50 mMde fosfato de potássio pH 7,5, 100 mM de NaCI, 4 mM de MgCI2. Proteínapurificada foi concentrada com concentradores centrífugos Amicon (Millipore,Billerica, MA).
Exemplo 9
Comparação de produção de monatina total e distribuição isomérica parapolipeptídeos com atividade de aldolase de SEQ ID NO: 40, SEQ ID NO:298, SEQ ID NO: 36, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 96, SEQID NO: 54, SEQ ID NO: 122, SEO ID NO: 142, SEQ ID NO: 42, SEQ ID NO:130, SEQ ID NO: 112, SEQ ID
NENHUM: 108, SEQ ID NO: 94, SEQ ID NO: 80, e SEQ ID NO: 28
A-103 transaminase (uma D-aminotransferase de ampla especi-ficidade) foi adquirida de BioCataIytics (Pasadena, CA) e esta enzima ou aenzima recombinante produzida no Exemplo 7 foi utilizada em reações aco-pladas com HMG aldolases para produzir monatina a partir de D-triptofano epiruvato como descrito no Pedido Publicado U.S. No. 20050282260. O poli-peptídeo com atividade de aldolase de SEQ ID NO: 28 (rotulado por His) foiutilizado como uma aldolase de referência para propósitos comparativos, efoi produzido e purificado como descrito no término do Exemplo 8. As outrasaldolases testadas foram isoladas e transformadas como descrito acima no
Exemplo 4 .
Para produzir quantidades teste de cada aldolase, culturas de 25ml_ foram crescidas em meio de LB contendo ampicilina (100 μς/ιτιί), em umOD6OO de aproximadamente 0,4. As cepas foram induzidas com 100 μΜ deIPTG. As células foram crescidas 4 horas após indução, e extratos celularesforam preparados de acordo com os protocolos do fabricante (Novagen, Ma-dison, Wl, reagente de Bugbuster) com benzonuclease. As proteínas solú-veis nos extratos celulares foram separadas em um Bio-Rad LaboratoriesExperion Automated Electrophoresis Station (Bio-Rad, Hercules, CA) e ana-lisadas quanto à concentração e expressão percentual utilizando o ExperionSoftware versão 1.1.98.0.
Os seguintes foram adicionados por 1 mL de mistura de reação:aproximadamente 50 μg de aldolase (fornecidos em extratos celulares amenos que de outra maneira notado), 4 mM de MgCfe, 50 mg/mL de D-triptofano, 2 mg de AT-103 (BioCatalytics, Pasadena, CA), 200 mM de piru-vato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5, e 0,05 mMde PLP. O D-triptofano não é solúvel a esta concentração mais alta, porémfoi utilizado para garantir que as reações fossem mantidas em quantidadessaturadas de D-triptofano. Experiências foram conduzidas em duplicata, comcontroles negativos nos quais nenhuma aldolase foi adicionado. Amostrasforam incubadas 2 horas e durante a noite (17-20 horas) a 30°C com suaveagitação. Quantidades pequenas de monatina são produzidas durante a noi-te sem aldolase (-0,5 ppm), devido às reações não-enzimáticas catalisadaspor magnésio e fosfato. Valores típicos para o % de R1R monatina são 50%para estas amostras. Os valores de controle negativos foram subtraídos dosdos números mostrados abaixo, e os resultados calculados pela média sãomostrados. Os únicos estereoisômeros detectados quanda-produzindo mo-natina utilizando estes métodos são R,R e S,R. O percentual de R,R é lista-do abaixo, e foi determinado por área de pico de LC de fase reversa. Amesma experiência foi conduzida depois do armazenamento dos extratoscelulares e o polipeptídeo purificado com atividade de aldolase de SEQ IDNO: 28 durante 2 meses a -20 °C, neste tempo 50 mM de D-triptofano foiutilizado como no Exemplo 8. Duas vezes a quantidade de aldolase foi adi-cionada com a exceção do polipeptídeo com atividade de aldolase de SEQID NO: 28, para que aproximadamente 50 μς sejam utilizadas novamente.Estes resultados são mostrados à direita da Tabela 9. A derivatização deFDAA resulta para distribuição isomérica é mostrado em parênteses.
Tabela 9: Monatina total produzida de D-triptofano e % de R,R
<table>table see original document page 338</column></row><table><table>table see original document page 339</column></row><table>
Alguém pode observar que certas enzimas são mais estáveis aoarmazenamento que outras aldolases, com base em relações de atividade.
Um produto secundário, mais provavelmente 4-hidróxi-4-metil glutamato po-de da mesma forma ser formado durante estas reações. As enzimas acimaforam classificadas quanto a sua especificidade para a produção de monati-na comparando-se as áreas de pico desta versus o subproduto. Os resulta-dos foram o polipeptídeo com atividade de aldolase de SEQ ID NO: 122 >SEQ ID NO: 42 > SEQ ID NO: 80 > SEQ ID NO: 108 > SEQ ID NO: 96 >SEQ ID NO: 112 > SEQ ID NO: 130 > SEQ ID NO: 36 > SEQ ID NO: 94 >SEQ ID NO: 298 > SEQ ID NO: 40 > SEQ ID NO: 142 > SEQ ID NO: 54 >SEQ TD NO: 64 > SEQ ID NO: 28 > SEQ ID NO: 62.
Com base nas experiências iniciais, os polipeptídeos com ativi-dade de aldolase de SEQ ID NO: 298, SEQ ID NO: 54, e SEQ ID NO: 42mostraram ser mais promissores em termos do nível de atividade e % deR1R monatina produzida. Estas enzimas foram subclonadas em vetores deexpressão de pET com e sem rótulos His.
Clonagem de SEQ ID NO: 297, SEQ ID NO: 53, e SEQ ID NO: 41.
Iniciadores utilizados para clonagem:Tabela 10:
<table>table see original document page 340</column></row><table>
SEQ ID NO: 297, SEQ ID NO: 53, e SEQ ID NO: 41 foram ampli-ficados por PCR e digeridos com enzimas apropriadas (Λ/cfel e BamHi paraos produtos de PCR contendo SEQ ID NO: 297 e SEQ ID NO: 53, Nco\ eBamHI para os produtos de PCR contendo SEQ ID NO: 41) e purificadas porgel (Kit de extração de Gel QIAquick (Qiagen, Valencia, CA)). SEQ ID NO:297 e SEQ ID NO: 53 foram individualmente ligados em pET28 que foi dige-rida com NdeI e BamHi e purificada por gel. SEQ ID NO: 41 foi ligada empET30 que foi digerida com Nco\ e BamHi e purificada por gel. A ligação foitransformada em TOPIO. Colônias foram avaliadas quanto às inserções.Isolados com uma inserção foram submetidas à varredura de seqüência deDNA (Agencourt, Beverly, MA).Purificação de aldolases
Clones de aldolase confirmados foram transformados em BL21DE3 ou BL21 DE3 pLysS. Culturas da noite crescidas com o antibiótico a-propriado foram diluídas em meios frescos (tipicamente 1 :100) e crescidasem um OD6oo -0,6 com aeração a 37°C. Culturas foram em seguida induzi-das com 1 mM de IPTG e trocadas a 30°C (com aeração) e a incubação foicontinuada durante a noite. As células foram colhidas por centrifugação. Opélete celular foi submetido tipicamente a um ciclo de congelamento des-congelamento para ajudar com a Iise celular. O pélete celular foi Iisado emBugBuster e Benzonase (Novagen, Madison, Wl) (de acordo com o protoco-lo do fabricante). Resíduos celulares foram removidos por centrifugação. Oextrato de proteína bruto foi aplicado em uma coluna de HisBind (Novagen,Madison, Wl) que foi preparada de acordo com o protocolo do fabricante. Acoluna foi lavada e a proteína foi eluída de acordo com o protocolo do fabri-cante. A proteína purificada foi dessalinizada com colunas PD-10 (GE Heal-thcare, Piscataway, NJ). O tampão utilizado para a troca foi 50 mM de fosfa-to de potássio pH 7,5, 100 mM de NaCI, 4 mM de MgCb- Proteína purificadafoi concentrada com concentradores centrífugos Amicon (Millipore, Billerica,MA).
Teste de aldolases purificadas
Aldolases purificadas foram testados quanto à sua capacidadede produzir R1R monatina a partir de D-triptofano. Os seguinte foram adicio-nados por 1 mL de mistura de reação: aproximadamente 50 μg de aldolasepurificada, 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase de B. sphaericus purificada, 200 mM de piruvato de sódio,100 mM tampão de fosfato de potássio pH 7,5, e 0,05 mM de PLP. Amostrasforam retiradas em 2 horas e durante a noite. Resultados são mostrados na
Tabela 11 abaixo.
Tabela 11: Monatina total produzida de D-triptofano e % de R,R.
<table>table see original document page 341</column></row><table>
As mesmas experiências foram realizadas utilizando L-triptofanocomo o substrato de partida de acoplando as aldolases com L-aminotransferase de ampla especificidade de HexAspC produzida e purifica-da como descrito no Pedido Publicado U.S. No. 20050282260 (0,5 mg deproteína purificada). Resultados são mostrados abaixo na Tabela 12 paraprodução de monatina total (subtraindo níveis base sem aldolase presente),e o percentual de S,S monatina é mostrado com base na área de pico de LCde fase reversa. Números acima de 400 ppm estão fora da faixa linear dacurva padrão, e são aproximados.
Tabela 12: Monatina total produzida de L-triptofano e % de S,S·
<table>table see original document page 342</column></row><table>
Estes dados e os dados de R1R monatina anteriores ilustram quepara a especificidade de R-MP1 os polipeptídeos com atividade de aldolasetêm a seguinte ordem: SEQ ID NO: 28 > SEQ ID NO: 54 > SEQ ID NO: 298> SEQ ID NO: 42.
ExempIoIO
Comparação de produção de monatina total e distribuição isomérica para ospolipeptídeos com atividade de aldolase de SEQ ID NO: 116, SEQ ID NO:76, SEQ ID NO: 44, SEQ ID NO: 148, SEQ ID NO: 46, SEQ ID NO: 134,SEQ ID NO: 74, SEQ. ID N0.126, SEQ ID NO: 102, SEQ ID NO: 58, SEQ IDNO: 88, SEQ ID NO: 50,
SEQ ID NO: 106, SEQ ID NO: 304, SEQ ID NO: 300, e SEQ ID NO: 28.
A enzima recombinante produzida no Exemplo 7 foi utilizada emreações acopladas com HMG aldolases para produzir monatina a partir deD-triptofano e piruvato como descrito no Pedido Publicado U.S. No.20050282260. O polipeptídeo com atividade de aldolase de SEQ ID NO: 28foi utilizado como uma referência nestes ensaios e foi purificado como des-crito no Exemplo 8.Para produzir quantidades teste de cada aldolase, culturas de 25mL foram crescidas em meio de LB contendo ampicilina (100 μg/mL), em umOD600 de aproximadamente 0,5. As culturas foram induzidas com 1 mM deIPTG. As células foram trocadas a 30°C e foram crescidas durante a noite.
Extratos celulares foram preparados de acordo com os protocolos de fabri-cante (Novagen, Madison, Wl, Bugbuster reagent). Benzonuclease foi damesma forma adicionado. As proteínas solúveis nos extratos celulares foramseparadas em um Bio-Rad Laboratories Experion Automated ElectrophoresisStation (Bio-Rad, Hercules, CA) e analisadas quanto à concentração e ex-pressão percentual utilizando o Software Experion versão 1.1.98.0.
Os seguintes foram adicionados por 1 mL de mistura de reação:aproximadamente 50 μg de aldolase (fornecidos em extratos celulares amenos que de outra maneira notado), 4 mM de MgCfe, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase de B. sphaericus purificada, 200mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5,e 0,05 mM de PLP. Ditiotreitol ("DTT") foi adicionado (concentração final 2mM) às amostras notadas abaixo. Experiências foram feitas em duplicata.Amostras foram incubadas 2 horas , e durante a noite (20 horas) a 30°C comsuave agitação. Resultados calculados pela média são mostrados abaixo.Apenas os estereoisômeros detectados quando produzindo monatina produ-tor utilizando estes métodos são RlRe S,R. O percentual de R1R é Iisatdoabaixo, e foi determinado por área de pico de LC de fase reversa.
Tabela 13: Monatina Total produziram a partir de D-triptofano e % deR,R.
<table>table see original document page 343</column></row><table><table>table see original document page 344</column></row><table>
Números de produção de monatina totais variaram a partir de 1ppm a mais de 200 ppm e o % de R1R variou de 0% para 99%. Porque aaminotransferase foi a mesmo para todas as aldolases, a mudança da aldo-Iase pode ter um impacto significante igualmente na quantidade de monatinaproduzida e na distribuição estereoisomérica da monatina produzida. DTT(como nas amostras abaixo) pareceu aumentar a quantidade de monatinatotal produzida.
As mesmas experiências como as acima foram feitas utilizandoL-triptofano como o substrato de partida de acoplando as aldolases (forneci-das como extrato celular) com L-aminotransferase de ampla especificidadede HexAspC parcialmente purificada (0,5 mg de HexAspC). Resultados cal-culados pela média (de duplicatas) são mostrados abaixo na Tabela 14 paraa produção de monatina total (subtraindo os níveis base sem aldolase pre-sente), e o percentual de S1S monatina é mostrado com base na área depico de LC de fase reversa. Números acima de 400 ppm estão fora da faixalinear da curva padrão, e são aproximados. Polipeptídeo purificado com ati-vidade de aldolase de SEQ ID NO: 28 foi utilizado como uma referência. Po-lipeptídeos com atividade de aldolase de SEQ ID NO: 304 e SEQ ID NO: 300(derivada de planta) foram utilizados com e sem 2 mM de DTT. Shannon eMarcus (The Journal of Biological Chemistry 237: 3342-3347, 1962) utiliza-ram mercaptoetanol como agente redutor na purificação original de umaHMG aldolase de amendoim.
Tabela 14: Monatina total produzida de L-triptofano e % de S,S.
<table>table see original document page 345</column></row><table><table>table see original document page 346</column></row><table>
Exemplo 11
Efeito de Ditiotreitol (DTT) na produção de monatina.
Várias enzimas no Exemplo 10 foram escolhidas para outro es-tudo. As aldolases derivadas de planta mostraram melhoria na adição deDTT como um agente redutor. Foi notado que as aldolases derivadas micro-bialmente de amostras ambientais da mesma forma contêm uma porcenta-gem alta de resíduos de cisteína. Portanto, experiências adicionais foramconduzidas para observar se DTT aumentou a produção de monatina paraaldolases não derivadas de planta também.
Os seguintes foram adicionados por 1 mL de mistura de reação:aproximadamente 50 μg de aldolase (forencida em extratos celulares a me-nos que de outra maneira notado), 4 mM de MgCI2, 50 mM de D-triptofano, 2mg de AT-103, 200 mM de piruvato de sódio, 100 mM de tampão de fosfatode potássio pH 7,5, e 0,05 mM de PLP. Ditiotreitol foi adicionado (concentra-ção final 2 mM) às amostras notadas abaixo. Experiências foram conduzidasem duplicata. Amostras foram incubadas 2 horas s a 30°C com suave agita-ção. Resultados calculados pela média são mostrados abaixo para monatinatotal como determinado por LC/MS/MS, com a produção base de monatina(nenhum controle de aldolase) subtraída.
Tabela 15: Monatina total produzida a partir de D-triptofano.
<table>table see original document page 346</column></row><table><table>table see original document page 347</column></row><table>
O controle de não-aldolase produziu 10 ppm de monatina totalcom e sem DTT, indicando que o DTT não está afetando a reação global porredução de subprodutos, e não está afetando a atividade de D-aminotransferase. Os polipeptídeos com atividade de aldolase de SEQ IDNO: 46, SEQ ID NO: 58, e SEQ ID NO: 28 mostraram todos um benefício daadição de DTT. O polipeptídeo com atividade de aldolase de SEQ ID NO: 46mostrou o benefício mais alto, cerca de 1,8 vez a atividade mais alta com 2mM de DTT. Dois polipeptídeos com atividade de aldolase parecem ter sidoinibidos por DTT (SEQ ID NO: 116 e SEQ ID NO: 50) enquanto nenhum efei-to foi notado, dentro do erro experimental, para o polipeptídeo com atividadede aldolase de SEQ ID NO: 44. Entretanto, é possível que para cada aldola-se utilizada haja uma concentração ideal de DTT para detectar um benefíciode fornecer o agente redutor.
O polipeptídeo com atividade de aldolase de SEQ ID NO: 88 foiescolhido para estudar o efeito da concentração de DTT sobre a produçãode monatina. Reações acopladas foram realizadas como acima. Resultadossão plotados na Figura 15. A concentração ideal de DTT neste ensaio estavaentre 2,5 e 5 mM, para a quantidade de aldolase adicionada. De forma inte-ressante, se nenhum DTT foi adicionado, a quantidade de monatina produzi-da foi quase tão alta quanto 2,5 mM de DTT, porém adicionar as quantida-des subideais de DTT (0,5 -1 mM) parece, de fato, ser inibidor, bem como aadição de muito DTT (20 mM).
Exemplo 12
Comparação de produção de monatina total e distribuição isomérica para ospolipeptídeos com atividade de aldolase de SEQ ID NO: 278, SEQ ID NO:162, SEQ ID NO: 276, SEQ ID NO: 178, SEQ ID NO: 202, SEQ ID NO: 166,SEQ ID NO: 218,SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 244, SEQ ID NO: 250, SEQID NO: 252, SEQ ID NO: 264, SEQ ID NO: 268, SEQ ID NO: 272, SEQ IDNO: 184, SEQ ID NO: 282, SEQ ID NO: 186, SEQ ID NO: 192, SEQ ID NO:200, SEQ ID
NO: 280, SEQ ID NO: 284, SEQ ID NO: 172, SEQ ID NO: 180, SEQ ID NO:168,
SEQ ID NO: 228, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQID
NO: 270, SEQ ID NO: 156, e SEQ ID NO: 28 .
A enzima recombinante produzida no Exemplo 7 foi utilizada emreações acopladas com HMG aldolases para produzir monatina a partir deD-triptofano e piruvato como descrito no Pedido Publicado U.S. No.20050282260. O polipeptídeo com atividade de aldolase de SEQ ID NO: 28foi utilizado como uma referência nestes ensaios e foi purificado como des-crito no Exemplo 8.
Para produzir quantidades teste de cada aldolase, culturas de 25mL foram crescidas em meio de LB contendo ampicilina (100 μς/ιτιΙ.), em umOD600 de aproximadamente 0,5. As culturas foram induzidas com 1 mM deIPTG. As células foram trocadas a 30°C e foram crescidas durante a noite.Extratos celulares foram preparados utilizando reagente de Bugbuster deacordo com os protocolos de fabricante (Novagen, Madison, Wl). Benzonu-clease também foi adicionada. As proteínas solúveis nos extratos celularesforam separadas em um Bio-Rad Laboratories Experion Automated Electro-phoresis Station (Bio-Rad, Hercules, CA) e analisadas quanto à concentra-ção e expressão percentual utilizando o Software Experion versão 1.1.98.0.
Os seguintes foram adicionados por 1 mL de mistura de reação:aproximadamente 200 μg dos polipeptídeos com atividade de aldolase deSEQ ID NO: 278, SEQ ID NO: 162, SEQ ID NO: 276, SEQ ID NO: 178, SEQID NO: 202, SEQ ID NO: 166, SEQ ID NO: 218, SEQ ID NO: 224, SEQ IDNO: 226, SEQ ID NO: 244, SEQ ID NO: 250, SEQ ID NO: 252, SEQ 3D NO:264, SEQ ID NO: 268, SEQ ID NO: 272, SEQ ID NO: 184, SEQ ID NO: 282,SEQ ID NO: 186, SEQ ID NO: 192, e SEQ ID NO: 200 ou 50 μg do polipep-tídeo com atividade de aldolase de SEQ ID NO: 280, SEQ ID NO: 284, SEQID NO: 172, SEQ ID NO: 180, SEQ ID NO: 168, SEQ ID NO: 228, SEQ IDNO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 270, e SEQ IDNO: 156 (fornecida em extratos celulares a menos que de outra maneira in-dicado), 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase de B. sphaericus purificada, 200 mM de piruvato de sódio,100 mM de tampão de fosfato de potássio pH 7,5, e 0,05 mM de PLP. Expe-riências foram conduzidas em duplicata. Amostras foram incubadas 2 horass, e durante a noite (20 horas) a 30°C com suave agitação. Resultados cal-culados pela média são mostrados abaixo. Os únicos estereoisômeros de-tectados quanda produzindo monatina utilizando estes métodos são R1ReS,R. O percentual de R,R é listado abaixo, e foi determinado por área depico de LC de fase reversa.
Tabela 16: Monatina total produzida de D-triptofano e % de R,R.
<table>table see original document page 349</column></row><table><table>table see original document page 350</column></row><table>
Números de produção de monatina totais variaram de não detec-táveis a mais de 600 ppm e % de R,R variou de 61% para 100%. Porque aaminotransferase foi a mesma para todas as aldolases, a mudança da aldo-Iase pode ter um impacto significante igualmente na quantidade de monatinaproduzida e na distribuição estereoisomérica da monatina produzida.As mesmas experiências como as acima foram realizadas utili-zando L-triptofano como o substrato de partida de acoplando as aldolases(fornecidas como extrato celular) com L-aminotransferase de ampla especifi-cidade de HexAspC produzida e purificada como descrito no Pedido Publi-cado U.S. No. 20050282260 (0,5 mg de proteína purificada). Resultados sãomostrados abaixo na Tabela 17 para produção de monatina total (subtraindoníveis base sem aldolase presente), e o percentual de S,S monatina é mos-trado com base na área de pico de LC de fase reversa. Números acima de400 ppm estão fora da faixa linear da curva padrão, e são aproximados. Ta-bela 12 mostra os resultados para a enzima R-específica de referência, opolipeptídeo com atividade de aldolase de SEQ ID NO: 28, que foi analisadoao mesmo tempo.
<table>table see original document page 351</column></row><table><table>table see original document page 352</column></row><table>
Exemplo 13
Produção de monatina a partir de indol-3-piruvato utilizando uma D-aminotransferase.
A-103 transaminase foi parte de uma biblioteca de transaminaseadquirida de BioCataIytics (Pasadena, CA) e a enzima foi testada quanto àprodução de monatina em reações acopladas utilizando a ProA aldolase apartir de C. testosteroni. Ae aldolase foi preparada como descrito em WO03/091396 A2. AT-103 é uma D-transaminase de ampla especificidade (E.C.2.6.1.21) de uma espécie de Bacillusque requer um D-aminoácido (tal comoD-glutamato, D-aspartato, ou D-alanina) como o doador de aminoácido. En-zimas e componentes adicionais/substratos foram adicionados diretamenteao tampão de reação fornecido no kit, que continha 100 mM de tampão defosfato de potássio pH 7,5, 100 mM de doador de amino, e 0,1 mM de PLP.Para um ml_ de tampão de reação foram adicionados: 4 mg de indol-3-piruvato, 20 mg de piruvato, aproximadamente 50 μg de ProA fornecida emum extrato celular, 1 μΙ_ de 2 M de MgCl2, e 2 mg de enzima aminotransfera-se. Reações foram realizadas em duplicata. As reações foram incubadasdurante a noite a 30°C com suave agitação (100 rpm). As amostras foramfiltradas e submetidas à varredura de LC/MS/MS de fase reversa como des-crito no Exemplo 1. Os resultados indicaram que aproximadamente 370μg/mL de monatina foram produzidos utilizando a enzima A-103. Os resul-tados foram também analisados para determinar relações de S,R/R,S versusR,R/S,S monatina, com base nas áreas de pico das dois misturas de estere-oisômero que resolvem durante a separação cromatográfica. Da monatinatotal produzida por A-103, 69% foram R,R/S,S monatina em comparação aosisômeros mistos. Esta enzima é homóloga à enzima DAT de Bacillus subtilisdescrita em WO 03/091396 A2, que é conhecida por ter uma ampla especifi-cidade para D-aminoácidos. Varredura quiral foi r-ealizada utilizando a meto-dologia de FDAA descrita no Exemplo 1, que verificou que a D-aminotransferase estava constituindo predominantemente R1R monatina, ealguma S,R monatina quando esperado. Outras experiências de transamina-ção com S,S monatina ou R1R monatina e α-cetoglutarato como substratosverificaram que a enzima BioCataIytics foi altamente seletiva para uma D-configuração no carbono 4, quando esperado. Nestas experiências, nenhumglutamato foi detectado na reação com S,S monatina e α-cetoglutarato comosubstratos.
Para diminuir a quantidade de S1S monatina ou R,S monatinaproduzida como subprodutos em reações acopladas com A-103 (a D-transaminase de ampla faixa) e a ProA aldolase, a aldolase foi purificadautilizando cartuchos de His-Bind, seguindo os protocolos do fabricante (No-vagen, Madison, Wl). A enzima purificada não deveria conter preferivelmenteatividades de L-aminotransferase tipo selvagem que podem estar presentesem extratos celulares (tal como as atividades de AspC ou TyrB de E. coli). Oeluente de His-Bind foi dessaliniado para remover imidazol utilizando colu-nas PD-10 (G25 Sephadex, GE Healthcare, Piscataway, NJ) e foi eluído em50 mM de Tris-Cl1 pH 7. Experiências foram realizadas em duplicata em umvolume de 1 mL e continham 100 mM de tampão de Tris-CI, pH 7,8, 50 μgde ProA aldolase, 4 mg de indol-3-piruvato, 1 ou 2 mg de D-aminotransferase, 200 mM de piruvato de sódio, 2 mM de MgCI2, 3 mM defosfato de potássio, 0,1 mM de PLP1 e 14,7 mg de D-glutamato. Os tubosforam incubados a 30°C com suave agitação. Pontos de tempo de duas ho-ras foram considerados e congelados imediatamente a-20°C. O pH foi ajustado em duas horas de 5 a entre 7-8 utilizando NaOH, eos ensaios foram incubados durante a noite. Amostras foram filtradas e ana-lisadas para monatina como descrito no Exempto 1. As amostras de duashoras não tiveram quantidades detectáveis de monatina, provavelmente de-vido ao pH baixo. As amostras da noite continham aproximadamente 190ng/mL de monatina quando 1 mg de D-aminotransferase foi utilizada, e a-proximadamente 84% foram R1R monatina e 16% foram S1R monatina.Quando 2 mg de D-aminotransferase foram utilizados, 540 ng/mL de mona-tina foram produzidos, aproximadamente 71% foram R1R monatina.Experiências similares foram conduzidas utilizando tampão deAminotransferase de BioCataIytics (BioCatalytics, Pasadena, CA) que conti-nha 100 mM de fosfato de potássio pH 7,5, 0,1 mM de PLP1 e 100 mM de D-glutamato. lndol-3-piruvato sólido e D-aminotransferase foram adicionadoscomo acima. ProA aldolase (50 μς), MgCI2, e 50 mM de piruvato foram adi-cionados a partir de soluções de matéria-prima. Os ensaios foram tratadoscomo acima, embora nenhum ajuste de pH tenha sido requerido neste caso.
Um controle negativo foi feito apenas com enzima fornecida de BioCatalyticse tampão, que não continham monatina. Os resultados experimentais sãomostrados na Tabela 18.
Tabela 18: Produção de Monatina a partir de lndol-3-Piruvato em Tampão de Fosfato.
<table>table see original document page 354</column></row><table>
A produção de monatina em tampão de fosfato é claramentemais alta do que aquela em sistemas tamponados de Tris.
Para comparar as atividades de DAT de B. subtilis clonado deWO 03/091396 A2 com a enzima de BioCatalytics (AT-103) (BioCatalytics,Pasadena, CA), ensaios adicionais foram feitos. O gene dat de B. subtilis foida mesma forma subclonado em pET30a para remover o rótulo His-6. Enzi-ma rotulada e não-rotulada foram produzidas em BL21 (DE3), como descritoem WO 03/091396 A2. Extratos celulares foram feitos e os ensaios de prote-ína total foram feitos para calcular a concentração de proteína como previa-mente descrito. Reações de um mL duplicadas foram feitas, as quais conti-nham: 500 μg de D-aminotransferase, 50 μg de ProA aldolase, 100 mM defosfato de potássio pH 7,5, 3 mM de MgCI2, 4 mg de indol-3-piruvato, 200mM de piruvato de sódio, 7,35 mg (50 mM) de D-glutamato, e 0,1 mM dePLP. Amostras foram incubadas a 30°C durante 1 h, 2 horas , e durante anoite, e foram filtradas para varredura de LC/MS/MS. As amostras continhamapenas os estereoisômeros S1R e R1R de monatina, como determinado peloprotocolo de derivação de FDAA descrito no Exemplo 1. Os resultados sãoresumidos na Tabela 19 abaixo. O % de RR foi determinado por áreas depico que foram separadas por cromatografia de fase reversa.
Tabela 19: Comparação de enzimas D-aminotransferase .
<table>table see original document page 355</column></row><table>
A remoção do rótulo HIS-6 parece ter melhorado a atividade deD-aminotransferase de B. subtilis-, porém, o homólogo de D-aminotransferase de BioCataIytics tiveram claramente a atividade mais alta.O homólogo de D-aminotransferase de BioCataIytics mostrou da mesmaforma especificidade de substrato maior para o precursor de R-monatina.Tempos de incubação aumentados parecem reduzir o excesso enantioméri-co de R,R monatina que é produzida.
Porque as enzimas D-aminotransferase de Bacillus têm umapreferência para piruvato como um aceptor de amino e D-alanina como umdoador de amino. Foi esperado que D-alanina pode ser utilizada como o do-ador de amino para conversão de MP em monatina com resultados similaresou melhores. Reações de um ml_ duplicadas foram feitas, as quais conti-nham: 500 μg de D-aminotransferase, 50 μg de ProA aldolase purificada,100 mM de fosfato de potássio pH 7,5, 3 mM de MgCI2, 4 mg de indol-3-piruvato, 100 mM de piruvato de sódio, 25 mM de D-glutamato ou D-alanina,e 0,1 mM de PLP. As amostras foram incubadas durante 2 horas, e tratadascomo acima antes da varredura. Quando D-alanina foi utilizada como o doa-dor amino, níveis ligeiramente mais altos de monatina foram produzidos (23versus 21 ppm) como esperado. Adicionalmente, é esperado que concentra-ções altas de piruvato podem inibir a etapa de transaminação, desse modo adosagem em quantidades menores de piruvato durante o período pode me-lhorar a taxa global de produção de monatina. Alguém pode observar a partirdos dados acima que embora a metade do piruvato tenha sido utilizada nes-te caso comparado à tabela acima, significativamente mais monatina foi pro-duzida. AT-103 é um exemplo de uma enzima com atividade limitada para S-MP. Mesmo que a ProA aldolase utilizada neste estudo torne-se maior que90-95% de S-MP, A-103 produz 92% de R1R monatina.
Exemplo 14
Produção de R1R monatina a partir de D-triptofano .
Os seguintes foram adicionados por 1 mL de mistura de reação:aproximadamente 60 μg de ProA aldolase de C. testosteroni (fornecida emextratos celulares, como descrito em WO 03/091396 A2), 4 mM de MgCI2, 50mM de D-triptofano, 0,5 mg de D-aminotransferase de BioCataIytics (AT-103) (BioCatalytics, Pasadena, CA), 100 mM de piruvato de sódio, 100 mMde tampão de fosfato de potássio pH 7,5 ou 100 mM de tampão de acetatode sódio pH 8, 0,05 mM de PLP, 3 mM de fosfato de potássio (apenas paraas reações de acetato), e 10 mM de α-cetoglutarato. Experiências foramconduzidas em duplicata, com controles negativos nos quais nenhuma aldo-Iase foi adicionada. As amostras foram incubadas durante a noite (20 horas)a 30°C com agitação suave. O pH atual das amostras de acetato de sódio foiaproximadamente 5, enquanto o pH final para as amostras tamponadas porfosfato foi aproximadamente 7. Nenhuma das aldolases mostrou ter ativida-de significante em pH 5, a amostra contendo ProA aldolase está ligeiramenteacima do controle negativo, porém, provavelmente não acima do erro expe-rimental. Em fosfato de potássio, a ProA aldolase produziu 73,4 ppm de mo-natina com uma relação de R,R:S,R de 1,7:1 (-63% de R1R de D-triptofano).
Porque as enzimas de D-aminotransferase de Bacillus têm umapreferência para piruvato como um aceptor de amino e D-alanina como umdoador de amino, esperou-se que a adição de alfa-cetoglutarato é desne-cessária quando produzindo R,R ou S1R monatina de D-triptofano. A experi-ência anterior foi repetida (em 100 mM de tampão de fosfato de sódio) utili-zando ProA aldolase purificada (50-60 μg), e um tempo de incubação de 2,5horas. Experiências duplicadas foram conduzidas, com e sem alfa-cetoglutarato. Com 10 mM de alfa-cetoglutarato adicionados, 56,1 ppm demonatina foram formados a partir de D-triptofano (79,5% de R,R, 20,5% deS,R). Sem alfa-cetoglutarato, 102,5 ppm de monatina foram formados (79%de R.R, 21% de S,R).
Exemplo 15
Triptofano Racemase
R,R-monatina foi produzida utilizando D-aminotransferase e umaaldolase quando D-triptofano foi utilizado como o material de partida come-çando (Exemplo 14). No entanto, L-triptofano podem ser um material de par-tida preferido por várias razões. Por exemplo, L-triptofano pode ser menosoneroso e mais facilmente disponível do que D-triptofano. Esta descriçãodescreve vários métodos para obter um triptofano racemase ativo. Rendi-mentos de R1R monatina são melhorados utilizando-se uma aldolase R-específica, isto é, um aldolase que preferencialmente ou seletivamente pro-duz R-MP. Figura 3 ilustra um método para produzir R,R monatina estereoi-somericamente enriquecida a partir de L-triptofano utilizando uma triptofanoracemase, uma D-aminotransferase e uma aldolase R-específica.[0731] Uma seleção para um triptofano racemase é criada construindo-se uma cepa que requereria uma racemase ativa para o desenvolvimento.
Um auxótropo de triptofano precisa de uma fonte de L-triptofano quando cul-tivado em meio mínimo. Suplementar o meio com D-triptofano é um modopara selecionar para uma racemase que converte D-triptofano em L-triptofano. Os auxotrofos de triptofano foram testados quanto ao cultivo emmeio mínimo suplementado com D-triptofano. As cepas, CAGI 8455 e CAGI8579 de Coli Genetic Stock Center e NRRLI 2264 (Também lipA,ÀDE3lisogeneizada, e curado de seu plasmídeo), não-cultivadas quando su-plementadas com D-triptofano, porém, cultivadas quando suplementadascom L-triptofano. E. coli podem ser utilizados como um organismo hospedei-ro, porém, outros organismos hospedeiros da mesma forma podem ser utili-zados, tal como levedura, outras bactérias, ou outros organismos eucarióti-cos. Um auxotrofo de triptofano (especificamente NRRL12264 (também IipA',ÀDE3lisogeneizada, e curado de seu plasmídeo)) crescerá em D-triptofanoquando foi transformado com uma D-aminotransferase. Isto confirma a ca-pacidade de E. coli transportar D-triptofano na célula.
Salcher e Lingens descreveram a presença de um triptofano ra-cemase em Pseudomonas aurereofaciens (ATCC 15926). Triptofano race-mase foi da mesma forma descrito em várias plantas incluindo tabaco, beter-rabas, tomate e trigo e a enzima parece ser induzida por condições de es-tresse osmótico ou secas. Triptofano racemase pode desempenhar um pa-pel em Sclerochiton ilicifolius na série de reação de produção de monatinanativa. Para isolar esta atividade de racemase, uma biblioteca de expressãoé construída a partir de ATCCI 5926 (ou outro organismo com atividade detriptofano racemase) e a biblioteca é transformada no auxotrofo de triptofa-no. Uma cepa é selecionada a qual crescerá utilizando D-triptofano como afonte de triptofano. Um método similar é da mesma forma utilizado para ava-liar muitas cepas com racemases conhecidas para procurar um racemasecom atividade em D-triptofano. Exemplos incluem: alanina, serina, e gluta-mato racemases (T. Yoshimura e N. Esaki, "Amino Acid Racemases: Functi-ons and Mechanisms." Journal of Bioscience and Bioengineering. Vol. 96, No. 2, 103-109, 2003). Alanina racemase é dependente de PLP e foi clonada- de Salmonella typhimurium (gene dadB). Outras fontes são Escherichia coli,Bacilius subtilis, Pseudomonas aeruginosa, Vibrio cholerae, Schizosaccaroy-ees pombe, e Bacilius eereus. Um cogumelo basidiomicetoso, Lentinus edo-des, da mesma forma contém uma ampla atividade de alanina racemase.
Serina racemase é da mesma forma dependente de PLP e é encontrada emEucariotos (tal como bicho-da-seda, cérebro de camundongo, cDNA de cé-rebro de camundongo) bem como bactérias (Enteroeoeeus gallinarum). Glu-tamato racemase é independente de PLP e foi clonada a partir de Pediococ-eus pentosaceus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus bre-vis, E. coli, Aquifex pyrophilus, e Bacillus subtilis. A glutamato racemase émuito específica e, por conseguinte, até mesmo aminoácidos estruturalmen-te similares aspartato, asparagina e glutamina não são substratos para aenzima. Aspartato racemases da mesma forma existem e são independen-tes de PLP. Estas enzimas são constatadas em cepas de Lactobacilli, Strep-tococcus, e alguns archaea tais como as cepas de Desulfurococcus e Ther-mococcus. O molusco bivalve Scapharca brouhtonii da mesma forma con-tém um aspartato racemase. Outras racemases encontradas na literaturaincluem aminoácido racemase (EC 5.1.1.10) de Anabaena sp. e Pseudomo-nas striata, prolina racemase, fenilalanina racemase multifuncional. Epime-rases ou racemases relacionadas estão da mesma forma sendo testadas.Racemases potenciais são testadas para ter certeza que elas não são Ρ-triptofano aminotransferases. Esta avaliação é feita por varredura de se-qüência e/ou um ensaio de enzima.
Enzimas que passam no teste como uma racemase são avalia-das quanto à atividade em monatina como descrito no Exemplo 17. Ideal-mente, a pessoa obtém uma enzima que é muito específica para triptofano etem pouca ou nenhuma atividade de racemase em monatina.
Uma triptofano racemase pode da mesma forma estar envolvidae/ou melhorada (por mutagênese ou engenharia genética) de uma racema-se, transaminase ou epimerase existente. Adicionalmente, porque as estru-turas de cristal para alanina aminotransferases são conhecidas, estas po-dem ser utilizadas como uma base para metagênese com base em estruturaracional. O processo descrito acima é empregado como uma seleção inicialpara atividade de triptofano racemase e como uma avaliação para atividademelhorada.
Bibliotecas de triptofano racemase
Constructo de bibliotecas:
Burkholderia pyrrodna (ATCC 15958) e Pseudomonas chlorora-phis
(ATCCI 5926) foram obtidas da Coleção de Cultura Tipo Americana. Elasforam crescidas como recomendado por ATCC e DNA genômico foi prepa-rado de acordo com o método de Mekalanos JJ. (Duplicação e amplificaçãode genes de toxina em Vibrio cholerae. Cell. 1983. 35:253-63). O DNA ge-nômico foi digerido parcialmente com a enzima de restrição Sau3AI. 1-3Fragmentos de Kbp foram purificados por gel utilizando um Kit de Extraçãode Gel Qiagen QIAquick (Qiagen, Valencia, CA). O DNA purificado foi ligadoem pTrc99a (Amersham, Piscataway, NJ) que foi digerido com BamHIe puri-ficado como acima. A ligação foi feita em temperatura ambiente com incuba-ção durante a noite utilizando uma relação molar de 3:1 de inserção ao ve-tor. A biblioteca ligada foi transformada nas células quimicamente competen-tes de TOPIOF (Invitrogen, Carlsbad, CA) e semeada em meio de LB com100 μg/mL de ampicilina. Depois da incubação durante a noite das placas detransformação, as colônias foram raspadas das placas lavadas com meio deLB líquido e um pélete celular de tamanho apropriada foi minipreparada utili-zando um kit mini-prep Qiagen QIAquick (Qiagen, Valencia, CA). Aproxima-damente 30.000 colônias foram agrupadas e minipreparada.
O plasmídeo agrupado foi transformado em CAGI 8455(írpC83::Tn70, rph-1) ou CAGI 8579 (trpC::Tn10, rph-1). Ambas as cepassão auxotrofos de triptofano, assim eles não crescerão em meio mínimo M9(Difco) a menos que o meio seja suplementado com triptofano. Os transfor-mantes foram semeados em meio mínimo M9 suplementado com D-triptofano. Isto seleciona uma cepa que pode converter D-triptofano em L-triptofano.
Antes da transformação da biblioteca, as cepas foram testadasquanto ao crescimento em meio mínimo com L- ou D-triptofano. As cepasforam testadas quanto ao crescimento em meio mínimo suplementado comD-triptofano e nenhum crescimento foi observado. Ambas as cepas cresce-ram em meio idêntico suplementado com L-triptofano em vez de D-triptofano. Adicionalmente, um derivado de NRRLI 2264 (a cepa utilizada foicurada do plasmídeo de operon de triptofano, Iisogeneizado com XDE3, edeletado para IipA, além de outras mutações cromossomicamente codifica-das (serB, AtrpED, tnaA2, aroP) (esta cepa cepa não pôde crescer em meiomínimo suplementado com D-triptofano, porém, poderia crescer em meioidêntico suplementado com L-triptofano em vez de D-triptofano) foi transfor-mado com uma D aminotransferase específica a partir de Bacillus subtilis(WO 03/091396). Expressão de D-aminotransferase foi direcionada pelopromotor T7. A cepa transformada pôde crescer em meio mínimo M9 suple-mentado com D-triptofano.
As colônias que crescem no meio de D-triptofano são avaliadas.O plasmídeo é isolado e retransformado na cepa de origem (CAGI 8455 ouCAGI 8579) para confirmar que o crescimento em meio de D-triptofano édependente do plasmídeo e não em uma mutação de hospedeiro. As se-qüências de nucleotídeo dos plasmídeos que complementam a auxotrofia detriptofano são analisadas. Clones que são determinados para conter um ge-ne de triptofano racemase são também analisados.
A triptofano racemase a partir de outras fontes de tecido é isola-do em uma maneira similar. Há relatos da literatura da atividade de triptofanoracemase em ambas as células de cultura de tecido de tabaco (Nicotianatabacum L. var Wisconsin 38) (Miura, G. A. e Mills, S. E. The conversion ofD-triptofano to L-triptofano in cell cultures of tobacco. Plant Physiol. 1971.47:483-487) e em extratos de proteína crus de trigo (Triticum aestivum) (Re-koslavskaya, N.I., Yur'eve, O.V., Shibanova1 L.A., e Salyaev, R.K. Synthesisand physiological function of D-triptofano during wheat germination. RussianJ. Plant Physiol. 1997. 44:196-203). Uma biblioteca de expressão de cDNA éfeita a partir de tecido, como descrito na literatura, e a biblioteca de expres-são é utilizada para transformar um auxotrofo de triptofano como descritoacima.
Ensaio de triptofano racemase
Clones que são identificados como potencialmente tendo umtriptofano racemase são transformados em uma cepa de E. coli geralmenteutilizados para expressão de proteínas recombinantes, tal como BL21. Ascélulas são crescidas em caldo de LB em uma densidade ótica em 600 nmde 0,4-0,6. A expressão impulsora de promotor da racemase é induzida comIPTG (0,1 mM de concentração final). Depois da indução, as células sãopermitidas expressar a proteína durante 1-3 horas a 37° C (com aeração).As células são colhidas e Iisadas por prensa French, sonicação ou por meiosquímicos (tal como BugBuster (Novagen, Madison, Wl)). As células Iisadassão centrifugadas para remover os resíduos celulares. O extrato clarificado édiretamente empregado em ensaios.
Quantidades variadas são adicionadas de extrato são adiciona-das a uma solução tal que a concentração final é 50 mM de fosfato de po-tássio (pH 7,0) e 2 mM de L-triptofano. Piidoxal-5-fosfato é adicionado a umaconcentração final de 10 μΜ. As amostras são incubadas e em seguida ana-lisadas por LC/MS. A presença de um pico de D-triptofano quando apenas L-triptofano é utilizado como um substrato indica um resultado positivo. Con-centração de D-triptofano deve aumentar com o tempo crescente até que oequilíbrio seja alcançado, e a taxa da mesma forma deveria aumentar comconcentração de proteína até que a concentração de enzima seja alta o sufi-ciente para que não seja mais saturada com substrato. D-triptofano pode damesma forma ser convertido em L-triptofano como acima.
Um gene de complementação pode codificar uma D-aminotransferase. (Um "gene de complementação" é um gene que, quandoexpresso, anula uma mutação em um organismo. Por exemplo, se um orga-nismo tiver uma mutação nula em um dos genes requeridos para síntese detriptofano pela célula, um gene de complementação pode ser aquele que,quando expresso, permite a cepa crescer em meio mínimo (isto é, sem trip-tofano). Esta reação requer um alfa-ceto ácido tal como α-cetoglutarato, oxa-Ioacetato ou piruvato como um aceptor de amino. Estes compostos estarãoprovavelmente presentes em um extrato celular (em quantidades pequenas).Estes compostos pode ser removidos utilizando uma coluna de dessaliniza-ção PD-10 (GE Healthcare, Piscataway, NJ) e o ensaio ainda pode ser reali-zado em extrato bruto. A atividade de triptofano racemase é purificada utili-zando cromatografia de coluna convencional. Finalmente, a estrutura de lei-tura aberta identificada como um triptofano racemase potencial é clonada emum vetor de expressão com um rótulo de afinidade. A triptofano racemasepotencial é, em seguida, purificada por cromatografia de afinidade. Em qual-quer caso, a proteína purificada é utilizada em ensaios de enzima essenci-almente como descrito acima.
Engenharia genética reversa de triptofano racemase
O triptofano racemase pode ser purificado da planta ou fontesmicrobianas por técnicas de purificação de proteína convencionais incluindofracionamento de sulfato de amônio, e cromatografia de coluna convencio-nal. Logo que a proteína foi purificada tal que uma mancha pode ser isoladaem um gel 2-D, técnicas de microseqüênciamento de peptídeo ou seqüên-ciamento de aminoácido tipo Edman convencional são utilizados (vide gol-gi.harvard.edu/microchem/ para descrições dos protocolos e equipamentoutilizadas para este tipo de trabalho). Em alguns casos, porém, a seqüênciade genoma do organismo não pode ser utilizada como uma fonte da proteínapara a purificação de proteína porque tal seqüência não foi ainda determina-da. Nessa situação, o primeiro grupo de iniciadores degenerados pode serprojetado com base na seqüência disponível a partir do parente conhecidomais íntimo da fonte de proteína. PCR degenerada e caminhada de genomasão em seguida realizadas de acordo com os protocolos estabelecidos paraisolar a seqüência de codificação de triptofano racemase.
Produção de monatina de triptofano racemase
O seguinte é adicionado por 1 mL da mistura de reação: aproxi-madamente 60 μg de ProA aldolase de C. testosteroni (fornecida em extra-tos celulares, como descrito em WO 03/091396 A2), 100 μΙ_/ηιΙ- de extratocelular de triptofano racemase ou 1 mg/mL de triptofano racemase purifica-do, 4 mM de MgCI2, 50 mM de L-triptofano, 0,5 mg de D-aminotransferasede BioCataIytics (A-103) (BioCatalytics, Pasadena, CA), 100 mM de piruvatode sódio, 100 mM de tampão de fosfato de potássio pH 7,5, 0,05 mM dePLP, e 10 mM de α-cetoglutarato. Porque o piruvato é um aceptor de aminoaceitável para a D-aminotransferase de ampla especificidade, a-cetoglutarato é opcional. Experiências são conduzidas em duplicata, comcontroles negativos nos quais nenhuma aldolase foi adicionado ou nenhumatriptofano racemase foi adicionado. Amostras são incubadas ~ 1 hora ou du-rante a noite (20 horas) a 30°C com suave agitação.
A triptofano racemase é testada quanto à atividade em monati-na. Um ensaio similar àquele no Exemplo 17 é utilizado com monatina comoum substrato, e comparado à atividade da enzima em triptofano. A enzimaideal tem atividade em triptofano, porém, pouca ou nenhuma atividade emoutros aminoácidos particularmente glutamato e monatina. Se a enzima tiveratividade significante em monatina, a enzima pode ser mutagenizada paradiminuir a atividade em monatina e ou glutamato enquanto mantendo a ativi-dade de triptofano inalterada ou a um nível alto o suficiente para a enzimaser útil na produção de monatina. Técnicas que podem ser utilizadas paramutagênese incluem, porém não são limitadas à PCR propensa ao erro, mu-tagênese direcionada ao sítio, modelagem para identificar alvos de mutagê-nese direcionada ao sítio (sítios que podem ser envolvidos na ligação desubstrato), passagem através de cepas mutagênicas, e embaralhamento deDNA.
Racemases mutagenizadas podem ser avaliadas quanto à ativi-dade de triptofano utilizando um ensaio de placa como descrito acima. Osclones que mantêm a atividade de triptofano são, em seguida, avaliados pa-ra uma perda de atividade em monatina.
Exemplo 16
Mutagênese Direcionada ao Sítio de HEXAspCAvaliação experimental
Um hexamutante de E. coli AspC (HEXaspC) foi constatado teruma melhor atividade quando comparada ao AspC para a produção de S,S monatina como descrito no Exemplo 6 de WO 03/091396 A2. HEX (númerode acesso:/AHFA gi: 127190) contém as seguintes mutações de AspC (nu-meração de E. coli): V35L, K37Y, T43I, N64L, T104S, e N285S. Com basenos relatos da literatura e varredura estrutural (S. Rothman e J. Kirsch, J.MoL Biol. (2003), 327, 593-608; S. Rothman e outro, Protein Science (2004),13: 763-772), mais 5 mutantes foram criados os quais foram esperados au-mentar a atividade cinética para substratos utilizados na série de reação deprodução de monatina: L-triptofano, S-MP1 ou ambos. Dois dos mutantesaumentaram taxas de transaminação para ambos triptofano e S,S monatina.Dois dos mutantes mostraram uma estereosseletividade aumentada para aformação de S1S monatina enquanto foi menos estereosseletiva. Com basenisto, é esperado que a D-aminotransferase de ampla especificidade de Ba-cillus sp. tendo mutações similares seja útil como a D-aminotransferase nasséries de reações R,R monatina mostradas na Figura 3, e descrita no Exem-plo 15. Um dos mutantes (HEXaspCP9T/R122G) tiveram atividade aumen-tada para transaminação de L-triptofano, porém a atividade na produção deS1S monatina ou transmissão de S1S monatina foi diminuída significativa-mente. Desse modo, é esperado que esta enzima seja útil na primeira etapadas séries de reações de produção de R,R monatina mostradas nas Figuras1, 2, 4, 5, 6, 7, e 8 e descrita nos Exemplos 18 e 19. Em geral, uma amino-transferase que tem atividade similar àquela de AspC em L-triptofano e ativi-dade limitada em R-MP e S-MP seria útil para os processos descritos nasFiguras 1, 2, 4, 5, 6, 7, e 8.
Métodos e Materiais
O gene HEX clonado em pUC19 foi fornecido por Professor J. F.Kirsch (Departament of Molecular e Cell Biology1 Universidade of Califórnia,Berkeley, Berkeley, CA 94720-3206) e utilizado como o padrão para a clo-nagem do gene em pET23a. Vide James J. Onuffer e Jack F. Kirsch, Rede-sign of the substrato specificity of Escherichia coli aspartate aminotransfera-se to that of Escherichia coli tyrosine aminotransferase by homology mode-Iing and site-directed mutagenesis, Protein Science, 4: 1750-1757 (1995).
Vide, da mesma forma, número de acesso de NCBI 1 AHF_A Gl: 1127190(seqüência de aminoácido de HEX). Os seguintes iniciadores foram desig-nados para clonar o gene HEX no vetor pET23a (Novagen, Madison, Wl):Iniciadores de HEXaspC:
Terminal N: õ^GCGGAACATATGTTTGAGAACATTACCGCC-S' (SEQ IDNO: 393);
Terminal C: 5'-ATAACCGGATCCTTACAGCACTGCCACAATCG-3' (SEQ IDNO: 394)
O seguinte protocolo de PCR foi utilizado para amplificação degene: Em uma reação de 100 μL, 50 ng de padrão de DNa, 1,0 μΜ de cadainiciador, 0,2 mM de cada dNTP, 1 U de Pfu Turbo Polimerase (Stratagene,La Jolla, CA), e 1X de tampão de Pfu Clonado foram adicionados. O pro-grama termociclizador utilizou uma partida quente de 94°C durante 5 minu-tos; seguido por 25 ciclos de uma etapa de desnaturação a 94°C (30 segun-dos), uma etapa de recozimento a 55°C (1 min), e uma etapa de extensão a72°C (2 min) e finalmente uma etapa de acabamento a 72°C (7 min). Técni-cas de biologia molecular padrão foram utilizadas para clonar o produto dePCR em pET23a utilizando sítios de restrição Ndele BamH\.
Acredita-se que o resíduo de triptofano na posição 130 seja im-portante para sobrepor as interações com o anel de piridoxila, porém damesma forma parece ser uma fonte de impedimento estérico com o substra-to de precursor de S-monatina (MP)1 com base nas observações de modela-gem de proteína. Portanto, um aminoácido com uma cadeia lateral hidrofóbi-ca menor (fenilalanina) foi utilizado para substituir o triptofano. O restantedas mutações foi baseado nos dados cinéticos na literatura, embora novascombinações de mutações desejáveis tenham sido criadas. Todas as muta-ções para HEXaspC, com a exceção de W130F, foram feitas utilizando-se okit Stratagene Multi-Change (Stratagene, La Jolla, CA) seguindo as instru-ções do fabricante. A mutação de W130F foi feita utilizando o kit StratageneQuikChange (Stratagene, La Jolla, CA) de acordo com as instruções do fa-bricante com a única exceção sendo que a temperatura de extensão para areação PCR foi diminuída para 66°C. Os iniciadores do kit de múltiplas mu-dançasdos foram projetados utilizando o instrumento do projeto de iniciadorde múltiplos kits QuikChange em < www.stratagene.com >, com exceção doiniciadores de mutação simples W130F.
As seqüências de iniciador são listadas abaixo na Tabela 20.
Tabela 20
<table>table see original document page 366</column></row><table>
α Denota um iniciador que foi modificado por fosforilação de 5'Expressão de Genes Mutantes HEXaspC e Varredura de Atividade deEnzima
Culturas líquidas (5 mL) do Sistema de Autoindução 2 NovagenDurante a noite Express™ (Catálogo #71366-3; soluções 1-6) (Novagen1Madison, Wl) foram inoculadas das placas frescas ou matérias-primas deglicerol congeladas das seguintes cepas :
E coli BL21(DE3)::HexaspCpET23aE coli BL21(DE3)::HEXaspCW130FpET23aE coli BL21 (DE3)::HEXaspCT156ApET23aE. coli BL21 (DE3)::HEXaspCP9T/T156ApET23aE coli BL21 (DE3)::HEXaspCP9T/R122GpET23aE coli BL21 (D E3):: H EXaspC R122G/T156ApET23a.
As culturas foram incubadas a 37°C em 230 rpm durante 6 - 8 h.O OD600 de cada cultura foi determinado e o volume de cultura necessáriopara obter um OD600 de 0,03 - 0,05 em 25 mL foi calculado. Os volumes cal-culados de cada cultura líquida foram transferidos em frascos contendo 25mL do mesmo meio. O Sistema de Autoindução 2 Durante a noite Express™é um meio quimicamente definido, completo para expressão de alto nívelcom sistemas de expressão induzíveis por IPTG utilizando lactose como oagente de indução e não requer o monitoramento de crescimento celular. Asculturas Durante a noite Express foram incubadas a 30°C com agitação em230 rpm durante 18 h. As células foram colhidas por centrifugação e lavadasuma vez com 50 mM de MOPS frio, pH 7,0. As células foram em seguidalisadas utilizando Reagente de Extração Bugbuster™ (livre amina primária)(Novagen Catalog #70923-3) (Novagen, Madison, Wl) contendo 1 μL/mL debenzonase nuclease (Novagen Catalog #70746-3) (Novagen, Madison, Wl),5 μL de Grupo II de Coquetel Inibidor de Protease (Novagen Catálogo#539132) (Novagen, Madison, Wl) e 0,33 μL/10 mL de r-Lisozima (NovagenCatálogo #71110-3) (Novagen, Madison, Wl) seguindo o protocolo recomen-dado por Novagen. Após incubação a 25-C durante 15 minutos com agita-ção suave, os detritos celulares de cada suspensão foram peletados porcentrifugação em 21.000 g durante 15 minutos a 4°C. O sobrenadante foicuidadosamente decantado e analisado como o extrato livre de célula. Fra-ções de corpo de inclusão foram isoladas por suspensão das frações de de-tritos celulares em Reagente de Extração Bugbuster™ a 30% (livre de aminaprimária), centrifugando em 21.000 xg durante 10 minutos; suspensão dospéletes centrifugados em Reagente de Extração Bugbuster™ a 10% (livre deamina primária), centrifugando novamente para isolar os péletes lavados. Asfrações de corpo de inclusão e extrato livre de células foram analisadosquanto à expressão de proteína por SDS-PAGE em géis de gradiente de 4-15% (BioRad #161-1104, Hercules, CA). Para as amostras de extrato celu-lar, vinte microgramas de proteína solúvel foram carregadas em cada faixade gel (pré-misturadas com tampão de carregamento de proteína IX e aque-cidas a 95SC durante 5 minutos). As frações de corpo de inclusão foram dis-solvidas em tampão de carregamento de proteína IX (0,2 mL), aquecidasdurante 10 minutos a 95eC e 5 μΙ_ de cada solução foram carregadas porfaixa de gel. A quantidade de cada mutante HEX em comparação com a pro-teína solúvel total carregada em cada faixa foi calculada por varredura deintensidade de banda utilizando-se instrumento ID-gel de Labworks Biolma-ging (UVP, Inc. Upland, CA), e é relatada abaixo:
Tabela 21
<table>table see original document page 368</column></row><table>
Varredura dos géis mostrou que o mutante HEXasp-CR122A/T156A foi a única proteína que foi encontrada em quantidadessubstanciais como corpos de inclusão. A proteína HEXaspCP9T/T156A for-neceu o nível mais elevado de expressão, aproximadamente 90% melhor doque a proteína HEXaspC. Ao contrário, as proteínas W130F, T156A eP9T/R122G foram expressas em concentrações menores do que HEXaspC.
A atividade das proteínas mutantes HEXaspC para a produçãode S.S-monatina foi avaliada utilizando-se as seguintes condições reacio-nais: Cada 1 mL de reação continha 50 mM de TAPS, pH 8,2, 4 mM de Mg-Cl2, 3 mM de fosfato de sódio, pH 8,0, 200 mM de piruvato de sódio (pH a-justado para 8), 5 mM de α-cetoglutarato (pH ajustado para 8), 50 mM detriptofano, 0,05 mM de piridoxal 3-fosfato, 50 pg/mL de ProA aldolase (adi-cionada como um extrato livre de célula) e concentrações variantes (aproxi-madamente 50 e 500 pg/mL) de aminotransferase (adicionada como um ex-trato livre de célula). Água desareada foi utilizada para preparar as soluçõesde matéria-prima e para ajustar o volume das misturas reacionais para 1,0mL. O piridoxal fosfato foi ajustado exatamente antes da adição das enzi-mas. Os tubos de reação foram incubados a 30QC com agitação suave du-rante 4 horas. Amostras (0,01 mL) foram retiradas em 1, 2, e 4 horas após aadição das enzimas, filtradas, e analisadas por LC/MS/MS, como descrito noExemplo 1. Produção de monatina foi normalizada com base na quantidadede aminotransferase presente nas reações. Sob as condições desses ensai-os, a HEXaspC e a HEXaspCTI 56A produziram o máximo de monatina totalpor mg de aminotransferase enquanto a proteína P9T/R122G produziu omínimo, seguida por HEXaspCWI30F. As enzimas HEXaspCWI30F eP9T/R122G mostraram a maior estereosseletividade para S-MP (maior doque 98% de S,S-monatina), mesmo quando concentrações de enzima ele-vadas forem utilizadas (maior do que 300 pg/mL). A porcentagem de produtode S,S-monatina diminuiu para menos do que 90% nas reações enzimáticascontendo a enzima P9T/T156A em concentração elevada. Os outros mutan-tes mostraram uma estereosseletividade de produto muito similar ao mutanteHEXaspC original (aproximadamente 95% de S,S-monatina). Varredura doproduto da reação contendo a enzima HEXaspC utilizando-se o reagente dederivatização FDAA descrito no Exemplo 1 mostrou que o segundo estereoi-sômero formado é R.S-monatina.
Ensaio de atividade de triptofano e monatina aminotransferase .Os mutantes foram testados quanto à atividade de transamina-ção utilizando-se S,S monatina e L-triptofano como substratos. A atividadede aminotransferase foi avaliada seguindo-se a formação do co-produto dareação, glutamato, por HPLC com OPA-pós-derivatização de coluna comodescrito no Exemplo 1. A mistura reacional continha, em 1,0 mL, 100 mM detampão HEPPS, pH 8,0, 20 mM de alfa-cetoglutarato, 0,08 mM de piridoxalfosfato, 25 mM de triptofano ou S1S monatina, e enzima (fornecida como 2,5mg de proteína de extratos celulares). Todos os componentes exceto a en-zima foram misturados um ao outro, a enzima foi adicionada para iniciar areação e a solução reacional foi incubada a 30?C (agitação suave) durante90 minutos. As reações foram feitas em duplicata, com controles negativosem que nenhuma enzima foi adicionada. A reação foi interrompida pela adi-ção de ácido fórmico a 10% (concentração final), a mistura foi centrifugadaem 21.000 rpm, e o sobrenadante foi cuidadosamente removido e filtrado.Os dados foram corrigidos para níveis de base de glutamato e para a dilui-ção a partir da adição de ácido para precipitar as proteínas, em seguidanormalizados por quantidade de aminotransferase mutante adicionada.Quando triptofano foi utilizado como um substrato, HEXaspC produziu 13,0mM de glutamato por mg de aminotransferase por hora. A atividade relativa,expressa como uma porcentagem, dos mutantes é como segue: HE-XaspCWI 30F (156%), -HEXaspCH 56A (151%), HEXaspCP9T/T156A(63,7%), HEXaspCP9T/R122G (116%), e HEXaspCRI 22G/T156A (107%).Quando S,S monatina foi utilizada como um substrato, HEXaspC produziu7,43 mM de glutamato por mg de aminotransferase por hora. A atividaderelativa, expressa como uma porcentagem, dos mutantes é como segue:HEXaspCWI 30F (113%), HEXaspCTI 56A (87,7%), HEXaspCP9T/T156A(67,3%), HEXaspCP9T/R122G (11-2%), eHEXaspCRI 22G/T156A (114%).
O mutante HEXaspCP9T/R122G teve atividade aumentada paraconversão de triptofano em indol-3-piruvato, porém atividade diminuída paratransaminação de S1S monatina. A taxa de triptofano para atividade de mo-natina foi 18,2 em comparação a 1,75 para HEXaspC, tornando-o um candi-dato desejável para produção de R,R monatina utilizando-se séries de rea-ção que requerem uma L-aminotransferase tais como aquelas descritas nosExemplos 18 e 19. Como tal, o HEXaspCP9T/R122G é um exemplo de umaaminotransferase com atividade limitada sobre S1S monatina (e MP).
A maioria das mutações melhorou a atividade de L-triptofano,porém apenas dois mutantes aumentaram a atividade com respeito tanto aL-triptofano quanto S1S monatina (HEXaspCW130F e HEXasp-CR122G/T156A). Porque 25 mM de substrato foram utilizados nestes ensai-os, as enzimas foram provavelmente mais saturadas e a atividade é umareflexão da kcat das enzimas. Entretanto, sob as condições em que os ensai-os para produção de monatina S,S foram realizados (acima) é improvávelque a concentração de S-MP é suficiente para saturar a enzima, desse mo-do o aumento em kcat não é refletido. Foi relatado, para substratos similares,que algumas das mutações feitas aumentam a kcat porém também aumen-tam a Km aparente para o substrato de aminoácido. Se concentrações cres-centes de substratos forem utilizadas, é esperado que estes dois mutantesforneçam um benefício em taxas de produção de S,S monatina em compa-ração a HEXaspC. A mutação HEXaspCT156A parece ter taxas de transa-minação de triptofano aumentadas sem ter um efeito significante sobre ataxa de transaminação de MP sob as condições acima para produção de S,Smonatina.
Por comparação das estruturas de HEXaspC e uma das enzi-mas D-aminotransferase de Bacillus sp. (vide, por exemplo, S. Sugio, G.A.Petsko, J.M. Manning, K. Soda, e D. Ringe, Biochemistry 34 (1995) páginas9661-9669), as mutações W130F, R122G, T156A, e HEX de AspC podemser mapeadas quanto aos resíduos correspondentes na estrutura de D-aminotransferase. É esperado que mutações similares na D-aminotransferase de ampla especificidade melhorem a produção total deR1R monatina como descrito no Exemplo 14. Por exemplo, a funcionalidadefornecida por triptofano 130 em AspC é substituída nas D-aminotransferasesde Bacillus por ligação de hidrogênio entre as cadeias laterais de serinas179 - 181 e glutamato 166 (esquema de numeração YM-1). Para reduzir obloqueio estérico, o glutamato pode ser mutado para um resíduo de asparta-to. Algumas D-aminotransferases têm um resíduo de treonina na posição179, que aumenta o bloqueio estérico e devem ser evitadas. A enzima de B.sphearicus tem uma alanina no lugar de serina na posição 181, que podetambém reduzir o bloqueio estérico.
Informação adicional de estudos de aspartato aminotransferasepode ser aplicada à D-aminotransferase também. Ao mesmo tempo que aenzima AspC tem uma arginina no sítio ativo que interage com a cadeia late-ral de substratos de dicarboxilato, a D-aminotransferase tem uma alça deSer240 a Ser243. As cadeias laterais de Ser240, Thr242, e Ser243 voltam-se para a mesma direção e formam uma cavidade com o grupo hidroxila deSerl 80 que fornece uma superfície para substratos tanto não polares quantopolares poderem interagir. Serl 80 está envolvida na ligação de PLP; entre-tanto, para melhorar a atividade de uma D-aminotransferase com R-MP1 al-guém pode modificar os resíduos de Ser240, Thr242, ou Ser243 para aceitarsubstratos maiores ou favorecer substratos negativamente carregados. Porexemplo, Thr242 pode ser mutado para Ser para reduzir o comprimento dacadeia lateral. Um dos resíduos pode ser mutado para Iisina ou arginina, talcomo Ser243. Os resíduos (numeração YM-1) Va130-Va136 são localizadosem um filamento beta através do sítio ativo da D-aminotransferase, e sãotambém importantes para atividade. Tyr31, Val33, Glu32, e Lys35 são'su-postos voltar-se ao sítio ativo. Tyr31, Glu32, e Val33 são invariantes em to-dos os homólogos de Bacillus. Ro e outros (FEBS Lett 398 (1996) páginas141 - 145) mutagenizaram Val33 para Ala e encontraram uma eficiência ca-talítica ligeiramente aumentada para transaminação de alfa-cetoglutarato euma eficiência cataiítica significantemente melhorada para substratos maisvolumosos (menos bloqueio estérico). Em alguns homólogos, Lys35 é subs-tituído com Arg, porém se o bloqueio estérico é um interesse, o resíduo deLys é preferível. Valinas 34 e 36 são também preferíveis sobre substituiçõesconservativas tal como isoleucina, novamente devido a bloqueio menos es-térico para moléculas grandes tal como MP.
Exemplo 17Clonagem, Expressão, e Testagem de Glutamato e Aspartato Racema-ses
Este exemplo descreve métodos utilizados para clonar e testarenzimas aminoácido racemase, que podem ser utilizados para interconver-são entre L-glutamato e D-glutamato (ou L- e D-aspartato ou L- e D-alanina).Glutamato, aspartato, ou alanina racemases são úteis em uma série de rea-ção biossintética para produzir R1R monatina quando uma etapa naquelasérie de reação produz um L-aminoácido (tal como L-glutamato, L-aspartato,ou L-alanina) e outra etapa na série de reação consome um D-aminoácido(tal como D-glutamato, D-aspartato, ou D- alanina). A Figura 4 ilustra umasérie de reação biossintética para produção de R1R monatina de L-triptofanoutilizando-se uma aminotransferase específica de L-triptofano, uma aldolaseR-específica, uma D-aminotransferase e uma glutamato (ou aspartato oualanina) racemase.
Genes foram clonados nos vetores pET28 e pET30 para gerartanto proteínas não-rotuladas quanto proteínas de fusão com HIS6-Tag/T7-Tags N-terminal clivável. As proteínas resultantes foram purificadas utilizan-do-se cromatografia de afinidade de metal imobilizado.
Avaliação Experimental
Genes que codificam glutamato racemases (EC 5.1.1.3) de Lactobacil-Ius brevis
(Acessão Genbank N9 D29627, seqüência de ácido nucleico), ePediococcus pentosaeeus (gene murf) (Acessão Genbank Ne L22789) foramclonados e expressos em E. eoli. Os extratos foram testados para a ativida-de na conversão de L-glutamato em D-glutamato e D- glutamato em L-glutamato. Enzima aspartato racemase BioCataIica (EC 5.1.1.13) (BioCataIy-tics, Pasadena, CA) foi também testada para interconversão entre L- e D-aspartato.
Isolamento de DNA Genômico para Clonagem
DNA genômico de L. brevis (ATCC 8287D) foi obtido da Ameri-can Type Culture Collection. P. pentosaeeus (ATCC 25745) foi cultivado a37°C em caldo de lactobaeilli MRS e 2 ml foram utilizados para isolamentodo DNA genômico utilizando-se o método de Mekalanos JJ. Duplication andamplification of toxin genes in Vibrio cholerae. Cell. 1983, 35:253-63.
Protoloco de Reação em Cadeia de Polimerase
Iniciadores foram designados com sítios de restrição 5' e proje-ções para clonagem nos vetores pET 28 e pET30 (Novagen, Madison, Wl).
Iniciadores de glutamato racemase de L brevis:
Termo N: 5'-GCGGCGCCATGGAAAATGATCCGATTGGTCTAATG -3' (SEQID NO: 401), e
Termo c: Si-Gcggcggtcgacgcaattacaattgtgtttgtc-S1 (seq idNO: 402).
Iniciadores de glutamato racemase de P. pentosaceus:Termo N: 5'- GCGGCGCCATGGATGTATGTATAATTTTATTTAG -3' (SEQID NO: 403), e
Termo C: Õ^GCGGCGGTCGACAAATTTCATTATTCATTCTAATTT -3' (SEQID NO: 404).
O gene derivado de L brevis foi amplificado utilizando-se o se-guinte protocolo de PCR. Em uma reação de 50 pl_, 0,150 pg de padrão, 1,6μΜ de cada iniciador, 0,4 mM de cada dNTP, 2,8 U de Polimerase ExpandHigh Fidelity™ (Roche, Indianapolis, IN), 0,5 U de Pfu polimerase (Stratage-ne, La Joila, CA) e tampão 1X Expand™ com Mg foram utilizados. O pro-grama termociclizador utilizado incluiu um início térmico a 96SC durante 3minutos, 8 repetições das seguintes etapas: 94°C durante 30 segundos,52°C durante 45 segundos, e 72°C durante 2 minutos, seguidas por 22 repe-tições das seguintes etapas: 94°C durante 30 segundos, 609C durante 45segundos, e 72°C durantes 2 minutos. Após as 22 repetições a amostra foimantida a 72°C durante 7 minutos e em seguida armazenada a 4°C. Esteprotocolo de PCR produziu um produto de -830 bp, como julgado por com-paração aos marcadores de tamanho de DNA.
O gene derivado de P. pentosaceus foi amplificado utilizando-seo seguinte protocolo de PCR. Em uma reação de 50 pl_, 0,15 pg de padrão,1,6 μΜ de cada iniciador, 0,4 mM de cada dNTP, 2,8 U de Polimerase Ex-pand High Fidelity™, 0,5 U de Pfu polimerase e tampão 1X Expand™ comMg foram adicionados. O programa termociciizador utilizado incluiu um iníciotérmico a 96°C durante 3 minutos, seguido por 8 repetições das seguintesetapas: 94°C durante 30 segundos, 37°C durante 45 segundos, e 72°C du-rante 2 minutos, seguidas por 8 repetições das seguintes etapas: 94°C du-rante 30 segundos, 45°C durante 45 segundos, e 72°C durantes 2 minutos,seguidas por 14 repetições das seguintes etapas: 94°C durante 30 segun-dos, 55°C durante 45 segundos, e 72°C durante 2 minutos. Após as 14 repe-tições a amostra foi mantida a 72°C durante 7 minutos e em seguida arma-zenada a 4°C. Este protocolo de PCR produziu um produto de -840 bp, co-mo julgado por comparação aos marcadores de tamanho de DNA.
Clonagem
Os produtos de PCR foram purificados por gel de géis de TAE-agarose a 0,8% utilizando-se o kit de extração de gel Qiagen (Qiagen, Va-lencia, CA). Os produtos de PCR foram quantificados utilizando-se um es-pectrofotômetro SmartSpec 3000™. Os produtos foram digeridos com enzi-mas de restrição Ncol e Sall seguindo os protocolos recomendados do fabri-cante (New England Biolabs, Beverly, MA) e gel purificado de géis de TAE-agarose a 0,8% utilizando-se o kit de extração de gel Qiagen (Qiagen, Va-lencia, CA). Vetores pET28 e pET30 foram preparados por digestão comenzimas de restrição Ncol e Sall seguida por tratamento com fosfatase alca-Iina de camarão e purificação de géis de TAE-agarose a 0,8% utilizando-se okit de extração de gel Qiagen (Qiagen, Valencia, CA).
As inserções e vetores digeridos foram ligados utilizando-se o kitde Ligação de DNA Rapid ™ (Roche, Indianapolis, IN). Aproximadamente 50ng de inserção tratada, 100 ng devetor tratado (relação molar de 3 para 1 deinserção para vetor), 5 U de T4 DNA ligase, e tampão de ligação 1X foramincubados durante 5 minutos em temperatura ambiente. As reações de liga-ção foram purificadas utilizando-se o kit de Purificação de Produto de PCRHigh Pure (Roche, Indianapolis, IN) e utilizadas para transformar células ele-trocompetentes DH10B de E. coli (Invitrogen, Carlsbad, CA). Dez μΙ de cadareação de ligação foram adicionados a 40 μΙ de células DH10B e foramtransformados por eletroporação utilizando-se o Bio-Rad Gene Pulser Il (Bio-Rad, Hercules, CA) sob as seguintes condições: 2,5 kV, 25 pF, 200 ohm emuma cubeta de 0,2 cm. As células foram deixadas recuperar em 1 mL deSOC em temperatura ambiente durante 1 hora a 37°C com agitação em 225rpm. As células foram semeadas em placas LB contendo canamicina (50pg/mL).
DNA plasmídeo foi purificado dos transformantes resultantesutilizando-se o kit Qiagen spin miniprep (Qiagen, Valencia, CA) e avaliadoquanto às inserções corretas por digestão de restrição com Ncol e Sall. Asseqüências de plasmídeos parecendo ter a inserção correta foram verifica-das por seqüenciamento de DNA de terminação de cadeia didesóxi.Ensaios e Expressão de Gene
DNA plasmídeo, verificado por varredura de seqüência, foi sub-clonado em hospedeiro de expressão de E. coli BL21 (DE3) (Novagen, Madi-son, WT). As culturas foram cultivadas. Os plasmídeos foram isolados utili-zando-se um kit Qiagen miniprep (Qiagen, Valencia, CA) e analisados pordigestão de restrição para confirmar identidade.
Indução em BL21(DE3) foi inicialmente realizada com glutamatoracemases de L. brevis e P. pentosaceus igualmente nos vetores pET28(não-rotulado) e pET 30 (rotulado por histidina). Um estudo ao decorrer dotempo foi realizado com culturas cultivadas em 250 mL de LB contendo ca-namicina (50 mg/L) em um OD6oo de 0,5 - 0,6, induzidas com 100 mM deIPTG (tiogalacatosídeo de isopropil) e amostradas em 0 e 3 horas após aindução. As células de 600 pL (0 hora) e 275 pL (3 horas) foram ressuspen-sas em 40 pL de tampão de sulfato de dodecila de sódio contendo 2-mercaptoetanol, aquecidas a 95°C durante 10 minutos, e resfriadas. Alíquo-tas destas amostras de proteína celular total foram analisadas por SDS-PAGE utilizando-se um gel de gradiente de 4-15%.
Extratos celulares foram também preparados das culturas de 3horas por suspensão de péletes celulares de 5 mL de cultura em 0,625 mLde reagente Novagen BugBuster™ (Novagen, Madison1 Wl) contendo 0,625pL de benzonase nuclease e 3 pL de coquetel inibidor de protease série #3(Calbiochem-Novabiochem Corp., San Diego, CA) em temperatura ambientedurante 20 minutos com agitação suave, e centrifugando em 16.000 χ g pararemover detritos celulares. Os sobrenadantes (extratos celulares) foram car-regados sobre géis de gradiente de 4-15% para varredura das proteínas ce-lulares solúveis.
As amostras de 3 horas de glutamato racemase de L. brevis eglutamato racemase de P. pentosaceus clonadas mostraram tanto proteínatotal quanto solúvel que correspondeu ao tamanho correto (aproximadamen-te 31 kDa). O produto de gene pET30 de L brevis (rotulado por histidina) foisuperexpresso em um nível mais elevado do que, e foi também mais solúvel(> 20% de proteína solúvel) do que o produto de gene pET 28 de L. brevis(não-rotulado), também como os produtos de gene de P. pentosaceus emambos os vetores. O produto de gene de P. pentosaceus mostrou superex-pressão igual e solubilidade nos vetores pET28 e pET30, que foi significan-temente menor do que aquela observada para o produto de gene pET30 deL. brevis.
Células das culturas induzidas (250 mL) foram centrifugadas elavadas uma vez com NaCI a 0,85 %. Péletes celulares foram ressuspensosem 5 ml_/g de peso celular úmido de reagente BugBuster™ (Novagen, Madi-son, Wl) contendo 5 pL/mL de coquetel inibidor de protease série #3 (Calbi-ochem-Novabiochem Corp., San Diego, CA) e 1 pL/mL de benzonase nucle-ase. As amostras foram incubadas em temperatura ambiente durante 20 mi-nutos em um agitador orbital. Detritos celulares insolúveis foram removidospor centrifugação em 16.000 X g durante 20 minutos a 4°C.
Extratos celulares foram ensaiados para atividade de glutamatoracemase utilizando-se o seguinte protocolo. 400-μΙ_ de reações foram reali-zadas em 10 mM de fosfato de potássio (pH 8,0), 0,2 mM de DTT, e 10 mMde L-glutamato ou D-glutamato. As reações foram iniciadas pela adição de20-100 pl_ de extratos livres de célula e foram incubadas em temperaturaambiente. Alíquotas de amostra foram calculadas durante um curso de tem-po de 1 minuto, 5 minutos, 10 minutos, 20 minutos e 1 hora (amostras dominuto zero serviram como reações de controle). 2 M de ácido fórmico (25pl_) foram adicionados a cada 40-pL de alíquota de amostra para interrompera reação e a proteína precipitada foi removida por centrifugação. Sobrena-dantes foram removidos e congelados a - 80°C até eles serem analisadospor LC/MS/MS.
Resultados de ensaio de extratos celulares de indução de pET30com 100 mM de IPTG (3 horas) demonstraram que as enzimas de L. brevis(Acessão Genbank N- BAA06106.1 Gl:468450) e P. pentosaceus (AcessãoGenbank N9 AAA16761.1 GL349029) têm níveis significantes de atividadede racemase sobre ambos os isômeros de glutamato. A racemase de Ppentosaceus (20 μΙ_ de extratos celulares) alcançou equilíbrio entre L- e D-glutamato em 10-20 minutos iniciando com qualquer substrato. A enzima deL. brevis (20 pl_ de extratos celulares) também alcançou equilíbrio em apro-ximadamente 20 minutos.
Uma enzima aspartato racemase parcialmente purificada (catá-logo # ASPR-101) adquirida de BioCataIytics, Inc. (Pasadena, CA) foi ensai-ada para atividade sobre L-aspartato e D-aspartato utilizando-se um protoco-lo similar àquele acima. A enzima comercial mostrou atividade de racemasesobre ambos os isômeros. Utilizando-se 0,5-1 mg de enzima, o equilíbrio foiobtido em 20-60 minutos.
Todas as três racemases (glutamato racemase de L. brevis, glu-tamato racemase de P pentosaceus e aspartato racemase de BioCataIytics)foram também ensaiadas para atividade sobre S,S monatina utilizando-se oseguinte protocolo. 400 μL de reações foram realizadas em 10 mM de fosfa-to de potássio (pH 8,0), 0,2 mM de DTT, e 10 mM de S1S monatina. As rea-ções foram iniciadas pela adição de extratos livres de célula (L brevis e P.pentosaceus) ou enzima purificada (BioCataiytics aspartato racemase) e fo-ram incubadas em temperatura ambiente. Alíquotas de amostra foram calcu-ladas durante um curso de tempo de 1 minuto, 5 minutos, 10 minutos, 20minutos e 1 hora (amostras do minuto zero serviram como reações de con-trole bem como amostras sem enzima). 2 M de ácido fórmico (25 pL) foramadicionados a cada 40 pl_ de alíquota de amostra para interromper a reaçãoe a proteína precipitada foi removida por centrifugação. Sobrenadantes fo-ram removidos e congelados a - 80°C até eles serem analisados porLC/MS/MS (Exemplo 1). Nenhum decréscimo na concentração de S,S mo-natina foi observado durante o tempo, nem existiu qualquer aumento em S1Rmonatina (presente inicialmente como <5% de subproduto de contaminação,mesmo no controle sem enzima). Portanto, nenhuma das racemases ensai-adas mostrou atividade com respeito à monatina.
Exemplo 18
Produção de R,R Monatina de L-triptofano Utilizando-se Glutamato ouAspartato
Racemases
Este exemplo descreve métodos de produção de R1R monatinaestereoisomericamente enriquecida de L-triptofano utilizando-se uma L-triptofano (L-tirosina, ou aromática) aminotransferase, ProA aldolase, gluta-mato ou aspartato racemase, e uma D-aminoácido aminotransferase de am-pla especificidade. A Figura 5 é um diagrama que ilustra a série de reação.Este método para produção de R1R monatina estereoisomericamente enri-quecida requer uma enzima para a etapa 1 que tenha baixa atividade naprodução de monatina a partir de precursor de monatina (MP). Com basenos resultados anteriores, utilizaram os produtos de gene Sinorhizobium me-liloti e Rhodobacter sphaeroides tatA descritos no Exempto 1 de WO03/091396 A2.
Materiais e Métodos
Glutamato racemases de L. brevis e P. pentosaceus foram pro-duzidas em E. coli como descrito no Exemplo 17. Em alguns casos a versãorotulada por HiS6 destas enzimas foi purificada utilizando-se cartuchos His-Bind 900 de acordo com os protocolos do fabricante (Novagen, Madison, Wl)e foi dessalinizada para remover imidazol utilizando-se colunas PD-10 (G25Sephadex, GE Healthcare, Piscataway, NJ). As enzimas foram eluídas em25 mM de fosfato de potássio pH 8,0, aspartato racemase (ASPR-101) e D-aminotransferase (AT-103) foram adquiridas de BioCataIytics, Inc. (Pasade-na, CA). Tirosina (aromática) aminotransferases de S. melilotie R. sphaeroi-des foram preparadas como descrito no Exemplo 1 de WO 03/091396 A2.ProA aldolase de Comamonas testosteroni foi preparada como descrito noExemplo 4 de WO 03/091396 A2. Ensaios de proteína total foram feitos utili-zando o Ensaio de Proteína Bio-Rad de acordo com os protocolos do fabri-cante (Hercules, CA).
Redução na quantidade de S,S monatina produzida utilizando-se racemases
Misturas reacionais (1 mL de volume, conduzidas em duplicata)continham 100 mM de tampão de fosfato de potássio (pH 8), 2 mM de Mg-Cl2, 0,05 mM de 5'-fosfato piridoxal (PLP), 200 mM de piruvato de sódio, 5mM de α-cetoglutarato de sódio ou oxaloacetato, aproximadamente 280pg/mL de S. meliloti TatA fornecidos em um extrato celular, 1 mg/mL de Bi-Catalytics D-aminotransferase (AT- 103) (BioCatalytics, Pasadena, CA),100 pL/mL de extrato celular de glutamato racemase ou 1 mg/mL de aspar-tato racemase, e aproximadamente 100 pg/mL de ProA aldolase fornecidacomo um extrato celular. Triptofano sólido foi adicionado em uma concentra-ção de 10,2 mg/ml. Controles negativos não continham racemase. As amos-tras foram incubadas a 30°C (agitação em 250 rpm) durante 1 hora, 2 horas,ou durante a noite. As amostras foram centrifugadas para remover o precipi-tado, filtradas por seringa, e armazenadas a -80 0C antes da varredura paramonatina utilizando-se o método LC/MS/MS descrito no Exemplo 1. A maio-ria das amostras continha >95% de S,S monatina, devido às quantidades deL-aminotransferase nativa presentes nos extratos celulares. Entretanto, asamostras que continham racemase tiveram uma quantidade reduzida demonatina total como um resultado das enzimas racemase tornando-se L-glutamato menos disponível para transaminação de MP. Sem racemase,1545-2355 ppm de monatina (predominantemente S,S) foi produzido duranteo curso de tempo. Com as racemases presentes, apenas 340-879 ppm (en-zima de L. brevis), 444-531 ppm (enzima de P. pentosaceus), e 506-1460ppm de monatina (aspartato racemase) foram produzidos. Estes dados indi-cam que as racemases são ativas nas condições reacionais requeridas paraproduzir monatina. Para minimizar a formação de S,S monatina de enzimasde extrato celular tais como aspartato aminotransferases, outros experimen-tos foram feitos com enzimas purificadas e uma relação maior de enzimas D-aminotransferase para L-aminotransferase.
Conversão de L-triptofano para 4-R contendo isômeros de Monatina
Os experimentos acima foram repetidos utilizando-se aproxima-damente 54 pg de L-aminotransferase purificada (S. meliloti ou R. sphaeroi-des TatA), 1 mg de aspartato aminotransferase (BioCatalytics, Pasadena,CA), 1 mg de D-aminotransferase, oxaloacetato como o aceptor de amino, e75 pg de aldolase purificada. As reações foram conduzidas em duplicatacom um tempo de amostragem de 2 horas e um tempo de incubação duran-te a noite. Controles negativos foram feitos com L-aminotransferase de S.meliloti porém nenhuma racemase. Além da quantificação de pico deR,R/S,S e S,R/R,S monatina baseada em cromatografia de fase reversa, aporcentagem de cada estereoisômero foi determinada utilizando-se a técnicade derivatização FDAA descrita no Exemplo 1. Os resultados são como segue:
Tabela 22
<table>table see original document page 381</column></row><table>
Claramente a presença da racemase aumentou a quantidadetotal de monatina produzida quando S. meliloti TatA foi utilizada como a en-zima para transaminação de L-triptofano. Níveis de monatina aumentaramde uma média de 6,4 para 16,5 ppm no ensaio de duas horas, e de 41-73ppm no ensaio durante a noite. Adicionalmente, o percentual de R1R forma-da aumentou de cerca de 1% até tanto quanto 58% utilizando-se a enzimaracemase. OS1R estereoisômero de monatina, outro adoçante potente, foi ooutro componente principal, aumentando de quase O nos controles negativospara 31%. A R. sphaeroides TatA claramente teve mais atividade sobre S-MP depois da L-transaminase de S. meliloti, demonstrando a importância deter uma enzima que tem uma especificidade de substrato elevada para L-triptofano quando comparada a MP quando 4-R isômeros de monatina sãoos produtos desejados. Com cerca de 10% da monatina total sendo 4S noponto do tempo de duas horas, a S. meliloti TatA pode ser considerada co-mo tendo atividade limitada sobre MP.
Os experimentos foram repetidos com a S. meliloti TatA purifica-da (54 pg) e a glutamato racemase de L brevis. Quando a glutamato race-mase purificada foi utilizada, aproximadamente 64 pg foram utilizados por 1ml_ de reação. Extratos celulares contendo a glutamato racemase foramtambém testados, e 1,4 mg de proteína solúvel foi utilizada. Um controle ne-gativo sem racemase foi utilizado novamente, e todas as amostras foramconduzidas em duplicata. Os resultados são como segue:
Tabela 23
<table>table see original document page 382</column></row><table><table>table see original document page 383</column></row><table>
Novamente, é evidente que a adição da racemase aumenta amonatina total produzida de L-triptofano, da mesma forma que o aumentodas quantidades relativas de isômeros contendo 4R de monatina quandocomparadas a S,S monatina. O uso de aldolase purificada, racemase, e L-aminotransferase grandemente melhora a capacidade de controlar a forma-ção de estereoisômero desejado. A relação de L para D aminotransferase étambém uma maneira de manipular a estereoquímica do produto final.
Quando compara-se resultados mostrados nas Tabelas 18 e 19no Exemplo 13 com resultados com condições reacionais similares às condi-ções acima, alguém pode observar que aproximadamente 7-29 ppm de mo-natina foram formados de indol-3-piruvato e as porcentagens de R1R mona-tina formadas foram aproximadamente 51-90%. Utilizando-se a aspartatoracemase aumentou-se a quantidade total de monatina produzida para 16-78 ppm de monatina com % R,R de aproximadamente 40-58%. Adicional-mente, um material bruto mais estável e menos dispendioso, L-triptofano, foiutilizado. No Exemplo 14, aproximadamente 73 ppm de monatina foram pro-duzidos de D- triptofano em uma relação de R,R:S,R de aproximadamente1,7:1. A quantidade total de 4R isômeros foi > 80% da monatina total. Por-que tanto R,R-monatina quanto S,R-monatina são adoçantes potentes (>1000 vezes mais doces do que sacarose) a capacidade de enriquecer des-tes isômeros sem a necessidade de substratos de D-aminoácido dispendio-so é crucial.
Como descrito nos Exemplos 13 e 14, D-alanina pode servir co-mo o doador de amino para transaminação de MP para monatina. Muitas L-aminotransferases têm a capacidade de utilizar piruvato como um aceptor deamino em alguma extensão, e produzir L-alanina. Porque as reações men-cionadas acima utilizam altas concentrações de piruvato, é provável que umpouco do piruvato seja convertido em L-alanina. Por exemplo, durante tran-saminação de L-triptofano, a enzima HEXaspC descrita no Exemplo 16 foidescoberta converter 10-18% de piruvato (50-200 mM de concentrações ini-ciais) em L-alanina em 2 horas se alfa-cetoglutarato estiver ausente. A en-zima mostrou uma preferência de 10 vezes para alfa-cetoglutarato quantoambos os aceptores de amino estavam presentes em altas concentrações (>50 mM). AspC (descrito em WO 03/091396 A2) também produziu alguma L-alanina a partir de piruvato. Portanto, é esperado que alguém possa omitir aadição de alfa-cetoglutarato ou oxaloacetato nas reações acima, e utilizaruma alanina racemase (EC 5.1.1.1) no lugar de glutamato ou aspartato ra-cemase. Enzimas alanina racemases foram primeiro identificadas em Brueel-Ia abortus e Streptococcus faecalis (Marr, A.G. e Wilson, P.W. Arch. Bio-chem. Biophys., 49 (1954) 424-433 e Wood, W. A. e Gunsalus, LC. J. Biol.Chem., 190 (1951) 403-416). O gene dacB em Salmoriella typhimuríum foiidentificado como a fonte de atividade de alanina racemase, e diversas cen-tenas de homólogos podem ser encontradas nas bases de dados genômi-cas. Outras fontes conhecidas de atividade de alanina racemase são Esehe-riehia eoli, Bacillus subtilis, Pseudomonas aeruginosa, Vibrio eholerae, Sehi-zosaeearoyees pombe, e Bacillus eereus. Um cogumelo basidiomicetoso,Lentinus edodes, também contém uma ampla atividade de alanina racema-se. Um homólogo termoestável de Bacillus stearothermophilus é disponibili-zado pela aquisição de Sigma-Aldrich (catálogo # A8936) (Sigma-AIdrich, St.Louis, MO) e foi imobilizado pelos pedidos comerciais (lnagaki, K., Bioche-mistry, 25: 3268, 1986). Uma alanina racemase é convertida em uma gluta-mato ou aspartato racemase por métodos aleatórios tais como PCR muta-gênica, passagem através de cepas mutagênicas, ou outros métodos co-nhecidos por aqueles versados na técnica. Uma evolução mais focada daalanina racemase é focada em resíduos de sítio ativo, incluindo Lysl29, Me-tl34, e os resíduos incluindo e entre Gly283 e Trp288 (numeração de Bacillusstearothermophilus).
Exemplo 19
D-fenilglicina aminotransferase (D-4-hidroxifenilglicina aminotransfera-se)
Como mostrado na Figura 3, D-fenilglicina aminotransferase éútil em uma série de reação biossintética para a produção de monatina. Porexemplo, D-fenilglicina aminotransferase produz R1R monatina de R-MP comL-glutamato como o doador de amino.
Síntese por PCR de 4 D-hidroxifenilglicina aminotransferase de P. stut-zeri de iniciadores de oligonucleotídeo.
Este exemplo descreve métodos que foram utilizados para sinte-tizar 4 D-hidroxifenilglicina aminotransferase, uma enzima de estereoinver-são que pode ser utilizada para converter precursor de R monatina em R,Rmonatina utilizando-se L-glutamato como o doador de amino.Projeto de Iniciador
A seqüência publicada (Acessão Genbank Ne AY319935, se-qüência de ácido nucléico; Acessão Genbank Ne AAQ8290, seqüência deproteína) para 4 D-hidroxifenilglicina aminotransferase (4 D-HPG AT) dePseudomonas stutzeri foi utilizada como um padrão para projeto de iniciadorde PCR. Alternativamente, a 4-D-hidroxifenilglicina aminotransferase dePseudomonas putida, (CAD42450 (proteína), AX467211 (nucleotídeo)) éutilizada como um padrão de seqüência. Um total de 34 iniciadores diantei-ros e 35 iniciadores inversos foi designado; iniciadores dianteiros e inversos- foram 40-mers compartilhando 20 pares de base em sobreposição. Alémdisso, 2 iniciadores externos foram designados com sítios de restrição 5' eprotuberâncias para clonagem nos vetores pET 28 e pET30 (Novagen, Ma-dison, Wl).
Iniciadores externos de 4 D-HPG AT de P. stutzerr. termo N(com sítio Ndel):
5'-GGCCGGCATATGTCGATCCTTAACGACTACAAACGT -3' (SEQ IDN0:405), e termo C (com sítio Xho\)\ 5'-GGAAGGCTCGAGTCATGATTGGTTTCCAGACAAATT -3' (SEQ IDN0:406).
Protocolo de Reação em Cadeia de Polimerase
A seqüência genética de P. stutzeri foi amplificada utilizando-seos seguintes protocolos. A reação PCR de 100 μΐ_ primária incluiu 0,05 μΜde cada dos 69 iniciadores internos, 0,4 mM de cada dNTP, 10 U de rTthPolimerase XL (Roche, Indianapolis, IN), 0,625 U de Pfu polimerase (Strata-gene, La Jolla, CA), 1X XL de tampão e 1 mM de Mg(OAc)2. O programatermociclizador utilizado incluiu um início quente a 94°C durante 3 minutos,15 repetições das seguintes etapas: 94°C durante 30 segundos, 42°C duran-te 30 segundos, e 68°C durante 15 segundos, seguidas por 10 repetiçõesdas seguintes etapas: 94°C durante 30 segundos, 52°C durante 30 segun-dos, e 68°C durante 30 segundos, seguidas por 10 repetições das seguintesetapas: 94°C durante 30 segundos, 60°C durante 30 segundos, e 68°C du-rante 1 minuto e 15 segundos. Após os 10 ciclos finais a amostra foi mantidaa 68°C durante 7 minutos e em seguida armazenada a 4°C. Este protocolode PCR produziu uma mancha de produto em -0,5 kb sobre um gel de aga-rose - TAE a 0,8%.
A reação PCR secundária foi realizada utilizando-se a reaçãoPCR primária como padrão. A reação PCR de 100 μί secundária incluiu 2,5pL da reação PCR primária, 0,5 μΜ de cada dos 2 iniciadores externos (comsítios de restrição Ndele Xhol), 0,4 mM de cada dNTP, 10 U de rTth Polime-rase XL, 0,625 U de Pfu polimerase, 1X XL de tampão e 1 mM de Mg(OAc)2.O programa termociclizador utilizado incluiu um início quente a 94°C durante3 minutos, 10 repetições das seguintes etapas: 94°C durante 30 segundos,52°C durante 30 segundos, e 68°C durante 1 minuto e 30 segundos, segui-das por 15 repetições das seguintes etapas: 94°C durante 30 segundos,60°C durante 30 segundos, e 68°C durante 1 minuto e 30 segundos. Apósas 15 repetições, a amostra foi mantida a 68°C durante 7 minutos e em se-guida armazenada a 4°C. Este protocolo de PCR produziu uma banda deproduto distintiva em ~1,4 kb sobre um gel de agarose - TAE a 0,8%.
O produto de PCR foi gel purificado de gel de agarose - TAE a0,8% utilizando-se o kit de extração de gel Qiagen (Qiagen, Valencia, CA). Oproduto foi TOPO clonado e transformado em células TOP 10 de acordocom o protocolo do fabricante (Invitrogen, Carlsbad, CA). DNA plasmídeo foipurificado a partir dos transformantes resultantes utilizando-se o Qiagen spinminiprep kit (Qiagen, Valencia, CA) e avaliado quanto às inserções corretaspor digestão de restrição com Ndel e Xhol. As seqüências de plasmídeosque parecem ter a inserção correta foram verificadas por sequenciamento deDNA de terminação de cadeia didesóxi com iniciadores inversos M13 e dian-teiros M13 universais. Dos 10 clones seqüenciados, todos tiveram pelo me-nos uma mutação da seqüência desejada. O melhor clone teve uma muta-ção de par de base única que resultou em uma mudança de aminoácido. Aseqüência deste clone foi corrigida utilizando-se o protocolo de MutagêneseQuickChange de acordo com recomendações do fabricante (Stratagene, LaJolla, CA).
O clone TOPO corrigido foi digerido com enzimas de restriçãoNdel e Xhol seguindo os protocolos recomendados do fabricante (New En-gland Biolabs, Beverly, MA) e gel purificado de géis de agarose - TAE a0,8% utilizando-se o kit de extração de gel Qiagen (Qiagen, Valencia, CA).
Os vetores pET 28 e pET 30 foram preparados por digestão com enzimas derestrição Ndel e Xhol seguida por tratamento com fosfatase alcalina de ca-marão e purificação de géis de agarose - TAE a 0,8% utilizando-se o kit deextração de gel Qiagen (Qiagen, Valencia, CA).
[0796] Os vetores e inserção digeridos foram ligados utilizando-se o NEBQuick Ligation Kit (Beverly, MA). Aproximadamente 50 ng de inserção trata-da, 100 ng de vetor tratado (3 para 1 de relação molar de inserção para ve-tor), 5 U de T4 DNA ligase, e 1X de tampão de ligação foram incubados du-rante 5 minutos em temperatura ambiente. A mistura de ligação foi transfor-mada em células quimicamente competentes TOPIOF1 (Invitrogen, Carlsbad,CA). As células foram deixadas recuperar em 0,25 mL de SOC em tempera-tura ambiente durante 1 hora a 37°C com agitação em 225 rpm. As célulasforam colocadas sobre placas LB contendo canamicina (50 pg/mL). DNAplasmídeo é purificado a partir dos transformantes resultantes utilizando-se oQiagen spin miniprep kit (Qiagen, Valencia, CA) e avaliado quanto às inser-ções corretas por digestão de restrição com Ndel e Xhol.
Expressão de Gene e Ensaios
DNA plasmídeo foi transformado em hospedeiro de expressãode Ε. coli BL21(DE3) (Novagen1 Madison, Wl). As culturas foram cultivadase os plasmídeos foram isolados utilizando-se Qiagen miniprep kit (Qiagen,Valencia, CA), e analisados por digestão de restrição para confirmar a iden-tidade.
Indução em BL21(DE3) é inicialmente realizada com 4 D - HPGde P. stutzeriem ambos os vetores pET 28 (rotulado por histidina) e pET 30(não-rotulado). Um estudo ao decorrer do tempo é realizado com culturascultivadas em 250 mL de LB contendo canamicina (50 mg/L) em um OD6oode 0,5 - 0,6, induzidas com 100 mM de IPTG (tiogalacatosídeo de isopropil)e amostradas em 0 e 3 horas após a indução. Um volume apropriado de cé-lulas de 0 hora e 3 horas é ressuspenso em 40 pL de tampão de sulfato dedodecila de sódio contendo 2-mercaptoetanol e aquecido a 95 0C durante 10minutos, e resfriado. Alíquotas destas amostras de proteína celular total sãoanalisadas por SDS-PAGE utilizando-se um gel de gradiente de 4-15%.
Extratos celulares são também preparados das culturas de 3horas por suspensão de péletes celulares de 5 mL de cultura em 0,625 mLde reagente Novagen BugBuster™ (Novagen, Madison, Wl) contendo 0,625pL de benzonase nuclease e 3 pL de coquetel inibidor de protease série #3(Calbiochem-Novabiochem Corp., San Diego, CA) em temperatura ambientedurante 20 minutos com agitação suave, e centrifugando em 16.000 χ g pararemover detritos celulares. Gs sobrenadantes (extratos celulares) são carre-gados sobre géis de gradiente de 4-15% para varredura das proteínas celu-lares solúveis. Quando requerido, a proteína é purificada utilizando-se cartu-chos His-Bind 900 de acordo com protocolos do fabricante (Novagen, Madi-son, Wl) e é dessalinizada para remover imidazol utilizando-se colunas PD-10 (G25 Sephadex, GE Healthcare, Piscataway1 NJ).Organismos com D-fenilglicina aminotransferase (DPGAT)
Organismos do gênero Pseudomonas e gêneros similares, comuma D- fenilglicina aminotransferase de estereoinversão (também denomi-nada D-4-hidroxifenilglicina aminotransferase) são isolados da seguinte ma-neira. Amostras do solo são incubadas sobre placas Petri com o seguintemeio: (por litro) 15 g de Ágar, 3,4 g de KH2PO4, 3,55 g de Na2HPO4, 0,2 g deMgS04-7H20, 8 mg de CaCI2^H2O1 10 mg de extrato de levedura, 1 ml desolução de elementos de traço de 1000x, 1 g de D-fenilglicina (D-4-hidroxifenilglicina).
Isolados são testados por PCR quanto à presença de uma ami-notransferase de estereoinversão (iniciadores designados de D-fenilglicinaaminotransferases conhecidas) ou são também enriquecidos para a presen-ça de uma aminotransferase de estereoinversão como segue: isolado dasplacas pode ser cultivado em meio líquido como acima menos o ágar a 30°Ccom agitação em um OD6oo de cerca de 1,0. As células são colhidas por cen-trifugação e lavadas duas vezes com 0,85% de NaCI. Uma amostra de 10mg (peso úmido) é suspensa em 1 ml de tampão de fosfato de potássio (pH7,0) e 5 mM de D-fenilglicina (ou D-4-hidroxifenilglicina). 15 mM de ácido(aminoóxi)acético neutralizado são adicionados às amostras em duplicatapreparadas como descrito acima. Consumo de D-fenilglicina (ou D-4-hidroxiglicina) é avaliado por HPLC. Isolados capazes de degradar D-fenilglicina (ou D-4-hidroxifenilglicina), porém fazem isso em uma taxa menorna presença de ácido (aminoóxi)acético são selecionados para outra varre-dura. Isolados são testados, por PCR, quanto à presença de uma amino-transferase de estereoinversão (iniciadores designados de D-fenilglicina a-minotransferases conhecidas).
A presença da aminotransferase de estereoinversão é confirma-da cultivando-se uma cultura em meio líquido como descrito acima, colhen-do-se as células e preparando-se um extrato bruto livre de célula (CFE) etestando-se quanto à atividade da enzima D-fenilglicina aminotransferase(ou D-4- hidroxifenilglicina aminotransferase). CFE é adicionado a uma mis-tura reacional com as seguintes concentrações finais: 0,1 M de CAPS (pH9,5), 60 mM de L- glutamato (sal de sódio), 5 mM de benzoilformiato (ou 4-hidroxibenzoato) e 50 μΜ de PLP. A reação inversa é avaliada por adição deCFE a uma mistura reacional com as seguintes concentrações: 50 mM defosfato de potássio (pH 7,0), 60 mM de D-fenilglicina (ou D-4-hidroxifenilglicina), 5 mM de a-cetoglutarato, 50 μΜ de PLP. Os ensaios sãoincubados a 35°C e alíquotas são calculadas em pontos do tempo e inter-rompidas por borbulhamento durante 2 minutos. O produto será quantificadopelo método de HLPC de Gil-Av, E., Tishbee1 A., Hare1 P.E., Resolution ofunderivatized amino acids by reversed phase chromatography. J. Am. Chem.Soe, 102: 5115-5117 (1980) ou por métodos descritos no Exemplo 1 (avalia-ção de formação de glutamato).
Como uma alternativa para métodos com base em PCR, a D-fenilgiicina aminotransferase de estereoinversão é purificada das bactériasisoladas por técnicas de purificação de proteína convencionais incluindo fra-cionamento de sulfato de amônio, e cromatografia de coluna convencional.Uma vez que a proteína foi purificada para um grau razoável, técnicas demicrosseqüenciamento de peptídeo ou seqüenciamento de aminoácido tipoEdman convencional são utilizados (vide golgi.harvard.edu/microchem/ paradescrições dos protocolos e equipamento utilizados para este tipo de traba-lho). Iniciadores degenerados são designados com base na seqüência dis-ponível da fonte de proteína relativa conhecida mais próxima. Trajetória dogenoma e PCR degenerada é em seguida realizada de acordo com protoco-los estabelecidos para isolar a seqüência de codificação de D-fenilglicinaaminotransferase de estereoinversão.
Produção de DPGAT monatina
D-hidroxifenilglicina aminotransferases, como descrito em (1) e(2) acima, são utilizadas em extratos de proteína livres de célula crus ou pu-rificadas como descrito em (1) acima. Tirosina (aromática) aminotransfera-ses de S. meliloti e R. sphaeroides são preparadas como descrito no Exem-plo. 1 de WO 03/091396 A2. ProA aldolase de Comamonas testosteroni épreparada como descrito no exemplo 4 de WO 03/091396 A2. Ensaios deproteína total são feitos utilizando o Ensaio de Proteína Bio-Rad de acordocom protocolos do fabricante (Hercules, CA).
Misturas reacionais (1 mL de volume, conduzidas em duplicata)contêm 100 mM de tampão de fosfato de potássio (pH 8), 2 mM de MgCI2,0,05 mM de piridoxal 5'-fosfato (PLP), 200 mM de piruvato de sódio, 5 mMde α-cetoglutarato de sódio, aproximadamente 280 pg/mL de TatA de S. me-liloti fornecidos em um extrato celular, 100 μL/mL de extrato celular de D-hidroxifenilglicina aminotransferase ou 1 mg/mL de D-hidroxifenilglicina ami-notransferase purificada, e aproximadamente 100 Mg/mL de Pro A aldolasefornecidos como um extrato celular. Triptofano sólido é adicionado em umaconcentração de 10,2 mg/ml. Controles negativos são estabelecidos sem D-hidroxifenilglicina aminotransferase. Amostras são incubadas em 30°C comagitação suave durante ~1 hora ou durante a noite. Amostras são centrifu-gadas para remover o precipitado, filtradas por seringa, e armazenadas a -80 0C antes da varredura para monatina utilizando-se o método LC/MS/MSdescrito no Exemplo 1.
D-hidroxifenilglicina aminotransferases com atividade melhoradapara produção de monatina são feitas por técnicas de mutagênese conheci-das por aqueles versados na técnica, incluindo: PCR mutagênica, passagematravés de cepas mutagênicas, ou mutagênese direcionada ao sítio. As D-hidroxifenilglicina aminotransferases melhoradas são selecionadas por de-senvolvimento em meio mínimo com R,R-monatina como a fonte de nitrogê-nio. Inicialmente a seleção é baseada no desenvolvimento porém quando asaminotransferases melhoradas são selecionadas a avaliação é baseada nataxa de desenvolvimento. Isto é, as células com versões mutadas do genesão cultivadas e o gene é expresso em meio mínimo com R,R-monatina co-mo a fonte de nitrogênio. As taxas de desenvolvimento das células com asversões mutadas do gene são comparadas com a versão não-mutada. A-quelas células com uma taxa de desenvolvimento mais rápida são selecio-nadas e a aminotransferase é analisada também. A D-hidroxifenilglicina a-minotransferase é mutagenizada por técnicas disponíveis tais como PCRpropenso ao erro e passagem através de cepas mutagênicas ou por méto-dos para os quais uma licença foi obtida tais como emaranhamento de DNAe outras tecnologias de evolução controlada.
Ensaio de DPGAT
Células com a D-hidroxifenilglicina aminotransferase recombi-nante foram cultivadas, a proteína expressa, e as células Iisadas como des-crito no Exemplo 17 ou por protocolos padrão. A proteína é expressa em seuhospedeiro nativo utilizando-se métodos descritos (Wiyakrutta, W., Meevoo-tisom, V. A stereoinverting D-phenylglycine aminotransferase from Pseudo-monas stutzeri ST-201: purification, characterization, and application for D-phenylglycine synthesis. J. Biotechnol., 55:193-203 (1997)).
Extrato livre de célula foi adicionado a uma mistura reacionalcom as seguintes concentrações finais: 100 mM de fosfato de potássio (pH7,0-8,5), 60 mM de D-fenilglicina (ou D-4-hidroxifenilglicina), 5 mM de a-cetoglutarato, 50 μΜ de PLP. Os ensaios foram incubados em temperaturaambiente e alíquotas foram calculadas em pontos do tempo e interrompidospor adição de um volume igual de ácido fórmico. O produto (L-glutamato) équantificado por métodos descritos no Exemplo 1.
Exemplo 20
Descoberta de um gene de D-metionina aminotransferaseAntecedentes
D-metionina-piruvato aminotransferase (EC 2.6.1.41) é supostaser outro exemplo, embora raro, de uma transaminase de estereoinversão.Esta enzima cataliza a conversão reversível de D-metionina e piruvato em L-alanina e 4-metiltio-2-oxobutanoato. Oxaloacetato, fenilpiruvato, 2-oxobutirato, 2-oxovalerato, 2-oxoheptanoato, glioxilato, e oxoglutarato po-dem também servir como aceptores de amino.
Transaminação de D ou L metionina é suposta ser parte de umasérie de reação para produção de etileno em plantas máiores (couve-flor,tomate, maçã, caule de ervilha, banana, amendoim) bem como em microor-ganismos do solo (Escherichia coli, Pseudomonas pisi, Pseudomonas aeru-ginosa, Bacillus mycoides, Acinetobacter caleoaceticus, Aeromonas hidrophi-Ia B12E, Rhizobium trifolii N2P7, Penieillium digitatum, Saccharomyees cere-visiae, Corynebaeterium D7F). D. C. Billington1 B.T. Golding, e S.B. PrimroseBioehem J. (1979) 182, 827-836. Em bactérias, L-metionina é tipicamenteutilizada como o substrato nos estudos de produção de etileno e enzimas deampla especificidade tais como TyrB ou AspC de E. coli são supostas serresponsáveis pela transaminação. Entretanto, S.B. Primrose J. Gen. Micro-biol. (1976), 95(1), 159-65 e S.B. Primrose J. Gen. Mierobiol. (1977), 98,519-528, mostraram que cepa de E. coli SPA O (coleção de cultura da Uni-versity of Warwick) produziu quase tanto etileno de D-metionina quanto de L-metionina em culturas de batelada. Porque nenhuma D-aminotransferase deampla especificidade foi identificada em E. coli, uma explicação possível po-de ser que a D-aminoácido desidrogenase de E. coli (codificada pelo genedadA) converte a D-metionina em 4-metiltio-2-oxobutanoato. É também pos-sível que exista uma metionina racemase em E. coli; entretanto, nenhuma talenzima foi descrita na literatura.
Em contraste com E. coli, em flósculos de couve-flor (prepara-ções de extrato mitocondrial) e sementes de amendoim de germinação, aprodução de etileno foi maior quando D-metionina e piruvato foram forneci-dos a um extrato de enzima quando comparados a L-metionina e piruvato (L.W. Mapson, J.F. March, e D.A. Wardale Biochem J. (1969) 115, 653-661; J.l.Durham, P. W. Morgan, J.M. Prescott e CM. Lyman Phytoquímica (1973) 12,2123- 2126). Portanto a possibilidade de uma combinação de metionina ra-cemase e uma L-aminotransferase não é confirmada pelos dados. Atividadede desidrogenase foi excluída por diálise de extratos celulares de couve-flor,nenhum NAD estava presente nas misturas de ensaio. Atividade de oxidasefoi excluída quando nenhum consumo de oxigênio foi observado e não exis-tiu nenhum requisito para FAD. A D-metionina aminotransferase de tecidosde amendoim foi purificada, mostrada ser dependente de PLP, e mostradaser independente de atividade de L-metionina aminotransferase. Existe umapossibilidade de que estas D-metionina - piruvato aminotransferases real-mente produzam D-alanina como um subproduto (similares às enzimas deBacillus descritas nos Exemplos 13 e 14), e de que as células contenhamalanina racemase para reciclar a D-alanina novamente em L-alanina (ou umdoador de amino análogo). Em qualquer caso, a descoberta das D-aminotransferase de ampla especificidade de plantas maiores é vantajosapara desenvolvimento de processos que produzem R1R monatina ou S,R monatina.
Avaliação Experimental
D-metionina aminotransferase é parcialmente purificada de flós-culos de couve-flor e embriões de amendoim de germinação utilizando-seprotocolos de cromatografia padrão e um sistema Pharmacia AKTA Explorer.
As seqüências de proteína de proteínas homólogas são determinadas portécnicas de impressão digital LC/MS/MS e pesquisa de base de dados reali-zada pelo estabelecimento Harvard Microquímica. As regiões de codificaçãodos genes de planta são clonadas de uma biblioteca de cDNA utilizando-seprotocolos de PCR padrão ou por síntese do gene como descrito no Exemplo 19.
Alternativamente, bibliotecas de expressão de cDNA são cons-truídas (Stratagene, La Jolla, CA) de tecido de couve-flor ou sementes deamendoim cultivadas na presença de D-metionina (e produção de etileno).
As bibliotecas são transformadas em auxótrofos de metionina de E. coli doCentro de Matéria-Prima Genético de E. coli (YaIe) tal como cepas RC519ou AB 1931. Plasmídeos de cepas capazes de crescerem em meios míni-mos contendo D-metionina contêm a região de codificação de interesse (videexemplo 15, uma técnica de avaliação análoga).
Uma vez que as regiões de codificação de interesse são obtidase são expressas em uma cepa de laboratório de E. coli padrão, os produtosde gene resultantes podem ser utilizados em ensaios para produzir R1R mo-natina como descrito no Exemplo 19 no lugar da D-hidroxifenilglicina amino-transferase, com a exceção do pH ser 7,5 (o pH ideal para a aminotransfera-se). Se a D-metionina- aminotransferase tem um requisito rígido para subs-tratos doadores de D-aminoácido, a enzima pode ser utilizada para prepararR,R monatina como descrito nos Exemplos 13 e 14. O gene pode ser muta-genizado e avaliado quanto à atividade aumentada como descrito no Exem-plo 19.
Métodos
Isolamento de couve-flor
Quatrocentos gramas de flósculos de couve-flor recentementecolhidos são extraídos com 400 mL de uma solução de sacarose/tampão a4°C (0,4 M de sacarose e 0,1 M de tampão de fosfato de sódio, pH 7,4) al-ternando-se embebimento e mistura utilizando-se um misturador. Detritoscelulares são removidos por filtração com talagarça e a solução resultante écentrifugada em 40.000 Xg durante 30 minutos a 4°C. O material sólido(contendo organelas mitocondriais) é ressuspenso em 20 mL de tampão defosfato de sódio a 10 mM, pH 7,4, e as enzimas são extraídas com 200 mLde acetona resfriada (-30°C). A suspensão é recentrifugada e o precipitadoé secado utilizando-se um Savant Speed Vac. O material sólido é dissolvidoem tampão de fosfato de sódio a 10 mM, pH 7,4, e acetona residual é remo-vida utilizando-se uma coluna PD-10 (GE Healthcare, Piscataway, NJ).
Atividade de aminotransferase é ensaiada por incubação da pre-paração de enzima com 5 mM de D-metionina, 1 mM de piruvato, 0,05 mMde PLP e 2 mM de EDTA em tampão de fosfato de sódio a 0,1 M, pH 7,4. Osensaios são realizados a 25°C durante 16 horas. O 4-Metiltio- 2-oxobutanoato é avaliado por formação do derivado de 2,4-dinitrofenilhidrazona, utilizando-se LC/MS (m/z de 328) e metodologia similardescrita no Exemplo 1. Uma solução a 0,4% (peso/volume) de 2,4-dinitrofenilhidrazina em 2 M de ácido sulfúrico é preparada, e uma metadedo volume é adicionada à mistura do ensaio após incubação. A mistura émisturada com agitação suave a 30°C durante 30 minutos e o precipitado écoletado por centrifugação e analisado por LC/MS. Frações de proteína se-paradas por técnicas cromatográficas padrão são ensaiadas quanto à ativi-dade de uma maneira similar, porém o co-produto alanina é avaliado pelatécnica de pós-derivatização de coluna OPA descrita no Exemplo 1.Isolamento de Amendoim (Arachia hypogea L. cv. Starr)
A enzima D-metionina aminotransferase a partir da germinaçãodo homogenado de embrião de amendoim (menos os cotilédones) é purifi-cada de acordo com o método de J.l. Durham, P.W. Morgan, J.M. Prescott eCM. Lyman Phytochemisry (1973) 12, 2123-2126. Os agentes de reduçãosão empregados durante a preparação de extratos crus para estabilizar asenzimas, e os resíduos celulares são removidos por centrifugação em33.000Xg. Uma fração de sulfato de amônio a 35-50% é também purificadapor incubação em baixa temperatura, e por remoção das proteínas no preci-pitado. O sobrenadante é também fracionado utilizando a acetona. Os lagosativos são, em seguida, purificados por cromatografia de filtração de gel(Sephadex 200, GE Healthcare, Piscataway, NJ).
Quando as frações de proteína são enriquecidas com a proteínade transaminase, eletroforese de 2D-gel é utilizado para separar a enzimade interesse para o microsseqüenciamento. Depois da elucidação de regiõesde codificação homólogas em seqüências de planta depositadas em NCBI1 aproteína de D-aminotransferase é produzida recombinantemente em Esche-richia coli utilizando técnicas de biologia molecular padrão. Espera-se que osextratos celulares dos flósculos da couve-flor ou sementes de amendoim ouenzimas recombinantemente produzidas possam ser utilizados na produçãode R,R-monatina como descrito no Exemplo 19 (se uma transaminase este-reoinvertida) ou Exemplos 13 e 14 (se uma D-aminotransferase de amplaespecificidade).
Exemplo 21
L-alanina aminotransferase/alanina racemase/D-alanina aminotransfe-rase
Figuras 4, 6, e 8 ilustram séries de reações biossintéticas paraproduzir R,R monatina estereoisomericamente enriquecida a partir de L-triptofano utilizando um L-aminoácido aminotransferase (tal como L-alanina-aminotransferase e/ou L-triptofano-aminotransferase), uma aldolase R-específica, uma alanina racemase e uma D-alanina aminotransferase.
Uma aminotransferase específica de triptofano é descrita no E-xemplo 16. Alternativamente, tirosina (aromática) aminotransferases de S.meliloti e R. sphaeroides são preparados como descrito no Exemplo 1 a par-tir de WO 03/091396 A2. ProA Aldolase de Comamonas Testosteroni é pre-parada como descrito no Exemplo 4 de WO 03/091396 A2. Ensaios de pro-teína total são realizados utilizando o Ensaio de Proteína de Bio-Rad de a-cordo com os protocolos do fabricante (Bio-Rad, Hercules, CA). Alanina ra-cemase é adquirida de Sigma-Aldrich (St. Louis, MO) (número de catálogoA8936). D-alanina aminotransferase é adquirida de BioCataIytics (número decatálogo AT-103) (BioCatalytics, Pasadena, CA).
L-alanina aminotransferases são amplamente distribuídas emeucariotos, bactérias, e archaea. Os seguintes organismos foram identifica-dos (baseados na homologia de seqüência) como contendo uma L-alaninaaminotransferase (E.C. 2.6.1.2): Arabidopsis thaliana, Ashbya gossypii, Azo-tobacter vineiandii, Bifidobacterium longum, Caenorhabditis elegans, Candi-da albicans, Candida glabrata, Chlamydomonas reinhardtii, Cryptococcusneoformans, Debaryomyees hansenii, Homo sapiens, Hordeum vulgare,Kluyveromyces laetis, Magnaporthe grisea, Medieago truneatula, Mus mus-eulus, Neurospora crassa, Oryza sativa, Phaneroehaete ehrysosporium, Pi-nus taeda, Pseudomonas putida, Pyroeoceus abyssi, Pyroeoeeus furiosus,Pyroeoeeus horikoshii, Rattus norvegieus, Saccharomyees eerevisiae, Sehi-zosaceharpmyees pombe, Takifugu rubripes, Trypanosoma cruzi, Vibrioneholerae, Vibrio parahaemolytieus, Vibrio vulnifieus, Yarrowia lipolytiea, eZea mays. Adicionalmente, muitas aminotransferases têm atividade de ala-nina aminotransferase de baixo nível e determinados níveis altos de L-glutamato e piruvato podem converte-las em L-alanina e a-cetoglutarato.
Uma enzima com baixa atividade é melhorada com técnicas de mutagênesepadrão tal como PCR propensa ao erro e passagem através de cepas muta-gênicas ou por técnicas de evolução direcionada. O gene para uma L-alanina aminotransferase é clonado utilizando técnica publicamente disponí-vel para projetar iniciadores e utilizar técnicas padrões para amplificar, clo-nar, expressar e purifcar o gene/enzima.
Misturas de reação (volume de 1 mL; conduzido em duplicata)contêm 100 mM de tampão de fosfato de potássio (pH 8), 2 mM de MgCI2,0,05 mM de 5'-fosfato piridoxal (PLP), 200 mM de piruvato de sódio, 5 mMde α-cetoglutarato de sódio, aproximadamente 280 μg/mLde TatA de S. me-liloti fornecido em um extrato celular (ou outra aminotransferase específicade L-triptofano), 100 μ!_/πιί de extrato celular de alanina racemase ou 1mg/mL de alanina racemase purificada, aproximadamente 280 μg/mL de D-alanina aminotransferase fornecidos em um extrato celular e aproximada-mente 100 μg/mL de ProA aldolase fornecidos como um extrato celular. Trip-tofano sólido é adicionado em uma concentração de 10,2 mg/ml. Controlesnegativos são fixados sem alanina racemase. Amostras são incubadas a30°C com suave agitação ~1 hora ou durante a noite. As amostras são cen-trifugadas para remover o precipitado, seringa filtrada, e armazenadas a -80°C antes da varredura para monatina utilizando o método de LC/MS/MSdescrito no Exemplo 1. Nestes misturas de reação, se a L-triptofano amino-transferase podem utilizar α-cetoglutarato, mas não o piruvato, um aceptorde amino, alguém pode adicionar uma L-alanina aminotransferase, que con-verte L-glutamato e piruvato e em L-alanina e α-cetoglutarato, como mostra-do na Figura 6.
Exemplo 22
Subclonagem de genes que codificam as aldolases de SEQ ID NO: 276,244, 218, 228, 162, 50, 74, 44, e 116
Os genes que codificam aldolases que tem as seqüências deaminoácido de SEQ ID NO: 276, 244, 218, 228, 162, 50, 74, 44, e 116 foramsubclonados no vetor de expressão de pET28b (Novagen, Madison, Wl) comrótulos de His N-terminal para permitir a purificação. SEQ ID NO: 275 é aseqüência do gene que codifica a aldolase que tem a seqüência de aminoá-cido de SEQ ID NO: 276. SEQ ID NO: 243 é a seqüência do gene que codi-fica a aldolase que tem a seqüência de aminoácido de SEQ ID NO: 244.SEQ ID NO: 217 é a seqüência do gene que codifica a aldolase que tem aseqüência de aminoácido de SEQ ID NO: 218. SEQ ID NO: 227 é a seqüên-cia do gene que codifica a aldolase que tem a seqüência de aminoácido deSEQ ID NO: 228. SEQ ID NO: 161 é a seqüência do gene que codifica a al-dolase que tem a seqüência de aminoácido de SEQ ID NO: 162. SEQ IDNO: 49 é a seqüência de gene que codifica a aldolase que tem a seqüênciade aminoácido de SEQ ID NO: 50. SEQ ID NO: 73 é a seqüência do geneque codifica a aldolase que tem a seqüência de aminoácido de SEQ ID NO:74. SEQ ID NO: 43 é a seqüência do gene que codifica a aldolase que tem aseqüência de aminoácido de SEQ ID NO: 44. SEQ ID NO: 115 é a seqüên-cia do gene que codifica a aldolase que tem a seqüência de aminoácido de
SEQ DD NO: 116.
Os iniciadores utilizados para clonagem são mostrados na Tabe-la 24.
Tabela 24<table>table see original document page 399</column></row><table>
Os genes que codificam as aldolases foram ampliados por PCRe digeridos com enzimas apropriadas (Nde I e BamH I) e purificados por gel{Kit de extração de Gel QIAquickO (Qiagen, Valencia, CA)). Os digestos fo-ram individualmente ligados em pET28 que foi digerido com Nde I e BamH Ie purificado por gel. A ligação foi transformada em células TOPIO (Invitro-gen, Carlsbad1 CA). DNA Miniprep de colônias individuais foi analisadoquanto à presença de inserções por varredura de tamanho utilizando eletro-forese de gel de agarose. Isolados com uma inserção foram submetidos pa-ra varredura de seqüência de DNA (Agencourt, Beverly, MA).
Purificação de aldolasesClones de aldolase confirmados foram transformados emBL21(DE3) ou
BL21(DE3) pLysS. A indução foi realizada durante a noite em Caldo Terrifica 30°C. Culturas da noite crescidas com o antibiótico apropriado foram diluí-das em meio fresco (tipicamente 1:100) e crescido em um. OD6oo -0,6 comaeração a 37°C. Culturas foram em seguida induzidas com 1 mM de IPTG etrocadas a 300°C (com aeração) e a incubação foi continuada durante a noi-te. As células foram colhidas por centrifugação. O pélete celular foi tipica-mente submetido o um ciclo de congelamento descongelamento para ajudarcom a Iise celular. O pélete celular foi Iisado em BugBuster e BenzonaseNuclease (Novagen, Madison1 Wl) (de acordo com o protocolo do fabrican-te). Resíduos celulares foram removidos por centrifugação. O extrato de pro-teína bruto foi aplicado a uma coluna His-Bind de 10 mg de capacidade (No-vagen, Madison, Wl) que foi preparada de acordo com o protocolo do fabri-cante. A coluna foi lavada e a proteína foi eluída de acordo com o protocolodo fabricante. A proteína purificada foi dessalinizada com colunas PD-10(GE Healthcare, Piscataway, NJ) e eluída em 50 mM de tampão de fosfatode potássio, pH 7,5, contendo 4 mM de MgCI2, 200 mM de NaCI. Proteínapurificada foi concentrada com concentradores centrífugos Amicon (corte de5000 MW) (Millipore, Billerica, MA). Depois da concentração, foi notado queas aldolases de SEQ ID NO: 44, SEQ ID NO: 28, e SEQ ID NO: 276 mostra-ram algum nível de precipitação, embora a atividade ainda fosse bastantealta. Proteínas foram armazenadas a -80 0C até que analisadas.
Ensaios de proteína foram realizados utilizando o kit Pierce BCA(Pierce, Rockford, IL) e o protocolo de placa de microtítulo com Albumina deSoro Bovino ("BSA") como o padrão de proteína. O sistema de eletroforeseExperion Pro260 (Bio-Rad, Hercules, CA) ou SDS-PAGE foi utilizado paracalcular a porcentagem de aldolase na amostra purificada, e avaliar níveisde expressão no extrato celular solúvel e na proteína total.
Teste de aldolases purificadas
Aldolases purificadas foram testadas quanto à sua capacidadede produzir R,R-monatina de D-triptofano, e foram adquiridas para as aldola-ses de SEQ ID NO: 28 e SEQ ID NO: 54 preparadas da mesma maneira. Osensaios foram conduzidos em tubos de microcentrífuga (em duplicata) comproteína purificada, utilizando a mesma concentração de enzima por ensaio(50 μρ/ΓτιΙ-) com a exceção de SEQ ID NO: 244, para qual 25 μς/ιτι!. foramutilizados. SEQ ID NO: 243 não-expressou bem e produziu quantidades me-nores de proteína purificada. Dois mg/mL de BioCataIytics AT-103 (BioCa-talytics, Pasadena, CA) foi utilizado como a D-aminotransferase. Os seguin-tes foram adicionados por 1 mL de mistura de reação: aldolase, 4 mM deMgCI2, 50 mM de D-triptofano, D-aminotransferase, 200 mM de piruvato desódio, 100 mM de tampão de fosfato de potássio pH 7,5, e 0,05 mM de PLP.As amostras foram incubadas a 30°C. Amostras de trinta minutos, 1 hora, 3hora, e da noite (19 hora) foram retiradas. Tabela 25 mostra os resultadoscalculados pela média de monatina total produzidos em cada ponto de tem-po e o % de R,R monatina produzida, como determinado por áreas de picode fase reversa. Na coluna 3 da Tabela 25, varredura de LC/MS/MS de deri-vação de FDAA adicional como descrito no Exemplo 1 foi realizada para al-gumas reações e esses resultados são mostrados nós parênteses.
Tabela 25: Monatina total produzida a partir de D-triptofano e % de R,R
<table>table see original document page 401</column></row><table><table>table see original document page 402</column></row><table>
A aldolase de SEQ ID NO: 276 manteve um nível alto de ativida-de, bem como ao estereoespecificidade mais alta para produção de R1R-monatina. O armazenamento desta enzima em um tampão que omite o clo-reto de sódio parece reduzir o nível de precipitação notado mais cedo. Con-centração de magnésio no tampão de armazenamento não parece ter umimpacto no nível de precipitação.
Todas as aldolases de SEQ ID NO: 276, SEQ ID NO: 28, e SEQID NO: 244 demonstraram atividade alta e estereosseletividade alta paraprodução de R1R monatina. Estas três enzimas foram preparadas como des-crito no Exemplo 23 e analisadas anaerobicamente, como descrito no E-xemplo 24, utilizando frasconetes de soro de 10 mL. Ensaios de sete mLforam realizados utilizando 0,05 mg/mL de cada aldolase (purificada) e 2mg/mL de D-aminotransferase de B. sphaericus purificada preparada comodescrito no Exemplo 24. A atividade de cada aldolase na produção de mona-tina a partir de D-triptofano foi comparada à HMG aldolase de S. meliloti pre-parada como descrito no Exemplo 27. Monatina total foi calculada utilizandoo método de LC-OPA descrito no Exemplo 1. A porcentagem de R,R-monatina formada foi determinada utilizando o método de derivação deFDAA descrito no Exemplo 1. Os resultados são mostrados abaixo na TabeIa 26.
Tabela 26
<table>table see original document page 403</column></row><table>
Estes resultados demonstram que a aldolase de SEQ ID NO:276 produz níveis altos de R,R-monatina em reações anaeróbias de volumemaior também.
Exemplo 23
Expressão e Purificação do aldolase de SEQ ID NO: 276
A clonagem de hospedeiro de BL21(DE3)pl_ysS de E. coli quecarrega o gene de aldolase listado como SEQ ID NO: 275 no plasmídeopET28b é descrita acima no Exemplo 22.
A aldolase de SEQ ID NO: 276 com um rótulo de purificação deHIS6 aminoterminal foi produzida utilizando o EMD Biosciences Durante anoite Express System Il (Novagen, Madison, Wl) (soluções 1-6) contendo 50μg/mL de canamicina em frascos de agitação. Este sistema de expressãoinduz a expressão de sistemas induzíveis por IPTG sem a necessidade demonitorar o crescimento celular. Depois da inoculação de alíquotas de 200mL do meio (em frascos de 1 L) a partir de culturas líquidas ou placas deconstructo de aldolase, as culturas foram incubadas durante a noite a 300°Cdurante a noite com agitação em 225 rpm. Quando a OD6oo alcançou ummínimo de 6, as células foram colhidas por centrifugação e lavadas uma vezcom tampão.
Para preparar o extrato livre de célula contendo a aldolase, ascélulas foram suspensas em volumes de 3 - 4 de 100 mM de fosfato de po-tássio, pH 7,8 e em seguida rompidas utilizando um homogeneizador Micro-fluidics (Microfluidics, Newton, MA) (3 passagens em 1,26 kg/cm2(18.000psi), mantendo a temperatura da suspensão em menos que 15°C.Alternativamente, o extrato livre de célula foi preparado utilizando EMD Bios-ciences BugBuster® (livre de amina primária) Reagente de Extração (Nova-gen, Madison, Wl) contendo 1 μL/mL de Benzonase® Nuclease, 5 μL/mL deProtease Inhibitor Coquetel Grupo II, e 0,033 μl/mL de rLysozyme™ quesegue o protocolo do fabricante. Todas as etapas de purificação subseqüen-tes foram realizadas a 4°C. A suspensão celular foi centrifugada durante 20 -30 minutos a 15.000 - 20.000 χ g para remover os resíduos celulares. Umaalíquota de 20-25 mL do extrato livre de célula foi aplicada a uma coluna de45 mL de resina de Fluxo Rápido GE Healthcare Chelating Sepharose™(forma de níquel (II)) (GE Healthcare, Piscataway, NJ) que foi previamenteequilibrada com 100 mM de fosfato de potássio que contém 200 mM de clo-reto de sódio. Para gerar a forma de níquel da resina, a resina foi lavadacom 150 mL de 200 mM de hexaidrato de sulfato de níquel (II) e em seguidacom-150 mL de água destilada. Depois do carregamento da amostra, a colu-na foi lavada/eluída com 150 mL do tampão de equilíbrio contendo 25 mMde imidazol, 150 mL do tampão de equilíbrio que contém 50 mM de imidazole 150 mL do tampão de equilíbrio que contém 500 mM de imidazol. A proteí-na rotulada por HIS6 eluída na última lavagem. A lavagem com 50 mM deimidazol foi concentrada com dispositivos de filtro centrífugo Millipo-re/Amicon Centricon Plus-70 (MWCO 10 kDa) (Millipore, Billerica, MA) para15 - 20 mL de acordo com as instruções do fabricante. O imidazol e cloretode sódio foram removidos por passagem através de colunas PD10 GE Heal-thcare descartáveis (GE Healthcare, Piscataway, NJ) (2,5 mL de amostra porcoluna) previamente equilibradas com 100 mM de fosfato de potássio, pH7,8. A aldolase purificado foi eluída com 3,5 mL por coluna do mesmo tam-pao.
A concentração de proteína de cada fração foi determinada utili-zando-se o kit de ensaio Pierce BCA (Pierce, Rockford1 IL) utilizando-se BSAcomo o padrão de proteína. A pureza de cada fração e o nível de expressãono extrato livre de célula foram determinados utilizando-se um sistema dechip microcapilar Bio-Rad Experion (Bio-Rad, Hercules, CA) ou utilizando-segéis de gradiente de 4-15% de SDS-poliacrilamida Bio-Rad conduzidos emum mecanismo de célula Mini PROTEAN® 3. A proteína foi visualizada nosgéis de poliacrilamida utilizando mancha de Coomassie Bio-Rad Bio-Safe G-250 (Bio-Rad, Hercules, CA) e tirando a mancha com água. Tipicamente,este procedimento produz ~ 50 mg de enzima a partir de 200 mL de culturada noite que é 85-95% puro como julgado pelo software Experion ou a partirda varredura dos géis de SDS-PAGE. Alíquotas (1-5 mL) da enzima purifica-da foram armazenadas a -80° C até o uso. A preparação da enzima destamaneira reduziu o nível de precipitação da enzima previamente notada. Apresença de magnésio no tampão de armazenamento não teve efeito nonível de precipitação.
Exemplo 24
Produção de R,R-monatina Utilizando a SEQ ID NO: 276 Aldolase: Oti-mização de Condições de reação
A D-alanina aminotransferase de Bacillus sphaericus (cepa deATCC 10208) clonada no Exemplo 7 foi purificada como a proteína rotuladapor HISe como descrito abaixo utilizando EMD Biosciences Durante a noiteExpress Systems Il (Novagen, Madison, Wl) para crescimento e indução. OEMD Biosciences Durante a noite Express Systems Il (soluções 1 - 6) (No-vagen, Madison, Wl) continha 50 μg/mL de canamicina em frascos de agita-ção. Este sistema de expressão induz a expressão de sistemas induzíveispor IPTG sem a necessidade de monitorar o crescimento celular. Depois dainoculação de alíquotas de 200 mL do meio (em frascos de 1 L) a partir deculturas líquidas ou placas do constructode aminotransferase, as culturasforam incubadas a 30 0C durante a noite com agitação em 225 rpm. Quandoo ODeoonm alcançou um mínimo de 6, as células foram colhidas por centrifu-gação e lavadas uma vez com tampão.
Para preparar o extrato livre de célula contendo a D-alanina a-minotransferase, as células foram suspensas em volumes de 3 - 4 de 100mM de fosfato de potássio, pH 7,8, contendo 50 μΜ de fosfato piridoxal(PLP) e em seguida rompidas utilizando um homogeneizador Microfluidics(Microfluidics, Newton, MA) (3 passagens em 1,26 kg/cm2), mantendo atemperatura da suspensão em menos que 15°C. Alternativamente, o extratolivre de célula foi preparado utilizando EMD Bioscienees BugBusterfD (livrede amina primária) Reagente de Extração (Novagen, Madison, Wl) contendo1 μΙ-/ητιΙ_ de Benzonase® Nuclease, 5 μΙ_/ιτιΙ_ de Protease Inhibitor CocktailSet II, e 0,033 μΙ-Απί de rLysozyme™ que segue o protocolo do fabricante.Todas as etapas de purificação subseqüentes foram realizadas a 4°C. O ex-trato celular foi centrifugado durante 20 - 30 minutos a 15.000 χ g para re-mover os resíduos celulares. Uma alíquota de 20 - 25 mL do extrato livre decélula foi aplicada a uma coluna de 45 mL de resina de Fluxo Rápido GEHealthcare Chelating Sepharose™ (forma de níquel (II)) (GE Healthcare,Piscataway, NJ) que foi previamente equilibrada com 100 mM de fosfato depotássio que contém 200 mM de cloreto de sódio e 50 μΜ de PLP. Para ge-rar a forma de níquel da resina, a resina foi lavada com 150 mL de 200 mMde hexaidrato de sulfato de níquel (II) e em seguida com 150 mL de águadestilada. Depois do carregamento da amostra, a coluna foi lavada/eluídacom 150 mL do tampão de equilíbrio contendo 25 mM de imidazol, 150 mLdo tampão de equilíbrio que contém 50 mM de imidazol e 150 mL do tampãode equilíbrio que contém 500 mM de imidazol. A proteína rotulada por HIS6eluída na última lavagem. A lavagem com 50 mM de imidazol foi concentra-da com dispositivos de filtro centrífugo Millipore/Amicon Centricon Plus-70(MWCO 10 kDa) (Millipore, Billerica, MA) para 15-20 mL de acordo com asinstruções do fabricante. O imidazol e cloreto de sódio foram removidos porpassagem através de colunas PD10 GE Healthcare descartáveis (GE Heal-thcare, Piscataway, NJ) (2,5 mL de amostra por coluna) previamente equili-bradas com 100 mM de fosfato de potássio, pH 7,8 contendo 0,5 μΜ dePLP. A aminotransferase purificada foi eluída com 3,5 mL por coluna domesmo tampão.
A concentração de proteína de cada fração foi determinada utili-zando-se o kit de ensaio Pierce BCA (Pierce, Rockford, IL) utilizando-se BSAcomo o padrão de proteína. A pureza de cada fração e o nível de expressãona fração de extrato livre de célula foram determinados utilizando-se um sis-tema de chip microcapilar Bio-Rad Experion (Bio-Rad1 Hercules, CA) ou utili-zando-se géis de gradiente de 4-15% de SDS-poliacrilamida Bio-Rad (Bio-Rad1 Hercules, CA) conduzidos em um mecanismo de célula Mini PROTE-AN® 3 (Bio-Rad, Hercules, CA). A proteína foi visualizada nos géis de polia-crilamida utilizando mancha de Coomassie Bio-Rad Bio-Safe G-250 (Bio-Rad, Hercules, CA) e tirando a mancha com água. Tipicamente, este proce-dimento produz ~ 50 mg de enzima a partir de 400 mL de cultura da noiteque é 85 - 95 % puro como julgado pelo software Experion. Alíquotas (1 - 5mL) da enzima purificada foram armazenadas a -80° C até o uso.
A aldolase de SEQ ID NO: 276 (clonada no Exemplo 22) foi puri-ficada como a proteína rotulada por HIS6 como descrito no Exemplo 23.
O co-fator de metal preferido para a aldolase SEQ ID NO: 276 foideterminado avaliando-se uma variedade de metais divalentes. As reaçõesforam fixadas anaerobicamente em frascos de soro de 10 mL com 7 mL devolumes finais. Uma solução de volume que consiste em 100 mM de fosfatode potássio (pH 7,8), 200 mM de piruvato de sódio, 0,05 mM de PLP e0,01% (v/v) de Tween 80 foi preparada em um volume final de 48,8 mL epulverizada com nitrogênio durante 30 minutos. D-Triptofano (143 mg; con-centração final de 100 mM) foi distribuído em sete frasconetes de soro de 10mL. A cada um dos frasconetes foi adicionado 0,014 mL de uma solução dematéria-prima de 2 M de um cátion de metal divalente, preparada a partir dosal de cloreto (concentração final de 4 mM). Para o controle negativo, 0,014mL de dH20 foi adicionado. Os frasconetes de soro foram tamponados comseptos de borracha e pulverizados com nitrogênio por meio de agulhas de16-18 gauges. Sob condições anaeróbicas, 5,625 mL da solução de volumeanaeróbica foram adicionados a cada frasco de soro anaeróbico. Subse-qüentemente, a D-alanina aminotransferase de B. sphaerícus e a aldolasede SEQ ID NO: 276 foram adicionados anaerobicamente a cada frasco desoro em uma concentração final de 2 mg/mL e 0,05 mg/mL, respectivamen-te. As soluções foram incubadas em temperatura ambiente com suave mis-turação durante 18 horas. Monatina final foi analisada de acordo com os mé-todos descritos no Exemplo 1 utilizando a Detecção de Fluorescência dePós-coluna-Cromatografia líquida de método de Aminoácidos. (Tabela 27).
Tabela 27
<table>table see original document page 408</column></row><table>
As condições de reação para o SEQ ID NO: 276 foram tambéminvestigadas com uma experiência fatorial fracionária de dois níveis projeta-da utilizando-se o software estatístico Design Epert 7.0.0 (Stat-Ease, Inc.;Minneapolis, MN). O projeto de avaliação consistiu em um único bloco decinco fatores em dois níveis com quatro pontos centrais (total de 20 ciclos).Os cinco fatorès a ser otimizados foram a concentração de co-fator de metal,pH de reação, concentração de Tween® 80, relação de piruvato para tripto-fano, e a concentração de aldolase (Tabela 28).
Tubos de polipropileno cônicos (14 mL) contendo 143 mg de D-triptofano foram desoxigenados em uma caixa de luva anaeróbica (Coy La-boratory Products, lnc; Grass Lake, Ml) durante a noite. Soluções de maté-ria-prima de 2 M de MgCI2; 1 M de fosfato de potássio em pH 7,0, 7,75, e8,5; 10% (v/v) de Tween® 80; 2 M de piruvato de sódio, e 10 mM de PLP (51-fosfato piridoxal) foram preparados em água desgaseificada e equilibrada nacaixa de luva anaeróbica durante a noite. Soluções de matéria-prima de D-alanina aminotransferase de B. sphaericus purificadas e a aldolase de SEQID NO: 276 foram descongeladas em gelo e empregadas na caixa de luvaanaeróbica imediatamente. Soluções de matéria-prima foram adicionadasaos tubos cônicos de 14 mL que contêm o D-triptofano para obter as con-centrações determinadas pelo projeto estatístico (Tabela 28). Água desga-seificada foi adicionada a cada tubo para trazer o volume final, junto com asadições de enzima, a 7,0 mL. Os tubos foram incubados em temperaturaambiente na caixa de luva anaeróbica com suave misturação durante até 24horas. Concentração de monatina e pureza isomérica foram analisadas deacordo com os métodos descritos no Exemplo 1 utilizando uma Detecção deFluorescência de Pós-Coluna- Cromatografia Líquida de método de Aminoá-cidos e o Monitoramento de Reação Múltipla LC/MS/MS para a Determina-ção da Distribuição de Estereoisômero de Monatina em método de Reaçõesin vitro e in vivo (método de derivatização de FDAA).
Tabela 28
<table>table see original document page 409</column></row><table><table>table see original document page 410</column></row><table>
Varredura estatística dos dados indicaram que o pH da reação,relação de piruvato:triptofano e concentração de aldolase foram os fatoressignificantes que afetam o título de monatina, pureza isomérica e rendimentode carbono. Um gráfico de desejo foi gerado utilizando o software DesignExpert no qual os fatores foram variados para maximizar as metas do títulode monatina mais alto e pureza isomérica mais alta sob condições de piruva-to em excesso. As condições de reações indicadas como ideal foram 1 mMde MgCI2, pH >8,0, 0,01% (v/v) de Tween® 80, e 0,01 mg/mL de aldolase deSEQ ID NO: 276. Esta é uma redução de 5 vezes na quantidade típica dealdolase utilizada, bem como uma redução de 4 vezes na quantidade de me-tal divalente tipicamente utilizada.
Experiências adicionais foram realizadas para determinar a faixade pH ideal para o processo de reação. Soluções de matéria-prima de 1 Mde tampão de EPPS foram preparadas em incrementos de 0,2 unidade depH entre pH 7,0 e 9,0. Estas soluções foram desgaseificadàs e equilibradasna caixa de luva anaeróbica durante a noite. Tubos de polipropileno (14 mL)contendo 143 mg de D-triptofano foram desoxigenados em uma caixa deluva anaeróbica durante a noite. Soluções de matéria-prima de 2 M de Mg-CI2, 10% (v/v) de Tween® 80, 2 M de piruvato de sódio e 10 mM de PLPforam preparadas em água desgaseificada e equilibradas na caixa de luvaanaeróbica. Preparações de D-alanina aminotransferase de B. sphaericuspurificada e aldolase de SEQ ID NO: 276 foram descongeladas em gelo eutilizadas imediatamente na caixa de luva anaeróbica. As soluções de maté-ria-prima foram adicionadas aos tubos cônicos de 14 mL para preparar umaconcentração final de 100 mM de EPPS, 200 mM de piruvato, 100 mM detriptofano, 1 mM de MgCI2, 0,01% (v/v) de Tween® 80, 0,05 mM de PLP, 2mg/mL de D-alanina aminotransferase de B. sphaericus, e 0,01 mg/mL dealdolase de SEQ ID NO: 276 em um volume total de 7 mL por tubo. As rea-ções foram incubadas em temperatura ambiente na caixa de luva anaeróbicacom suave agitação durante 22 horas. Amostras foram removidas e analisa-das quanto à monatina como descrito no Exemplo 1 utilizando o método demonitoramento de reação múltipla LC/MS/MS (Tabela 29).
Tabela 29
<table>table see original document page 21</column></row><table>
Os resultados indicaram que a formação de monatina aumentoucom o pH crescente entre 7,0 - 8,0. Formação de monatina alcançou ummáximo na faixa de pH 8,0 - 8,2, e diminuiu sobre o pH 8,4. Adicionalmente,a pureza isomérica de monatina diminuiu sobre o pH 8,4.
Outra otimização de reação foi realizada utilizando-se a aldolasede SEQ ID NO: 276 (0,01 mg/mL), 2 mg/mL de T243N 4978 DAT (não-rotulado, do Exemplo 26), 1 mM de MgCI2, 200 mM de piruvato de sódio,0,05 mM de PLP, 0,01% de Tween-80, e 100 mM de D-triptofano em pH 8,5.As células utilizadas para produzir a aldolase e a D-aminotransferase foramabertas à força em 50 mM de EPPS, pH 8,4 utilizando um homogeneizadorMicrofluidics (Microfluidics, Newton, MA) (3 passagens em 1,40 kg/cm2(20.00 psi). Os resíduos celulares foram removidos por centrifugação(20.000 χ g durante 30 minutos) e os extratos celulares clarificados foramutilizados nas reações enzimáticas. Nenhum tampão adicional foi utilizado,porém as misturas de reação foram ajustadas em pH 8,5 utilizando hidróxidode sódio e estimulados com nitrogênio antes da adição de enzima. Reaçõesde duzentos e cinqüenta mL foram realizadas em fermentadores agitadosSixfor de 0,7 L (Infors AG, Bottmingen, Switerland) a 30 0C utilizando nitro-gênio no topo livre. Fosfato de potássio foi adicionado a uma concentraçãofinal de 0, 5, 10, 20, e 50 mm. A adição de 5-10 mM de fosfato foi constatadaser ideal, produzindo 3,5 g/L de monatina (quantificada por LC/MS/MS comodescrito no Exemplo 1).
Exemplo 25
Clonagem de Uma Nova D-Amonoácido Aminotransferase de Bacillus
Uma D-aminoácido aminotransferase de Bacillus ("DAAT" ou"DAT") (EC 2.6.1.21, da mesma forma conhecida como D-alanina amino-transferase ou D-aspartato aminotransferase) foi produzida recombinante-mente. Esta aminotransferase foi utilizada em ensaios acoplados com aldo-Iases para produção de R,R monatina. Esta enzima aminotransferase é ho-móloga à D-aminotransferases previamente descritas para produção de mo-natina (Pedido Publicado U.S. No. 20040063175 e Pedido Publicado U.S.No. 20050282260). O organismo ATCC 4978--Bacillus sphaericus deposita-do originalmente como Bacillus rotans-foi ordenado a partir de ATCC e utili-zado para preparar o DNA genômico. Iniciadores degenerados foram proje-tados nas regiões de conservação de seqüência de proteína de D-aminotransferases de Bacillus conhecidas e utilizados para amplificação dereação em cadeia de polimerase ("PCR") de seqüência de gene DAAT inter-na a partir da cepa de ATCC mencionada acima. Caminhada de genoma foirealizada utilizando o Kit Universal BD GenomeWalker™ (Clontech, Mounta-in View, CA). Varreduras de seqüência (Agencourt BioScience Corporation,Beverly, MA) verificaram uma seqüência de codificação de tamanho naturalpara o gene DAAT de ATCC 4978. A seqüência de DNA do gene de DAATde ATCC 4978 é SEQ ID NO: 357 e é mostrada abaixo. O gene de SEQ IDNO: 357 pode ser amplificado por protocolos de PCR padrões e clonado uti-lizando técnicas de DNA recombinantes padrões. O gene de SEQ ID NO:357 pode da mesma forma ser reconstruído por qualquer método conhecidopor uma pessoa de experiência ordinária na técnica, tais como métodos dePCR de montagem conhecidos por alguém versado na técnica.
A seqüência de DNA ATCC 4978 DAAT é:atgagttata gcttatggaa tgaccaaatt gtgaatgatg aagaagtagt agttgataag gag-gaccgtg gctatcaatt tggcgatggt gtttatgaag ttgtaaaagt atataacggt gaattatttacagcggagga gcatgtcgat cgtttttacg cgagtgctga aaaaattcgc gttacgatcc cttataca-aa agacaaattg catcaattat tgcatcagtt agttgaaatg aataaagttc aaacaggaca gaa-taacttc atcttaaatg gtattacacg tcaagtaatc attaaatgtg ctgctgaaat tggcttacca gt-gaaggaag aagcaatgac aaaaactcag cttcttgcaa tggatgaagt gattgtttca tcaacgacttcagaagtaac gccaattatc gacatagatg gaacagtaat tggtgcgggt aaaccgggtg actg-gacacg taaattacaa gcacaatttg atacgaaaat cccaaaaggt attcgcgcat aa(SEQ ID NO: 357)
A seqüência de aminoácido do gene DAAT a partir de ATCC4978 como codificada pela seqüência de DNA acima é SEQ ID NO: 358 e émostrada abaixo:
Met Ser Tyr Ser Leu Trp Asn Asp Gln He Val Asn Asp Glu Glu Val Val ValAsp Lys Glu Asp Arg Gly Tyr Gln Phe Gly Asp Gly Val Tyr Glu Val Val LysVal Tyr Asn Gly Glu Leu Phe Thr Ala Glu Glu His Val Asp Arg Phe Tyr AlaSer Ala Glu Lys He Arg Val Thr He Pro Tyr Thr Lys Asp Lys Leu His Gln LeuLeu His Gln Leu Val Glu Met Asn Lys Val Gln Thr Gly His He Tyr Phe GlnHe Thr Arg Gly Ala Gly Pro Arg Asn His He Phe Pro Gly Asp Glu Val LysPro Val Leu Thr Gly Asn Thr Lys Glu Asn Pro Arg Pro Val Ala Asn Phe GluLys Gly Val Lys Ala Thr Phe Val Glu Asp He Arg Trp Leu Arg Cys Asp HeLys Ser Leu Asn Leu Leu Gly Ala Val Leu Ala Lys Gln Glu Ala His Glu LysGly Cys Tyr Glu Ala Val Leu His Arg Asp Glu He Val Thr Glu Gly Ser SerSer Asn He Tyr Gly He Lys Asp Gly Val Leu Tyr Thr His Pro Ala Asn AsnPhe He Leu Asn Gly He Thr Arg Gln Val He He Lys Cys Ala Ala Glu He GlyLeu Pro Val Lys Glu Glu Ala Met Thr Lys Thr Gln Leu Leu Ala Met Asp GluVal He Val Ser Ser Thr Thr Ser Glu Val Thr Pro He He Asp He Asp Gly ThrVal He Gly Ala Gly Lys Pro Gly Asp Trp Thr Arg Lys Leu GLn Ala Gln PheAsp Thr Lys He Pro Lys Gly He Arg Ala (SEQ ID NO: 358)
A D-aminotransferase nova obtida a partir da cepa ATCC 4978tem uma seqüência de proteína que tem mudanças de resíduo de aminoáci-do distintas quando comparadas à seqüência de D-aminotransferase publi-cada de ATCC 10208 de B. sphaericus. O DAAT de ATCC 4978 tem apenas72% de identidade com o DAAT de B. sphaericus (ATCC 10208). Enquantoesta cepa é listada atualmente como B. sphaericus na ATCC, foi depositadacomo B. rotans. Com base nos alinhamentos de seqüência e nas diferençasrealçadas entre este novo
DAAT e o DAAT de B. sphaericus, vários resíduos candidato são identifica-dos os quais podem ser avaliados por seu papel (individualmente ou emcombinação) em atividade de DAAT crescente para biossíntese de R1R mo·natina, nestes, bem como outras seqüências de DAAT.
Exemplo 26
Caracterização de mutantes de D-aminotransferase de ATCC 4978Avaliação experimental
O novo gene de D-aminotransferase (descrito no Exemplo 25)da cepa de Bacillus ATCC 4978 foi mutagenizado utilizando métodos dire-cionados ao sítio. Os genes mutantes foram expressos e analisados quantoàs atividades de interesse para séries de reações de produção de monatina,especialmente quando acopladas juntou-se com uma ou mais aldolases.
Além das idéias listadas no Exemplo 16 para mutagênese dire-cionada ao sítio, outras idéias foram desenvolvidas pelo acoplamento atualde R-MP no sítio ativo dos alinhamentos de seqüência de aminoácido primá-rio de estrutura de cristal YM-1 foram utilizadas para determinar se a proteí-na de aminotransferase 4978 foi provável ter características estruturais simi-lares nesta região. Foi esperado que as seguintes mutações adicionais seri-am benéficas (utilizando a numeração de aminoácido de aminotransferase4978). Pensa-se que mutagênese de alanina 153 em arginina estabilizaria osegundo grupo carboxila do substrato (R-MP). Esta mudança é provável deaumentar o impedimento estérico, para assim compensar, os resíduos deserina nas posições 181 e 182 foram mudados para alanina ou glicina. Foida mesma forma hipotetizado que alguém pode introduzir uma arginina naposição 180, 181, ou 182 e pode converter um ou mais dos outros resíduosde serina em alanina ou glicina para abrir espaço para a cadeia lateral maisvolumosa de arginina. A fenilalanina no aminoácido 200 está espacialmenteperto donde R-MP é prevista acoplar-se no sítio ativo e há uma quantidadegrande de variabilidade neste resíduo entre as D-aminotransferases que ca-talisam a transaminação de monatina razoavelmente bem. Pensa-se quemodificações de aminoácido nesta posição podem ser úteis. Mutação deleucine 151 em fenilalanina foi prevista para potencialmente melhorar as in-terações com o anel de indol do substrato.
Com base na literatura, foi hipotetizado que a mutação de treo-nina 243 em asparagina pode melhorar a seletividade de R-MP para reaçõesde transaminação. Igualmente, pensou-se que mutagênese de asparagina100 em alanina pode melhorar a atividade específica da enzima para rea-ções de transaminação de monatina (Ro, e outros, FEBS Lett 398:141-145,(1996); Sugio, S, e outros, Biochemistry 34:9661 -9669, (1995); EP1580268).
Lee e outros caracterizaram mutantes da região 141-144 (alça)e constataram que D-aminotransferases com EYcY em vez de LRcD (que énativo a nossa proteína) tenda a ter um Km mais baixo para substratos deácido dicarboxílico. (Lee SG, Hong SP, Song JJ, Kim SJ1 Kwak MS, SungMH. Caracterização funcional e estrutural de D-amino ácido aminotransfera-ses termoestáveis de Geobacillus spp. Appl Environ Microbiol. Fev. de2006;72(2): 1588-94). Porque MP é um substrato de ácido dicarboxílico, si-milar ao alfa-ceto glutarato, e as concentrações de MP são bastante baixasem uma mistura de reação de produção de monatina típica, um Km diminuídopode potencialmente ajudar a atividade de um DAT mutante para produçãode monatina.
Abaixo, métodos são descritos para criar os 4978 mutantes deD-aminotransferase, bem como resultados de ensaio utilizando estes mutantes.
MutagêneseOs iniciadores para mutagênese foram projetados seguindo assugestões listadas no kit Stratagene Multi-Chance (Stratagene, La Jolla1CA). Os iniciadores foram 5'-fosforilados. Mutagênese foi realizada utilizandoo kit Stratagene Multi-Chance (Stratagene, La Jolla1 CA) seguindo as instru-ções do fabricante. Padrões utilizados para mutagênese foram as construc-tos de 4978 DAT de pET30 (não-rotulado) ou pET28 (rotulado) descritas noExemplo 25. Os iniciadores são listados abaixo na Tabela 30:
Tabela 30
Nome do Mu-Mudança do Iniciador
tante Aminoácido
4978-22 T243N GTGATTGTTTCATCAACGAATTCAGAAGTA-
ACGCC (SEQ ID NO:359) T243R GTGATTGTTTCATCAACGCGTTCAGAAGTA-
ACGCC (SEQ ID N0:360)7 T243S GTGATTGTTTCATCAACGAGTTCAGAAGTA-
ACGCC (SEQ ID NO:361)19 T243A GTGATTGTTTCATCAACGGCTTCAGAAGTA-
ACGCC (SEQ ID NO:362) N100A GTGCAGGCCCTCGTGCTCATATTTTCCCTGG
(SEQ ID NO:363)
B T243Q GAAGTGATTGTTTCATCAACGCAGTCAGAAGT
AACGCCAATTATC (SEQ ID NO:364)2 T243N/N1OO iniciadores acima utilizados juntos
Células XLIO-GoId de E. coli (Stratagene, La Jolla9 CA) foramtransformadas, e preparações de plasmídeo purificadas resultantes foramseqüênciadas para verificar que as mutações corretas foram incorporadas.Expressão e ensaio
Preparações de DNA de plasmídeo contendo os mutantes corre-tos ou o DAT 4978 tipo selvagem foram transformadas no hospedeiro deexpressão dre E. coli BL21(DE3) (Novagen, Madison1 Wl). As culturas foramcrescidas utilizando os protocolos descritos acima, os plasmídeos foram iso-lados utilizando o kit miniprep Qiagen (Qiagen, Valencia1 CA) e analisadaspor digestão de restrição, como descrito acima, para confirmar a presençade uma inserção.
Indução do gene DAAT foi tipicamente realizada em meio de LBque contém canamicina (50 μς / mL). As células foram crescidas a umOD6OOnm de 0,4 - 0,8 a 37°C, induzidas com 0,1 mM de IPTG (isopropil tioga-lacatosídeo) e experimentadas em 3 - 4 horas após indução.
Extratos celulares foram preparados com Reagente de BugBus-ter e Benzonase Nuclease (Novagen, Madison, Wl). Ensaios de um ml foramrealizados a 30°C com suave agitação e continham 10,2 mg de D-triptofano,0,05 mM de PLP, 4 mM de MgCI2, 100 mM de tampão de fosfato de potássiopH 7,5, aproximadamente 50 μg de aldolase, 200 mM de piruvato, e 0,150 -0,5 mg/mL de D-aminotransferase fornecida como extratos celulares. Ensai-os de proteína total foram realizadas utilizando o kit de proteína total de Bio-Rad (Coomassie) (Bio-Rad, Hercules, CA) ou o kit Pierce BCA (Pierce,Rockford, IL), e a expressão percentual de D-aminotransferase foi calculadapor SDS-PAGE ou o Bio-Rad Experion Automated Electrophoresis System(Bio-Rad, Hercules, CA). As amostras foram retiradas em 3 horas e durantea noite.
A aldolase R-específica de SEQ ID NO: 28 foi utilizada em en-saios com
aproximadamente 0,150 mg/mL de D-aminotransferase.
Os primeiros ensaios mostraram que os seguintes mutantes(não-rotulados) tiveram atividade de transaminação (em ordem do mais altopara mais baixo): T243N, T243S, T243N/N100A, N100A. Foi da mesma for-ma notado que T243N pareceu aumentar a estereo-pureza de R,R monatinaproduzida. Os ensaios foram repetidos utilizando ProA aldolase de Coma-monas testosteroni purificada (100 μg / ml) e 0,50 mg / ml de mutantes de D-aminotransferase (não-rotulados, forencidos como extrato celular). Amostrasforam retiradas em 2 horas e durante a noite. Os resultados para as proteí-nas ativas são mostrados abaixo, os resultados duplicados foram calculadospela média. O % de R1R monatina foi determinado por área de pico em H-PLC de fase reversa, e em seguida medido utilizando o método de derivaçãode FDAA descrito no Exemplo 1. Na coluna 3 da Tabela 31, a varredura deLC/MS/MS de derivação de FDAA adicional como descrito no Exemplo 1 foirealizada por algumas dentre as reações e estes resultados são mostradosnos parênteses. Apenas R,R e S,R monatina são produzidas a partir de D-triptofano. O mutante T243R não pareceu produzir monatina sob as condi-ções testadas, e o mutante T243A produziu níveis muito baixos de monatina.
Tabela 31
<table>table see original document page 418</column></row><table>
Embora os ensaios tenham sido realizados calculando o percen-tual de D-aminotransferase utilizando o software Bto-Rad Experion, está cla-ro que mutantes T243S e T243N tiveram atividade aumentada comparada àenzima tipo selvagem. O mutante T243N da mesma forma forneceu um be-nefício adicional de aumentar dramaticamente o % de R,R-monatina forma-da. Esta enzima tem uma preferência aumentada para R-MP quando compa-rada a S-MP em reações de transaminação. O mutante N100A não aumen-tou a atividade sozinha ou em combinação com T243N ao contrário do quefoi sugerido na literatura. Um mutante direcionado ao sítio V34A de 4978DAT não-rotulado foi da mesma forma criado utilizando-se métodos simila-res, como descrito acima. O mutante direcionado ao sítio V34A foi constata-do ter significativamente menos atividade do que a enzima tipo selvagemsob as condições testadas.
Outro ponto de interesse nos ensaios iniciais foi que a enzimatipo selvagem mostrou ter mais atividade quando foi produzida com um rótu-lo His N-terminal. Mutagênese subseqüente foi terminada na versão rotuladado gene. Adicionalmente, os mutantes mais promissores acima foram sub-clonados em pET28b que tem um rótulo His N-terminal. Estes foram purifi-cados utilizando as colunas His-bind de Novagen e o protocolo do fabricantecom os tampãos indicados (Novagen, Madison, Wl). O tampão das fraçõesde eluente foi trocado, utilizando colunas PD10 GE Healthcare (GE Health-care, Piscataway, NJ), pelo tampão uitlizado nos ensaios.
Ensaios de um ml com D-aminotransferase purificada (0,5mg/ml) e SEQ ID NO: 276 de aldolase R-específica purificada (50 μg/ml) fo-ram conduzidos a 30°C com suave agitação e continham 10,2 mg de D-triptofano, 0,05 mM de PLP, 200 mM de piruvato, 4 mM de MgCI2, e 100 mMde tampão de fosfato de potássio pH 7,5. Amostras duplicadas foram incu-badas durante 2 horas e durante a noite. Como um controle positivo, o DATde Bacillus sphaericus (clonado no Exemplo 7) foi utilizado nos mesmos en-saios. Os resultados são apresentados na Tabela 32:
Tabela 32
<table>table see original document page 419</column></row><table>
Os dados acima mostram que o mutante T243N produz clara-mente a quantidade mais alta de monatina em 2 horas. Quando o tempoaumenta, a relação de mutante T243N para controle positivo de DAT de B.sphaericus é reduzida. Este resultado sugere que o mutante T243N não sejatão estável durante a reação de monatina quanto o DAT de B. sphaericus.Quando analisado sob condições similares, a enzima de T243S (purificadaalvejada) teve níveis similares de atividade ao mutante T243N; entretanto, opercentual de R,R monatina produzido foi mais baixo (97,2% tanto em 2 hquanto durante a noite). O mutante T243N/N100A teve menos atividade queo mutante T243N. Entretanto, tanto T243S quanto T243N/N100A tiveramatividade mais alta que o 4978 DAT tipo selvagem.
Os ensaios de transaminação foram realizados para determinarquais taxas de reação foram melhoradas quando emprega-se o mutanteT243N no lugar do B. sphaericus DAT. Ensaios de 1/2 mL foram realizados a30 °C tomando pontos do tempo em 1 hora, 2 horas, e 5 horas. Os ensaioscontinham 25 mM de monatina ou D-triptofano, 25 mM de piruvato, 100 mMde fosfato de potássio pH 7,5, 50 μΜ de PLP, e 0,1 mg de D-aminotransferase (rotulado, purificado). No caso onde menos do que 100 pgde DAT foi empregado, a quantidade de alanina foi normalizada a 100 pg deD-aminotransferase. As amostras foram tratadas com ácido fórmico e anali-sadas por LC-OPA para a presença do co-produto, alanina. Os resultadossão mostrados nas Tabelas 33 e 34.
Tabela 33: Atividade de transaminação com R,R monatina como substrato
<table>table see original document page 420</column></row><table><table>table see original document page 421</column></row><table>
Para as reações de D-triptofano, os resultados mostraram quealgumas enzimas alcançaram equilíbrio em 2 horas. As reações de R5R mo-natina são claramente Iimitantes da taxa e as melhoras a esta atividade pos-suem mais de um impacto sobre as taxas de produção de monatina de D-triptofano.
Outros ensaios foram feitos para examinar a estabilidade do mu-tante T243N 4978 DAT. A enzima tipo selvagem também perde a atividadedurante o tempo. O exemplo 27 descreve métodos para melhorar a estabili-dade do mutante T243N D-aminotransferase. Quando recentemente prepa-radas, as versões rotuladas e não-rotuladas do mutante T243N são prepara-das e comparadas por atividade, foi descoberto que a versão não-rotuladateve uma estabilidade temporal melhor, tornando-a geralmente uma versãomelhor da enzima para o emprego nas reações de produção de monatina.
Mutantes adicionais de 4978 DAT foram preparados por méto-dos comumente conhecidos por aqueles versados na técnica. Entretanto,estas mutações todas resultaram em proteína que era insolúvel sob as con-dições que elas foram preparadas, e desse modo não puderam ser ensaia-das por atividade. As mutações que resultaram em proteína insolúvel foram:
S180A/S181A/S182R;
L151F;
V34G
S181R
A153R/S181A/S182A;A153R/S182A;A153R/S182G;S180 R/S 181 A/S 182G;S180R/S181A/S182A;S180R/S181G/S182G;S180G/S181R/S182G; eS180A/S181R/S182A.
Mutagênese Adicional
Para criar o mutante F200M 4978 DAT, a estrutura de leituraaberta por 4978 DAT tipo selvagem do Exemplo 25 (rotulado) foi amplificadacom iniciadores 73 e 80 (abaixo) e PfuTurbo DNA Polimerase (Stratagene,La Jolla, CA) e clonada em pCRIl-Blunt (Invitrogen, Carlsbad, CA). Sua se-qüência foi verificada (Agencourt, Beverly1 MA). As regiões 5' e 3' foram am-plificadas empregando-se iniciadores 80 e 96 e 99 e 103, respectivamente.
O DNA amplificado por 345 foi em seguida purificado por gel empregando-seKit Qiagen QIAquick Gel Extraction (Qiagen, Valencia, CA). Estes DNA am-plificados foram submetidos novamente por PCR empregando-se os inicia-dores 80 e 99. O DNA amplificado foi purificado por gel como acima descritoe clonado em pCRII Blunt e sua seqüência verificada. A estrutura de leituraaberta por DAT foi subclonada como um fragmento de digesto de restriçãode Ndel/Xhol em pET28b.
Tabela 35
Número doSeqüência
Iniciador
CATATGAGTTATAGCTTATGGAATGACCAAATTGTGAATG(SEQ ID NO:365)
80 CTCGAGTGCGGCCGCAAGCTTGTCGACGGAGCTC (SEQ IDNO:366)
96 AATATTT ATGGAATTAAAGATGGCGTATTATACACACATCCAGCGAATAACATGATCTTAAATGGTATTACACGTCAAGTAATCATTAAATGTGC (SEQ ID NO:367)
99 GGCCAGTGAATTGTAATACGACTCACTATAGGGC (SEQ IDΝΟ:368)
103 CGCCATCTTTAATTCCATAAATATTTGAAGAAGAGCCTTCTG(SEQ ID ΝΟ:369)
Os seguintes iniciadores foram destinados para mutagênese di-recionada ao sítio adicional empregando-se o Mutagênese direcionada aoSítio Kit QuikChange® Multi (Stratagene, La Jolla, CA). A mutagênese foifeita empregando-se o Kit Stratagene Multi-Change (Stratagene, La Jolla,CA) seguindo-se as instruções do fabricante. O modelo empregado para mu-tagênese foi o pET28 (rotulado) 4978 DAT construído como descrito no E-xemplo 25. Um mutante duplo foi também criado empregando-se o mutanteF200Y como modelo e realizando um ciclo adicional de mutagênese com oiniciador T243N (acima listado).
Tabela 36
Mutante Oligo
141-LRcD-144 -> GCAACATTTGTAGAAGACATTCGTTGGGAATACTGTTAEYcY C ATTAAATCATTAAATTTACTTG GTGCG (SEQ ID
N0:370)
F200Y GTATTATACACACATCCAGCGAATAACTACATCTTAAAT
GGTATTACACGTCAAG (SEQ ID NO:371)S244K GCAATGGATGAAGTGATTGTTTCATCAACGACTAAÁGA
AGTAACGCCAATTATCGACATAGATG (SEQ ID NO:372)243-TS-244 -> GCAATGGATGAAGTGATTGTTTCATCAACGAATAAAGANK AGTAACGCCAATTATCGACATAGATG (SEQ ID NO:373)
243-TS-244 -> GCAATGGATGAAGTGATTGTTTCATCAACGAATCGTGANR AGTAACGCCAATTATCGACATAGATG (SEQ ID NO:374)
As regiões de codificação de mutante foram verificadas por seqüenciamentode DNA (Agencourt). Os plasmídeos verificados por seqüência foram trans-formados em células BL21(DE3) (Novagen, Madison, Wl).
Expressão e Ensaio
As culturas contendo 10O ml de LB com 50 pg/ml de canamicinaem um frasco tampado de 500 ml foram inoculadas com um ml de uma cul-tura durante a noite e cultivadas a 37 0C para uma densidade óptica de (em600 nm) de aproximadamente 0,6. A produção da proteína foi induzida porIPTG em uma concentração final de 1 mM. As células foram incubadas a 300C durante 4,5 horas após a adição do IPTG. As células foram centrifugadase congeladas a -80 0C. As células foram rompidas (preparadas empregando-se o reagente Novagen BugBusfer (Novagen, Madison, Wl) contendo 1pL/mL de benzonase nuclease, 5 pL/mL de coquetel Il de inibidor de protea-se, e 0,033 pL/mL de r-lisozima seguindo-se o protocolo recomendado porNovagen) e analisadas por SDS-PAGE. Os mutantes (141 -LRcD- 144 ->EYcY) e (243-TS-244 -> NR) resultaram em proteínas insolúveis sob ascondições nas quais eles foram preparados. O mutante 243-TS- 244~> NKnão possui atividade quantificável sob as condições testadas, e é provavel-mente uma enzima de atividade fraca em comparação com a tipo selvagemcomo é o mutante S244K.
As proteínas rotuladas por His foram purificadas como segue. Ascolunas ligadas por HIS (Novagen, Madison, Wl) foram equilibradas com 10ml_ de 100 mM de fosfato de potássio, pH 7,8, contendo 200 mM de NaCI e50 μΜ de PLP. Os extratos livres de célula foram carregados sobre a coluna.As colunas foram lavadas com 10 mL de tampão de equilíbrio, 10 mL detampão de equilíbrio contendo 25 mM de imidazol, e 10 mL de tampão deequilíbrio contendo 50 mM de imidazol. As proteínas foram eluídas com 5 mlde tampão de equilíbrio contendo 500 mM de imidazol. As proteínas foramdessalinizadas empregando-se colunas de PDIO as quais foram equilibradasem 100 mM de fosfato de potássio, pH 7,8 contendo 50 μΜ de PLP. As pro-teínas purificadas foram concentradas e quantificadas empregando-se o En-saio Bradford (Bio-Rad, Hercules, CA).
Os mutantes de D-aminotransferase foram ensaiados empre-gando-se 500 pg/ml de D- aminotransferase, 50 pg/ml do aldolase de SEQID NO:276, 4 mM de MgCI2, 50 mM de fosfato de potássio pH 8, 200 mM depiruvato de sódio, 0,05 mM de PLP e 20,4 mg/ml de D- triptofano para ascondições de ensaio. O volume final foi 1,25 ml. As amostras (200 pl) foramtomadas após 0,5, 1, 2 e 14 horas e congeladas até o experimento ser con-cluído. As amostras foram filtradas, diluídas 1 a 10, e analisadas porLC/MS/MS como descrito no Exemplo 1.
O 4978 D-aminotransferase tipo selvagem do Exemplo 25 foiempregado como uma referência para porcentagem de atividade relativa. ATabela 37 mostra a atividade relativa de cada mutante em cada ponto detempo.
Tabela 37
<table>table see original document page 425</column></row><table><table>table see original document page 426</column></row><table>
O Τ243Ν foi o melhor mutante de todos os testados para ativi-dade na produção de R5R monatina.
Exemplo 27
Estabilização do Mutante T243N da D-aminotransferase da linhagemATCC 4978
Como mostrado no Exemplo 25, a atividade inicial do mutanteT243N DAT é significantemente maior do que B. DAT sphaericus, porém aatividade diminui mais rapidamente. Os experimentos adicionais, empregan-do-se o protocolo anaeróbico descrito abaixo, indicaram que a atividade ini-ciai de 348 do mutante T243N DAT foi de até 8 vezes maior do que de B.DAT sphaericus, entretanto a atividade diminuiu rapidamente mesmo sob ascondições anaeróbicas. Os seguintes estudos foram feitos para tentar man-ter a atividade maior durante um período de tempo extendido.
O mutante T243N do D-aminotransferase de linhagem 4978(descrito no Exemplo 25) e o S. meliloti HMG aldolase foram purificados co-mo as proteínas rotuladas por ΗΙββ como abaixo descrito. O SEQ ID NO:276aldolase foi purificada como descrito no Exemplo 23.
Purificação do DAT de ATCC 4978 (T243N mutante)
O mutante T243N do D-aminotransferase de linhagem ATCC4978 com um rótulo de purificação HISe de terminal amino (descrito no E-xemplo 26) foi produzido empregando-se EMD Biosciences durante a noiteSistema Expresso II (soluções 1-6) (Novagen, Madison, Wl) contendo 50pg/mL de canamicina em frascos agitados. Este sistema de expressão induza expressão de sistemas induzíveis por IPTG sem a necessidade de monito-rar o crescimento celular. Após a inoculação de 200-mL de alíquotas domeio (em frascos de 1L) de culturas líquidas ou placas hospedeiras de E.coli BL21(DE3) carregando o gene para o mutante T243N D- aminotransfe-rase de linhagem ATCC 4978 sobre o plasmídeo pET28b, as culturas foramincubadas a 30°C durante a noite com agitação a 225 rpm. Quando oQD600 alcançou um mínimo de 6, as células foram colhidas por centrifuga-ção e lavadas uma vez com tampão.
O extrato livre de célula foi preparado empregando-se EMD Bi-osciences BugBusteF (amina livre primária) Reagente de Extração (Nova-gen, Madison, WT) contendo 1 pL/mL de Benzonase® Nuclease (Novagen,Madison, Wl), 5 pL/mL de Grupo Il de coquetel de inibidor de Protease (Cal-biochem - Novabiochem Corp., San Diego, CA), e 0,033 pL/mL de r-lisozima(Novagen, Madison, Wl) seguindo-se o protocolo do fabricante. Todas asetapas de purificação subseqüente foram realizadas a 4°C. O extrato de cé-lula foi centrifugado durante 20-30 minutos a 15.000 χ g para remover osresíduos celulares. 20-25 ml_ de alíquota do extrato livre de célula foi aplica-do a 45 mL de coluna de Resina de fluxo rápido GE Healthcare ChelatingSepharose™ (forma de níquel (II)) (GE Healthcare, Piscataway, NJ) que foipreviamente equilibrado com 100 mM de fosfato de potássio contendo 200mM de cloreto de sódio e 50 μΜ de PLP. Para gerar a forma de níquel daresina, a resina foi lavada com 150 mL de 200 mM de hexaidrato de sulfatode níquel (II) e em seguida com 150 mL de água destilada. Após carregar aamostra, a coluna foi lavada/eluída com 150 mL do tampão de equilíbrio con-tendo 25 mM de imidazol, 150 mL do tampão de equilíbrio contendo 50 mMde imidazol e 150 mL do tampão de equilíbrio contendo 500 mM de imidazol.Proteína rotulada por ΗΙββ eluída na última lavagem. Uma lavagem de 500- mM de imidazol foi concentrada com dispositivos de filtro centrífugo Millipo-re/Amicon Centricon Plus-70 (MWCO 10 kDa) (Millipore, Billerica, MA) para15-20 mL de acordo com as intruções do fabricante. O imidazol e cloreto desódio foram removidos por passagem através de colunas GE HealthcarePDIO disponíveis (GE Healthcare, Piscataway, NJ) (2,5 mL de amostra porcoluna) previamente equilibrados com 100 mM de fosfato de potássio, pH7,8 contendo 0,5 pM de PLP. A aminotransferase purificada foi eluída com3,5 mL por coluna do mesmo tampão. A concentração de proteína de cadafração foi determinada empregando-se o kit de ensaio Pierce BCA (Pierce,Rockford, IL) com BSA como a proteína padrão.
A pureza de cada fração e o nível de expressão na fração deextrato livre de célula foram determinados empregando-se um sistema dechip microcapilar Bio-Rad Experion (Bio-Rad1 Hercules, CA) ou empregando-se Bio-Rad 4-15% de géis de gradiente de SDS-poliacrilamida (Bio-Rad,Hercules, CA) executado em um dispositivo celular Mini PROTEAN® 3. Aproteína foi visualizada nos géis de poliacrilamida empregando-se coranteBio-Rad Bio-Safe G-250 Coomassie (Bio-Rad, Hercules, CA) e descoloradacom água. Tipicamente este procedimento produz ~ 20 mg de enzima 200mL durante a noite cultura que é 85-90% pura como avaliado pelo softwareExperion ou da varredura dos géis SDS-PAGE. As alíquotas (1-5 mL) daenzima purificada foram armazenadas a -80 sC até o emprego.
A purificação do SEQ ID NO: 276 aldolase é como descrita noExemplo 23.
Purificação do S. meliloti HMG aldolase
O S. meliloti HMG aldolase com um rótulo de purificação de HISede terminal amino (clonagem descrita no Pedido Publicado nos Estados Uni-dos ne 20040063175 e WO 03091396 A2) foi produzido por indução de de-senvolvimento de culturas em caldo de Luria-Bertani contendo 50 mg/L decanamicina com 0,2 mM de IPTG. Após a inoculação de 800-mL de alíquo-tas do meio de culturas líquidas ou placas hospedeiras de de E. coliBL21(DE3) carregando o gene para o S. meliloti HMG aldolase empET30(Xa/LIC), as culturas foram incubadas a 37°C com agitação a 225rpm. Quando a densidade óptica alcançou um OD6OOnm de 0,5-0,75, o IPTGfoi adicionado e as culturas foram incubadas a 30°C com agitação a 225 rpmdurante 4 horas. As células foram colhidas por centrifugação e lavadas umavez com tampão.
Para preparar o extrato livre de célula contendo o S. meliloti al-dolase, as células foram suspensas em 3-4 volumes de 50 mM de EPPSácido (N-(2-hidroxietil)piperazina-N'-(3-propanossulfônico), pH 8,2 contendo100 mM de NaCI e em seguida rompidas empregando-se um homogeniza-dor Microfluídicos (Microfluidics, Newton, MA) (3 passagens a 1.265,5262kg/cm2 (18.000 psi)), mantendo a temperatura da suspensão em menos doque 15°C. A suspensão celular foi centrifugada durante 20-30 minutos a15.000-20.000 χ g para remover o resíduo celular. A proteína rotulada porHIS6 foi purificada empregando-se colunas EMD Biosciences HIS-Bind®(Novagen, Madison, Wl) seguindo-se o protocolo recomendado pelo fabri-cante com uma exceção: As colunas foram lavadas com uma solução 1:1 detampão de ligação : tampão de lavagem no lugar do tampão de lavagem so-zinho. A fração de eluição foi concentrada com Millipore/Amicon 15 mL dedispositivos de filtro centrífugo (MWCO 5 kDa) (Millipore, Billerica, MA) para7-10 mL de acordo com as instruções do fabricante. O imidazol e o cloretode sódio foram removidos por passagem através de colunas GE HealthcarePDIO disponíveis (GE Healthcare, Piscataway, NJ) (2,5 mL de amostra porcoluna) previamente equilibrados com 50 mM de EPPS, pH 8,2 contendo100 mM de NaCI. O aldolase purificado foi eluído com 3,5 mL por coluna domesmo tampão. A concentração de proteína de cada fração foi determinadaempregando-se o kit de ensaio Pierce BCA (Pierce, Rockford, IL) empregan-do-se BSA como a proteína padrão.
A pureza de cada fração e o nível de expressão na fração deextrato livre de célula foram determinados empregando-se Bio-Rad 4-15%de géis de gradiente de SDS-poliacrilamida (Bio- Rad, Hercules, CA) execu-tados em um dispositivo celular Mini PROTEAN® 3. A proteína foi visualizadanos géis de poliacrilamida empregando-se corante Bio-Rad Bio-Safe G-250Coomassie (Bio-Rad, Hercules, CA) e descolorada com água. Tipicamente,este procedimento produz -15-20 mg de enzima de 800 mL de cultura e é85-95% puro. As alíquotas (1-5 mL) da enzima purificada foram armazena-das a -80° C até o uso.
Ensaios de produção de monatina
Os tubos de polipropileno cônicos (14 mL) contendo 143 mg deD-triptofano foram desoxigenados em uma caixa de luvas anaeróbica duran-te a noite. As soluções de matéria-prima de 1 M de tampão de EPPS (pH8,2), 2 M de MgCI2, 2 M de piruvato de sódio e 10 mM de PLP foram prepa-radas em água desgaseificada e equilibradas em uma caixa de luvas anae-róbica durante a noite. As soluções de matéria-prima de 10% (v/v) Tween80, 1% (v/v) de Tween 20, 1% (v/v) de Triton X-100, 100% de acetona,100% de etanol e 50% (peso/volume) de glicerol foram equilibradas na caixade luvas anaeróbica junto a 0,7 g por cada trealose, inositol, sorbitol e eritri-tol em 2 mL de tubos de microcentrífuga. As preparações das enzimas puri-ficadas foram descongeladas sobre gelo e empregadas imediatamente nacaixa de luvas anaeróbica. As soluções de matéria-prima foram adicionadasa 14 mL de tubos cônicos para fornecer uma concentração final de 100 mMde EPPS, 200 mM de piruvato, 100 mM de triptofano, 1 mM de MgCI2, 0,05mM de PLP, 0,5 mg/mL de D-aminotransferase, e 0,01 mg/mL de SEQ IDNO:276 aldolase ou 0,05 mg/mL de S. meliloti HMG aldolase. Os componen-tes de estabilização de enzima propostos foram adicionados em várias con-centrações finais (Tabelas 38 e 39) para levar o volume de reação final a 7mL por tubo. As reações foram incubadas em temperatura ambiente na cai-xa de luvas anaeróbica com agitação suave durante até 24 horas. As amos-tras foram removidas periodicamente e analisadas para monatina como des-crito no Exemplo 1 empregando-se o método de monitoramento de reaçãomúltipla LC/MS/MS. As taxas iniciais foram calculadas das amostras retira-das entre 0 e 3 horas após a adição da enzima.
Tabela 38
<table>table see original document page 430</column></row><table><table>table see original document page 431</column></row><table>
Tabela 39 (SEQ ID NO: 276 aldolase)
<table>table see original document page 431</column></row><table>
A adição de 0,01% - 0,1% (v/v) de detergente, tal como Triton X-100, Tween 20 ou Tween 80, ou 1% - 10% (peso/volume) poliol, tal comoglicerol, trealose, inositol ou sorbitol, melhorou a estabilidade da T243N D-aminotransferase durante o tempo de vida do experimento.
Exemplo 28
Clonagem de Aminoácido Racemase de Ampla Especificidade (BAR) dePseudomonasputida KT2440
Um BAR foi identificado em P. putida KT2440 empregando-se ainformação da literatura (Roise, D., Soda, K., Yagi, T., Walsch, C.T., Bio-chemistry 23, 5195-5201, (1984)). O sítio ativo de uma enzima de BAR de P.striata foi seqüenciado e relatado - LTAVLKADAYGXGIGL (SEQ ID NO:375).Esta seqüência foi empregada para BLAST a seqüência do genoma P. puti-da KT2440 disponível em NCBI. Uma proteína com uma seqüência de con-senso quase idêntico foi identificada. Os iniciadores foram destinados clonaro gene do DNA genômico obtido do American Type Culture Collection(ATCC, Manassas, VA)
(5'-AGAAGACATATGCCCTTTCGCCGTAGGG-3' (SEQ ID N0.376 e
5'-AGAAGAGGATCCTCAGTCGACGAGTATCTTCG-3') (SEQ ID NO:377)).
O PCR foi conduzido sob condições padrão e o produto de PCRfoi purificado {kit de purificação QIAquick PCR, Qiagen1 Valencia, CA). Oproduto de PCR purificado foi digerido com Nde I e BarnA I. O produto dePCR digerido foi purificado por gel {kit QIAquick Gel Extraction, Qiagen1 Va-lencia, CA) e ligado a pET30 e pET28 que foi digerido e purificado por gel deuma maneira similar. Os clones com inserções foram seqüenciados (Agen-court, Beverly1 MA) e isolados com a seqüência correta, foram identificados(pET30 KT2440 BAR e pET28 KT2440BAR) e empregados nos estudos pos-teriores.
A seqüência do KT2440 BAR DNA é:atgccctttcgccgtacccttctggctgcatccctggcacttctgatcaccggacaggcccccctgtatgcggcaccaccgttgtcgatggacaacggcaccaacaccctgaccgtgcaaaacagcaatgcctgggtcgaagtcagcgccagcgccctgcagcacaacatccgcacgctgcaggccgagctggccggcaagtccaagctgtgcgccgtgctcaaggccgatgcctatggccacggtatcggcctggtaatgccatcgatcatcgcccaaggcgtgccctgcgtggcggtggccagcaacgaggaggcccgcgtggtccgcgccagtggcttcaccgggcaactggtgcgggtacgcctggccagcctcagcgagctggaagatggcttgcagtacgacatggaagagctggtgggcagcgcggaatttgcccgccaggccgatgccatcgccgcgcgccatggcaagaccttgcgcattcacatggcgctcaactccagcggcatgagccgcaacggggtggagatggccacctggtccggccgtggcgaagcgctgcagatcaccgaccagaagcacctcaagctggtcgcgctgatgacccacttcgccgtggaagacaaggacgatgtacgcaagggcctggcggcattcaacgagcagaccgactggttgatcaagcacgccaggctggaccgcagcaagctcaccctgcacgccgccaactcgttcgctacgctggaagtgccggaagcgcgcctggacatggtacgaacgggtggcgcgctgttcggcgacaccgtgccggcgcgcaccgagtacaaacgtgcgatgcagttcaaatcgcacgtggcggcggtgcacagctatccggccggcaacaccgtgggctatgaccgcaccttcaccctggcccgtgattcgcggctggccaacattacggtcgggtactccgatggctaccgccgggtattcaccaacaagggccatgtgctgatcaacggccaccgtgtgccggtcgtgggcaaggtgtcgatgaacacgctgatggtcgatgtcaccgacttccctgatgtgaaggggggtaacgaagtggtgctgttcggcaagcaggccgggggcgaaatcacccaggccgagatggaagaaatcaacggcgcgttgctcgccgatttgtacaccgtatggggcaattccaacccgaagatactcgtcgactga(SEQ ID NO:378).
A seqüência de KT2440 BAR aminoácido é:Mpfrrtllaaslallitgqaplyaapplsmdngtntltvqnsnawvevsasalqhnirtlqaelagksklcavlkadayghgiglvmpsiiaqgvpcvavasneearvvrasgftgqlvrvrlaslseledglqydmeelvgsaefarqadaiaarhgktlrihmalnssgmsrngvematwsgrgealqitdqkhlklvalmthfavedkddvrkglaafneqtdwlikharldrskltlhaansfatlevpearldmvrtggalfgdtvparteykramqfkshvaavhsypagntvgydrtftlardsrlanitvgysdgyrrvftnkghvlinghrvpvvgkvsmntlmvdvtdfpdvkggnevvlfgkqaggeitqaemeeingalladlytvwgnsnpkilvd(SEQ ID NO:379)
B) Purificação de P. putida KT2440 BAR.
O plasmídeo de pET30 KT2440 BAR descrito acima foi trans-formado em BL21 DE3 pLysS (Invitrogen, Carlsbad1 CA). A linhagem resul-tante foi desenvolvida em LB ou Caldo Terrífico a 37° C com aeração aOD6Qonm de 0,4-0,6 e induzido com 1 mM de IPTG. A incubação foi continu-ada 3-4 horas a 37° C com aeração. As células foram colhidas por centrifu-gação e o pélete celular foi armazenado a -80 0C até o uso. O pélete celularfoi descongelado sobre gelo. As células foram Iisadas com BugBuster (No-vagen, Madison, Wl) e Benzonase (Novagen, Madison, Wl). O resíduo decélula foi removido por centrifugação e o extrato livre de célula foi emprega-do imediatamente ou armazenado a -80° C. O gene K.T2440 BAR foi tam-bém clonado em sítios NdeI-BamHI de pET28 e transformado em BL21 DE3pLysS. Esto constructoparece não-expressar proteína solúvel muito eficien-temente assim a versão não-rotulada (pET30 KT2440 BAR) foi empregadaem estudos futuros.
O extrato foi aplicado a uma coluna UnoQ (Bio-Rad, Hercules,CA) que foi equilibrada com pelo menos 5 volumes de coluna de tampão A(25 mM de fosfato de potássio pH 8,0, 10 μΜ de piridoxal-5 '-fosfato (PLP)).
A coluna foi lavada com 2 volumes de coluna de tampão A. A proteína foieluída com um gradiente linear do tampão B (tampão A + 1 M de NaCI) de 0-100% do tampão B sobre 20 volumes de coluna e 5 ml de frações foram co-letados na hora que o gradiente iniciou. As frações foram ensaiadas empre-gando-se o método Amplex Red descrito no Exemplo 4-parte 7. Recente-mente, 100 pg de D-aminoácido oxidase (Sigma- Aldrich, St. Louis, MO),0,05 mM de FAD, 25 mM de L-trp, e um pequeno volume da fração a serensaiada foram combinados em 50 pL de H2O e adicionados a 50 pL detampão de reação Amplex Red preparados como direcionado no protocolodo fabricante. As frações com atividade foram dessalinizadas com uma colu-na PD-10 (GE Healthcare, Piscataway. NJ) e concentradas com concentra-dores centrífugos Amicon (Millipore, Billercia, MA). A proteína purificada foiarmazenada a -80 0C.
C) Produção e ensaio de um mutante de alanina racemase Y354A deGeobacillus stearothermophilus com atividade de triptofano racemase
O Geobacillus stearothermophilus alanina racemase tipo selva-gem (SEQ ID N0:380, mostrado abaixo foi clonado em pET30 foi emprega-do como um modelo para a Mutagênese direcionada ao sítio para fazer aalteração de Y354A. O gene de SEQ ID N0:380 pode ser amplificado porprotocolos de PCR padrão e clonado empregando-se técnicas de DNA re-combinante padrão. O gene de SEQ ID N0:380 pode também ser reconstru-ído por qualquer método conhecido por uma pessoa versada na técnica, talcomo métodos de PCR de constructo conhecidos por alguém versado natécnica.
O DNA Geobacillus stearothermophilus alanina racemase tiposelvagem e as seqüências de aminoácido são mostrados abaixo como SEQID N0:380:
atggacgagt ttcaccgcga tacgtgggcg gaagtggatt tggacgccat ttacgacaat gtgga-gaatt tgcgccgttt gctgccggac gacacgcaca ttatggcggt cgtgaaggcg aacgcctatggacatgggga tgtgcaggtg gcaaggacag cgctcgaagc gggggcctcc cgcctggcggttgccttttt ggatgaggcg ctcgctttaa" gggaaaaagg aatcgaagcg ccgattctagttctcggggc ttcccgtcca gctgatgcgg cgctggccgc ccagcagcgc attgccctgaccgtgttccg ctccgactgg ttggaagaag cgtccgccct ttacagcggc ccttttccta ttcatttccatttgaaaatg gacaccggca tgggacggct tggagtgaaa gacgaggaag agacgaaacg a -atcgtagcg ctgattgagc gccatccgca ttttgtgctt gaaggggtgt acacgcattt tgcgactgcggatgaggtga acaccgatta tttttcctat cagtataccc gttttttgca catgctcgaa tggctgccgtcgcgcccgcc gctcgtccat tgcgccaaca gcgcagcgtc gctccgtttc cctgaccgga cgtt-caatat ggtccgcttc ggcattgcca tgtatgggct tgccccgtcg cccggcatca agccgctgctgccgtatcca ttaaaagaag cattttcgct ccatagccgc ctcgtacacg tcaaaaaact gcaac-caggc gaaaaggtga gctatggtgc gacgtacact gcgcagacgg aggagtggat cgggac-gatt ccgatcggct atgcggacgg ctggctccgc cgcctgcagc actttcatgt ccttgttgac gga-caaaagg cgccgattgt cggccgcatt tgcatggacc agtgcatgat ccgcctgcct ggtccgctgccggtcggcac gaaggtgaca ctgattggtc gccaagggga cgaggtaatt tccattgatgatgtcgctcg ccatttggaa acgatcaact acgaagtgcc ttgcacgatc agttatcgag tgccccg-tat ttttttccgc cataagcgta taatggaagt gagaaacgcc gttggccgcg ga(SEQ ID N0:380).
A seqüência de aminoácido codificada do Alanina Racemase(Geobacillus stearothermophilus) é mostrada abaixo como SEQ ID NO:381:Met Asp Glu Phe His Arg Asp Thr Trp Ala Glu Val Asp Leu Asp Ala Ile TyrAsp Asn Val Glu Asn Leu Arg Arg Leu Leu Pro Asp Asp Thr His Ile Met AlaVal Val Lys Ala Asn Ala Tyr Gly His Gly Asp Val Gln Val Ala Arg Thr Ala LeuGlu Ala Gly Ala Ser Arg Leu Ala Val Ala Phe Leu Asp Glu Ala Leu Ala LeuArg Glu Lys Gly Ile Glu Ala Pro Ile Leu Val Leu Gly Ala Ser Arg Pro Ala AspAla Ala Leu Ala Ala Gln Gln Arg Ile Ala Leu Thr Val Phe Arg Ser Asp Trp LeuGlu Glu Ala Ser Ala Leu Tyr Ser Gly Pro Phe Pro Ile His Phe His Leu Lys MetAsp Thr Gly Met Gly Arg Leu Gly Val Lys Asp Glu Glu Glu Thr Lys Arg Ile ValAla Leu Ile Glu Arg His Pro His Phe Val Leu Glu Gly Val Tyr Thr His Phe AlaThr Ala Asp Glu Val Asn Thr Asp Tyr Phe Ser Tyr Gln Tyr Thr Arg Phe LeuHis Met Leu Glu Trp Leu Pro Ser Arg Pro Pro Leu Val His Cys Ala Asn SerAla Ala Ser Leu Arg Phe Pro Asp Arg Thr Phe Asn Met Val Arg Phe Gly IleAla Met Tyr Gly Leu Ala Pro Ser Pro Gly Ile Lys Pro Leu Leu Pro Tyr Pro LeuLys Glu Ala Phe Ser Leu His Ser Arg Leu Val His Val Lys Lys Leu Gln ProGly Glu Lys Val Ser Tyr Gly Ala Thr Tyr Thr Ala Gln Thr Glu Glu Trp Ile GlyThr Ile Pro Ile Gly Tyr Ala Asp Gly Trp Leu Arg Arg Leu Gln His Phe His ValLeu Val Asp Gly Gln Lys Ala Pro Ile Val Gly Arg Ile Cys Met Asp Gln Cys MetIle Arg Leu Pro Gly Pro Leu Pro Val Gly Thr Lys Val Thr Leu Ile Gly Arg GlnGly Asp Glu Val Ile Ser Ile Asp Asp Val Ala Arg His Leu Glu Thr Ile Asn TyrGlu Val Pro Cys Thr Ile Ser Tyr Arg Val Pro Arg Ile Phe Phe Arg His Lys ArgIle Met Glu Val Arg Asn Ala Val Gly Arg Gly (SEQ ID NO:381)
A mutagênese foi realizada empregando-se o kit QuickChange-Multi Site-directed mutagenesis (Stratagene, La Jolla, CA). O seguinte inicia-dor mutagênico foi empregado para fazer a alteração de Y354A, 5'-gccatttggaaacgatcaacgcggaagtgccttgcacgatcag-3' (SEQ ID NO:382). A Mu-tagênese direcionada ao sítio foi feita como descrito no protocolo do fabri-cante. Vários isolados foram seqüenciados (Agencourt, Beverly1 MA) e umisolado com a seqüência correta foi selecionado e empregado para outravarredura.
O mutante sozinho pET30Y354A foi transformado em E. coliBL21 (DE3)pLysS. A proteína purificada foi preparada da seguinte maneira. Alinhagem foi desenvolvida em LB ou caldo terrífico (a 37° C com aeração)para um OD6oonm de 0,4 - 0,6 e induzida com 1 mM de IPTG. A incubação foicontinuada a 37° C com aeração durante ~3 horas. As células foram colhi-das por centrifugação e o pélete celular foi armazenado a -80° C.
O pélete celular foi descongelado sobre gelo e em seguida re-suspenso em um volume apropriado de BugBuster (Novagen, Madison, WT)mais Benzonase nuclease (Novagen, Madison, Wl). O resíduo de célula foiremovido por centrifugação, e o extrato livre de célula foi aplicado a uma co-luna de ligação de HIS (Novagen, Madison, Wl) que foi equilibrada com tam-pão de ligação. A coluna foi lavada com tampão de ligação e tampão de la-vagem e a proteína foi eluída com tampão de eluição (como direcionado noprotocolo do fabricante). A proteína purificada foi dessalinizada empregando-se uma coluna de PD-10 (GE Healthcare, Piscataway, NJ). A proteína foidessalinizada em 50 mM de fosfato de potássio pH 8,0 e 10 μΜ de piridoxal-5'-fosfato de acordo com o protocolo do fabricante. A proteína foi concentra-- da empregando-se um concentrador centrífugo Amicon (Millipore, Billercia,MA). A proteína purificada e concentrada foi dividida em pequenas alíquotase armazenadas a -80° C antes do uso.
O Y354A purificado foi comparado a alanina racemase tipo sel-vagem (preparado da maneira descrita acima) em ambos ensaios de alaninae triptofano. Os ensaios foram realizados a 37 0C em 50 mM de tampão defosfato de potássio, pH 8, e 10 μΜ de PLP empregando-se 400 μί de proteí-na purificada concentrada (>1 mg/ml) e 50 mM de substrato. A detecção deD-alanina e D-triptofano foi realizada empregando-se a metodologia de ami-noácido quiral descrita no Exemplo 1.Tabela 40
<table>table see original document page 437</column></row><table>
*nd= nada detectado
Estes dados foram analisados sem o uso de um padrão interno;desse modo, estes dados são semi-quantitativos e devem ser empregadospara propósitos comparativos. Apesar de tudo, estes resultados mostramque a mutação única de Y354A é suficiente para ampliar a especificidade doalanina racemase para que possa catalizar a racemização de aminoácidoempregando-se substratos alternativos.
D) Ensaio da enzima BAR.
A enzima BAR foi ensaiada como segue. Os ensaios AmplexRed foram estabelecidos como descritos neste exemplo. P. putida KT2440BAR foi empregado em 200 pg (purificado como descrito neste exemplo). G.stearothermophitus alanina racemase tipo selvagem e o Y354A foram purifi-cados como descrito neste exemplo e empregados a 200 ug/mL ou 1000ug/mL. CE é o extrato livre de célula que foi preparado como descrito nesteexemplo. Os resultados para o ponto de tempo 60 minutos são mostrados naTabela 41 abaixo.
Tabela 41
<table>table see original document page 438</column></row><table>
A proteína purificada foi também ensaiada para a atividade detriptofano racemase em 50 mM de fosfato de potássio pH 8, 10 μΜ de PLP1e 30 mM de L-triptofano como acima descrito. 200 pg/mL ou 1000 pg/mL deenzima purificada foi empregado nos ensaios (indicados nos parênteses). D-triptofano foi analisado empregando-se o método de aminoácido quiral des-crito no Exemplo 1 para detecção.
Tabela 42
<table>table see original document page 438</column></row><table><table>table see original document page 439</column></row><table>
Os ensaios indicam que a enzima P. putida KT2440 BAR é muitomais ativa sobre triptofano do que a enzima derivada de G.stearothermophHus e o mutante de Y354A desta.E) Produção de monatina com P. putida KT2440 BAR.
Um ensaio de produção de monatina foi feito com o P. putidaKT2440 BAR purificado (como acima purificado) (100 pg) ou Y354A purifica-do (como acima purificado) (500 pg), D-aminotransferase (BioCataIytics AT-103 (Pasadena, CA)) (500 pg), e o aldolase de SEQ ED NO:276) (como puri-ficado no Exemplo 23) (50 μς). O experimento de produção de monatina ini-ciando com L-triptofano foi feito como segue. Além das enzimas acima, asseguintes foram adicionadas por 1 mL de mistura reacional: 4 mM de MgCfe150 mM de L- triptofano, 100 mM de piruvato de sódio, 100 mM de tampão defosfato de potássio pH 7,5, e 0,05 mM de PLP.
Como um controle, o experimento foi feito como descrito acimasem racemase e iniciando com D-triptofano no lugar de L-triptofano. Um su-mário dos resultados é apresentado na Tabela 43 abaixo.
Tabela 43
<table>table see original document page 440</column></row><table>
Nenhuma monatina foi detectada empregando-se Y354A nesteexperimento. Esta racemase foi empregada no passado (dados não mostra-dos) para produzir monatina, porém um nível muito maior de enzima foi em-pregado (pelo menos 2 mg e até 10 mg para ver níveis maiores de monati-na). O P. putida KT2440 BAR foi empregado para produzir monatina a partirde L-triptofano. Os 100 pg empregados neste experimento não foram o bas-tante para ver a produção de monatina após duas horas porém foram o bas-tante para ver a produção de monatina após 18 horas. A distribuição de es-tereoisômero indicou que a maioria da monatina produzida é o isômero R,R.Nenhum isômero R,S foi produzido. Este resultado indica que KT2440 BARnão é capaz de detectavelmente raeemizar o isômero R1R da monatina (ra-cemização do isômero R,R produziria o isômero R,S). Existiu uma quantida-de significante do isômero S5S produzido neste experimento. Isto é prova-velmente devido ao fato que o AT-103 empregado neste experimento não éaltamente purificado e pode conter L- aminotransferases do extrato celular, eque existe uma quantidade maior de L- triptofano presente para servir comoum doador de amino para transaminação de S-MP.
Exemplo 29
Clonagem e expressão de Pseudomonas taetrolens Arginina RacemaseAvaliação Experimental
Pseudomonas taetrolens (também conhecido como P. graveo-lens) arginina racemase (Genbank Accession No. AB096176, seqüência deácido nucléico) e um mutante de 1384M deste, foi clonado, expresso, e tes-tado para a atividade na conversão de L-triptofano para D-triptofano. Estegene é 72% idêntico ao gene P. putida BAR de KT2440 e 73% idêntico aogene P. putida BAR de NBRC 12996 acima descrito. A seqüência de amino-ácido é 72% idêntica a ambas proteínas P. putida BAR.
Protocolo de Reação de Cadeia de Polimerase
Pseudomonas taetrolens (ATCC 4683) foi desenvolvido em cal-do nutriente a 28 0C com agitação a 225 rpm. A reação de cadeia de polime-rase foi realizada em todas as células empregando-se os iniciadores desig-nados com os sítios de restrição 5' e projeta-se para clonagem nos vetorespET 28 e pET30 (Novagen, Madison, WT).
As seqüências de iniciador foram:terminal Ν: 5'-ATAATACATATGCCCTTCTCCCGTACCC -3' (SEQ IDN0:408) e
terminai c: Si-Gcggcgggatccttactgatctttcaggatt-S' (seq idn0:409).
O gene derivado de P. taetrolens foi amplificado empregando-seo seguinte protocolo PCR. 25 μL de células de crescimento foram Iisados a96 0C durante 10 minutos. O resíduo de célula foi removido por centrifuga-ção e o sobrenadante foi empregado como modelo para PCR. Uma reaçãode 100 pL continha 5 μL de modelo (sobrenadante de célula lisada), 1,6 μΜde cada iniciador, 0,3 mM de cada dNTP, 10 U rTth Polimerase XL (AppliedBiosystems, Foster City, CA), tampão IX XL e 1 mM de Mg(OAc)2. O pro-grama termociclizador empregado incluiu um início quente a 94 0C durante 3minutos, 8 repetições das seguintes etapas: 94 0C durante 30 segundos, 520C durante 30 segundos, e 68 0C durante 2 minutos, seguido por 22 repeti-ções das seguintes etapas : 94 0C durante 30 segundos, 58 0C durante 30segundos, e 68 0C durante 2 minutos. Após 22 repetições, a amostra foimantida a 68 0C durante 7 minutos e em seguida armazenada a 4 0C. Esteprotocolo de PCR produziu um produto de 1230 pares de base.
Clonagem
O produto de PCR foi purificado por gel de 0,8% de gel de TAE-agarose empregando-se o kit de extração de gel Qiagen (Qiagen, Valencia,CA). O produto foi TOPO clonado e transformado em células TOP 10 de a-cordo com o protocolo do fabricante (Invitrogen, Carlsbad, CA). O DNA deplasmídeo foi purificado dos transformantes resultantes empregando-se o kitQiagen spin miniprep (Qiagen, Valencia, CA) e avaliado para a correta inser-ção por digesto de restrição com Nde I e BamH I. As seqüências de plasmí-deos parecendo ter a correta inserção foram verificadas por seqüenciamentode DNA de terminação de cadeia de dideóxi com iniciadores universais M 13dianteiros e M 13 reversos.
O clone TOPO correto foi digerido com enzimas de restrição Nde1 e BamH I seguindo-se os protocolos recomendados pelo fabricante (NewEngland Bíolabs, Beverly, MA) e purificado por gel de 0,8% de géis TAE-agarose empregando-se o kit de extração de gel Qiagen (Qiagen, Valencia,CA). Os vetores pET 28 e pET 30 foram preparados por digestão com enzi-mas de restrição Nde I e BamH I seguido pelo tratamento com fosfatase al-calina de camarão (Roche, Indianapolis1 IN) e purificação de 0,8% de géis deTAE-agarose empregando-se o kit de extração de gel Qiagen (Qiagen, Va-lencia, CA). Os vetores digeridos e inseridos foram ligados empregando-se okit Rapid ™ DNA Ligation (Roche, Indianapolis1 IN). Aproximadamente, 50ng de inserção tratado, 100 ng de vetor tratado (3 a 1 relação molar de in-serção para vetor), 5 U de T4 DNA ligase, e tampão de ligação IX foram in-cubados durante 5 minutos em temperatura ambiente. A reação de ligaçãofoi dessalinizada empregando-se o kit High Pure PCR Product Purification(Roche, Indianapolis, IN) e empregada para transformar células eletrocom-ponentes de E. coli DH10B (Invitrogen, Carlsbad, CA). Dez μ1_ de cada rea-ção de ligação foram adicionados a 40 pL de células DH10B, que foramtrânsformadas por eletroporação empregando-se BioRad Gene Pulsar Il sobas seguintes condições: 2,5 kV, 25 pF, 200 ohm em uma cubeta de 0,2 cm.As células foram deixadas recuperar em 1 mL de SOC em temperatura am-biente durante 1 hora a 37 0C com agitação a 225 rpm. As células foram se-meadas sobre placas LB contendo canamicina (50 pg/mL). O DNA de plas-mídeo foi purificado dos transformantes resultantes empregando-se o kit Qi-agen spin miniprep (Qiagen, Valencia, CA) e avaliado para a correta inser-ção por digesto de restrição com Nde I e BamH I.Ensaios e Expressão de Gene
O DNA de plasmídeo foi transformado em hospedeiro de ex-pressão de E. coli BL21(DE3) pLysS (Novagen, Madison, Wl). As culturasforam desenvolvidas e os plasmídeos foram isolados empregando-se o kitQiagen miniprep (Qiagen, Valencia, CA) e analisadas por digesto de restri-ção para confirmar a identidade.
A indução em BL21DE3 pLysS foi inicialmente realizada em am-bos vetores pET 28 (rotulado por histidina) e pET 30 (não-rotulado). Um es-tudo de curso do tempo foi realizado com culturas desenvolvidas a 37 0C em100 mL de LB contendo canamicina (50 mg/L) para um OD6qO de 0,5 e indu-zido com 100 μΜ de IPTG (isopropil tiogalacatosídeo) e tirado amostra em 0e 3 horas após a indução. As células dos pontos de tempo 0 hora e 3 horasforam resuspensas em tampão de sulfato de dodecila de sódio IX contendo2-mercaptoetanol e aquecidas a 95°C durante 10 minutos, e resfriadas. Asalíquotas destas amostras de proteína celular total foram analisadas porSDS-PAGE empregando-se 4-15% de gel gradiente.
Os extratos de célula foram também preparados das culturas de3 horas suspendendo-se os péletes de célula de 5 mL de cultura em reagen-te Novagen BugBuster™ contendo benzonase nuclease e grupo de coquetelinibidor de protease #3 (Calbiochem-Novabiochem Corp., San Diego, CA)em temperatura ambiente durante 20 minutos com agitação suave e centri-fugação a 16.000 χ g para remover o resíduo de célula. Os sobrenadantes(extratos de célula) foram carregados em géis de gradiente a 4 - 15% paravarredura das proteínas solúveis celulares.
A amostra de 3 horas de P. taetrolens arginina racemase clona-do mostrou uma faixa de proteína total que correspondeu ao tamanho corre-to (aproximadamente 45 kDa) no vetor pET 30 (não-rotulado). O produto degene P. taetrolens pET 30 foi superexpresso em um nível maior do que oproduto de gene P. taetrolens pET 28 (rotulado por histidina), porém nenhumdos vetores forneceu uma faixa de proteína solúvel visível.
As células das culturas induzidas (100 mL) foram centrifugadase lavadas uma vez com 0,85 % de NaCI. Os péletes de célula foram resus-pensas em 5 mL/g de peso de célula úmida do reagente BugBuster™ (No-vagen, Madison, Wl) contendo 5 pL/mL do grupo de coquetel inibidor de pro-tease #3 (Calbiochem-Novabiochem Corp., San Diego, CA) e 1 pL/mL debenzonase nuclease. As amostras foram incubadas em temperatura ambien-te durante 20 minutos em um agitador orbital. O resíduo de célula insolúvelfoi removido por centrifugação a 16.000 X g durante 20 minutos a 4°C.
Os extratos de célula foram ensaiados para atividade de triptofa-no racemase empregando-se o seguinte protocolo. Reações de 1 mL foramrealizadas em 50 mM de fosfato de potássio (pH 8,0), 0,05 mM de PLP e 30mM de L triptofano. As reações foram iniciadas pela adição de extratos livrede célula e foram incubadas a 30 0C durante a noite. As alíquotas de amos-tra foram tomadas após a incubação durante a noite (amostras de zero mi-nuto serviram como reação de controle). O ácido fórmico concentrado (5 μΙ_)foi adicionado a cada 250 μΙ_ de alíquota de amostra para interromper a rea-ção e a proteína precipitada foi removida por centrifugação. Os sobrenadan-tes foram removidos e congelados a -80 0C até eles serem analisados paraD-triptofano pelo método de aminoácido quiral descrito no Exemplo 1.
Os resultados do ensaio dos extratos de célula de indução depET28 e pET30 com 100 μΜ de IPTG (3 horas) demonstram que os clonesde P. taetrolens mostraram atividade de racemase em L-triptofano. Nova-mente, a versão rotulada do BAR parece ser menos ativa e pode precipitarou ser menos solúvel do que a não-rotulada (pET28). A tabela 44, abaixo,mostra os resultados iniciais, embora não quantitativos como a proteína so-lúvel muito pobre foi obtida.
Tabela 44
<table>table see original document page 445</column></row><table>
A indução do constructode pET30 (não-rotulado) foi repetidaempregando-se as mesmas condições como mencionado acima e uma faixade proteína solúvel visível foi observada em SDS-PAGE. O ensaio foi repeti-do empregando-se as mesmas condições descritas acima e os resultados,como mostrados na Tabela 45 abaixo, foram obtidos.Tabela 45
<table>table see original document page 446</column></row><table>
Novamente, foi notado que a duplicação dos volumes não sobepara mais atividade. Para trabalho futuro, foi determinado remover a proteínade Bugbuster tão rapidamente quanto possível após a preparação de extra-tos de célula e para armazenar a proteína em 50 mM de tampão de fosfatopH 8 contendo 0,01 mM de PLP. O detergente em Bugbuster pode inibir areação ou causar uma perda de atividade na armazenagem.
A indução do constructode pET30 foi realizada novamente e oextrato de célula foi processado com cromatografia de permuta de ânion(como no Exemplo 28) para fornecer um extrato mais puro. O .ensaio foi re-petido com esta prep. parcialmente purificada. Os números nos parêntesesna coluna de extrato de Racemase da tabela 46 abaixo indica a quantidadeaproximada de enzima de racemase parcialmente purificada empregada noensaio. Os resultados do ensaio são mostrados na Tabela 46 abaixo.
Tabela 46
<table>table see original document page 446</column></row><table><table>table see original document page 447</column></row><table>
A não-linearidade da amostra durante a noite neste caso é pro-vavelmente devido ao fato de que as reações estão alcançando equilíbrio.Evidentemente, o P taetrolens BAR possui uma atividade significante pararacemização de triptofano, como fazem os 12996 BAR e KT2440 BAR. Pa-rece que o KT2440 BAR e o P. taetrolens BAR possuem atividade similar, aqual é ligeiramente maior do que 12996 BAR.
A seqüência de DNA do P. taetrolens arginina racemase é mos-trada abaixo como SEQ ID N0:410. A seqüência de PCR forneceu duas al-terações quando comparada com a seqüência de NCBI publicada. Especifi-camente, a seqüência de PCR continha uma adenosina em vez de umaguanina na posição 902 e uma citosina em vez de uma guanina na posição921. Estas alterações de DNA resultaram em uma mutação silenciosa bemcomo uma alteração de glicina para aspartato na posição 301 do aminoácido.
ATGCCCTTCTCCCGTACCCTGCTCGCCCTTTCCCTTGGCATGGCATTGCTGCAAAACCCGGCCTTTGCTGCGCCACCCCTGTCGATGACCGACGGCGTAGCTCAAGTGAATACCCAGGACAGCAATGCCTGGGTCGAAATCAATAAAGCCGCGTTCGAGCACAACATACGGACTCTGCAAACCGCCCTCGCCGGCAAGTCGCAGATCTGCGCCGTACTCAAGGCGGATGCCTATGGCCACGGTATCGGCTTGTTGATGCCCTCGGTGATCGCCATGGGTGTTCCCTGTGTCGGTGTCGCCAGCAACGAAGAAGCCCGCGTCGTGCGCGAGAGCGGTTTCAAGGGTCAACTGATACGCGTGCGCACCGCTGCCCTGAGCGAACTGGAAGCTGCACTGCCGTACAACATGGAAGAGCTGGTGGGCAACCTGGACTTCGCGGTCAAGGCCAGCCTGATTGCCGAGGATCACGGTCGCCCGCTGGTGGTGCACCTGGGTCTGAATTCCAGCGGCATGAGCCGTAACGGAGTGGACATGACCACCGCTCAGGGCCGTCGTGATGCGGTAGCTATCACCAAGGTGCCAAACCTGGAAGTGCGGGCGATCATGACCCACTTCGCGGTCGAAGATGCTGCCGACGTGCGTGCCGGGCTCAAGGCCTTCAATCAGCAAGCCCAATGGCTGATGAACGTGGCCCAGCTTGATCGCAGCAAGATCACCCTGCACGCGGCCAACTCGTTCGCCACACTGGAGGTGCCCGAATCGCATCTGGACATGGTCCGCCCCGGCGGCGCGCTGTTCGGCGACACCGTACCGTCCCACACCGAGTACAAGCGGGTCATGCAGTTCAAGTCCCACGTGGCGTCGGTCAACAGCTACCCCAAGGGCAACACCGTCGGTTATGACCGCACGTACACCCTGGGCCGCGACTCGCGGCTGGCCAACATCACCGTCGGCTACTCTGACGGCTACCGCCGCGCGTTTACCAATAAAGGGATTGTGCTGATCAACGGCCATCGCGCCAGTGGTGGGCAAAGTCTCGATGAACACCCTGATGGGTGGACGTCACTGACGCGCCGGATGTGAAAAGCGGCGATGAAGTGGTGCTGTTCGGGCACCAGGGCAAGGCCGAGATTACCCAGGCTGAGATCGAAGACATCAACGGTGCACTGCTTGCGGATCTGTATACCGTGTGGGGCAATTCCAACCCTAAAATCCTGAAAGATCAGTAA(SEQ ID N0:410).
A proteína codificada pelo gene de SEQ ID N0:410 foi analisadapelo programa Signal P3.0 de prognóstico de peptídeo sinal(www.cbs.dta.dk/services/SiqnalP/) e uma seqüência condutora de 23 ami-noácidos foi prognosticada.
1384M Mutagênese de Y. taetrolens BAR
A mutagênese foi feita empregando-se o kit QuickChange-MuItisite-directed mutagenesis (Stratagene, La Jolla, CA), empregando-se o geneP. taetrolens BAR em pET30 o qual resulta em uma proteína não-rotulada. Oseguinte iniciador mutagênico foi empregado para fazer a alteração 1384M:5'-TACCCAGGCTGAGATGGAAGACATCAACG-S' (SEQ ID NO:411).
A Mutagênese direcionada ao sítio foi realizada como descritono protocolo do fabricante. Vários isolados foram seqüenciados (Agencourt,Beverly, MA) e um isolado com a seqüência correta foi selecionado e em-pregado para outra varredura.
O plasmídeo foi transformado em células BL21(DE3) (Novagen,Madison, Wl). A proteína recombinante foi produzida durante a noite emmeio Express Il (Novagen, Madison, Wl) contendo 50 pg/mL de canamicinade acordo com os protocolos dos fabricantes. Os extratos livres de célulaforam preparados empregando-se BugBuster (Novagen, Madison, Wl) deacordo com os protocolos dos fabricantes, dessalinizados, e analisados pelaporcentagem de expressão da proteína alvo empregando-se o método Expe-rion acima descrito.
Os ensaios de proteína total foram realizados empregando-seum kit Pierce BCA (Pierce, Rockford, IL). Os ensaios de triptofano racemasecom a enzima mutante foram realizados empregando-se a enzima tipo sel-vagem da mesma maneira como um controle positivo. Os ensaios continhampor mL: 30 mM de L-triptofano, 50 mM de fosfato de potássio pH 8,10 uM dePLP, e aproximadamente 100 pg de proteína racemase em um extrato livrede célula. No caso onde 100 pg não foi empregado (com base na % de ex-pressão de Experion e números de proteína total de Pierce), os resultadosforam normalizados. Zero, 30 minutos, 2 horas, e durante a noite as amos-tras foram coletadas, tratadas com 2% de ácido fórmico, filtradas, e diluídas1 :10 para varredura empregando-se o método de aminoácido quiral descritono Exemplo 1.
A enzima tipo selvagem pareceu produzir 49,1 ppm de D-triptofano em 30 minutos, ao passo que o 1384M mutante produziu 108 ppm.O ponto do tempo 2 horas foi similar - 229,4 ppm de D-triptofano foi produzi-do pela enzima tipo selvagem versus 541,7 para o mutante 1384M. A muta-ção de 1384M pareceu ter aproximadamente dobrado a atividade do P. tae-trolens BAR. O ponto do tempo durante a noite para o mutante é tambémmaior, porém como as reações aproximam-se do equilíbrio a diferença entreas atividades é reduzida. Quando os ensaios foram realizados para produ-ção de monatina como no Exemplo 28, o 1384M não pareceu fornecer qual-quer benefício sobre a enzima P. taetrolens tipo selvagem.
Exemplo 30
Ensaio de Extrato de A. caviae
Aeromonas caviae ATCC 14486 foi desenvolvido em caldo nu-tritivo a 37 0C. As células da cultura (200 mL) foram centrifugadas e lavadasuma vez com 0,85 % de NaCI. Os péletes de célula foram resuspensos em 5mL/g de peso de célula úmida de reagente BugBusterrM (Novagen, Madison,Wl) contendo 5 pL/mL grupo #3 de coquetel inibidor de protease (Calbio-chem-Novabiochem Corp., San Diego, CA) e 1 pUrriL de benzonase nuclea-se. As amostras foram incubadas em temperatura ambiente durante 20 mi-nutos em um agitador orbital. O resíduo de célula insolúvel foi removido porcentrifugação a 16.000 X g durante 20 minutos a 4 0C. O extrato livre de cé-lula foi dessalinizado em uma coluna PD-10 (GE Healthcare, Piscataway, NJ).
O extrato livre de célula foi ensaiado durante a atividade de trip-tofano racemase empregando-se o seguinte protocolo. Reações de 1 mLforam realizadas em 50 mM de fosfato de potássio (pH 8,0), 0,05 mM dePLP e 30 mM de L-triptofano. As reações foram iniciadas pela adição de ex-trato livre de célula (100 pL ou 500 pL) e foram incubadas a 30 0C durante anoite. As alíquotas de amostra foram tomadas em 2 horas e após incubaçãodurante a noite (as amostras de zero minuto serviram como reações de con-trole). O ácido fórmico concentrado (5 pL) foi adicionado a cada 250 pL dealíquota de amostra para interromper a reação e a proteína precipitada foiremovida por centrifugação. Os sobrenadantes foram removidos e congela-dos a -80 0C até eles serem analisados para D-triptofano pelo método deaminoácido quiral descrito no Exemplo 1.
Os resultados do ensaio dos extratos celulares de A. caviae de-monstraram atividade de racemase sobre L-triptofano, como mostrado naTabela 47.
Tabela 47
<table>table see original document page 451</column></row><table>
Após a descoberta da atividade nos extratos de célula de A. ca-viae, os iniciadores degenerados foram destinados (com base nas regiõesconservadas dos homólogos de BAR conhecidos) para obter o gene BARdesta espécie. As seqüências de iniciador degenerado são mostradas abaixo:
Aer deg F2: 5'-GCCAGCAACGARGARGCMCGCGT-3' (SEQ IDNO:412); e
Aer deg Ri: S'-TGGCCSTKGATCAGCACA-S' (SEQ ID N0.413)em que K indica G ou T5, R indica A ou G, S indica C ou G, e Mindica A ou C.
Os iniciadores acima foram empregados para PCR amplificar715 bp de um fragmento de DNA de A. caviae (ATCC 14486) DNA genômi-co. O seguinte protocolo de PCR foi empregado: uma reação de 50 μL con-tinha 0,5 μL de modelo (-100 ng de DNA genômico de A. caviae ), 1,6 μΜ decada iniciador, 0,3 mM de cada dNTP, 10 U rTth de Polimerase XL (AppliedBiosystems, Foster City, CA), tampão IX XL, 1 mM de Mg(OAc)2 e 2,5 μl desulfóxido de dimetila. O programa termociclizador empregado incluiu um iní-cio quente a 94 0C durante 3 minutos e 30 repetições das seguintes etapas:94 °C durante 30 segundos, 53 °C durante 30 segundos, e 68 °C durante 2minutos. Após as 30 repetições, a amostra foi mantida a 68 °C durante 7 mi-nutos e em seguida armazenada a 4 °C. Este protocolo de PCR produziu umproduto de 715 bp.
Clonagem
O produto de PCR foi purificado por gel de 0,8% de gel de TAE-agarose empregando-se o kit de extração de gel Qiagen (Qiagen, Valencia,CA). O produto foi clonado por TOPO e transformado em células TOP 10 deacordo com o protocolo do fabricante (Invitrogen, Carlsbad, CA). O DNA deplasmídeo foi purificado dos transformantes resultantes empregando-se o kitQiagen spin miniprep (Qiagen, Valencia, CA) e avaliado para as inserçõescorretas por digesto de restrição com EcoR 1. As seqüências de plasmídeosparecendo ter a inserção correta foram verificadas por seqüenciamento deDNA de terminação de cadeia de dideóxi com iniciadores dianteiros M13universais.
A seqüência de DNA do produto de PCR A. caviae é mostradaabaixo como SEQ ID NO:414), com as regiões de seqüência de iniciadordegenerado sublinhadas:
GCCAGCAACGARGARGCMCGCGTTGCCCGCGAGAAGGGCTTCGAAGGTCGCCTGATGCGGGTACGTGCCGCCACCCCGGATGAAGTGGAGCAGGCCCTGCCCTACAAGCTGGAGGAGCTCATCGGCAGCCTGGAGAGCGCCAAGGGGATCGCCGACATCGCCCAGCGCCATCACACCAACATCCCGGTGCACATCGGCCTGAACTCCGCCGGCATGAGCCGCAACGGCATCGATCTGCGCCAGGACGATGCCAAGGCCGATGCCCTGGCCATGCTCAAGCTCAAGGGGATCACCCCGGTCGGCATCATGACCCACTTCCCGGTGGAGGAGAAAGAGGACGTCAAGCTGGGGCTGGCCCAGTTCAAGCTGGACTACCAGTGGCTCATCGACGCCGGCAAGCTGGATCGCAGCAAGCTCACCATCCACGCCGCCAACTCCTTCGCCACCCTGGAAGTACCGGAAGCCTACTTTGACATGGTGCGCCCGGGCGGCATCATCTATGGCGACACCATTCCCTCCTACACCGAGTACAAGAAGGTGATGGCGTTCAAGACCCAGGTCGCCTCCGTCAACCACTACCCGGCGGGCAACACCGTCGGCTATGACCGCACCTTCACCCTCAAGCGCGACTCCCTGCTGGCCAACCTGCCGATGGGCTACTCCGACGGCTACCGCCGCGCCATGAGCAACAAGGCCTATGTGCTGATCMASGGCCA(SEQ ID NO:414), em que R indica A ou G, S indica C ou G1 e M indica A ou C.
A seqüência de aminoácido da enzima A. caviae BAR parcial émostrada como SEQ ID NO:415 abaixo.
ASNEEARVAREKGFEGRLMRVRAATPDEVEQALPYKLEELIGSLESAKGIADIAQRHHTNIPVHIGLNSAGMSRNGIDLRQDDAKADALAMLKLKGITPVGIMTHFPVEEKEDVKLGLAQFKLDYQWLIDAGKLDRSKLTIHAANSFATLEVPEAYFDMVRPGGIIYGDTIPSYTEYKKVMAFKTQVASVNHYPAGNTVGYDRTFTLKRDSLLANLPMGYSDGYRRAMSNKA YVLIXG
em que X é H1 Q, N, ou K (SEQ ED NO:415).
O fragmento de seqüência de proteína de consenso de SEQ IDNO:415 acima é 89% homólogo no nível de aminoácido à seqüência de Tl-GR publicada para A. hidrofila. Foi esperado que por causa da proteína Ae-romonas hidrofila altamente relacionada exibisse ampla especificidade deatividade de racemase, bem como os extratos de célula de A. caviae, a regi-ão de codificação de tamanho natural para A. caviae, uma vez obtida, pro-duziria uma racemase que também teria uma ampla especificidade com ati-vidade sobre triptofano. Os métodos Genome Walker foram utilizados paraobter a seqüência de gene de tamanho natural do gene A. caviae BAR mos-trado abaixo como SEQ ID NO:416. atgcacaaga aaacactgct cgcgaccctgatctttggcc tgctggccgg ccaggcagtc gccgccccct atctgccgct cgccgacgac caccg-caacg gtcaggaaca gaccgccgcc aacgcctggc tggaagtgga tctcggcgcc ttcgagca-ca acatccagac cctgaagaat cgcctcggtg acaagggccc gcagatctgc gccatcatgaaggcggacgc ctacggtcac ggcatcgacc tgctggtccc ttccgtggtc aaggcaggcatcccctgcat cggcatcgcc agcaacgaag aagcacgtgt tgcccgcgag aagggcttcg a-aggtcgcct gatgcgggta cgtgccgcca ccccggatga agtggagcag gccctgccct aca-agctgga ggagctcatc ggcagcctgg agagcgccaa ggggatcgcc gacatcgccc agcgc-catca caccaacatc ccggtgcaca tcggcctgaa ctccgccggc atgagccgca acggcatcgatctgcgccag gacgatgcca aggccgatgc cctggccatg ctcaagctca aggggatcaccccggtcggc atcatgaccc acttcccggt ggaggagaaa gaggacgtca agctggggct ggcc-cagttc aagctggact accagtggct catcgacgcc ggcaagctgg atcgcagcaa gctcaccatccacgccgcca actccttcgc caccctggaa gtaccggaag cctactttga catggtgcgcccgggcggca tcatctatgg cgacaccatt ccctcctaca ccgagtacaa gaaggtgatg gcgtt-caaga cccaggtcgc ctccgtcaac cactacccgg cgggcaacac cgtcggctat gaccgcaccttcaccctcaa gcgcgactcc ctgctggcca acctgccgat gggctactcc gacggctaccgccgcgccat gagcaacaag gcctatgtgc tgatccatgg ccagaaggcc cccgtcgtgg gcaa-gacttc catgaacacc accatggtgg acgtcaccga catcaagggg atcaaacccg gtgac-gaggt ggtcctgttc ggacgccagg gtgatgccga ggtgaaacaa tctgatctgg aggagtacaacggtgccctc ttggcggaca tgtacaccgt ctggggctat accaacccca agaagatcaa gcgc-taa
(SEQ ED NO:416).
A seqüência de aminoácido correspondente para A. caviae nati-ve BAR é mostrada abaixo como SEQ ID NO:417:
1 mhkktllatl ifgllagqav aapylpladd hrngqeqtaa41 nawlevdlga fehniqtlkn rlgdkgpqic aimkadaygh81 gidllvpsvv kagipcigia sneearvare kgfegrlmrv121 raatpdeveq alpykieeli gslesakgia diaqrhhtni161 pvhiglnsag msmgidlrq ddakadalam Iklkgitpvg201 imthfpveek edvklglaqf kldyqwlida gkldrsklti241 haansfatle vpeayfdmvr pggiiygdti psyteykkvm281 afktqvasvn hypagntvgy drtftlkrds Ilanlpmgys321 dgyrramsnk ayvlihgqka pvvgktsmnt tmvdvtdikg361 ikpgdevvlf grqgdaevkq sdleeyngal Iadmytvwgy401 tnpkkikr(SEQ ID NO:417).
Os primeiros 21 resíduos de aminoácido de terminal N de SEQID NO:417 são prognosticados ser um peptídeo sinal empregando-se o pro-grama Signal P 3.0 (www.cbs.dtu.dk/services/SignalP/).
A prova experimental confirmou que o produto de expressão foisecretado no periplasmo de E. coli, e o peptídeo sinal foi clivado como pre-visto. O gene de tamanho natural, quando clonado e expresso empregando-se os métodos descritos acima, foi descoberto ter atividade comparável a,porém maior do que, o P. taetrolens BAR.Exemplo 31
A produção do aldolase de SEQ ID NO: 276 em um hospe-deiro de expressão alternativa.
O gene de SEQ ED NO: 275 foi subclonado empregando-se osprocedimentos de biologia molecular padrão em um derivado do vetorpET23d (Novagen, Madison1 Wl) contendo o gene E. coli metE e promotorinserido no sítio de restrição NgoMTV e um segundo sítio de restrição psilque foi adicionado para remoção fácil do gene beta Iactamase (bid). O cons-tructodeste vetor contendo uma inserção para um gene de mioinositol oxige-nase é descrita em PCT W02006066072 nos Exemplos 2 e 20. A inserçãode aldolase foi confirmada pelo seqüenciamento de DNA (Agencourt Biosci-ence Corporation; Beverly, MA) e o plasmídeo com a seqüência de inserçãocorreta foi transformado no hospedeiro de expressão de E. coliBW30384(DE3)DompTDmetE. O constructodeste hospedeiro de expressãoe o protocolo de transformação são também descritos em PCTW02006066072 (Exemplos 21 e 22). O gene de aldolase foi expresso em-pregando-se o Sistema Il de Auto-indução Novagen durante a noite Ex-press™ (Novagen, Madison, Wl) contendo 100 mg/L de ampicilina. O siste-ma foi descrito no Exemplo 24 para a expressão de Bacillus sphaericus (li-nhagem ATCC 10208) D-alanina aminotransferase. O Extrato livre de célulascontendo a aldolase foram produzidos empregando-se o Reagente de Extra-ção Novagen BugBuster™ (livre de amina primária) (Novagen, Madison, Wl)contendo 1 pUmL de benzonase nuclease, 0,033 pL/mL r-Lisozima, e 5pL/rnL de Grupo Il de Coquetel de Inibidor de Protease seguindo-se o proto-colo recomendado pelo fabricante para célula lise. As proteínas solúveis nosextratos livres de célula foram separadas em Bio-Rad Laboratories Experi-on™ Automated Electrophoresis Station (Bio- Rad, Hercules, CA) e analisa-das pela porcentagem de expressão de proteína solúvel empregando-se aversão 1.1.98.0 do Software Experion como descrito no Exemplo 12.
Para tentar melhorar a expressão de aldolase em JE. coli, dois asete códons da seqüência de codificação de DNA foram mutados para alte-rações sugeridas da varredura da seqüência tipo selvagem empregando-seo algoritmo de Roche ProteoExpert RTS Ε. coli HY. As alterações foram fei-tas empregando-se um kit QuikChange® mutagênese multi sítios direciona-dos ou kit QuikChange® Il XL mutagênese de sítio direcionado (Stratagene,La Joila, CA) seguindo-se o protocolo sugerido pelo fabricante com 0,75 pLde Solução Quik por 25 pL de mistura reacional e transformação em célulasultracompetentes de XLIO-Gold®. As mutações foram geradas empregando-se iniciadores (cada 45 nucleotídeos em comprimento) definidas com Strata-gene1 s web-baseado Programa QuikChange® Primer Design disponível on-line em www. stratagene . com. qcprimerdesign.
Tabela 48
<table>table see original document page 456</column></row><table>
As seqüências de gene de aldolase com as alterações de códonacima foram transformadas no hospedeiro de expressão E. coliBW30384(DE3) AornpTAmetE e em seguida expressas empregando-se No-vagen Durante a noite Express™ Autoinduction System Il (Novagen, Madi-son, Wl). Nenhuma destas mutações resultaram em níveis maiores de ex-pressão de gene quando comparadas à seqüência tipo selvagem. Os resul-tados típicos dos extratos livres de célula analisados pelo software Bio-RadExperion Pro260 1.1.98.0 são mostrados na Tabela 49 abaixo, na qual a co-Iuna intitulada Expressão de Proteína mostra valores para % total de proteí-na solúvel.
Os extratos livres de célula (0,025 mg/mL de proteína solúvel porensaio) foram ensaiados pela sua capacidade de produzir R,R-monatina de200 mM de piruvato de sódio e 100 mM de D-triptofano empregando-se oprotocol descrito no Exemplo 7. As reações (7 mL de volume total) foramrealizadas em tubos de 14 mL de polipropileno em uma caixa de luvas anae-róbica empregando-se B. sphaericus purificado (ATCC 10208) D-aminotransferase em 2 mg/mL de concentração final. As concentrações de mona-tina produzidas em 1, 4 e 20 horas após a adição das enzimas são mostra-das na Tabela 49 abaixo. A Tabela 49 mostra que o extrato livre de célulagerado do constructocontendo a seqüência de aldolase tipo selvagem pro-duziu uma concentração ligeiramente maior de monatina em 20 horas doque os extratos livres de célula das constructos carregando as mutações deProteoExpert. As concentrações de monatina foram determinadas pelo mé-todo LC/MS/MS descrito no Exemplo 1.
Tabela 49
<table>table see original document page 457</column></row><table>
Estes dados demonstram que a aldolase de SEQ ID NO: 276pode ser produzida em um hospedeiro de expressão alternativa sem a indu-çãodeIPTG.
O gene bla foi removido do vetor e fermentações subseqüentespara produzir a aldolase foram feitas sem o uso de antibiótico como descritoem PCT W02006066072 para outra enzima. Os níveis de expressão emfermentações em bateladas alimentadas a 30 0C alcançaram um máximo a6-8 horas pós-indução, produzindo a aldolase de SEQ ID NO: 276 a 25-30%da proteína solúvel, de acordo com os dados Experion. Os estudos de esta-bilidade não mostraram nenhuma perda aparente de atividade de aldolasequando o produto de fermentação foi deixado por 6 horas a 15 ou 30 0C (sobambas condições de limitação de oxigênio bem como condições aeradas)antes da concentração celular e disrupção. A aldolase foi descoberta serigualmente estável armazenada como um extrato livre de célula ou como umpélete celular quando armazenada durante 5 dias a -80 0C. A lavagem dopélete celular em tampão antes da armazenagem a -80 0C não foi requeridae até causou uma leve diminuição na atividade. As células resuspensas emágua destilada, sobrenadante de fermentação, ou 100 mM de tampão defosfato de potássio (pH 7,8) foram descobertos não ter nenhuma perda naatividade ou concentração de proteína (avaliado por SDS-PAGE) quandoarmazenados durante 11 dias em temperatura ambiente ou 4 0C. O extratolivre de célula produziu em tampão de fosfato de potássio não mostrou ne-nhuma perda de atividade de aldolase quando armazenado a 4 0C ou tempe-ratura ambiente durante 5 dias. As células podem ser abertas à força emtampão de fosfato, até 25% de sobrenadante de cultura ou água com recu-peração comparável da atividade de aldolase; entretanto, a adição de 1 mMde MgCfe à água descobriu-se ligeiramente melhorar a atividade de aldolase.
Estes dados mostram que a proteína de aldolase é suficientemente estávelpara ser comercialmente útil.
Diversas modalidades da invenção foram descritas. As modali-dades da invenção incluem um ou mais dos aspectos acima descritos. Seráentendido que várias modificações podem ser feitas sem divergir do espíritoe escopo de acordo com a invenção. Conseqüentemente, outras modalida-des estão dentro do escopo das seguintes reivindicações.LISTAGEM DE SEQÜÊNCIA
<110> Burke, Ellen
Gort1 Steven JohnHicks, Paula M.Luginbuhl, PeterMcFarlan, Sara C.Richardson, TobySolheid, christopherweiner, Davidzhao, Lishan
<120> Método para fabricação de polipeptideos com atividade de aldolase epolinucleotideos que codificam estes polipeptideos
<130> 2464.0190002/MAC/M-R
<140> A ser determinado neste<141> Herewith
<150> 60/853,005<151> 2006-10-20
<150> 60/799,460<151> 2006-03-07
<160> 417
<170> Patentln 3.1
<210> 1<211> 699<212> DNA<213> Bactéria
<400> 1
atgcagccgc tgaaggaatt cgccgagctc tccaccccgc tgatcgccga cgcctgcgtg 60cggctcgggg aacccctgcg cgtcgcgccc gccggcatcc tgcccgtcgt cgcgggccgg 120cgcgtcgccg gccgggccct gcccgtacgg cactacggca gcgtcgacgt cttcctggag 180gcgttcggcg aggccgagcc cggtgacgtc ctcgtcatcg acaacgcggg ccgcgtcgac 240gaggcctgca tcggcgacct cgccgtcctg gaggcggcgg cggccggcat cgccggggtc 300gtcgtgtggg gcctgcaccg ggacaccccc gacctcgtcg agatcgggct gcccgtcttc 360tcctacggac gccacgcgcc cggccccgtg cgcgtcgacc cccgggaccc ggacgcgctg 420acgaccgcgc ggttcggcga gcacgaggtg accgccgccg acgtcgtgtt cggcgacgac 480gacggcgtgg tcttcgtcgc cgccgcccgg gccggcgccg tcctggaggc ggcccgggcc 540ctgttccgta cggagcgcga gcaggcgcgg cggatcaggg cgggggagac gctgcgcgcc 600cagacccggt tcgacgcgta cctggcgggc cgggccgagg acccctcgta caccttccgg 660cagcacctgc gccggatcgg cggcgcgatc gaggagtga 699
<210> 2
<211> 232
<212> PRT
<213> Desconhecido
<220>
<223> isolado<220>
<221> DOMÍNIO<222> (8) . . . (165)
<223> Demetilmenaquinona metiltransferase<400> 2Met Gln Pro Leu Lys Glu Phe Ala Glu Leu Ser Thr Pro Leu lie Ala1 5 10 15
Asp Ala Cys vai Arg Leu Gly Glu Pro Leu Arg vai Ala Pro Ala Gly20 25 30
Ile Leu Pro Val vai Ala Gly Arg Arg vai Ala Gly Arg Ala Leu Pro35 40 45
vai Arg His Tyr Gly ser vai Asp vai Phe Leu Glu Ala Phe Gly Glu50 55 60
Ala Glu Pro Gly Asp vai Leu vai Ile Asp Asn Ala Gly Arg vai Asp65 70 75 80
Glu Ala Cys Ile Gly Asp Leu Ala Val Leu Glu Ala Ala Ala Ala Gly85 90 95
lie Ala Gly vai Val vai Trp Gly Leu His Arg Asp Thr Pro Asp Leu100 105 110
vai Glu lie Gly Leu Pro vai Phe ser Tyr Gly Arg His Ala Pro Gly115 120 125
Pro vai Arg vai Asp Pro Arg Asp Pro Asp Ala Leu Thr Thr Ala Arg130 135 140
Phe Gly Glu His Glu vai Thr Ala Ala Asp vai vai Phe Gly Asp Asp145 150 155 160
Asp Gly vai vai Phe vai Ala Ala Ala Arg Ala Gly Ala vai Leu Glu165 170 175
Ala Ala Arg Ala Leu Phe Arg Thr Glu Arg Glu Gln Ala Arg Arg lie180 185 190
Arg Ala Gly Glu Thr Leu Arg Ala Gln Thr Arg Phe Asp Ala Tyr Leu195 200 205
Ala Gly Arg Ala Glu Asp Pro Ser Tyr Thr Phe Arg Gln His Leu Arg210 215 220
Arg Ile Gly Gly Ala lie Glu Glu225 230
<210> 3
<211> 693
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 3
gtgaccggcc acgtcatcgt ccgcgagatc gaccgcgccg acgcgaacgc cctcgacggc 60
ctcgccgcgc tcggcgtctc gacggtgcac gaggccgacg gccgccgcgg cgcgctcgcc 120
accgccattc gaccgatcca cagtggattc acgatcgccg gttcggcggt gacggtctcc 180
tcccagccgg gcgacaacgt catgatccac gccgccattg aggtgtgccg gcccggcgac 240atcctcgtgg tcaccaccac ctcgccgtcc accgacggga tgatcggcga actgctggcg 300acgtcgctgc gcgcgcacgg ggtgcggggt gtcgtcaccg atgccggcgt acgcgacgtc 360gcccagctcc gggcgatgaa cttcccggtg tggacgcgcg ccatcagtcc acaggggacg 420gtcaaggcga gcccgggctc ggtgaacata ccggtcgtct gcgccggcca ggtcgtccac 480cccggcgatg ccatcgtcgc cgacgacgac ggcgttgtcg tcgtcccgcg cgaccgggtg 540ccggcggtgc tggcggccgg ccgggcgcgg gccgagagcg aggacgacaa acgcgtccgg 600ctcgccggtg gcgaactctc ggtcgacatg tacgggctgc gcgagctgct cacccgactc 660ggagtggagt acgtcgaccg gcggccggcg tga 693
<210> 4
<211> 230
<212> PRT
<21Β> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (28)...C174)
<223> Demetilmenaquinona meti Itransferase<400> 4
Met Thr Gly His Val Ile vai Arg Glu lie Asp Arg Ala Asp Ala Asn1 5 10 15
Ala Leu Asp Gly Leu Ala Ala Leu Gly vai Ser Thr vai His Glu Ala20 25 30
Asp Gly Arg Arg Gly Ala Leu Ala Thr Ala lie Arg Pro Ile His Ser35 40 45
Gly Phe Thr Ile Ala Gly Ser Ala vai Thr vai ser ser Gln Pro Gly50 55 60
Asp Asn vai Met Ile His Ala Ala Ile Glu vai Cys Arg Pro Gly Asp65 70 75 80
Ile Leu vai vai Thr Thr Thr ser Pro Ser Thr Asp Gly Met lie Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Arg Gly vai Val100 105 110
Thr Asp Ala Gly vai Arg Asp vai Ala Gln Leu Arg Ala Met Asn Phe115 120 125
Pro vai Trp Thr Arg Ala lie Ser Pro Gln Gly Thr Val Lys Ala Ser130 135 140
Pro Gly Ser vai Asn lie Pro vai vai Cys Ala Gly Gln vai vai His145 150 155 160
Pro Gly Asp Ala lie vai Ala Asp Asp Asp Gly Val vai vai vai Pro165 170 175
Arg Asp Arg vai Pro Ala vai Leu Ala Ala Gly Arg Ala Arg Ala Glu180 185 190
Ser Glu Asp Asp Lys Arg vai Arg Leu Ala Gly Gly Glu Leu Ser vai195 200 205
Asp Met Tyr Gly Leu Arg Glu Leu Leu Thr Arg Leu Gly vai Glu Tyr210 215 220
vai Asp Arg Arg Pro Ala225 230
<210> 5
<211> 762
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 5
atggcgttga ataccggttc cgacattatt cgcccgtcca aggagctcgt tgccgggctc 60aaagctcttg gcagtgcgac catcgcgggc acgctcggcc acatggggtt caagaacccg 120cacatgacgg gcatcctgcc acagacggcg ggcaaggtca tggccggccc ggcgctgacg 180ctgcagtgca tgccgcagcg accggacctg ttcagcgaag gcgaatacgc cgatcctgaa 240acgcagctcc accgccatgt gctctatcac gtgcaggagg gcgacgtggt cgtcgtcgat 300gcgcgcggcg atatgaagtc gggcatcttc ggcgacatga tgtcgaccta cttcaagggc 360cgcggcggcg ccggcatcgt catcgacggc tgcatgcgcg atcgtcccaa tgtcgaaaag 420ctcgacctgt cgctctggct caagggctgg acgccgaact accacgtcca gaccgacatc 480tttccctacg cggtgaacgt tccagtcgca tgtggcggcg ttcttgtgct ccccggcgac 540atcatcgttg ccgatgacga cggcgctgtc gtcgtgccgg tgaagatggc gcagcacatc 600gtcgaggacg gcaagaagca cgccgagtgg gaagtgttct cgcgcgagaa gctgatggcc 660ggcgagtcgc tccgccgtta ctacccgctg caccccgatg ccgaggacga ataccaggcc 720tggcggaagg cgaaggggct gccgccgtcg ccctcgcgct aa 762
<210> 6
<211> 253
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(191)
<223> Demetilmenaquinona metiltransferase<400> 6
Met Ala Leu Asn Thr Gly Ser Asp Ile lie Arg Pro ser Lys Glu Leu1 15 10 15
vai Ala Gly Leu Lys Ala Leu Gly ser Ala Thr Ile Ala Gly Thr Leu20 25 30
Gly His Met Gly Phe Lys Asn Pro His Met Thr Gly Ile Leu Pro Gln35 40 45Thr Ala Gly Lys vai Met Ala Gly Pro Ala Leu Thr Leu Gln Cys Met50 55 60
Pro Gln Arg Pro Asp Leu Phe Ser Glu Gly Glu Tyr Ala Asp Pro Glu65 70 75 80
Thr Gln Leu His Arg His vai Leu Tyr His vai Gln Glu Gly Asp vai85 90 95
vai vai vai Asp Ala Arg Gly Asp Met Lys Ser Gly lie Phe Gly Asp100 105 110
Met Met Ser Thr Tyr Phe Lys Gly Arg Gly Gly Ala Gly lie vai Ile115 120 125
Asp Gly Cys Met Arg Asp Arg Pro Asn vai Glu Lys Leu Asp Leu ser130 135 140
Leu Trp Leu Lys Gly Trp Thr Pro Asn Tyr His vai Gln Thr Asp lie145 150 155 160
Phe Pro Tyr Ala vai Asn vai Pro vai Ala Cys Gly Gly vai Leu vai165 170 175
Leu Pro Gly Asp Ile Ile vai Ala Asp Asp Asp Gly Ala vai vai vai180 185 190
Pro vai Lys Met Ala Gln His lie vai Glu Asp Gly Lys Lys His Ala195 200 205
Glu Trp Glu vai Phe ser Arg Glu Lys Leu Met Ala Gly Glu Ser Leu210 215 220
Arg Arg Tyr Tyr Pro Leu His Pro Asp Ala Glu Asp Glu Tyr Gln Ala225 230 235 240
Trp Arg Lys Ala Lys Gly Leu Pro Pro Ser Pro ser Arg245 250
<210> 7 <211> 672 <212> DNA <213> Desconhecido <220> <223> Obtido a partir de amostras ambientais <400> 7 atgagtgtag tggtgcaaaa tatcgagcgg gcagatcagg caattatcaa ggcgcttgct 60gaatgcggtg tagcaactgt gcatgaggcc caaggccgca cggggttgct ggcttcttat 120atgcggccaa tttatagcgg tgcttgcatt ggtgcatcag cggtaaccat tctggctccg 180ccttgcgata actggatggt ccatgtggcc attgagcaga taaagccggg tgatgctctg 240gttatggcaa caacatcgtc atctgatgcc ggatattttg gtgacctgct ggcgacctcg 300atgcaggcgc gtggcggggt tggcatgatt atcgatgccg gggtgcgcga tattaaagac 360ctgaccgaga tgaaatgtcc tgtctggtca aaagcgatct gcgctgaagg gacggtgaaa 420gaaacacttg gctctgtaaa tattccggtg gtttgcgccg gccagttggt caaccccggc 480gatattgtca tcgctgatga tgatggggtc tgtgtcgttg agcgcgaaag ggctggcgaa 540
gttctggaaa aagcgcaagc ccgcatggct ttggaagaag acaaacgtaa acgtttggcc 600
tccggtgaac ttgggctgga tatgtataat atgcgcgagc gtctggctga aaaaggtctc 660
aaatatgttt aa 672
<210> 8<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 8
Met ser vai vai vai Gln Asn lie Glu Arg Ala Asp Gln Ala Ile Ile1 5 10 15
Lys Ala Leu Ala Glu Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Leu Ala ser Tyr Met Arg Pro lie Tyr ser Gly Ala35 40 45
Cys lie Gly Ala Ser Ala vai Thr lie Leu Ala Pro Pro Cys Asp Asn50 55 60
Trp Met vai His vai Ala Ile Glu Gln Ile Lys Pro Gly Asp Ala Leu65 70 75 80
vai Met Ala Thr Thr ser Ser ser Asp Ala Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr ser Met Gln Ala Arg Gly Gly vai Gly Met Ile Ile Asp100 105 110
Ala Gly vai Arg Asp Ile Lys Asp Leu Thr Glu Met Lys Cys Pro vai115 120 125
Trp ser Lys Ala lie Cys Ala Glu Gly Thr vai Lys Glu Thr Leu Gly130 135 140
ser vai Asn lie Pro vai Val Cys Ala Gly Gln Leu Val Asn Pro Gly145 150 155 160
Asp Ile vai Ile Ala Asp Asp Asp Gly vai Cys vai vai Glu Arg Glu165 170 175
Arg Ala Gly Glu vai Leu Glu Lys Ala Gln Ala Arg Met Ala Leu Glu180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala ser Gly Glu Leu Gly Leu Asp Met195 200 205
Tyr Asn Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val210 215 220
<210> 9<211> 552<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 9
atgaacggga ccgtcgtgcg caacatccat cgcgccgagg cgggggccat cgcggcgctc 60gggcgcatcg gcgtctcgac cgtccacgag gcgcaggggc gcaccgggct catgcaggcc 120tacatgcggc ccgtatggcg gggcgcgcgc atcgccggca gcgccgtgac cgtcctgtgc 180catcccaacg acaactggat gatccacgtc gcgatggagg tggcaaggcc cggcgacgtg 240ctcgtggtgg cttgctcgag cgagaacacg aacggcgcga tcggcgacct gatcgccacc 300tcgctcatgg cgcgcggcgt gaaaggcgcg atcctcgaca tgggctgccg cgacgtgctg 360gagctcgagc agatgaggtt tccgctctgg tcgcgggcca tctcggcgca gggaaccatc 420aagggcacgc tcggctcggt caacttcccg gtcacctgcg ccggcgccca cgtcaggccg 480ggcgacatcg tggtcgcgga cgacgacggc gtggtggtcg tgccccgcca ggacgcggcg 540aaagtgatcc aa 552
<210> 10<211> 184<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE<222> (2)...(5)
<223> Sitio de N-glicosilação. Pró-sítio id = PS00001<400> 10
Met Asn Gly Thr vai vai Arg Asn Ile His Arg Ala Glu Ala Gly Ala1 5 10 15
Ile Ala Ala Leu Gly Arg lie Gly vai ser Thr vai His Glu Ala Gln20 25 30
Gly Arg Thr Gly Leu Met Gln Ala Tyr Met Arg Pro vai Trp Arg Gly35 40 45
Ala Arg lie Ala Gly ser Ala vai Thr vai Leu Cys His Pro Asn Asp50 55 60
Asn Trp Met lie His vai Ala Met Glu vai Ala Arg Pro Gly Asp vai65 70 75 80
Leu vai vai Ala Cys Ser ser Glu Asn Thr Asn Gly Ala Ile Gly Asp85 90 95
Leu Ile Ala Thr Ser Leu Met Ala Arg Gly Val Lys Gly Ala Ile Leu100 105 110
Asp Met Gly Cys Arg Asp Val Leu Glu Leu Glu Gln Met Arg Phe Pro115 120 125
Leu Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Ile Lys Gly Thr Leu130 135 140
Gly Ser vai Asn Phe Pro vai Thr Cys Ala Gly Ala His vai Arg Pro145 150 155 160
Gly Asp Ile vai vai Ala Asp Asp Asp Gly vai vai Val vai Pro Arg165 170 175
Gln Asp Ala Ala Lys vai lie Gln180
<210> 11
<211> 645
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 11
atggatccag gggtcatcag gcgtctgggg gagctgggcg ttgcgaccgt tcacgaggcg 60ctcggccgcc agggccttct cgatcccgtc gtgcgcccga tctaccccgg cgcgcgggcg 120gccggaaccg ccgtaacggt gtgctgtccg gccggggaca acctgatgat ccatgcggcg 180ctccaggtcg tggcgcgcgg cgacgtgctc gtcgtcacga ccgagccgcc gtcgacgtac 240ggcatgttcg gcgacgtgct ggggacgtcg tgccaggcgc tcggggtcgc ggggctcgtc 300atcgacgccg gcatccgtga cacggaggag ctcgagcgga tggcgtttcc cgcctgggcg 360cgcgcgacgt cggcgcaggg cacggtgaaa gtggctccgg gcatcgtcaa cgcgccgatt 420gtgtgcgcgg gcgcggacgt tcgtccgggc gacgttgtcg tggcggatcg cgacggcgtc 480gtcatcgtcc cgcgcgagcg ggctgccgaa gcggcggagc ttggtgagca gcggcgcgat 540cgcgagatcg aataccgccg gcggctggca ggtggagagc tgaccctgga cgtgctcgac 600ctccggcgca ccctgcggga gatcgggatg gacaggctgg actga 645
<210> 12
<211> 214
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> ClO)...(162)
<223> Demetilmenaquinona metiltransferase<400> 12
Met Asp Pro Gly vai Ile Arg Arg Leu Gly Glu Leu Gly vai Ala Thr1 5 10 15
vai His Glu Ala Leu Gly Arg Gln Gly Leu Leu Asp Pro vai vai Arg20 25 30Pro Ile Tyr Pro Gly Ala Arg Ala Ala Gly Thr Ala vai Thr Val Cys35 40 45
Cys Pro Ala Gly Asp Asn Leu Met Ile His Ala Ala Leu Gln vai vai50 55 60
Ala Arg Gly Asp vai Leu vai vai Thr Thr Glu Pro Pro ser Thr Tyr65 70 75 80
Gly Met Phe Gly Asp Val Leu Gly Thr ser Cys Gln Ala Leu Gly vai85 90 95
Ala Gly Leu vai Ile Asp Ala Gly Ile Arg Asp Thr Glu Glu Leu Glu100 105 110
Arg Met Ala Phe Pro Ala Trp Ala Arg Ala Thr Ser Ala Gln Gly Thr115 120 125
vai Lys vai Ala Pro Gly lie vai Asn Ala Pro Ile vai Cys Ala Gly130 135 140
Ala Asp vai Arg Pro Gly Asp vai vai vai Ala Asp Arg Asp Gly vai145 150 155 160
vai Ile Val Pro Arg Glu Arg Ala Ala Glu Ala Ala Glu Leu Gly Glu165 170 175
Gln Arg Arg Asp Arg Glu lie Glu Tyr Arg Arg Arg Leu Ala Gly Gly180 185 190
Glu Leu Thr Leu Asp vai Leu Asp Leu Arg Arg Thr Leu Arg Glu lie195 200 205
Gly Met Asp Arg Leu Asp210
<210> 13
<211> 498
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 13
atggcgaccg gggagtacga cgcatgggcc ggctcctggt actcgaagct ctcgccggag 60ccgttcatgg atctcattcg tcccggcact gccctggtga tcgacgatgc gcccgcagcg 120gatgtcggct ccatcgggtc gaacaacatc ctccaatgga agacgcgtgg gatggtggcg 180gtcgtgacga acgcgacggc gcgggacacc gacgaaatcg ttgtcgagcg cgtgccgctc 240tatttccggc agcctggccg cggcatccgt ccgggccgca atgagatcga atcggtcaac 300cgtcccgtgg tcgtgggcgg ggtgctcgtg atgcccggcg acgtcatcgt cggagacggc 360gacggcgtgg ttgtcgtccc acgcgcgcag gccgaggccg tggcgcgata tgctcacacg 420atcctcgaga aggacacgga aggacgtcgg cggctctacc agcagctgaa gcttccaacc 480gattcgacgg tccggtag 498<210> 14<211> 165<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 14
Met Ala Thr Gly Glu Tyr Asp Ala Trp Ala Gly ser Trp Tyr Ser Lys1 5 10 15
Leu Ser Pro Glu Pro Phe Met Asp Leu lie Arg Pro Gly Thr Ala Leu20 25 30
vai lie Asp Asp Ala Pro Ala Ala Asp vai Gly ser lie Gly Ser Asn35 40 45
Asn lie Leu Gln Trp Lys Thr Arg Gly Met vai Ala vai vai Thr Asn50 55 60
Ala Thr Ala Arg Asp Thr Asp Glu lie vai vai Glu Arg vai Pro Leu65 70 75 80
Tyr Phe Arg Gln Pro Gly Arg Gly lie Arg Pro Gly Arg Asn Glu Ile85 90 95
Glu Ser vai Asn Arg Pro vai vai vai Gly Gly vai Leu vai Met Pro100 105 110
Gly Asp Val lie vai Gly Asp Gly Asp Gly vai vai Val vai Pro Arg115 120 125
Ala Gln Ala Glu Ala vai Ala Arg Tyr Ala His Thr lie Leu Glu Lys130 135 140
Asp Thr Glu Gly Arg Arg Arg Leu Tyr Gln Gln Leu Lys Leu Pro Thr145 150 155 160
Asp Ser Thr vai Arg165
<210> 15<211> 723<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 15
atgacaacaa gcactaaaaa tatgcaggta agtcagaaag ttattgacga tcttcgtcgc 60gtgtcaacag caactctgca cactgcgctg ttcaaaagag gtttacgcaa cacctacatc 120cagggtgtca gcctcatcaa caaccaaaaa ctgaagatgg tcggccaggc gttcaccctg 180cgctacatcc cggctcgtga agacgttgac accgttgcgg cattcaaaag ccctgagcac 240cctcagcgcc tggccgttga atccgtcccg gaaggcatgg tgctggtttc agactgtcgt 300caggacgcaa cagctgcttc tgccgggagc atccttctta ctcgattgga agttcgcaag 360tgtgcgggtt ttgtttccga tgcgggcatc agagatttca acgatgcatc tgaaatgaac 420atgccgattt tttgcgccaa gccaagcgct ccaaccaacc tgaccaagca ccacgccgta 480gacatacaag taccgatcgg ctgcggcggt gtgatggtta atccaggcga tgtgttagtc 540ggcgatggtg acggcatcat cgttatccct gtggaaattg cacaggaggt ttcagaagaa 600gcacttgcaa tggaactctt cgaagatttt gtgctggata aagttcgggc gggaagcaaa 660gtcattgggc tgtaccctcc taacgcagaa actctggagg agtacaacaa ccaaaaggca 720tag 723
<210> 16
<211> 240
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (19)···(188)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (155)...(158)
<223> Sítio de N-glicosi!ação. Pró-sitio id = PS00001<400> 16
Met Thr Thr Ser Thr Lys Asn Met Gln vai Ser Gln Lys vai lie Asp1 5 10 15
Asp Leu Arg Arg vai Ser Thr Ala Thr Leu His Thr Ala Leu Phe Lys20 25 30
Arg Gly Leu Arg Asn Thr Tyr lie Gln Gly vai Ser Leu lie Asn Asn35 40 45
Gln Lys Leu Lys Met vai Gly Gln Ala Phe Thr Leu Arg Tyr lie Pro50 55 60
Ala Arg Glu Asp vai Asp Thr vai Ala Ala Phe Lys ser Pro Glu His65 70 75 80
Pro Gln Arg Leu Ala vai Glu Ser vai Pro Glu Gly Met Val Leu vai85 90 95
Ser Asp Cys Arg Gln Asp Ala Thr Ala Ala ser Ala Gly Ser Ile Leu100 105 110
Leu Thr Arg Leu Glu vai Arg Lys Cys Ala Gly Phe Val Ser Asp Ala115 120 125
Gly lie Arg Asp Phe Asn Asp Ala ser Glu Met Asn Met Pro lie Phe130 135 140
Cys Ala Lys Pro Ser Ala Pro Thr Asn Leu Thr Lys His His Ala vai145 150 155 160
Asp Ile Gln vai Pro lie Gly Cys Gly Gly vai Met vai Asn Pro Gly165 170 175
Asp vai Leu vai Gly Asp Gly Asp Gly lie Ile vai lie Pro vai Glu180 185 190
Ile Ala Gln Glu vai Ser Glu Glu Ala Leu Ala Met Glu Leu Phe Glu195 200 205
Asp Phe vai Leu Asp Lys vai Arg Ala Gly ser Lys vai lie Gly Leu210 215 220
Tyr Pro Pro Asn Ala Glu Thr Leu Glu Glu Tyr Asn Asn Gln Lys Ala225 230 235 240
<210> 17
<211> 792
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 17
atgattcggt tgaccaacct gaaccccttt gagcggtttg acgatggccg ccccaaggtg 60cccgatgacc tgctggagcg gatgaagctg gtcaccaccg aggaggcctg gggcacgctc 120tatcacgccg gctacctgcg ccagttcgaa ggcaagtggc acgagaccca cccgggcgtc 180atcactgtcg gccgcgccgt caccgcccag ttcctgcccc atcgccccga ctaccacgcc 240gtggtgcaag aaaccggcgt cggcgaaggc cgcggcagcg ccggtggtca gaactcgtgg 300atcatcgaga gcctgcagcg caacgacgtc atggtggtcg acatcttcgg caaggtcaaa 360gacggcacgg tcgtcggcga caacctgggc accgccgtgc gcacccgcac ccgcgccggg 420gccgtcatcg acggcggcgt gcgcgactac cagggcctga cccagctcac cgacgtcaac 480ttctacatcc gcggtatgga cccgaccggc atcgccgacg tcaccctggc cggcctgaac 540atccccatcc gcatcggtgg ctgcacagtc ctgcccggcg acgtggtcct cggcacgccc 600agcggcgtcc tgttcatccc gccgcacctg gtgtcgaagg tggtcgagga gagcgaggac 660gtccgcgtcc gcgacgagtt tggcaagagc cgcctggccg aaggcatttg gacctccggc 720cagatcgact cggcctggag cgacgagatc aaggccgact tcgagaactg gaaggccaac 780cgccccaagt ag 792
<210> 18
<211> 263
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (39)...(205)
<223> Demetilmenaquinona metiltransferase<400> 18
Met Ile Arg Leu Thr Asn Leu Asn Pro Phe Glu Arg Phe Asp Asp Gly1 5 10 15
Arg Pro Lys Val Pro Asp Asp Leu Leu Glu Arg Met Lys Leu vai Thr20 25 30
Thr Glu Glu Ala Trp Gly Thr Leu Tyr His Ala Gly Tyr Leu Arg Gln35 40 45Phe Glu Gly Lys Trp His Glu Thr His Pro Gly vai Ile Thr vai Gly50 55 60
Arg Ala vai Thr Ala Gln Phe Leu Pro His Arg Pro Asp Tyr His Ala65 70 75 80
vai vai Gln Glu Thr Gly vai Gly Glu Gly Arg Gly Ser Ala Gly Gly85 90 95
Gln Asn Ser Trp Ile Ile Glu Ser Leu Gln Arg Asn Asp vai Met vai100 105 110
vai Asp lie Phe Gly Lys vai Lys Asp Gly Thr vai vai Gly Asp Asn115 120 125
Leu Gly Thr Ala vai Arg Thr Arg Thr Arg Ala Gly Ala vai Ile Asp130 135 140
Gly Gly Val Arg Asp Tyr Gln Gly Leu Thr Gln Leu Thr Asp Val Asn145 150 155 160
Phe Tyr Ile Arg Gly Met Asp Pro Thr Gly lie Ala Asp vai Thr Leu165 170 175
Ala Gly Leu Asn Ile Pro lie Arg lie Gly Gly Cys Thr Val Leu Pro180 185 190
Gly Asp Val vai Leu Gly Thr Pro ser Gly vai Leu Phe lie Pro Pro195 200 205
His Leu vai ser Lys vai vai Glu Glu Ser Glu Asp vai Arg vai Arg210 215 220
Asp Glu Phe Gly Lys ser Arg Leu Ala Glu Gly lie Trp Thr Ser Gly225 230 235 240
Gln Ile Asp Ser Ala Trp ser Asp Glu lie Lys Ala Asp Phe Glu Asn245 250 255
Trp Lys Ala Asn Arg Pro Lys260
<210> 19
<211> 723
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 19
atgagcgatt ataccaacga gattaccggc gaaccgccag ctgctgaacc tttgccggac 60gagcaggaaa tcttggattt tgtacggcag aagctgcatg tcgccgcggt ttgcgatatt 120ttggatgatt tgggctaccg caatcaagcc atgcaccagc gattgcgccc gctcctaccc 180gatattcgga actgtggttt tgtcgggcga gcgcgtacgt tgcgctggat ggagaccgat 240tatattgtcg aggaagatcc ctatgggctg gagatcgact ttatggatag tctgggcgcg 300ggtgatgtca ttgttcattc caccgaccct ggcggcacca atgccccgtg gggcgaactc 360atgaccacca tcgccaagtt gcgcggcgca gttggctgcg tctgcgacag ccagatacgc 420gacacggtgc agatcatcga catgggcttc cccgtctact acacgggaat tcgtccgttg 480gattccaaag ggcgggcgcg cgtgatgggt ttggatctgc ccgtacgctg tggtgatgtg 540ttggtgcatc ctggcgatct catcttcgcc gaccatgacg gcatcgtggt cattccgcaa 600gcgcaggtgc agcaggtact caagctggcc caagaaaaga tggagaagga gaaccacacg 660cgcaatgacc tgctcgcggg caagacactg cgcgaggtct atgatacgta tggggtgttg 720tag 723
<210> 20<211> 240<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (30)...(197)
<223> Demetilmenaquinona metiItransferase<220>
<221> SITE
<222> (221)...(224)
<223> Sítio de N-glicosilação. Pró-sítio id = PS00001<400> 20
Met Ser Asp Tyr Thr Asn Glu lie Thr Gly Glu Pro Pro Ala Ala Glu1 5 10 15
Pro Leu Pro Asp Glu Gln Glu Ile Leu Asp Phe vai Arg Gln Lys Leu20 25 30
His vai Ala Ala vai Cys Asp lie Leu Asp Asp Leu Gly Tyr Arg Asn35 40 45
Gln Ala Met His Gln Arg Leu Arg Pro Leu Leu Pro Asp Ile Arg Asn50 55 60
Cys Gly Phe vai Gly Arg Ala Arg Thr Leu Arg Trp Met Glu Thr Asp65 70 75 80
Tyr Ile vai Glu Glu Asp Pro Tyr Gly Leu Glu Ile Asp Phe Met Asp85 90 95
Ser Leu Gly Ala Gly Asp vai Ile vai His Ser Thr Asp Pro Gly Gly100 105 110
Thr Asn Ala Pro Trp Gly Glu Leu Met Thr Thr lie Ala Lys Leu Arg115 120 125
Gly Ala vai Gly Cys vai Cys Asp ser Gln Ile Arg Asp Thr vai Gln130 135 140
Ile Ile Asp Met Gly Phe Pro Val Tyr Tyr Thr Gly Ile Arg Pro Leu145 150 155 160Asp Ser Lys Gly Arg Ala Arg vai Met Gly Leu Asp Leu Pro vai Arg165 170 175
Cys Gly Asp vai Leu Val His Pro Gly Asp Leu lie Phe Ala Asp His180 185 190
Asp Gly lie vai vai Ile Pro Gln Ala Gln vai Gln Gln vai Leu Lys195 200 205
Leu Ala Gln Glu Lys Met Glu Lys Glu Asn His Thr Arg Asn Asp Leu210 215 220
Leu Ala Gly Lys Thr Leu Arg Glu vai Tyr Asp Thr Tyr Gly vai Leu225 230 235 240
<210> 21<211> 444<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 21
atgaccaagc cgctgagtga agccgcgcgc gccaagctcg ccaccgtcag taccgccacg 60ctgacgacgc aactgttcaa gcgcgggctg cgcaacacct tcatccaggg cgcacgcccg 120ctcaatcccg acgcgccgcc gatggtcggc ccggcctaca cgctgcgcta tatcccggca 180cgcgaggaca tcgacacgct cgatgtgttc aatgaccgca cccacccgca acgcaaggcc 240gtggaggaca tcccgccggg cagcgtgctg gtgatggact gccgcggcga cgcgagcgtc 300gcgtcggccg gcagcatcct ggtgacccgc atgatgatgc gcggcgcagc cggcgtggtc 360agcgacggcg gcctgcgcga ttcccccgag atcgcgaagc tccccttccc cacctactgc 420cagggcgggt cggcgcccac caac 444
<210> 22<211> 148<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 22
Met Thr Lys Pro Leu Ser Glu Ala Ala Arg Ala Lys Leu Ala Thr vai1 5 10 15
Ser Thr Ala Thr Leu Thr Thr Gln Leu Phe Lys Arg Gly Leu Arg Asn20 25 30
Thr Phe lie Gln Gly Ala Arg Pro Leu Asn Pro Asp Ala Pro Pro Met35 40 45
vai Gly Pro Ala Tyr Thr Leu Arg Tyr Ile Pro Ala Arg Glu Asp lie50 55 60
Asp Thr Leu Asp vai Phe Asn Asp Arg Thr His Pro Gln Arg Lys Ala65 70 75 80
vai Glu Asp Ile Pro Pro Gly ser vai Leu vai Met Asp Cys Arg Gly85 90 95Asp Ala ser Val Ala Ser Ala Gly ser lie Leu vai Thr Arg Met Met100 105 110
Met Arg Gly Ala Ala Gly vai Val Ser Asp Gly Gly Leu Arg Asp ser115 120 125
Pro Glu lie Ala Lys Leu Pro Phe Pro Thr Tyr Cys Gln Gly Gly ser130 135 140
Ala Pro Thr Asn145
<210> 23
<211> 801
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 23
atgatcaatt gcctcgcggc taaaccacag cggccttccc aattatccaa tccctatcag 60gagcctgcca tgccagccat ctccctcgaa gtgcttgaga aactgcgcgc atacgatacg 120cccaccattt gcaacgtgat cgagctgttc gacgtgcggc cgcgcaccag cggctacatg 180gatgcccgca tccgcgcctg cttccccgag atgccgccgg tggtgggctt tgcctccacc 240gccaccttcc gcgcttctga agcgccgctc tccggcccgg atatctacgg ctcgctgaac 300ctgcaagtgg agagctttgg cacgctctcc ggcccggcca tcgtggtctt tcaagacctg 360gacgacccgg cggtggcggc aacctttggc gaggtgatgt gcaccaccta ccagacgtac 420ggatcggtcg ggctgatcac ctctggcgcg gggcgcgacc tggaccaggt acgcaagatt 480ggttactcgg tcttcaccaa cggcgcgatt tgctcgcacg gctactgcca cattccggat 540gtcaacgtgc cggtgcgggt gggcggctta atcgtgcgcc cggatgatct gctgcacatg 600gacgtgaacg gcgtgaccaa catccccaag gagatcgcgg cggaggtggc ggaggcctgc 660gaggcctacg tggcggcgga gatggcgacg ctgaacgggc tgcatgcgta taggcaagat 720ggggatgccg ggaagctgca agaggcgaag aaggagagta aaaggctgat gcaggcgctg 780aaggaacggg tgaggaggta a 801
<210> 24
<211> 266
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (36)...(207)
<223> Demetilmenaquinona metiltransferase<400> 24
Met Ile Asn Cys Leu Ala Ala Lys Pro Gln Arg Pro ser Gln Leu Ser1 5 10 15
Asn Pro Tyr Gln Glu Pro Ala Met Pro Ala lie Ser Leu Glu vai Leu20 25 30Glu Lys Leu Arg Ala Tyr Asp Thr Pro Thr Ile Cys Asn vai lie Glu35 40 45
Leu Phe Asp vai Arg Pro Arg Thr ser Gly Tyr Met Asp Ala Arg Ile50 55 60
Arg Ala Cys Phe Pro Glu Met Pro Pro Val vai Gly Phe Ala Ser Thr65 70 75 80
Ala Thr Phe Arg Ala Ser Glu Ala Pro Leu Ser Gly Pro Asp Ile Tyr85 90 95
Gly Ser Leu Asn Leu Gln vai Glu Ser Phe Gly Thr Leu Ser Gly Pro100 105 110
Ala lie vai vai Phe Gln Asp Leu Asp Asp Pro Ala Val Ala Ala Thr115 120 125
Phe Gly Glu vai Met Cys Thr Thr Tyr Gln Thr Tyr Gly ser vai Gly130 135 140
Leu lie Thr ser Gly Ala Gly Arg Asp Leu Asp Gln Val Arg Lys Ile145 150 155 160
Gly Tyr Ser vai Phe Thr Asn Gly Ala lie Cys Ser His Gly Tyr Cys165 170 175
His lie Pro Asp vai Asn Val Pro vai Arg vai Gly Gly Leu lie vai180 185 190
Arg Pro Asp Asp Leu Leu His Met Asp vai Asn Gly vai Thr Asn Ile195 200 205
Pro Lys Glu lie Ala Ala Glu Val Ala Glu Ala Cys Glu Ala Tyr vai210 215 220
Ala Ala Glu Met Ala Thr Leu Asn Gly Leu His Ala Tyr Arg Gln Asp225 230 235 240
Gly Asp Ala Gly Lys Leu Gln Glu Ala Lys Lys Glu ser Lys Arg Leu245 250 255
Met Gln Ala Leu Lys Glu Arg vai Arg Arg260 265
<210> 25
<211> 741
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 25
atggctgaga agaaactgac cgggcggatt gcgcgggaga aaatcaggtt gatggaggtg 60
ccgcggccgc cgcaaggcgt cgtcgagcgg ttcaagtcgc tcggcgattg caccggcatc 120atttccgaca ccatggatga actgggcatc ccgaacggcg tgatcggcgc gtcagtgctg 180cgaccaacca tccccggcac cgtcatcgcc gggccggcgt tgacgctgcg caacattctc 240cagcgcatcg atccactcgc cggcgcgcgc gagcacgtca acaagatggc cgagttcgaa 300tgtcacaacc tcgcgacccc gggcgacgtg ctggtgatcc agggggtgcc gaacgtctcc 360agtatgggag gcatctcggc gctgaccggc aagcgcgccg gtgaagtcgg cgccatcgtc 420gaaggcggca tccgcgacat tgcacattcg cgtgaggttg gctttccact gtggtcgagc 480cagatcacgc cggtcaccgg caagtggcgg ctggaggcgg ccgagatcaa cggcaccatc 540gaaatcggcg gcgtgcaggt gcaccccggc gatctggtgg tggccgacga caccggcgtc 600tgcttcatcc cgcgcgacaa cattctggaa gtgctcgccg agtgcgagaa gaaagcgaag 660gccgaggacc tgcgctgcaa ggcgatcgat ggcggcgtcc cggtgccgga tatctcgaaa 720tcgacgtatg gagagacgtg a 741
<210> 26<211> 246<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (38)...(202)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (119)...(122)
<223> sitio de N-glicosilação. Pró-sitio id = PS00001<220>
<221> SITE
<222> (179)...(182)
<223> sitio de N-glicosilação. Pró-sitio id = PS00001<400> 26
Met Ala Glu Lys Lys Leu Thr Gly Arg lie Ala Arg Glu Lys Ile Arg1 5 10 15
Leu Met Glu vai Pro Arg Pro Pro Gln Gly vai vai Glu Arg Phe Lys20 25 30
Ser Leu Gly Asp Cys Thr Gly lie lie Ser Asp Thr Met Asp Glu Leu35 40 45
Gly Ile Pro Asn Gly vai lie Gly Ala ser vai Leu Arg Pro Thr lie50 55 60
Pro Gly Thr vai lie Ala Gly Pro Ala Leu Thr Leu Arg Asn lie Leu65 70 75 80
Gln Arg Ile Asp Pro Leu Ala Gly Ala Arg Glu His vai Asn Lys Met85 90 95
Ala Glu Phe Glu Cys His Asn Leu Ala Thr Pro Gly Asp vai Leu vai100 105 110
Ile Gln Gly vai Pro Asn vai ser Ser Met Gly Gly Ile ser Ala Leu115 120 125Arg Ala Gly Glu Val135
Gly Ala lie vai Glu Gly Gly Ile140
Arg Asp Ile Ala
His Ser Arg Glu150
vai Gly Phe Pro Leu Trp Ser Ser
145
155
160
Gln Ile Thr Pro vai Thr Gly Lys Trp Arg Leu Glu Ala Ala Glu lie165 170 175
Asn Gly Thr Ile Glu Ile Gly Gly Val Gln vai His Pro Gly Asp Leu180 185 190
vai vai Ala Asp Asp Thr Gly vai Cys Phe Ile Pro Arg Asp Asn Ile195 200 205
Leu Glu vai Leu Ala Glu Cys Glu Lys Lys Ala Lys Ala Glu Asp Leu210 215 220
Arg Cys Lys Ala Ile Asp Gly Gly vai Pro vai Pro Asp Ile Ser Lys225 230 235 240
ser Thr Tyr Gly Glu Thr245
<210> 27
<211> 693
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 27
atgatttatc agccggggac aacaggcatc gtcgtgcagg atattgcacg cgctgatcaa 60
gccattatcg atggcctagc agaatgtggt gtggcgacgg tgcatgaggc acaggggcgc 120
aagggcctgt tggcggatta tatgacgccg atttactcgg gcgcgcgcat cgctggatct 180
gcggtgacca ttctggcacc gccgtgtgac aattggatga tccatgtggc ggtagaacag 240
ttgcaaaagg gcgatgtgtt gctgctgggc acgatcacac cgtccaatgc tggctatttc 300
ggtgacttgc tggccacgtc agccatggcg cacggttgtc gcggattgat cattgatggc 360
ggtgtgcgcg atgtgcaaga gctgacggat atgggctttc cggtttggtc caaggccgta 420
catgcccaag gcacaatcaa agaaacgctg ggatcggtca acgtgccagt tgtctgcggc 480
caagagttgg taaaccccgg tgatattgtg gtggccgacg atgacggggt gtgcgttgtg 540
cgccgcgaag aagctgctga tgtgctggct aaggcgcggg cgcgcgagag caatgaagcg 600
gccaagcgcg cgcgttttga ggccggtgag ctggggctgg atatctatga catgcgcgcg 660
cggctggccg aaaaaggact gaaatacgtc tga 693
<210> 28
<211> 230
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (27)...(179)<223> Demetilmenaquinona metiltransferase<400> 28
Met Ile Tyr Gln Pro Gly Thr Thr Gly lie vai vai Gln Asp Ile Ala15 10 15
Arg Ala Asp Gln Ala lie lie Asp Gly Leu Ala Glu Cys Gly vai Ala20 25 30
Thr vai His Glu Ala Gln Gly Arg Lys Gly Leu Leu Ala Asp Tyr Met35 40 45
Thr Pro lie Tyr Ser Gly Ala Arg lie Ala Gly Ser Ala Val Thr Ile50 55 60
Leu Ala Pro Pro Cys Asp Asn Trp Met lie His vai Ala vai Glu Gln65 70 75 80
Leu Gln Lys Gly Asp vai Leu Leu Leu Gly Thr Ile Thr Pro Ser Asn85 90 95
Ala Gly Tyr Phe Gly Asp Leu Leu Ala Thr ser Ala Met Ala His Gly100 105 110
Cys Arg Gly Leu lie lie Asp Gly Gly vai Arg Asp vai Gln Glu Leu115 120 125
Thr Asp Met Gly Phe Pro vai Trp Ser Lys Ala vai His Ala Gln Gly130 135 140
Thr lie Lys Glu Thr Leu Gly Ser vai Asn vai Pro Val vai Cys Gly145 150 155 160
Gln Glu Leu vai Asn Pro Gly Asp lie vai vai Ala Asp Asp Asp Gly165 170 175
vai Cys vai vai Arg Arg Glu Glu Ala Ala Asp vai Leu Ala Lys Ala180 185 190
Arg Ala Arg Glu ser Asn Glu Ala Ala Lys Arg Ala Arg Phe Glu Ala195 200 205
Gly Glu Leu Gly Leu Asp lie Tyr Asp Met Arg Ala Arg Leu Ala Glu210 215 220
Lys Gly Leu Lys Tyr vai225 230
<210> 29
<211> 756
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 29
ttgcagcgac agctttccac actgcagcgg cgatggaagg cttatacgtc gggcatggaacagaagattg cggaacggct gtcggccttg tcggtggcgc atctggccga tggctgcctgcgtgccggaa cggcgatgcg ggtggtggcc aatctacccc cgatcgtagc tggtcagcga 180acgtccggcc ggacacggcc ggtgcggcat tacggcagcg tcgacgtctt ccttgaagcg 240ctggccgacc ccagggcggg cgatgtgctg gtcgtcgaca atggcgaccg ggacgatgaa 300ggctgcatcg gcgacctgac ggcgctggaa gtcgctcagg ccgggctggc cgggatcatc 360atctcgggcc ggcaccgcga cacggcgatc ctccgctcca ttccaatcgc cttgttcagc 420cgcggtgcct gcgcgcgtgg gccggtccgg ctcgacgtcc gcgcgccgga gacattcgtc 480agcgcccgca ttggcgacga ggtcgtaacc gcagcagatt gggtagcggc cgatgacgac 540ggcgccatct tcatcggcga caaccatatt gcggcggtgg tcgcggcggc ggagtcgatc 600cgcgacaccg agctccggca gaccgggctg atgaaggccg ggacaagctt gcgcgagcag 660cttgaggtcg cggcttatct ggacgcgcgg gcggcggatc cggcgctgga cttccgcgcc 720catttgcgcg cgctcaacgc ggcgatcgag gaatga 756
<210> 30
<211> 251
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (28)...(184)
<223> Demetilmenaquinona metiltransferase<400> 30
Met Gln Arg Gln Leu Ser Thr Leu Gln Arg Arg Trp Lys Ala Tyr Thr1 5 10 15
Ser Gly Met Glu Gln Lys Ile Ala Glu Arg Leu Ser Ala Leu ser vai20 25 30
Ala His Leu Ala Asp Gly Cys Leu Arg Ala Gly Thr Ala Met Arg vai35 40 45
vai Ala Asn Leu Pro Pro lie vai Ala Gly Gln Arg Thr Ser Gly Arg50 55 60
Thr Arg Pro vai Arg His Tyr Gly Ser vai Asp vai Phe Leu Glu Ala65 70 75 80
Leu Ala Asp Pro Arg Ala Gly Asp vai Leu vai vai Asp Asn Gly Asp85 90 95
Arg Asp Asp Glu Gly Cys Ile Gly Asp Leu Thr Ala Leu Glu vai Ala100 105 110
Gl π Ale Gly Lgu Ala Gly IIg ιΙθ IIg Sgt Gly Arg His Arg Asp Thr115 120 125
Ala Ile Leu Arg Ser lie Pro Ile Ala Leu Phe Ser Arg Gly Ala Cys130 135 140
Ala Arg Gly Pro vai Arg Leu Asp vai Arg Ala Pro Glu Thr Phe vai145 150 155 160Ser Ala Arg lie Gly Asp Glu vai vai Thr Ala Ala Asp Trp vai Ala
165 170 175
Ala Asp Asp Asp Gly Ala lie Phe lie Gly Asp Asn His Ile Ala Ala180 185 190
vai vai Ala Ala Ala Glu Ser lie Arg Asp Thr Glu Leu Arg Gln Thr195 200 205
Gly Leu Met Lys Ala Gly Thr Ser Leu Arg Glu Gln Leu Glu vai Ala210 215 220
Ala Tyr Leu Asp Ala Arg Ala Ala Asp Pro Ala Leu Asp Phe Arg Ala225 230 235 240
His Leu Arg Ala Leu Asn Ala Ala lie Glu Glu
245 250
<210> 31<211> 327<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 31
gtgagacagg gaatgcgact tgctcacacg cgtgtggcgc ccgaacttgt atcggccttc 60tcggctgttc agaccgccac gattcacgag gcacaaggtg gtatcggtgc ggtcgcggcg 120gatattcgcc ctctcgaccg ggcaatgtcc atctgcggcc ctgccctgac gatcaaaact 180ccgcccgcgg acaacctggc gcttcaccag gcgctttatc tcgcggaacc gggtgacgtg 240ctggtggtcg attgcgcaag ccacaccgag gccgggcaat ggggcggcat tctcatggaa 300gcagccaagg tgcgcggcat agccggg 327
<210> 32<211> 109<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 32
Met Arg Gln Gly Met Arg Leu Ala His Thr Arg vai Ala Pro Glu Leu1 5 10 15
vai Ser Ala Phe Ser Ala vai Gln Thr Ala Thr lie His Glu Ala Gln20 25 30
Gly Gly Ile Gly Ala vai Ala Ala Asp lie Arg Pro Leu Asp Arg Ala35 40 45
Met Ser Ile Cys Gly Pro Ala Leu Thr Ile Lys Thr Pro Pro Ala Asp50 55 60
Asn Leu Ala Leu His Gln Ala Leu Tyr Leu Ala Glu Pro Gly Asp vai65 70 75 80
Leu vai vai Asp Cys Ala Ser His Thr Glu Ala Gly Gln Trp Gly Gly85 90 95lie Leu Met Glu Ala Ala Lys vai Arg Gly Ile Ala Gly100 105
<210> 33
<211> 681
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 33
gcgctcgaga gcgtcacgac cgcgacgctg accaccgtgc tgctgaagca gggcctgcgc 60aacgtctgga tgcgcggcac ccggccgctg gcgagcggtc agccgcgcaa ggtcgggcgc 120gcgttcacgc tccgcttcgt gccggcgcgc gaggacctcg cgaccccggc ttcatggggc 180gcgccgatct cgacccgcgc cgcgatcgag gcgatgccgg aaggcgtgat cgcggtcgcc 240gatgcgatgg gcgtgactga cgccggcatc ttcggcgaca tcctgtgcgc ccggatgcgc 300cggcgcaacg tggccgcgct cgtgaccgac ggcgtgatcc gcgacctggc cggcgtgctg 360agcaccggcc tgccggtctg gtgccagggt accgcagcgc cttcgtcggt caccggcctg 420accttcgtcg cctggcagca gccggtcggc tgcggtgggg tggcggtgtt cccgaacgac 480gtggtcgtca tcgacgccga cggcgcggtc gtcatcccgg ctgcgctgct cgatggcgtc 540atcgcggagg cgatcgagca ggagacccag gagggctgga tcatgcggga ggtggagggc 600ggtgcggcgc tgccgggcct ctatccgatg aacgaggcga cgaaggcgcg ctacgaagcc 660tggaagaagg cgagcgactg a 681
<210> 34
<211> 226
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (3)...(171)
<223> Demetilmenaquinona metiltransferase<400> 34
Ala Leu Glu ser vai Thr Thr Ala Thr Leu Thr Thr vai Leu Leu Lys15 10 15
Gln Gly Leu Arg Asn vai Trp Met Arg Gly Thr Arg Pro Leu Ala Ser20 25 30
Gly Gln Pro Arg Lys Val Gly Arg Ala Phe Thr Leu Arg Phe vai Pro35 40 45
Ala Arg Glu Asp Leu Ala Thr Pro Ala Ser Trp Gly Ala Pro lie Ser50 55 60
Thr Arg Ala Ala lie Glu Ala Met Pro Glu Gly vai Ile Ala vai Ala65 70 75 80
Asp Ala Met Gly vai Thr Asp Ala Gly Ile Phe Gly Asp lie Leu Cys85 90 95Ala Arg Met Arg Arg Arg Asn vai Ala Ala Leu vai Thr Asp Gly vai100 105 110
Ile Arg Asp Leu Ala Gly vai Leu Ser Thr Gly Leu Pro Val Trp Cys115 120 125
Gln Gly Thr Ala Ala Pro ser Ser vai Thr Gly Leu Thr Phe vai Ala130 135 140
Trp Gln Gln Pro Val Gly Cys Gly Gly vai Ala vai Phe Pro Asn Asp145 150 155 160
vai vai vai lie Asp Ala Asp Gly Ala vai vai lie Pro Ala Ala Leu165 170 175
Leu Asp Gly vai lie Ala Glu Ala Ile Glu Gln Glu Thr Gln Glu Gly180 185 190
Trp lie Met Arg Glu Val Glu Gly Gly Ala Ala Leu Pro Gly Leu Tyr195 200 205
Pro Met Asn Glu Ala Thr Lys Ala Arg Tyr Glu Ala Trp Lys Lys Ala210 215 220
ser Asp225
<210> 35
<211> 681
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 35
gtgaccgatc cggttgtcgt tcgacagatc gacaggccgt ccgcgaatct ggtcgctgat 60ctgcagcgct acggcgtctc caccgtgcac gaggcgcaag ggcgtcgcgg cctgctcgcg 120tcgtacatgc ggccgatcta tgccggcgcg ctcatcgccg gtcccgcgat cacggtcctg 180gtgccgcctg gcgacaactt gatgatccac gtcgccgtgg aagtgtgcca gcccggcgac 240gttctcatcg tcgccaccac ctcgccgtgc accgacggct atttcggcga gctgctggcg 300acgtcgctgc gggcccgcgg cgtggcgggg ctcgtgatcg atgcgggctg ccgggatgtt 360cgcgcgctga cagaaatgcg atttcccgtc tggagccgcg cgatcagcgc gcagggaacc 420gtcaaagcga cgctgggctc ggtgaacgcg gcggtggtgt gcgccggggc gtcggtgaga 480gccggggatc tcatcgtggc cgacgatgac ggggtggtgg cggtgcggcg ggaggaagtc 540gtcgccgtga cgcaggcagc cgaacagcgc gttcgcaagg aagagggcac gcgcgcacgg 600ctcgcgcagg gcgagctcgg cctggacatt tacggcttgc gccagaagct gtcggatctc 660ggcttgaagt catcgtcgtg a 681
<210> 36
<211> 226
<212> PRT
<213> Desconhecido
<220><223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 36
Met Thr Asp Pro Val vai vai Arg Gln lie Asp Arg Pro Ser Ala Asn1 5 10 15
Leu vai Ala Asp Leu Gln Arg Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala Leu Ile Ala Gly Pro Ala Ile Thr vai Leu vai Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gln Pro Gly Asp65 70 75 80
Val Leu lie vai Ala Thr Thr ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala Arg Gly vai Ala Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu Met Arg Phe115 120 125
Pro vai Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn Ala Ala vai vai Cys Ala Gly Ala Ser vai Arg145 150 155 160
Ala Gly Asp Leu Ile vai Ala Asp Asp Asp Gly vai Val Ala vai Arg165 170 175
Arg Glu Glu vai vai Ala vai Thr Gln Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly Leu Lys Ser210 215 220
Ser ser225
<210> 37
<211> 675
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientaisatggccggcg tcgtggttca acagatcgag cgcgccggtc tcgacactgc cgctgccctc 60ggggaatgcg gcgtcgccac agtgcacgag gcgcagggcc ggacagggct gatgcgctcc 120tacatgcggc cgatttattc aggcgcccgc gttgcgggcc ccgcggtaac ggtgtctatc 180ccgccgggcg acaactggat gattcacgtc gctgtggaac agtgccggga aggcgacgtc 240ctcgtcgtgg cgccgacgag tccttgcgag gacggctatt tcggcgagct gctcgcctgc 300tcgctgcaga cccgccgagt gagcggtctc atcatagagg ccggggtgcg cgacgtccgc 360gagctgaccg agatgcggtt cccggtttgg tccaaggcga ttctcgcaca agggactgtg 420aaggaaacca tcggctcggt gaacgtcgca atcgtctgcg ccggtgcggc ggtcagtccc 480ggcgacgtga tcgtcgccga tgacgacggc gtctgcattg tgccgcgcgg acaggcggag 540acggtgcttc aggcgagccg cgcccgcgag gcgaaggagg ccgaaacgcg gcggcggctc 600cggtcgggcg aactcggcct cgatatctac agcatgcgcg aaaagctggc ggccaggggc 660ctgaaatatg tctga 675
<210> 38<211> 224<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<400> 38
Met Ala Gly Val Val vai Gln Gln lie Glu Arg Ala Gly Leu Asp Thr15 10 15
Ala Ala Ala Leu Gly Glu Cys Gly vai Ala Thr vai His Glu Ala Gln20 25 30
Gly Arg Thr Gly Leu Met Arg ser Tyr Met Arg Pro lie Tyr ser Gly35 40 45
Ala Arg vai Ala Gly Pro Ala vai Thr vai ser Ile Pro Pro Gly Asp50 55 60
Asn Trp Met Ile His vai Ala vai Glu Gln Cys Arg Glu Gly Asp vai65 70 75 80
Leu vai vai Ala Pro Thr ser Pro Cys Glu Asp Gly Tyr Phe Gly Glu85 90 95
Leu Leu Ala Cys Ser Leu Gln Thr Arg Arg vai Ser Gly Leu Ile Ile100 105 110
Glu Ala Gly vai Arg Asp vai Arg Glu Leu Thr Glu Met Arg Phe Pro115 120 125
vai Trp Ser Lys Ala Ile Leu Ala Gln Gly Thr vai Lys Glu Thr lie130 135 140
Gly ser vai Asn Val Ala lie vai Cys Ala Gly Ala Ala vai Ser Pro145 150 155 160
Gly Asp vai lie vai Ala Asp Asp Asp Gly Val Cys lie vai Pro Arg165 170 175
Gly Gln Ala Glu Thr vai Leu Gln Ala Ser Arg Ala Arg Glu Ala Lys180 185 190
Glu Ala Glu Thr Arg Arg Arg Leu Arg Ser Gly Glu Leu Gly Leu Asp195 200 205
lie Tyr ser Met Arg Glu Lys Leu Ala Ala Arg Gly Leu Lys Tyr vai210 215 220
<210> 39
<211> 672
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 39
atggccaaag ttgttcaaaa tatcgaacgc gcagcccaaa aggtgattga tgcgcttggg 60gcctgcggtg ttgccacggt gcatgaggcg caggggcgca aaggcctgct cgcttcctat 120atgcggccga tttattccgg tgcgcggctt gcggcatcgg cggtgaccat atcggctgca 180cccggtgata actggatggt gcatgtggcg attgagcaag tgaaagaggg cgacattttg 240gtgcttgccc cgacctcgcc ttgtgaagac ggctattttg gcgatctgct ggcgacatcg 300atgcaggcgc gtggcgggcg tgggctgatt atcgatgccg gggttcgcga tattcgcgat 360ctgacggaaa tgggttttcc ggtgtggtca aaggcgattt atgcccaagg cacggtcaag 420aaaacgctgg ggtcggttaa tattcctatc gtctgcgccg gtgcgcttat caatgctggc 480gacattattg ttgccgatga tgacggtgtg tgtgttgtgg cccgagaaga ggccgaagcg 540gtgctggcca aggcgcaggc gcgcgaggcc aatgaggaag acaagcgcaa gcggttggct 600gccggtgagt tggggcttga tatgtataac atgcgcgcac ggctggcgga aaagggcctg 660aaatatgttt ag 672
<210> 40<211> 223<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 40
Met Ala Lys vai vai Gln Asn lie Glu Arg Ala Ala Gln Lys vai Ile1 5 10 15
Asp Ala Leu Gly Ala Cys Gly Val Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala35 40 45Arg Leu Ala Ala ser Ala vai Thr Ile Ser Ala Ala Pro Gly Asp Asn50 55 60
Trp Met vai His vai Ala Ile Glu Gln vai Lys Glu Gly Asp Ile Leu65 70 75 80
vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Met Gln Ala Arg Gly Gly Arg Gly Leu Ile Ile Asp100 105 110
Ala Gly vai Arg Asp lie Arg Asp Leu Thr Glu Met Gly Phe Pro vai115 120 125
Trp ser Lys Ala lie Tyr Ala Gln Gly Thr vai Lys Lys Thr Leu Gly130 135 140
ser vai Asn Ile Pro Ile vai Cys Ala Gly Ala Leu lie Asn Ala Gly145 150 155 160
Asp Ile Ile vai Ala Asp Asp Asp Gly vai Cys vai Val Ala Arg Glu165 170 175
Glu Ala Glu Ala vai Leu Ala Lys Ala Gln Ala Arg Glu Ala Asn Glu180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Met195 200 205
Tyr Asn Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 41<211> 672<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 41
atgggtgtcg tggtccagaa cattgcccgc gcagcctccg atgtcatcga tcggctcgca 60gcctgcggtg tcgcaacggt acatgaggcg cagggtcgca cggggctgct tgccagccat 120atgcggccga tctatccggg cgcgcggctc gcggcaagcg cggtgaccat ctctgcgccg 180ccaggtgaca actggatgat ccatgtggcg atcgagcagt tgaaggatgg cgacgtgctg 240ctgctcgcgc cgacgagccc ctgcgaggat ggctatttcg gcgacctcct ggcgacgtcg 300gccagggcga ggggctgccg gggcctgatc atcgatgccg gcgtgcgcga cgttgccgat 360ctgaccgaga tgaagtttcc cgtctggtcg aaggcgatct ttgcgcaggg aaccgtcaag 420gagactgtcg gatcggtgaa tgtaccggtc gtttgcgccg gtgctttcgt caatccgggc 480gatgtgatcg tcgccgacga tgacggcgcc tgcgtcgtgc cccggcaaga cgcggccgat 540gtggccgaca aggcggaggc acgtgtcgct gccgaggagg ccaagcgcaa gcggctggca 600tcgggcgagc ttgggctcga catctacgac atgcgcgggc ggctggcgca gaggggcctg 660aaatatgtct ga
<210> 42
<211> 223
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 42
Met Gly vai vai vai Gln Asn lie Ala Arg Ala Ala Ser Asp vai Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Leu Ala ser His Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Arg Leu Ala Ala ser Ala vai Thr Ile ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala lie Glu Gln Leu Lys Asp Gly Asp vai Leu65 70 75 80
Leu Leu Ala Pro Thr ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Arg Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp100 105 110
Ala Gly vai Arg Asp Val Ala Asp Leu Thr Glu Met Lys Phe Pro vai115 120 125
Trp ser Lys Ala Ile Phe Ala Gln Gly Thr vai Lys Glu Thr vai Gly130 135 140
Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Phe vai Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly Ala Cys vai vai Pro Arg Gln165 170 175
Asp Ala Ala Asp vai Ala Asp Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Glu Ala Lys Arg Lys Arg Leu Ala ser Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Gln Arg Gly Leu Lys Tyr vai210 215 220
<210> 43<211> 672<212> DNA<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 43
atgagcgtcg tcgttcagaa catcgcgcgc gccgatcaat ccatcgtcga taggctcggg 60gcctgcggcg tcgccaccgt gcacgaagcg cagggccgca aaggattgct cgcgagccac 120atgcggccga tctattccgg cgcgcggctc gcggcgagcg ccgtgaccat ctcggcgccg 180ccgggtgaca attggatggt ccatgtcgcg atcgagcaat tgcgagccgg cgacattatg 240gtgctcgcgc cgaccagccc gtgcgaggat ggctatttcg gtgatctgct cgcgacctcg 300gcgaaagcgc ggggctgccg cggtctcatc atcgatgccg gcgtgcgcga tgtcgccgat 360ctcaccgcga tgcagtttcc cgtctggtcc aaggccgtct tcgcccaggg aaccgtgaag 420gaaacgctcg gctcggtaaa catccccgtg gtctgcgccg gtgcgctggt caatccgggc 480gatgtcatcg tcgccgatga cgatggtgtc tgcgtcgtgc gccgcgaaga ggcggaggcg 540gtggcgcaga aggccgaggc ccgcgtcgcc gccgaggagg ataagcgcaa gcgcctcgcc 600gccggcgaac tcggcctcga catctacaag atgcgcgagc ggctcgccga gaaggggctc 660aaatatgtct ga 672
<210> 44<211> 223<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiItransferase<400> 44
Met Ser vai vai vai Gln Asn lie Ala Arg Ala Asp Gln Ser lie vai15 10 15
Asp Arg Leu Gly Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro lie Tyr Ser Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala vai Thr lie Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met vai His vai Ala lie Glu Gln Leu Arg Ala Gly Asp Ile Met65 70 75 80
vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys Arg Gly Leu lie lie Asp100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Thr Ala Met Gln Phe Pro vai115 120 125Trp Ser Lys Ala vai Phe Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn Ile Pro vai vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Glu Ala vai Ala Gln Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 45
<211> 672
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 45
atgaacgttg tcgtccagaa ctttgaacgg gctgatcctg cggttgttaa ggccttgggc 60gaatgtggtg tggccacggt gcatgaagca cagggccgca aggggctttt agcctcttat 120atacgcccga tttatagcgg aacttctatc ggggcttcgg ctgttaccat acttgcggct 180ccatgcgaca actggatgct gcatgtggcg atcgaacaag tgcaagcggg cgatgtattg 240gtactggcgg ttacgtcacc atcagacgca ggttactttg gcgatttgtt agcaacatct 300gcgcaagcgc ggggttgcgc aggtttgatc actgatgcgg gcgtacgcga tgtgcgcgat 360ttgcaggcga tgaattttcc ggtttggtcg aaagcgatct gtgcgcaagg cacggtgaaa 420gaaaccctgg gttcggtcaa cgttcccgtt gtctgtgcag gagcgaagat taatcccggt 480gatgtgattg tggcggatga tgatggggtt tgcgctgtga agtgcgaaga ggcggcagag 540gttttgaaaa aagcgcaagc gcgtttggcc aatgaagagc agaaacgtac gcgattggct 600gatggtgagt tagggctgga catgtatgat atgcgcgggc gcctagctga aaaaggtctg 660aaatatgtct aa 672
<210> 46
<211> 223
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiItransferase<400> 46
Met Asn vai vai Val Gln Asn Phe Glu Arg Ala Asp Pro Ala vai vai1 5 10 15
Lys Ala Leu Gly Glu Cys Gly Val Ala Thr vai His Glu Ala Gln Gly20 25 BO
Arg Lys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Ser Gly Thr35 40 45
ser lie Gly Ala ser Ala vai Thr lie Leu Ala Ala Pro Cys Asp Asn50 55 60
Trp Met Leu His vai Ala Ile Glu Gln Val Gln Ala Gly Asp vai Leu65 70 75 80
vai Leu Ala vai Thr ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Ala Gly Leu Ile Thr Asp100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Gln Ala Met Asn Phe Pro vai115 120 125
Trp Ser Lys Ala lie Cys Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Lys Ile Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys Ala vai Lys Cys Glu165 170 175
Glu Ala Ala Glu vai Leu Lys Lys Ala Gln Ala Arg Leu Ala Asn Glu180 185 190
Glu Gln Lys Arg Thr Arg Leu Ala Asp Gly Glu Leu Gly Leu Asp Met195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 47
<211> 672
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 47
atgggtattg ttgttcagaa catcaagcgg gcggaccccg ggatcatagc aggtcttggc 60aaatgcggcg ttgccactgt gcatgaagcg caggggtgca aggggctcct ggcggcctat 120atgcggccca tttattctgg cgcgcgcctt gccgcctccg ctgtcaccat ttccgcgccg 180ccgggagaca actggatggt gcatgtcgcc attgagcagg tgaggcaagg tgatattctg 240gttcttgccc caacatcgcc ctgtgaagac ggctatttcg gtgatttgct cgccacctcc 300atgctgcagc gcggcggcag ggggctgatt attgacgccg gtgtccgcga tatccgtgat 360ctgactcaaa tgaaatttcc ggtgtggtcg aaaaccgttt ttgcgcaggg caccgttaag 420gaaacccttg gctctgtgaa cgtcccgata gtttgcgccg gtgaagtggt caatcctggc 480gacatcatga ttgccgatga tgatggtgtg tgcgtggtcc ggcgcgacga cgctgaaagc 540
gtgcttgaaa aagcattggc gcgtgaggca aaggaagaag atacacgcaa acgccttgcg 600
gcaggcgagc tgggtcttga tatttacggc atgcgcgcac gtctggccga aaagggccta 660
aaatatgtct ga 672
<210> 48
<211> 223
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 48
Met Gly lie Val vai Gln Asn Ile Lys Arg Ala Asp Pro Gly lie Ile1 5 10 15
Ala Gly Leu Gly Lys Cys Gly Val Ala Thr Val His Glu Ala Gln Gly20 25 30
Cys Lys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala vai Thr lie Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met vai His vai Ala lie Glu Gln vai Arg Gln Gly Asp lie Leu65 70 75 80
vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Met Leu Gln Arg Gly Gly Arg Gly Leu Ile Ile Asp100 105 110
Ala Gly vai Arg Asp Ile Arg Asp Leu Thr Gln Met Lys Phe Pro vai115 120 125
Trp ser Lys Thr vai Phe Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro Ile vai Cys Ala Gly Glu vai vai Asn Pro Gly145 150 155 160
Asp Ile Met Ile Ala Asp Asp Asp Gly vai Cys vai Val Arg Arg Asp165 170 175
Asp Ala Glu ser vai Leu Glu Lys Ala Leu Ala Arg Glu Ala Lys Glu180 185 190
Glu Asp Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Gly Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val210 215 220<210> 49<211> 672<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 49
atgagcatcg tcgtccagaa catcgagcgc gccgacaagg atgcggttgt ggcactcggc 60gaatgcggcg ttgcgacggt gcatgaggcg caggcccgca aagggctcat gcggccttac 120atgcggccaa tctatgccgg cgcccgcatc gccggcccag ccgtgacggt ctcgatcgcg 180ccgggcgaca actggatgat ccatgtggca gtggagcagt gccgcgacgg cgatatcctc 240gtggtggcac cgaccagccc gagtgaagac ggctatttcg gcgaactgct ggcgcgctcg 300ctcatggcgc gcggtgtgaa ggggctgatc atcgaagccg gggtgcgcga cgtgcgcgac 360ctcaccgaga tcaatttccc ggtctggtcg aaagcgatct ccgcgcaagg gacggtgaag 420gaaacgctcg gctcggtgaa tgtgccggtc gtctgcgccg gcgcgctggt caatccgggc 480gacgtcatca ttgccgatga cgacggcgtc tgtgtcgtgg cgcgcgctgc ggcaagtgac 540gttgcgaagg cgtcccgaac ccgcgaagcc aaggaagccg aaacccgcaa gcgcctgatg 600gcgggtgaac tcggactcga catctacggg atgcgcgaca agcttgcggc caagggcctg 660aaatatgtct ga 672
<210> 50<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 50
Met Ser Ile vai vai Gln Asn Ile Glu Arg Ala Asp Lys Asp Ala vai1 5 10 15
vai Ala Leu Gly Glu Cys Gly vai Ala Thr Val His Glu Ala Gln Ala20 25 30
Arg Lys Gly Leu Met Arg Pro Tyr Met Arg Pro lie Tyr Ala Gly Ala35 40 45
Arg lie Ala Gly Pro Ala vai Thr vai Ser lie Ala Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala vai Glu Gln Cys Arg Asp Gly Asp lie Leu65 70 75 80
vai vai Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Arg ser Leu Met Ala Arg Gly vai Lys Gly Leu lie lie Glu100 105 110Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu Ile Asn Phe Pro vai115 120 125
Trp ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly130 135 140
ser vai Asn vai Pro Val vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai Ile lie Ala Asp Asp Asp Gly vai Cys Val vai Ala Arg Ala165 170 175
Ala Ala Ser Asp vai Ala Lys Ala ser Arg Thr Arg Glu Ala Lys Glu180 185 190
Ala Glu Thr Arg Lys Arg Leu Met Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Gly Met Arg Asp Lys Leu Ala Ala Lys Gly Leu Lys Tyr vai210 215 220
<210> 51
<211> 672
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 51
atgggcgtcg tggtccagaa tatcgcccgg gccgagcagt ccgtcgtcga caggctggct 60gcgtgcggtg ttgccacggt gcacgaggcg cagggccgca aggggctgct cgcgagttct 120gtgcggccga tctatccggg cgcgcgggtg gcggccagcg cggtcacgat ctcagcgccg 180ccgggtgaca actggatggt ccatgtagcg atcgaacagt tgaaggaggg cgacatcctg 240ctgttggcgc cgaccagtcc ctgcgaggat ggctatttcg gtgatctgct cgccacttcg 300gccatggcgc ggggctgccg cggactgatc atagatgcgg gggtgcgcga cgtcgcggac 360ctgacggcga tgcagtttcc agtctggtcc aaggcgatct tcgcccaagg caccgtcaag 420gaaacgctgg gttcggtgaa tattcctgtg gtctgcgccg gcgcgctggt caatcccggt 480gacgtgatcg tggccgatga cgacggcgtc tgcgtcgtcc gccgcgaaga ggcggccgcc 540gtcgccgaaa aggcggaggc acgggtggcg atcgaggaag gcaaacgcaa gcggctcgcg 600gcgggcgaac tcgggctcga tatttacgac atgcgcagtc gccttgccga gaaggggctg 660aaatatgtct ga 672
<210> 52
<211> 223
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 52Met Gly vai vai vai Gln Asn lie Ala Arg Ala Glu Gln ser vai vai1 5 10 15
Asp Arg Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala ser Ser vai Arg Pro lie Tyr Pro Gly Ala35 40 45
Arg vai Ala Ala ser Ala vai Thr lie Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met vai His vai Ala Ile Glu Gln Leu Lys Glu Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu lie Ile Asp100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Thr Ala Met Gln Phe Pro vai115 120 125
Trp ser Lys Ala lie Phe Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn Ile Pro vai vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai Val Arg Arg Glu165 170 175
Glu Ala Ala Ala vai Ala Glu Lys Ala Glu Ala Arg vai Ala Ile Glu180 185 190
Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Asp Met Arg Ser Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 53
<211> 675
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 53
atgaagccgg tggtggtgca gactatcgag cgggccgacc gagcgatcat cgagggtctg 60
gccgcgtgtg gcgttgccac cgtccatgag gcgcaggggc gccgggggct gcttgcgtcc 120
tacatgcgcc cgatctattc gggcgctgcg gttgcggcct cggccgtcac catcctctct 180
ccaccctgcg acaactggat gctgcacgtc gccatcgagc agatccagcc gggcgacatt 240
ctcgttctcg gcacgacctc tccgtccgat gccggctatt tcggtgatct gctggcgact 300
tcggccaagg cgcgcggttg cgtcgggttg gtcatcgatg ccggcgtacg cgatatccgc 360gacctgacag cgatgcagtt tccggtctgg tccaaggccg tttcggccca gggcacgatc 420aaggagacgc tgggttcggt caacgtcccc gtcgtctgcg ccggtgctct ggtcaatccc 480ggcgacgtcg tcgtggccga tgacgacggt gtctgcgtgg tgcgccgcga ggaagccgcg 540gaaacgctgg aaaaggcccg ggcgcggatc gccaatgagg aggaaaagcg ccagcgcttt 600gccgctggcg aactcgggct cgacatctac aagatgcgcg aacgcctcgc tgccctgggg 660ctcacctatg tctga 675
<210> 54
<211> 224
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<400> 54
Met Lys Pro vai vai vai Gln Thr lie Glu Arg Ala Asp Arg Ala lie1 5 10 15
lie Glu Gly Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln20 25 30
Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly35 40 45
Ala Ala vai Ala Ala Ser Ala vai Thr lie Leu ser Pro Pro Cys Asp50 55 60
Asn Trp Met Leu His vai Ala Ile Glu Gln Ile Gln Pro Gly Asp Ile65 70 75 80
Leu vai Leu Gly Thr Thr ser Pro ser Asp Ala Gly Tyr Phe Gly Asp85 90 95
Leu Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys vai Gly Leu vai Ile100 105 110
Asp Ala Gly vai Arg Asp lie Arg Asp Leu Thr Ala Met Gln Phe Pro115 120 125
vai Trp ser Lys Ala vai ser Ala Gln Gly Thr lie Lys Glu Thr Leu130 135 140
Gly ser Val Asn vai Pro vai vai Cys Ala Gly Ala Leu vai Asn Pro145 150 155 160
Gly Asp vai vai vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg165 170 175
Glu Glu Ala Ala Glu Thr Leu Glu Lys Ala Arg Ala Arg Ile Ala Asn180 185 190
Glu Glu Glu Lys Arg Gln Arg Phe Ala Ala Gly Glu Leu Gly Leu Asp195 200 205
Ile Tyr Lys Met Arg Glu Arg Leu Ala Ala Leu Gly Leu Thr Tyr vai210 215 220
<210> 55<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 55
atgaatgatc cggtggtggt ccggcaagtg gagcagccgc cagccgacgc cgttgtcgca 60ttggagaagt gtggtgtgac gaccgtgcat gaagctcagg gacgttgtgg tctccttgcc 120tcctacatgc gtccgattta ctcgggagca agcatcgccg gttccgctgt gactgtctct 180ctgcctcctg gcgacaacct catgatccac gtcgccgtcg aggtttgcgg tccgggaaac 240atcctggtcg tttcaccaac gtcgccttgc accgatggct acttcggaga gctgttggcg 300acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggctg ccgcgacgtc 360cggtcgttaa ccgagatgaa atttcctgtc tggagccgcg gcatcagctc gcaagggaca 420gtcaaagcca cgctcggatc tgtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540caagaggtcg ccgccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600cttgctcgtg gagaactcgg actggatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctaaagt atctgtga 678
<210> 56<211> 225<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 56
Met Asn Asp Pro vai vai vai Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Val Ala Leu Glu Lys Cys Gly Val Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser35 40 45
Gly Ala Ser lie Ala Gly Ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu Val Cys Gly Pro Gly Asn65 70 75 80
lie Leu vai vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Gly Ile Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Ala vai Thr Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai lie Val Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Gln Ala Gln Glu vai Ala Ala Ala Ala Gln Gln Arg vai Arg180 185 190
Lys Glu Asp vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 57
<211> 678
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 57
atgaatgatc cggtggtagt ccgagaggtg gagcagccac cagcggatgc ggttgtcaca 60ttggagaagt gcggagtgac aactgtgcat gaggcgcagg gacgttgtgg ccttctcgcc 120cactacatgc gtccgattta tcctggagcc accatcgccg gttccgctgt cactgtctct 180ttgccgcctg gcgacaacct catgatccac gttgcggtcg aggtttgtcg tccgggaaac 240atcctggtcg tttcaccgac gtcgccttgc accgatggct acttcggaga gctgttggcg 300acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggctg ccgcgacgtc 360cggtcgttga ccgagatgaa atttcctgtc tggagccgcg gcatcagctc gcaagggacg 420gtcaaagcca cgctcggatc tgtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540caagaggtcg ccgccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600cttgctcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctaaagt atctgtga 678
<210> 58
<211> 225
<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 58
Met Asn Asp Pro vai vai vai Arg Glu vai Glu Gln Pro Pro Ala Asp15 10 15
Ala vai Val Thr Leu Glu Lys Cys Gly vai Thr Thr Val His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro lie Tyr Pro35 40 45
Gly Ala Thr lie Ala Gly ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Arg Pro Gly Asn65 70 75 80
lie Leu vai vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly Val Arg Gly Leu vai100 105 110
lie Asp Ala Gly Cys Arg Asp Val Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Gly lie Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Ala vai Thr Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai Val vai vai Lys165 170 175
Arg Ala Gln Ala Gln Glu vai Ala Ala Ala Ala Gln Gln Arg vai Arg180 185 190
Lys Glu Asp vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 59<211> 678<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 59 atgaatgatc cggtggtagt ccgagaggtg gagcagccac cagcggatgc ggttgtcaca 60ttggagaagt gtggagtgac aaccgtgcat gaggcacagg gacgttgtgg ccttctcgcg 120cactacatgc gtccgattta cccgggggca accatcgccg gttccgctgt cactgtctct 180ttgccgcctg gcgacaacct catgatccac gtcgccgtcg aggtttgcgg tccgggaaac 240atcctggtcg tttcaccgac gtcgccttgc accgatggct acttcggaga gctgttggcg 300acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggatg ccgtgatgtc 360cggtcgttga ccgagatgaa atttcctgtc tggagccgcg cgatcagctc gcaagggaca 420gtcaaagcca cgctcgggtc ggtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcgggcg 540caagaggtcg cggccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600cttgctcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctaaagt atctgtga 678<210> 60 <211> 225 <212> PRT <213> Desconhecido <220> <223> obtido a partir de amostras ambientais <220> <221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinona metiltransferase <400> 60 Met Asn Asp Pro vai vai vai Arg Glu vai Glu Gln Pro Pro Ala Asp
10 15
Ala vai vai Thr Leu Glu Lys Cys Gly vai Thr Thr vai His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Thr Ile Ala Gly Ser Ala vai Thr vai ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Arg Gly Leu vai
100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala lie Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140Leu Gly ser vai Asn vai Ala vai Thr Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Arg Ala Gln Glu vai Ala Ala Ala Ala Gln Gln Arg vai Arg180 185 190
Lys Glu Asp Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 61
<211> 675
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 61
atgagcggcg tggttgtgcg ggaggtcgcc cgcccggcgc ccgatctcgt ggcctcgctc 60gaagaggcgg gtgtctcaac cgtccacgaa gcacagggac gccggggact gctcgccacc 120tacatgcgtc cgatctacgc cggagccacg ctcgcgggac cggcagtcac cgtcctcgtc 180ccccccggcg acaacctgat gattcacgta gccgtggagg tgtgccgccc gggtgacgtg 240ctggtcgtcg ccgtcacgtc gccgtgcacc gacggttact tcggcgagct gctggcgacg 300tcggttcgcg cgcgcggcgt caaggggctc gtcatcgatg caggctgccg ggacgtgcgg 360gcgctcaccg agatgcggtt tccggtgtgg agccgggcgg tcagcgcgca gggcaccgtc 420aaggccacgc tgggctccgt gagcgttccg gtcgtttgcg ccggcgcgct gatcgaggcc 480ggcgacgtcg tcgtgggcga cgacgacgga gtggttgtcg tgaaacggag cgaggccgat 540gcggtcgtga gtgcttcgcg ccagcggctc ctcaaggaag aggggacgcg tcagcgcctg 600gcaagcggtg aactcggtct ggacatctac tcgctgcgca aaacgctttc cgacctgggg 660ctgaagtacc ggtaa 675
<210> 62
<211> 224
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<400> 62
Met ser Gly vai vai vai Arg Glu vai Ala Arg Pro Ala Pro Asp Leu1 5 10 15
vai Ala ser Leu Glu Glu Ala Gly vai Ser Thr vai His Glu Ala Gln20 25 BO
Gly Arg Arg Gly Leu Leu Ala Thr Tyr Met Arg Pro Ile Tyr Ala Gly35 40 45
Ala Thr Leu Ala Gly Pro Ala vai Thr vai Leu vai Pro Pro Gly Asp50 55 60
Asn Leu Met lie His vai Ala vai Glu vai Cys Arg Pro Gly Asp vai65 70 75 80
Leu vai vai Ala vai Thr ser Pro Cys Thr Asp Gly Tyr Phe Gly Glu85 90 95
Leu Leu Ala Thr Ser vai Arg Ala Arg Gly vai Lys Gly Leu vai lie100 105 110
Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu Met Arg Phe Pro115 120 125
vai Trp ser Arg Ala vai ser Ala Gln Gly Thr Val Lys Ala Thr Leu130 135 140
Gly Ser vai ser vai Pro vai vai Cys Ala Gly Ala Leu lie Glu Ala145 150 155 160
Gly Asp vai vai vai Gly Asp Asp Asp Gly Val vai vai vai Lys Arg165 170 175
Ser Glu Ala Asp Ala vai vai ser Ala Ser Arg Gln Arg Leu Leu Lys180 185 190
Glu Glu Gly Thr Arg Gln Arg Leu Ala ser Gly Glu Leu Gly Leu Asp195 200 205
lie Tyr Ser Leu Arg Lys Thr Leu ser Asp Leu Gly Leu Lys Tyr Arg210 215 220
<210> 63
<211> 693
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 63
atgaccggca tcgtcgtcca gtggttcgag cgcacgccgc ttgccgatgt cgcggcgctt 60gccgagttcg gcgtggctac catccacgag gcgcaaggcc gcaaggggct gctcgcgtcc 120tacatgcggc cgatctatgc gggtgctgcc gcggcgggca atgccgtcac agtatcggtg 180cctcccggtg acaactggat gatccatgtg gcggtcgagg tgtgccgcga gggcgacgtg 240ctggtggtcg ccccgacctc gccctgcgac aacggctatt tcggtgagct gctggcctgc 300tcgctcaagg cgcgcggcgt gcgcgggctc gtcatcgagg ccggctgccg cgacgtgaag 360ccactctccg acatgaagtt tcccgtgtgg tcgcgcgccg tttccgccca gggcaccgtc 420aaggagagcc tgggcgacgt caacctgccg ctcgtgatcg ccagccagac cgtgcatcct 480ggcgacgtgg tggtcgccga tgacgacggt gtcgtcatcg tcgctcgcgg cgaggtgcgc 540
gccgtcaccg ccaagtcgcg cgagcgcgag gacaaggagg ccgcaagccg cgagaagctg 600
agcaaggggg aggtgggcct cgacatctac ggcatgcggg ccaagctgaa ggagaagggc 660
attcgctacg tcgcgaatcc cgacaaactc tga 693
<210> 64
<211> 230
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<400> 64
Met Thr Gly lie vai vai Gln Trp Phe Glu Arg Thr Pro Leu Ala Asp1 5 10 15
vai Ala Ala Leu Ala Glu Phe Gly vai Ala Thr lie His Glu Ala Gln20 25 30
Gly Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly35 40 45
Ala Ala Ala Ala Gly Asn Ala vai Thr vai Ser vai Pro Pro Gly Asp50 55 60
Asn Trp Met Ile His vai Ala vai Glu vai Cys Arg Glu Gly Asp vai65 70 75 80
Leu vai vai Ala Pro Thr ser Pro Cys Asp Asn Gly Tyr Phe Gly Glu85 90 95
Leu Leu Ala Cys ser Leu Lys Ala Arg Gly vai Arg Gly Leu vai Ile100 105 110
Glu Ala Gly Cys Arg Asp vai Lys Pro Leu ser Asp Met Lys Phe Pro115 120 125
vai Trp Ser Arg Ala Val ser Ala Gln Gly Thr vai Lys Glu ser Leu130 135 140
Gly Asp vai Asn Leu Pro Leu vai Ile Ala ser Gln Thr vai His Pro145 150 155 160
Gly Asp vai vai vai Ala Asp Asp Asp Gly vai vai Ile Val Ala Arg165 170 175
Gly Glu vai Arg Ala vai Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys180 185 190
Glu Ala Ala Ser Arg Glu Lys Leu ser Lys Gly Glu vai Gly Leu Asp195 200 205
Ile Tyr Gly Met Arg Ala Lys Leu Lys Glu Lys Gly Ile Arg Tyr Val210 215 220Ala Asn Pro Asp Lys Leu225 230
<210> 65
<211> 672
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 65
atgagcatcg tcgtcacgaa gatcgagcgc gccggcgcgg cggccgtcgc cgcgctgcgc 60acaagtggcg ttgccacagt gcacgaggcg caagggcgca cgggcttgat gcgtccctac 120atgcggccga tctacccggg cgcgcgcatc gccggcacgg cgatcaccgt ctccctgcct 180ccgggcgaca actggatgat ccacgtcgcg gtcgagcagt gccgcgaggg cgatatcctc 240gtggtggcgc cgaccagccc gagcgacgac ggctatttcg gcgacctgct tggcaattcg 300ctcgtcgcac gcggcgtcag gggcctggtg atcgaggccg gtgtgcgtga cgtgcgcgac 360ctcacggaga tgcgctttcc ggtctggtcg aagacgattt cggcgcaagg cacggtcaag 420gagacgttgg gctcggtcaa cgtgccgatc gtctgcgcgg gtgctgccgt gaaccccgga 480gacgtgatcg tggccgacga cgacggcgtc tgcgtcgtgc cgcgccagac ggtcacagag 540gtcgtcgagg cggcccacgc ccgcgaggcc aaggaggccg aggtccggca gcggctcatc 600gcgggcgagc ttggcctcga cgtctacggc atgcgcgaga agctggcggc caagggcctc 660aaatatgtct ga 672
<210> 66
<211> 223
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> SIGNAL<222> (1)...(27)
<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 66
Met Ser Ile vai vai Thr Lys Ile Glu Arg Ala Gly Ala Ala Ala vai15 10 15
Ala Ala Leu Arg Thr ser Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Arg Ile Ala Gly Thr Ala Ile Thr vai Ser Leu Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala vai Glu Gln Cys Arg Glu Gly Asp Ile Leu65 70 75 80vai vai Ala
Leu Gly Asn
Ala Gly vai115
Trp Ser Lys130
Ser vai Asn145
Asp vai Ile
Thr vai Thr
Ala Glu vai195
Tyr Gly Met210
<210> 67<211> 672<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais
<400> 67
atgagcgttg tcgtcacgaa gatcgagcgc gccggcgccg aagctgttgt agcgctggcc 60gaaagtggtg tgtcgaccgt gcacgaggcg cagggccgga ccgggctgat gcggccttat 120atgcggccga tctacgcggg cgcgcggatc gccgggacgg cgatcaccgt gtcgctgcag 180ccgggcgaca actggatgat ccatgtggcg gtcgagcaat gccggcaggg cgacatcctc 240gtcgtggcgc cgaccagccc gagcgacgac gggtatttcg gcgacctgct cggcaattcg 300cttgtcgcgc ggggcgtcag ggggctggtg atcgaggccg gcgtgcgcga cgtgcgcgat 360ctgaccgcga tgggttttcc ggtatggtcg aagacagtct cggcgcaagg caccgtgaag 420gagacgctcg gctcggtgaa cgtgcccgtc gtctgcgcgg gggcgaccgc aaaccccggt 480gacgtgatcg tggccgatga cgacggcgtc tgcgtggtgc cgcgcgagac ggccgcggca 540gtggtcgagg cggcccatgc gcgggaggtg aaggaggcag aggtacggcg gcggctgatc 600tccggcgagc tcggcctaga catctacggc atgcgcgaca agctcgctgc caagggcctc 660aaatatgtct ga 672
<210> 68<211> 223<212> PRT
<213> Desconhecido<220>
Pro Thr ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu85 90 95
ser Leu vai Ala Arg Gly Val Arg Gly Leu vai lie Glu100 105 110
Arg Asp vai Arg Asp Leu Thr Glu Met Arg Phe Pro vai120 125
Thr lie Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly135 140
vai Pro Ile vai Cys Ala Gly Ala Ala vai Asn Pro Gly150 155 160
vai Ala Asp Asp Asp Gly vai Cys vai vai Pro Arg Gln165 170 175
Glu vai vai Glu Ala Ala His Ala Arg Glu Ala Lys Glu180 185 190
Arg Gln Arg Leu lie Ala Gly Glu Leu Gly Leu Asp vai200 205
Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr vai215 220<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiItransferase<400> 68
Met Ser vai vai vai Thr Lys Ile Glu Arg Ala Gly Ala Glu Ala vai1 5 10 15
vai Ala Leu Ala Glu Ser Gly Val Ser Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro lie Tyr Ala Gly Ala35 40 45
Arg lie Ala Gly Thr Ala lie Thr vai Ser Leu Gln Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala vai Glu Gln Cys Arg Gln Gly Asp Ile Leu65 70 75 80
vai vai Ala Pro Thr ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Gly Asn ser Leu Val Ala Arg Gly vai Arg Gly Leu vai lie Glu100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Ala Met Gly Phe Pro vai115 120 125
Trp ser Lys Thr vai ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser Val Asn vai Pro vai vai Cys Ala Gly Ala Thr Ala Asn Pro Gly145 150 155 160
Asp vai lie vai Ala Asp Asp Asp Gly vai Cys vai vai Pro Arg Glu165 170 175
Thr Ala Ala Ala vai vai Glu Ala Ala His Ala Arg Glu Val Lys Glu180 185 190
Ala Glu Val Arg Arg Arg Leu Ile Ser Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Gly Met Arg Asp Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val210 215 220
<210> 69
<211> 672
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 69
atgggcaccg tggttcaaaa cattgcgcgc gctgaccact ccgtcatcga ccgccttgctgcctgcggtg tcgccaccgt tcacgaggcc cagggccgca ccggattgct cgccagttacatgcggccga tctatgcggg cgcgcggctg gccgctagcg ccgtcaccat ctccgcccca 180ccgggcgaca actggatgat ccacgtcgcc atcgagcaac tcaaggcagg cgacatcatg 240gtgctggccc cgaccagccc ctgcgaggac ggttatttcg gcgacctgct cgccacttcc 300gcccaagcgc gagggtgcaa gggcctaatc atcgacgccg gcgtgcgcga cgttgcagac 360ctgaccgcga tgggatttcc cgtgtggtcc aaggccatct tcgcgcaggg tacggtcaag 420gcgagtttgg gttcagtcaa tgtgtcggtg gtctgtgcta gtgccttgat caatccgggc 480gacattgtcg tggccgacga tgatggtgtg tgtgtcgtac ggcgcgagga cgcggtctcc 540gtggcggcga aggccgaagc gcgggtggca gccgaagagg acaagcgccg gcgcctcgca 600gggggcgaac tgggacttga tatttatggg atgcgcgaca cgctcgcggc caaggggcta 660aaatatgtct ga 672
<210> 70<211> 223<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiItransferase<220>
<221> SITE
<222> (149)...(152)
<223> Sitio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 70
Met Gly Thr vai vai Gln Asn Ile Ala Arg Ala Asp His Ser vai lie1 5 10 15
Asp Arg Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Leu Ala ser Tyr Met Arg Pro lie Tyr Ala Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala vai Thr Ile ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala lie Glu Gln Leu Lys Ala Gly Asp lie Met65 70 75 80
vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr ser Ala Gln Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Thr Ala Met Gly Phe Pro vai115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Ala Ser Leu Gly130 135 140Ser vai145
Asn vai Ser vai vai150
Cys Ala Ser Ala Leu Ile Asn155
Pro Gly160
Asp Ile vai vai Ala Asp Asp Asp165
Gly vai Cys vai vai170
Arg Arg Glu
175
Asp Ala vai ser vai Ala Ala180
Lys Ala Glu Ala Arg vai185
Ala Ala Glu190
Glu Asp Lys Arg Arg Arg Leu195
Ala200
Gly Gly Glu Leu Gly Leu Asp Ile205
Tyr Gly210
Met Arg Asp Thr Leu Ala Ala215
Lys Gly Leu Lys Tyr vai220
<210> 71<211> 672<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 71
atgagcgtcg tcgtccagac catcgcgcgc gccgatcaga cggtcatcga ccgcctcggc 60
gcctgcggcg tcgccaccgt acatgaggcg cagggccgca aggggctact cgcgagctac 120
atgcggccca tctattccgg cgcgcggctg gctgcgagcg cggtgacaat ttcggcgccg 180
cccggcgaca actggatgat ccacgtcgcc atcgagcagc tcaaggccgg cgacatcatg 240
gtgctcgctc ccaccagccc ctgcgaagac ggctatttcg gcgacctgct cgcgacgtcg 300
gctgtggcgc gcggctgccg cgggctcgtc atcgaggccg gcgtgcgcga tgtggccgat 360
ctcaccgcga tgaaattccc ggtatggtcg aaagccatct ccgctcaggg caccgtcaag 420
gagacgctgg gctcggtgaa cgtgccgatc gtatgcgccg gcacgctggt cgagccgggc 480
gacgtcatcg tcgccgacga tgacggcgtc tgcgtcgtgc gccgcgaaga ggcggaggcc 540
gtggcgcaga aggccgaggc ccgcatcgcc accgaagagg acaagcgcaa acgcctggcg 600
ggcggcgagc tcggtctcga catctacaag atgcgcgagc ggctggccga aaaaggactc 660
aaatatgtct ag 672
<210> 72<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 72
Met Ser vai vai vai Gln Thr Ile Ala Arg Ala Asp Gln Thr vai lie1 5 10 15
Asp Arg Leu Gly Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr ser Gly Ala35 40 45
Arg Leu Ala Ala ser Ala vai Thr Ile ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met Ile His vai Ala lie Glu Gln Leu Lys Ala Gly Asp Ile Met65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala vai Ala Arg Gly Cys Arg Gly Leu vai Ile Glu100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Thr Ala Met Lys Phe Pro vai115 120 125
Trp ser Lys Ala lie Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro Ile vai Cys Ala Gly Thr Leu vai Glu Pro Gly145 150 155 160
Asp vai lie vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Glu Ala vai Ala Gln Lys Ala Glu Ala Arg Ile Ala Thr Glu180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 73<211> 690<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 73
atgagcgtgg tcatcaccaa tatccagcgc cccgatcccg agcacaccaa agcgctcgcc 60gccttcggcg ttgcgactat tcacgaggcg cagggccgca ccggactgat gcagtccttc 120atgcgaccga tctatgccgg cgcgcgcgcc gccggcaccg ccgtcaccgt gtcgctgccc 180cccgccgaca actggatgat ccacgtcgcg gtggagcaat gccaggcagg cgacattctc 240gtcgtcgcgc cgacctcgcc ctccgatgtc ggatatttcg gcgagctcct cgccacctcg 300ctcgccgcac ggggcgtggt cggcctcatc atcgaaggcg gctgccgcga cgtcgcggca 360ttgaccgaga tgggtttccc ggtctggtcg cgcgccgtat cggcgcaggg caccgtgaag 420gagacgctcg gctccgtgaa cataccgatc gtctgcgccg gcgcgcatat tcatcccggc 480gacttcgtcg ccgccgacga tgacggcgtg gtcgtcgtgc cccgcgccca cgtggcggaa 540atcgccgccg cctccctcgc gcgcgaggac aaggaggccg ccgttcgcga gcgcctgaaa 600
ttccggtgagc tcggcctcga tatttacggc atgcgcccgc gcctcaagga gaaaggcctc 660
gtctggcgcg aaacgccgga gaagaaatag 690
<210> 74<211> 229<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 74
Met Ser vai vai Ile Thr Asn lie Gln Arg Pro Asp Pro Glu His Thr15 10 15
Lys Ala Leu Ala Ala Phe Gly vai Ala Thr lie His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Gln ser Phe Met Arg Pro lie Tyr Ala Gly Ala35 40 45
Arg Ala Ala Gly Thr Ala vai Thr vai ser Leu Pro Pro Ala Asp Asn50 55 60
Trp Met lie His vai Ala vai Glu Gln Cys Gln Ala Gly Asp lie Leu65 70 75 80
vai vai Ala Pro Thr ser Pro ser Asp vai Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Thr ser Leu Ala Ala Arg Gly vai vai Gly Leu Ile lie Glu100 105 110
Gly Gly Cys Arg Asp vai Ala Ala Leu Thr Glu Met Gly Phe Pro vai115 120 125
Trp ser Arg Ala Val Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn lie Pro lie vai Cys Ala Gly Ala His lie His Pro Gly145 150 155 160
Asp Phe vai Ala Ala Asp Asp Asp Gly vai vai vai vai Pro Arg Ala165 170 175
His vai Ala Glu Ile Ala Ala Ala Ser Leu Ala Arg Glu Asp Lys Glu180 185 190
Ala Ala vai Arg Glu Arg Leu Lys ser Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Gly Met Arg Pro Arg Leu Lys Glu Lys Gly Leu vai Trp Arg Glu210 215 220
Thr Pro Glu Lys Lys225<210> 75
<211> 672
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 75
atgggagtcg tcgttcagaa tatcgcgcgg gccgagcagg agatcatcga ccggctggcc 60gcctgcggcg ttgccaccgt tcacgaagcg caagggcgca aagggctgct ggcaagctat 120atgcggccga tctatcaggg tgcgcggctc gccgcgagcg ccgtcacaat ctcggcgccg 180ccgggcgaca actggatggt tcatgtcgcc atcgaacaga taagggccgg cgacatcctg 240ctgcttgcgc ccacaagccc gtgcgaggac ggctattttg gcgatctcct cgcaacgtcc 300gcgcaggcaa gggggtgccg cgggctggtc atcgacgctg gtgtgcgcga catcgccgat 360ctgaaggcga tgaattttcc ggtctggtcg aaggccgtgt tcgcgcaggg aacgatcaag 420gagacactcg gatcggtcaa tgtgcccgtg gtctgtgccg gagcgctggt caatccggga 480gacgtgattg tggcggacga cgacggcgtc tgcgtcgtgc gccgggagga ggccgaaaac 540gtagtccaga aagccgaggc gcgggtcagc gcggaagtgg ccaagcgcgc caggctcgca 600gccggcgaac tcggcctcga catctacagg atgcgcgaaa ggctggcgga gaaggggctg 660aaatatgtct ga 672
<210> 76
<211> 223
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 76
Met Gly Val vai vai Gln Asn lie Ala Arg Ala Glu Gln Glu Ile lie1 5 10 15
Asp Arg Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Gln Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala vai Thr lie Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met vai His vai Ala lie Glu Gln lie Arg Ala Gly Asp lie Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr ser Ala Gln Ala Arg Gly Cys Arg Gly Leu vai lie Asp100 105 110Ala Gly vai Arg Asp Ile Ala Asp Leu Lys Ala Met Asn Phe Pro vai115 120 125
Trp Ser Lys Ala vai Phe Ala Gln Gly Thr Ile Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Glu Asn vai vai Gln Lys Ala Glu Ala Arg vai Ser Ala Glu180 185 190
vai Ala Lys Arg Ala Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Arg Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 77<211> 681<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 77
gtgaccgatc cggttgtcgc tcgacagatc gacaggccgc ccgcgaatct ggtcgccgat 60ctgcagcgct acggcgtctc caccgtccac gaggcgcaag ggcgtcgcgg cctgctcgcg 120tcgtacatgc ggccgatcta tgccggcgcg ctcattgccg gtcccgcgat cacggtcctg 180gtaccgcctg gcgacaactt gatgatccac gtcgccgtgg aagtgtgcca gcctggcgac 240gttctcgtcg tcgccacgac gtcgccgtgc accgacggct atttcggcga gctgctggcg 300acgtcgctgc gggcccgcgg cgtggcgggg ctcgtgatcg atgcgggctg ccgggatgtt 360cgcgcgctga cggaaatgcg atttcccgtc tggagccgcg cgatcagcgc gcagggaacc 420gtcaaagcca cgctgggctc ggtgaacgcg gcggtggtgt gcgccgggac gtcggtgaga 480gccggggatc tcatcgtggc cgacgatgac ggggtggtgg cggtgcggcg ggaggaagtc 540gtcgccgtga cgcaggcggc cgaacagcgc gttcgcaagg aagagggcac gcgcgcacgg 600ctcgcgcagg gcgagctcgg cctggacatt tacggcttgc gccagaagct gtcggatcta 660ggcttgaagt catcgtcgtg a 681
<210> 78<211> 226<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 78Met Thr Asp Pro vai vai Ala Arg Gln lie Asp Arg Pro Pro Ala Asn1 5 10 15
Leu vai Ala Asp Leu Gln Arg Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Ala35 40 45
Gly Ala Leu Ile Ala Gly Pro Ala Ile Thr vai Leu vai Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gln Pro Gly Asp65 70 75 80
vai Leu vai vai Ala Thr Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly vai Ala Gly Leu vai100 105 110
lie Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu Met Arg Phe115 120 125
Pro vai Trp ser Arg Ala Ile ser Ala Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn Ala Ala vai vai Cys Ala Gly Thr Ser vai Arg145 150 155 160
Ala Gly Asp Leu Ile vai Ala Asp Asp Asp Gly vai vai Ala vai Arg165 170 175
Arg Glu Glu Val Val Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg180 185 190
Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly Leu Lys Ser210 215 220
Ser ser225
<210> 79<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 79
atgagcgagc cggtcgtcgt tcggcagatc gagaggccct cttcggccgc gatcgccgat 60ctccggcggt acggcgtctc gacggttcac gaagcgcagg gccgccgcgg actgctcgcg 120tccggcctgc ggccgatcta tgcgaccgcg ctcatggcgg gccctgcgat cacggtgctg 180gtcgcaccgg gcgacaacct gatgatccac gtcgccgtcg aggtctgcca gcccggggat 240gtgctcgtgg tcacgccgac gtcaccgtgc acggacggct atttcggcga gctgctggcc 300acgtcgctgc gggcgcgagg cgttgcgggc ctcgtcatcg acgccggctg ccgcgacatt 360cgcgcgctga cggagatgcg gtttcccgta tggagtcgcg cgatcagcgc gcagggcacg 420gtcaaagcca cgctcggctc cgtgaatgtc cccgtcgtct gcgccggcgc gcttgtcgaa 480gcgggcgacg tcatcgtcgc cgacgatgac ggggtcgtgg tggtgaagcg gggcgaagtc 540gacgtcgtca tccaggcggc ggagcagcgc gtgcgcaagg aagaagtcac gcgggcccgg 600ctggcgcagg gcgagctcgg tctggacatc tacggcctgc gcaagaagat tgcggacctg 660ggcttgaagt cgtcgtga 678
<210> 80
<211> 225
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 80
Met ser Glu Pro vai vai vai Arg Gln lie Glu Arg Pro Ser Ser Ala15 10 15
Ala lie Ala Asp Leu Arg Arg Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Gly Leu Arg Pro Ile Tyr Ala35 40 45
Thr Ala Leu Met Ala Gly Pro Ala Ile Thr vai Leu Val Ala Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gln Pro Gly Asp65 70 75 80
vai Leu vai vai Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala Arg Gly vai Ala Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp lie Arg Ala Leu Thr Glu Met Arg Phe115 120 125
Pro vai Trp ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly Val vai vai vai Lys165 170 175
Arg Gly Glu Val Asp vai Val Ile Gln Ala Ala Glu Gln Arg Val Arg180 185 190
Lys Glu Glu Val Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys lie Ala Asp Leu Gly Leu Lys Ser210 215 220
Ser225
<210> 81
<211> 678
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 81
atgaacgagc cgaccgttgt tcgagcgatc gacaggccgc cggcggatgt ggtcgcggcg 60ctccagcgct acggcgtgtc gaccgtgcat gaagcacaag ggagacgcgg cctcgtagcg 120tcctgcatgc ggccgatcta caccggcgct ttggtcgccg gtcctgccgt aaccgtctcg 180ctcccgccgg gcgacaacct catgattcac gtcgctgtcg aagcctgcca ggcgggcgac 240gtgcttgtcg tggtgccgac ctccccgtgc acggacgggt atttcggtga gttactggcg 300acgtcgctgc acgcacgcgg agtcgtggct ctcgtcatcg atgccggctg ccgcgacgtg 360cgcgctctgt cggagatgcg atttcctgtc tggagccgcg cgatcagcgc tcagggcacg 420gtcaaagcca cgttgggatc ggtgaacgtt cccgtggtgt gcgcgggagc gcccgtggag 480cccggcgatg tgatcgtcgc cgacgacgat ggggtggtgg ttgtgaagcg cagcgaggtg 540gagggggtgg cgcaggcgtc ggagcagcga gtcctgaagg aggaggcgac gcgcgagcgg 600ttggcgcgcg gcgagctggg cctcgacatc tacgggctgc ggaaaaaggt gtcggacctc 660ggcctgaaat attcgtga 678
<210> 82
<211> 225
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 82
Met Asn Glu Pro Thr vai vai Arg Ala lie Asp Arg Pro Pro Ala Asp1 5 10 15
vai vai Ala Ala Leu Gln Arg Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu vai Ala Ser Cys Met Arg Pro lie Tyr Thr35 40 45
Gly Ala Leu vai Ala Gly Pro Ala vai Thr Val Ser Leu Pro Pro Gly50 55 60Asp Asn Leu Met Ile His vai Ala vai Glu Ala Cys Gln Ala Gly Asp65 70 75 80
Val Leu vai vai vai Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu His Ala Arg Gly vai vai Ala Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu ser Glu Met Arg Phe115 120 125
Pro vai Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro vai vai Cys Ala Gly Ala Pro vai Glu145 150 155 160
Pro Gly Asp Val Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg ser Glu vai Glu Gly vai Ala Gln Ala Ser Glu Gln Arg vai Leu180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys vai Ser Asp Leu Gly Leu Lys Tyr210 215 220
Ser225
<210> 83 <211> 678 <212> DNA <213> Desconhecido <220> <223> obtido a partir de amostras ambientais <400> 83 atgagcgagc cggtcgtcgt tcggcagatc gagaggccct cttcggccgc gatcgccgat 60ctccggcggt acggcgtctc gacggttcac gaagcgcagg gccgccgcgg actgctcgcg 120tccggcctgc ggccgatcta tgcgagcgcg ctcatggtgg gccctgcgat cacggtgctg 180gtcgcaccgg gcgacaacct gatgatccac gtcgccgtcg aggtctgcca gcccggggat 240gtgctcgtgg tcacgccgac gtcaccgtgc acggacggct atttcggcga gctgctggcc 300acgtcgctgc gggcgcgagg cgttgcgggc ctcgtcatcg acgccggctg ccgcgacatt 360cgcgcgctga cggagatgcg gtttcccgta tggagtcgcg cgatcagcgc gcagggcacg 420gtcaaagcca cgctcggctc cgtgaatgtc cccgtcgtct gcgccggcgc gctcgtcgaa 480gcgggcgacg tcatcgtcgc cgacgatgac ggggtcgtgg tggtgaagcg gggcgaagtc 540gacgtcgtca tccaggcggc ggagcagcgc gtgcgcaagg aagaagtcac gcgggcgcgg 600ctggcgcagg gcgagctcgg tctggacatc tacggcctgc gcaagaagat tgcggacctg 660ggcttgaagt cgttgtga 678
<210> 84<211> 225<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 84
Met Ser Glu Pro vai vai vai Arg Gln Ile Glu Arg Pro Ser Ser Ala1 5 10 15
Ala Ile Ala Asp Leu Arg Arg Tyr Gly Val ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Gly Leu Arg Pro lie Tyr Ala35 40 45
Ser Ala Leu Met vai Gly Pro Ala Ile Thr vai Leu vai Ala Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Gln Pro Gly Asp65 70 75 80
vai Leu vai vai Thr Pro Thr ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala Arg Gly vai Ala Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp Ile Arg Ala Leu Thr Glu Met Arg Phe115 120 125
Pro vai Trp Ser Arg Ala Ile ser Ala Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai Val vai Lys165 170 175
Arg Gly Glu Val Asp vai vai Ile Gln Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Glu vai Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Gly Leu Arg Lys Lys Ile Ala Asp Leu Gly Leu Lys ser210 215 220
Leu225<210> 85<211> 699<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 85
atgaccggca ttgtcgtcga gaccatcgag cgcgcgtcgc tcgccgacat cgccgcgttg 60gccgaattcg gcgtcgccac catccacgag gcgcagggcc gcatcggcct gcttgcctcc 120accatgcgcc cgatctacgc aggcgcggcg gccgccggca atgccgtcac cgtgtcggtg 180ccgcccggcg acaactggat gatccacgtc gccgtcgagc agtgccgcga aggcgatatt 240ctcgtcgtcg cccccaccag cccgaacgac aacggctact ttggcgaact gctggcctgc 300tcgctcaagt cgcgcggcgt gcgcggcctc atcatcgagg ccggctgccg cgacgtgaaa 360ccgctcaccg agatgaagtt ccccgtctgg tcccgcgccg tctcctccca gggcacggtg 420aaggaaagcc tcggcgacgt gaacctgccg ctctcgatcg ccggccagct cgtcaacccc 480ggcgatgtca tcgtcgccga tgacgacggc gtggtcgtgg tctcccgcaa tgaagtcagg 540agcgtcaccg ccaagtcccg cgagcgcgaa gacaaggagg ccaagaaccg cgtgcagctc 600caagccggcc agctcggcat cgacatctac ggcatgcgcg acaagctcaa ggccaagggc 660ctccgctacg tcaaatccgc ggcggagttg aagaagtag 699
<210> 86<211> 232<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<400> 86
Met Thr Gly Ile vai vai Glu Thr lie Glu Arg Ala ser Leu Ala Asp1 5 10 15
Ile Ala Ala Leu Ala Glu Phe Gly vai Ala Thr lie His Glu Ala Gln20 25 30
Gly Arg Ile Gly Leu Leu Ala Ser Thr Met Arg Pro lie Tyr Ala Gly35 40 45
Ala Ala Ala Ala Gly Asn Ala vai Thr Val Ser vai Pro Pro Gly Asp50 55 60
Asn Trp Met lie His Val Ala vai Glu Gln Cys Arg Glu Gly Asp lie65 70 75 80
Leu vai vai Ala Pro Thr ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu85 90 95
Leu Leu Ala Cys ser Leu Lys ser Arg Gly vai Arg Gly Leu lie Ile100 105 110Glu Ala Gly Cys Arg Asp Val Lys Pro Leu Thr Glu Met Lys Phe Pro115 120 125
Val Trp ser Arg Ala vai ser ser Gln Gly Thr vai Lys Glu Ser Leu130 135 140
Gly Asp vai Asn Leu Pro Leu Ser Ile Ala Gly Gln Leu vai Asn Pro145 150 155 160
Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai vai vai Ser Arg165 170 175
Asn Glu vai Arg Ser vai Thr Ala Lys ser Arg Glu Arg Glu Asp Lys180 185 190
Glu Ala Lys Asn Arg vai Gln Leu Gln Ala Gly Gln Leu Gly lie Asp195 200 205
Ile Tyr Gly Met Arg Asp Lys Leu Lys Ala Lys Gly Leu Arg Tyr Val210 215 220
Lys Ser Ala Ala Glu Leu Lys Lys225 230
<210> 87
<211> 672
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 87
atgggcattg tcgttcagaa cattcagcgg gcggagcagt ccgtcatcga tcgtctcgct 60gcttgcggag ttgcgaccgt acatgaagcg cagggccgca aggggctgct cgccagctac 120atgcggccga tttatccggg cgcgcggatc gcggcgagtg ccgtgacaat ttccgcgcct 180ccgggcgata actggatgct gcatgtggcg atcgagcaga tcaaggcggg cgatatccta 240ctgcttgcgc cgaccagtcc ctgcgaggac ggttatttcg gcgatctctt ggcgacgtct 300gccatggcac gcggctgccg cgggttggtg atcgatgccg gcgtgcgcga tgtcgccgat 360ctcaaggcga tgaattttcc cgtttggtcg aagacgatct ctgcacaggg gacggtcaag 420gagacggtgg gctcggtcaa tattcccgtc gtctgcgcca gtgcgctcgt caatcctggc 480gatgtgatcg ttgccgatga tgatggcgtc tgcgtcgtac ggcgggagga agctgccgag 540gtcgcggata aggccgagca gcgggtcgcg gcagaagagg acaagcgccg gcgactggcc 600gcgggtgaac tcgggctcga tatctacaag atgcgcgagc ggctggcgga gaaggggctg 660aaatatgtct ag 672<210> 88 <211> 223 <212> PRT <213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaquinona metiltransferase<400> 88
Met Gly Ile vai vai Gln Asn lie Gln Arg Ala Glu Gln Ser vai lie1 5 10 15
Asp Arg Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Arg Ile Ala Ala Ser Ala vai Thr Ile ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met Leu His vai Ala Ile Glu Gln lie Lys Ala Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr ser Ala Met Ala Arg Gly Cys Arg Gly Leu vai Ile Asp100 105 110
Ala Gly vai Arg Asp Val Ala Asp Leu Lys Ala Met Asn Phe Pro vai
115 120 125
Trp ser Lys Thr lie Ser Ala Gln Gly Thr vai Lys Glu Thr vai Gly130 135 140
ser vai Asn Ile Pro Val Val Cys Ala Ser Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly Val Cys vai vai Arg Arg Glu165 170 175
Glu Ala Ala Glu Val Ala Asp Lys Ala Glu Gln Arg vai Ala Ala Glu180 185 190
Glu Asp Lys Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 89<211> 696<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 89
atgaagcgcg gcgtggtggt gacccatatc gcgcgggcgg atgcggcgaa cgtggccgtg 60ctgcgggagg caggcgttgc gaccgtccac gaggcgcaga gccggcttgg tcttctagcg 120tgctacatgc ggccgatcta tccgggcgcg gccattgccg gaccggccgt cacggtgctc 180gtgccgccgt cggacaactg gatgctgcat gtggcggtcg aacagtgccg cgcaggcgac 240gtgctggtgg tggcgcccac gtctgcctgc gaggacgggt atttcgggga actgcttgcc 300acgtcgctcg cgaagcgcgg cgtacagggc ctgatcatcg atgcgggctg ccgggatgtg 360tgcgcgctca aggcaatgga ttttcccgtg tggtcgaagg ccgtctccgc gcagggcacg 420gtcaaggaga cgctcggctc ggtcaatgtg ccggtcgtat gcgcgcagca gatcgtgcat 480ccgggagacg tgatcgtggc cgatgacgac ggcatcgtcg tggcgccgct cgccaccgtc 540gaggcggtag cgaaggccgc gcaggcgcgc ctggagaagg aagagaagac gcgtgcggtg 600ctcgcaagcg gcacgctcgg cctcgactac tacgcgatgc gtgacaggct cgcggaaaga 660ggcttgcgct acgtcgattc ggcctctgaa ctttga 696
<210> 90<211> 231<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 90
Met Lys Arg Gly vai vai vai Thr His Ile Ala Arg Ala Asp Ala Ala1 5 10 15
Asn Val Ala Val Leu Arg Glu Ala Gly vai Ala Thr vai His Glu Ala20 25 30
Gln Ser Arg Leu Gly Leu Leu Ala Cys Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala vai Thr Val Leu vai Pro Pro ser50 55 60
Asp Asn Trp Met Leu His vai Ala vai Glu Gln Cys Arg Ala Gly Asp65 70 75 80
vai Leu Val vai Ala Pro Thr Ser Ala Cys Glu Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Lys Arg Gly vai Gln Gly Leu Ile100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Cys Ala Leu Lys Ala Met Asp Phe115 120 125
Pro vai Trp ser Lys Ala vai Ser Ala Gln Gly Thr vai Lys Glu Thr130 135 140
Leu Gly Ser vai Asn Val Pro vai vai Cys Ala Gln Gln lie vai His145 150 155 160
Pro Gly Asp vai Ile vai Ala Asp Asp Asp Gly lie vai vai Ala Pro165 170 175
Leu Ala Thr vai Glu Ala vai Ala Lys Ala Ala Gln Ala Arg Leu Glu180 185 190Lys Glu Glu Lys Thr Arg Ala vai Leu Ala Ser Gly Thr Leu Gly Leu195 200 205
Asp Tyr Tyr Ala Met Arg Asp Arg Leu Ala Glu Arg Gly Leu Arg Tyr210 215 220
vai Asp ser Ala ser Glu Leu225 230
<210> 91
<211> 678
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 91
atgaacaaac cggtggtggt ccggaaggtc gaacagccgc cacaagatgc ggtggcggct 60ctggagaaat atggcgtgtc cacggtgcac gaagcgcaag gccgttgcgg gctgctcgcc 120ccttacatgc gcccgatcta tgccggcgct tccatggccg ggcccgccgt caccgtctcc 180cttccgcccg gtgacaacct catgatccat gtcgcggtcg aagtgtgcca gcccggaaac 240attctggtcg tcgcccccac ttcaccttgt accgacgggt atttcggcga gttgctggct 300acttccttgc gcgcccacgg cgtgaaggca ctcataatcg atgccggatg ccgtgacgtg 360cgctccctca ccgaaatgaa gtttcccgtg tggagccgcg ccgtcagttc gcagggaaca 420gtgaagtcca cgctcggatc agtgaacgtg ggcgtagtgt gtgcgggcgc tttcatcgaa 480gcgggcgaca tcgtcgtcgc tgatgatgac ggagttgtcg tcgtgaagcg gactttcgcg 540cgcgacgtgg ttgaagcctg tgaacagagg gttcgcaagg aagaggcgac gcgggcacgg 600ctggcgcggg gcgaacttgg gctggacatc tacggattgc gctccaaggt ggcggaactc 660ggtctcaagt acatataa 678
<210> 92
<211> 225
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 92
Met Asn Lys Pro vai vai vai Arg Lys vai Glu Gln Pro Pro Gln Asp15 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro lie Tyr Ala35 40 45
Gly Ala ser Met Ala Gly Pro Ala vai Thr vai ser Leu Pro Pro Gly50 55 60Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Gln Pro Gly Asn65 70 75 80
Ile Leu vai Val Ala Pro Thr ser pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Ala Leu lie100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai ser Ser Gln Gly Thr vai Lys Ser Thr130 135 140
Leu Gly ser vai Asn vai Gly vai vai Cys Ala Gly Ala Phe Ile Glu145 150 155 160
Ala Gly Asp Ile Val vai Ala Asp Asp Asp Gly Val vai vai vai Lys165 170 175
Arg Thr Phe Ala Arg Asp vai vai Glu Ala Cys Glu Gln Arq vai Arq180 185 190
Lys Glu Glu Ala Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg ser Lys vai Ala Glu Leu Gly Leu Lys Tyr210 215 220
Ile225
<210> 93 <211> 678 <212> DNA <213> Desconhecido <220> <223> obtido a partir de amostras ambientais <400> 93 atgaataaac cggtggtagt ccggcaagtg gagcagccac cagcggacgc ggttgcggcg 60ctggagaagt atggcgtcac caccgtgcat gaggctcagg gacgttgtgg cctgctcgcg 120cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgctgt caccgtagcc 180ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240atcctggtgg ttgcgccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300acctctctgc gtgctcgcgg tgtgaaagga cttgtgattg atgccggatg ccgtgacgtt 360cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaaca 420gtcaaggcca ccctcggatc ggtgaatgtg ccggtcatgt gcgcgggcgc gctcgtcgaa 480gctggggatg tcatcgtcgc cgatgatgat ggaattgtgg ttgtcaagcg cgcgcatgcg 540cacgaggtgg ccgcggcggc agaacaaagg gtgcgcaaag agaatataac ccgcgaacgg 600cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaaaat cgcgcaactg 660ggcctcaaat acctgtga 678
<210> 94<211> 225<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 94
Met Asn Lys Pro Val vai vai Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro lie Phe Pro35 40 45
Gly Ala Ala Ile Ser Gly Ser Ala vai Thr vai Ala Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
lie Leu vai Val Ala Pro Thr ser Pro Ser Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn Val Pro vai Met Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly Ile vai vai vai Lys165 170 175
Arg Ala His Ala His Glu Val Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn lie Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225<210> 95
<211> 639
<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais
<400> 95
gtgagcgatc cgatcgccga cctgcgcggg tatggagtct cgacggttca cgaggcccag 60ggccggcgcg gtctgctggc gccttacatg cgtccgatct atgccggcgc ccttgtcgcc 120ggaccagccg tgacggttct ggtcccgccc ggcgacaacc tgatgatcca cgtcgccgtc 180gagcggtgct cgccgggcga catcctcgtc gtcgcgccga cgtcgccgtg cacggacggc 240tatttcggcg agctgctggc gacgtcgctg cgggcacgcg gtgtcgccgc actgatcatc 300gacgccggct gcagggacgt gcgagcgctc accgagatgc gcttcccggt gtggagccgc 360gccatcagcg cccaaggaac ggtgaaggcg acgctcggct cggtgaatgt gccagtggtc 420tgcgccggag ccatcgtcgg tcctggcgac gtcatggttg cggacgatga cggcgtggtc 480gtggtgagga aggacgaagt cgccgcggtg acgcaggcgg cggcgcagcg ggtccgcaaa 540gaagagggca cgcgggcgcg gctggccgcg ggcgagctcg gcctggacat ctacggcctc 600cggcagaagc tgtcggatct cggcctgaag tcgtcgtga 639
<210> 96
<211> 212
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais
<220>
<221> DOMÍNIO
<222> (9)...(161)
<223> Demetilmenaquinona metiltransferase
<400> 96 ·
Met Ser Asp Pro lie Ala Asp Leu Arg Gly Tyr Gly vai Ser Thr vai15 10 15
His Glu Ala Gln Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro20 25 30
Ile Tyr Ala Gly Ala Leu vai Ala Gly Pro Ala vai Thr vai Leu vai35 40 45
Pro Pro Gly Asp Asn Leu Met lie His vai Ala vai Glu Arg Cys ser50 55 60
Pro Gly Asp lie Leu Val vai Ala Pro Thr Ser Pro Cys Thr Asp Gly65 70 75 80
Tyr Phe Gly Glu Leu Leu Ala Thr ser Leu Arg Ala Arg Gly vai Ala85 90 95
Ala Leu Ile lie Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu100 105 110
Met Arg Phe Pro vai Trp Ser Arg Ala lie Ser Ala Gln Gly Thr vai115 120 125Lys Ala Thr Leu Gly Ser vai Asn vai Pro vai vai Cys Ala Gly Ala130 135 140
Ile vai Gly Pro Gly Asp vai Met vai Ala Asp Asp Asp Gly vai vai145 150 155 160
vai vai Arg Lys Asp Glu vai Ala Ala vai Thr Gln Ala Ala Ala Gln165 170 175
Arg vai Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu180 185 190
Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly195 200 205
Leu Lys Ser Ser210
<210> 97
<211> 678
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 97
atgagcggcc ccacggtcgt tcgcgagatc gaccggccgg aaggcgacct cgtgaccgca 60cttgagcacg cgggcgtgtc gacggtccac gaagcacagg gacggcgggg actgctcgcc 120acctacatgc ggccgattta cgccggagcc gtgatcgccg gaccggcggt caccgtcctc 180gtgccgcccg gcgacaacct gatgattcac gtggcggtcg aagtgtgccg cccgggtgac 240gtgctggtcg tcgccgtcac gtcgccgtgt accgacggct acttcggtga gctgctggcg 300acgtcggttc gcgcgcgcgg cgtcaaaggg ctcgtcatcg atgcagggtg ccgggacgtg 360cgggcgctca ccgagatgcg gtttccggtg tggagccggg cggtcagtgc gcagggcacc 420gtcaaggcca cgctcggctc cgtgaacgtt ccagtcgtgt gtgccggcgc gctcatcaca 480ggtggagacg tcgtcatcgc cgacgacgat ggggtggtcg tggtgaagcg cgaggaagtg 540gacgcggtcg ttcaggactc gcgccagcgg ctgctcaagg aagacgggac gcgagagcgt 600ctcgcgacag gcgagctggg gctggacatc tactcgctgc gcaagatgct gtccgatctg 660ggactgaagt accgatag 678
<210> 98
<211> 225
<212> PRT
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 98
Met ser Gly Pro Thr vai vai Arg Glu lie Asp Arg pro Glu Gly Asp1 5 10 15Leu vai Thr Ala Leu Glu His Ala Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Thr Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala vai lie Ala Gly Pro Ala Val Thr vai Leu vai Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala Val Glu vai Cys Arg Pro Gly Asp65 70 75 80
vai Leu vai vai Ala Val Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser vai Arg Ala Arg Gly vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu Met Arg Phe115 120 125
Pro vai Trp Ser Arg Ala vai Ser Ala Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu Ile Thr145 150 155 160
Gly Gly Asp vai vai lie Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Glu Glu vai Asp Ala vai vai Gln Asp Ser Arg Gln Arg Leu Leu180 185 190
Lys Glu Asp Gly Thr Arg Glu Arg Leu Ala Thr Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr ser Leu Arg Lys Met Leu Ser Asp Leu Gly Leu Lys Tyr210 215 220
Arg225
<210> 99<211> 639<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 99
gtgagcgatc cgatcgccga cctgcgaggg tatggtgtct ccacggttca cgaggcgcag 60ggccggcgcg gcctgctggc gccttacatg cgtccgatct atgccggcgc gctcgtcgcc 120ggaccagccg tgacggtcct ggtcccgccc ggcgacaacc tgatgatcca cgtcgctgtc 180gagcggtgct cgccaggcga catcctcgtc gtcgcgccga cgtcgccgtg cacggacggc 240tatttcggcg agctgctggc gacgtcgctg cgggcacgcg gtgtcgccgc actgatcatc 300gacgctggct gcagggacgt gcgagcgctc accgagatgc gcttcccggt gtggagccgc 360gccatcagcg cccaaggaac ggtgaaagcg acgctcggct cggtgaatgt gccactggtc 420tgcgccggag ccatcgtcgg tcctggcgac gtcatggttg cggacgatga cggcgtggtc 480gtggtgagga aggacgaagt cgccgcggtg acgcaggcgg cggcgcagcg ggtccgcaaa 540gaagaaggca cgcgggcgcg gctggccgcg ggcgagctcg gcctggacat ctacggcctc 600cggcagaagc tgtcggatct cggcctgaag tcgtcgtga 639
<210> 100<211> 212<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (9)...(161)
<223> Demetilmenaquinona metiltransferase<400> 100
Met ser Asp Pro lie Ala Asp Leu Arg Gly Tyr Gly vai Ser Thr vai1 5 10 15
His Glu Ala Gln Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro20 25 30
Ile Tyr Ala Gly Ala Leu vai Ala Gly Pro Ala Val Thr vai Leu Val35 40 45
Pro Pro Gly Asp Asn Leu Met lie His Val Ala vai Glu Arg Cys ser50 55 60
Pro Gly Asp lie Leu vai vai Ala Pro Thr ser Pro Cys Thr Asp Gly65 70 75 80
Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly vai Ala85 90 95
Ala Leu lie lie Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu100 105 110
Met Arg Phe Pro vai Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr vai115 120 125
Lys Ala Thr Leu Gly Ser vai Asn vai Pro Leu vai Cys Ala Gly Ala130 135 140
lie vai Gly Pro Gly Asp vai Met vai Ala Asp Asp Asp Gly vai vai145 150 155 160
vai vai Arg Lys Asp Glu Val Ala Ala vai Thr Gln Ala Ala Ala Gln165 170 175
Arg vai Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu180 185 190
Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly195 200 205Leu Lys Ser Ser210
<210> 101<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 101
atgaacacac cggtggtagc aagacaagtg gagcagccac cagcggatgc aattgccgca 60ttggagaagt gtggagtgac aaccgtccat gaggctcagg gacgttgtgg cctccttgcg 120tcctacattc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360cgctctctga cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcgagggaca 420gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc aatggtcgag 480gctggtgatg gcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540caggagatcg ctgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctcaaat atctctga 678
<210> 102<211> 225<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (28)...(174)
<223> Demetilmenaquinona metiltransferase<400> 102
Met Asn Thr Pro vai vai Ala Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Ile Ala Ala Leu Glu Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr lie Arg Pro lie Tyr Pro35 40 45
Gly Ala Ala lie Ala Gly Ser Ala lie Thr vai ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Ile Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala Ile Cys Ser Arg Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro Ile vai Cys Ala Gly Ala Met vai Glu145 150 155 160
Ala Gly Asp Gly lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Leu Ala Gln Glu lie Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 103<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 103
atgaatcgac cggtggtagt ccggcaagtg gagcaggcac cagcggatgc ggtcgccgca 60ctggagaagt gcggagtgac caccgtgcat gaggctcagg gacggggtgg cctgcttgcc 120tcctacatgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgtct 180ttgccccctg gcgataacct catgatccac gtcgcagtgg aggtctgcgg tccgggaaac 240attctggtgg tttcaccgat ctcgccttgt acggatggtt acttcggcga gctgttggca 300acatccctcc gtgcccgcgg tgggagaggg cttgtgatcg atgccggatg ccgggacgtg 360cgctctttaa cagaaatgaa atttccagtc tggagccgcg ccgtcagttc gcaggggaca 420gtcaaggcca cactgggatc ggtgaatgtg cccgtcgtgt gtgcgggcgc actggtcgag 480gcgggtgatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540caggaggtcg ccgccgcagc ggaacaaagg gttcgcaaag agaacctgac ccgcgaacga 600cttgcgcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaaatg 660ggccttaaat atctctaa 678
<210> 104<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase
<400> 104
Met Asn Arg Pro vai Val Val Arg Gln Val Glu Gln Ala Pro Ala Asp15 10 15
Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala20 25 30
Gln Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu vai Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai vai ser Pro lie ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala Arg Gly Gly Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala Val ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai Val Val Lys165 170 175
Arg Ala Leu Ala Gln Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Asp Met Arg Gln Lys Ile Ala Gln Met Gly Leu Lys Tyr210 215 220
Leu
225
<210> 105
<211> 678
<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais
<400> 105atgaatacac cggtggtagt ccggcaagtg gagcagccac ctgcggaggc ggttgccgca 60ctggaaaagc gtggggtgac aaccgtgcat gaggctcagg gacgttgtgg cctccttgcc 120tcctacatgc gcccgattta cacgggagca gcgatcgcag gatccgctat cacagtgtcc 180ttgccgcccg gcgacaacct catgatccac gttgccgtgg aggtatgtgg ttcaggaaac 240atcctggtag tttcaccaac ctcgccttgt gcggatggct acttcggtga gctgttggca 300acatctctcc gtgcccatgg tgtcagaggg ctggtgatcg atgcgggatg ccgtgatgtg 360cgctccctaa cagagatgaa atttccggtc tggagccgcg ccgtcagctc acaggggaca 420gtcaaggcca cacttggatc ggtgaacgtg cccatcgttt gcgcgggtgc actggtcgac 480gctggtgatg tcatcgtcgc agatgacgat ggcgttgtgg tggtgaagcg cgcgatggcg 540caagaggtcg ccgcggcggc ggaacaaagg gttcgcaaag agaatctgac ccgcgaacga 600cttgcgcgtg gtgaacttgg tctcgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggacttaagt atctgtaa 678
<210> 106 <211> 225 <212> PRT <213> Desconhecido <220> <223> Obtido a partir de amostras ambientais <220> <221> DOMÍNIO <222> (22)...(174) <223> Demetilmenaquinona meti Itransferase <400> 106 Met Asn Thr Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Ala Glu 10 15
Ala vai Ala Ala Leu Glu Lys Arg Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Thr35 40 45
Gly Ala Ala Ile Ala Gly ser Ala lie Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gly ser Gly Asn65 70 75 80
Ile Leu vai vai ser Pro Thr Ser Pro Cys Ala Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala vai ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro lie vai Cys Ala Gly Ala Leu vai Asp145 150 155 160Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Met Ala Gln Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 107<211> 636<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 107
gtgagcgatc cgatcgccgc cctgcgcgga tatggcgttt cgacggtgca cgaggcgcag 60gggcggcgcg gcctgctggc gccttacatg cgcccgatct atgccggtgc gctcctcgcc 120gggcccgcgg tgacggtcct ggttcctcct ggcgacaacc tgatgatcca cgtggcggtc 180gagaaatgct cgcctggaga cgtcctcgtc gtcgccccgg cgtctccgtg cacggacggc 240tacttcggag aattgcttgc gacgtcgttg cgggcccgcg gcgttgccgg cttgatcatc 300gatgccggct gccgggatgt gcgcgcgctc acggagatgc ggtttccggt gtggagccgc 360ttcgtctgcg ctcagggcac ggtgaaggcc acgctcggct cgctgaatgt gccgctggtc 420tgcgccggcg ccctcatcgc tcccgctgat gtcatcgttg cagacgatga cggggtggtg 480gtggtgaaga gggacgagat cgccatggtg acgcaggcgg cggagcagcg ggttcgcaaa 540gaggaaggca cgcgcgcgcg gctcgccgcg ggcgagctcg gcctggacat ctacggcttg 600cggcagaagc tgtcggacct cggcctcaag tcgtga 636
<210> 108<211> 211<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (9)...(161)
<223> Demetilmenaquinona metiltransferase<400> 108
Met Ser Asp Pro lie Ala Ala Leu Arg Gly Tyr Gly vai ser Thr vai1 5 10 15
His Glu Ala Gln Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro20 25 30
Ile Tyr Ala Gly Ala Leu Leu Ala Gly Pro Ala Val Thr Val Leu Val35 40 45
Pro Pro Gly Asp Asn Leu Met lie His vai Ala vai Glu Lys Cys Ser50 55 60
Pro Gly Asp vai Leu vai vai Ala Pro Ala Ser Pro Cys Thr Asp Gly65 70 75 80
Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala85 90 95
Gly Leu lie Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu100 105 110
Met Arg Phe Pro vai Trp Ser Arg Phe vai Cys Ala Gln Gly Thr vai115 120 125
Lys Ala Thr Leu Gly ser Leu Asn vai Pro Leu vai Cys Ala Gly Ala130 135 140
Leu Ile Ala Pro Ala Asp vai lie Val Ala Asp Asp Asp Gly vai vai145 150 155 160
vai vai Lys Arg Asp Glu Ile Ala Met vai Thr Gln Ala Ala Glu Gln165 170 175
Arg vai Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu180 185 190
Leu Gly Leu Asp lie Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly195 200 205
Leu Lys Ser210
<210> 109<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientai:<400> 109
atgaatacac cggtggtagt aagacaagtg gagcagccac cagcggatgc aattgccgca 60ttaaagaagt gtggagtgac aaccgtccat gaggctcagg gacgtggtgg cctccttgcg 120tcctacatgc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360cgctccctga cagaaatgaa gttcccggtc tggagccgcg ccatctgttc gcaagggaca 420gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc attggtcgag 480gctggtgatg tcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540caagagatcg ccgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctgaaat atctctga 678
<210> 110<211> 225<212> PRT<213> Desconhecido<220><223> Obtido a partir de amostras ambientais<220><221> DOMÍNIO<222> (22)...(174)<223> Demetilmenaquinona metiltransferase<400> 110
Met Asn Thr Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Ala Asp15 10 15
Ala Ile Ala Ala Leu Lys Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala lie Thr vai ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
lie Leu vai vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai lie Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala lie Cys Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro lie Val Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Leu Ala Gln Glu lie Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225<210> 111<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 111
atgaaagagg cggtggtggt caggaatatt gagcgcccgc cggccgatgt gatcgcggcg 60ctggaaaagt ttggtgtttc aacggtacac gaagcgcaag gccgccgcgg acttctggcc 120gcttatatga ggccgattta tgggggcgcg gccattgccg ggcctgcggt gactgtctcg 180ttggctccgg gtgacaatct aatgattcac gtggccgtgg aagtttgccg gtcaggtgac 240attctcgtgg tcgctccgac gtcgccgtgc acggatgggt attttggcga gttgctggcg 300acttccttgc gcgcgcacgg ggtaaaagga ctcgtgatcg aggcaggatg ccgcgatgtc 360cgggcgctta cggagatgaa atttcccgtg tggagccgcg cggtgagttc gcagggaacg 420gtgaaggcta gtttgggctc ggtgaacgtg ggaattgtgt gcgctgccgc ggcgatcgaa 480gccggcgacg cgatcgttgc cgatgatgac ggcgttgtgg tggtgaaacg cggcgacgcc 540gccagtgttg tcgccgcgtc gcagcaacgc gtccgcaagg aagaggctgc gcgaggacgc 600ctggcgcgcg gcgaactggg cctggacatt tacggcctgc gcgccaaggt cgcggagctt 660ggcttgaaat atttgtga 678
<210> 112<211> 225<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 112
Met Lys Glu Ala vai vai vai Arg Asn Ile Glu Arg Pro Pro Ala Asp1 5 10 15
vai lie Ala Ala Leu Glu Lys Phe Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro lie Tyr Gly35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala vai Thr vai ser Leu Ala Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Arg Ser Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly Val Lys Gly Leu vai100 105 110Ile Glu Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai ser Ser Gln Gly Thr vai Lys Ala ser130 135 140
Leu Gly Ser vai Asn vai Gly lie vai Cys Ala Ala Ala Ala lie Glu145 150 155 160
Ala Gly Asp Ala lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Gly Asp Ala Ala Ser vai vai Ala Ala Ser Gln Gln Arg vai Arg180 185 190
Lys Glu Glu Ala Ala Arg Gly Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Gly Leu Arg Ala Lys vai Ala Glu Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 113<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 113
atgaaagggg cggtggtggt caggaatatc gagcgcccgc cggccgaggt ggtcgcggcg 60ctggaaaagt ttggtgtttc gacggtgcac gaagcgcaag gacgccgcgg acttctggcc 120gcttatatga ggccgattta tgggggcgcg gccattgccg ggcctgcggt gactgtctcg 180ttggctccgg gcgacaattt aatgattcac gtggcggtgg aagtttgccg gtcaggcgac 240attctcgtgg tcgctccgac gtcgccgtgc acggatgggt attttggcga gttgctggcg 300acttccttgc gcgcgcacgg ggtaaaagga ctggtgatcg aggcaggatg ccgcgatgtc 360cgggcgctta cggagatgaa atttcccgtg tggagccgcg cggtgagttc gcagggaacg 420gtgaaggcta ctttgggctc ggtgaacgtg gaaattgtgt gcgctgccgc ggcgatcgaa 480gccggtgacg tgatcgttgc cgatgatgac ggcgttgtgg tggtgaaacg gggcgacgcc 540gccgctgtgg tcgccgcgtc gcagcaacgc gtccgcaaag aagaagctac gcgagaacgc 600ctggcgcgcg gcgaactggg cctggacatt tacggcctgc gcgccaaggt cgcggagctt 660ggcttgaaat atttgtga 678
<210> 114<211> 225<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 114
Met Lys Gly Ala vai vai Val Arg Asn Ile Glu Arg Pro Pro Ala Glu1 5 10 15
vai vai Ala Ala Leu Glu Lys Phe Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Gly35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr vai Ser Leu Ala Pro Gly50 55 60
Asp Asn Leu Met lie His Val Ala Val Glu vai Cys Arg Ser Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala vai Ser ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Glu lie Val Cys Ala Ala Ala Ala lie Glu145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai Val vai Val Lys165 170 175
Arg Gly Asp Ala Ala Ala vai vai Ala Ala Ser Gln Gln Arg vai Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Val Ala Glu Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 115<211> 672<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 115
atgtcggttg tcgttcagaa catcgagcgt gctgatcagt cggtcatcga ccggctggccgcctgcggcg ttgccacggt gcatgaagcg cagggccgca agggcctgct cgccagctatatgcggccga tctttccggg tgcacgcctc gcggcgagtg ccgtcactat ctccgcacct 180ccgggcgaca actggatgct gcatgtggcg atcgaacagt tgaaggccgg cgacattctg 240ctgctcgccc cgaccagccc ctgcgaggac ggctatttcg gtgatctcct cgccacgtct 300gcgcaggcgc gcggttgcga gggattgatc atcgatgcgg gtgttcggga tgtggctgat 360ctgacggaga tgaaatttcc tgtctggtcg aaggcgatct tcgcccaggg cacagtcaag 420gagaccctcg gttctgtgaa cgtaccggtc gtatgcgctg gcgcctatgt tcgcccgggt 480gatgtgatcg ttgccgatga tgatggcgtt tgtgttgtgc tgcgcgagga agctgaagtg 540gtcgcaaaga aggcggaagc ccgtgttgcg gccgaagatg gtaaacgcaa gcggctcgcg 600gccggcgaac tcggcctcga tatctacgac atgcgcggcc ggctggctga aaagggcctg 660aagtatatct ga 672
<210> 116<211> 223<212> PRT<213> Desconhecido<220><223> obtido a partir de amostras ambientais<220><221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaquinona metiItransferase<400> 116
Met ser vai Val vai Gln Asn Ile Glu Arg Ala Asp Gln ser vai Il1 5 10 15
Asp Arg Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala ser Tyr Met Arg Pro lie Phe Pro Gly Ala35 40 45
Arg Leu Ala Ala ser Ala vai Thr lie ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met Leu His vai Ala lie Glu Gln Leu Lys Ala Gly Asp lie Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr ser Ala Gln Ala Arg Gly Cys Glu Gly Leu lie lie Asp100 105 110
Ala Gly vai Arg Asp Val Ala Asp Leu Thr Glu Met Lys Phe Pro vai115 120 125
Trp Ser Lys Ala lie Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro Val vai Cys Ala Gly Ala Tyr vai Arg Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Leu Arg Glu165 170 175
Glu Ala Glu vai vai Ala Lys Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Asp Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Glu Lys Gly Leu Lys Tyr lie210 215 220
<210> 117<211> 672<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 117
atgggtgtcg tcgtccagaa cattgaccgc gccgagcaag ccgtcatcga ccggctcgcc 60gcctgcggcg tcgcgaccgt gcatgaggcg caggggcgca aggggctgct ggcgagctat 120atgcggccga tctatcccgg cgcgcggatc gcggcgagtg cggtgacgat ctcggcgccg 180cctggtgaca actggatggt gcatgtggcg atcgagcagg tgaaggatgg cgacatcctg 240ctgctggcac cgaccagccc ctgcgaggac ggctatttcg gcgatctttt ggcgacctcg 300gccttggcgc ggggctgccg cgggctggtc atcgatgccg gcgtgcgcga cgtcgctgac 360cttgcggcga tgaagtttcc ggtctggtcg aaagcgatct tcgcccaggg cacggtcaag 420gaaacgctgg gttcggtgaa tgtgccggtc gtctgcgccg gcgcgctggt caaccccggc 480gacgtgatcg tcgccgacga tgacggcgtt tgtgtcgttc gccgcgaaga ggcggcggag 540gttgcagaca aggctgaggc ccacgtcgcg gcagaggagg gcaagcgcaa gcggctggcg 600gccggcgagc ttggtctcga catctacgac atgcgcaagc ggctcgccga gaaagggctg 660aaatatgtct ga 672
<210> 118<211> 223<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 118
Met Gly vai vai vai Gln Asn Ile Asp Arg Ala Glu Gln Ala vai lie1 5 10 15
Asp Arg Leu Ala Ala Cys Gly vai Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Arg lie Ala Ala ser Ala vai Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60Trp Met vai His vai Ala lie Glu Gln Val Lys Asp Gly Asp lie Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Leu Ala Arg Gly Cys Arg Gly Leu Val lie Asp100 105 110
Ala Gly vai Arg Asp Val Ala Asp Leu Ala Ala Met Lys Phe Pro Val115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn Val Pro vai vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai lie vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Ala Glu vai Ala Asp Lys Ala Glu Ala His vai Ala Ala Glu180 185 190
Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Asp Met Arg Lys Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 119<211> 672<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 119
atgggtattg ttgttcagaa catcaagcgg gcggaccccg ggatcatagc aggtcttggc 60aaatgcggcg ttgccactgt gcatgaagcg caggggtgca aggggctcct ggcggcctat 120atgcggccca tttattctgg cgcgcgcctt gccgcctccg ctgtcaccat ttccgcgccg 180ccgggagaca actggatggt gcatgtcgcc attgagcagg tgaggcaagg tgatattctg 240gttcttgccc caacatcgcc ctgtgaagac ggctatttcg gtgatttgct cgccacctcc 300atgctgcagc gcggcggcag ggggctgatt attgacgccg gtgtccgcga tatccgtgat 360ctgactcaaa tgaaatttcc ggtgtggtcg aaaaccgttt ttgcgcaggg caccgttaag 420gaaacccttg gctctgtgaa cgtcccgata gtttgcgccg gtgaagtggt caatcctggc 480gacatcatga ttgccgatga tgatggtgtg tgcgtggtcc ggcgcgacga cgctgaaagc 540gtgcttgaaa aagcattggc gcgtgaggca aaggaagaag atacacgcaa acgccttgcg 600gcaggcgagc tgggtcttga tatttacggc atgcgcgcac gtctggccga aaagggccta 660aaatatgtct ga 672
<210> 120<211> 223<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 120
Met Gly lie vai vai Gln Asn Ile Lys Arg Ala Asp Pro Gly Ile lie1 5 10 15
Ala Gly Leu Gly Lys Cys Gly Val Ala Thr vai His Glu Ala Gln Gly20 25 30
Cys Lys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala35 40 45
Ara Leu Ala Ala Ser Ala vai Thr lie Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met vai His vai Ala Ile Glu Gln vai Arg Gln Gly Asp lie Leu65 70 75 80
vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Met Leu Gln Arg Gly Gly Arg Gly Leu Ile lie Asp100 105 110
Ala Gly vai Arg Asp lie Arg Asp Leu Thr Gln Met Lys Phe Pro vai115 120 125
Trp Ser Lys Thr vai Phe Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
ser vai Asn vai Pro Ile vai Cys Ala Gly Glu vai vai Asn Pro Gly145 150 155 160
Asp lie Met lie Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Asp165 170 175
Asp Ala Glu ser vai Leu Glu Lys Ala Leu Ala Arg Glu Ala Lys Glu180 185 190
Glu Asp Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Gly Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 121<211> 696<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 121
atgaagcgcg gtgtcgtcgt cacccatatc gagcgcgcca acccgcgtga cgtggccgtg 60cttcagcagg cgggcgctgc gaccgttcat gaagcgcaga gccgtctggg cctgctcgcg 120tcgtacatgc ggcccatcta tgcgggcgcg tcaatcgcgg gatcggcggt gacggtgctc 180gtgccgccgt cggacaactg gatgttgcac gttgccgccg aacagtgccg cgaaggcgac 240gtgctcgtgg tcgcgccgac ttcgccgtgc gaagacggct acttcggcga actgctcgcg 300acgtcgcttg ccgcgcgcgg tgtgcgcggg ctcatcatcg atgcgggctg tcgcgatgtg 360cgcgcgctca aggacatgaa cttcccggtc tggtcgaaag cggtctctgc gcaaggcacg 420gtgaaggaga cgctgggctc ggtcaatgtg cctgttgtgt gcgcacagca gatcgtgcat 480gcgggcgacg tgatcgtcgc cgacgatgac ggcgtcgtgg tcgtgccgtt cgccacggtg 540tcgcgcgtgg ccgaagcagc gcaggcgcgt ctcgcgaagg aagagaagac gcgttccgtg 600ctcgcgacgg gcgtgctggg cctcgactac tacagcatgc gtgacaagct cgcggaaaag 660ggcctgcgtt acgtcgggtc gatcgaggaa gcgtga 696
<210> 122<211> 231<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 122
Met Lys Arg Gly Val Val vai Thr His lie Glu Arg Ala Asn Pro Arg1 5 10 15
Asp vai Ala vai Leu Gln Gln Ala Gly Ala Ala Thr Val His Glu Ala20 25 30
Gln ser Arg Leu Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Ala35 40 45
Gly Ala Ser lie Ala Gly ser Ala Val Thr Val Leu vai Pro Pro Ser50 55 60
Asp Asn Trp Met Leu His vai Ala Ala Glu Gln Cys Arg Glu Gly Asp65 70 75 80
vai Leu vai vai Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala Arg Gly vai Arg Gly Leu Ile100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Lys Asp Met Asn Phe115 120 125
Pro Val Trp Ser Lys Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr130 135 140Leu Gly ser vai Asn vai Pro vai vai Cys Ala Gln Gln lie vai His145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai vai vai Pro165 170 175
Phe Ala Thr vai Ser Arg vai Ala Glu Ala Ala Gln Ala Arg Leu Ala180 185 190
Lys Glu Glu Lys Thr Arg Ser vai Leu Ala Thr Gly vai Leu Gly Leu195 200 205
Asp Tyr Tyr Ser Met Arg Asp Lys Leu Ala Glu Lys Gly Leu Arg Tyr210 215 220
vai Gly Ser Ile Glu Glu Ala225 230
<210> 123<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 123
atgaacaaac ccgtggtagt gcggcaactg gagcagccac ccgccgatgc ggttgcggcc 60ctggagaagt atggcgtgac taccgtccac gaggctcagg gacgttgtgg cctgctggct 120ccttatatgc gaccgatttt tgcgggagcc tgcatcgccg gttccgccgt caccgtgtct 180ttgccgcccg gcgataactt catgatccac gttgccgtcg aggtctgcag tccgggcagc 240attctcgtag tcgcccccac ctcaccttgc acggacggtt atttcggcga actcttggca 300acttccctcc gcgctcacgg tgtcaaagga ctggtcattg atgccggctg ccgggatgtt 360cgctcgttaa cggaaatgaa attccccgtt tggagccgtg cggtgagttc gcaaggaacg 420gtgaaggcta cgctcggatc tgtgaatgtg ccggtcattt gcgcgggcgc cgaggtggaa 480gccggtgacg tcatcatcgc cgatgacgat ggtgtggtag tggtgaagcg tgcgactgcc 540cacgaggtag cagcggcggc ggaacaacga gttcgcaagg agaatgccac tcgcgaacga 600ctggcacgag gagaactcgg cctcgacatc tacgacatgc ggcaaaaaat cgcgcaactt 660ggtctcaaat atctgtga 678
<210> 124<211> 225<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 124
Met Asn Lys Pro vai vai vai Arg Gln Leu Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Phe Ala35 40 45
Gly Ala Cys Ile Ala Gly Ser Ala Val Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Phe Met lie His vai Ala vai Glu vai Cys ser Pro Gly ser65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
lie Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai ser ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro vai lie Cys Ala Gly Ala Glu vai Glu145 150 155 160
Ala Gly Asp vai Ile lie Ala Asp Asp Asp Gly vai Val vai vai Lys165 170 175
Arg Ala Thr Ala His Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 125<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 125
atgaacgatc ccgtcgtcgt ccgagagatc gagaggccgt cggcgacgtc gatcgacgat 60ctgcggcgtt tcggcgtctc gacggtgcac gaagcgcagg ggcgccgcgg gctgctcgca 120tcgtacatgc ggccgatcta tgccggcgcg ctggtcgccg ggcctgcgat taccgtcctg 180gtgacgccgg gcgacaacct gatgatccat gtcgcggtcg agatctgcca gccaggcgat 240gtcctcgtcg tcgccccgac gtcgccgtgc accgacggat acttcggcga gctgctggcg 300acgtcgttgc gagcgcatgg cgtcgcgggt ctgatcatcg atgccggctg ccgggatgtt 360cgctcgttga gcgagatgcg atttcccgtg tggagccgcg cgatcagcgc ccaggggacc 420gtcaaggcga cgctgggttc ggtgaacgtg ccgctggtgt gcgccggagc gctggtcgag 480ccgggcgatg cgatcgtcgc cgacgacgac ggtgtcgtcg tcgtcaggcg ggaacaggtc 540gacactgtgt gccaggcggc gggacagcgc gtgcgcaagg aagaggacac gcgcgcgcgg 600ctggcgcaag gcgagcttgg cctcgacatc tacggcttgc gcaaaaagct gtcggacctc 660gggttgaagt cgtcgtga 678
<210> 126<211> 225<212> PRT<213> Desconhecido<220><223> Obtido a partir de amostras ambientais<220><221> DOMÍNIO<222> (22)...(174)<223> Demetilmenaquinona metiltransferase<400> 126
Met Asn Asp Pro vai vai vai Arg Glu lie Glu Arg Prc ssr Ala Thr15 10 15
Ser lie Asp Asp Leu Arg Arg Phe Gly vai ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala Leu vai Ala Gly Pro Ala Ile Thr vai Leu Val Thr Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu lie Cys Gln Pro Gly Asp65 70 75 80
vai Leu Val vai Ala Pro Thr ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Ala Gly Leu Ile100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu ser Glu Met Arg Phe115 120 125
Pro vai Trp Ser Arg Ala lie ser Ala Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro Leu vai Cys Ala Gly Ala Leu vai Glu145 150 155 160
Pro Gly Asp Ala Ile vai Ala Asp Asp Asp Gly Val vai vai vai Arg165 170 175
Arg Glu Gln Val Asp Thr Val Cys Gln Ala Ala Gly Gln Arg vai Arg180 185 190
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu195 200 205Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser210 215 220
Ser225
<210> 127<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 127
atgaacgatc cggtcgtcgt tcgcgagatc gacaggccgg cgggtaccgc catcgacgat 60ctccggcgct tcggcgtgtc gaccgtccac gaagcgcagg ggcgttgcgg cttgctcgct 120tcgtacatac ggccgattta ttcaggcgcc ctgctcgccg gcccggcgat caccgtccag 180gttacgcctg gcgacaacct gatgatccac gtcgctgtcg aagtgtgccg gccaggagac 240rvl-nr-t-m-tm 3 ---Zt--s tcçjrrrcgac gtcgccgtgc acggatggct atttcggcga gctgctcgcg 300acatcgctgc gtgcccacgg cgtcgtcggg ctgatcatcg acgccggttg ccgggacgtt 360cgcgccttga gcgagatgcg atttcctgtg tggagtcgcg cgatcagcgc gcagggcacc 420gtcaaagcca cgctgggctc ggtgaacgtg ccgctgttgt gtgccgggat gctggtcgag 480gccggcgacg cgatcgtggc cgacgacgac ggagtggtgg tggtcaggcg gagccaggtc 540gatgctgtcc gcgaggcggc cgaacgacgc gtgcgcaagg aagaggacac gcgggcccgg 600ctcgcccgag gcgagcttgg cctcgacatc tacggcctgc gcaggaaact gtcagacccc 660ggtttgaagt cgtcgtga 678
<210> 128<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 128
Met Asn Asp Pro vai vai vai Arg Glu lie Asp Arg Pro Ala Gly Thr1 5 10 I5
Ala lie Asp Asp Leu Arg Arg Phe Gly Val Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala ser Tyr Ile Arg Pro Ile Tyr Ser35 40 45
Gly Ala Leu Leu Ala Gly Pro Ala Ile Thr Val Gln vai Thr Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Arg Pro Gly asd65 70 75 80Val Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai vai Gly Leu lie100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Ser Glu Met Arg Phe115 120 125
Pro vai Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro Leu Leu Cys Ala Gly Met Leu vai Glu145 150 155 160
Ala Gly Asp Ala Ile vai Ala Asp Asp Asp Gly vai vai vai vai Arg165 170 175
Arg ser Gln vai Asp Ala vai Arg Glu Ala Ala Glu Arg Arg vai Arg180 185 190
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Gly Leu Arg Arg Lys Leu Ser Asp Pro Gly Leu Lys ser210 215 220
ser225
<210> 129 <211> 678 <212> DNA <213> Desconhecido <220> <223> Obtido a partir de amostras ambientais
<400> 129 atgaacaaac cggtggtggt ccggaaggtc gaacagccgc cacaagatgc ggtggcggct 60ctggagaaat atggcgtctc cacggtgcac gaagcgcaag gccgttgcgg gctgctcgcc 120gcttacatgc gcccgatcta tgccggagct tccatggccg gacccgccgt gaccgtttcc 180cttccgcccg gtgacaacct catgatccac gtcgcggtcg aagtgtgcca ccccggaaac 240attctggtcg tcgcccccac ttcaccttgt accgacgggt atttcggcga gttgctggct 300acttccttgc gcgcccacgg cgtgaaggca ctcataatcg atgccggatg ccgtgacgtg 360cgctccctca ccgaaatgaa gtttcccgtg tggagccgcg ccgtcagttc gcagggaaca 420gtgaagtcca cgctcggatc agtgaacgtg ggcgtagtgt gtgcgggcgc tttcatcgaa 480gcgggcgaca tcgtcgtcgc tgatgatgac ggagtcgtcg tcgtgaagag ggctttcgcg 540cgcgacgtgg ttgaagcctg tgaacagagg gtccgcaagg aagaagcgac gcgggcacgc 600ctggcgcagg gcgagcttgg tctggacatc tacggattgc gcgccaaagt ggcggagctc 660ggtctcaagt acatataa 678
<210> 130 <211> 225<212> PRT<213> Desconhecido
<220><223> obtido a partir de amostras ambientais
<220><221> DOMÍNIO<222> (22)...(174)<223> Demetilmenaquinona metiltransferase
<400> 130
Met Asn Lys Pro Val vai vai Arg Lys vai Glu Gln Pro Pro Gln Asp15 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala Ser Met Ala Gly Pro Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys His Pro Gly Asn65 70 75 80
Ile Leu vai Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Lys Ala Leu Ile100 105 110
lie Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai ser ser Gln Gly Thr vai Lys ser Thr130 135 140
Leu Gly Ser vai Asn vai Gly vai vai Cys Ala Gly Ala Phe lie Glu145 150 155 160
Ala Gly Asp Ile vai vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Phe Ala Arg Asp vai vai Glu Ala Cys Glu Gln Arg vai Arg180 185 190
Lys Glu Glu Ala Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Gly Leu Arg Ala Lys vai Ala Glu Leu Gly Leu Lys Tyr210 215 220
Ile225
<210> 131<211> 672<212> DNA<213> Desconhecido<220>
<22Β> Obtido a partir de amostras ambientais<400> 131
atgagcatcg tcgtgcagaa catcgagcga gcggacctgg aggcggttac gacgcttggc 60gaatgcggtg tggcgaccgt gcacgaggca caaggccgca cgggcctcat gctcccctat 120atgcggccga tctggccggg cgcacggatc gcaggcccgg ctgtgaccgt ctccctgccg 180ccgggcgaca actggatgat ccatgtcgcg gtggagcaat gccgggaggg cgacatcctg 240atcgtggcgc cgaccagccc cagcgaggac ggctatttcg gcgagcttct ggcgcgctcg 300ctcgtggcgc gcagcgtcaa gggcttcgtg atcgaggctg gggtgcgcga tgtgcgcgac 360cttaccgaga tacgtttccc ggtctggtcg cgggcagtct ccgcccaggg cacggtcaag 420gaaacgatcg gctcggtgaa cgtgccgatc gtctgcgcag gtgctgcggt gaatccgggc 480gacgtggtcg tggctgacga tgacggcata tgtgtcgtgg ctcgcgacaa agctggtgag 540gtggccaagg ctgcgcgagc gcgcgaggcg aaggaagctg aaacgcgccg ccggctgatc 600aatggcgagc tcgggctcga catctatgga atgcgggaga agcttgcggc gaagggcctg 660aaatatgtct ga 672
<210> 132<211> 223<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 132
Met Ser Ile vai vai Gln Asn lie Glu Arg Ala Asp Leu Glu Ala vai1 5 10 15
Thr Thr Leu Gly Glu Cys Gly Val Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Leu Pro Tyr Met Arg Pro Ile Trp Pro Gly Ala35 40 45
Arg Ile Ala Gly Pro Ala vai Thr vai Ser Leu Pro Pro Gly Asp Asn50 55 60
Trp Met Ile His vai Ala vai Glu Gln Cys Arg Glu Gly Asp lie Leu65 70 75 80
Ile vai Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Arg ser Leu vai Ala Arg ser vai Lys Gly Phe vai Ile Glu100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu lie Arg Phe Pro vai115 120 125
Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr Ile Gly130 135 140
Ser vai Asn vai Pro lie vai Cys Ala Gly Ala Ala vai Asn Pro Gly145 150 155 160
Asp vai vai vai Ala Asp Asp Asp Gly lie Cys vai vai Ala Arg Asp165 170 175
Lys Ala Gly Glu vai Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu180 185 190
Ala Glu Thr Arg Arg Arg Leu Ile Asn Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr vai210 215 220
<210> 133<211> 672<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 133
atgaacatcg tcgtccagaa catcgagcgc gccgatccgg cggtgatcgc cggcctcgcc 60gagtgcggcg tcgccacagt ccacgaagcg caggggcgca tcgggctgat gtcatcgaag 120atgcggccga tctacgccgg cgcccgcatc gcggcctcgg cggtgaccgt gtcgctgccg 180ccggccgaca actggatgat ccatgtcgcc gtggagcaga tcaaagcggg cgacgtcatg 240gtcgtggcgc cgacctcgcc ctcggacgcg ggctattttg gcgacctgct cgccaattcg 300ctgcaggccc ggggctgcgc cggcctcgtg atcgatgccg gggtgcgcga cigtgcgtgac 360cttaccgaaa tgcggttccc cgtctggtcg acggcgatct cggcgcaggg aaccgtcaag 420gaaacgcttg gttcggtgaa cgtcccgatc gtctgcgccg gtgcacatgt cgaacccggc 480gacgtgatcg tcgccgacga cgacggcgtc tgcatcgtca agcgcaccga cgcggctgcg 540gtgctcgaaa aggcgcgggc ccggctcgcg aacgaaaccg acaagcgcga gaaactcgcg 600aacggcacgc tgggcctcga tctctacaag atgcgcgagg cgctggagaa gaagggcctc 660aggtatgcct ga 672
<210> 134<211> 223<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (193)...(196)
<223> Sitio de N-glicosi 1 ação. Pró-sitio id = PS00001<220>
<221> SITE<222> (204)...(207)
<223> Sitio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 134
Met Asn Ile vai Val Gln Asn lie Glu Arg Ala Asp Pro Ala Val lie1 5 10 15
Ala Gly Leu Ala Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg lie Gly Leu Met Ser Ser Lys Met Arg Pro Ile Tyr Ala Gly Ala35 40 45
Arg Ile Ala Ala Ser Ala vai Thr vai Ser Leu Pro Pro Ala Asp Asn50 55 60
Trp Met Ile His vai Ala vai Glu Gln Ile Lys Ala Gly Asp Val Met65 70 75 80
vai vai Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Asn Ser Leu Gln Ala Arg Gly Cys Ala Gly Leu vai Ile Asp100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu Met Arg Phe Pro vai115 120 125
Trp ser Thr Ala lie Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
ser vai Asn vai Pro lie vai Cys Ala Gly Ala His vai Glu Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly Val Cys lie Val Lys Arg Thr165 170 175
Asp Ala Ala Ala vai Leu Glu Lys Ala Arg Ala Arg Leu Ala Asn Glu180 185 190
Thr Asp Lys Arg Glu Lys Leu Ala Asn Gly Thr Leu Gly Leu Asp Leu195 200 205
Tyr Lys Met Arg Glu Ala Leu Glu Lys Lys Gly Leu Arg Tyr Ala210 215 220
<210> 135<211> 672<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 135
atgagcgtcg tcgtccagaa catcgcgcgc gccgatcaag cgatcgtcga tcggctcgcg 60
gcctgcggtg ttgccactgt gcatgaagcg cagggccgca agggactgct cgcgagccat 120
atgcggccga tctatcccgg tacccggctc gcggcgagcg ctgtgaccat ctcggcgccg 180
ccgggcgaca actggatggt ccacgtcgcg atcgagcaat tgcgagcggg cgacatcatg 240gtgctcgccc cgaccagccc ctgcgaggat ggttatttcg gcgatctgct tgccacatcg 300gcgaaagcac ggggctgccg cggtctcatc atcgatgccg gcgtccgcga tgtcgccgat 360ctcacggcga tgcagtttcc tgtctggtcc aaggccatct tcgcgcaagg caccgtcaag 420gaaacgctcg gctcggtgaa catcccggtg gtgtgcgcgg gtgcgctggt caatcccggc 480gatgtcatcg tcgccgatga cgatggcgtc tgcgttgtgc gccgcgaaga ggcggaggcg 540gtggcgcaga aggccgaagc ccgcgtcgcc gccgaggacg acaagcgcaa gcgcctcgcc 600gccggcgaac tcggtctcga catctacaag atgcgcgagc ggctggccga gaaggggctc 660aaatatgtct ga 672
<210> 136<211> 223<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...Ç172)
<223> Demetilmenaquinona metiltransferase<400> 136
Met ser vai Val Val Gln Asn lie Ala Arg Ala Asp Gln Ala lie vai1 5 10 15
Asp Arg Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Pro Gly Thr35 40 45
Arg Leu Ala Ala ser Ala vai Thr lie ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met vai His vai Ala lie Glu Gln Leu Arg Ala Gly Asp Ile Met65 70 75 80
Val Leu Ala Pro Thr ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr ser Ala Lys Ala Arg Gly Cys Arg Gly Leu Ile lie Asp100 105 110
Ala Gly vai Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro vai115 120 125
Trp Ser Lys Ala lie Phe Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn lie Pro vai vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Glu Ala Val Ala Gln Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Asp Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 137<211> 672<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 137
atggctgtcg tggtccagaa tattgcccgt gccgaccagg cggtcattga ccggctggcc 60gcctgtgatg tcgccacggt tcatgaggcg cagggccgca agggcctgct cgccggctac 120atgcggccga tttatcccgg tgcccggatt gctgccagtg ccgtaacgat ctctgcgccg 180cccggcgaca actggatggt ccatgtggcg atcgaacagc tcaaggcggg cgatatcctg 240ttgcttgcgc cgacaagccc ctgcgaggac ggctatttcg gcgatcttct cgcgacgtcg 300gccgttgcgc gcggctgccg cgggcttatc atcgatgccg gcgtgcgtga cgttgccgat 360ctcacggaaa tgaagtttcc ggtctggtcc aaggcggtct tcgcccaggg cacggtcaag 420gagacgctcg gctcggtcaa tgtgaccgtg gtctgtgccg gtgccctggt caatgccggc 480gacgtgatcg tggccgacga cgatggcgtc tgcgtggtcc ggcgcgagga agcggctgac 540gtggctgcca aagccgaggc gcgtgtcgct gccgaggagg gcaagcgcàa gcggctcgcg 600gccggcgaac tcgggctcga catttacgac atgcgcgggc gattggcgga gaagggactg 660agatatgtct ga 672
<210> 138<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172) .
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (149)...(152)
<223> Sitio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 138
Met Ala vai vai vai Gln Asn Ile Ala Arg Ala Asp Gln Ala vai Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Asp vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Gly Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Arg lie Ala Ala Ser Ala vai Thr lie ser Ala Pro Pro Gly Asp AsnTrp Met vai His vai Ala Ile Glu Gln Leu Lys Ala Gly Asp lie Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala vai Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Thr Glu Met Lys Phe Pro vai115 120 125
Trp Ser Lys Ala vai Phe Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Thr vai vai Cys Ala Gly Ala Leu vai Asn Ala Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Ala Asp vai Ala Ala Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp lie
Tyr Asp Met Arg Gly Arg Leu Ala Glu Lys Gly Leu Arg Tyr vai210 215 220
<210> 139<211> 693<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 139
atgaattatc agccggggac aacaggcatc gtcgtgcagg atattgcgcg cgctgatcaa 60gccattatcg atggcctagc agaatgtggt gtggcgacgg tgcatgaggc acaagggcgc 120aaggggctgt tggcggacta tatgacgccg attttttcag gcgcgggcat cgctggatct 180gcggtgacca ttctggcgcc accttgtgac aattggatga ttcatgtggc ggtagaacag 240ttgcaaaagg gcgatgtgtt gctgctgggc acgatcacac cgtccaatgc tggctatttc 300ggtgacttgc tggccacgtc agccatggcg cacggttgtc gcggattgat cattgatggc 360ggtgtgcgcg atgtgcaaga gctgacggat atgggctttc cggtttggtc caaggccgta 420catgcccaag gcacaatcaa agaaacgctg ggatcggtca acgtgccagt tgtctgcggc 480caagagttgg taaatcccgg tgatattgtg gtggccgatg atgacggggt gtgcgttgtg 540cgccgcgaag aagctgctga tgtgctggct aaggcgcggg cgcgcgagag taatgaagcc 600gccaagcgcg cgcgttttga ggacggtgag ctggggctgg atatctatga catgcgcgcg 660cggctggccg aaaagggact gaaatacgtc tga 693<210> 140<211> 230<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (27)...(179)
<223> Demetilmenaquinona metiltransferase<400> 140
Met Asn Tyr Gln Pro Gly Thr Thr Gly Ile vai vai Gln Asp lie Ala1 5 10 15
Arg Ala Asp Gln Ala lie lie Asp Gly Leu Ala Glu Cys Gly vai Ala20 25 30
Thr vai His Glu Ala Gln Gly Arg Lys Gly Leu Leu Ala Asp Tyr Met35 40 45
Thr Pro Ile Phe Ser Gly Ala Gly lie Ala Gly Ser Ala vai Thr Ile50 55 60
Leu Ala Pro Pro Cys Asp Asn Trp Met lie His vai Ala vai Glu Gln65 70 75 80
Leu Gln Lys Gly Asp vai Leu Leu Leu Gly Thr Ile Thr Pro ser Asn85 90 95
Ala Gly Tyr Phe Gly Asp Leu Leu Ala Thr Ser Ala Met Ala His Gly100 105 110
Cys Arg Gly Leu Ile Ile Asp Gly Gly vai Arg Asp vai Gln Glu Leu115 120 125
Thr Asp Met Gly Phe Pro vai Trp ser Lys Ala vai His Ala Gln Gly130 135 140
Thr lie Lys Glu Thr Leu Gly Ser vai Asn vai Pro vai vai Cys Gly145 150 155 160
Gln Glu Leu Val Asn Pro Gly Asp Ile Val vai Ala Asp Asp Asp Gly165 170 175
vai Cys vai vai Arg Arg Glu Glu Ala Ala Asp vai Leu Ala Lys Ala180 185 190
Arg Ala Arg Glu Ser Asn Glu Ala Ala Lys Arg Ala Arg Phe Glu Asp195 200 205
Gly Glu Leu Gly Leu Asp Ile Tyr Asp Met Arg Ala Arg Leu Ala Glu210 215 220
Lys Gly Leu Lys Tyr Val225 230
<210> 141<211> 672<212> DNA
<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 141
atgagcgtcg tcgtccagaa catcgaacgc gccgacccgg actccgtcgc cgtgctcggc 60gcgagcggcg tcgccaccgt gcacgaagcg caaggccgga cgggactcat gcggccctat 120atgcggccga tctattcggg cgtgcgcatt gccggaccga ccgtcacggt ctccatcccg 180ccgggcgaca actggatgat tcatgtcgcg gtcgagcagt gccgcgaagg cgacattctc 240gttgtggctc cgaccagccc gagcgatgac ggctatttcg gcgacctgct tgccgggtcg 300cttatggcac gaggcgtcaa ggctctcatc atcgaggccg gtgtgcgcga cgttcgcgat 360ctgaccgaaa tgcgctttcc ggtctggtcg aagaccattt ccgcgcaggg aaccgtcaag 420gaaacgcttg gctccgtgaa tgtgccgatc gtctgcgccg gtgcggcggt caatcccggc 480gacgcggtcg tggccgatga cgacggcgta tgcgtcgtgc cgcgagagcg agcggccgag 540gtggccaagg cgtcgcaggc ccgcgaggca aaggaagccg ggacgcgccg gcggctgatg 600gccggtgaac tggggctcga catctacggc atgcgcgaga aactcgctgc caagggtttg 660aaatatgtct ga 672
<210> 142<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 142
Met Ser vai vai vai Gln Asn lie Glu Arg Ala Asp Pro Asp1 5 10
Ala vai Leu Gly Ala Ser Gly vai Ala Thr vai His Glu Ala20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro lie Tyr Ser35 40 45
Arg lie Ala Gly Pro Thr vai Thr vai Ser Ile Pro Pro Gly50 55 60
Trp Met Ile His vai Ala vai Glu Gln Cys Arg Glu Gly Asp65 70 75
vai vai Ala Pro Thr Ser Pro ser Asp Asp Gly Tyr Phe Gly85 90
Leu Ala Gly ser Leu Met Ala Arg Gly vai Lys Ala Leu lie100 105 110
Ser Val15
Gln Gly
Gly vai
Asp Asn
lie Leu80
Asp Leu95
Ile Glu
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu Met Arg Phe Pro vai115 120 125Trp ser Lys Thr Ile Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser Val Asn vai Pro Ile Val Cys Ala Gly Ala Ala vai Asn Pro Gly145 150 155 160
Asp Ala vai vai Ala Asp Asp Asp Gly vai Cys vai vai Pro Arg Glu165 170 175
Arg Ala Ala Glu vai Ala Lys Ala ser Gln Ala Arg Glu Ala Lys Glu180 185 190
Ala Gly Thr Arg Arg Arg Leu Met Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr vai210 215 220
<210> 143<211> 672<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 143
atgagcgtcg tcgtccagaa catcgaacgc gccgacccgg actccgtcac cgtgctcggc 60gcgagcggcg tcgccaccgt gcacgaagcg caaggccgga cgggactcat gcggccctac 120atgcggccga tctattcggg cgtgcgcatt gccggaccgg ccgtcacggt ctccatcccg 180ccgggcgaca actggatgat tcatgtcgcg gtcgagcagt gccgcgaagg cgacattctc 240gttgtggctc cgaccagccc gagcgatgat ggctatttcg gcgacctgct tgccgggtcg 300cttgtggcac gaggcgtcaa ggctctcatc atcgaggccg gtgtgcgcga cgttcgcgat 360ctgaccgaaa tgcgctttcc ggtctggtcg aagaccattt ccgcgcaggg aaccgtcaag 420gaaacgcttg gctccgtgaa tgtgccgatc gtctgcgccg gtgcggcggt caatcccggc 480gacgcggtcg tggccgatga cgacggcgta tgcgtcgtgc cgcgagagcg agcggctgag 540gtggccaagg cgtcgcaggc ccgcgaggca aaggaggccg ggacgcgccg gcggctgatg 600gccggtgaac tggggctcga catctacggc atgcgcgaga aactcgctgc caagggtttg 660aaatatgtct ga 672
<210> 144<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (1)...(21)
<223> Receptor proteináceo dependente - TonB Marca 1. Prosite id = PS00430<400> 144
Met Ser vai Val vai Gln Asn Ile Glu Arg Ala Asp Pro Asp Ser vai15 10 15
Thr vai Leu Gly Ala Ser Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro lie Tyr Ser Gly vai35 40 45
Arg lie Ala Gly Pro Ala vai Thr vai Ser lie Pro Pro Gly Asp Asn50 55 60
Trp Met Ile His vai Ala vai Glu Gln Cys Arg Glu Gly Asp Ile Leu65 70 75 80
vai vai Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Gly ser Leu vai Ala Arg Gly vai Lys Ala Leu Ile lie Glu100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu Met Arg Phe Pro vai115 120 125
Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
ser vai Asn vai Pro Ile vai Cys Ala Gly Ala Ala vai Asn Pro Gly145 150 155 160
Asp Ala vai vai Ala Asp Asp Asp Gly vai Cys vai vai Pro Arg Glu165 170 175
Arg Ala Ala Glu vai Ala Lys Ala Ser Gln Ala Arg Glu Ala Lys Glu180 185 190
Ala Gly Thr Arg Arg Arg Leu Met Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr vai210 215 220
<210> 145<211> 672<212> DNA<213> Desconhecido
<220><223> Obtido a partir de amostras ambientais
<400> 145atgaccatcg tcgtcaccgg catcgagcgc gcgggagcgg acactgtcgc cgcgctgggc 60acaagcggcg tcgcgaccgt acacgaggcg cagggccgca ccggcctgat gcgtccctac 120atgcggccga tctatacggg agcgcgcatc gccgggacgg cgattaccgt gtcgctgccg 180cccggcgaca actggatgat ccacgtcgcc gtcgagcagt gccggcaagg cgatatcctc 240gtggtggcgc cgaccagccc gagcgacgac ggctatttcg gcgacctgct cgccaattct 300ctcgtcgccc gcggcgtgag gggcatggtc atcgaggccg gcgtgcgtga cgttcgcgat 360ctcaccgaga tgcgcttccc ggtctggtcg aagacgatct cggcgcaggg aacggtcaag 420gagacgctcg gctcggtcaa cgtgccggtc gtctgcgctg gcttggccgt gaacccgggc 480gacatcatcg tggccgacga cgacggcatc tgcgtggtgc cgcgccagac cgccgcgcag 540gtcgtcgagg cggctcatgc gcgcgaggcg aaggaggcgg aggtccgtcg gcggctcatc 600gccggcgaac tcggcctcga tatctacggc atgcgtgaga agctggcggc caagggcctg 660aaatatgtct ga 672
<210> 146<211> 223<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> C20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 146
Met Thr lie vai vai Thr Gly lie Glu Arg Ala Gly Ala Asp Thr vai1 5 10 15
Ala Ala Leu Gly Thr ser Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Thr Gly Ala35 40 45
Arg lie Ala Gly Thr Ala lie Thr vai Ser Leu Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala Val Glu Gln Cys Arg Gln Gly Asp lie Leu65 70 75 80
Val vai Ala Pro Thr ser Pro ser Asp Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Asn Ser Leu vai Ala Arg Gly vai Arg Gly Met vai lie Glu100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu Met Arg Phe Pro vai115 120 125
Trp Ser Lys Thr lie Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro vai vai Cys Ala Gly Leu Ala Val Asn Pro Gly145 150 155 160
Asp lie lie vai Ala Asp Asp Asp Gly Ile Cys vai vai Pro Arg Gln165 170 175
Thr Ala Ala Gln vai vai Glu Ala Ala His Ala Arg Glu Ala Lys Glu180 185 190Ala Glu vai195
Tyr Gly Met210
<210> 147<211> 675<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 147
gtgagcggca tcgtcgtcca gaacatcgag cgcgccgacc ccgcgatcat cacgggcctc 60gccgaatgcg gcgtcgccac ggtgcatgag gcgcagggcc gcaagggtct gctcgcgtcc 120tacatgcggc cgatctatgc cggcgccgct gtcggcgcat cggcggtcac catcctcgcc 180ccgccctgcg acaactggat ggtgcatgtg gcgatcgagc aggtgcgggc aggggacatc 240ctcgtcctcg cgaccacctc gccctccgac gccggctatt tcggcgatct gctcgccacc 300tcgatgaagg cccgcggcgg tgtcggcctc atcatcgatg ccggcgttcg tgacattcgc 360gacctcacgg cggtgcagtt cccggtgtgg tccaaggccg tctgcgccca gggcaccatc 420aaggaaacgc tgggctcggt gaacgtgccg gtggtctgtg ccggcgagct ggtcaacccg 480ggcgatgtca tcgtcgccga tgacgacggc gtctgcgtcg tgcggcgcga ggaagctgcc 540gatgtgctga agaaggcgca ggcccgcgtg gcgaacgaag gcgacaagcg tcagcgcctc 600gcggccggcg aactcggcct cgacatgtac aagatgcgcg acaagctgaa ggaaatgggc 660ctcaaatatg tctga 675
<210> 148<211> 224<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<400> 148
Met ser Gly lie vai vai Gln Asn Ile Glu Arg Ala Asp Pro Ala lie1 5 10 15
Ile Thr Gly Leu Ala Glu Cys Gly Val Ala Thr vai His Glu Ala Gln20 25 30
Gly Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly35 40 45
Ala Ala vai Gly Ala Ser Ala vai Thr Ile Leu Ala Pro Pro Cys Asp50 55 60
Asn Trp Met vai His Val Ala lie Glu Gln vai Arg Ala Gly Asp ile65 70 75 80
Leu vai Leu Ala Thr Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp
Arg Arg Arg Leu ile Ala Gly Glu Leu Gly Leu Asp ile200 205
Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr vai215 22085 90 95
Leu Leu Ala Thr Ser Met Lys Ala Arg Gly Gly vai Gly Leu lie Ile100 105 110
Asp Ala Gly vai Arg Asp Ile Arg Asp Leu Thr Ala vai Gln Phe Pro115 120 125
vai Trp ser Lys Ala vai Cys Ala Gln Gly Thr Ile Lys Glu Thr Leu130 135 140
Gly Ser vai Asn Val Pro vai vai Cys Ala Gly Glu Leu vai Asn Pro145 150 155 160
Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg165 170 175
Glu Glu Ala Ala Asp vai Leu Lys Lys Ala Gln Ala Arg vai Ala Asn180 185 190
Glu Gly Asp Lys Arg Gln Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp195 200 205
Met Tyr Lys Met Arg Asp Lys Leu Lys Glu Met Gly Leu Lys Tyr vai210 215 220
<210> 149<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 149
atgaataaac cggtggtagt tcgacaggtc gagcagccat cagccgatgc ggttgcggca 60ctagaaaagt gtggcgtaac gacggtgcat aaggctcagg gacgctgcgg cttgcttgca 120gcctacatgc gaccgatttt cccaggagct agcatcgccg gttctgcggt cactgtgtcc 180ctgccgccgg gcgacaacct gatgattcac gtcgcggtcg aggtctgcag cacaggaaac 240attctggtgg tcgctccgac ctcgccatgc acggatggtt acttcggtga actcctcgca 300acgtcgttgc gcgcgcacgg tgtaagaggc cttgtgatcg atgctggatg ccgtgacgtt 360cgctctttga cggaaatgaa attcccggtc tggagccgcg ccatcagctc tcaggggaca 420gtgaaagcca cactcggatc agtcaatgtg ccgatcacat gcgcggggac actcgttgaa 480tccggtgacg tcatcgtcgc cgacgatgat ggtgtcgtag tcgtgaagcg tacggccgca 540caagaagtcg ccgcagccgc tgaacaaagg gtgcgcaaag agaatgcgac ccgtgaacga 600ctcgcacggg gcgaactcgg tctcgatatc tacgagatgc gccagaaaat cgcgcagctc 660ggcctcaagt atctgtga 678
<210> 150<211> 225<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 150
Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Ser Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Lys Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Phe Pro35 40 45
Gly Ala Ser Ile Ala Gly Ser Ala Val Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu vai Cys Ser Thr Gly Asn65 70 75 80
Ile Leu vai vai Ala Pro Thr ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro Val Trp ser Arg Ala Ile Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn Val Pro lie Thr Cys Ala Gly Thr Leu vai Glu145 150 155 160
Ser Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai Val Lys165 170 175
Arg Thr Ala Ala Gln Glu vai Ala Ala Ala Ala Glu Gln Arg Val Arg180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Glu Met Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 151<211> 675<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 151
atgagcggaa ttgttgtcca gaatatcgag cgcgccgacg cggcggtcat cgcagccttggaaagctgcg gcgtctcaac tgtgcacgag gctcaaggcc gtactggact gctggcttct 120tatatgcgtc caatctacac aggtgcacgg atagcaggaa gtgcagtgac tatctccgca 180cctcctggcg ataactggat ggtgcatgtg gctatcgagc aattgcacgc aggcgacata 240ttgataatcg caccaacctc gccgtgcgaa gacggctatt tcggcgactt gctagccacg 300tctgcgcagg cccgtgggtg caagggtctg attatcaacg ccggcgttcg cgatgtgcgc 360gatttgactg aaatgggctt tcccgtctgg tcgaaggcca tttttgccca aggcactatc 420aaagcatcgc tgggttcggt caacataccc gtcgtgtgcg caggcgcgcc catcaatccc 480ggcgatgtga ttgtggccga tgatgacggc gtttgtgtcg tgccgcgcca gaatgcggca 540gaggtcgcaa aggcggcgaa ggcacgtgag gcgaacgagg ccgcaaagcg cgaccagctt 600gcaaccggca tcttggggct tgatatgtat gacatgcgcg gaaatctcgc cgagatgggg 660ctgaaatata tatga 675
<210> 152
<211> 224
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<400> 152
Met Ser Gly Ile vai vai Gln Asn Ile Glu Arg Ala Asp Ala Ala vai1 5 10 15
lie Ala Ala Leu Glu Ser Cys Gly vai ser Thr vai His Glu Ala Gln20 25 30
Gly Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Thr Gly35 40 45
Ala Arg lie Al3. Gly Sgt Ala vai Thr ιΙθ Sgt Ala Pro Pro Gly Asp50 55 60
Asn Trp Met vai His vai Ala lie Glu Gln Leu His Ala Gly Asp Ile65 70 75 80
Leu lie Ile Ala Pro Thr ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp85 90 95
Leu Leu Ala Thr ser Ala Gln Ala Arg Gly Cys Lys Gly Leu lie Ile100 105 110
Asn Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu Met Gly Phe Pro115 120 125
Val Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Ile Lys Ala ser Leu130 135 140
Gly ser vai Asn lie Pro vai vai Cys Ala Gly Ala Pro lie Asn Pro145 150 155 160Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Pro Arg165 170 175
Gln Asn Ala Ala Glu Val Ala Lys Ala Ala Lys Ala Arg Glu Ala Asn180 185 190
Glu Ala Ala Lys Arg Asp Gln Leu Ala Thr Gly lie Leu Gly Leu Asp195 200 205
Met Tyr Asp Met Arg Gly Asn Leu Ala Glu Met Gly Leu Lys Tyr Ile210 215 220
<210> 153<211> 672<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 153
atgtccgtcg tcgtccagaa catcgcgcgc gccgaccagt ccgtcatcga tcggctcggc 60gcctgcggcg tcgccactgt gcatgaagcg cagggccgca cgggactgct agccagctac 120atgcgcccca tctatcgggg tgcgcgtctg gccgcgagcg cggtgaccat ctcggccccg 180cccggcgaca attggatgct ccatgtcgcc atcgagcagc tgaggcccgg cgacatcatg 240gtgcttgccc ccaccagccc ctgcgaggat ggctatttcg gcgacctgct tgcgacatcg 300gccctggcgc gcggctgccg tggtctcgtc atcgaggcgg gcgttcgcga tgtcgccgac 360ctcaccgcga tgaagtttcc cgtctggtcc aaagccatct tcgcccaggg caccgtcaag 420ggaacgctgg gttcggtgaa cgtgcccgtc gtctgtgccg gcgcgctgat caatcccggt 480gacgtcattg tggccgatga cgatggcgtc tgcgtggtgc gccgcgagga agccgaagcg 540gtggcgcaaa aggccgaggc gcgcgtcgcc gccgaagagg ataagcgcaa gcgcctcgcc 600gccggcgaac tcgggctcga tatctacaag atgcgcgagc ggctcgccga aaagggactc 660aaatatgtct ag 672
<210> 154<211> 223<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 154
Met ser vai vai vai Gln Asn Ile Ala Arg Ala Asp Gln ser vai Ile1 5 10 15
Asp Arg Leu Gly Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Arg Gly Ala35 40 45Arg Leu Ala Ala Ser Ala vai Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met Leu His vai Ala Ile Glu Gln Leu Arg Pro Gly Asp Ile Met65 70 75 80
vai Leu Ala Pro Thr ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr ser Ala Leu Ala Arg Gly Cys Arg Gly Leu vai Ile Glu100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Thr Ala Met Lys Phe Pro vai115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr vai Lys Gly Thr Leu Gly130 135 140
ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu Ile Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Glu Ala Val Ala Gln Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 155<211> 672<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 155
atgaacatcg tggtgcagaa catcgagcgc gccgatccgg ccgtgatcgc cggactcgcg 60gattgcggcg tcgccaccgt gcacgaggcg caggggcgca tcggactgat gtcgtccaag 120atgcgaccga tctatccggg cgcgcgtgtc gcggcgtcgg cggtgacggt gtcgctgccg 180ccggccgaca actggatgat tcatgtggcg gtggagcaga tcaaggccgg cgacatcatg 240gtggtcgctc cgacctcgcc gtctgatgcc ggctacttcg gcgacctact ggcgacctcg 300ctcaaggcgc ggggctgcgt gggactggtg atcgacgcgg gggtgcgcga tgtgcgcgac 360ctgaccgaaa tgcagttccc ggtgtggtcg acggcgatct cggcgcaggg gaccgtgaaa 420gaaacgctgg gctcggtgaa cgtccctgtc atctgcgccg gcgcgcatgt ggagccgggc 480gacgtgattg ttgccgacga cgacggggtc tgcatcgtca agcgtgccaa tgcggcggcg 540gtgcttgaga aggcgcgagc gcgggtcgcc ggcgaagccg acaagcgcga gagattagcg 600aacggcacgc tcgggctcga cctctacaag atgcgcgaag ggctggagaa gaagggtcta 660aaatatgtct ga
<210> 156
<211> 223
<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (204)...(207)
<223> Sitio de N-glicosilação. Pró-sitio id = PS00001<400> 156
Met Asn Ile vai vai Gln Asn Ile Glu Arg Ala Asp Pro Ala vai Ile1 5 10 15
Ala Gly Leu Ala Asp Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg lie Gly Leu Met Ser Ser Lys Met Arg Pro lie Tyr Pro Gly Ala35 40 45
Arg vai Ala Ala Ser Ala vai Thr vai ser Leu Pro Pro Ala Asp Asn50 55 60
Trp Met lie His vai Ala vai Glu Gln Ile Lys Ala Gly Asp lie Met65 70 75 80
vai vai Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Leu Lys Ala Arg Gly Cys Val Gly Leu vai Ile Asp100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu Met Gln Phe Pro vai115 120 125
Trp ser Thr Ala Ile Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro vai lie Cys Ala Gly Ala His vai Glu Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys Ile vai Lys Arg Ala165 170 175
Asn Ala Ala Ala vai Leu Glu Lys Ala Arg Ala Arg vai Ala Gly Glu180 185 190
Ala Asp Lys Arg Glu Arg Leu Ala Asn Gly Thr Leu Gly Leu Asp Leu195 200 205
Tyr Lys Met Arg Glu Gly Leu Glu Lys Lys Gly Leu Lys Tyr vai210 215 220<210> 157<211> 690<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 157
atgagcgtgg tcgtcaccgg cgtgcagcgg cccgctcccg cggacgtcgc ggcattgggc 60cgcttcggcg tagcgacaat ccacgaggcg cagggacgca ctggactaat gcacgcttac 120atgcggccga tctattccgg cgcgcatgtc tgcggtccag cggtaaccgt gtctctcccg 180ccagcggaca actggatgat ccacgttgcc atcgagcaat gtgttgcagg cgacatcctc 240gtggtggcac caacctcgcc ttccgacgcc ggctatttcg gcgagctact ggcaacctcg 300cttcaggcgc gcggcgtgaa ggggcttatc atcgaggctg gctgccgcga tgtcgcggca 360ctgactgcca tgcgcttccc ggtgtggtcg cgctcgatct ctgcgcaggg gacagtgaag 420gagacgctcg gctcggtaaa tgtgcccgtc gtctgtaccg gcgcgctggt ggcgccgggc 480gatgttatcg tcgctgacga cgatggagtt gtcgtggtcc caaaggacaa tgtggccgcc 540atcgcctccg cctccgcggc gcgtgaggcg aaggaggaag aggtgcgggc gaagctcaag 600gccggcgtgc tgggcctcga catctacggc gtgcgcgagc ggctgaagga gaaggggctt 660cgctatcgtg ccgccgacga aggccactag 690
<210> 158<211> 229<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE<222> (20)...(40)
<223> Oxidases multicobre marca 1. Pró-sitio id = PS00079<400> 158
Met Ser Val vai vai Thr Gly vai Gln Arg Pro Ala Pro Ala Asp vai1 5 10 15
Ala Ala Leu Gly Arg Phe Gly vai Ala Thr Ile His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met His Ala Tyr Met Arg Pro Ile Tyr ser Gly Ala35 40 45
His Val Cys Gly Pro Ala vai Thr vai Ser Leu Pro Pro Ala Asp Asn50 55 60
Trp Met Ile His vai Ala lie Glu Gln Cys vai Ala Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Glu Leu85 90 95Leu Ala Thr Ser Leu Gln Ala Arg Gly vai Lys Gly Leu lie lie Glu100 105 110
Ala Gly Cys Arg Asp vai Ala Ala Leu Thr Ala Met Arg Phe Pro vai115 120 125
Trp ser Arg Ser Ile Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro vai vai Cys Thr Gly Ala Leu vai Ala Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Pro Lys Asp165 170 175
Asn vai Ala Ala lie Ala Ser Ala ser Ala Ala Arg Glu Ala Lys Glu180 185 190
Glu Glu vai Arg Ala Lys Leu Lys Ala Gly vai Leu Gly Leu Asp Ile195 200 205
Tyr Gly vai Arg Glu Arg Leu Lys Glu Lys Gly Leu Arg Tyr Arg Ala210 215 220
Ala Asp Glu Gly His225
<210> 159<211> 672<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 159
atggcggtag tcgtccagaa tatcgagcgg gcggacggcg cggccatcga caagctggca 60acatgcggcg tggcgaccgt gcacgaggcg caggggcgca ccggtctgct ggcatcggcc 120atgcggccga tctacgccgg cgcccagatt gccggatcgg cgatcaccat ttcggcccca 180cccggcgaca actggatggt gtacgtcgca atcgaacagc tcaagcaggg cgacgtgctg 240gtgattgccc cgacgagtcc ctgtgaagac ggatacttcg gcgacctgct tgccacttcg 300gcgatggcgc gcggctgccg cggcctgatc atcgatgcgg gcgtgcgcga cgtgcgcgat 360ctgaccgcaa tgcgcttccc ggtctggtcc aaggcgatct tcgcgcaggg aaccgtcaag 420gagacgctcg ggtcggtcaa cgtggcggtc gtgtgcgcca acgcgctggt caaccccggc 480gacgtgatta tagccgacga cgacggcgtc gtcgtggtgc cacgcgcgca ggccggcgag 540gtcctgaaga aggcggaagc gcgcatcgca tcggaagaag ccaagcgcaa gcggctggcg 600gccggcgaac tcggcctcga tctctacgac atgcgcggca gactggccga caagggcctg 660aagtatgttt ga 672
<210> 160<211> 223<212> PRT<213> Desconhecido
<220><223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 160
Met Ala vai vai vai Gln Asn lie Glu Arg Ala Asp Gly Ala Ala lie1 5 10 15
Asp Lys Leu Ala Thr Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Leu Ala Ser Ala Met Arg Pro lie Tyr Ala Gly Ala35 40 45
Gl π lie Al3. Gly Ser Ala. Xle Thr iIg Ser Alâ Pro Pro Gly Asp Asn50 55 60
Trp Met vai Tyr vai Ala Ile Glu Gln Leu Lys Gln Gly Asp vai Leu65 70 75 80
vai lie Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr ser Ala Met Ala Arg Gly Cys Arg Gly Leu lie Ile Asp100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Ala Met Arg Phe Pro vai115 120 125
Trp ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Ala vai vai Cys Ala Asn Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai Ile lie Ala Asp Asp Asp Gly vai vai vai vai Pro Arg Ala165 170 175
Gln Ala Gly Glu vai Leu Lys Lys Ala Glu Ala Arg Ile Ala Ser Glu180 185 190
Glu Ala Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Leu195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Asp Lys Gly Leu Lys Tyr vai210 215 220
<210> 161<211> 699<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 161
atgagcgtgg tcgtcaccgg catcgcgcgg cctgaccgcg ccgaggtgga aggcttcgctgccatcggcg tggcgaccat ccacgaggcg cagggccgca ccggcctgat gcagtccttcatgcagccga tctataccgg cgcgcacatt ggcgggcccg cggtgacggt ctcgctgccg 180cccggcgaca actggatgat tcacgtcgcg gtagagcagt gccaggccgg cgacgttctg 240gtcgtcgccc ccacctcacc ctcggacgtc ggctatttcg gcgagctgct ggcgacctcg 300ctcgtcgcac gcggcatccg cggcctcgtc atcgaggccg gctgccgcga taaaacggcg 360ctgactgcga tgcgctttcc cgtttggtcc cgcgcggtct cggcgcaggg aacggtcaag 420gagacgctcg gctcggtgaa tgtcccactc gtctgcgccg gtgcgctggt aaatcccggt 480gatctcgtgg tcgccgatga cgacggtgtc gtcgttgtgc cgcgcgacaa ggtcgcggcg 540gtgcgggcgg catcgcttgc acgcgaggcg aaggaggatg gggtgcgcgc gcggctgcag 600gccggcgagc tcggactcga cgtctacggc atgcgcgagc gcctgaagga aaaggggctg 660gtctatcgcg cggcgaacac cgacgggaaa aacggctga 699
<210> 162<211> 232<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiItransferase<400> 162
Met ser vai vai vai Thr Gly Ile Ala Arg Pro Asp Arg Ala Glu vai1 5 10 15
Glu Gly Phe Ala Ala lie Gly vai Ala Thr Ile His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Gln Ser Phe Met Gln Pro lie Tyr Thr Gly Ala35 40 45
His lie Gly Gly Pro Ala vai Thr vai ser Leu Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala vai Glu Gln Cys Gln Ala Gly Asp vai Leu65 70 75 80
vai vai Ala Pro Thr Ser Pro Ser Asp vai Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Thr ser Leu vai Ala Arg Gly lie Arg Gly Leu vai lie Glu100 105 110
Ala Gly Cys Arg Asp Lys Thr Ala Leu Thr Ala Met Arg Phe Pro vai115 120 125
Trp ser Arg Ala vai ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro Leu vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp Leu vai vai Ala Asp Asp Asp Gly vai Val vai vai Pro Arg Asp165 170 175
Lys vai Ala Ala vai Arg Ala Ala Ser Leu Ala Arg Glu Ala Lys Glu180 185 190
Asp Gly vai Arg Ala Arg Leu Gln Ala Gly Glu Leu Gly Leu Asp vai195 200 205
Tyr Gly Met Arg Glu Arg Leu Lys Glu Lys Gly Leu vai Tyr Arg Ala210 215 220
Ala Asn Thr Asp Gly Lys Asn Gly225 230
<210> 163<211> 699<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 163
atgagtgtcg tcgtcacagg aattccgcgg gcctcggcat ctgagatcga cgcgcttcgc 60cgctgcgggg tggcgacgat ccacgaggcg caagggcgta ccggccttct gcgcgcgaac 120atgcggccga tctacgctgg tgcccatgcc gtcggatcgg cggtgaccgt gtcgttgccc 180ccggccgata actggatgat ccatgtggcg gtcgagcagt gtcaggcagg agacgtcctc 240gtcgtggccc cgacttcgcc ttcggatgcc ggctactttg gcgagctgct ggcgacctct 300ctcgccgcgc ggggtgtgcg cggcctcgtt atcgaggctg ggtgccgcga cgtggcggcg 360ttgacggcaa tgcgttttcc ggtctggtca cgcgccgtct ccgcacaagg gacggtgaag 420gagacgcttg gttcggtgaa tgtgccgatc atctgcgccg gtgctctcgt gaatccggga 480gacgttgtcg ttgccgacga tgacggcgtg gtcgttgtgc cacgcatcgg agtggcggat 540gtcgctgccg cctcggccgc gcgtgaagcg aaggaggatc aggtcagggc gcgcttcaag 600gcgggcgagc tcgggctcga tatctatagg atgcgcgagc ggctgaagga aaaagggctc 660gtctaccgta ccgcgggtga tggcccaggc gggggctag 699
<210> 164<211> 232<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 164
Met Ser vai vai vai Thr Gly lie Pro Arg Ala Ser Ala Ser Glu lie1 5 10 15
Asp Ala Leu Arg Arg Cys Gly vai Ala Thr Ile His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Leu Arg Ala Asn Met Arg Pro Ile Tyr Ala Gly Ala35 40 45His Ala vai Gly Ser Ala Val Thr vai ser Leu Pro Pro Ala Asp Asn50 55 60
Trp Met lie His vai Ala vai Glu Gln Cys Gln Ala Gly Asp vai Leu65 70 75 80
vai vai Ala Pro Thr Ser Pro ser Asp Ala Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Thr ser Leu Ala Ala Arg Gly Val Arg Gly Leu Val lie Glu100 105 110
Ala Gly Cys Arg Asp vai Ala Ala Leu Thr Ala Met Arg Phe Pro vai115 120 125
Trp ser Arg Ala vai Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro Ile Ile Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai vai vai Ala Asp Asp Asp Gly vai Val vai vai Pro Arg lie165 170 175
Gly vai Ala Asp vai Ala Ala Ala Ser Ala Ala Arg Glu Ala Lys Glu180 185 190
Asp Gln vai Arg Ala Arg Phe Lys Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Arg Met Arg Glu Arg Leu Lys Glu Lys Gly Leu vai Tyr Arg Thr210 215 220
Ala Gly Asp Gly Pro Gly Gly Gly225 230
<210> 165<211> 672<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 165
atgggtgtgg tggtccagaa tatcgcccgc gccgcgcaat ccgtcatcga ccggctcgcg 60gcttgcggcg tcgcgacggt tcatgaagca caggggcgca aaggcctgct cgccagccgt 120atgcggccga tctatcccgg cgcccggatc gccgcgagcg cggtgacgat ctcagcgccg 180cccggtgaca actggatgat tcatgtggcg atcgagcagc tcaagacggg tgacatcctg 240cttctggcgc cgaccagtcc ttgcgaggac ggctatttcg gcgatctgct tgcgacgtcc 300gcgatggcgc ggggctgtcg gggattgatc atcgatgctg gcgtgcgcga tgtcgccgac 360ctggccgcga tgaaattccc tgtctggtcg aaggccatct tcgcgcaggg cacggtcaag 420gagacagtcg gttccgtgaa tgtgccggtc gtctgcgccg gcgcgctggt caatcccggc 480gatgtgatcg tcgccgacga tgacggcgtc tgtgtcgtca ggcgcgagga tgcggctgat 540gtggctgaca aggccgaggc gcgcgtcgcg gccgaagaga gcaagcgcaa gcggctagca 600
tcaggcgagc tcggtctcga catttacgat atgcgccaac ggctcacgga gaaaggcctt 660
agatatgtct ga 672
<210> 166<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 166
Met Gly vai Val vai Gln Asn lie Ala Arg Ala Ala Gln Ser vai Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala ser Arg Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Arg Ile Ala Ala Ser Ala vai Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala Ile Glu Gln Leu Lys Thr Gly Asp lie Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr ser Ala Met Ala Arg Gly Cys Arg Gly Leu Ile lie Asp100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Ala Ala Met Lys Phe Pro vai115 120 125
Trp ser Lys Ala lie Phe Ala Gln Gly Thr Val Lys Glu Thr vai Gly130 135 140
Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai lie vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Asp Ala Ala Asp vai Ala Asp Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Glu Ser Lys Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Asp Met Arg Gln Arg Leu Thr Glu Lys Gly Leu Arg Tyr vai210 215 220<210> 167<211> 672<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 167
atgggcgtcg tggtccagaa catcgcccgc gccgagcgag atgtcatcga ccggcttgcg 60atctgcggcg tcgcgaccgt gcatgaggcg caagggcgca aggggctgct ggcgagctat 120atgcggccga tctatcccgg cgcgcggatt gcggcgagcg ccgtcaccat ttcggctccc 180cccggtgaca actggatggt ccatgtggcg atcgagcagg tgagggaggg cgacatcctg 240ctgctcgctc cgacgagccc ttgcgaggac gggtattttg gcgacctgct ggcgacctcg 300gccatggcgc gcggatgccg cgggctggtc atcgatgccg gcgtgcgtga tgtcgccgat 360ctcacggcga tgcagttccc cgtctggtcg aaggcgatct tcgcacaggg cacggtcaag 420gagacgctgg gctctgtgaa tgtgccggtc gtctgcgccg gcgcgcttat caatccgggc 480gatgtcatcg tggcggatga tgacggcgtc tgcgtcgtca ggcgcgagga ggcggccgat 540gtcgccgcca aggccgaggc gcgcgttggc gccgaggagg ccaagcgcaa gcgtctcgct 600gccggcgaac tcggactcga catctacgat atgcgcaggc gtctcgccga gaagggattg 660aaatatgtct ga 672
<210> 168<211> 223<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 168
Met Gly vai vai vai Gln Asn lie Ala Arg Ala Glu Arg Asp vai Ile1 5 10 15
Asp Arg Leu Ala Ile Cys Gly vai Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Arg lie Ala Ala Ser Ala vai Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met vai His vai Ala lie Glu Gln vai Arg Glu Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu vai Ile Asp100 105 110Ala Gly vai Arg Asp vai Ala Asp Leu Thr Ala Met Gln Phe Pro Val115 120 125
Trp Ser Lys Ala lie Phe Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn Val Pro vai vai Cys Ala Gly Ala Leu lie Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Ala Asp vai Ala Ala Lys Ala Glu Ala Arg vai Gly Ala Glu180 185 190
Glu Ala Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Asp Met Arg Arg Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 169<211> 672<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 169
atgagtgtgg tcgttcagaa tatcgagcgg gccgatcccg ccatcatcgc cggccttgcc 60gaatgcggtg tggcgaccgt ccacgaagcg cagggccgca agggcctgct ggcgtcctat 120atgcgtccca tctactcggg cgcgcgcctg gcagcaagtg ccgtgaccat ttcggcgccg 180ccctgcgaca actggatgtt gcatgtcgcc attgagaaat tgcgggaggg cgacattctc 240gtcctcgccc caacgtcgcc gtctgacgct gggtactttg gcgacctgct ggccacttcg 300gcgcaggccc gcggctgcaa gggcctgatc attgatgccg gcgtacgcga cgtggccgac 360ctcacgcgga tgaaattccc cgtctggtcc aaggcgatat ttgcccaggg cacgatcaag 420gagacgctgg gctcggtcaa tgtgccgatt gtctgcgcgg gcgagctggt caatgccggc 480gacatcatcg tggccgatga cgatggggtt tgcgttgtgc gccgcgagga ggctgctgcg 540gtgctcgaag cctcgcagaa gcgcgtggcc aatgaagaga gcacgcgcaa gcgcctcgct 600gccggggaac tgggactcga catctatgga atgcgccagc ggctgaccga gaaggggttg 660aagtatgtct ga 672
<210> 170<211> 223<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 170
Met Ser vai vai Val Gln Asn lie Glu Arg Ala Asp Pro Ala Ile Ile1 5 10 15
Ala Gly Leu Ala Glu Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala Val Thr lie Ser Ala Pro Pro Cys Asp Asn50 55 60
Trp Met Leu His vai Ala lie Glu Lys Leu Arg Glu Gly Asp lie Leu65 70 75 80
vai Leu Ala Pro Thr Ser Pro ser Asp Ala Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Thr Arg Met Lys Phe Pro vai115 120 125
Trp ser Lys Ala Ile Phe Ala Gln Gly Thr lie Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro Ile vai Cys Ala Gly Glu Leu vai Asn Ala Gly145 150 155 160
Asp Ile Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Ala Ala vai Leu Glu Ala Ser Gln Lys Arg vai Ala Asn Glu180 185 190
Glu ser Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Gly Met Arg Gln Arg Leu Thr Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 171<211> 672<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 171
atgaccgtcg tcgtccgcaa cttcgagcgc gcgtcgcccg aagtcgtagc cgtgctgggc 60gaatgcggcg tggcgacggt gcatgaagcg caaggccgca gcggcctcat gctcgccttc 120atgcggccga tcttcgcggg cgcccgcatc gccgggccgg cggtgacagt ttccgtcccg 180ccgggcgaca actggatgat ccatgtggcg atcgagcagt gccgcgaagg cgacgtgctc 240gtcgtggcgc cgaccagccc ctccgaggac ggctatttcg gcgacctgct cgcgcactcg 300ctgatggcgc ggggcgtcaa ggggctcgtc attgaggccg gcgttcgcga tctacgcgat 360ctcaccgaga tgcgctttcc ggtctggtcc cggacgatct ccgcgcaggg aacggtcaag 420gagacgctcg gctcggtgaa cgtgccgatc gtctgcgccg gcgcggcggt cgatccgggc 480gacgtagtcg tggccgacga cgacggcgtc tgcatcgtga gacgcgcccg ggcggaagag 540gtcgcgaaag cggcgcgcga acgcgaggcg aaggagaggg agacgcggcg gcggctggcc 600gccggcgagc tcggtctcga catctatggc atgcgcgaga agcttgcggc caaagggctg 660aaatatgtct ga 672
<210> 172<211> 223<212> PRT<21Β> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 172
Met Thr vai vai vai Arg Asn Phe Glu Arg Ala Ser Pro Glu vai vai1 5 10 15
Ala vai Leu Gly Glu Cys Gly Val Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Ser Gly Leu Met Leu Ala Phe Met Arg Pro lie Phe Ala Gly Ala35 40 45
Arg lie Ala Gly Pro Ala vai Thr vai ser vai Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala lie Glu Gln Cys Arg Glu Gly Asp vai Leu65 70 75 80
vai vai Ala Pro Thr ser Pro ser Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala His Ser Leu Met Ala Arg Gly vai Lys Gly Leu vai lie Glu100 105 110
Ala Gly vai Arg Asp Leu Arg Asp Leu Thr Glu Met Arg Phe Pro vai115 120 125
Trp Ser Arg Thr Ile Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro Ile vai Cys Ala Gly Ala Ala Val Asp Pro Gly145 150 155 160
Asp vai vai vai Ala Asp Asp Asp Gly vai Cys lie vai Arg Arg Ala165 170 175
Arg Ala Glu Glu vai Ala Lys Ala Ala Arg Glu Arg Glu Ala Lys Glu180 185 190
Arg Glu Thr Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr vai210 215 220
<210> 173<211> 672<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 173
atgggcgttg tggtccagaa tgtcggccgc gccgaacaat ccgtcatcga ccggctcgca 60gcctgtggcg tggcgactgt gcatgaggcg cagggccgcc ggggcctcct cgcgagctac 120atgcggccga tctattccgg tgcacggatc gccgcgagtg cagtgacgat ctcggcgccg 180cccagtgaca actggatgct gcatgtggcg atcgagcaat tgaagcaggg cgatctgctt 240ctgctcgcgc ccaccagccc gtgcgaagac ggctatttcg gtgacctgct cgcgacctct 300gccgtggcgc gaggttgccg cggcctgatc atcgacgcgg gcgtacgcga tgtcgccgac 360ctgacggcca tgtcgtttcc ggtctggtcc aaggcgatat ctgcgcaagg caccgtcaag 420gagacattgg gctcggtgaa tgtgccggtc gtctgcgccg gtgcgctggt caacccaggc 480gacgtgatcg tggccgacga cgatggcgtc tgcgtcgtgc gccgcgagga ggcggcggag 540atcgccgaca aggccgaagc gcgcgtcgcg gccgaggaaa gcaagcgggc gcggctggca 600gccggcgaac ttgggttgga tatctacgac atgcgcaagc ggctcgccga gaaagggctg 660aagtatgtct ga 672
<210> 174<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 174
Met Gly vai vai vai Gln Asn vai Gly Arg Ala Glu Gln ser vai Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Arg Gly Leu Leu Ala ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala35 40 45
Arg lie Ala Ala Ser Ala vai Thr lie Ser Ala Pro Pro Ser Asp Asn50 55 60
Trp Met Leu His vai Ala Ile Glu Gln Leu Lys Gln Gly Asp Leu Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95Leu Ala Thr Ser Ala vai Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Thr Ala Met Ser Phe Pro vai115 120 125
Trp ser Lys Ala Ile Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly Val Cys vai vai Arg Arg Glu165 170 175
Glu Ala Ala Glu Ile Ala Asp Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Glu Ser Lys Arg Ala Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Asp Met Arg Lys Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 175<211> 672<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 175
atgggtgtcg tcgtccagaa tatcgagcgc gccgatcctt cggtcatcga acggctggcg 60gcatgcgggg ttgctactgt gcacgaagcg cagggacgca agggtctgct ggcgagccat 120atgcggccga tctatgccgg tgcgcgcctt gcagccagtg ccgtgaccat atcggcgccg 180ccgggcgata actggatgat ccatgtcgcc atcgaacagc tcagggcggg tgacataatg 240gtgcttgccc cgacaagtcc ctgcgaggat ggctatttcg gcgacttgct ggcgacgtct 300gctgcggcgc gaggctgccg ggggctgatc atcgatgcgg gcgtgcgtga cgtggcggac 360ctgacggcga tgaagtttcc ggtgtggtcg aaggccattt ttgcgcaggg cacggtcaag 420gaaacgctgg gctcggtcaa tgtgccggtg gtctgcgcgg gagcgctggt caacccgggc 480gacgtgatcg tggccgatga cgacggcgtc tgcgtcgtgc gacgcgagga agcggccgcg 540gtggccgaca aggccgaggc gcgcgtggct gcggaagagg acaagcgcag gcgcctggcg 600gccggggaac tgggcctcga catctacaag atgcgcgagc gcctggccga gaagggcctc 660aggtatgtct ga 672
<210> 176<211> 223<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiItransferase<400> 176
Met Gly vai vai vai Gln Asn Ile Glu Arg Ala Asp Pro Ser vai lie1 5 10 15
Glu Arg Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala ser His Met Arg Pro Ile Tyr Ala Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala vai Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala lie Glu Gln Leu Arg Ala Gly Asp lie Met65 70 75 80
vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Ala Ala Arg Gly Cys Arg Gly Leu lie lie Asp100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Thr Ala Met Lys Phe Pro vai115 120 125
Trp ser Lys Ala Ile Phe Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Ala Ala vai Ala Asp Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Glu Asp Lys Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Arg Tyr vai210 215 220
<210> 177<211> 675<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 177
atggggggcg tagtcgtgca gaacatcgag cgggccgacg cggaaaccat ccgccggctc 60ggcgaatgcg gtgtggcgac ggtgcacgag gcgcaggggc gcagcgggct gatggcgccc 120catatgacgc cggtctggcg cggcgcatcg gttgccggtt cggcggtgac gatctccgcc 180ccgcccggcg acaactggat gctgcacgtg gcgatcgagc aggtgcatga gggcgatatc 240ctcgtgctgg cgccgaccag tccttccacg gacggctatt tcggcgattt gcttgccacc 300tcggcgatgg cgcgggggtg tcgcgggctg gtcatcgaag caggcgtgcg cgacgtggcc 360gacctgacga agatgcggtt ccccgtctgg tcgaaggcgg tccacgcgca gggtacggtc 420aaagagacgc cgggctcagt caacgtgccg gtcgtctgcg ccggtgccca tgtgcggccg 480ggcgacgtca tcgtggccga cgatgacggc gtgtgcgtgg tcaggcgcga ggaggcggcg 540gaaatattga ggaaggccga ggcccgcatc gccaacgaag ccgacaagcg cgagcgtttc 600gccgccggcg aactcggcct cgacatctac ggcatgcgcg agaagctggc cgccaaggga 660ttgaaatata tctga 675
<210> 178<211> 224<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<400> 178
Met Gly Gly vai vai vai Gln Asn Ile Glu Arg Ala Asp Ala Glu Thr1 5 10 15
Ile Arg Arg Leu Gly Glu Cys Gly vai Ala Thr vai His Glu Ala Gln20 25 30
Gly Arg Ser Gly Leu Met Ala Pro His Met Thr Pro vai Trp Arg Gly35 40 45
Ala Ser vai Ala Gly ser Ala vai Thr Ile Ser Ala Pro Pro Gly Asp50 55 60
Asn Trp Met Leu His vai Ala Ile Glu Gln vai His Glu Gly Asp lie65 70 75 80
Leu vai Leu Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly Asp85 90 95
Leu Leu Ala Thr ser Ala Met Ala Arg Gly Cys Arg Gly Leu vai Ile100 105 110
Glu Ala Gly vai Arg Asp vai Ala Asp Leu Thr Lys Met Arg Phe Pro115 120 125
vai Trp ser Lys Ala vai His Ala Gln Gly Thr vai Lys Glu Thr Pro130 135 140
Gly Ser vai Asn vai Pro Val vai Cys Ala Gly Ala His vai Arg Pro145 150 155 160
Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys Val vai Arg Arg165 170 175
Glu Glu Ala Ala Glu Ile Leu Arg Lys Ala Glu Ala Arg lie Ala Asn180 185 190
Glu Ala Asp Lys Arg Glu Arg Phe Ala Ala Gly Glu Leu Gly Leu Asp195 200 205
lie Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Ile210 215 220
<210> 179<211> 672<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 179
atgggggtcg tggtccagaa catcgaacgc gccgatcagg ccgtcatcaa ccgccttgcc 60gcctgcggcg tggccaccgt gcacgaggcg cagggccgca agggcctgct cgccgccaat 120atgcgtccga tctacagcgg agaacgtctg gcggcctcgg ccgtgacgat ttccgcgccc 180cccggtgaca actggatggt ccatgtcgcg atcgagcaat tgcaggccgg tgacatcatg 240gttttggccc ccacctcgcc ctgcgaggac ggctatttcg gtgatcttct ggccacgtcg 300gctatcgcac gtggctgcaa gggcctgatc atcgatgcgg gcgtgcgcga tgtgtcggat 360ctgacggcga tgaaattccc cgtctggtcc aaggcgatct tcgcccaagg cacggtcaag 420gaaacccttg ggtcggtgaa tattcccgtg gtctgcgccg gcgcgctgat caatcccggt 480gatgtaattg tggccgatga cgacggcgtt tgcgtggtcc gccgcgagga agccgaagcc 540gttgcagcca aagccgaagc ccgtgtcgca gccgaagaag gcaagcgcgt gcgtctggcc 600gcgggtgaac tgggccttga tatctataac atgcgcgaac gtctggccga gaagggcctg 660aaatatgtct ga 672
<210> 180<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 180
Met Gly Val vai vai Gln Asn Ile Glu Arg Ala Asp Gln Ala vai lie1 5 10 15
Asn Arg Leu Ala Ala Cys Gly Val Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ala Asn Met Arg Pro lie Tyr Ser Gly Glu35 40 45
Arg Leu Ala Ala Ser Ala Val Thr lie ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met vai His Val Ala Ile Glu Gln Leu Gln Ala Gly Asp Ile Met65 70 75 80vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Ile Ala Arg Gly Cys Lys Gly Leu lie lie Asp100 105 110
Ala Gly vai Arg Asp Val Ser Asp Leu Thr Ala Met Lys Phe Pro vai115 120 125
Trp ser Lys Ala Ile Phe Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
ser vai Asn lie Pro Val Val Cys Ala Gly Ala Leu lie Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Arg Arg Glu165 170 175
Glu Ala Glu Ala vai Ala Ala Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Glu Gly Lys Arg Val Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Asn Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 181<211> 687<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 181
atgagcggtc atcgcatcgt ccgcaactat ccaaaagcag actcgggcgt cgcctccgct 60ctgggcgctc tgggcagcgc gaccgtgcac gaggccatgg gccgcgtggg atacgccggc 120caccgtatcc ggccgatcca gcagggcgtg tcgatcggcg gcaccgccgt aaccgtctcg 180gtcgcaccgg gtgacaacct gatggttcac gccgcgattg ccgaggccaa cgaaggcgac 240gtgctggtcg tcgttcccgt gagcgacagc gcgttcggct ttatcggcga cctgatggcg 300actcagatgc gctctcgccg gctgcgcggt tacgtgacct ccggcggcgt gcgtgatacc 360gccgagttgg cccgcttggg ttttccggta tggacgaaat acgtctcgtc gcaagggacg 420gtgaaagata cccccggctc ggtcaatgtg cccgtcgtgc tcgaaggcgt cgtggtccat 480cctggagacg tcgtggtagc ggacgacgac ggcgtcacca tcgtgccgcg cgagatcgcc 540gccgacacgc tccaggccgc tcgggcccgc gtggagaagg aagccgcgac ccgatcgcgg 600tatgcggcgg gcgagctttc actcgacgtc aacaacctgc gcccgaccct cgcagcgctg 660ggagtggagt atgtcgattt cgggtga 687
<210> 182<211> 228<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> SIGNAL<222> Cl)...(31)
<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 182
Met Ser Gly His Arg lie vai Arg Asn Tyr Pro Lys Ala Asp Ser Gly1 5 10 15
vai Ala Ser Ala Leu Gly Ala Leu Gly Ser Ala Thr vai His Glu Ala20 25 30
Met Gly Arg vai Gly Tyr Ala Gly His Arg lie Arg Pro lie Gln Gln35 40 45
Gly vai Ser lie Gly Gly Thr Ala vai Thr vai ser vai Ala Pro Gly50 55 60
Asp Asn Leu Met vai His Ala Ala lie Ala Glu Ala Asn Glu Gly Asp65 70 75 80
vai Leu vai vai vai Pro vai ser Asp Ser Ala Phe Gly Phe Ile Gly85 90 95
Asp Leu Met Ala Thr Gln Met Arg Ser Arg Arg Leu Arg Gly Tyr vai100 105 110
Thr ser Gly Gly vai Arg Asp Thr Ala Glu Leu Ala Arg Leu Gly Phe115 120 125
Pro vai Trp Thr Lys Tyr vai Ser Ser Gln Gly Thr vai Lys Asp Thr130 135 140
Pro Gly Ser vai Asn vai Pro vai vai Leu Glu Gly vai vai vai His145 150 155 160
Pro Gly Asp vai vai vai Ala Asp Asp Asp Gly vai Thr lie vai Pro165 170 175
Arg Glu lie Ala Ala Asp Thr Leu Gln Ala Ala Arg Ala Arg vai Glu180 185 190
Lys Glu Ala Ala Thr Arg Ser Arg Tyr Ala Ala Gly Glu Leu Ser Leu195 200 205
Asp vai Asn Asn Leu Arg Pro Thr Leu Ala Ala Leu Gly vai Glu Tyr210 215 220
vai Asp Phe Gly225
<210> 183<211> 693<212> DNA<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 183
atgcgcggcg tcgtggtccg gaacattcca cgcgccgacg cgcgcgagat cgcggttctg 60catgaagcgg gcgtcgccac cgtgcacgag gcgcagagcc gcctcggtct gctcgcttcg 120tacatgcggc ccatttacga gggcgcatcg attgccggtc cggccgtgac cgtgctcgtg 180ccgccatcgg acaactggat gctgcacgtc gccgctgaac agtgccagcc cggcgatgtc 240ctcgtggtcg cgccgacgtc gccgtgcgaa gacggctact tcggcgaact gttggcgacg 300tcgctggcac agctcggcgt gcgcggactg atcatcgatg cgggctgccg cgacatccgt 360gcgctcaagg cgatgaattt ccccgtgtgg tcgaaaggga tctcggcgca agggaccgtc 420aaggaaacgc tcgggtcggt gaacatcccc gtggtgtgcg cgcagcaact ggtgcgaccg 480ggcgacgtga tcgtggccga tgacgatggc gtcgtggtcg tcgcgttcga gacggtggcg 540gccgtggcga gcgccgcacg cgcgcgcctc gagaaggaag agaagacgcg cagcgtgctt 600gcgacaggcc agctcggtct cgactactac gcgatgcgcg agaagcttgc ggcaaagggt 660ttgcgttacg tcgattccgc tgcgggtctt tga 693
<210> 184<211> 230<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<400> 184
Met Arg Gly Val Val vai Arg Asn lie Pro Arg Ala Asp Ala Arg Glu1 5 10 15
Ile Ala vai Leu His Glu Ala Gly vai Ala Thr vai His Glu Ala Gln20 25 30
ser Arg Leu Gly Leu Leu Ala ser Tyr Met Arg Pro lie Tyr Glu Gly35 40 45
Ala Ser Ile Ala Gly Pro Ala Val Thr Val Leu vai Pro Pro Ser Asp50 55 60
Asn Trp Met Leu His vai Ala Ala Glu Gln Cys Gln Pro Gly Asp vai65 70 75 80
Leu vai vai Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Glu85 90 95
Leu Leu Ala Thr ser Leu Ala Gln Leu Gly vai Arg Gly Leu lie Ile100 105 110
Asp Ala Gly Cys Arg Asp lie Arg Ala Leu Lys Ala Met Asn Phe Pro115 120 125vai Trp ser Lys Gly lie Ser Ala Gln Gly Thr vai Lys Glu Thr Leu130 135 140
Gly Ser vai Asn Ile Pro vai vai Cys Ala Gln Gln Leu Val Arg Pro145 150 155 160
Gly Asp vai lie vai Ala Asp Asp Asp Gly Val vai vai vai Ala Phe165 170 175
Glu Thr vai Ala Ala vai Ala Ser Ala Ala Arg Ala Arg Leu Glu Lys180 185 190
Glu Glu Lys Thr Arg ser vai Leu Ala Thr Gly Gln Leu Gly Leu Asp195 200 205
Tyr Tyr Ala Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Arg Tyr vai210 215 220
Asp Ser Ala Ala Gly Leu225 230
<210> 185<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 185
atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60ctggagaggt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360cgctctctca cagaaatgaa atttccggcc tggagccgcg ccgtcagttc acaggggaca 420gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcgag 480gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660ggccttaaat atctctga 678
<210> 186<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...C174)
<223> Demetilmenaquinona metiltransferase<400> 186
Met Asn Arg Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Arg Tyr Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Pro Gly Gly Leu Leu Ala ser Tyr Met Arg Pro lie Tyr Pro35 40 45
Gly Ala vai lie Ala Gly Ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala Val Glu vai Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai Val Ala Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro Ala Trp Ser Arg Ala vai ser ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro lie vai Cys Ala Gly Ala Arg vai Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Asp Met Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 187<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 187
atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60ctggagaagt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360cgctctctca cagaaatgaa atttccggtc tggagccgcg ccgtcagtcc acaggggaca 420gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcgag 480gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660ggccttaaat atctctga 678
<210> 188<211> 225<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 188
Met Asn Arg Pro Val Val vai Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai Thr Thr Val His Glu Ala20 25 30
Gln Gly Pro Gly Gly Leu Leu Ala ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala vai Ile Ala Gly Ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai Val Ala Pro Ile ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Arg Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai Ser Pro Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro Ile vai Cys Ala Gly Ala Arg vai Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Leu Ala Glu Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190Lys Glu Asn vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 189<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 189
atgaacaaac cggtggtgat ccggcaactg gagcgggcgc cggctgatgc ggtggcggcg 60ctcgaaaaat atggtgtgtc caccgtgcat gaagctcagg gacgttgcgg actactcgct 120tcctacatgc gaccgattta tccgggtgcc gctattgccg ggtcggcggt cacggtgtca 180cttccgcccg gcgataacct gatgattcac gttgccgtcg aggtttgcca gtccggcgac 240atactcgtgg ttgcccccac ctcgccttgc tcggacggat acttcgggga gttgttggca 300acatctttgc gcgcccacgg cgtgaagggg cttgtcattg aggcaggatg ccgtgatgtt 360cgctcgctca ccgaaatgaa gttcccggtc tggagccgcg ccgtcagttc gcaaggcacc 420gtgaagtcta acctcggatc ggtgaatgtg ggcatagtct gtgcgggtgc acacattgac 480gctggcgatg tggtcgtggc agatgacgac ggtgtcgtgg cggtgaagcg cgcatccgcc 540caagaagtag ttggggcgtg cgaacaacgg gttcgcaagg aagaggcagc ccgtgagcgg 600ctggcgcggg gagagcttgg cctcgacatc tacggcttgc gcacacgaat cgcggaaatg 660ggtctcaagt atcaatga 678
<210> 190<211> 225<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 190
Met Asn Lys Pro vai vai Ile Arg Gln Leu Glu Arg Ala Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Ala Ile Ala Gly ser Ala vai Thr vai ser Leu Pro Pro Gly50 55 60Asp Asn Leu Met lie His Val Ala vai Glu vai Cys Gln ser Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Glu Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai Ser Ser Gln Gly Thr vai Lys Ser Asn130 135 140
Leu Gly ser vai Asn vai Gly lie vai Cys Ala Gly Ala His Ile Asp145 150 155 160
Ala Gly Asp vai vai vai Ala Asp Asp Asp Gly vai vai Ala vai Lys165 170 175
Arg Ala ser Ala Gln Glu vai vai Gly Ala Cys Glu Gln Arg vai Arg180 185 190
Lys Glu Glu Ala Ala Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Thr Arg lie Ala Glu Met Gly Leu Lys Tyr210 215 220
Gln225
<210> 191 <211> 678 <212> DNA <213> Desconhecido <220> <223> obtido a partir de amostras ambientais <400> 191 atgaacaaac cggtggtgat ccggcaactg gagcgggcgc cggctgatgc ggtggcggcg 60ctcgaaaaat atggtgtgtc caccgtgcat gaagctcagg gacgttgcgg actactcgct 120tcctacatgc gaccgattta tccgggtgcc gctattgccg ggtcggcggt cacggtgtca 180cttccgcccg gcgataacct gatgattcac gttgccgtcg aggtttgcca gtccggcgac 240atactcgtgg ttgcccccac ctcgccttgc tcggacggat acttcgggga gttgttggca 300acatctttgc gcgcccacgg cgtgaagggg cttgtcattg aggcaggatg ccgtgatgtt 360cgctcgctca ccgaaatgaa gttcccggtc tggagccgcg ccgtcagttc gcaaggcacc 420gtgaagtcta acctcggatc ggtgaatgtg ggcatagtct gtgcgggtgc acacattgac 480gctggcgatg tggtcgtggc agatgacgac ggtgtcgtgg cggtgaagcg cgcatccgcc 540caagaagtag ttggggcgtg cgaacaacgg gttcgcaagg aagaggcaac ccgtgagcgg 600ctggcgcggg gagagcttgg cctcgacatc tacggcttgc gcacacgaat cgcggaaatg 660ggtctcaagt atcaatga
678
<210> 192<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> C22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 192
Met Asn Lys Pro vai vai lie Arg Gln Leu Glu Arg Ala Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai Ser Thr vai His Glu Ala
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Gln Ser Gly Asp65 70 75 80
lie Leu vai vai Ala Pro Thr Ser Pro Cys ser Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly Val Lys Gly Leu vai100 105 110
Ile Glu Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai Ser Ser Gln Gly Thr vai Lys ser Asn130 135 140
Leu Gly ser vai Asn vai Gly Ile vai Cys Ala Gly Ala His Ile Asp145 150 155 160
Ala Gly Asp vai vai vai Ala Asp Asp Asp Gly vai vai Ala vai Lys165 170 175
Arg Ala Ser Ala Gln Glu Val vai Gly Ala Cys Glu Gln Arg vai Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Thr Arg lie Ala Glu Met Gly Leu Lys Tyr
20
25
30
210
215
220
Gln225<210> 193<211> 678<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 193
atgaatacac cggtggtagt ccggcaggtg gagcagccgc cagcaggtgc ggttgccaca 60ctggagaagt gtggggtgac aaccgtgcat gaggctcaag gacgttgtgg cctgcttgcg 120ccctacctgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgact 180ttgcctccgg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240attctcgtag tttcaccgac ctcggcttgc accgatggct acttcggtga gctgttggcc 300acatctctcc gtgcccacgg tgtgagaggg ctggtgatcg atgccggatg ccgtgatgtg 360cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccgtcagtcc gcagggcacc 420gtcaaggcca cgctgggatc ggtgaatgtg cccatcgtgt gcgcgggcgc actggtcgaa 480gctggtgatg ttatcgtcgc cgatgacgat ggcgtggtgg tggtgaggcg cgcgctggcc 540gaagaggtcg ccgcggcggc ggaacaaagg gttcagaaag agaatgtgac ccgcgagcgg 600cttgcacgcg gagagctcgg cctcgatatt tacgacattc gccaacggat cgcgcaactg 660ggccttaaat atctgtaa 678
<210> 194<211> 225<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 194
Met Asn Thr Pro Val vai vai Arg Gln vai Glu Gln Pro Pro Ala Gly1 5 10 15
Ala vai Ala Thr Leu Glu Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Leu Arg Pro lie Tyr Pro35 40 45
Gly Ala Ala lie Ala Gly ser Ala lie Thr vai Thr Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
lie Leu vai vai Ser Pro Thr Ser Ala Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala vai ser Pro Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro lie vai Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai vai vai Arg165 170 175
Arg Ala Leu Ala Glu Glu vai Ala Ala Ala Ala Glu Gln Arg vai Gln180 185 190
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp lie Arg Gln Arg Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 195<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 195
atgaatacac cggtggtagt ccggcaggtg gagcagccgc cagcaggtgc ggttgccaca 60ctggagaagt gtggggtgac aaccgtgcat gaggctcaag gacgttgtgg cctgcttgcg 120ccctacatgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgact 180ttgcctccgg gcgacaacct catgatccac Qttgcggtgg aggtctgcgg tccgggaaac 240attttggtgg tttcaccgac ctcggcttgc accgatggct acttcggtga gctgttggcc 300acctctctcc gtgctcacgg tgtgagaggg ctggtgatcg atgccggatg ccgtgatgtg 360cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccgtcagttc gcagggcacc 420gtcaaggcca cactgggatc ggtgaatgtg cccatcgtgt gcgcgggcgc actggtcgaa 480gctggtgatg tcatcgtcgc cgatgacgat ggagtggtgg tggtgaggcg cgcgctggcc 540gaagaggtcg ccgccgcggc ggaacaaagg gctcagaaag agaatgtgac ccgcgagcga 600ctggcgcgcg gagagctcgg cctcgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggccttaaat atccgtaa 678
<210> 196<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 196
Met Asn Thr Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Ala Gly1 5 10 15
Ala vai Ala Thr Leu Glu Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro lie Tyr Pro35 40 45
Gly Ala Ala lie Ala Gly Ser Ala lie Thr vai Thr Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai vai ser Pro Thr Ser Ala Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala vai Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn Val Pro lie vai Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai vai vai Arg165 170 175
Arg Ala Leu Ala Glu Glu vai Ala Ala Ala Ala Glu Gln Arg Ala Gln180 185 190
Lys Glu Asn vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Pro225
<210> 197<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 197
atgaataaac cggtggtaat ccggcaagtg gagcagccac cagcggacgc cgttgcagcattggagaagt atggcgtcac aaccgtgcat gaggtgcagg gacgctgtgg cctcctcgcgcactacgtgc gtccgattta cgcaggagct gcaatcgcag gttccgctgt tactgtgtcgttgcctcccg gcgacaacct catgattcat gttgctgtcg aggtctgcgg tcctggaaat 240attctggttg tttcacccac ctccccttgt acagacggct atttcggtga actgttggca 300acgtctttgc gcgctcacgg agtgaagggg cttgtgatcg atgccggatg ccgcgacgtt 360cgctcactga cggagatgaa attcccggtg tggagccggg ccatctgctc acaggggaca 420gtcaaggcta cactcggatc ggtcaatgtg cccatcatgt gcgcgggcgc actcgtcgaa 480gccggcgacg tcatcgtggc cgacgatgat ggagtggtgg ttgtgaagcg agcgatggcg 540attgacgtcg ccgcggccgc cgagcaaagg gttcacaaag agaatacgac ccgcgaacgg 600cttgcacgtg gagagcttgg gctcgatatt tacgagatgc gtcagaaaat cgtacaactg 660ggccttaagt attcctga 678
<210> 198<211> 225<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (197)...(200)
<223> Sítio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 198
Met Asn Lys Pro vai vai Ile Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai Thr Thr vai His Glu Val20 25 30
Gln Gly Arg Gys Gly Leu Leu Ala His Tyr vai Arg Pro lie Tyr Ala35 40 45
Gly Ala Ala Ile Ala Gly ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Lys Gly Leu Val100 105 110
lie Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala lie Cys Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro lie Met Cys Ala Gly Ala Leu vai Glu145 150 155 160Ala Gly Asp Val lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Met Ala lie Asp vai Ala Ala Ala Ala Glu Gln Arg vai His180 185 190
Lys Glu Asn Thr Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Glu Met Arg Gln Lys lie vai Gln Leu Gly Leu Lys Tyr210 215 220
ser225
<210> 199<211> 678<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 199
atgaacaagc ccgtggtggt gcgggacatc gagcggccgc cggcggatgc catcgcggcg 60ctcgaacggt acggtgtgtc cacggtgcac gaggcgcagg gccgttgcgg gctgctggcc 120ccttacatgc gtccgatcta tgcgggcgca gcgatcgctg gtcccgccgt tacagtttca 180cttccgccgg gagacaacct gatgatccac gtcgccgtcg aagtgtgccg tcccggagac 240atcctggttg tcacgccgac ctcgccgtgc accgacggct attttggaga gttgctcgcg 300acttcgctgg ctgcgcacgg ggtgaaagga ctggtcattg atgcgggatg ccgcgatgtt 360cgagcgttga ccgagatgaa atttcccgtc tggagccgcg ccgtgagttc gcagggaacg 420gtgaaggcta cacttgggtc ggtgaatgtg acgattgcat gcgcgggggc tacggttgag 480cccggtgacg taatcgtagc ggacgatgat ggcgtcgttg tggtgaaacg ggctgaggcg 540caagacgttg tcgccgcatc tgagcagaga gtgcgaaagg aagagggaac ccgtaaacgg 600ctcgcgcagg gcgaactcgg cttggatatt tacggcttgc gcgcgaagat cgcggacctc 660ggcctcaagt acttgtag 678
<210> 200<211> 225<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (151)...(154)
<223> sítio de N-glicosi 1 ação. Pró-sítio id = PS00001<400> 200
Met Asn Lys Pro Val vai vai Arg Asp lie Glu Arg Pro Pro Ala Asp1 5 10 15Ala lie Ala Ala Leu Glu Arg Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala vai Thr Val Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu Val Cys Arg Pro Gly Asp65 70 75 80
Ile Leu vai vai Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Thr lie Ala Cys Ala Gly Ala Thr vai Glu145 150 155 160
Pro Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai Val vai vai Lys165 170 175
Arg Ala Glu Ala Gln Asp vai vai Ala Ala Ser Glu Gln Arg vai Arg180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Gln Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys lie Ala Asp Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 201<211> 633<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 201
atgagcaacg atttgcggcg cttcggcgtc tcgacgctgc acgaggcgca aggacggcgc 60gggttgctcg cgtcatacat gcggccgatc tatccgggcg cgctggtcgc cggtccggcg 120gtaaccgtcc tcgtgccgcc aggcgacaac ctggtgatcc acgtcgcggt ggaagcgtgc 180gcgccgggcg acgtcctcgt cgtcgcgccg acgtcgccct gcacggacgg ctattttggc 240gagctgctgg cgacgtcttt acgcgctcgg aacgtggcgg gcctggtgat cgacgccggc 300tgccgggatg tccgtgcgct caccgagatg cggttcccgg tctggcgccg cgccatcagc 360gcgcagggga cggtcaaggc gacgctcggc tctctgaaca cgccgatcgt ctgtgccgga 420gcgctcgttg cccccggcga tgtcatcgtg gccgacgatg acggagtcgt cgtggtgaag 480cgggaggaaa tcgcggcggt gacgcaggcg gcggagcagc gcgtccgcaa ggaagagggt 540acgcgagcga ggctcgcaaa cggtgaactg ggtttggaca tctacggctt gcggcagaag 600ctggcggacc tgggcctgaa gtcgtcatcg tga 633
<210> 202<211> 210<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (6)...(158)
<223> Demetilmenaquinona metiltransferase<400> 202
Met ser Asn Asp Leu Arg Arg Phe Gly vai ser Thr Leu His Glu Ala1 5 10 15
Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Pro20 25 30
Gly Ala Leu Val Ala Gly Pro Ala vai Thr vai Leu vai Pro Pro Gly35 40 45
Asp Asn Leu vai Ile His vai Ala vai Glu Ala Cys Ala Pro Gly Asp50 55 60
vai Leu vai vai Ala Pro Thr ser Pro Cys Thr Asp Gly Tyr Phe Gly65 70 75 80
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Asn vai Ala Gly Leu vai85 90 95
Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu Met Arg Phe100 105 110
Pro Val Trp Arg Arg Ala lie ser Ala Gln Gly Thr vai Lys Ala Thr115 120 125
Leu Gly Ser Leu Asn Thr Pro lie Val Cys Ala Gly Ala Leu vai Ala130 135 140
Pro Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys145 150 155 160
Arg Glu Glu Ile Ala Ala vai Thr Gln Ala Ala Glu Gln Arg vai Arg165 170 175
Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Asn Gly Glu Leu Gly Leu180 185 190
Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ala Asp Leu Gly Leu Lys Ser195 200 205
Ser Ser210
<210> 203<211> 699<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 203
atgaccggca ttgtcgtcga gaccatcgag cgcgcgtccc tcgccgacat cgccgcgctg 60gccgagttcg gcgtcgccac catccacgag gcgcagggcc gcatcggtct cctcgcctcc 120accatgcgcc cgatctacgc gggtgccgca gccgccggca atgccgtcac cgtgtcggtt 180ccgcccggcg acaactggat gatccacgtg gccgtcgagc agtgccgcga gggcgacatc 240ctggtggtgg cccccaccag cccgaacgac aacggctact tcggcgaact gctggcctgc 300tcgctcaagt cgcgcggcgt gcgcggcctc atcatcgaag ccggctgccg cgacgtgaaa 360ccgctcaccg agatgaagtt ccccgtctgg tcccgcgccg tctcctccca aggcaccgtc 420aaggaaagcc tcggcgacgt gaatctgccg ctctcgatcg cgggccagct cgtcaacccc 480ggcgatgtca tcgtcgccga tgacgacggc gtggtcgtgg tcgcccgcag cgatgtgcgc 540tcagtcaccg ccaagtcgcg cgaacgcgaa gacaaggaag ccaaaaaccg ggtgcaactc 600caggccggcc agctcggcat tgacatctat ggcatgcgcg acaagctcaa ggccaaaggc 660ctgcgctacg tgaaaagcgc ggcggacctg aagggctaa 699
<210> 204<211> 232<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<400> 204
Met Thr Gly Ile vai vai Glu Thr lie Glu Arg Ala Ser Leu Ala Asp1 5 10 15
Ile Ala Ala Leu Ala Glu Phe Gly vai Ala Thr lie His Glu Ala Gln20 25 30
Gly Arg lie Gly Leu Leu Ala Ser Thr Met Arg Pro Ile Tyr Ala Gly35 40 45
Ala Ala Ala Ala Gly Asn Ala Val Thr vai ser vai Pro Pro Gly Asp50 55 60
Asn Trp Met lie His vai Ala Val Glu Gln Cys Arg Glu Gly Asp Ile65 70 75 80
Leu vai vai Ala Pro Thr ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu85 90 95Leu Leu Ala Cys Ser Leu Lys ser Arg Gly vai Arg Gly Leu lie lie100 105 110
Glu Ala Gly Cys Arg Asp vai Lys Pro Leu Thr Glu Met Lys Phe Pro115 120 125
vai Trp ser Arg Ala vai ser Ser Gln Gly Thr vai Lys Glu Ser Leu130 135 140
Gly Asp vai Asn Leu Pro Leu Ser lie Ala Gly Gln Leu vai Asn Pro145 150 155 160
Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Ala Arg165 170 175
Ser Asp vai Arg Ser vai Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys180 185 190
Glu Ala Lys Asn Arg vai Gln Leu Gln Ala Gly Gln Leu Gly Ile Asp195 200 205
Ile Tyr Gly Met Arg Asp Lys Leu Lys Ala Lys Gly Leu Arg Tyr vai210 215 220
Lys ser Ala Ala Asp Leu Lys Gly225 230
<210> 205<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 205
atgaacacac cggtggtagc aagacaagtg gagcagccac cagcggatgc aattgccgca 60ttggagaagt gtggagtgac aaccgtccat gaggctcagg gacgttgtgg cctccttgcg 120tcctacattc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360cgctctctga cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcaagggaca 420gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc aatggtcgag 480gctggtgatg tcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540caggagatcg ctgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600ctcgcacgtg gagatctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctcaaat atctctga 678
<210> 206<211> 225<212> PRT<213> Desconhecido<220>
<22Β> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (28)...(174)
<223> Demetilmenaquinona metiltransferase<400> 206
Met Asn Thr Pro vai vai Ala Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala lie Ala Ala Leu Glu Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Pro35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala lie Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala Val Glu vai Cys Gly Pro Gly Asn65 70 75 80
lie Leu vai vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai lie Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala lie Cys ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro Ile vai Cys Ala Gly Ala Met vai Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Leu Ala Gln Glu Ile Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn vai Thr Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 207<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 207
atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60ctcgaaaccc atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120tcctacatgc ggccgattta tcccggcgcc gcgattgccg ggtcggcggt cacggtgtcg 180cttccgcccg gcgataatct catgattcat gttgccgtgg aggtctgcca atccggcgac 240attctcgtgg ttgctcccac gtcgccttgt tcggacggtt acttcggtga actcctggca 300acctccctgc gggcgcacgg cgtcaggggg ctcgttatcg atgcaggttg ccgcgacgtt 360cgctcgctta ccgagatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggcacc 420gtgaaatcca ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480gccggcgatg tggtcgtcgc cgatgacgat ggcgtcgttg tggtggagcg agcacgcgcc 540cacgaagtag tcgctgcgtg cgaacaacgc attcgcaagg aagaggcaac tcgcgagcgg 600ctggcgcggg gagaactcgg actcgatatc tacggcttgc gcacaaaaat cgcggagatg 660ggtctcaagt atcagtga 678
<210> 208<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (151)...(154)
<223> Sitio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 208
Met Asn Lys Pro vai vai Ile Arg Gln vai Glu Arg Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Thr His Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Ala lie Ala Gly Ser Ala vai Thr Val Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His Val Ala vai Glu vai Cys Gln Ser Gly Asp65 70 75 80
lie Leu vai vai Ala Pro Thr ser Pro Cys Ser Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125Pro vai Trp Ser Arg Ala vai Ser Ser Gln Gly Thr vai Lys ser Thr130 135 140
Leu Gly Ser vai Asn vai Ser vai vai Cys Ala Gly Ala Arg Ile Glu145 150 155 160
Ala Gly Asp vai vai vai Ala Asp Asp Asp Gly vai vai vai vai Glu165 170 175
Arg Ala Arg Ala His Glu vai vai Ala Ala Cys Glu Gln Arg lie Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Lys Tyr210 215 220
Gln225
<210> 209<211> 678<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 209
atgaatacac cagtggtagt ccgacaggtg cagcagccac cagccgaaac ggtggccgcg 60ctggagaagt gtggggtgac aacggtgcat gaggctcagg gacgtgctgg cctgcttgcg 120tcctacatgc gcccgatcta cccgggagca gcgatcgctg gttccgctat cacggtgtct 180ttgcctcccg gcgacaacct catgatccac gttgcggtgg aggtctgcgg cccgggaaac 240atcctggtag tttcaccaac ctcgccttct acggatggct acttcggtga gctgttggca 300acatctctcc gtgcccacgg tgtgagaggg cttgtgatcg atgctggatg ccgtgatgtg 360cgctctttaa cagaaatgaa attccccgtc tggagccgcg ccatcaattc gcaggggaca 420gtcaagacca cacttggatc ggtgaatgtg cccatcgttt gcgcgggcgc actggtcgac 480gctggagatg tcatcgtcgc ggatgacgat ggagttgtag ttgttaagca ggcgatggcg 540cgagaggttg ccgcggcagc ggaacaaagg gttcgcaaag agaacctgac ccgcgaacga 600cttgcgcgcg gagaacttgg tctcgacatt tacgagatac gacaaaagat cgcgcaacta 660ggacttaagt atttgtaa 678
<210> 210<211> 225<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 210Met Asn Thr Pro vai vai vai Arg Gln vai Gln Gln Pro Pro Ala Glu1 5 10 15
Thr vai Ala Ala Leu Glu Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 BO
Gln Gly Arg Ala Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Ala Ile Ala Gly ser Ala Ile Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai vai Ser Pro Thr ser Pro ser Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala lie Asn Ser Gln Gly Thr vai Lys Thr Thr130 135 140
Leu Gly ser vai Asn vai Pro lie vai Cys Ala Gly Ala Leu vai Asp145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Gln Ala Met Ala Arg Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Glu lie Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 211<211> 702<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 211
gtgagcgccg tcatcaggaa cattccacgc tcgccgcccg agctcctcga tcgcttcaag 60ggcctcggcg ttgcgaccgt ctcggaagcg cagggccgca agggcctttt ggccccgtat 120atgcgcccga tctatccggg ggccgcgctg atcggcaatg cggtgacggc ctcggtcgcg 180cccggcgaca attggacgat ccatgtcgcc gtcgaagtct gccaggaagg cgacgcgctc 240gtcgtcgcgc ccacctcctt ctgcgaggac ggctatttcg gcgagctact cgccacgtct 300ctgcagcagc gcggtgtgcg cgggctcatt ctcgaagcag gctgccgcga cgtgcgcgag 360cttcaaagga tgaattttcc ggtttggtcg cgcgcaatct atgcgcaagg aactgtgaaa 420gagacggtgg gcgacgtgaa cctgccgctc cgctgcgcag gccagatcgt caatgccggc 480gatctcattg tcgccgacga cgacggcgtt tgcgtcgtgc cctatgccga tgtcgagaag 540gtcttgaacg cggcccgcga acgtgcggcg aaggaagaga ggaaccgtgc cgagttcgcc 600aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgccgc caagggcctc 660aaatatttcg acgacatcga ggcgtataag aaggcgaagt ga 702
<210> 212<211> 233<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 212
Met ser Ala vai Ile Arg Asn Ile Pro Arg ser Pro Pro Glu Leu Leu1 5 10 15
Asp Arg Phe Lys Gly Leu Gly vai Ala Thr vai Ser Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Ala Leu Ile Gly Asn Ala Val Thr Ala ser vai Ala Pro Gly Asp Asn50 55 60
Trp Thr Ile His vai Ala vai Glu vai Cys Gln Glu Gly Asp Ala Leu65 70 75 80
vai vai Ala Pro Thr ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Thr ser Leu Gln Gln Arg Gly vai Arg Gly Leu lie Leu Glu100 105 110
Ala Gly Cys Arg Asp vai Arg Glu Leu Gln Arg Met Asn Phe Pro vai115 120 125
Trp ser Arg Ala Ile Tyr Ala Gln Gly Thr vai Lys Glu Thr vai Gly130 135 140
Asp vai Asn Leu Pro Leu Arg Cys Ala Gly Gln Ile vai Asn Ala Gly145 150 155 160
Asp Leu Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Pro Tyr Ala165 170 175
Asp vai Glu Lys vai Leu Asn Ala Ala Arg Glu Arg Ala Ala Lys Glu180 185 190
Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly vai Leu Gly Leu Asp Leu195 200 205
Tyr Lys Tyr Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr Phe Asp210 215 220
Asp lie Glu Ala Tyr Lys Lys Ala Lys225 230
<210> 213<211> 690<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 213
atgagcgttg tcatcacgaa gattacgcgg ccggacccca aacatgtgga gatgctggct 60gctttcggtg tcgccaccat tcatgaggcg cagggccgca ccggcctgat gcagtcctac 120atgcgccccg tctatgccgg cgcccgtgcc gccggcacag ccgtcacggt ctcgctgccc 180cccgccgaca actggatgat ccatgtcgcc gtggagcagt gccgggaagg cgacattctc 240gtcgtcgcgc ccacttcgcc ctccgatgtc gggtatttcg gcgagctgct ggcgacctcg 300ctcgtcgccc gcggcgtccg cggcctcgtc attgaaggcg gctgccgcga tgtcagggcg 360ctgaccgaga tgcgcttccc ggtctggtcg cgcgccattt ccgcgcaggg caccgtcaag 420gaaacgctcg gctcggtgaa cgtgccgatc gtttgcgccg gcgcgcatat ccatcccggc 480gatttcattg ccgccgacga cgatggcgtt gtcgtggtgc gccgcagccg cgtcgccgag 540atcgccgccg ccgcgatggc gcgcgaagac aaggaaacaa ccgtccgcga gcgcctgaaa 600gccggagagc ttggcctcga catttacgga atgcgcccgc gtctcaagga aaagggcctc 660gtctggcgcg agacgccgga gaaggagtag 690
<210> 214<211> 229<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 214
Met Ser vai vai Ile Thr Lys lie Thr Arg Pro Asp Pro Lys His vai1 5 10 15
Glu Met Leu Ala Ala Phe Gly vai Ala Thr Ile His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Gln Ser Tyr Met Arg Pro vai Tyr Ala Gly Ala35 40 45
Arg Ala Ala Gly Thr Ala vai Thr vai ser Leu Pro Pro Ala Asp Asn50 55 60Trp Met Ile His vai Ala vai Glu Gln Cys Arg Glu Gly Asp lie Leu65 70 75 80
vai Val Ala Pro Thr Ser Pro ser Asp vai Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Thr ser Leu vai Ala Arg Gly vai Arg Gly Leu vai Ile Glu100 105 110
Gly Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe Pro vai115 120 125
Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro Ile vai Cys Ala Gly Ala His lie His Pro Gly145 150 155 160
Asp Phe Ile Ala Ala Asp Asp Asp Gly vai vai vai vai Arg Arg ser165 170 175
Arg vai Ala Glu Ile Ala Ala Ala Ala Met Ala Arg Glu Asp Lys Glu180 185 190
Thr Thr vai Arg Glu Arg Leu Lys Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Gly Met Arg Pro Arg Leu Lys Glu Lys Gly Leu vai Trp Arg Glu210 215 220
Thr Pro Glu Lys Glu225
<210> 215<211> 702<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 215
gtgagcgccg tcatcaggaa cattccacgc tcgccgctcg agctcctcga tcgcttcaag 60ggcctcggcg ttgcgaccgt ctcggaagcg cagggccgca agggcctttt ggcctcgtat 120atgcgcccga tctatccggg ggccgcgctg atcggcaatg cggtgacggc ctcggtcgcg 180cccggcgaca attggacgat ccatgtcgcc gtcgaagtct gccaggaagg cgacgcgctc 240gtcgtcgcgc ccacctcctt ctgcgaggac ggctatttcg gcgagctact cgccacgtct 300ctgcagcagc gcggtgtgcg cgggctcatt ctcgaagcag gctgccgcga cgtgcgcgag 360cttcaaagga tgaattttcc ggtttggtcg cgcgcaatct atgcgcaagg aactgtgaaa 420gagacggtgg gcgacgtgaa cctgccgctc cgctgcgcag gccagatcgt caatgccggc 480gatctcattg tcgccgacga cgacggcgtt tgcgtcgtgc cctatgccga tgtcgagaag 540gtcttgaacg cggcccgcga acgtgcggcg aaggaagaga ggaaccgtgc cgagttcgcc 600aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgccgc caagggcctc 660aaatatttcg acgacatcga ggcgtataag aaggcgaagt ga
<210> 216<211> 233<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 216
Met Ser Ala vai Ile Arg Asn lie Pro Arg Ser Pro Leu Glu Leu Leu1 5 10 15
Asp Arg Phe Lys Gly Leu Gly vai Ala Thr vai Ser Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Ala Leu lie Gly Asn Ala vai Thr Ala ser vai Ala Pro Gly Asp Asn50 55 60
Trp Thr Ile His vai Ala vai Glu vai Cys Gln Glu Gly Asp Ala Leu65 70 75 80
vai vai Ala Pro Thr Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Thr ser Leu Gln Gln Arg Gly vai Arg Gly Leu Ile Leu Glu100 105 110
Ala Gly Cys Arg Asp vai Arg Glu Leu Gln Arg Met Asn Phe Pro vai115 120 125
Trp Ser Arg Ala Ile Tyr Ala Gln Gly Thr vai Lys Glu Thr vai Gly130 135 140
Asp vai Asn Leu Pro Leu Arg Cys Ala Gly Gln lie vai Asn Ala Gly145 150 155 160
Asp Leu Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Pro Tyr Ala165 170 175
Asp Val Glu Lys vai Leu Asn Ala Ala Arg Glu Arg Ala Ala Lys Glu180 185 190
Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly vai Leu Gly Leu Asp Leu195 200 205
Tyr Lys Tyr Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr Phe Asp210 215 220
Asp Ile Glu Ala Tyr Lys Lys Ala Lys225 230<210> 217<211> 702<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 217
gtgagcgtgg tcatccgaaa cattccgcgc acgccgctcg cgctgctgga cagtttcaaa 60gggttcggcg ttgcgacgat ctcggaggcg cagggccgca agggcctcat ggcttcttat 120atgcgtccga tttatccggg agctgagctt gtcggcaatg cggtgacggc ctcggtcgcg 180cccggcgaca attggacgat ccatgtcgcg atcgaagtct gccaggaagg tgatgtgctc 240gtggtcgcgc ctgcctcgtt ttgcgaggat ggctatttcg gcgagcttct cgcgacttcg 300cttcagcagc gcggcgtgcg cgggctcatt ctcgaagccg gctgccgcga cgtacgcgcg 360cttcagaaga tgaattttcc ggtttggtcg cgcgcgattt tcgcacaagg aaccgtgaaa 420gagacggtcg gcgacgtcaa cctgccgctc cactgcgcgg gccagatcgt gcatggcggc 480gatctcatcg tcgccgatga tgacggcgtc tgcgtcgtgc cgcataccga tgtcgagaag 540gtcttgagcg cggcgcgcga acgcgcggcg aaggaggagc gaaaccgcgc cgagtttgcc 600aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgctca aaagggcctc 660aagtattacg acgacatcga agcctataac aaagcgaagt ga 702
<210> 218<211> 233<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 218
Met ser vai Val Ile Arg Asn Ile Pro Arg Thr Pro Leu Ala Leu Leu1 5 10 15
Asp ser Phe Lys Gly Phe Gly Val Ala Thr lie ser Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Met Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Glu Leu vai Gly Asn Ala Val Thr Ala Ser vai Ala Pro Gly Asp Asn50 55 60
Trp Thr Ile His vai Ala Ile Glu vai Cys Gln Glu Gly Asp vai Leu65 70 75 80
vai vai Ala Pro Ala Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Thr Ser Leu Gln Gln Arg Gly Val Arg Gly Leu Ile Leu Glu100 105 110Ala Gly Cys Arg Asp vai Arg Ala Leu Gln Lys Met Asn Phe Pro vai115 120 125
Trp Ser Arg Ala Ile Phe Ala Gln Gly Thr vai Lys Glu Thr vai Gly130 135 140
Asp vai Asn Leu Pro Leu His Cys Ala Gly Gln Ile vai His Gly Gly145 150 155 160
Asp Leu Ile vai Ala Asp Asp Asp Gly vai Cys vai Val Pro His Thr165 170 175
Asp vai Glu Lys vai Leu Ser Ala Ala Arg Glu Arg Ala Ala Lys Glu180 185 190
Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly vai Leu Gly Leu Asp Leu195 200 205
Tyr Lys Tyr Arg Glu Arg Leu Ala Gln Lys Gly Leu Lys Tyr Tyr Asp210 215 220
Asp Ile Glu Ala Tyr Asn Lys Ala Lys225 230
<210> 219<211> 672<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 219
atgagcgtgg tcgtgcagaa catcgaacgc gccgacgcgt catttgtggc aacgctcggc 60gagtgcggcg tggcgaccgt gcacgaggcg caaggtcgaa ctggcttgat gcgcccttac 120atgcgaccga tctacgccgg cgcccgcatc gccggaccgg cggtgacggt gtcgatcccg 180cccggcgaca actggatgat ccacgtcgcg gtcgagcagt gccgcgaggg cgatatcctc 240gtcgtggccc cgaccagccc gagcgaggac ggctatttcg gcgagttgct ggcgcgctcg 300ctgctcgcgc gcggcgtgag gggtcttgtc atcgaggccg gcgtccgcga cgtacgcgat 360ctcaccgaga tcaagttccc cgtatggtcc aaagcgatat cggcgcaagg cacggtgaag 420gagacgatcg gctcggtgaa tgtgccggtc gtatgtgccg gcgccgccat caatcccggc 480gatgtcatag tcgctgacga cgacggtgtc tgcgtcgtgt cacgcgaacg ggcggaagac 540gtcgccaagg ccgcgcgcgc ccgcgaagcc aaggaagcgg aaacgcgcaa gcggctgata 600tcaggcgagc tcggcctcga tatctacggc atgcgcgaga agctcgcggc gaaaggcctc 660aaatatgcct ga 672
<210> 220<211> 223<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaquinona metiltransferase<400> 220
Met Ser vai Val vai Gln Asn lie Glu Arg Ala Asp Ala Ser Phe vai1 5 10 15
Ala Thr Leu Gly Glu Cys Gly Val Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala35 40 45
Arg lie Ala Gly Pro Ala Val Thr vai Ser Ile Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala vai Glu Gln Cys Arg Glu Gly Asp Ile Leu65 70 75 80
vai vai Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Arg Ser Leu Leu Ala Arg Gly vai Arg Gly Leu vai Ile Glu100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu lie Lys Phe Pro vai115 120 125
Trp Ser Lys Ala lie ser Ala Gln Gly Thr vai Lys Glu Thr lie Gly130 135 140
ser vai Asn vai Pro vai vai Cys Ala Gly Ala Ala Ile Asn Pro Gly145 150 155 160
Asp Val Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Ser Arg Glu165 170 175
Arg Ala Glu Asp vai Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu180 185 190
Ala Glu Thr Arg Lys Arg Leu Ile Ser Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Ala210 215 220
<210> 221<211> 672<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 221
atgagcgtgg tcgtgcagaa catcgaacgc gccgacgcgt cttttgtggc aacgctcggc 60gagtgcggcg tggcgaccgt gcacgaggcg caaggtcgaa ccggcttgat gcgcccctac 120atgcgaccga tctacgccgg cgcccgcatc gccgggccgg cggtgacggt gtcgatccca 180cccggcgaca actggatgat ccacgtcgcg gtcgagcaat gccgcgacgg tgacatcctg 240gtcgtcgcgc cgaccagccc gagcgaggac ggctatttcg gcgagttgct ggcgcgctcg 300cttctcgcgc gtggcgtgag aggcctcgtc atcgaggccg gcgtccgcga cgtgcgcgac 360cttaccgaaa tcggatttcc cgtctggtcg aaggcgatct ccgcacaagg caccgtcaag 420gagacgctcg gcttggtgaa cgtgccggtt gtctgcgccg gcgctacggt caacccgggc 480gatgtcatcg tcgcggacga cgacggtgtg tgcgtggtgc cacgcggcaa tgccgaagag 540gtcgcgaagg ccgcccgcgc ccgcgaggca aaggaggcgg agacgagcaa gcggttgata 600gcaggtgagc tcggcctcga catctacggc atgcgcgaga agctggcggc caagggcctc 660aaatatgtct ga 672
<210> 222<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 222
Met Ser vai vai vai Gln Asn lie Glu Arg Ala Asp Ala Ser Phe vai1 5 10 15
Ala Thr Leu Gly Glu Cys Gly vai Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro lie Tyr Ala Gly Ala35 40 45
Arg Ile Ala Gly Pro Ala vai Thr vai Ser lie Pro Pro Gly Asp Asn50 55 60
Trp Met Ile His vai Ala Val Glu Gln Cys Arg Asp Gly Asp Ile Leu65 70 75 80
vai vai Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Arg Ser Leu Leu Ala Arg Gly vai Arg Gly Leu vai lie Glu100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu Ile Gly Phe Pro vai115 120 125
Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr vai Lys Glu Thr Leu Gly130 135 140
Leu vai Asn vai Pro vai vai Cys Ala Gly Ala Thr vai Asn Pro Gly145 150 155 160
Asp vai lie vai Ala Asp Asp Asp Gly vai Cys vai vai Pro Arg Gly165 170 175
Asn Ala Glu Glu vai Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu180 185 190Ala Glu Thr Ser Lys Arg Leu Ile Ala Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr vai210 215 220
<210> 223<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 223
atgaacgagc cgatcgtcgt tcggacgatc gcgcggccgt cggccgaggc gatcgcggcg 60ctgcagcggt acggcgtgtc gactgtgcat gaagcgcaag gacgacgcgg actgctcggg 120tctcgcttgc gaccgatcta cagcggcgcg gcgatcgccg gtccagcggt caccgtttcg 180ctgccgcctg gtgacaacct catgattcac gtcgccgtcg aggtgtgcca gcctggcgac 240gtgctcgtcg tggccccgac ctccccctgc acggacggct atttcggtga actgttggcc 300acgtcgtttc gcgcacgcgg cgtcgtcggc ctgatcatcg atgccggctg ccgcgacgtg 360cgcgcgttgt cggagatgcg ctttcccgtc tggagccgcg cgatcagcgc gcagggtacg 420gtgaaggcct cgttgggttc ggtgaacgtt gccgtcgtgt gtgggggagc gtccgtcaat 480ccaggcgatg cgatcgtggc cgacgatgat ggggtggtgg tcgtggcgcg caacgaggtg 540gaagcggtgg tgcaggcgtc ggagcagcgc atccggaagg aacaggcgac gcgcgagcgg 600ctggcgagcg gtgaactggg cctcgatatc tacggcctca ggaaaaaggt gtcggacctc 660gggctgaaat attcgtga 678
<210> 224<211> 225<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 224
Met Asn Glu Pro lie vai vai Arg Thr Ile Ala Arg Pro Ser Ala Glu1 5 10 15
Ala Ile Ala Ala Leu Gln Arg Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Gly ser Arg Leu Arg Pro lie Tyr Ser35 40 45
Gly Ala Ala lie Ala Gly Pro Ala vai Thr vai ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gln Pro Gly Asp65 70 75 80vai Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Phe Arg Ala Arg Gly vai vai Gly Leu lie100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Ser Glu Met Arg Phe115 120 125
Pro vai Trp ser Arg Ala lie Ser Ala Gln Gly Thr vai Lys Ala ser130 135 140
Leu Gly ser vai Asn vai Ala vai vai Cys Gly Gly Ala ser vai Asn145 150 155 160
Pro Gly Asp Ala lie vai Ala Asp Asp Asp Gly vai vai vai vai Ala165 170 175
Arg Asn Glu Val Glu Ala Val vai Gln Ala ser Glu Gln Arg Ile Arg180 185 190
Lys Glu Gln Ala Thr Arg Glu Arg Leu Ala Ser Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys vai Ser Asp Leu Gly Leu Lys Tyr210 215 220
ser225
<210> 225<211> 672<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 225
atgaacgttg tcgtccggaa tatcgagcgg gccgctgcgg atacgatcgc cgtgcttggc 60gaatgcggcg tcgcgacggt gcacgaggca cagggccgca gcggcctcat gcgtccctat 120atgcgaccga tctatacggg cgcgcgcatc gccggctcgg cggtcactgt gtcggtcccg 180ccgggcgaca actggatgat ccatgtcgcg gtcgaacaat gccacgacgg cgacgtcctc 240gtcgtggcgc cgaccagccc atgcgatgac ggctatttcg gcgagcttct ggcgcgctcg 300ctgcgggcgc acggcgtgag aggcctcgtg atcgaggcag gcgtgcgcga cgtgcgcgat 360ctcaccgaga tgcagttccc ggtctggtcg aaatcgatct ccgcgcaagg gacggtgaag 420gagacgatcg gctcggtgaa cgtgccggtc gtctgcgcgg gtgccgccgt caatccgggc 480gacgtcatcg tggccgacga cgatggcgtc tgcgttgtac cgcgaggcca ggcggcagtc 540gttgccgagg cggcacgcgc gcgcgaggcg aaggaggccg aggtccgcaa gcgcctggtt 600gccggggagc tcggtctcga catctacggc atgcgcgaac ggctggcggc gaagggcctg 660aagtatgtct ga 672
<210> 226<211> 223<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 226
Met Asn vai vai vai Arg Asn Ile Glu Arg Ala Ala Ala Asp Thr lie1 5 10 15
Ala vai Leu Gly Glu Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Ser Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Thr Gly Ala35 40 45
Arg Ile Ala Gly Ser Ala vai Thr Val Ser vai Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala vai Glu Gln Cys His Asp Gly Asp vai Leu65 70 75 80
vai vai Ala Pro Thr Ser Pro Cys Asp Asp Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Arg Ser Leu Arg Ala His Gly vai Arg Gly Leu vai lie Glu100 105 110
Ala Gly vai Arg Asp vai Arg Asp Leu Thr Glu Met Gln Phe Pro vai115 120 125
Trp ser Lys Ser Ile ser Ala Gln Gly Thr vai Lys Glu Thr lie Gly130 135 140
Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Ala vai Asn Pro Gly145 150 155 160
Asp vai Ile vai Ala Asp Asp Asp Gly vai Cys vai vai Pro Arg Gly165 170 175
Gln Ala Ala vai vai Ala Glu Ala Ala Arg Ala Arg Glu Ala Lys Glu180 185 190
Ala Glu vai Arg Lys Arg Leu Val Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Gly Met Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr vai210 215 220
<210> 227<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 227
atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgca 480cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600cttgcttcgg gggaactcgg cctggatatt tacggcctgc gaccgaagat tgcagacctc 660ggtctcaagt acttgtag 678
<210> 228<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (151)...(154)
<223> Sitio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 228
Met Asn Lys Pro vai vai Val Arg Asn lie Glu Arg Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala Ala lie Ala Gly Pro Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Arg Pro Gly Asp65 70 75 80
vai Leu vai vai Ala Pro Thr ser Pro Cys Thr Asp Gly Tyr1Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Glu Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu Met Lys Phe115 120 125Pro Val Trp ser Arg Ala vai ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Thr lie vai Cys Ala Gly Ala Ala vai Ala145 150 155 160
Pro Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Thr Glu Ala Gln Glu Val vai Thr Ala ser Glu Gln Arg Leu Arg180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala ser Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Pro Lys Ile Ala Asp Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 229<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 229
atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgca 480cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540caagaggccg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600cttgcttcgg gggaactcgg cctggatatt tacggcctgc gaccgaagat tgcagacctc 660ggtctcaagt acttgtag 678
<210> 230<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE<222> (151)...(154)
<22Β> Sitio de N-glicosilação. Pró-sitio id = PS00001<400> 230
Met Asn Lys Pro vai Val vai Arg Asn Ile Glu Arg Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Ala35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Arg Pro Gly Asp65 70 75 80
vai Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Ala Ala His Gly vai Lys Gly Leu vai100 105 110
lie Glu Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai Ser ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Thr Ile vai Cys Ala Gly Ala Ala vai Ala145 150 155 160
Pro Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Thr Glu Ala Gln Glu Ala vai Thr Ala ser Glu Gln Arg Leu Arg180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala ser Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Pro Lys Ile Ala Asp Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 231<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 231
atgaatgaac cggtggtaat ccggcaggtg gagcagccac cagcagacgc agttgccgcattggagaaat gtggcgtgac aaccgtccat gaagctcaag gacgttgtgg cctgcttgcgcactacatgc gtcccatttt cccgggagca accatcgcgg gttccgccgt caccgtgtct 180ctgcctcccg gtgacaacct catgatccac gttgcggtcg aagtctgcag gccgggaaac 240atcctggtcg tttcaccgac atcgccgtgc tcggatggct acttcggcga gctattggca 300acttctctgc gtgctcacgg tgtaagaggg cttgtgatcg acgccggatg cagggacgtc 360cgctcgctga ctgagatgaa atttcccgtc tggagccgcg ccatcagttc gcagggtacc 420gtcaaagcca cgctcggatc ggtgaatgtg ccgatcacgt gcgcgggcgc gttagtcgac 480gcaggtgatg tcattgtcgc tgacgatgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540caagaggtcg ctgccgcggc ggagcaaagg gttcgcaaag agaacgcgac ccgcgaacga 600cttgcacgtg gagagctagg actcgatatt tacgacatgc gccagaagat cgcgcaactg 660ggccttaagt atcggtga 678
<210> 232<211> 225<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 232
Met Asn Glu Pro vai vai Ile Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro lie Phe Pro35 40 45
Gly Ala Thr lie Ala Gly Ser Ala vai Thr vai ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Arg Pro Gly Asn65 70 75 80
Ile Leu vai vai Ser Pro Thr ser Pro Cys Ser Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala lie Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro Ile Thr Cys Ala Gly Ala Leu vai Asp145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Gln Ala Gln Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Arg225
<210> 233<211> 678<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 233
atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60ctcgaaacct atggcgtgtc caccgtgcac gaggcccagg ggcgttgcgg gctgctcgct 120tcctacatgc ggccgattta tggcggcgcc ctgattgccg ggtcggcggt cacggtgtca 180cttccgcccg gcgataatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240attctcgtgg ttgctcccac gtcgccttgt tcggacggtt acttcggtga acttctggca 300acctccctgc gggcacacgg cgtcaagggg ctcgtgattg atgcgggttg ccgcgacgtt 360cggtcgctta ccgaaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggaacc 420gtgaaatcga ctctcggatc ggtgaatgta agcgtcgttt gcgccggagc acgcatcgaa 480gccggcgatg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggcgcg ggcacgcgcc 540cacgaagtag tcgcggcgtg cgaacaacgc attcgcaagg aagaggcaac ccgcgaacgg 600ctggcgcggg gagaactcgg actcgatatc tacggcttgc gcacaaaaat cgcggagatg 660ggtctcgagt atcaatga 678
<210> 234<211> 225<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (151)...(154)
<223> Sítio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 234
Met Asn Lys Pro vai vai lie Arg Gln vai Glu Arg Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Thr Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gly35 40 45
Gly Ala Leu Ile Ala Gly Ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gln ser Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala vai ser Ser Gln Gly Thr vai Lys Ser Thr130 135 140
Leu Gly ser vai Asn vai ser vai vai Cys Ala Gly Ala Arg Ile Glu145 150 155 160
Ala Gly Asp vai vai Val Ala Asp Asp Asp Gly Val vai vai vai Ala165 170 175
Arg Ala Arg Ala His Glu vai vai Ala Ala Cys Glu Gln Arg lie Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Glu Tyr210 215 220
Gln225
<210> 235<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 235
atgaatgaac cggtggtaat ccggcaggtg gagcagccac cagcagacgc agttgccgca 60ttggagaaat gtggcgtgac aaccgtccat gaagctcaag gacgttgtgg cctgcttgcg 120cactacatgc gtcccatttt cccgggagca accatcgcgg gttccgccgt caccgtgtct 180ctgcctcccg gtgacaacct catgatccac gttgcggtcg aagtctgcag gccgggaaac 240atcctggtcg tttcaccgac atcgccgtgc tcggatggct acttcggcga gctattggca 300acttctctgc atgctcacgg tgtaagaggg cttgtgatcg acgccggatg cagggacgtc 360cgctcgctga ctgagatgaa atttcccgtc tggagccgcg ccatcagttc gcagggtacc 420gtcaaagcca cgctcggatc ggtgaatgtg ccgatcacgt gcgcgggcgc gttagtcgac 480gcaggtgata tcattgtcgc tgacgatgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540caagaggtcg ctgccgcggc ggagcaaagg gttcgcaaag agaacgcgac ccgcgaacga 600cttgcacgtg gagagctagg actcgatatt tacgacatgc gccagaagat cgcacaactg 660ggccttaagt atcggtga 678
<210> 236<211> 225<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona meti Itransferase<400> 236
Met Asn Glu Pro vai vai Ile Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro35 40 45
Gly Ala Thr lie Ala Gly ser Ala vai Thr vai ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Arg Pro Gly Asn65 70 75 80
Ile Leu vai vai Ser Pro Thr Ser Pro Cys ser Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu His Ala His Gly vai Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala Ile Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro Ile Thr Cys Ala Gly Ala Leu vai Asp145 150 155 160
Ala Gly Asp lie lie vai Ala Asp Asp Asp Gly vai Val vai vai Lys165 170 175
Arg Ala Gln Ala Gln Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205Asp Ile Tyr Asp Met Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Arg225
<210> 237<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 237
atgaacaagc ccgtggtggt ccggcacgtg gagcagccac ctgctgatgc ggtagccgct 60ttggaaaagt atggcgtgtc aaccgttcat gaggcccagg gacggtcggg tcttctcgcc 120agttacctgc ggccgatctt tgccggcgcc tcaatcgcag ggccggcggt tacggtctcg 180ctgccacctg gggacaattt gatgatccac gtcgccgtcg aggtgtgcac gcctggaagc 240atccttgtcg tcgccccaac ctccccttgt acggacggct atttcggaga gctgctggcg 300acctcgcttc gcgcacacgg cgtaaagggg ttggtcatcg atgccgggtg tcgcgacgtt 360aggtctttaa cggaaatgaa ctttcccgtt tggagccgct cggtcagttc gcaaggaacc 420gtcaaagcga cgttgggatc ggtgaatgta ggcgtcgtct gcgccggtgc atacgtcgag 480ccaggcgacg tgatcgtcgc ggacgatgac ggagttgtag tcgtgaagcg ggcggctgcg 540cccgaggctg tcgtcgcctc cgaagcgaga gttcgtaaag aagccgcgac gcgcgagcgt 600ctctcccgcg gagagcttgg ccttgacatc tacggcctac gttcaaagat tgcggacctt 660ggcctcgagt atctgtga 678
<210> 238<211> 225<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 238
Met Asn Lys Pro vai Val Val Arg His vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Ser Gly Leu Leu Ala ser Tyr Leu Arg Pro Ile Phe Ala35 40 45
Gly Ala Ser Ile Ala Gly Pro Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Thr Pro Gly Ser65 70 75 80lie Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Asn Phe115 120 125
Pro vai Trp ser Arg Ser Val Ser ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Gly vai vai Cys Ala Gly Ala Tyr vai Glu145 150 155 160
Pro Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Ala Ala Pro Glu Ala vai vai Ala Ser Glu Ala Arg vai Arg180 185 190
Lys Glu Ala Ala Thr Arg Glu Arg Leu Ser Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg ser Lys Ile Ala Asp Leu Gly Leu Glu Tyr210 215 220
Leu225
<210> 239 <211> 678 <212> DNA <213> Desconhecido <220> <223> Obtido a partir de amostras ambientais <400> 239 atgaacaaac cggtggtgat ccggcaagcg gagcggccgc cggctgacgc ggtggcggcg 60ctcgcaacct atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120tcctacatgc ggccgattta tcacggcacc gcgattgccg ggtcggcggt cacggtgtcc 180cttccgcccg gcgacaatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240attctcgtgg tcgctcccac gtcgccctgt tccgacggtt acttcggcga actcctggcc 300acctctctgc gggcgcacgg cgtcaagggg ctcgttattg atgcgggttg ccgcgacgtt 360cgctcgctca gcgcaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggcacc 420gtgaaatcta ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480gccggcgacg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggagcg agcatccgcc 540cacgaagtag tcgtggcgtg cgaacaacgc cttcgcaagg aagaggcaac tcgcgagcgc 600ctggcgcggg gagaactcgg actcgacatc tacggcttgc gcacaaaagt cgcggagatg 660ggtctcaagt atcaatga 678<210> 240 <211> 225<212> PRT
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (151)...(154)
<223> Sítio de N-glicosi 1 ação. Pró-sítio id = PS00001<400> 240
Met Asn Lys Pro vai vai Ile Arg Gln Ala Glu Arg Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Ala Thr Tyr Gly Val ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr His35 40 45
Gly Thr Ala lie Ala Gly ser Ala vai Thr vai ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His Val Ala vai Glu vai Cys Gln ser Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Ser Ala Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai ser Ser Gln Gly Thr vai Lys ser Thr130 135 140
Leu Gly ser vai Asn vai ser vai Val Cys Ala Gly Ala Arg Ile Glu145 150 155 160
Ala Gly Asp vai Val vai Ala Asp Asp Asp Gly vai vai vai Val Glu165 170 175
Arg Ala Ser Ala His Glu vai Val vai Ala Cys Glu Gln Arg Leu Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys vai Ala Glu Met Gly Leu Lys Tyr210 215 220
Gln
225<210> 241<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 241
atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60ctcgcaacct atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120tcctacatgc ggccgattta tcccggcacc gcgattgccg ggtcggcggt cacggtgtcc 180cttccgcccg gcgacaatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240attctcgtgg tcgctcccac gtcgccttgt tcggacggtt acttcggcga actcctggcc 300acctctctgc gggcgcacga cgtcaagggg ctcgttattg atgcgggttg ccgcgacgtt 360cgctcgctca gcgcaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaagcacc 420gtgaaatcta ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480gccggcgacg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggagcg agcatccgcc 540cacgaagtag tcgcggcgtg cgaacaacgc cttcgcaagg aagaggcaac tcgcgagcgc 600ctggcgcggg gagaactcgg actcgacatc tacggcttgc gcacaaaagt cgcggagatg 660ggtctcaagt atcaatga 678
<210> 242<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<220>
<221> SITE
<222> (151)...(154)
<223> sitio de N-glicosi!ação. Pró-sitio id = PS00001<400> 242
Met Asn Lys Pro vai vai lie Arg Gln vai Glu Arg Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Ala Thr Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Thr Ala lie Ala Gly Ser Ala vai Thr vai ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His Val Ala vai Glu vai Cys Gln Ser Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr ser Pro Cys ser Asp Gly Tyr Phe Gly85 90 95Glu Leu Leu Ala Thr Ser Leu Arg Ala His Asp vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Ser Ala Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala vai Ser Ser Gln Ser Thr vai Lys ser Thr130 135 140
Leu Gly ser vai Asn Val Ser vai vai Cys Ala Gly Ala Arg lie Glu145 150 155 160
Ala Gly Asp vai vai Val Ala Asp Asp Asp Gly vai vai Val vai Glu165 170 175
Arg Ala Ser Ala His Glu vai vai Ala Ala Cys Glu Gln Arg Leu Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys vai Ala Glu Met Gly Leu Lys Tyr210 215 220
Gln225
<210> 243<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 243
atgaacagac ctgtggttgt ccgggaggtg gagcggccgc cggcagatgc tgtgacagcg 60ctcgagcagt acggggtatc gacggtgcat gaagctcaag ggcgttgcgg gttactcgca 120tcgtatatgc ggccgattta tgccggagcg gccatcgctg gtcccgccgt gactgtttct 180ctacctccgg gagacaactt gatgattcac gtggcggtcg aggtctgccg tccgggagac 240atcctcgttg tggcgccgac gtcgccgtgt acggatggct attttggaga gctgcttgca 300acttcactcc gagcacatgg cgtgaaagga cttgtgatcg atgcgggatg tcgcgatgtt 360cgctcgctga ctgagatgaa gtttcccgtg tggagtcgcg cggtgagttc gcagggaacg 420gtgaaggcga cgctcggatc agtaaatgtg agtatcgtgt gcgccggcgc actcgtcgaa 480gccggcgatg tcatcatcgc ggatgacgat ggagccgtag ttgtgaggag gacagccgcg 540aaagacgtgg tcgcggcgtc tgaacagaga gtgcgaaaag aagaggcgac gcgaaggcgg 600cttgcgcaag gcgaactcgg tctggacatc tacgggttgc gcgcgaaaat cgcggacctc 660ggtctcaagt acctgtaa 678
<210> 244<211> 225<212> PRT
<213> Desconhecido<220><223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<220>
<221> SITE
<222> (151)...(154)
<223> Sitio de N-glicosilação. Pró-sitio id = PS00001<400> 244
Met Asn Arg Pro vai vai vai Arg Glu vai Glu Arg Pro Pro Ala Asp1 5 10 15
Ala vai Thr Ala Leu Glu Gln Tyr Gly vai ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala35 40 45
C
Gly Ala Ala Ile Ala Gly Pro Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Arg Pro Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala Val Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Ser Ile vai Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp Val Ile Ile Ala Asp Asp Asp Gly Ala vai vai Val Arg165 170 175
Arg Thr Ala Ala Lys Asp vai vai Ala Ala ser Glu Gln Arg vai Arg180 185 190
Lys Glu Glu Ala Thr Arg Arg Arg Leu Ala Gln Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 245<211> 678<212> DNA<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 245
atgaacaagt ccgtggtggt tcgcaacgtc gagcagcctc ctgccgatgc catggccgcg 60ctcgaaaaat atggcgtttc caccgttcac gaagcgcaag gccgctgcgg cttgctcgcc 120tcttacatgc gcccaatttt cgggggtgcc tccgtcgccg gccccgcggt caccgtctcc 180gtgccgcccg gcgacaacct catgattcac gtcgctgtag aagtctgccg cccgggagac 240attctcgtcg tagcccccac atcgcgctgc accgacggct acttcggcga actactagcc 300acttcgttgc gcgcccacgg cgtcaaaggc ctcgtcatcg atgccggttg ccgcgacgtc 360cgctccttga ccgaaatgaa atttcccgtc tggagccgcg ccatcagttc gcaaggcacc 420gtcaaatcca ctgtgggctc ggtaaacgtc cccgtcgtgt gtgcgggcgc actcatcgca 480cccggcgacg tcatggtcgc ggatgacgat ggcgttgtcg tcgtgcagcg cgccgccgcc 540cgcgacgtcg tcgccgcctc ggaacaaagg attcgcaagg aagaagccac acgtgagcgt 600ctggtgcgcg gtgaactcag cctcgatatc tacggcctgc gcgcaaaact caccgaattg 660ggtctcacgt acttgtag 678
<210> 246<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE<222> (2)...(5)
<223> Sitio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 246
Met Asn Lys Ser vai vai vai Arg Asn vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Met Ala Ala Leu Glu Lys Tyr Gly vai ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Gly35 40 45
Gly Ala Ser vai Ala Gly Pro Ala Val Thr vai Ser vai Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu Val Cys Arg Pro Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Arg Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala Ile Ser Ser Gln Gly Thr vai Lys Ser Thr130 135 140
vai Gly Ser Val Asn vai Pro Val vai Cys Ala Gly Ala Leu lie Ala145 150 155 160
Pro Gly Asp Val Met Val Ala Asp Asp Asp Gly vai vai vai vai Gln165 170 175
Arg Ala Ala Ala Arg Asp vai vai Ala Ala Ser Glu Gln Arg lie Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu vai Arg Gly Glu Leu Ser Leu195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Leu Thr Glu Leu Gly Leu Thr Tyr210 215 220
Leu225
<210> 247<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 247
gtgacgggtc cgatcgtcgt tcgcaccatc gacagaccga tggccgatgt cgtcgccgcg 60ctgcagcgcc atggcgtctc gacggttcac gaagcacaag ggcgacgggg actgctcgcg 120tcctgcgtgc ggccgatcta tgtgggcgcc gtgattgcgg gtcctgccgt caccgtctcg 180ctgccacctg gcgacaacct gatgattcac gtcgcggtgg agatgtgtca gcccggcgat 240gtcctcgtcg tcgccccgac ctctccgtgc accgacggct atttcggcga actgctggcg 300acctcattgc acgcccgcgg cgtcacggga ctcatcatcg atgccggctg ccgggacgtt 360cgcgccttga cggacatgcg atttccggtt tggagccgcg cgatcagcgc gcagggcacc 420gtcaagtcaa cgctcggatc agtgaacgtg ccggtggtgt gcgccggagc gttggtccac 480gcgggcgacg ccatcgtggc ggatgacgat ggcgtggtgg tggtgagacg ggaagaggcg 540gggaccgtgt cggaggcgtg cgcggagcgg gcgcgcaagg aagaggccac gagggaacgg 600ctcgcgcgag gcgagcttgg tctcgatatc tacggcctgc gaaaaaaact caccgacctc 660ggcctgaagt attcgtag 678
<210> 248<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 248
Met Thr Gly Pro Ile Val vai Arg Thr Ile Asp Arg Pro Met Ala Asp1 5 10 15
vai vai Ala Ala Leu Gln Arg His Gly vai Ser Thr vai His Glu Ala20 25 BO
Gln Gly Arg Arg Gly Leu Leu Ala Ser Cys Val Arg Pro Ile Tyr vai35 40 45
Gly Ala vai Ile Ala Gly Pro Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu Met Cys Gln Pro Gly Asp65 70 75 80
vai Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu His Ala Arg Gly Val Thr Gly Leu Ile100 105 110
lie Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Thr Asp Met Arg Phe115 120 125
Pro vai Trp Ser Arg Ala Ile ser Ala Gln Gly Thr vai Lys ser Thr130 135 140
Leu Gly Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu vai His145 150 155 160
Ala Gly Asp Ala Ile vai Ala Asp Asp Asp Gly vai vai vai vai Arg165 170 175
Arg Glu Glu Ala Gly Thr Val ser Glu Ala Cys Ala Glu Arg Ala Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Leu Thr Asp Leu Gly Leu Lys Tyr210 215 220
Ser225
<210> 249<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 249
atgaacaagt ccgtggtggt tcgcaacgtc gagcagcctc ctgccgatgc catggccgcgctcgaaaaat atggcgtttc caccgttcac gaagcgcaag gccgctgcgg cttgctcgcctcttacatgc gcccaatttt cgggggtgcc tccgtcgccg gccccgcggt caccgtctcc 180gtgccgcccg gcgacaacct catgattcac gtcgctgtag aagtctgccg cccgggagac 240attctcgtcg tagcccccac atcgccctgc accgacggct acttcggcga actactagcc 300acttcgttgc gcgcccacgg cgtcaaaggc ctcgtcatcg atgccggttg ccgcgacgtc 360cgctccttga ccgaaatgaa atttcccgtc tggagccgcg ccatcagttc gcaaggcacc 420gtcaaatcca ctgtgggctc ggtaaacgtc cccgtcgtgt gtgcgggcgc actcatcgca 480cccggcgacg tcatggtcgc ggatgacgat ggcgttgtcg tcgtgcagcg cgccgccgcc 540cgcgacgtcg tcgccgcctc ggaacaaagg attcgcaagg aagaagccac acgtgagcgt 600ctggtgcgcg gtgaactcgg cctcgatatc tacggcctgc gcgcaaaact caccgaattg 660ggtgtcacgt acttgtag 678
<210> 250<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE<222> (2)...(5)
<223> Sitio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 250
Met Asn Lys ser Val vai Val Arg Asn vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Met Ala Ala Leu Glu Lys Tyr Gly vai ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala ser Tyr Met Arg Pro lie Phe Gly35 40 45
Gly Ala Ser vai Ala Gly Pro Ala Val Thr vai Ser vai Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Arg Pro Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala lie Ser Ser Gln Gly Thr vai Lys Ser Thr130 135 140vai Gly Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu lie Ala145 150 155 160
Pro Gly Asp vai Met vai Ala Asp Asp Asp Gly vai vai vai vai Gln165 170 175
Arg Ala Ala Ala Arg Asp vai vai Ala Ala ser Glu Gln Arg lie Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu vai Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Leu Thr Glu Leu Gly vai Thr Tyr210 215 220
Leu225
<210> 251<211> 693<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 251
atgaacaagc cggcattcgt tcgccccgta gttgttcgca atgtcgagca accttctgcc 60gacgcggtag ccgcgctcga aaaatatggc gtctcgaccg ttcatgaagc gcagggccgc 120tgtggcttgc tcgcttcctg tatccgcccg attttcgcgg gcgccgccgt cgccggtccc 180gtggtcaccg tttccgtgcc gccaggggac aacctgatga ttcacgtcgc agtggaagtc 240tgccgcccgg gagatatcct cgtcgtagcc ccaacgtctc cttgcaccga cggctacttc 300ggcgaactat tggccacttc gcttcgcgcg cacggcgtca agggcttgat tattgacgcc 360ggctgccgtg acgtccgcgc cctcaccgaa atgaaatttc ccgtctggag ccgcgccgtc 420agttcgcaag gcactgtcaa atccacgtta ggctcggtga atgtttcagt cgtctgtgcc 480ggcgcactgg tcgcacccgg cgacgtcatc gtcgccgatg acgacggagt ggtcgtcgtc 540cagcgcgctg ccgcccgcga ggtagtcgcc gccgcagaac aaaggattcg caaggaagaa 600gccactcgcg aacgcctcgc gcgcggtgaa ctcggtctcg atatctacag cctgcgcgca 660aaactcaccg aactcggcct cacctacttg tga 693
<210> 252<211> 230<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (27)...(179)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (156)...(159)
<223> Sitio de N-glicosilação. Pró-sitio id = PS00001<400> 252Met Asn Lys Pro Ala Phe vai Arg Pro vai vai vai Arg Asn vai Glu1 5 10 15
Gln Pro Ser Ala Asp Ala vai Ala Ala Leu Glu Lys Tyr Gly vai ser20 25 30
Thr vai His Glu Ala Gln Gly Arg Cys Gly Leu Leu Ala ser Cys lie35 40 45
Arg Pro lie Phe Ala Gly Ala Ala vai Ala Gly Pro vai vai Thr Val50 55 60
Ser vai Pro Pro Gly Asp Asn Leu Met Ile His vai Ala vai Glu vai65 70 75 80
Cys Arg Pro Gly Asp Ile Leu Val vai Ala Pro Thr Ser Pro Cys Thr85 90 95
Asp Gly Tyr Phe Gly Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly100 105 110
vai Lys Gly Leu Ile Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Leu115 120 125
Thr Glu Met Lys Phe Pro vai Trp Ser Arg Ala vai Ser Ser Gln Gly130 135 140
Thr vai Lys Ser Thr Leu Gly Ser vai Asn vai Ser vai vai Cys Ala145 150 155 160
Gly Ala Leu vai Ala Pro Gly Asp vai Ile vai Ala Asp Asp Asp Gly165 170 175
vai vai vai vai Gln Arg Ala Ala Ala Arg Glu vai vai Ala Ala Ala180 185 190
Glu Gln Arg lie Arg Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg195 200 205
Gly Glu Leu Gly Leu Asp lie Tyr ser Leu Arg Ala Lys Leu Thr Glu210 215 220
Leu Gly Leu Thr Tyr Leu225 230
<210> 253<211> 702<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 253
atgagcggta tcgtcgtcca ggacttcgag cgcgcatcgc tcgccgacat caaggcgctc 60
gccgagttcg gcgtcgccac gatccacgag gcgcagggcc gcgttggcct gctcgcgtcg 120
tacatgcgcc cgatttatgc gggagctgca gccgccggca atgccgtcac cgtgtcggtg 180
ccgccgggcg acaactggat gatccacgtg gcggtggagg tgtgccgcga gggcgacatc 240ctcgtggtgg cgccgacctc gccaaacgac aacggctact tcggcgagct gctggcgtct 300tcactgaaga gccgcggtgt gcgtgggctc gtcatcgagg ccggatgccg cgacgtgaag 360cccctcaccg acatgaaatt cccggtgtgg tcgcgcgccg tgtccgcgca agggacagtc 420aaggagagcc tcggcgatgt gaacctcccg cttgtcattg ccgggcagac ggtgaacccc 480ggcgacgtga tcgtggctga cgacgacggc gttgtcatcg ttggccgcag cgaggtgcgc 540gccgtgacga ccaaatcgcg cgagcgcgag gagaaggagg ccaagaaccg cttgcagctc 600accagcggcc agctcggcat cgacatctat ggtatgcgcg gcaagctcaa ggaaaagggg 660ctgcgctacg tgaagaacgc gagcgagttg aaggccaaat aa 702
<210> 254<211> 233<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (21)...(173)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (229)...(232)
<223> sitio de N-glicosi 1 ação. Pró-sítio id = PS00001<400> 254
Met Ser Gly Ile vai vai Gln Asp Phe Glu Arg Ala Ser Leu Ala Asp1 5 10 15
lie Lys Ala Leu Ala Glu Phe Gly vai Ala Thr Ile His Glu Ala Gln20 25 30
Gly Arg vai Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly35 40 45
Ala Ala Ala Ala Gly Asn Ala vai Thr vai Ser vai Pro Pro Gly Asp50 55 60
Asn Trp Met Ile His vai Ala vai Glu vai Cys Arg Glu Gly Asp lie65 70 75 80
Leu vai vai Ala Pro Thr Ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu85 90 95
Leu Leu Ala ser ser Leu Lys Ser Arg Gly vai Arg Gly Leu vai Ile100 105 110
Glu Ala Gly Cys Arg Asp vai Lys Pro Leu Thr Asp Met Lys Phe Pro115 120 125
vai Trp ser Arg Ala vai Ser Ala Gln Gly Thr vai Lys Glu Ser Leu130 135 140
Gly Asp vai Asn Leu Pro Leu vai lie Ala Gly Gln Thr vai Asn Pro145 150 155 160Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai Ile vai Gly Arg165 170 175
Ser Glu vai Arg Ala vai Thr Thr Lys ser Arg Glu Arg Glu Glu Lys180 185 190
Glu Ala Lys Asn Arg Leu Gln Leu Thr ser Gly Gln Leu Gly Ile Asp195 200 205
Ile Tyr Gly Met Arg Gly Lys Leu Lys Glu Lys Gly Leu Arg Tyr Val210 215 220
Lys Asn Ala Ser Glu Leu Lys Ala Lys225 230
<210> 255<211> 681<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 255
atgaacgatc cgatcgtcgt tcgacagatc gacagaccat caggcccttc ggtcgatagt 60ctgcgtcgct ttggcgtctc gaccgtgcac gaggcacagg ggcgccgcgg gctgctcgcg 120tcgcacatgc ggccgattta cgccggtgcg ctcgtcgctg gtccagcgat cactgtcctg 180gtgccgccgg gcgacaacct gatgattcac gtcgcggtgg aggtgtgcca gccgggtgac 240gttctcgttg ttgctccgac gtcgccgtgc accgacggct atttcggcga gctgctggcg 300acctcgctgc gggctcgtgg cgtggcggga ctcatcatcg acgccggttg ccgggatgtt 360cgggcgctga gcgagatgcg atttcccgtc tggagtcgcg cgatcagcgc gcagggtacc 420gtcaaggcga cgctgggttc ggtgaacgtg cccctggtgt gcgccggggc gctggtcgag 480gcgggagaca ttgtcgtcgc cgacgatgac ggcgtcgtga tcgtcaagaa ggatcaggtc 540gatgcggtca ctcaggcagc cgaacagcgc gtgcgcaaag aagaggacac acgggcgcgg 600ttggcgcgag gcgagctcgg cctggacatc tacgccttgc gcaagaagct gtcggacctc 660gggctgaagt cgtcgtcgtg a 681
<210> 256<211> 226<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 256
Met Asn Asp Pro lie vai vai Arg Gln lie Asp Arg Pro Ser Gly Pro1 5 10 15
Ser vai Asp ser Leu Arg Arg Phe Gly vai ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala ser His Met Arg Pro lie Tyr Ala35 40 45
Gly Ala Leu vai Ala Gly Pro Ala lie Thr vai Leu vai Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gln Pro Gly Asp65 70 75 80
vai Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala Arg Gly vai Ala Gly Leu Ile100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Ser Glu Met Arg Phe115 120 125
Pro vai Trp ser Arg Ala Ile Ser Ala Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser Val Asn vai Pro Leu Val Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp lie vai vai Ala Asp Asp Asp Gly vai vai lie vai Lys165 170 175
Lys Asp Gln Val Asp Ala Val Thr Gln Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Ala Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser210 215 220
Ser Ser225
<210> 257<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 257
atgaacgatc ccttcgtcgt tcgacaggtg gaccgaccgt cagctgcgtc gatcgacgat 60
ctgcggcgat tcggcgtctc gaccgtgcac gaggcccagg ggcgccgcgg gttgctcgca 120tcgtacatgc ggccgatcta caccggtgcg ctcgtcgccg gtcctgccat cacggtcctg 180gtggcgccgg gcgacaacct gatgatccac gtcgcggtgg aggtgtgcca gcctggtgat 240gtcctcgtcg tcgccccgac gtcgccatgc acggacgggt atttcggcga actgctggcg 300acctcgttgc gggctcgcgg cgtcgcaggg ctcatcatcg acgccggctg ccgcgatgtt 360cgagcgttga gcgagatgcg gtttcccgtc tggagtcgcg cgatcagcgc gcagggcacc 420gtcaaggcga cgctgggttc ggtgaatgtg ccgctgatgt gcgccggaac gctggtcgag 480gccggagacg tgatcgtggc cgatgatgac ggcgtcgtgg tcgtcaagcg ggagcaggtc 540
gatgccgtaa cgcaggccgc cgaacagcgc gtgcgaaagg aagaggacac acgggcacgg 600
ctcgcgcgag gcgagctggg cctcgacatc tacggcttgc gcaagaaact gtcggacctc 660
ggtttgaagt cgtcgtga 678
<210> 258<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 258
Met Asn Asp Pro Phe vai vai Arg Gln vai Asp Arg Pro Ser Ala Ala1 5 10 15
Ser lie Asp Asp Leu Arg Arg Phe Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Thr35 40 45
Gly Ala Leu Val Ala Gly Pro Ala Ile Thr vai Leu Val Ala Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gln Pro Gly Asp65 70 75 80
vai Leu vai Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly vai Ala Gly Leu lie100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Ser Glu Met Arg Phe115 120 125
Pro vai Trp Ser Arg Ala lie Ser Ala Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro Leu Met Cys Ala Gly Thr Leu vai Glu145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai Val vai Lys165 170 175
Arg Glu Gln vai Asp Ala vai Thr Gln Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Gly Leu Arg Lys Lys Leu ser Asp Leu Gly Leu Lys Ser210 215 220
Ser225
<210> 259<211> 579<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 259
atgcggccca tctatgccgg tgcggcggcc gccggcagcg ccgtcaccgt atccgtacct 60ccgggcgaca actggatgat ccacgtggcc gtcgaagtct gccgcgaagg cgacgtgctg 120gtcgtcgccc caacctcgcc atgcgataac ggctacttcg gcgagctgct cgccagctcg 180ctcaagtccc gtggcgtgcg cgggcttgtc atcgaggcag gctgtcgcga cgtgagagca 240ctctcggata tgaaattccc ggtctggtcg cgggccgtct ccgcgcaagg cactgtgaag 300gaaagcctgg gcgacgtgaa cctgccgctc gtgatcgccg gacagctcgt caatccgggc 360gatgtcgtgg ttgccgacga cgacggcgtc gtcgtcgtgg cgcggttaga agcgcgcgcc 420gtgaccgcca agtcgcacga acgggagcag aaagaagcag ccaaccgcga gcagctgagc 480aagggtgagc tcggcatcga tacctacggc atgcgcaaga agctcgccga caaggggctg 540cgctacgtcg ccaccgccga agaactcaag gcgaagtga 579
<210> 260<211> 192<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (1)...(132)
<223> Demetilmenaquinona metiltransferase<400> 260
Met Arg Pro lie Tyr Ala Gly Ala Ala Ala Ala Gly Ser Ala vai Thr1 5 10 15
vai Ser vai Pro Pro Gly Asp Asn Trp Met lie His vai Ala Val Glu20 25 30
vai Cys Arg Glu Gly Asp vai Leu vai vai Ala Pro Thr ser Pro Cys35 40 45
Asp Asn Gly Tyr Phe Gly Glu Leu Leu Ala Ser Ser Leu Lys Ser Arg50 55 60
Gly vai Arg Gly Leu vai Ile Glu Ala Gly Cys Arg Asp vai Arg Ala65 70 75 80
Leu Ser Asp Met Lys Phe Pro vai Trp Ser Arg Ala vai ser Ala Gln85 90 95
Gly Thr vai Lys Glu ser Leu Gly Asp vai Asn Leu Pro Leu vai lie100 105 110Ala Gly Gln Leu vai Asn Pro Gly Asp vai Val vai Ala Asp Asp Asp115 120 125
Gly vai vai vai Val Ala Arg Leu Glu Ala Arg Ala vai Thr Ala Lys130 135 140
Ser His Glu Arg Glu Gln Lys Glu Ala Ala Asn Arg Glu Gln Leu ser145 150 155 160
Lys Gly Glu Leu Gly Ile Asp Thr Tyr Gly Met Arg Lys Lys Leu Ala165 170 175
Asp Lys Gly Leu Arg Tyr vai Ala Thr Ala Glu Glu Leu Lys Ala Lys180 185 190
<210> 261<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 261
atgaatcaac cggcggtagt ccgccacgtg gagcagccac ccgccgacgc ggttgcggcg 60ctggagaagt atggtgtgac gaccgtgcat gaagctcagg gacgttgtgg cctccttgcc 120gcgtacatgc gtccgatttt cccgggagcg gccatcgccg gctccgctgt caccgtgtcg 180ttgcctcccg gcgacaacct catgatccat gtcgcggtcg aggtctgcag gccgggaaac 240atcctggtcg tttcacccac ctcgccttgt accgacggat acttcggtga actgttggca 300acttctctgc gagctcacgg cgtgcaaggt cttgtgattg atgccggatg ccgcgacgtt 360cgaccgctga ctgagatgaa attcccggtc tggagccgga ccatcagctc gcaggggacg 420gtcaaggcca cactcggatc ggtcaatgtc ccgatcatgt gcgcgggcgc actcgtcgaa 480gctggcgacg tcatcatcgc cgatgacgat ggggtcgtgg ttgtcaagcg tgcagacgcg 540caccaggtcg ctgctgctgc ggaacaaagg gttcggaaag agaatgtgac ccgtgagcga 600cttgcgcgtg gagagctagg actcgatatc tacgacatgc gccagaaaat cgcgcaactg 660ggcctcaaat acctgtaa 678
<210> 262<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 262
Met Asn Gln Pro Ala vai vai Arg His vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai Thr Thr vai His Glu Ala20 25 30Gln Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro lie Phe Pro35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala vai Thr vai ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His Val Ala vai Glu vai Cys Arg Pro Gly Asn65 70 75 80
Ile Leu vai vai Ser Pro Thr ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Gln Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Pro Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Thr lie ser ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro Ile Met Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp vai Ile lie Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Asp Ala His Gln vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 263<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 263
atgaataaac cggtggtagt tcgtcaagtg gagcagccac caacggatgc ggttacggca 60ctagaaaagt atggcgtgac gaccgtgcat gaagcccagg gacgttgtgg cctccttgcc 120tcctacatgc gtccgatttt tccgggagcg agcatcgcgg gttctgccgt cactgtgtct 180ttgcctcctg gcgacaacct gatgatccac gtggcggtcg aggtctgtgg tccgggaaat 240atcctcgtcg tttcgccgac ttcgccttgt accgatggct acttcggtga attgttggcc 300acttccctgc gtgcccgagg tgtccaagga ttagtcatcg atgccggatg ccgtgacgtc 360cgctcgctga cggagatgaa attcccggtc tggagtcgtg ccatcagctc gcagggcaca 420gtcaaagcca cccttggatc ggtgaacgtg ccgatcatgt gtgcgggtgc gtccgtggaa 480
gcgggcgatg taattgtggc cgatgatgat ggagttgttg tcgtgaagcg tgcggccgca 540
caagacgtcg ctgcggccgc ggaacaaagg gttcgcaagg aaaacgcgac ccgcgaacgt 600
cttgcacgcg gcgaactcgg actcgatatc tacgacatgc gccagaagat cgcgcagctg 660
ggcctcaaat atctgtga 678
<210> 264<211> 225<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 264
Met Asn Lys Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Thr Asp1 5 10 15
Ala vai Thr Ala Leu Glu Lys Tyr Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Pro35 40 45
Gly Ala ser Ile Ala Gly Ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
lie Leu vai vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly vai Gln Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala lie Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser vai Asn Val Pro lie Met Cys Ala Gly Ala Ser vai Glu145 150 155 160
Ala Gly Asp vai lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Ala Ala Gln Asp vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 265<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 265
atgacgggtc ctatcgtcgt gcgtcacatc gaacggccac cggcagctgc cgtggcacgg 60ctgcaggagt acggcgtggc gacggtccac gaagcgcaag gacgccgcgg gttgctggcc 120gcctatatgc gaccgatcta tgcgggcgca gccattgcgg gccctgcggt cacggtgtcc 180gttccgccgg gcgacaacct gatgatccac gtcgcggtgg aggtctgcca gccgggagac 240gtgctcgtcg tcgctcccac gtcaccgtgc acggacggct acttcggcga gctgctcgcg 300acctcgctgc aggctcatgg cgtcgtcgcg ctcgtcatcg acgccggatg ccgagatgtg 360cgtgccatga cagagatgcg cttccccgtc tggagccgcg cagtcagttc gcagggcacc 420gtgaaagcga cgctggggtc ggtgaacgtg ccggtggcat gtgcgggcac gctcgtgaat 480cccggcgatg tcgtcatagc ggatgatgac ggcgttgtgg tggtgaggcg agacgaggtg 540gaagagaccg tgagctcgtc ggaaaagcgg atccagaaag aggcgattac gcgagagcgg 600ctcgccagcg gcgagctcgg gctggatatc tacgggctgc ggaagaaact cgccgacctc 660ggactgaagt actcataa 678
<210> 266<211> 225<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 266
Met Thr Gly Pro lie vai vai Arg His lie Glu Arg Pro Pro Ala Ala1 5 10 15
Ala vai Ala Arg Leu Gln Glu Tyr Gly vai Ala Thr vai His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro lie Tyr Ala35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala vai Thr vai Ser vai Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gln Pro Gly Asp65 70 75 80
vai Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Gln Ala His Gly vai vai Ala Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ala Met Thr Glu Met Arg Phe115 120 125
Pro vai Trp Ser Arg Ala vai Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro vai Ala Cys Ala Gly Thr Leu vai Asn145 150 155 160
Pro Gly Asp vai vai Ile Ala Asp Asp Asp Gly vai vai vai Val Arg165 170 175
Arg Asp Glu vai Glu Glu Thr vai ser ser ser Glu Lys Arg Ile Gln180 185 190
Lys Glu Ala Ile Thr Arg Glu Arg Leu Ala Ser Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ala Asp Leu Gly Leu Lys Tyr210 215 220
Ser225
<210> 267<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 267
atgaatacac cgttggtagt ccgacaagtc gagcagccac cagcggacgc ggttgcggca 60ttggaaaagt gcggagtcac aaccgtgcat gaggctcagg gacgtggtgg cctctttgcc 120tcctacatgc gcccgattta cccgggagca accatcgcag gatccgccat cacagtgtct 180gtgcctccgg gcgacaacct tatgatccat gtggctgtgg aagtctgcgg tgcgggaaac 240atcctggtgg tttcaccaac ctccccttgt acggatggat acttcggtga gctgttggca 300acatctcttc gcgcccacgg tgtgaggggg cttgtgatcg atgccggatg tcgtgatgtg 360cgctctctga cggatatgaa atttccggtt tggagtcgca ccgtcagttc gcaagggaca 420gtcaaggcca cactcggatc ggtgaatgta cccatcgttt gtgcgggcgc gatggttgag 480gccggtgatg tgatcgtcgc cgacgacgat ggagttgtgg tggtgaagcg cgcgctggcg 540ccagaggtcg ccgcggcggc gcaacaaagg gttcgcaaag agaatttggc ccgcgaacga 600cttggacgcg gagaactcgg actcgacatt tatgacatgc gcgaaaagat cgcgaaactg 660ggccttaagt atttgtaa 678
<210> 268<211> 225<212> PRT<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 268
Met Asn Thr Pro Leu vai Val Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Gly Gly Leu Phe Ala ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Thr lie Ala Gly Ser Ala Ile Thr vai Ser vai Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Gly Ala Gly Asn65 70 75 80
Ile Leu vai vai Ser Pro Thr ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Asp Met Lys Phe115 120 125
Pro vai Trp ser Arg Thr vai Ser ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro Ile vai Cys Ala Gly Ala Met vai Glu145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai Val Lys165 170 175
Arg Ala Leu Ala Pro Glu vai Ala Ala Ala Ala Gln Gln Arg vai Arg180 185 190
Lys Glu Asn Leu Ala Arg Glu Arg Leu Gly Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Glu Lys lie Ala Lys Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 269<211> 678<212> DNA
<213> Desconhecido<220><223> obtido a partir de amostras ambientais<400> 269
atgaacacac cggtcgtagt ccggcaagtg gagcaaccat caatggatgt gattgcagcc 60ctggagaaac atggtgtgac gaccgtacat gaggcccagg gacgttgtgg cctgctggcg 120tgttacatgc gtccgatttt ccccggagcg agcatcgctg gttccgcggt cactgtttct 180ttgccccccg gcgataatct tatgatccac gttgcggtcg aggtctgcag tccagggaac 240atccttgtag ttgccccgac ctcgccttgc acggatggct atttcggaga attgttggca 300acttccctgc gcgctcgcgg tgtgaaaggt ctcgtgattg atgccggatg ccgtgatgtt 360cgctctttga cggaaatgaa gttcccggtc tggagccgag cgatcagctc gcagggaacg 420gtcaaatcta cactcggctc cgtgaacgtg cctatcctgt gcgcgggcgc actcgtcgag 480gccggcgata tcatcgccgc cgatgacgac ggcgttgtcg ttgtcaagcg cgcaatggcg 540caggaggtcg ccacggcggc agaacaaagg gtgcgcaaag agaatgtgac ccgagagcgt 600cttgcgcggg gagatctcgg gctcgatatc tacgacatgc ggcagaaact cgcccaactg 660ggcctcaaat atctgtga 678
<210> 270<211> 225<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 270
Met Asn Thr Pro vai Val vai Arg Gln vai Glu Gln Pro Ser Met Asp1 5 10 15
vai Ile Ala Ala Leu Glu Lys His Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Cys Tyr Met Arg Pro Ile Phe Pro35 40 45
Gly Ala Ser lie Ala Gly Ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Ser Pro Gly Asn65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Lys Gly Leu vai100 105 110
lie Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ser Thr130 135 140Leu Gly ser vai Asn145
Ala Gly Asp Ile lie165
Arg Ala Met Ala Gln180
Lys Glu Asn vai Thr195
Asp lie Tyr Asp Met210
Leu225
<210> 271<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 271
atgaaccaag ccgtggtggt ccggaatatc gagcgcccgc ccgcggatgt agttgctgcg 60ttggagaaac ttggtgtttc cacggtgcac gaggcgcagg gacgttgcgg tctgttcgct 120acgtatatga ggccgattta tgcgggtgcg gcgattgccg ggccggcggt taccgtatcg 180ttgccgccgg gtgacaattt gatgattcac gtggccgtgg aagtgtgccg cgcgggggac 240attttggtgg tcgcgccgac ttcgccttgc acggacgggt atttcggcga attgctggcg 300acttcgttgc gcgcacatgg cgtcaagggc ctggtgatcg atgcggggtg ccgcgacgtc 360cgagcgctcg cggagatgaa atttcccgtg tggagccgcg cagtaagttc gcagggaacg 420gtgaagtcga cccttggttc ggtaaacgtc ggaattgtgt gcgcaggagc acgcgtggaa 480gccggagacg tgatcgttgc cgacgatgac ggcgtagtgg gggtgaagtg cggcgcagcg 540caggaagtgg ttgccgcggc gcagctgcgc gttcgcaagg aagaggccac gcgcgaacgc 600ttggggcgtg gcgagctcgg cctggatatc cacgggctgc gggccaaggt cgcggagctt 660ggcctgaaat atttgtga 678
<210> 272<211> 225<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 272
Met Asn Gln Ala vai vai vai Arg Asn Ile Glu Arg Pro Pro Ala Asp1 5 10 15
vai Pro lie Leu Cys Ala Gly Ala Leu vai Glu150 155 160
Ala Ala Asp Asp Asp Gly vai Val vai vai Lys170 175
Glu vai Ala Thr Ala Ala Glu Gln Arg vai Arg185 190
Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu200 205
Arg Gln Lys Leu Ala Gln Leu Gly Leu Lys Tyr215 220vai vai Ala Ala Leu Glu Lys Leu Gly vai ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Phe Ala Thr Tyr Met Arg Pro lie Tyr Ala35 40 45
Gly Ala Ala lie Ala Gly Pro Ala vai Thr vai ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Arg Ala Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
lie Asp Ala Gly Cys Arg Asp vai Arg Ala Leu Ala Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai ser ser Gln Gly Thr vai Lys ser Thr130 135 140
Leu Gly Ser vai Asn vai Gly lie vai Cys Ala Gly Ala Arg vai Glu145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai Gly vai Lys165 170 175
Cys Gly Ala Ala Gln Glu vai vai Ala Ala Ala Gln Leu Arg vai Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Gly Arg Gly Glu Leu Gly Leu195 200 205
Asp lie His Gly Leu Arg Ala Lys vai Ala Glu Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 273<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 273
atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60
cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120
tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180
ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg acctggggat 240
gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggcga gttgcttgca 300
acttcgctcg cggcgcatgg ggtgaaaggc ttgatcattg aggcgggatg tcgcgacgtc 360cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgcg 480cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600cttgcttcgg gggaactcgg cctggatatt tacggcctgc gagcgaagat tgcagacctc 660ggtctcaagt acttgtag 678
<210> 274<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (151)...(154)
<22B> Sitio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 274
Met Asn Lys Pro vai vai Val Arg Asn Ile Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly vai Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Ala35 40 45
Gly Ala Ala lie Ala Gly Pro Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Arg Pro Gly Asp65 70 75 80
Val Leu vai Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Ala Ala His Gly vai Lys Gly Leu lie100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala vai Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn Val Thr Ile vai Cys Ala Gly Ala Ala vai Ala145 150 155 160
Pro Gly Asp vai lie vai Ala Asp Asp Asp Gly Val vai vai vai Lys165 170 175Arg Thr Glu Ala Gln Glu vai vai Thr Ala Ser Glu Gln Arg Leu Arg180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 275<211> 690<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 275
atgcctatcg ttgttacgaa gatcgaccga cccagcgcgg cggacgtcga aaggatcgcc 60gcctatggtg tcgcgacctt gcatgaagcg caaggacgaa ccgggttgat ggcgtccaat 120atgcgcccaa tctatcgccc tgcgcacatt gccgggcccg cggtgacctg ccttgtggcg 180cctggcgaca attggatgat ccatgtcgcc gtcgaacagt gccagccggg agatgtcctg 240gtcgtggtac cgaccagccc ctgcgaagac ggctatttcg gcgatctgct ggcgacctcg 300ctgcggtcgc gcggggtcaa aggtctgatc atcgaggccg gcgtacgcga tatcgcgaca 360ttgaccgaga tgaaattccc ggtctggtcc aaggcggtgt tcgcgcaagg aacggtcaag 420gagaccatcg ccagcgtcaa tgtgcccctc gtctgcgcgg gcgcccgcat cgtgccgggc 480gatctgatcg ttgccgacga cgacggggtc gtcgtgattc caagacgttc cgttccggcg 540gtcctttcca gcgccgaggc ccgcgaagag aaggaagccc gcaaccgcgc ccgcttcgaa 600gctggcgagc tgggcctcga cgtctacaac atgcgccagc gcctggccga caagggcttg 660cgctatgtcg agcggctgcc cgaggaatag 690
<210> 276<211> 229<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiltransferase<400> 276
Met Pro Ile vai vai Thr Lys lie Asp Arg Pro ser Ala Ala Asp vai1 5 10 15
Glu Arg Ile Ala Ala Tyr Gly vai Ala Thr Leu His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Ala Ser Asn Met Arg Pro Ile Tyr Arg Pro Ala35 40 45
His Ile Ala Gly Pro Ala vai Thr Cys Leu Val Ala Pro Gly Asp Asn50 55 60
Trp Met Ile His vai Ala vai Glu Gln Cys Gln Pro Gly Asp vai Leu65 70 75 80
Val vai vai Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Leu Arg ser Arg Gly vai Lys Gly Leu lie Ile Glu100 105 110
Ala Gly vai Arg Asp Ile Ala Thr Leu Thr Glu Met Lys Phe Pro vai115 120 125
Trp ser Lys Ala vai Phe Ala Gln Gly Thr vai Lys Glu Thr lie Ala130 135 140
ser vai Asn vai Pro Leu vai Cys Ala Gly Ala Arg Ile vai Pro Gly145 150 155 160
Asp Leu Ile vai Ala Asp Asp Asp Gly vai vai vai lie Pro Arg Arg165 170 175
Ser vai Pro Ala vai Leu ser Ser Ala Glu Ala Arg Glu Glu Lys Glu180 185 190
Ala Arg Asn Arg Ala Arg Phe Glu Ala Gly Glu Leu Gly Leu Asp vai195 200 205
Tyr Asn Met Arg Gln Arg Leu Ala Asp Lys Gly Leu Arg Tyr vai Glu210 215 220
Arg Leu Pro Glu Glu225
<210> 277 <211> 678 <212> DNA <213> Desconhecido <220> <223> obtido a partir de amostras ambientais <400> 277 atgaatacac cggtggtagt ccgacaagtg gagcagccac cagcggatgc ggttgccgca 60ttggagaagt gtggagtgac caccgtgcat gaggcgcagg gacgctgcgg cctccttgcg 120tcctacatgc gcccaattta cccgggagca gccatcgccg gttccgctat cactgtgtct 180ttgcctcctg gcgacaacct catgatccat gttgcggtgg aggtctgcag tccgggaaat 240atcctggtag tttcaccggc ctcgccttgt accgatggct acttcggtga gctgttggcg 300acgtctctcc gtgcccacgg cgtgagaggg cttgtgatcg aggcgggatg ccgtgacgtg 360cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccatcagttc gcaggggaca 420gtcaaggcta cacttggatc ggtaaacgtg cccatcgtgt gcgcgggcgc acgggtcgag 480gctggtgatg tcatcgtcgc cgatgacgat ggagtggtgg ttgtgaagcg ggcgcttgcg 540caagaggtcg ccgcggcggc ggaacaaagg gttcgcaaag agaatgcgac ccgcgaacga 600cttgcgcgcg gagaactcgg actcgatatt tacgacctgc gccaaaagat cgctcaactg 660
ggccttaaat atctgtga 678
<210> 278<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMlNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 278
Met Asn Thr Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Pro35 40 45
Gly Ala Ala lie Ala Gly Ser Ala Ile Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His vai Ala vai Glu vai Cys Ser Pro Gly Asn65 70 75 80
Ile Leu vai vai ser Pro Ala ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly vai Arg Gly Leu vai100 105 110
lie Glu Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro Ile vai Cys Ala Gly Ala Arg Val Glu145 150 155 160
Ala Gly Asp vai Ile Val Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Leu Ala Gln Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Leu Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225<210> 279<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 279
atgaataaac cggtggtagt gcggcaagtc gagcagccac ccgccgatgc ggttgcggcc 60ctggagaagt atggcgtgac caccgtgcac gaagctcaag cgcgttgtgg cctgctggct 120ccctatatgc gcccgatttt tgcgggagca tgcatcgccg gttccgccgt gaccgtgtct 180ttgccgcctg gcgataatct catgatccac gttgccgtcg aggtctgcac tccgggcagc 240attctggtag ttgcccccac ctcgccttgc acggacggtt atttcgggga actcctggca 300acttccctgc tcgctcacgg tgtcaaagga ttggtcatcg atgctggctg tcgggatgtt 360cgctcgttaa cggaaatgaa attccccgtc tggagccgtg ctgtcagttc tcaaggaacg 420gtgaaggcca cgctcggatc ggtgaatgtg ccggtcattt gcgcgggcgc ggaggtggag 480gctggcgata tcatcatcgc cgatgatgat ggtgtggtgg tggtgaagcg cacgctggcg 540cacgaggtgg cagcggcggc ggaactacgg gttcgcaagg agaatgccac ccgcgaacga 600ctcgcacgag gggatctcgg cctcgatatc tacgacatgc ggcaaaaaat cgcgcaactt 660ggtctcaaat atctgtga 678
<210> 280<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 280
Met Asn Lys Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Ala Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro lie Phe Ala35 40 45
Gly Ala Cys lie Ala Gly Ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu Val Cys Thr Pro Gly ser65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Leu Ala His Gly vai Lys Gly Leu vai100 105 110Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp ser Arg Ala vai ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro vai Ile Cys Ala Gly Ala Glu vai Glu145 150 155 160
Ala Gly Asp lie lie lie Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Thr Leu Ala His Glu vai Ala Ala Ala Ala Glu Leu Arg Val Arg180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu195 200 205
Asp lie Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu
225
<210> 281<211> 678<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 281
atgaacaagc ccgtggtcgt ccggcacgtg gaccaaccgt cagccgacgt tgtggctgcg 60ctggagaagt acggagtctc gaccgtgcac gaagcgcaag gccgttgcgg tctactggcc 120tcgtacatgc acccgattta tcccggcgat tccatcgctg ggcctgcggt cacggtttcg 180cttccgccag gtgacaattt gatgatccat gttgcggtcg aggtctgccc ggcgggaagc 240gttctggtcg tggctcccac ctcaccgtgc acagacggtt atttcggcga attgctggca 300acttctctgc gcgctcacca tgtgacgggg ttggttatcg atgccggttg ccgcgacgtt 360cgctcactca cggaaatgaa gtttccggtg tggagtcgcg ccgtcagttc acaggggacc 420gtaaagtcga cgcttggctc cgtgaacgtg ccagtagtgt gcgccggggc ccatgtcgaa 480gcgggcgata tcatcgtcgc cgatgacgat ggagtggtag ttgtaaagcg attggacgca 540cccgaggtag tcgctgcgtg cgaacaaagg gttcgcaagg aacaggtgac gcgcgaacgg 600ctggcgcgcg gcgaactggg tctggatatt tacggcctgc gaagcaaaat cgccgaactt 660ggcctcaagt acgagtag 678
<210> 282<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 282
Met Asn Lys Pro vai vai vai Arg His vai Asp Gln Pro Ser Ala Asp1 5 10 15
vai vai Ala Ala Leu Glu Lys Tyr Gly vai ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met His Pro lie Tyr Pro35 40 45
Gly Asp Ser lie Ala Gly Pro Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Pro Ala Gly Ser65 70 75 80
vai Leu vai vai Ala Pro Thr ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His His vai Thr Gly Leu vai100 105 110
lie Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala vai Ser Ser Gln Gly Thr vai Lys Ser Thr130 135 140
Leu Gly Ser vai Asn Val Pro vai vai Cys Ala Gly Ala His vai Glu145 150 155 160
Ala Gly Asp lie lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Leu Asp Ala Pro Glu vai vai Ala Ala Cys Glu Gln Arg vai Arg180 185 190
Lys Glu Gln vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Gly Leu Arg ser Lys lie Ala Glu Leu Gly Leu Lys Tyr210 215 220
Glu225
<210> 283<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 283
atgaatacac cggtggtagt ccggcaagtg gagcagccac cagcggacgc ggtggccgcattggagaact gtggcgtgac caccgtgcat gaggctcagg gacgtagtgg cctgcttgcctcctacatgc gcccgattta ccagggagca gccatcgcag gttccgctct caccgtgtct 180ttgcctccgg gcgacaacct catgatgcat gttgcggtag agttctgcgg cccgggaaat 240atcctggtcg ttgcaccgac ctcgccctgt acggatggct acttcggtga gctgttggca 300acatctctcc gtgcccacgg tgggagaggg cttgtgatcg atgccggatg ccgtgacctg 360cgctctctaa cagaaatgaa attccctgtc tggagccgcg ccatcagttc gcaagggacg 420gtcaaggcca cacttggatc cgtgaatgtg cccatcgtat gcgcgggcgc attggtcgag 480gccggagatg tcatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgccctcgcg 540caagaggtca gggcggcggc ggagcaaagg gttcgcaaag aaaatgcgac ccgcgaaaga 600ctcgcacgtg gagaactcgg actcgacatt tacgacatgc gccaaaagat cgcgcagctg 660ggccttaaat atctgtga 678
<210> 284<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 284
Met Asn Thr Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Asn Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg ser Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gln35 40 45
Gly Ala Ala Ile Ala Gly ser Ala Leu Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Met His Val Ala vai Glu Phe Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly Gly Arg Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp Leu Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala Ile Ser ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro lie vai Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai Ile Val Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Leu Ala Gln Glu vai Arg Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 285<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 285
atgaatacac cggtggtagt aagacaagtg gagcagccac cagcggatgc aattgccgca 60ttgaagaagt gtggcgtgac aaccgtccac gaggctcagg gacgtggtgg ccttcttgcg 120tcctacatgc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240atcctggtag tttcaccgac ctcgccttgt acggatggct acttcggtga gttgttggca 300acatctctcc gtgcccaggg cgtgattggg cttgtgatcg atgccggatg ccgtgacgtg 360cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcaagggaca 420gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc attggtcgag 480gctggtgatg tcatcgtcgc cgacgacgat ggcgttgtgg ttgtaaagcg agcgctggcg 540caagaggtcg ccgctgcggc ggaacaaaag gttcgcaaag agaatgtaac ccgcgaacga 600ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctcaaat atctgtga 678
<210> 286<211> 225<212> PRT
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 286
Met Asn Thr Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala lie Ala Ala Leu Lys Lys Cys Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45Gly Ala Ala lie Ala Gly ser Ala lie Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai vai Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala Gln Gly vai Ile Gly Leu vai100 105 110
lie Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala Ile Cys ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro lie vai Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Leu Ala Gln Glu vai Ala Ala Ala Ala Glu Gln Lys vai Arg180 185 190
Lys Glu Asn vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 287<211> 678<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 287
atgaacaaac cgttggtgat ccggcaagtg gagcggccgc cggctgacgc tgtggcggcg 60ctcgaaaaat atggcgtgtc caccgtgcat gaagcccagg gacgttgcgg actgctcgct 120tcctacatgc gaccgattta tcccggtgct gccgttgccg gttcggcggt caccgtatcc 180cttccgcccg gcgataatct gatgattcac gttgctgtcg aggtctgcca gtccggcgat 240attctcgtgg ttgctccgac ctcgccttgc tcggacggat acttcggtga gttgctggcg 300acgtccttgc gcgcgcacgg cgtgaagggc ctcgtcattg acgcggggtg ccgtgacgtt 360cgctcactta ccgaaatgag gttccccgtc tggagccgca gcgtcagctc gcaaggtacc 420gtgaagtcta ctctcggatc tgtgaatgtg agcattgttt gtgccggcgc gcacatcgaa 480gctggtgatg tgatcgtcgc ggatgacgac ggtgtcgtgg tggtgaagcg cgcatccgcc 540cacgaagtag tcgcggcgtg cgaacagcgg gttcgcaagg aagaggtcac tcgggagcgg 600ttggcgcgcg gggagcttgg gcttgacatc tacgggttgc gcacaaaaat cgcggaaatg 660ggtctcaagt atcaatga 678
<210> 288<211> 225<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (151)...(154)
<223> Sítio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 288
Met Asn Lys Pro Leu vai Ile Arg Gln vai Glu Arg Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro lie Tyr Pro35 40 45
Gly Ala Ala vai Ala Gly Ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Gln Ser Gly Asp65 70 75 80
Ile Leu vai vai Ala Pro Thr ser Pro Cys Ser Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Arg Phe115 120 125
Pro vai Trp ser Arg ser Val ser Ser Gln Gly Thr vai Lys Ser Thr130 135 140
Leu Gly Ser vai Asn vai Ser Ile vai Cys Ala Gly Ala His lie Glu145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala ser Ala His Glu vai vai Ala Ala Cys Glu Gln Arg vai Arg180 185 190
Lys Glu Glu Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205Asp Ile Tyr Gly Leu Arg Thr Lys lie Ala Glu Met Gly Leu Lys Tyr210 215 220
Gln225
<210> 289<211> 678<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 289
atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360cgagctctga tggaaatgaa gtttccagtc tggagccgcg ccgtcaactc gcaaggaacg 420gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgcg 480cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600cttgcttcgg gggaactcgg cctggatatt tacggcctgc gagcgaagat tgcagacctc 660ggtctcaagt acttgtag 678
<210> 290<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<220>
<221> SITE
<222> (151)...(154)
<223> Sitio de N-glicosi 1 ação. Pró-sitio id = PS00001<400> 290
Met Asn Lys Pro Val Val vai Arg Asn lie Glu Arg Pro Pro Ala Asp15 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai ser Thr vai His Glu Ala20 25 30
Gln Gly Arg Asn Gly Leu Leu Ala ser Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala Ala lie Ala Gly Pro Ala vai Thr Val Ser Leu Pro Pro Gly50 55 60Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Arg Pro Gly Asp65 70 75 80
vai Leu vai vai Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Ala Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Glu Ala Gly Cys Arg Asp vai Arg Ala Leu Met Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala vai Asn Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn Val Thr lie vai Cys Ala Gly Ala Ala vai Ala145 150 155 160
Pro Gly Asp Val lie vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Thr Glu Ala Gln Glu vai vai Thr Ala ser Glu Gln Arg Leu Arg180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys lie Ala Asp Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 291 <211> 678 <212> DNA <213> Desconhecido <220> <223> Obtido a partir de amostras ambientais <400> 291 atgaataaac cggtggtagt ccggcaagtg gagcagccac ccgcggacgc ggttgcggcg 60ctggagaagt atggcgttac caccgtgcat gaggctcagg gacgttgtgg cctgctcgcg 120cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgctgt caccgtagct 180ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240atcctggttg tggcaccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300acctctttgc gtgctcacgg tgtgaaaggg cttgtgattg atgccggatg ccgtgacgtt 360cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaaca 420gtcaaggcca ccctcggatc ggtgaatgtg ccggtcatgt gcgcgggcgc gctcgtcgaa 480gctggggatg tcatcgtcgc cgatgatgat ggagttgtgg ttgtgaagcg cgcgaatgcg 540cacgaggtgg ccgcggcggc agaacaaagg gtgcgcaagg agaatataac ccgcgaacgg 600cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaaaat cgcgcaactg 660ggcctcaaat acctgtga 678
<210> 292<211> 225<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiItransferase<400> 292
Met Asn Lys Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro lie Phe Pro35 40 45
Gly Ala Ala Ile ser Gly Ser Ala vai Thr vai Ala Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
Ile Leu vai vai Ala Pro Thr ser Pro Ser Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly vai Lys Gly Leu vai100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala Ile ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro vai Met Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala Asn Ala His Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn lie Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu195 200 205
Asp lie Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225<210> 293<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 293
atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60ctggagaagt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360cgctctctca cagaaatgaa atttccggtc tggagccgcg ccgtcagttc acaggggaca 420gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcggg 480gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660ggccttaaat atctctga 678
<210> 294<211> 225<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinona metiltransferase<400> 294
Met Asn Arg Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Ala Asp15 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly vai Thr Thr Val His Glu Ala20 25 30
Gln Gly Pro Gly Gly Leu Leu Ala ser Tyr Met Arg Pro lie Tyr Pro35 40 45
Gly Ala vai lie Ala Gly Ser Ala vai Thr vai Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met lie His vai Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
lie Leu vai vai Ala Pro lie Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr ser Leu Arg Ala His Gly Val Arg Gly Leu vai100 105 110Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala vai ser ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly ser vai Asn vai Pro lie vai Cys Ala Gly Ala Arg vai Gly145 150 155 160
Ala Gly Asp vai Ile vai Ala Asp Asp Asp Gly Val vai vai vai Lys165 170 175
Arg Ala Leu Ala Glu Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn vai Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys lie Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 295<211> 678<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 295
atgaataaac cggtggtagt ccggcaagtg gagcagccgc cagcggacgc ggttgcggcg 60ctggagaagt atggcgtcac caccgtgcat gaggctcagg gacgttgtgg cctgctcggg 120cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgcagt caccgtagct 180ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240atcctggtgg ttgcaccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300acctctctgc gtgctcgcga tgtgaaaggg cttgtgattg atgccggatg ccgtgacgtt 360cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaacg 420gtcaaggcca ccctcggatc ggtgaatgtg ccggtcacgt gcgcgggcgc gctcgtcgaa 480gccggggatg tcatcgtcgc cgatgatgat ggagttgtgg ttgtgaagcg cgcgcatgcg 540cacgaggtgg cggcggcggc agaacaaagg gtgcgcaaag agaatataac ccgcgaacgg 600cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctcaaat acctgtga 678
<210> 296<211> 225<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (22)...(174)<223> Demetilmenaquinona metiltransferase<400> 296
Met Asn Lys Pro vai vai vai Arg Gln vai Glu Gln Pro Pro Ala Asp1 5 10 15
Ala vai Ala Ala Leu Glu Lys Tyr Gly vai Thr Thr vai His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Gly His Tyr Met Arg Pro Ile Phe Pro35 40 45
Gly Ala Ala Ile Ser Gly Ser Ala vai Thr vai Ala Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His Val Ala vai Glu vai Cys Gly Pro Gly Asn65 70 75 80
lie Leu vai vai Ala Pro Thr ser Pro Ser Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Asp vai Lys Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp vai Arg Ser Leu Thr Glu Met Lys Phe115 120 125
Pro vai Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr vai Lys Ala Thr130 135 140
Leu Gly Ser vai Asn vai Pro vai Thr Cys Ala Gly Ala Leu vai Glu145 150 155 160
Ala Gly Asp Val Ile vai Ala Asp Asp Asp Gly vai vai vai vai Lys165 170 175
Arg Ala His Ala His Glu vai Ala Ala Ala Ala Glu Gln Arg vai Arg180 185 190
Lys Glu Asn lie Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 297<211> 672<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 297
atgggtgtcg tcgtccaaaa catcgagcgg gctgcgcaag ggaccatcga ccgcctcgccgcctgcgggg tggctaccgt ccatgaagcg caggggcgca aggggctgct ggcgagccacatgcggccgg tctacagggg cgcacggctc gccgcgagcg cggtgacgat ttcggcgccg 180cccggcgaca actggatgat ccatgtcgcc atcgagcagc tccaagccgg cgacatcatg 240gtgctggcgc cgaccagccc gtgcgaggac ggatatttcg gcgacctcct ggcgacctcg 300gcgcaggcgc gcgggtgcaa ggggctggtg atcgatgccg gcgtgcgcga cgttgccgac 360cttacggcaa tgcagttccc ggtgtggtcg aaggcgatct tcgcgcaggg cacgctgaaa 420gagacgctgg gttcggtgaa cgtgccggtg gtctgcgccg gcgcgctggt caacccgggc 480gacgtcatcg tcgccgatga cgacggggtc tgcgtggtac gccgcgagga ggtcgaggca 540gtggcggaaa aggcggaagc ccgcgtcgct gccgaggagg acaagcgcaa gcgcctcgcc 600gggggagaac tggggctcga catctacaag atgcgcgagc gcttggccga gaagggcctc 660aaatatgtct ga 672
<210> 298<211> 223<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinona metiItransferase<400> 298
Met Gly vai vai vai Gln Asn Ile Glu Arg Ala Ala Gln Gly Thr Ile15 10 15
Asp Arg Leu Ala Ala Cys Gly vai Ala Thr vai His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala ser His Met Arg Pro vai Tyr Arg Gly Ala35 40 45
Arg Leu Ala Ala ser Ala vai Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met lie His vai Ala lie Glu Gln Leu Gln Ala Gly Asp Ile Met65 70 75 80
vai Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Lys Gly Leu vai Ile Asp100 105 110
Ala Gly vai Arg Asp vai Ala Asp Leu Thr Ala Met Gln Phe Pro vai115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Leu Lys Glu Thr Leu Gly130 135 140
Ser vai Asn vai Pro vai vai Cys Ala Gly Ala Leu vai Asn Pro Gly145 150 155 160
Asp vai lie Val Ala Asp Asp Asp Gly Val Cys vai vai Arg Arg Glu165 170 175Glu vai Glu Ala vai Ala Glu Lys Ala Glu Ala Arg vai Ala Ala Glu180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp lie195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr vai210 215 220
<210> 299<211> 501<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 299
atgggttcct tggcaactgc cgaagcttgt gacacgaatg cagcacacct gacaagcggt 60gacatccggg tcctgccacc actcttcaag atttacgggc aaagtcgggc attctctggg 120ccaatcgtga ctgtgaaggt atttgaagac aatgtgctgg tacgggaact tcttgaaacc 180aaaggcgacg gtagagttct ggtgatagac ggcggaggga gcatgaggtg tgccttggtc 240ggaggaaacc tggggcagtt agcgcagaac atggggtggg cggggattgt tgtaaacggg 300tgcataagag acgtagatga gatcaacggg tgcgatgttg gggttagagc attggcatcc 360catccacaga agtcgaataa aaaggggcat ggggagaaac acatgccgat taatatcgcg 420ggcacgatga tccgagacgg agagtggttg tatgcagaca gtgatggcat tctcatctcc 480agaactgagc tctctatcta 9 501
<210> 300<211> 166<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (2)...(159)
<223> Demetilmenaquinona metiltransferase<400> 300
Met Gly ser Leu Ala Thr Ala Glu Ala Cys Asp Thr Asn Ala Ala His15 10 15
Leu Thr ser Gly Asp lie Arg Val Leu Pro Pro Leu Phe Lys lie Tyr20 25 30
Gly Gln ser Arg Ala Phe Ser Gly Pro lie vai Thr vai Lys vai Phe35 40 45
Glu Asp Asn vai Leu vai Arg Glu Leu Leu Glu Thr Lys Gly Asp Gly50 55 60
Arg vai Leu vai Ile Asp Gly Gly Gly Ser Met Arg Cys Ala Leu vai65 70 75 80
Gly Gly Asn Leu Gly Gln Leu Ala Gln Asn Met Gly Trp Ala Gly Ile85 90 95
vai vai Asn Gly Cys Ile Arg Asp Val Asp Glu lie Asn Gly Cys Asp100 105 110
vai Gly vai Arg Ala Leu Ala Ser His Pro Gln Lys Ser Asn Lys Lys115 120 125
Gly His Gly Glu Lys His Met Pro lie Asn Ile Ala Gly Thr Met Ile130 135 140
Arg Asp Gly Glu Trp Leu Tyr Ala Asp ser Asp Gly lie Leu lie Ser145 150 155 160
Arg Thr Glu Leu Ser Ile165
<210> 301<211> 501<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 301
atgggttcct tggcaactgc cgaagcttgt gacacgaatg cagcacacct gacaagcggt 60gacatccggg tcctgccacc actcttcaag atttacgggc aaagtcgggc attctctggg 120ccaatcgtga ctgtgaaggt atttgaagac aatgtgctgg tacgggaact tcttgaaacc 180aaaggcgacg gtagagttct ggtgatagac ggcggaggga gcatgaggtg tgccttggtc 240ggaggaaacc tggggcagtt agctcagaac atggggtggg cagggattgt tgtaaacggg 300tgcataagag acatagatga gatcaacggg tgcgatgttg gggttagagc attggcatcc 360catccacaga agtcgaataa aaaggggcat ggggagaaac acatgccgat taatatcgcg 420ggcacgatga tccgagacgg agagtggttg tatgcagaca gtgatggcat tctcatctcc 480agaactgagc tctctatcta g 501
<210> 302<211> 166<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (2)...(159)
<223> Demetilmenaquinona metiltransferase<400> 302
Met Gly ser Leu Ala Thr Ala Glu Ala Cys Asp Thr Asn Ala Ala His1 5 10 15
Leu Thr Ser Gly Asp Ile Arg vai Leu Pro Pro Leu Phe Lys Ile Tyr20 25 30
Gly Gln Ser Arg Ala Phe Ser Gly Pro lie vai Thr vai Lys vai Phe35 40 45Glu Asp Asn vai Leu vai Arg Glu Leu Leu Glu Thr Lys Gly Asp Gly50 55 60
Arg vai Leu vai Ile Asp Gly Gly Gly Ser Met Arg Cys Ala Leu vai65 70 75 80
Gly Gly Asn Leu Gly Gln Leu Ala Gln Asn Met Gly Trp Ala Gly lie85 90 95
vai vai Asn Gly Cys lie Arg Asp lie Asp Glu Ile Asn Gly Cys Asp100 105 110
vai Gly vai Arg Ala Leu Ala Ser His Pro Gln Lys Ser Asn Lys Lys115 120 125
Gly His Gly Glu Lys His Met Pro Ile Asn Ile Ala Gly Thr Met lie130 135 140
Arg Asp Gly Glu Trp Leu Tyr Ala Asp ser Asp Gly lie Leu lie Ser145 150 155 160
Arg Thr Glu Leu Ser Ile165
<210> 303<211> 501<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 303
atggccttag taaccactgc cgaagtttgt gatgcgaacc cacagctcat tgtgagcggc 60gagcttcgcg cactccatcc aattttccaa atttacggta ggcggcaagt cttctccggg 120cccgttgtta cgctgaaggt gtttgaagat aatgtgttgg tgcgcgaatt tcttgaggag 180aggggcaatg gcagggttct tgttgtcgat ggtggtggca gcttgagatg cgcaatactc 240ggtggcaacc ccgttgtaca agctcagaac aacgggtggg ctggcattgt ggttaacggg 300tgtataaggg atgttgatga aatcaacggg tgcgacattg gagtcagagc tctggccgcg 360cacccggtga aagccaataa gaaaggcatc ggtgagaagc atgttccggt gaacattggt 420ggaacccgta tatgtgatgg agagtggctc tatgcagata ccgatggtat tttggtgtct 480aaaaccgagt tgtctgtcta a 501
<210> 304<211> 166<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO<222> (2)...(159)
<223> Demetilmenaquinona metiItransferase<400> 304
Met Ala Leu vai Thr Thr Ala Glu vai Cys Asp Ala Asn Pro Gln Leu15 10 15lie vai Ser Gly Glu Leu Arg Ala Leu His Pro lie Phe Gln Ile Tyr20 25 BO
Gly Arg Arg Gln vai Phe Ser Gly Pro vai vai Thr Leu Lys vai Phe35 40 45
Glu Asp Asn vai Leu Val Arg Glu Phe Leu Glu Glu Arg Gly Asn Gly50 55 60
Arg vai Leu vai vai Asp Gly Gly Gly Ser Leu Arg Cys Ala Ile Leu65 70 75 80
Gly Gly Asn Pro vai vai Gln Ala Gln Asn Asn Gly Trp Ala Gly Ile85 90 95
vai vai Asn Gly Cys Ile Arg Asp vai Asp Glu lie Asn Gly Cys Asp100 105 110
Ile Gly vai Arg Ala Leu Ala Ala His Pro vai Lys Ala Asn Lys Lys115 120 125
Gly Ile Gly Glu Lys His Val Pro vai Asn Ile Gly Gly Thr Arg lie130 135 140
Cys Asp Gly Glu Trp Leu Tyr Ala Asp Thr Asp Gly lie Leu vai Ser145 150 155 160
Lys Thr Glu Leu Ser vai165
<210> 305<211> 639<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 305
ttggatcaaa tccacaaatc cggcattatc cccgtcgtcg aaatcgactc ggtagaacgc 60gccgtcccgc tggctgaggc attgcttgca ggagggctga cggtcgtgga gatcaccctc 120cgcaccgggg cggcgctcga gtcgattcga gcaattgctc agcaggtacc agaggtcagt 180gtcggggcag gaacagtcat tacctgggaa caggcgcagg cggcacgtga tgcaggcgcg 240cagttcctcg tctcaccggg gatggtggag caggttgtca tctgggcgca ggagcaccag 300cttccgatca tacctggcgc agcaactccc accgagatga tccgcggcat caacctgggg 360ctcaacctcc tgaaattctt tcccgccgaa acgatgggtg gggtaagcgc tgttaaggcg 420ttatctgacc cgtttccgca gttgaaattc attcccacgg gcggcatcag gttggaaaat 480gcagcttcgt atctcgcgca tcctaaaatc catgctgtgg gcggctcgtg gatagcgaaa 540cgagagatga tcgcggatgg cagatttgat gagatccggc gtatggcaca ggaagccaga 600gacctggtaa agcagatcag gaggaaaacg atcccatga 639
<210> 306<211> 212<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (1)...(195)
<223> KDPG e KHG aldolase
<220>
<221> SITE<222> (32)...(41)
<223> Sitio ativo de kdpg e khg aldolases. Pró-sitio id = PS00159<400> 306
Met Asp Gln lie His Lys ser Gly lie Ile Pro vai vai Glu lie Asp15 10 15
Ser Val Glu Arg Ala vai Pro Leu Ala Glu Ala Leu Leu Ala Gly Gly20 25 30
Leu Thr vai vai Glu lie Thr Leu Arg Thr Gly Ala Ala Leu Glu Ser35 40 45
Ile Arg Ala lie Ala Gln Gln vai Pro Glu vai Ser vai Gly Ala Gly50 55 60
Thr Val lie Thr Trp Glu Gln Ala Gln Ala Ala Arg Asp Ala Gly Ala65 70 75 80
Gln Phe Leu vai ser Pro Gly Met Val Glu Gln vai vai Ile Trp Ala85 90 95
Gln Glu His Gln Leu Pro Ile Ile Pro Gly Ala Ala Thr Pro Thr Glu100 105 110
Met Ile Arg Gly lie Asn Leu Gly Leu Asn Leu Leu Lys Phe Phe Pro115 120 125
Ala Glu Thr Met Gly Gly vai Ser Ala vai Lys Ala Leu Ser Asp Pro130 135 140
Phe Pro Gln Leu Lys Phe lie Pro Thr Gly Gly lie Arg Leu Glu Asn145 150 155 160
Ala Ala Ser Tyr Leu Ala His Pro Lys lie His Ala vai Gly Gly Ser165 170 175
Trp Ile Ala Lys Arg Glu Met lie Ala Asp Gly Arg Phe Asp Glu Ile180 185 190
Arg Arg Met Ala Gln Glu Ala Arg Asp Leu Val Lys Gln lie Arg Arg195 200 205
Lys Thr lie Pro210
<210> 307<211> 639<212> DNA<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais
<400> 307 ttgactttga aacaaggcgt gttgcctttg tattttaata aggacgagga ggtgagtatc 60gctgttttaa aagctttata tgaagcggga attcgtacag ttgaatatac gaatcgtggt 120gaagccgcat tgaaaaactt taagtcgttg cgcaaggtat gtgataccga attgaatgga 180atgtacctcg gtattgggac gattaaaaat ggccagcagg cacaagcttt tgtggatgca 240ggtgcagatt atttaattag tccgggtgta gtggatgatg cagcaaaagt tgccgatcaa 300aatggtttgt tatatgtgcc tggtgcaatg accccaacag aaattatcag ggcagagcaa 360caatttggat caacgctggt gaaacttttt ccgggtaata ttttaggccc tggctttgtt 420agtgctatta aagaattgtt cagcggattg aaatttatta ttaccggagg agttgaaccg 480gaagaaaata atttgaaagg atggttcaac gcaggtgccg cagctgtggg catgggaagt 540aaattaatta ccaaacaggt tttggaaaat aaagactatg caaaaattac agagttaact 600aaggaatctt taagactgat taaattggtc agagggtaa 639
<210> 308<211> 212<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (2)...(199)
<223> kdpg e khg aldolase
<400> 308
Met Thr Leu Lys Gln Gly vai Leu Pro Leu Tyr Phe Asn Lys Asp Glu15 10 15
Glu vai Ser lie Ala vai Leu Lys Ala Leu Tyr Glu Ala Gly lie Arg20 25 30
Thr vai Glu Tyr Thr Asn Arg Gly Glu Ala Ala Leu Lys Asn Phe Lys35 40 45
ser Leu Arg Lys Val Cys Asp Thr Glu Leu Asn Gly Met Tyr Leu Gly50 55 60
Ile Gly Thr lie Lys Asn Gly Gln Gln Ala Gln Ala Phe vai Asp Ala65 70 75 80
Gly Ala Asp Tyr Leu lie Ser Pro Gly vai vai Asp Asp Ala Ala Lys85 90 95
vai Ala Asp Gln Asn Gly Leu Leu Tyr vai Pro Gly Ala Met Thr Pro100 105 110
Thr Glu Ile lie Arg Ala Glu Gln Gln Phe Gly ser Thr Leu Val Lys115 120 125
Leu Phe Pro Gly Asn Ile Leu Gly Pro Gly Phe vai Ser Ala lie Lys130 135 140Glu Leu Phe Ser Gly Leu Lys Phe Ile Ile Thr Gly Gly vai Glu Pro145 150 155 160
Glu Glu Asn Asn Leu Lys Gly Trp Phe Asn Ala Gly Ala Ala Ala vai165 170 175
Gly Met Gly ser Lys Leu Ile Thr Lys Gln vai Leu Glu Asn Lys Asp180 185 190
Tyr Ala Lys lie Thr Glu Leu Thr Lys Glu Ser Leu Arg Leu Ile Lys195 200 205
Leu vai Arg Gly210
<210> 309<211> 687<212> DNA<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<400> 309
atgagtattg ctgcaaatac aggtgtagac aaaaaaaatg agatcctaca attaacattg 60caacaaggtg tgttgccttt gtattttaat aaagatgaag aagtgagtat tgctgttttg 120aaagcgttat atgaggcagg cattcgcaca gttgagtata ccaatcgtgg agaagccgca 180ttaaaaaatt ttaaagtact gagaaaaatt tgtgatacgg aattgagtgg attatacctg 240ggtatcggca ccattaaaaa tggagaacag gcaaaagctt ttgttgatgc cggtgcagat 300tatttaatta gtccgggtgt ggtagatgat gcagcaaaaa ttgctgatca aaatggattg 360ttatatgtgc ctggtgccat gacgccaact gaaattatca gggcagaaca atttggtgca 420acactggtaa aactttttcc cggtaatatt ttaggccctg gtttcgttag tgccgttaag 480gaattattca gcggtttgaa atttatcatc actggtggag tagaacctga agaaaataat 540ttgaaaggat ggtttaatgc aggtgctgcg gccgtaggaa tgggaagtaa attgatcaca 600aaacaaactt tggaaaataa agactacgca aaaattacag agctcacgaa agagtcttta 660agattgattg aactggtgcg gaaataa 687
<210> 310<211> 228<212> prt<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> domínio
<222> (16)...(215)
<223> kdpg e khg aldolase
<400> 310
Met Ser lie Ala Ala Asn Thr Gly vai Asp Lys Lys Asn Glu lie Leu15 10 15
Gln Leu Thr Leu Gln Gln Gly vai Leu Pro Leu Tyr Phe Asn Lys Asp20 25 30
Glu Glu vai ser Ile Ala vai Leu Lys Ala Leu Tyr Glu Ala Gly Ile35 40 45
Arg Thr vai Glu Tyr Thr Asn Arg Gly Glu Ala Ala Leu Lys Asn Phe50 55 60
Lys vai Leu Arg Lys Ile Cys Asp Thr Glu Leu ser Gly Leu Tyr Leu65 70 75 80
Gly Ile Gly Thr Ile Lys Asn Gly Glu Gln Ala Lys Ala Phe vai Asp85 90 95
Ala Gly Ala Asp Tyr Leu lie ser Pro Gly vai Val Asp Asp Ala Ala100 105 110
Lys Ile Ala Asp Gln Asn Gly Leu Leu Tyr vai Pro Gly Ala Met Thr115 120 125
Pro Thr Glu Ile lie Arg Ala Glu Gln Phe Gly Ala Thr Leu vai Lys130 135 140
Leu Phe Pro Gly Asn Ile Leu Gly Pro Gly Phe vai Ser Ala vai Lys145 150 155 160
Glu Leu Phe Ser Gly Leu Lys Phe lie lie Thr Gly Gly vai Glu Pro165 170 175
Glu Glu Asn Asn Leu Lys Gly Trp Phe Asn Ala Gly Ala Ala Ala vai180 185 190
Gly Met Gly Ser Lys Leu lie Thr Lys Gln Thr Leu Glu Asn Lys Asp195 200 205
Tyr Ala Lys lie Thr Glu Leu Thr Lys Glu Ser Leu Arg Leu Ile Glu210 215 220
Leu vai Arg Lys225
<210> 311<211> 600<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 311
atgatattcg ccgatgccat agccgaatgc ggcctcatcg ccatcctgcg cggcattgca 60acggctgaaa ttgaagccgt gggacaagcc ctcatcgaag ccggcattcg cgtcgctgaa 120attccgctga actcgccgga tccatttgcc tccatcgaga aaatggccaa ggccttcaag 180ggcgagctgg ttgtcggggc tggaaccgtt ctcagtgtgc aggatgtcaa tttactgaaa 240gcccatggcg gccagatcag cgtttctccc gattgcaacg aggcggtggt cgcacgcacc 300aaagaactgg gtctggagcc cgttcccggc gtcttcacgc ccactgaggc ttttgccgcg 360atccgcgccg gggcaaccca tatcaagttg tttccggcgg aagccgcaag ccccgcaacc 420atcagggcct ggcgcgctgt tcttccaaag catgtgaaaa tctatccggt gggcggcatc 480acgccagcaa atatgcaggg ctgggttgat gccggcgccg caggctttgg aattggctca 540
aatatctata agcagggggc cacagccgcc aacgtggcaa aggcggccaa ggaattcttt 600
<210> 312<211> 200<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (4)...(198)
<223> KDPG e KHG aldolase
<400> 312
Met Ile Phe Ala Asp Ala Ile Ala Glu Cys Gly Leu Ile Ala lie Leu15 10 15
Arg Gly Ile Ala Thr Ala Glu lie Glu Ala vai Gly Gln Ala Leu lie20 25 30
Glu Ala Gly lie Arg vai Ala Glu lie Pro Leu Asn Ser Pro Asp Pro35 40 45
Phe Ala ser lie Glu Lys Met Ala Lys Ala Phe Lys Gly Glu Leu vai50 55 60
vai Gly Ala Gly Thr vai Leu Ser vai Gln Asp vai Asn Leu Leu Lys65 70 75 80
Ala His Gly Gly Gln Ile Ser vai ser Pro Asp Cys Asn Glu Ala vai85 90 95
vai Ala Arg Thr Lys Glu Leu Gly Leu Glu Pro vai Pro Gly vai Phe100 105 110
Thr Pro Thr Glu Ala Phe Ala Ala Ile Arg Ala Gly Ala Thr His Ile115 120 125
Lys Leu Phe Pro Ala Glu Ala Ala ser Pro Ala Thr lie Arg Ala Trp130 135 140
Arg Ala vai Leu Pro Lys His vai Lys lie Tyr Pro vai Gly Gly Ile145 150 155 160
Thr Pro Ala Asn Met Gln Gly Trp vai Asp Ala Gly Ala Ala Gly Phe165 170 175
Gly Ile Gly Ser Asn lie Tyr Lys Gln Gly Ala Thr Ala Ala Asn vai180 185 190
Ala Lys Ala Ala Lys Glu Phe Phe195 200
<210> 313<211> 681<212> DNA<213> Desconhecido
<220><223> obtido a partir de amostras ambientais<400> 313
atgagccagc ccgatagaaa cctgaaggag accgtgattg cgttaactaa ggaatgcggg 60gttctgccct gcatcaagtt gcgcaaaaaa gatgatttta ttgcctatgc ccaggcgatg 120tatgacggag gagctcgcgt catcgaagtg accatgacaa ctccaggcgc cctggaagcg 180atcgaagcca tttcgtctgc ctttaaagac aaactctatg ttgcttcggg caccacattg 240gacgcgtcca ctgcgcgcga ggtcatcact cacggcggaa gctgcattgt taatccttgt 300gtcatccccg aagtgatcga tgtcgccaac cgctatggca ttccagttta ttccggagca 360ttcactgcga ccgaggtgtt cacggcgatg cgcgccggag cgtccatggt caaaatattt 420cccgggggtc tgggcggcgc caagtacatg accaatctga aaatggtatt cccagaagtg 480aacctgattc cttcaggggg aattaacctt gataatgctc ccgaatttat tcgcgccggc 540gcctgcgctg tcagtggtgc acgaactttc atggatcacg aaatgattgc caagcatggt 600ttgaaatgga ttactcaaca gacgtcaaaa ttcattgaag tggttctgga agcgaagcgg 660aacgctccag agttgccttg a 681
<210> 314<211> 226<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (12)...(207)
<223> kdpg e khg aldolase
<400> 314
Met Ser Gln Pro Asp Arg Asn Leu Lys Glu Thr vai Ile Ala Leu Thr1 5 10 15
Lys Glu Cys Gly Val Leu Pro Cys Ile Lys Leu Arg Lys Lys Asp Asp20 25 30
Phe lie Ala Tyr Ala Gln Ala Met Tyr Asp Gly Gly Ala Arg vai lie35 40 45
Glu vai Thr Met Thr Thr Pro Gly Ala Leu Glu Ala Ile Glu Ala lie50 55 60
Ser Ser Ala Phe Lys Asp Lys Leu Tyr vai Ala Ser Gly Thr Thr Leu65 70 75 80
Asp Ala Ser Thr Ala Arg Glu vai Ile Thr His Gly Gly ser Cys Ile85 90 95
vai Asn Pro Cys vai Ile Pro Glu vai Ile Asp vai Ala Asn Arg Tyr100 105 110
Gly Ile Pro Val Tyr ser Gly Ala Phe Thr Ala Thr Glu vai Phe Thr115 120 125
Ala Met Arg Ala Gly Ala ser Met vai Lys Ile Phe Pro Gly Gly Leu130 135 140Gly Gly Ala Lys Tyr Met Thr Asn Leu Lys Met vai Phe Pro Glu vai145 150 155 160
Asn Leu lie Pro Ser Gly Gly lie Asn Leu Asp Asn Ala Pro Glu Phe165 170 175
Ile Arg Ala Gly Ala Cys Ala Val Ser Gly Ala Arg Thr Phe Met Asp180 185 190
His Glu Met Ile Ala Lys His Gly Leu Lys Trp Ile Thr Gln Gln Thr195 200 205
ser Lys Phe Ile Glu vai Val Leu Glu Ala Lys Arg Asn Ala Pro Glu210 215 220
Leu Pro225
<210> 315<211> 576<212> DNA
<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais
<400> 315 atggcacaat ttacaagaat agaagttgca acagcaatga aagaaactgg gatgattcct 60ttgtttttta acaacgattt agaattaagt aaaaaagtat taaaagcttg ttacgatggt 120ggagcacgct taatggaatt tactgctcgt ggagattttg cacacgaagt ttttggtgaa 180ttaacaaaat atgcaattgc agaattacca ggaatgatta tgggtgtagg ttctgtaacc 240gatgcagctg cagcatcttt atacatggct ttaggagcaa actttattgt aactccagta 300ttaagagaag atatagcaat tgtttgtaac agacgtaaag ttttatggtc tcctggttgt 360ggaactttaa ctgaaattac taaggccgaa gaattaggat gtgaaattgt aaaattattc 420cctggtgata tttatggacc tcaatttgta aaaggaatta aaggaccaca accttggact 480agtgtaatgc caactggagg agtttctcca acaaaagaaa atttaacagg ttggtttaat 540gcaggtgtaa cttgtgttgg aatgggatct caatta 576
<210> 316<211> 192<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (9)...(192)
<223> KDPG e KHG aldolase
<220>
<221> SITE
<222> (176)...(179)
<223> Sitio de N-glicosi 1 ação. Pró-sítio id = PS00001<400> 316
Met Ala Gln Phe Thr Arg lie Glu vai Ala Thr Ala Met Lys Glu Thr15 10 15Gly Met Ile Pro Leu Phe Phe Asn Asn Asp Leu Glu Leu Ser Lys Lys20 25 30
vai Leu Lys Ala Cys Tyr Asp Gly Gly Ala Arg Leu Met Glu Phe Thr35 40 45
Ala Arg Gly Asp Phe Ala His Glu vai Phe Gly Glu Leu Thr Lys Tyr50 55 60
Ala lie Ala Glu Leu Pro Gly Met Ile Met Gly vai Gly ser vai Thr65 70 75 80
Asp Ala Ala Ala Ala ser Leu Tyr Met Ala Leu Gly Ala Asn Phe lie85 90 95
vai Thr Pro vai Leu Arg Glu Asp lie Ala lie vai Cys Asn Arg Arg100 105 110
Lys vai Leu Trp Ser Pro Gly Cys Gly Thr Leu Thr Glu lie Thr Lys115 120 125
Ala Glu Glu Leu Gly Cys Glu Ile vai Lys Leu Phe Pro Gly Asp Ile130 135 140
Tyr Gly Pro Gln Phe vai Lys Gly lie Lys Gly Pro Gln Pro Trp Thr145 150 155 160
Ser vai Met Pro Thr Gly Gly Val Ser Pro Thr Lys Glu Asn Leu Thr165 170 175
Gly Trp Phe Asn Ala Gly vai Thr Cys vai Gly Met Gly Ser Gln Leu180 185 190
<210> 317<211> 612<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 317
atgagcgggc gagagatcat tgcgatcctg cggggcgtgc gcccgaatga ggtggtggcc 60attgggcacg ttctgctgga tgcaggtatc gacaagatcg aagttccgct gaattccccc 120gatgcctttg aaagcattgc gcttttggcg gatgcgtttc acgatagtgc ggtgataggt 180gctggcaccg ttctgacgcc acaagacgtg gtgaaggtgc atcaacaggg tggcgcgatg 240gtggtatcgc ctgattgcaa tccggatgtg atcaaggcaa ccaaggcgct gggcatgttg 300tcttaccccg gtgttttcac cccgaccgaa gcttttaccg ccctgcgttc tggtgcggat 360gggatcaaac tgtttcctgc ttcaggcatt ggccctgcag ggctggccgc gatgttggcc 420gttttgccca caggcatgcg cagctatgcg gtggggggcg tcgggccaga tagcttcgcg 480ccttggatcg gagttggcgt gaccggattt ggcattggaa cgggcctgtt caaaccgggg 540tttggcacgg ctgatgtggc taaacgggca gcggacattg tggcggccta tgatcggggt 600attttgaaat ga 612<210> 318<211> 203<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (1)...(192)
<223> KDPG e KHG aldolase
<400> 318
Met Ser Gly Arg Glu Ile Ile Ala lie Leu Arg Gly vai Arg Pro Asn1 5 10 15
Glu vai vai Ala lie Gly His vai Leu Leu Asp Ala Gly Ile Asp Lys20 25 30
Ile Glu vai Pro Leu Asn ser Pro Asp Ala Phe Glu ser Ile Ala Leu35 40 45
Leu Ala Asp Ala Phe His Asp Ser Ala vai lie Gly Ala Gly Thr vai50 55 60
Leu Thr Pro Gln Asp vai vai Lys Val His Gln Gln Gly Gly Ala Met65 70 75 80
vai Val Ser Pro Asp Cys Asn Pro asd vai Ile Lvs Ala Thr Lys Ala85 90 95
Leu Gly Met Leu Ser Tyr Pro Gly Val Phe Thr Pro Thr Glu Ala Phe100 105 110
Thr Ala Leu Arg ser Gly Ala Asp Gly lie Lys Leu Phe Pro Ala Ser115 120 125
Gly Ile Gly Pro Ala Gly Leu Ala Ala Met Leu Ala vai Leu Pro Thr130 135 140
Gly Met Arg ser Tyr Ala vai Gly Gly vai Gly Pro Asp Ser Phe Ala145 150 155 160
Pro Trp Ile Gly Val Gly vai Thr Gly Phe Gly Ile Gly Thr Gly Leu165 170 175
Phe Lys Pro Gly Phe Gly Thr Ala Asp vai Ala Lys Arg Ala Ala Asp180 185 190
Ile vai Ala Ala Tyr Asp Arg Gly Ile Leu Lys195 200
<210> 319<211> 600<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 319
gtgccggttc tggtcatcga agacgtcaat gatgccgtgc cgcttgccaa ggccttggtggccggtggtt tgcgcgtgct tgaaatcacc ctgcgcagtg ccgccgccga ggaaagcatt 120aaacgtatta tcgccgaagt tcccgatgca attaccggtg cgggcaccgt gatcaatgcc 180aaacagatgg aacgtatggc cgaaatcggt tgtgcttttg cggtttcgcc gggccatacc 240gatggtttgc ttaaggccgc caaagatacc ggcgtgccgt tgctgcccgg tgccggaacg 300ccgtctgaaa tcatgcatct gattgatcat ggctatgaca tcttgaaatt cttcccggcc 360gaacaacagg gcggtgtttc gatgcttaaa gccctgtctg gcccgctgcc acaggtgaaa 420ttctgcccga cgggtggtgt gtcgctggca aatttggggg attatctcgc cctgccaaat 480atcatcaccg ttggtgggtc gtgggtctcg ccaaaaagcg cggtcaaggc cggtgactgg 540gcaacgatca cgcgcctggc acaggaagca accgacaagg ttgccgaact tcgcggttaa 600
<210> 320<211> 199<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (1)...(186)
<223> kdpg e khg aldolase
<220>
<221> SITE<222> (23),,.(32)
<223> Sítio ativo de kdpg e khg aldolases. Pró-sitio id = PS00159<220>
<221> SITE
<222> (112)...(125)
<223> Residuo de formação de base de Schiff de kdpg e khg. Pró-site id =PS00160
<400> 320
Met Pro vai Leu vai lie Glu Asp vai Asn Asp Ala vai Pro Leu Ala15 10 15
Lys Ala Leu Val Ala Gly Gly Leu Arg Val Leu Glu lie Thr Leu Arg20 25 30
ser Ala Ala Ala Glu Glu Ser lie Lys Arg Ile lie Ala Glu vai Pro35 40 45
Asp Ala Ile Thr Gly Ala Gly Thr vai lie Asn Ala Lys Gln Met Glu50 55 60
Arg Met Ala Glu Ile Gly Cys Ala Phe Ala vai ser Pro Gly His Thr65 70 75 80
Asp Gly Leu Leu Lys Ala Ala Lys Asp Thr Gly vai Pro Leu Leu Pro85 90 95
Gly Ala Gly Thr Pro Ser Glu lie Met His Leu lie Asp His Gly Tyr100 105 110
Asp lie Leu Lys Phe Phe Pro Ala Glu Gln Gln Gly Gly vai Ser Met115 120 125Leu Lys Ala Leu Ser Gly Pro Leu Pro Gln vai Lys Phe Cys Pro Thr130 135 140
Gly Gly vai ser Leu Ala Asn Leu Gly Asp Tyr Leu Ala Leu Pro Asn145 150 155 160
Ile lie Thr vai Gly Gly Ser Trp vai Ser Pro Lys Ser Ala vai Lys165 170 175
Ala Gly Asp Trp Ala Thr Ile Thr Arg Leu Ala Gln Glu Ala Thr Asp180 185 190
Lys vai Ala Glu Leu Arg Gly195
<210> 321<211> 654<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 321
atgaccagcg aaacgaacca gatattagag gcgaaatttg ccgctgcgcc ggtggtgccc 60ctgatcgaag ccagtgaccc tacggttgcg gtagcaatcg caaaagcgct gcaggcgggc 120ggcctcgatg tgatcgaagt cgtcctccgg accgacgcgg cgctcgattg catggaagcc 180attatcgcgg agacttcgga catcattgtt ggcgcgggaa caatcttgac cgctgacgat 240gcgaaggcag ctgttacccg cggcgcgcag ttcattgtgt gcccgggact ggtcgacgcg 300gtggtcaatt tctgcaaggc aaatgatctt ccggtcttcc cgggaacaat gaccccgggc 360gaagtgcaac aggcccataa tctcggtctc ggaacggtga aattctttcc cgccaaactc 420gctggcggtg tgccgatgct caaggcattg agctcggtct ttcgcaatat gcgtttcatg 480ccgacgggtg gggtgtcagc agagaatctg ggcgaatttc tggccgtgcc ttccgtaatt 540gcctgcggcg gtagctggct cacgccgaaa gcggctatcg acgcgggcga ttacgatgca 600atcaccaagc tggcccgtga agctgtcgct ctcgcacgtg cctctagacc ataa 654
<210> 322<211> 217<212> PRT
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (9)...(204)
<223> kdpg e khg aldolase
<400> 322
Met Thr Ser Glu Thr Asn Gln Ile Leu Glu Ala Lys Phe Ala Ala Ala1 5 10 15
Pro vai vai Pro Leu Ile Glu Ala Ser Asp Pro Thr vai Ala vai Ala20 25 30
lie Ala Lys Ala Leu Gln Ala Gly Gly Leu Asp vai lie Glu vai vai35 40 45Leu Arg Thr Asp Ala Ala Leu Asp Cys Met Glu Ala lie Ile Ala Glu50 55 60
Thr ser Asp Ile Ile vai Gly Ala Gly Thr lie Leu Thr Ala Asp Asp65 70 75 80
Ala Lys Ala Ala Val Thr Arg Gly Ala Gln Phe lie vai Cys Pro Gly85 90 95
Leu vai Asp Ala vai vai Asn Phe Cys Lys Ala Asn Asp Leu Pro vai100 105 110
Phe Pro Gly Thr Met Thr Pro Gly Glu Va.1 Gln Gln Al3. His Asn Leu115 120 125
Gly Leu Gly Thr vai Lys Phe Phe Pro Ala Lys Leu Ala Gly Gly vai130 135 140
Pro Met Leu Lys Ala Leu ser ser vai Phe Arg Asn Met Arg Phe Met145 150 155 160
Pro Thr Gly Gly Val ser Ala Glu Asn Leu Gly Glu Phe Leu Ala vai165 170 175
Pro Ser Val Ile Ala Cys Gly Gly ser Trp Leu Thr Pro Lys Ala Ala180 185 190
lie Asp Ala Gly Asp Tyr Asp Ala lie Thr Lys Leu Ala Arg Glu Ala195 200 205
vai Ala Leu Ala Arg Ala ser Arg Pro210 215
<210> 323<211> 603<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 323
atgacgttcc ccctgagatc actcgtggaa gccgcgacca aggcaccgat tgtacccgtt 60ctggtcgtcg accgcattga agttgcggcc ccccttgcgc gggcgcttgt tgatggcggc 120ctgacaattg ccgaagtcac gctgcgaaca ccttcggggc tggcggtaat cgaagagatg 180aaatccgccg agcccggcct gaaggtcggc gcgggcaccg tgttgaccga atccgatgtc 240gagaacgcat tggcggccgg cgcggatttc ctcgtggcac cgggcatgtc gccaaaactg 300ttggccggac tgggtggcca ccgccgcctg atgatccctg gcgttgcgac agccagcgaa 360gccatggcca ggcacgagga cgggttcgac ctgttgaaac tgtttccggc ctcgattgcc 420ggcggagtca gcgctctcaa ggcgcttggc ggtccgctgc cgcacctgcg cttcatgccg 480accggcggca tcaccgaggc ggatgtcggc aaatacctcg cccttcccaa tgttttcgcg 540gccggaggct cgtggattgc gacgggcgcc gacattgctg ccgaagactc gagccgaatt 600Ctt 603<210> 324<211> 201<212> PRT<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (9)...(201)
<223> KDPG e KHG ai do!ase
<220>
<221> SITE<222> (40)...(49)
<223> Sitio ativo de kdpg e khg aldolases. Pró-sitio id = PS00159<400> 324
Met Thr Phe Pro Leu Arg ser Leu vai Glu Ala Ala Thr Lys Ala Pro15 10 15
Ile vai Pro vai Leu vai vai Asp Arg Ile Glu vai Ala Ala Pro Leu20 25 30
Ala Arg Ala Leu Val Asp Gly Gly Leu Thr lie Ala Glu vai Thr Leu35 40 45
Arg Thr Pro Ser Gly Leu Ala vai lie Glu Glu Met Lys Ser Ala Glu50 55 60
Pro Gly Leu Lys vai Gly Ala Gly Thr vai Leu Thr Glu Ser Asp vai65 70 75 80
Glu Asn Ala Leu Ala Ala Gly Ala Asp Phe Leu vai Ala Pro Gly Met85 90 95
Ser Pro Lys Leu Leu Ala Gly Leu Gly Gly His Arg Arg Leu Met Ile100 105 110
Pro Gly vai Ala Thr Ala Ser Glu Ala Met Ala Arg His Glu Asp Gly115 120 125
Phe Asp Leu Leu Lys Leu Phe Pro Ala Ser Ile Ala Gly Gly vai Ser130 135 140
Ala Leu Lys Ala Leu Gly Gly Pro Leu Pro His Leu Arg Phe Met Pro145 150 155 160
Thr Gly Gly lie Thr Glu Ala Asp vai Gly Lys Tyr Leu Ala Leu Pro165 170 175
Asn vai Phe Ala Ala Gly Gly ser Trp lie Ala Thr Gly Ala Asp Ile180 185 190
Ala Ala Glu Asp Ser Ser Arg lie Leu195 200
<210> 325<211> 648<212> DNA<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 325
atacaagaag taaaggagat tggtttattg cctttatatt atcacgacga tgcagctatt 60tgtctgaaag tagctaatac tttgtatgat gccgatgtaa aatgcataga atttacaaac 120cgtggtgaat atgcacttac aaactttaaa cacttagtga agctgagaga tgaaaagatg 180aaaggtctat tgcttgcagt gggcacaatt aaaaccggga cggatgctca gaaatttatt 240gatgccggtg ccgatttttt gatcagccca atatttgaca gcagcgtttg cgatacggcc 300tatttgaata aaacgttgtg gataccaggt tgtacaacgc caacagaaat tcatgtagca 360cagcaagcgg gttgtaagct tatcaaatta ttcccgggaa atgtactggg gccgggtttt 420gtagaagcga tcatgccatt attcagtgga attgatttta cgatcactgg tggagtagaa 480gcaacagaag caaatctggg tgcctggttt aaatcaggtg tgaaggtagt tggaatgggc 540agcaagctta taacaaaaga cattttaaag aatggtgatt atgatggatt gaaagctaaa 600acaaaagaag tgctttcaat aattcgacat attaaatcag ctaaatag 648
<210> 326<211> 215<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (1)...(200)
<223> kdpg e khg aldolase
<220>
<221> SITE
<222> (104)...(107)
<223> Sítio de N-glicosi!ação. Pró-sitio id = PS00001<400> 326
Ile Gln Glu Val Lys Glu Ile Gly Leu Leu Pro Leu Tyr Tyr His Asp1 5 10 15
Asp Ala Ala Ile Cys Leu Lys vai Ala Asn Thr Leu Tyr Asp Ala Asp20 25 30
vai Lys Cys lie Glu Phe Thr Asn Arg Gly Glu Tyr Ala Leu Thr Asn35 40 45
Phe Lys His Leu vai Lys Leu Arg Asp Glu Lys Met Lys Gly Leu Leu50 55 60
Leu Ala vai Gly Thr lie Lys Thr Gly Thr Asp Ala Gln Lys Phe lie65 70 75 80
Asp Ala Gly Ala Asp Phe Leu lie Ser Pro Ile Phe Asp ser Ser vai85 90 95
Cys Asp Thr Ala Tyr Leu Asn Lys Thr Leu Trp Ile Pro Gly Cys Thr100 105 110
Thr Pro Thr Glu lie His vai Ala Gln Gln Ala Gly Cys Lys Leu lie115 120 125Lys Leu Phe Pro Gly Asn vai Leu Gly Pro Gly Phe vai Glu Ala lie130 135 140
Met Pro Leu Phe ser Gly Ile Asp Phe Thr lie Thr Gly Gly vai Glu145 150 155 160
Ala Thr Glu Ala Asn Leu Gly Ala Trp Phe Lys ser Gly vai Lys vai165 170 175
vai Gly Met Gly Ser Lys Leu Ile Thr Lys Asp lie Leu Lys Asn Gly180 185 190
Asp Tyr Asp Gly Leu Lys Ala Lys Thr Lys Glu vai Leu ser Ile lie195 200 205
Arg His lie Lys ser Ala Lys210 215
<210> 327<211> 642<212> DNA
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 327
atggaacaat ctatctttga ttacttctac aaaatcggcg tcattcccgt actggaaatc 60gactcggcgc ttcatgccaa accgttagcc gaggcgctgc tggcaggagg tctgcctatc 120gccgagatca cactgcgcac cgaggcagcg ctcgaggcga ttcgcactat tgcgcgcgat 180gtaccggatg tcatcgtcgg ggctggaacc gtgataacct gggaacaagc cgaagcggca 240cgtgacgcgg gcgcgcaatt tctcgtctca cccgggatgg tggagcaggt tgtcatctgg 300gcacaggaaa atcaaatccc tgttctgccc ggcgctgtga cccccaccga gatgatccgc 360gccatccatc tcggtttgaa gtttctgaaa tttttcccat cggaagctgt aggcggactc 420aaagccctca aggccctctc agaccccttt ccgggattgc gatttatccc aaccggtgga 480gtgaagtttg agaatctggc ggattatcta caaatggaaa agatccacgc tgtcggcggc 540tcgtggatgg caaagcgcca gatgatcgcc gaccgaaaat tcgacgagat tacgcgattg 600gcgaatgaag ccagcgacct tgtgacaaaa atcaggaagt ag 642
<210> 328<211> 213<212> prt
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (5)...(200)
<223> kdpg e khg aldolase
<220>
<221> SITE<222> (37)...(46)
<223> Sítio ativo de KDPG e KHG aldolases. Pró-sítio id = PS00159<400> 328
Met Glu Gln Ser Ile Phe Asp Tyr Phe Tyr Lys Ile Gly Val Ile Pro1 5 10 15
vai Leu Glu Ile Asp ser Ala Leu His Ala Lys Pro Leu Ala Glu Ala20 25 30
Leu Leu Ala Gly Gly Leu Pro Ile Ala Glu lie Thr Leu Arg Thr Glu35 40 45
Ala Ala Leu Glu Ala Ile Arg Thr Ile Ala Arg Asp vai Pro Asp vai50 55 60
Ile vai Gly Ala Gly Thr vai Ile Thr Trp Glu Gln Ala Glu Ala Ala65 70 75 80
Arg Asp Ala Gly Ala Gln Phe Leu vai Ser Pro Gly Met vai Glu Gln85 90 95
vai vai lie Trp Ala Gln Glu Asn Gln lie Pro vai Leu Pro Gly Ala100 105 110
vai Thr Pro Thr Glu Met lie Arg Ala Ile His Leu Gly Leu Lys Phe115 120 125
Leu Lys Phe Phe Pro Ser Glu Ala vai Gly Gly Leu Lys Ala Leu Lys130 135 140
Ala Leu ser Asp Pro Phe Pro Gly Leu Arg Phe Ile Pro Thr Gly Gly145 150 155 160
vai Lys Phe Glu Asn Leu Ala Asp Tyr Leu Gln Met Glu Lys lie His165 170 175
Ala vai Gly Gly Ser Trp Met Ala Lys Arg Gln Met Ile Ala Asp Arg180 185 190
Lys Phe Asp Glu lie Thr Arg Leu Ala Asn Glu Ala Ser Asp Leu vai195 200 205
Thr Lys Ile Arg Lys210
<210> 329<211> 618<212> DNA
<213> Desconhecido<220>
<223> Obtido a partir de amostras ambientais<400> 329
atgactcgct tttctgaact tatgtcaggg caaacattac tgcctataat tcaagccgac 60acaccagagc aaggcgttaa aatagctcaa gctatggcta atgctggcct tactttggtt 120gaagtagtac ttagaactga tgcatcgtta gatgcattaa aagctattaa agagcaggtg 180ccagcgctta aagtaggtgc aggcacagta ataaatactg acattttaga gcaagcactt 240gcagcaggtg ccgactttat tgttacgcca gcagtgtctc cgcaattatt agccgcgcta 300acaaaatgca atgtgccggt acttcctggt gtgtctaaca cgggtgacat tttaatggcg 360cttgagtacg gttttgaaga acaaaaatta ttccctgcat cgctcgctgg tggtgcacca 420ttcgtatcgg ctgtctcgtc agtatttaga gctgctagct tttgtcctac aggtggcgta 480agcgagcaaa ataaaatgga ttacttatct ttaaataatg tatttgctgt gggtggtact 540tggattgcaa ataaagagtg ggttgcacaa gaaaactggc aagcaattac tgactcgtgt 600attcaagcat taaagtag 618
<210> 330<211> 205<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (4)...(199)
<223> kdpg e khg aldolase
<400> 330
Met Thr Arg Phe Ser Glu Leu Met Ser Gly Gln Thr Leu Leu Pro lie1 5 10 15
Ile Gln Ala Asp Thr Pro Glu Gln Gly vai Lys lie Ala Gln Ala Met20 25 30
Ala Asn Ala Gly Leu Thr Leu Val Glu Val vai Leu Arg Thr Asp Ala35 40 45
Ser Leu Asp Ala Leu Lys Ala lie Lys Glu Gln Val Pro Ala Leu Lys50 55 60
Val Gly Ala Gly Thr vai Ile Asn Thr Asp lie Leu Glu Gln Ala Leu65 70 75 80
Ala Ala Gly Ala Asp Phe lie vai Thr Pro Ala vai Ser Pro Gln Leu85 90 95
Leu Ala Ala Leu Thr Lys Cys Asn vai Pro vai Leu Pro Gly vai ser100 105 110
Asn Thr Gly Asp Ile Leu Met Ala Leu Glu Tyr Gly Phe Glu Glu Gln115 120 125
Lys Leu Phe Pro Ala ser Leu Ala Gly Gly Ala Pro Phe vai Ser Ala130 135 140
vai ser Ser Val Phe Arg Ala Ala Ser Phe Cys Pro Thr Gly Gly vai145 150 155 160
Ser Glu Gln Asn Lys Met Asp Tyr Leu Ser Leu Asn Asn vai Phe Ala165 170 175
vai Gly Gly Thr Trp Ile Ala Asn Lys Glu Trp Val Ala Gln Glu Asn180 185 190
Trp Gln Ala Ile Thr Asp Ser Cys lie Gln Ala Leu Lys195 200 205<210> 331<211> 663<212> DNA<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<400> 331
atggcatatc cgaccgcggt caattcacag attaccgaca cagcaggcaa ggttttgcat 60cgcaaactga ttgctatttt acgcggagtg aagcccgatg aagcggcatc catggcgcgt 120gtgctggtcg atgccgggat cacgatgatc gaggtgccgc tgaattcccc ggaaccgctt 180aaaagcattg cgatcatgaa ggcagaagtc ggtgacgcgg ccctgatcgg ggcaggtacg 240gtcttaacgg tcgaggatgt tgtgaacgtt cgtgacgcgg gcggtgagtt tgttgtgtcg 300cccaattacg atgtcgatgt gattaaaaaa accaaggaag tcggtatggg aagttggccg 360ggggtgctga ctccgaccga atgtttcgcc gcgatcaagg ccggggcgga tgggcttaaa 420atattccctg ccagcatcat tggcgcatcg gggatttcgg cgatgcgggc ggttttgcca 480aaagatatgc cggtttatgc ggttggtggt gttgggccgg atgattttgc gacctatgcc 540aaggcggggt gcgatggttt cggccttgga tcggggattt ataaacccgg cctgacagcg 600gacgaagtat cggggcgcgc tattgccttc gtaacggcgc atgacgcggt atttgcgggc 660tag 663
<210> 332<211> 220<212> PRT<213> Desconhecido
<220>
<223> obtido a partir de amostras ambientais<220>
<221> DOMÍNIO
<222> (15)...(211)
<223> KDPG e KHG aldolase
<400> 332
Met Ala Tyr Pro Thr Ala vai Asn Ser Gln lie Thr Asp Thr Ala Gly1 5 10 15
Lys vai Leu His Arg Lys Leu lie Ala lie Leu Arg Gly vai Lys Pro20 25 30
Asp Glu Ala Ala ser Met Ala Arg vai Leu vai Asp Ala Gly Ile Thr35 40 45
Met Ile Glu vai Pro Leu Asn ser Pro Glu Pro Leu Lys ser Ile Ala50 55 60
Ile Met Lys Ala Glu vai Gly Asp Ala Ala Leu lie Gly Ala Gly Thr65 70 75 80
vai Leu Thr vai Glu Asp Val vai Asn vai Arg Asp Ala Gly Gly Glu85 90 95
Phe vai vai Ser Pro Asn Tyr Asp vai Asp vai Ile Lys Lys Thr Lys100 105 110
Glu vai Gly Met Gly Ser Trp Pro Gly Val Leu Thr Pro Thr Glu Cys115 120 125
Phe Ala Ala lie Lys Ala Gly Ala Asp Gly Leu Lys Ile Phe Pro Ala130 135 140
ser lie lie Gly Ala Ser Gly lie Ser Ala Met Arg Ala Val Leu Pro145 150 155 160
Lys Asp Met Pro Val Tyr Ala Val Gly Gly vai Gly Pro Asp Asp Phe165 170 175
Ala Thr Tyr Ala Lys Ala Gly Cys Asp Gly Phe Gly Leu Gly ser Gly180 185 190
Ile Tyr Lys Pro Gly Leu Thr Ala Asp Glu vai ser Gly Arg Ala lie195 200 205
Ala Phe vai Thr Ala His Asp Ala vai Phe Ala Gly210 215 220
<210> 333<211> 648
<212> dna
<213> Desconhecido<220>
<223> obtido a partir de amostras ambientais<400> 333
atggcgattg atcccgccgc tgccagtcgg cgcatgcgcg aattggcggc gctggccccg 60gtgatcccgg tgctggtgat cgaggatgcc gcaagggcga ggcccctggc cgaggcgctg 120gtggcgggtg gtctgccggt gctggaggtg acgctgcgca ccccggccgc gccagaggtc 180attcgcgaga tgtcccgggt cccgggggcc attgtcggcg ccggcaccgt gatcacaccg 240gccgacgtgc ggatcgcaca agcggcgggg gcccgattcg ccgtctcccc cggcgcgacc 300gatgcgttgc tcgatgcctg cgaagcggcg gggctgccgc tcctgcccgg cgcggccacg 360gcgagcgagg cgatggcgct tctggcgcgc ggctacgaca tgctgaagtt ctttcccgcc 420gaggcagtgg gcggcgcggc ggcgcttgca gcgctgggcg cgccgctgcc gcagatttcc 480ttctgcccga ccggaggggt cagcccggca aacgcgcccg actacctcgc cttgcccacg 540gttccctgcg tcggcggcag ctgggtggcc ccgaaaccac aggtcgccgc cggcgactgg 600gacgcgatcc gtgccctcgc cgaacacgcc cgcaccctcg cgccctga 648
<210> 334<211> 215<212> prt<213> Desconhecido
<220>
<223> Obtido a partir de amostras ambientais<220>
<221> domínio
<222> (12)...(206)
<223> kdpg e khg aldolase
<220>
<221> site
<222> (44)...(53)
<223> Sitio ativo de kdpg e khg aldolases. Pró-sitio id = PS00159<220>
<221> SITE
<222> (133)...(146)
<223> Resíduo de formação de base de schiff de kdpg e khg. Pró-siteps00160
<400> 334
Met Ala Ile Asp Pro Ala Ala Ala Ser Arg Arg Met Arg Glu Leu Ala1 5 10 15
Ala Leu Ala Pro vai Ile Pro Val Leu vai lie Glu Asp Ala Ala Arg20 25 30
Ala Arg Pro Leu Ala Glu Ala Leu Val Ala Gly Gly Leu Pro vai Leu35 40 45
Glu vai Thr Leu Arg Thr Pro Ala Ala Pro Glu vai lie Arg Glu Met50 55 60
ser Arg Val Pro Gly Ala Ile vai Gly Ala Gly Thr Val Ile Thr Pro65 70 75 80
Ala Asp vai Arg Ile Ala Gln Ala Ala Gly Ala Arg Phe Ala vai ser85 90 95
Pro Gly Ala Thr Asp Ala Leu Leu Asp Ala Cys Glu Ala Ala Gly Leu100 105 110
Pro Leu Leu Pro Gly Ala Ala Thr Ala Ser Glu Ala Met Ala Leu Leu115 120 125
Ala Arg Gly Tyr Asp Met Leu Lys Phe Phe Pro Ala Glu Ala vai Gly130 135 140
Gly Ala Ala Ala Leu Ala Ala Leu Gly Ala Pro Leu Pro Gln Ile ser145 150 155 160
Phe Cys Pro Thr Gly Gly vai Ser Pro Ala Asn Ala Pro Asp Tyr Leu165 170 175
Ala Leu Pro Thr vai Pro Cys Val Gly Gly Ser Trp vai Ala Pro Lys180 185 190
Pro Gln vai Ala Ala Gly Asp Trp Asp Ala Ile Arg Ala Leu Ala Glu195 200 205
His Ala Arg Thr Leu Ala Pro210 215
<210> 335
<211> 19
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador<220>
<221> Região de interesse biológico
<222> (1)..(19)
<223> b é c, g, ou t<220>
<221> Região de interesse biológico
<222> (1)..(19)
<223> y é c ou t
<220>
<221> Região de interesse biológico
<222> (1)..(19)
<223> r é a ou g
<220>
<221> Região de interesse biológico
<222> (1)..(19)
<223> w é a ou t
<400> 335
aargtbtwyg argacaatg
<210> 336
<211> 18
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador<220>
<221> Região de interesse biológico
<222> (1)..(18)
<223> d é a, g, ou t
<220>
<221> Região de interesse biológico
<222> (1)..(18)
<223> y é c ou t
<220>
<221> Região de interesse biológico
<222> (1)..(18)
<223> r é a ou g
<220>
<221> Região de interesse biológico
<222> (1)..(18)
<223> w é a ou t
<400> 336gcdcagawca ayggrtgg
<210> 337
<211> 23
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador<220>
<221> Região de interesse biológico
<222> (1)..(23)
<223> d é a, g, ou t
<220>
<221> Região de interesse biológico
<222> (1)..(23)
<223> y é c ou t
<220>
<221> Região de interesse biológico
<222> (1)..(23)
<223> r é a ou g
<220><221> Região de interesse biológico<222> (1)..(23)<223> s é c ou g
<400> 337
ccatcrsyat cdgcrtadag cca
<210> 338
<211> 20
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador<220>
<221> Região de interesse biológico
<222> (1)..(20)
<223> d é a, g, ou t
<220>
<221> Região de interesse biológico
<222> (1)..(20)
<223> y é c ou t
<220>
<221> Região de interesse biológico
<222> (1)..(20)
<223> r é a ou g
<220>
<221> Região de interesse biológico
<222> (1)..(20)
<223> η é a, c, g, ou t
<400> 338
gcrtadagcc aytcnccrtc
<210> 339
<211> 30
<212> DNA
<213> sequencia artificial<220>
<223> iniciador
<400> 339
ataagacata tgcctatcgt tgttacgaag
<210> 340
<211> 33
<212> DNA
<213> sequencia artificial<220>
<223> iniciador
<400> 340
ataagaggat ccttattcct cgggcagccg ctc
<210> 341
<211> 30
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 341
ataagacata tgaacagacc tgtggttgtc
<210> 342<211> 33
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador
<400> 342
ataagaggat ccttacaggt acttgagacc gag 33
<210> 343
<211> 30
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 343
ataagacata tgagcgtggt catccgaaac 30
<210> 344
<211> 33
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 344
ataagaggat ccttacttcg ctttgttata ggc 33
<210> 345
<211> 30
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador
<400> 345
ataagacata tgaacaagcc cgtggttgtg 30
<210> 346
<211> 34
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador
<400> 346
ataagaggat ccttacaagt acttgagacc gagg 34
<210> 347
<211> 29
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 347
ataagacata tgagcgtggt cgtcaccgg 29
<210> 348
<211> 34
<212> DNA
<213> Sequencia artificial<220>
<223> lniciador<400> 348
ataagaggat ccttagccgt ttttcccgtc ggtg
<210> 349
<211> 33
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 349
agaagacata tgatgagcat cgtcgtccag aac
<210> 350
<211> 34
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador
<400> 350
agaagaggat cctcagacat atttcaggcc cttg
<210> 351
<211> 30
<212> DNA
<213> Sequencia artificial<220>
<223> lniciador
<400> 351
agaagacata tgatgagcgt ggtcatcacc
<210> 352
<211> 33
<212> DNA
<213> Sequencia artificial<220>
<223> lniciador
<400> 352
acaacaggat ccctatttct tctccggcgt ttc
<210> 353
<211> 30
<212> DNA
<213> sequencia artificial<220>
<223> lniciador
<400> 353
ataatacata tgagcgtcgt cgttcagaac
<210> 354
<211> 34
<212> DNA
<213> sequencia artificial<220>
<223> lniciador
<400> 354ataataggat ccttagacat atttgagccc cttc
<210> 355
<211> 33
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 355
agaagacata tgatgtcggt tgtcgttcag aac
<210> 356
<211> 31
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador
<400> 356
agaagaggat cctcagatat acttcaggcc c
<210> 357
<211> 852
<212> DNA
<213> Sequencia artificial<220>
<223> ATCC 4978 DAAT
<400> 357
atgagttata gcttatggaa tgaccaaatt gtgaatgatggaggaccgtg gctatcaatt tggcgatggt gtttatgaaggaattattta cagcggagga gcatgtcgat cgtttttacggttacgatcc cttatacaaa agacaaattg catcaattataataaagttc aaacaggaca tatttatttc caaattacgccatattttcc ctggtgatga agtgaagcca gtattaacagcgtcccgtag caaactttga aaaaggtgtg aaagcaacatttacgctgtg acattaaatc attaaattta cttggtgcggcatgaaaaag gatgctatga agcggtttta catcgtgatgtcttcaaata tttatggaat taaagatggc gtattatacaatcttaaatg gtattacacg tcaagtaatc attaaatgtggtgaaggaag aagcaatgac aaaaactcag cttcttgcaatcaacgactt cagaagtaac gccaattatc gacatagatgaaaccgggtg actggacacg taaattacaa gcacaatttg
attcgcgcat aa
<210> 358
<211> 283
<212> PRT
<213> Sequencia artificial<220>
<223> ATCC 4978 DAAT
33
31
aagaagtagt agttgataag 60ttgtaaaagt atataacggt 120cgagtgctga aaaaattcgc 180tgcatcagtt agttgaaatg 240gtggtgcagg ccctcgtaat 300gtaataccaa ggaaaatcca 360ttgtagaaga cattcgttgg 420tacttgctaa acaagaagca 480aaatcgtaac agaaggctct 540cacatccagc gaataacttc 600ctgctgaaat tggcttacca 660tggatgaagt gattgtttca 720gaacagtaat tggtgcgggt 780atacgaaaat cccaaaaggt 840 852
<400> 358Met ser Tyr Ser Leu Trp Asn Asp Gln Ile Val Asn Asp Glu Glu vai1 5 10 15
vai vai Asp Lys Glu Asp Arg Gly Tyr Gln Phe Gly Asp Gly vai Tyr20 25 30
Glu vai vai Lys vai Tyr Asn Gly Glu Leu Phe Thr Ala Glu Glu His35 40 45
Val Asp Arg Phe Tyr Ala Ser Ala Glu Lys Ile Arg vai Thr lie Pro50 55 60
Tyr Thr Lys Asp Lys Leu His Gln Leu Leu His Gln Leu vai Glu Met65 70 75 80
Asn Lys vai Gln Thr Gly His lie Tyr Phe Gln Ile Thr Arg Gly Ala85 90 95
Gly Pro Arg Asn His Ile Phe Pro Gly Asp Glu vai Lys Pro vai Leu100 105 110
Thr Gly Asn Thr Lys Glu Asn Pro Arg Pro vai Ala Asn Phe Glu Lys115 120 125
Gly vai Lys Ala Thr Phe vai Glu Asp lie Arg Trp Leu Arg Cys Asp130 135 140
lie Lys ser Leu Asn Leu Leu Gly Ala Val Leu Ala Lys Gln Glu Ala145 150 155 160
His Glu Lys Gly Cys Tyr Glu Ala vai Leu His Arg Asp Glu lie vai165 170 175
Thr Glu Gly ser ser Ser Asn Ile Tyr Gly lie Lys Asp Gly vai Leu180 185 190
Tyr Thr His Pro Ala Asn Asn Phe Ile Leu Asn Gly Ile Thr Arg Gln195 200 205
vai Ile lie Lys Cys Ala Ala Glu Ile Gly Leu Pro vai Lys Glu Glu210 215 220
Ala Met Thr Lys Thr Gln Leu Leu Ala Met Asp Glu vai lie vai ser225 230 235 240
Ser Thr Thr Ser Glu vai Thr Pro lie Ile Asp lie Asp Gly Thr vai245 250 255
Ile Gly Ala Gly Lys Pro Gly Asp Trp Thr Arg Lys Leu Gln Ala Gln260 265 270
Phe Asp Thr Lys Ile Pro Lys Gly lie Arg Ala275 280
<210> 359<211> 35<212> DNA<213> Sequencia artificial<220>
<223> Iniciador mutagênico<400> 359
gtgattgttt catcaacgaa ttcagaagta acgcc
<210> 360
<211> 35
<212> DNA
<213> sequencia artificial<220>
<223> iniciador mutagênico
<400> 360
gtgattgttt catcaacgcg ttcagaagta acgcc
<210> 361
<211> 35
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador mutagênico
<400> 361
gtgattgttt catcaacgag ttcagaagta acgcc
<210> 362
<211> 35
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador mutagênico
<400> 362
gtgattgttt catcaacggc ttcagaagta acgcc
<210> 363
<211> 31
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador mutagênico
<400> 363
gtgcaggccc tcgtgctcat attttccctg g
<210> 364
<211> 45
<212> DNA
<213> sequencia artificial<220>
<223> iniciador mutagênico
<400> 364
gaagtgattg tttcatcaac gcagtcagaa gtaacgccaa ttatc
<210> 365
<211> 40
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador mutagênico<400> 365
catatgagtt atagcttatg gaatgaccaa attgtgaatg 40
<210> 366
<211> 34
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador mutagênico
<400> 366
ctcgagtgcg gccgcaagct tgtcgacgga gctc 34
<210> 367<211> 95<212> DNA
<213> Sequencia artificial<220>
<223> iniciador mutagênico<400> 367
aatatttatg gaattaaaga tggcgtatta tacacacatc cagcgaataa catgatctta 60aatggtatta cacgtcaagt aatcattaaa tgtgc 95
<210> 368
<211> 34
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador mutagênico
<400> 368
ggccagtgaa ttgtaatacg actcactata gggc 34
<210> 369
<211> 42
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador mutagênico
<400> 369
cgccatcttt aattccataa atatttgaag aagagccttc tg 42
<210> 370<211> 66<212> DNA
<213> Sequencia artificial<220>
<223> iniciador mutagênico<400> 370
gcaacatttg tagaagacat tcgttgggaa tactgttaca ttaaatcatt aaatttactt 60ggtgcg 66
<210> 371
<211> 55
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador mutagênico<400> 371
gtattataca cacatccagc gaataactac atcttaaatg gtattacacg tcaag 55
<210> 372
<211> 64
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador mutagênico
<400> 372
gcaatggatg aagtgattgt ttcatcaacg actaaagaag taacgccaat tatcgacata 60gatg 64
<210> 373
<211> 64
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador mutagênico
<400> 373
gcaatggatg aagtgattgt ttcatcaacg aataaagaag taacgccaat tatcgacata 60gatg 64
<210> 374
<211> 64
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador mutagênico
<400> 374
gcaatggatg aagtgattgt ttcatcaacg aatcgtgaag taacgccaat tatcgacata 60gatg 64
<210> 375
<211> 16
<212> PRT
<213> P. striata
<220>
<221> Região de interesse biológico
<222> (12)..(12)
<223> xaa pode ser qualquer aminoácido de ocorrência natural
<400> 375
Leu Thr Ala vai Leu Lys Ala Asp Ala Tyr Gly xaa Gly lie Gly Leu15 10 15
<210> 376
<211> 28
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 376
agaagacata tgccctttcg ccgtaggg 28<210> 377
<211> 32
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador
<400> 377
agaagaggat cctcagtcga cgagtatctt cg 32
<210> 378 <211> 1230 <212> DNA <213> sequencia artificial <220> <223> KT2440 BAR <400> 378 atgccctttc gccgtaccct tctggctgca tccctggcac ttctgatcac cggacaggcc 60cccctgtatg cggcaccacc gttgtcgatg gacaacggca ccaacaccct gaccgtgcaa 120aacagcaatg cctgggtcga agtcagcgcc agcgccctgc agcacaacat ccgcacgctg 180caggccgagc tggccggcaa gtccaagctg tgcgccgtgc tcaaggccga tgcctatggc 240cacggtatcg gcctggtaat gccatcgatc atcgcccaag gcgtgccctg cgtggcggtg 300gccagcaacg aggaggcccg cgtggtccgc gccagtggct tcaccgggca actggtgcgg 360gtacgcctgg ccagcctcag cgagctggaa gatggcttgc agtacgacat ggaagagctg 420gtgggcagcg cggaatttgc ccgccaggcc gatgccatcg ccgcgcgcca tggcaagacc 480ttgcgcattc acatggcgct caactccagc ggcatgagcc gcaacggggt ggagatggcc 540acctggtccg gccgtggcga agcgctgcag atcaccgacc agaagcacct caagctggtc 600gcgctgatga cccacttcgc cgtggaagac aaggacgatg tacgcaaggg cctggcggca 660ttcaacgagc agaccgactg gttgatcaag cacgccaggc tggaccgcag caagctcacc 720ctgcacgccg ccaactcgtt cgctacgctg gaagtgccgg aagcgcgcct ggacatggta 780cgaacgggtg gcgcgctgtt cggcgacacc gtgccggcgc gcaccgagta caaacgtgcg 840atgcagttca aatcgcacgt ggcggcggtg cacagctatc cggccggcaa caccgtgggc 900tatgaccgca ccttcaccct ggcccgtgat tcgcggctgg ccaacattac ggtcgggtac 960tccgatggct accgccgggt attcaccaac aagggccatg tgctgatcaa cggccaccgt 1020gtgccggtcg tgggcaaggt gtcgatgaac acgctgatgg tcgatgtcac cgacttccct 1080gatgtgaagg ggggtaacga agtggtgctg ttcggcaagc aggccggggg cgaaatcacc 1140caggccgaga tggaagaaat caacggcgcg ttgctcgccg atttgtacac cgtatggggc 1200aattccaacc cgaagatact cgtcgactga 1230<210> 379 <211> 409 <212> PRT
<213> sequencia artificial<220>
<223> KT2440 BAR<400> 379
Met Pro Phe Arg Arg Thr Leu Leu Ala Ala Ser Leu Ala Leu Leu Ile1 5 10 15Thr Gly Gln Ala Pro Leu Tyr Ala Ala Pro Pro Leu Ser Met Asp Asn20 25 30
Gly Thr Asn Thr Leu Thr vai Gln Asn Ser Asn Ala Trp vai Glu vai35 40 45
Ser Ala ser Ala Leu Gln His Asn Ile Arg Thr Leu Gln Ala Glu Leu50 55 60
Ala Gly Lys ser Lys Leu Cys Ala vai Leu Lys Ala Asp Ala Tyr Gly65 70 75 80
His Gly Ile Gly Leu vai Met Pro Ser lie Ile Ala Gln Gly vai Pro85 90 95
Cys vai Ala Val Ala Ser Asn Glu Glu Ala Arg vai vai Arg Ala Ser100 105 110
Gly Phe Thr Gly Gln Leu Val Arg vai Arg Leu Ala ser Leu ser Glu115 120 125
Leu Glu Asp Gly Leu Gln Tyr Asp Met Glu Glu Leu vai Gly ser Ala130 135 140
Glu Phe Ala Arg Gln Ala Asp Ala Ile Ala Ala Arg His Gly Lys Tnr145 150 155 160
Leu Arg Ile His Met Ala Leu Asn Ser ser Gly Met Ser Arg Asn Gly165 170 175
vai Glu Met Ala Thr Trp ser Gly Arg Gly Glu Ala Leu Gln lie Thr180 185 190
Asp Gln Lys His Leu Lys Leu vai Ala Leu Met Thr His Phe Ala vai195 200 205
Glu Asp Lys Asp Asp vai Arg Lys Gly Leu Ala Ala Phe Asn Glu Gln210 215 220
Thr Asp Trp Leu lie Lys His Ala Arg Leu Asp Arg Ser Lys Leu Thr225 230 235 240
Leu His Ala Ala Asn Ser Phe Ala Thr Leu Glu vai Pro Glu Ala Arg245 250 255
Leu Asp Met vai Arg Thr Gly Gly Ala Leu Phe Gly Asp Thr vai Pro260 265 270
Ala Arg Thr Glu Tyr Lys Arg Ala Met Gln Phe Lys Ser His vai Ala275 280 285
Ala vai His Ser Tyr Pro Ala Gly Asn Thr vai Gly Tyr Asp Arg Thr290 295 300
Phe Thr Leu Ala Arg Asp Ser Arg Leu Ala Asn Ile Thr Val Gly Tyr305 310 315 320Ser Asp Gly Tyr Arg Arg vai Phe Thr Asn Lys Gly His vai Leu lie325 330 335
Asn Gly His Arg Val Pro vai Val Gly Lys vai Ser Met Asn Thr Leu340 345 350
Met vai Asp Val Thr Asp Phe Pro Asp vai Lys Gly Gly Asn Glu Val355 360 365
vai Leu Phe Gly Lys Gln Ala Gly Gly Glu lie Thr Gln Ala Glu Met370 375 380
Glu Glu Ile Asn Gly Ala Leu Leu Ala Asp Leu Tyr Thr Val Trp Gly385 390 395 400
Asn Ser Asn Pro Lys Ile Leu Val Asp405
<210> 380<211> 1152<212> DNA
<213> Geobacillus stearothermophilus<400> 380
atggacgagt ttcaccgcga tacgtgggcg gaagtggatt tggacgccat ttacgacaat 60gtggagaatt tgcgccgttt gctgccggac gacacgcaca ttatggcggt cgtgaaggcg 120aacgcctatg gacatgggga tgtgcaggtg gcaaggacag cgctcgaagc gggggcctcc 180cgcctggcgg ttgccttttt ggatgaggcg ctcgctttaa gggaaaaagg aatcgaagcg 240ccgattctag ttctcggggc ttcccgtcca gctgatgcgg cgctggccgc ccagcagcgc 300attgccctga ccgtgttccg ctccgactgg ttggaagaag cgtccgccct ttacagcggc 360ccttttccta ttcatttcca tttgaaaatg gacaccggca tgggacggct tggagtgaaa 420gacgaggaag agacgaaacg aatcgtagcg ctgattgagc gccatccgca ttttgtgctt 480gaaggggtgt acacgcattt tgcgactgcg gatgaggtga acaccgatta tttttcctat 540cagtataccc gttttttgca catgctcgaa tggctgccgt cgcgcccgcc gctcgtccat 600tgcgccaaca gcgcagcgtc gctccgtttc cctgaccgga cgttcaatat ggtccgcttc 660ggcattgcca tgtatgggct tgccccgtcg cccggcatca agccgctgct gccgtatcca 720ttaaaagaag cattttcgct ccatagccgc ctcgtacacg tcaaaaaact gcaaccaggc 780gaaaaggtga gctatggtgc gacgtacact gcgcagacgg aggagtggat cgggacgatt 840ccgatcggct atgcggacgg ctggctccgc cgcctgcagc actttcatgt ccttgttgac 900ggacaaaagg cgccgattgt cggccgcatt tgcatggacc agtgcatgat ccgcctgcct 960ggtccgctgc cggtcggcac gaaggtgaca ctgattggtc gccaagggga cgaggtaatt 1020tccattgatg atgtcgctcg ccatttggaa acgatcaact acgaagtgcc ttgcacgatc 1080agttatcgag tgccccgtat ttttttccgc cataagcgta taatggaagt gagaaacgcc 1140gttggccgcg ga 1152
<210> 381<211> 384<212> PRT<213> Geobacillus stearothermophilus<400> 381
Met Asp Glu Phe His Arg Asp Thr Trp Ala Glu Val Asp Leu Asp Ala1 5 10 15
Ile Tyr Asp Asn Val Glu Asn Leu Arg Arg Leu Leu Pro Asp Asp Thr20 25 30
His Ile Met Ala vai vai Lys Ala Asn Ala Tyr Gly His Gly Asp vai35 40 45
Gln vai Ala Arg Thr Ala Leu Glu Ala Gly Ala Ser Arg Leu Ala vai50 55 60
Ala Phe Leu Asp Glu Ala Leu Ala Leu Arg Glu Lys Gly Ile Glu Ala65 70 75 80
Pro lie Leu vai Leu Gly Ala ser Arg Pro Ala Asp Ala Ala Leu Ala85 90 95
Ala Gln Gln Arg Ile Ala Leu Thr vai Phe Arg ser Asp Trp Leu Glu100 105 110
Glu Ala Ser Ala Leu Tyr Ser Gly Pro Phe Pro lie His Phe His Leu115 120 125
Lys Met Asp Thr Gly Met Gly Arg Leu Gly vai Lys Asp Glu Glu Glu130 135 140
Thr Lys Arg lie vai Ala Leu lie Glu Arg His Pro His Phe vai Leu145 150 155 160
Glu Gly vai Tyr Thr His Phe Ala Thr Ala Asp Glu vai Asn Thr Asp165 170 175
Tyr Phe Ser Tyr Gln Tyr Thr Arg Phe Leu His Met Leu Glu Trp Leu180 185 190
Pro Ser Arg Pro Pro Leu vai His Cys Ala Asn Ser Ala Ala Ser Leu195 200 205
Arg Phe Pro Asp Arg Thr Phe Asn Met vai Arg Phe Gly Ile Ala Met210 215 220
Tyr Gly Leu Ala Pro Ser Pro Gly Ile Lys Pro Leu Leu Pro Tyr Pro225 230 235 240
Leu Lys Glu Ala Phe Ser Leu His Ser Arg Leu vai His vai Lys Lys245 250 255
Leu Gln Pro Gly Glu Lys Val Ser Tyr Gly Ala Thr Tyr Thr Ala Gln260 265 270
Thr Glu Glu Trp lie Gly Thr lie Pro Ile Gly Tyr Ala Asp Gly Trp275 280 285Leu Arg Arg Leu Gln His Phe His vai Leu vai Asp Gly Gln Lys Ala290 295 300
Pro lie vai Gly Arg lie Cys Met Asp Gln Cys Met lie Arg Leu Pro305 310 315 320
Gly Pro Leu Pro vai Gly Thr Lys vai Thr Leu Ile Gly Arg Gln Gly325 330 335
Asp Glu vai lie Ser lie Asp Asp vai Ala Arg His Leu Glu Thr lie340 345 350
Asn Tyr Glu Val Pro Cys Thr lie ser Tyr Arg vai Pro Arg Ile Phe355 360 365
Phe Arg His Lys Arg Ile Met Glu vai Arg Asn Ala vai Gly Arg Gly370 375 380
<210> 382
<211> 43
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador mutagênico
<400> 382
gccatttgga aacgatcaac gcggaagtgc cttgcacgat cag 43
<210> 383
<211> 30
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 383
gatataccat ggcatactca ttatggaatg 30
<210> 384
<211> 32
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 384
gttatcggat ccttaggcat taattgaaat tg 32
<210> 385
<211> 36
<212> DNA
<213> sequencia artificial<220>
<223> iniciador
<400> 385
gaggagctcg agtcagacgt atttcagtcc tttttc 36
<210> 386
<211> 29
<212> DNA
<213> Sequencia artificial<220>
<22Β> lniciador<400> 386
agaagacata tgatttatca gccggggac
<210> 387
<211> 30
<212> DNA
<213> sequencia artificial<220>
<223> lniciador
<400> 387
agaagacata tgggtgtcgt cgtccaaaac
<210> 388
<211> 31
<212> DNA
<213> sequencia artificial<220>
<223> lniciador
<400> 388
ataataggat ccttagacat atttgaggcc
<210> 389
<211> 28
<212> DNA
<213> Sequencia artificial<220>
<223> lniciador
<400> 389
ataatacata tgaagccggt ggtggtgc
<210> 390
<211> 31
<212> DNA
<213> sequencia artificial
<220>
<223> lniciador
<400> 390
agaagaggat ccttagacat aggtgagccc
<210> 391
<211> 26
<212> DNA
<213> Sequencia artificial<220>
<223> lniciador
<400> 391
ataataccat gggtgtcgtg gtccag
<210> 392
<211> 32
<212> DNA
<213> Sequencia artificial<220>
<223> lniciador
<400> 392agaagaggat ccttagacat atttcaggcc cc
<210> 393
<211> 30
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 393
gcggaacata tgtttgagaa cattaccgcc
<210> 394
<211> 32
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador
<400> 394
ataaccggat ccttacagca ctgccacaat cg
<210> 395
<211> 36
<212> DNA
<213> sequencia artificial<220>
<223> iniciador
<400> 395
cgctcttatg gttcggtttg cttgggttgc tcaccc
<210> 396
<211> 36
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador
<400> 396
gggtgagcaa cccaagcttt ccgaaccata agagcg
<210> 397
<211> 39
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador
<400> 397
caaaaaatac cagcgttaag ggagtgtggg tgagcaacc
<210> 398
<211> 29
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador
<400> 398
cattaccgcc gctactgccg acccgattc
<210> 399<211> 39
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 399
caccaaaaat tacctcggcg tagacggcat ccctgaatt
<210> 400
<211> 35
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador
<400> 400
tgatgcggaa aatcacgctc ttgacttcga tgcac
<210> 401
<211> 35
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 401
gcggcgccat ggaaaatgat ccgattggtc taatg
<210> 402
<211> 33
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador
<400> 402
gcggcggtcg acgcaattac aattgtgttt gtc
<210> 403
<211> 34
<212> DNA
<213> Sequencia artificial<220>
<223> iniciador
<400> 403
gcggcgccat ggatgtatgt ataattttat ttag
<210> 404
<211> 36
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 404
gcggcggtcg acaaatttca ttattcattc taattt
<210> 405
<211> 36
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador<400> 405
ggccggcata tgtcgatcct taacgactac aaacgt 36
<210> 406
<211> 36
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador
<400> 406
ggaaggctcg agtcatgatt ggtttccaga caaatt 36
<210> 407<211> 27<212> PRT
<213> Sequencia artificial<220>
<223> Synthetic Signal Sequence<400> 407
Met Ser Ile vai vai Thr Lys Ile Glu Arg Ala Gly Ala Ala Ala vai15 10 15
Ala Ala Leu Arg Thr Ser Gly vai Ala Thr vai20 25
<210> 408<211> 28<212> DNA
<213> sequencia artificial<220>
<223> Iniciador<400> 408
ataatacata tgcccttctc ccgtaccc 28
<210> 409
<211> 31
<212> DNA
<213> sequencia artificial<220>
<223> Iniciador
<400> 409
gcggcgggat ccttactgat ctttcaggat t 31
<210> 410<211> 1230<212> DNA
<213> Sequencia artificial
<223> Pseudomonas taetrolens arginine racemase<400> 410
atgcccttct cccgtaccct gctcgccctt tcccttggca tggcattgct gcaaaacccg 60gcctttgctg cgccacccct gtcgatgacc gacggcgtag ctcaagtgaa tacccaggac 120agcaatgcct gggtcgaaat caataaagcc gcgttcgagc acaacatacg gactctgcaa 180accgccctcg ccggcaagtc gcagatctgc gccgtactca aggcggatgc ctatggccac 240ggtatcggct tgttgatgcc ctcggtgatc gccatgggtg ttccctgtgt cggtgtcgcc 300agcaacgaag aagcccgcgt cgtgcgcgag agcggtttca agggtcaact gatacgcgtg 360cgcaccgctg ccctgagcga actggaagct gcactgccgt acaacatgga agagctggtg 420ggcaacctgg acttcgcggt caaggccagc ctgattgccg aggatcacgg tcgcccgctg 480gtggtgcacc tgggtctgaa ttccagcggc atgagccgta acggagtgga catgaccacc 540gctcagggcc gtcgtgatgc ggtagctatc accaaggtgc caaacctgga agtgcgggcg 600atcatgaccc acttcgcggt cgaagatgct gccgacgtgc gtgccgggct caaggccttc 660aatcagcaag cccaatggct gatgaacgtg gcccagcttg atcgcagcaa gatcaccctg 720cacgcggcca actcgttcgc cacactggag gtgcccgaat cgcatctgga catggtccgc 780cccggcggcg cgctgttcgg cgacaccgta ccgtcccaca ccgagtacaa gcgggtcatg 840cagttcaagt cccacgtggc gtcggtcaac agctacccca agggcaacac cgtcggttat 900gaccgcacgt acaccctggg ccgcgactcg cggctggcca acatcaccgt cggctactct 960gacggctacc gccgcgcgtt taccaataaa gggattgtgc tgatcaacgg ccatcgcgtg 1020ccagtggtgg gcaaagtctc gatgaacacc ctgatggtgg acgtcactga cgcgccggat 1080gtgaaaagcg gcgatgaagt ggtgctgttc gggcaccagg gcaaggccga gattacccag 1140gctgagatcg aagacatcaa cggtgcactg cttgcggatc tgtataccgt gtggggcaat 1200tccaacccta aaatcctgaa agatcagtaa 1230
<210> 411
<211> 29
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 411
tacccaggct gagatggaag acatcaacg 29
<210> 412
<211> 23
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 412
gccagcaacg argargcmcg cgt 23
<210> 413
<211> 18
<212> DNA
<213> Sequencia artificial<220>
<223> Iniciador
<400> 413
tggccstkga tcagcaca 18
<210> 414
<211> 716
<212> DNA
<213> Sequencia artificial<220>
<223> Produto PCR de Α. caviae<400> 414 gccagcaacg argargcmcg cgttgcccgc gagaagggct tcgaaggtcg cctgatgcgg 60gtacgtgccg ccaccccgga tgaagtggag caggccctgc cctacaagct ggaggagctc 120atcggcagcc tggagagcgc caaggggatc gccgacatcg cccagcgcca tcacaccaac 180atcccggtgc acatcggcct gaactccgcc ggcatgagcc gcaacggcat cgatctgcgc 240caggacgatg ccaaggccga tgccctggcc atgctcaagc tcaaggggat caccccggtc 300ggcatcatga cccacttccc ggtggaggag aaagaggacg tcaagctggg gctggcccag 360ttcaagctgg actaccagtg gctcatcgac gccggcaagc tggatcgcag caagctcacc 420atccacgccg ccaactcctt cgccaccctg gaagtaccgg aagcctactt tgacatggtg 480cgcccgggcg gcatcatcta tggcgacacc attccctcct acaccgagta caagaaggtg 540atggcgttca agacccaggt cgcctccgtc aaccactacc cggcgggcaa caccgtcggc 600tatgaccgca ccttcaccct caagcgcgac tccctgctgg ccaacctgcc gatgggctac 660tccgacggct accgccgcgc catgagcaac aaggcctatg tgctgatcma sggcca 716
<210> 415
<211> 238
<212> PRT
<213> Aeromonas caviae<220>
<221> REGIÃO DE INTERESSE BIOLÓGICO
<222> (237)..(237)
<223> xaa can be Phe1 Gln, Asn ou Lys
<400> 415
Ala Ser Asn Glu Glu Ala Arg Val Ala Arg Glu Lys Gly Phe Glu Gly1 5 10 15
Arg Leu Met Arg Val Arg Ala Ala Thr Pro Asp Glu vai Glu Gln Ala20 25 30
Leu Pro Tyr Lys Leu Glu Glu Leu Ile Gly ser Leu Glu Ser Ala Lys35 40 45
Gly Ile Ala Asp lie Ala Gln Arg His His Thr Asn lie Pro vai His50 55 60
Ile Gly Leu Asn Ser Ala Gly Met Ser Arg Asn Gly Ile Asp Leu Arg65 70 75 80
Gln Asp Asp Ala Lys Ala Asp Ala Leu Ala Met Leu Lys Leu Lys Gly85 90 95
Ile Thr Pro vai Gly lie Met Thr His Phe Pro vai Glu Glu Lys Glu100 105 110
Asp vai Lys Leu Gly Leu Ala Gln Phe Lys Leu Asp Tyr Gln Trp Leu115 120 125
Ile Asp Ala Gly Lys Leu Asp Arg ser Lys Leu Thr Ile His Ala Ala130 135 140
Asn ser Phe Ala Thr Leu Glu vai Pro Glu Ala Tyr Phe Asp Met vai145 150 155 160
Arg Pro Gly Gly Ile Ile Tyr Gly Asp Thr lie Pro ser Tyr Thr Glu165 170 175
Tyr Lys Lys vai Met Ala Phe Lys Thr Gln vai Ala Ser Val Asn His180 185 190
Tyr Pro Ala Gly Asn Thr vai Gly Tyr Asp Arg Thr Phe Thr Leu Lys195 200 205
Arg Asp ser Leu Leu Ala Asn Leu Pro Met Gly Tyr Ser Asp Gly Tyr210 215 220
Arg Arg Ala Met Ser Asn Lys Ala Tyr vai Leu Ile Xaa Gly225 230 235
<210> 416
<211> 1227
<212> DNA
<213> Aeromonas caviae
<400> 416 atgcacaaga aaacactgct cgcgaccctg atctttggcc tgctggccgg ccaggcagtc 60gccgccccct atctgccgct cgccgacgac caccgcaacg gtcaggaaca gaccgccgcc 120aacgcctggc tggaagtgga tctcggcgcc ttcgagcaca acatccagac cctgaagaat 180cgcctcggtg acaagggccc gcagatctgc gccatcatga aggcggacgc ctacggtcac 240ggcatcgacc tgctggtccc ttccgtggtc aaggcaggca tcccctgcat cggcatcgcc 300agcaacgaag aagcacgtgt tgcccgcgag aagggcttcg aaggtcgcct gatgcgggta 360cgtgccgcca ccccggatga agtggagcag gccctgccct acaagctgga ggagctcatc 420ggcagcctgg agagcgccaa ggggatcgcc gacatcgccc agcgccatca caccaacatc 480ccggtgcaca tcggcctgaa ctccgccggc atgagccgca acggcatcga tctgcgccag 540gacgatgcca aggccgatgc cctggccatg ctcaagctca aggggatcac cccggtcggc 600atcatgaccc acttcccggt ggaggagaaa gaggacgtca agctggggct ggcccagttc 660aagctggact accagtggct catcgacgcc ggcaagctgg atcgcagcaa gctcaccatc 720cacgccgcca actccttcgc caccctggaa gtaccggaag cctactttga catggtgcgc 780ccgggcggca tcatctatgg cgacaccatt ccctcctaca ccgagtacaa gaaggtgatg 840gcgttcaaga cccaggtcgc ctccgtcaac cactacccgg cgggcaacac cgtcggctat 900gaccgcacct tcaccctcaa gcgcgactcc ctgctggcca acctgccgat gggctactcc 960gacggctacc gccgcgccat gagcaacaag gcctatgtgc tgatccatgg ccagaaggcc 1020cccgtcgtgg gcaagacttc catgaacacc accatggtgg acgtcaccga catcaagggg 1080atcaaacccg gtgacgaggt ggtcctgttc ggacgccagg gtgatgccga ggtgaaacaa 1140tctgatctgg aggagtacaa cggtgccctc ttggcggaca tgtacaccgt ctggggctat 1200accaacccca agaagatcaa gcgctaa 1227
<210> 417
<211> 408
<212> PRT
<213> Aeromonas caviae<400> 417
Met His Lys Lys Thr Leu Leu Ala Thr Leu Ile Phe Gly Leu Leu Ala15 10 15
Gly Gln Ala Val Ala Ala Pro Tyr Leu Pro Leu Ala Asp Asp His Arg20 25 30
Asn Gly Gln Glu Gln Thr Ala Ala Asn Ala Trp Leu Glu vai Asp Leu35 40 45
Gly Ala Phe Glu His Asn Ile Gln Thr Leu Lys Asn Arg Leu Gly Asp50 55 60
Lys Gly Pro Gln Ile Cys Ala lie Met Lys Ala Asp Ala Tyr Gly His65 70 75 80
Gly Ile Asp Leu Leu vai Pro Ser vai vai Lys Ala Gly lie Pro Cys85 90 95
Ile Gly Ile Ala Ser Asn Glu Glu Ala Arg vai Ala Arg Glu Lys Gly100 105 110
Phe Glu Gly Arg Leu Met Arg vai Arg Ala Ala Thr Pro Asp Glu vai115 120 125
Glu Gln Ala Leu Pro Tyr Lys Leu Glu Glu Leu lie Gly ser Leu Glu130 135 140
Ser Ala Lys Gly Ile Ala Asp lie Ala Gln Arg His His Thr Asn Ile145 150 155 160
Pro vai His Ile Gly Leu Asn ser Ala Gly Met Ser Arg Asn Gly lie165 170 175
Asp Leu Arg Gln Asp Asp Ala Lys Ala Asp Ala Leu Ala Met Leu Lys180 185 190
Leu Lys Gly lie Thr Pro vai Gly Ile Met Thr His Phe Pro vai Glu195 200 205
Glu Lys Glu Asp vai Lys Leu Gly Leu Ala Gln Phe Lys Leu Asp Tyr210 215 220
Gln Trp Leu Ile Asp Ala Gly Lys Leu Asp Arg Ser Lys Leu Thr Ile225 230 235 240
His Ala Ala Asn Ser Phe Ala Thr Leu Glu Val Pro Glu Ala Tyr Phe245 250 255
Asp Met Val Arg Pro Gly Gly lie lie Tyr Gly Asp Thr Ile Pro Ser260 265 270
Tyr Thr Glu Tyr Lys Lys vai Met Ala Phe Lys Thr Gln Val Ala Ser275 280 285
Val Asn His Tyr Pro Ala Gly Asn Thr Val Gly Tyr Asp Arg Thr Phe290 295 300
Thr Leu Lys Arg Asp ser Leu Leu Ala Asn Leu Pro Met Gly Tyr ser
305 310 315 320
Asp Gly Tyr Arg Arg Ala Met Ser Asn Lys Ala Tyr vai Leu lie His
325 330 335
Gly Gln Lys Ala Pro vai vai Gly Lys Thr Ser Met Asn Thr Thr Met340 345 350
vai Asp vai Thr Asp Ile Lys Gly Ile Lys Pro Gly Asp Glu vai vai355 360 365
Leu Phe Gly Arg Gln Gly Asp Ala Glu vai Lys Gln Ser Asp Leu Glu370 375 380
Glu Tyr Asn Gly Ala Leu Leu Ala Asp Met Tyr Thr vai Trp Gly Tyr
385 390 395 400
Thr Asn Pro Lys Lys Ile Lys Arg405

Claims (33)

1. Método compreendendo:produzir um produto selecionado demonatina, derivados de monatina, sais destes, e combinações destes, emuma trilha multietapas, onde uma reação na trilha é facilitada por um ou maispolipeptídeos selecionados de polipeptídeos recombinantes ou isoladoscompreendendo a seqüência de aminoácido SEQ ID NO:2, SEQ ID NO:4,SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ ID NO:12, SEQ ID NO:14,SEQ ID NO:16, SEQ ID NO:18, SEQ ID N0:20, SEQ ID NO:22, SEQ IDNO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID N0:30, SEQ ID NO:32, SEQID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID N0:40, SEQ ID NO:42,SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID N0:50, SEQ IDNO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID N0:60, SEQID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID N0:70, SEQ ID NO:72,SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID N0:80, SEQ IDNO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID N0:90, SEQID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NQ:100,SEQ ID NO: 104, SEQ ID NQ:106, SEQ ID NQ:108, SEQ ID NQ:110, SEQ ID NO:112, SEQ ID NO: 114, SEQ ID NO:116, SEQ ID NO: 118, SEQ ID N0:120, SEQ ID NO: 122, SEQ ID NO:124, SEQ ID NO: 126, SEQ ID NO:128, SEQ ID NO: 130, SEQ ID NO:132, SEQ ID NO: 134, SEQ ID NO:136, SEQ ID NO: 138, SEQ ID N0:140, SEQ ID NO:142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO:148, SEQ ID NO: 150, SEQ ID NO:152, SEQ ID NO: 154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID N0:170, SEQ ID NO:172, SEQ ID NO: 174, SEQ ID NO:1763 SEQ ID NO:178, SEQ ID N0:180, SEQ ID NO:182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO:188, SEQ ID N0:190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID N0:200, SEQ ID N0:204, SEQ ID N0:206, SEQ ID N0:208, SEQ ID NQ:210, SEQ ID NO:212, SEQ ID NQ:214, SEQ ID NO:216, SEQ ID NO:218, SEQ DD N0:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID N0:230, SEQ ID NO:232, SEQ IDΝΟ:234, SEQ ID ΝΟ:236, SEQ ID ΝΟ:238, SEQ ID Ν0:240, SEQ IDΝΟ:242, SEQ ID ΝΟ:244, SEQ ID ΝΟ:246, SEQ ID ΝΟ:248, SEQ IDΝ0:250, SEQ ID ΝΟ:252, SEQ ID ΝΟ:254, SEQ ID ΝΟ:256, SEQ IDΝΟ:258, SEQ ID Ν0:260, SEQ ID ΝΟ:262, SEQ ID ΝΟ:264, SEQ IDΝΟ:266, SEQ 376 ID ΝΟ:268, SEQ ID Ν0:270, SEQ ID ΝΟ:272, SEQ IDΝΟ:274, SEQ ID ΝΟ:276, SEQ ID ΝΟ:278, SEQ ID ΝΟ:282, SEQ IDΝΟ:284, SEQ ID ΝΟ:286, SEQ ID ΝΟ:288, SEQ ID Ν0:290, SEQ IDΝΟ:292, SEQ ID ΝΟ:294, SEQ ID ΝΟ:296, SEQ ID ΝΟ:298, SEQ IDΝ0:300, SEQ ID Ν0:302, SEQ ID Ν0:304, SEQ ID Ν0:306, SEQ IDΝ0:308, SEQ ID Ν0:310, SEQ ID ΝΟ:312, SEQ ID ΝΟ:314, SEQ IDΝΟ:316, SEQ ID ΝΟ:318, SEQ ID Ν0:320, SEQ ID ΝΟ:322, SEQ IDΝΟ:324, SEQ ID ΝΟ:326, SEQ ID ΝΟ:328, SEQ ID Ν0:330, SEQ IDΝΟ:332, ou SEQ ID ΝΟ:334, ou fragmentos ou subseqüências destes tendoatividade aldolase.
2. Método de acordo com a reivindicação 1, em que um ou maispolipeptídeos são selecionados de poiipeptídeos que compreendem a se-qüência de aminoácido SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ IDNQ:8, SEQ ID NC-IO, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQID NO:18, SEQ ID N0:20, SEQ ID NQ:22, SEQ ID NO:24, SEQ ID NO:26,SEQ ID NQ:28, SEQ ID NQ:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO-- 36, SEQ ID NO:38, SEQ ID N0:40, SEQ ID NO:42, SEQ ID NO:44, SEQ IDNO:46, SEQ ID NO:48, SEQ ID N0:50, SEQ ID NO:52, SEQ ID NO:54, SEQID NO:56, SEQ ID NO:58, SEQ ID N0:60, SEQ ID NO:64, SEQ ID NO:66,SEQ ID NO:68, SEQ ID N0:70, SEQ ID NO:72, SEQ ID NO:74, SEQ IDNO:76, SEQ ID NO:78, SEQ ID N0:80, SEQ ID NO:82, SEQ ID NO:84, SEQID NO:86, SEQ ID NO:88, SEQ ID N0:90, SEQ ID NO:92, SEQ ID NO:94,SEQ ID NO:96, SEQ ID NO:98, SEQ ID N0:100, SEQ ID N0:104, SEQ IDN0:106, SEQ ID N0:108, SEQ ID N0:110, SEQ ID NO:112, SEQ IDNO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID N0:120, SEQ IDNO: 122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ IDN0:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ IDNO:138, SEQ ID N0:140, SEQ ID NO:142, SEQ ID NO:144, SEQ IDNO: 146, SEQ ID NO:148, SEQ ID N0:150 SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158 SEQ ID N0:160, SEQ ID NO:162, SEQ ID NO: 164, SEQ ID NO: 166 SEQ ID NO:168, SEQ ID N0:170, SEQ ID NO:172, SEQ ID NO: 174 SEQ ID NO:176, SEQ ID NO: 178, SEQ ID N0:180, SEQ ID NO: 182 SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID NO: 190 SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO: 196, SEQ ID NO: 198 SEQ ID N0:200, SEQ ID N0:204, SEQ ID N0:206, SEQ ID N0:208 SEQ ID N0:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216 SEQ ID NO:218, SEQ ID N0:220, SEQ ID NO:222, SEQ ID NO:224 SEQ ID NO:226, SEQ ID NO:228, SEQ ID N0:230, SEQ ID NO:232 SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID N0:240 SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:24S SEQ ID N0:250, SEQ ID NO:252, SEQ ID N0.254, SEQ ID NO:256 SEQ ID NO:258, SEQ ID N0:260, SEQ ID NO:262, SEQ ID NO:264 SEQ ID NO:266, SEQ ID NO:268, SEQ ID N0:270, SEQ ID NO:272 SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:282 SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID N0:290 SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID ' N0:300, SEQ ID N0:302, ou SEQ ID N0:304, ou fragmentos ou subseqüências destes tendo atividade de aldolase.
3. Método de acordo com a reivindicação 1, em que uma oumais etapas na referida trilha de multietapas é uma etapa química.
4. Método de acordo com a reivindicação 1, em que a reação éuma reação entre indol-3- piruvato e uma fonte de carbono C3.
5. Método de acordo com a reivindicação 4, em que um ou maispolipeptídeos são selecionados de polipeptídeos que compreendem a se-qüência de aminoácido SEQ ID NO:4, SEQ ID NO:8, SEQ ID NO:12, SEQ IDNO:28, SEQ ID NO:36, SEQ ID N0:40, SEQ ID NO:42, SEQ ID NO:44, SEQID NO:46, SEQ ID N0:50, SEQ ID NO:54, SEQ ID NO:58, SEQ ID NO:64,SEQ ID NO:74, SEQ ID NO:76, SEQ ID N0:80, SEQ ID NO:88, SEQ IDNO:94, SEQ ID NO:96, SEQ ID NQ:106, SEQ ID N0:108, SEQ ID NO:112,SEQ ID Ν0:1165 SEQ ID ΝΟ:122, SEQ ID ΝΟ:126, SEQ ID Ν0:130, SEQ IDΝΟ:134, SEQ ID ΝΟ:142, SEQ ID ΝΟ:148, SEQ ID ΝΟ:156, SEQ IDΝΟ:162, SEQ ID ΝΟ:166, SEQ ID ΝΟ:168, SEQ ID ΝΟ:172, SEQ IDΝΟ:178, SEQ ID Ν0:180, SEQ ID ΝΟ:184, SEQ ID ΝΟ:186, SEQ IDNO: 192, SEQ ID Ν0:200, SEQ ID ΝΟ:218, SEQ ID ΝΟ:224, SEQ IDΝΟ:226, SEQ ID ΝΟ:228, SEQ ID ΝΟ:236, SEQ ID ΝΟ:238, SEQ IDΝ0:240, SEQ ID ΝΟ:244, SEQ ID Ν0:250, SEQ ID ΝΟ:252, SEQ IDΝΟ:264, SEQ ID ΝΟ:268, SEQ ID Ν0:270, SEQ ID ΝΟ:272, SEQ IDΝΟ:276, SEQ ID ΝΟ:278, SEQ ID ΝΟ:282, SEQ ID ΝΟ:284, SEQ IDΝΟ:298, SEQ ID Ν0:300, ou SEQ ID Ν0:304.
6. Método de acordo com a reivindicação 4, em que a reaçãopreferencialmente produz ácido R-2- hidróxi-2-(indol-3-il-metil)-4-cetoglutárico sobre ácido S-2-hidróxi-2-(indol-3-il- metil)-4-cetoglutárico.
7. Método de acordo com a reivindicação 6, em que um ou maispolipeptídeos são selecionados de polipeptídeos que compreendem a se-qüência de aminoácido SEQ ID NO:28, SEQ ID N0:116, SEQ ID NO:298,SEQ ID NO:44, SEQ ID NO:54, SEQ ID NO:148, SEQ ID NO:46, SEQ IDNO:134, SEQ ID NO:142, SEQ ID NO:122, SEQ ID NO:74, SEQ ID NO:64,SEQ ID N0:108, SEQ ID NO:96, SEQ ID NO:126, SEQ ID N0:80, SEQ IDNO:36, SEQ ID NO:62, SEQ ID NO:112, SEQ ID N0:130, SEQ TD NO:94,SEQ ID NO:58, SEQ ID N0:50, SEQ ID N0:106, SEQ ID NO:42, SEQ IDNO:278, SEQ ID NO:162, SEQ ID NO:276, SEQ ID NO:178, SEQ IDNO:166, SEQ ID NO:218, SEQ ID NO:224, SEQ ID NO:2265 SEQ IDNO:244, SEQ ID N0:250, SEQ ID NO:252, SEQ ID NO:264, SEQ IDNO:268, SEQ ID NO:272, SEQ ID NO:184, SEQ ID NO:282, SEQ IDNO:186, SEQ ID NO:192, SEQ ID N0:200, SEQ ID NO:284, SEQ IDNO:172, SEQ ID N0:180, SEQ ID NO:168, SEQ ID NO:228, SEQ IDNO:236, SEQ ID NO:238, SEQ ID N0:240, ou SEQ ID NO:156.
8. Método de acordo com a reivindicação 6, em que um ou maispolipeptídeos são selecionados de polipeptídeos que compreendem a se-qüência de aminoácido SEQ ID NO:28, SEQ ID NO:298, SEQ ID NO:54,SEQ ID NO: 142, SEQ ID NO:122, SEQ ID N0:108, SEQ ID NO:96, SEQ IDΝ0:80, SEQ ID ΝΟ:36, SEQ ID ΝΟ:62, SEQ ID Ν0:112, SEQ ID Ν0:130,SEQ EO NQ:94, SEQ ID NQ:58, SEQ ID Ν0:50, SEQ ID Ν0:106, SEQ IDΝΟ:42, SEQ ID ΝΟ:276, SEQ ID ΝΟ:166, SEQ ID ΝΟ:224, SEQ ID ΝΟ:226,SEQ ID ΝΟ:244, SEQ ID Ν0:180, SEQ ID ΝΟ:168, SEQ ID ΝΟ:228, SEQ IDΝΟ:238, ou SEQ ID Ν0:156.
9. Método de acordo com a reivindicação 6, em que um ou maispolipeptídeos são selecionados de polipeptídeos que compreendem a se-qüência de aminoácido SEQ ID NO:28, SEQ ID NO:276, ou SEQ ID NO:244.
10. Método de acordo com a reivindicação 1, em que o produtoé selecionado de monatina, sais deste e combinações deste.
11. Método de acordo com a reivindicação 1, em que a reação éfacilitada pelos referidos um ou mais polipeptídeos é realizada em cerca de 1,0 a cerca de 10,0 mM de MgCI2.
12. Método de acordo com a reivindicação 1, em que a reaçãofacilitada pelos referidos um ou mais polipeptídeos é realizada em cerca depH 7,0 a cerca de pH 11,5.
13. Método de acordo com a reivindicação 1, em que a reaçãofacilitada pelos referidos um ou mais polipeptídeos é realizada em cerca de 0,005% a cerca de 1% de detergente de polissorbato.
14. Método de acordo com a reivindicação 7, em que pelo me-nos um de R.R-monatina, R-S monatina, ou uma combinação deste é produ-zido em quantidade maior do que S,S-monatina ou S,R- monatina.
15. Método de acordo com a reivindicação 7, em que R,R mona-tina é produzido em quantidade maior do que R,S-monatina, S,S-monatina eS,R-monatina.
16. Método de acordo com a reivindicação 15, em que o referidoR,R monatina produzido é pelo menos cerca de 60%, em peso, de monatinatotal produzida.
17. Método de acordo com a reivindicação 16, em que o referidoR,R monatina produzido é pelo menos cerca de 80%, em peso, de monatinatotal produzida.
18. Método de acordo com a reivindicação 17, em que o referidoR1R monatina produzido é pelo menos cerca de 90%, em peso, de monatinatotal produzida.
19. Método de acordo com a reivindicação 17, em que o referidoR,R monatina produzido é pelo menos cerca de 98%, em peso, de monatinatotal produzida.
20. Método de acordo com a reivindicação 1, em que os frag-mentos ou subseqüências destes possuem uma atividade de aldolase depelo menos 0,2 mg MP/mg proteína/hora.
21. Método compreendendo: produzir um produto selecionadode monatina, derivados de monatina, sais deste, e combinações deste, emuma trilha de multietapas, onde a reação na trilha é facilitada por pelo menosum polipeptídeo codificado por uma seqüência de ácido nucléico que com-preende uma seqüência tendo uma porcentagem de identidade de seqüên-cia de pelo menos 50% para SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5,SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15,SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ iD NO:23, SEQ IDNO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43,SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ IDNÓ:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:63, SEQID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73,SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ IDNO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID N0:103,SEQ ID N0:105, SEQ ID N0:107, SEQ ID N0:109, SEQ ID NO:111, SEQ IDNO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ IDNO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ EP NQ:127, SEQ IDNQ:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ IDNO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ IDNQ: 145, S$Q ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ IDNO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ IDNO: 161, SEQ TD NO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ IDNO:169, SEQ ID NO:171, SEQ ID NO: 173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO: 185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO: 197, SEQ ID NO:199, SEQ ID N0:203, SEQ ID N0:205, SEQ ID N0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:2233 SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NQ:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ. ID NO:277, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ iD N0:301, SEQ ID N0:303, SEQ ID N0:305, SEQ ID N0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NQ:327, SEQ ID NO:329, SEQ ID NO:331, SEQ IDΝΟ:333, SEQ ID ΝΟ:335, SEQ ID ΝΟ:336, SEQ ID ΝΟ:337, ou SEQ IDΝΟ:338.
22. Método de acordo com a reivindicação 21, em que a porcen-tagem de identidade de seqüência é de pelo menos 95%.
23. Método de acordo com a reivindicação 22, em que a porcen-tagem de identidade de seqüência é de 100%.
24. Método de acordo com a reivindicação 23, em que pelo me-nos um polipeptídeo é codificado por uma seqüência de ácido nucléico quecompreende uma seqüência tendo pelo menos 95% de identidade para SEQID NO:4, SEQ ID NO:8, SEQ ID NO:12, SEQ ID NO:28, SEQ ID NO:36, SEQID N0:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID N0:46, SEQ ID N0:50,SEQ ID NO:54, SEQ ID NO:58, SEQ ID NO:64, SEQ ID NO:74, SEQ IDΝΟ:76, SEQ ID Ν0:80, SEQ ID ΝΟ:88, SEQ ID ΝΟ:94, SEQ ID ΝΟ:96, SEQID Ν0:106, SEQ ID Ν0:108, SEQ TD Ν0:112, SEQ ID Ν0:116, SEQ IDNO: 122, SEQ ID ΝΟ:126, SEQ ID Ν0:130, SEQ ID Ν0.134, SEQ IDΝ0:142, SEQ ID ΝΟ:148, SEQ ID ΝΟ:156, SEQ ID ΝΟ:162, SEQ IDΝΟ:166, SEQ ID ΝΟ:168, SEQ ID ΝΟ:172, SEQ ID ΝΟ:178, SEQ IDΝ0:180, SEQ ID ΝΟ:184, SEQ ID ΝΟ:186, SEQ ID ΝΟ:192, SEQ ID NO-NO:200, SEQ ID ΝΟ:218, SEQ ID ΝΟ:224, SEQ ID ΝΟ:226, SEQ ID ΝΟ:228,SEQ ID ΝΟ:236, SEQ ID ΝΟ:238, SEQ ID Ν0:240, SEQ ID ΝΟ:244, SEQ IDΝ0:250, SEQ ID ΝΟ:252, SEQ ID ΝΟ:264, SEQ ID ΝΟ:268, SEQ IDΝ0:270, SEQ ID ΝΟ:272, SEQ ID ΝΟ:276, SEQ ID ΝΟ:278, SEQ IDΝΟ:282, SEQ ID ΝΟ:284, SEQ ID ΝΟ:298, SEQ ID Ν0:300, e SEQ IDΝ0:304.
25. Método de acordo com a reivindicações 21, em que a reaçãopreferencialmente produz ácido R-2-hidróxi-2-(indol- 3-il-metil)-4-cetoglutárico sobre ácido S-2-hidróxi-2-(indol-3-il-metil)-4- cetoglutárico epelo menos um polipeptídeo é codificado por uma seqüência de ácido nu-cléico que compreende uma seqüência tendo pelo menos 95% de identidadede seqüência para SEQ ID N0:28, SEQ ID NO:116, SEQ ID NO:298, SEQID NO:44, SEQ ID NO:54, SEQ ID NO:148, SEQ ID NO:46, SEQ ID NO:134,SEQ EO NO:142, SEQ ID NO:122, SEQ ID NO:74, SEQ ID NO:64, SEQ IDN0:108, SEQ ID NO:96, SEQ ID NO:126, SEQ ID N0:80, SEQ ID NO:36,SEQ ID NO:62, SEQ ID NO:112, SEQ ID N0:130, SEQ ID NO:94, SEQ IDNO:58, SEQ ID N0:50, SEQ LD N0:106, SEQ ID NO:42, SEQ ID NO:278,SEQ ID NO:162, SEQ ID NO:276, SEQ ID NO:178, SEQ ID NO:166, SEQ IDNO:218, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:244, SEQ IDN0:250, SEQ ID NO:252, SEQ ID NO:264, SEQ ID NO:268, SEQ IDNO:272, SEQ ID NO:184, SEQ ID NO:282, SEQ ID NO:186, SEQ IDNO:1925 SEQ ID N0:200, SEQ ID NO:284, SEQ ID NO:172, SEQ IDN0:180, SEQ ID NO:168, SEQ ID NO:228, SEQ ID NO:236, SEQ IDNO:238, SEQ ID N0:240, e SEQ ID NO:156.
26. Método de acordo com a reivindicação 25, em que pelo me-nos um polipeptídeo é codificado por uma seqüência de ácido nucléico quecompreende uma seqüência tendo pelo menos 95% de identidade de se-qüência para SEQ ID NO:28, SEQ ID NO:298, SEQ ID NO:54, SEQ IDNO:142, SEQ ID NO:122, SEQ ID N0:108, SEQ ID NO:96, SEQ ID N0:80,SEQ ID NO:36, SEQ ID NO:62, SEQ ID NO:112, SEQ ID N0:130, SEQ IDNO:94, SEQ ID NO:58, SEQ ID N0:50, SEQ ID N0:106, SEQ ID NO:42,SEQ ID NO:2765 SEQ ID NO:166, SEQ ID NO:224, SEQ ID NO:226, SEQ IDNO:244, SEQ ID N0:180, SEQ ID NO:168, SEQ ID NO:228, SEQ IDNO:238, e SEQ ID NO:156.
27. Método de acordo com a reivindicação 26, em que pelo me-nos um polipeptídeo é codificado por uma seqüência de ácido nucléico quecompreende uma seqüência tendo pelo menos 95% de identidade de se-qüência para SEQ ID NO:28, SEQ ID NO:276, e SEQ ID NO:244.
28. Método compreendendo:produzir um produto selecionado demonatina, derivados de monatina, sais deste e combinações deste, em umatrilha de multietapas, em que a reação na trilha é facilitada por pelo menosum polipeptídeo codificado por uma seqüência de ácido nucléico que com-preende uma seqüência que hibridiza sob condição rigorosa para um ácidonucléico de SEQ ID NO:1, SEQ ID NQ:3, SEQ ID NO:5, SEQ ID NO:7, SEQID NQ:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17,SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NQ:25, SEQ IDNO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45,SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ IDNO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:63, SEQ ID NO:65, SEQID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75,SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ IDNO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQID NO.95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID N0:103, SEQ ID N0:105,SEQ ID NO: 107, SEQ ID N0:109, SEQ ID NO:111, SEQ ID NO:113, SEQ IDNO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ IDNO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ IDNO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ IDNO:139. SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO: 165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO: 173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO. 183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NQ:199, SEQ ID NQ:203, SEQ DD N0:205, SEQ ID N0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID N0:217, SEQ ID NO:219, SEQ ID NO:221, SEQ DD NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ EO NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO.-293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID N0:301, SEQ ID N0:303, SEQ ID N0:305, SEQ ID N0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ DD NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ DD NO:331, SEQ ID NO:333, SEQ ID NO:3355 SEQ ID NO:336, SEQ DD NQ:337, ou SEQ ID NO:338.
29. Método compreendendo:produzir R1R monatina em uma tri-lha de multietapas, em que o referido R1R monatina produzido é pelo menoscerca de 95%, em peso, da monatina total produzida.
30. Método compreendendo:produzir um produto selecionado deprecursor de monatina, sais deste, e combinações deste, em uma trilha, emque a reação na trilha é facilitada por um ou mais polipeptídeos selecionadosde polipeptídeos recombinantes ou isolados compreendendo a seqüência deaminoácido SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQID NO: 10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18,SEQ ID N0:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NQ:26, SEQ IDNO:28, SEQ ID N0:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQID NO:38, SEQ ID N0:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46,SEQ ID NO:48, SEQ ID N0:50, SEQ ID NO:52, SEQ ID NO:54, SEQ IDNO:56, SEQ ID NO:58, SEQ ID N0:60, SEQ ID NO:64, SEQ ID NO :66,SEQ ID NO:68, SEQ ID N0:70, SEQ ID NO:72, SEQ ID NO:74. SEQ IDNO:76, SEQ ID NO:78, SEQ ID N0:80, SEQ ID NO:82, SEQ ID NO:84, SEQID NO:86, SEQ ID NO:88, SEQ ID N0:90, SEQ ID NO:92, SEQ ID NO:94,SEQ ID NO:96, SEQ ID NO:98, SEQ ID N0:100, SEQ ID N0:104, SEQ ID N0:106, SEQ ID NO: 108, SEQ ID NO:1 IO5 SEQ ID NO:1125 SEQ ID NO:114, SEQ ID NÒ:116, SEQ ID NO:118, SEQ ID N0:120, SEQ ID NO:122, SEQ ID NO: 124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID N0:130, SEQ ID NO. 132, SEQ ID NO.134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO: 140, SEQ ID NO:142, SEQ ID NO: 144, SEQ ID NO:146, SEQ ID NO: 148, SEQ ID N0:150, SEQ ID NO: 152, SEQ ID NO:154, SEQ ID NO: 156, SEQ ID NO:158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ iD NO: 164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO:182, SEQ ID- NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID N0:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID N0:200s SEQ ID N0:204, SEQ ID N0:206, SEQ ID N0:208, SEQ ID N0:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID N0:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID N0:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID N0:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID N0:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID N0:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID N0:270, SEQ ID NO:272, SEQ ID NO:274, SEQ IDΝΟ:276, SEQ ID ΝΟ:278, SEQ ID ΝΟ:282, SEQ ID ΝΟ:284, SEQ IDΝΟ:286, SEQ ID ΝΟ:288, SEQ ID Ν0:290, SEQ ID ΝΟ:292, SEQ IDΝΟ:294, SEQ ID ΝΟ:296, SEQ ID ΝΟ:298, SEQ ID Ν0:300, SEQ IDΝ0:302, SEQ ID Ν0:304, SEQ ID Ν0:306, SEQ ID Ν0:308, SEQ IDΝ0:310, SEQ ID ΝΟ:312, SEQ ID ΝΟ:314, SEQ ID ΝΟ:316, SEQ IDΝΟ:318, SEQ ID Ν0:320, SEQ ID ΝΟ:3225 SEQ ID ΝΟ:324, SEQ IDΝΟ:326, SEQ ID ΝΟ:328, SEQ ID Ν0:330, SEQ ID ΝΟ:332, ou SEQ IDΝΟ:334, ou fragmentos ou subseqüências destes tendo atividade de aldola-se, em que o referido precursor de monatina, sais deste e combinações des-te são empregados para preparar um produto adoçante.
31. Método compreendendo:produzir um produto selecionado deprecursor de monatina, sais deste e combinações deste, em uma trilha, emque a reação na trilha é facilitada por pelo menos um polipeptídeo codificadopor uma seqüência de ácido nucléico que compreende uma seqüência tendouma porcentagem de identidade de seqüência de pelo menos 50% paraSEQ ID NO:1, SEQ ID NO:3, SEQ ID NO;5, SEQ ID NO:7, SEQ ID NQ:9,SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ IDNO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37,SEQ DO NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ IDNO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQID NO:57, SEQ ID NO:59, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67,SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75s SEQ IDNO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95,SEQ ID NO:97, $EQ ID NQ:99, SEQ ID N0:103, SEQ ID N0:105, SEQ IDNO: 107, SEQ ID N0:109, SEQ DD NO:111, SEQ ID NO:113, SEQ IDNO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ IDNO: 123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ IDNO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ IDNO: 139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ IDNO:147, SEQ ID NO:149, SEQ ID NO.151, SEQ ID NO:153, SEQ IDΝΟ:155, SEQ ID ΝΟ:157, SEQ ID ΝΟ:159, SEQ ID Ν0:161, SEQ IDΝΟ:163, SEQ ID ΝΟ:165, SEQ ID ΝΟ:167, SEQ ID ΝΟ:169, SEQ DDΝ0:171, SEQ ID ΝΟ:173, SEQ ID ΝΟ:175, SEQ ID ΝΟ:177, SEQ IDΝΟ:179, SEQ ID Ν0:181, SEQ DD ΝΟ:183, SEQ ID ΝΟ:185, SEQ DDΝΟ:187, SEQ DD ΝΟ:189, SEQ Ε) Ν0:191, SEQ DD ΝΟ:193, SEQ DDΝΟ:195, SEQ DD ΝΟ:197, SEQ ID ΝΟ:199, SEQ DD Ν0:203, SEQ DDΝ0:205, SEQ ID Ν0:207, SEQ ID Ν0:209, SEQ DD Ν0:211, SEQ DDΝΟ:213, SEQ DD ΝΟ:215, SEQ DD ΝΟ:217, SEQ DD ΝΟ:219, SEQ DDΝΟ:221, SEQ ID ΝΟ:223, SEQ DD ΝΟ:225, SEQ DD ΝΟ:227, SEQ IDΝΟ:229, SEQ ID ΝΟ:231, SEQ ID ΝΟ:233, SEQ ID ΝΟ:235, SEQ IDΝΟ:237, SEQ ID ΝΟ:239, SEQ ID ΝΟ:241, SEQ ID ΝΟ:243, SEQ IDΝΟ:245, SEQ ID ΝΟ:247, SEQ ID ΝΟ:249, SEQ ID ΝΟ:251, SEQ IDΝΟ:253, SEQ ID ΝΟ:255, SEQ ID Ν0.257, SEQ ID ΝΟ:259, SEQ IDΝΟ:261, SEQ ID ΝΟ:263, SEQ ID ΝΟ:265, SEQ ID ΝΟ:267, SEQ IDΝΟ:269, SEQ ID Ν0.271, SEQ ID ΝΟ:273, SEQ ID ΝΟ:275, SEQ IDΝΟ:277, SEQ ID ΝΟ:281, SEQ ID ΝΟ:283, SEQ ID ΝΟ:285, SEQ IDΝΟ:287, SEQ ID ΝΟ:289, SEQ ID ΝΟ:291, SEQ ID ΝΟ:293, SEQ IDΝΟ:295, SEQ ID ΝΟ:297, SEQ ID ΝΟ:299, SEQ ID Ν0:301, SEQ IDΝ0:303, SEQ ID Ν0.305, SEQ ID Ν0:307, SEQ ID Ν0:309, SEQ IDΝΟ:311, SEQ ID ΝΟ:313, SEQ ID ΝΟ:315, SEQ ID ΝΟ:317, SEQ IDΝΟ:319, SEQ ID ΝΟ:321, SEQ ID ΝΟ:3235 SEQ ID ΝΟ:325, SEQ IDΝΟ:327, SEQ ID ΝΟ:329, SEQ ID ΝΟ:331, SEQ ID ΝΟ:333, SEQ IDΝΟ:335, SEQ ID ΝΟ:336, SEQ ID ΝΟ:337, ou SEQ ID ΝΟ:338, em que οreferido precursor de monatina, sais deste e combinações deste são prepa-rados para preparar um produto adoçante.
32.
Método compreendendo:produzir um produto selecionado deprecursor de monatina, sais deste e combinações deste, em uma trilha, emque a reação na trilha é facilitada por pelo menos um polipeptídeo codificadopor uma seqüência de ácido nucléico que compreende uma seqüência quehibridiza sob condição rigorosa para um ácido nucléico de SEQ ID NO:1SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11,SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ IDΝ0:21, SEQ ID ΝΟ:23, SEQ ID ΝΟ:25, SEQ ID ΝΟ:27, SEQ ID ΝΟ:29, SEQID ΝΟ:31, SEQ ID ΝΟ:33, SEQ ID ΝΟ:35, SEQ ID ΝΟ:37, SEQ ID ΝΟ:39,SEQ ID Ν0:41, SEQ ID ΝΟ:43, SEQ ID ΝΟ:45, SEQ ID ΝΟ:47, SEQ IDΝΟ:49, SEQ ID Ν0:51, SEQ ID ΝΟ:53, SEQ ID ΝΟ:55, SEQ ID ΝΟ:57, SEQID ΝΟ:59, SEQ ID ΝΟ:63, SEQ ID ΝΟ:65, SEQ ID ΝΟ:67, SEQ ID ΝΟ:69,SEQ ID Ν0:71, SEQ ID ΝΟ:73, SEQ ID ΝΟ:75, SEQ ID ΝΟ:77, SEQ IDΝΟ:79, SEQ ID ΝΟ:81, SEQ ID ΝΟ:83, SEQ ID ΝΟ:85, SEQ ID ΝΟ:87, SEQID Ν0.89, SEQ ID Ν0:91, SEQ ID ΝΟ:93, SEQ ID ΝΟ:95, SEQ ID ΝΟ:97,SEQ EQ ΝΟ:99, SEQ ID NQ:103, SEQ ID Ν0:105, SEQ ID NQ:107, SEQ ID NO: 109, SEQ ID Ν0:111, SEQ ID NOrI 13, SEQ ID Ν0:115, SEQ ID ΝΟ:117, SEQ ID Ν0:119, SEQ ID Ν0:121, SEQ ID Ν0:123, SEQ ID ΝΟ:125, SEQ ID NO: 127, SEQ ID ΝΟ:129, SEQ ID Ν0:131, SEQ ID ΝΟ:133, SEQ ID NO: 135, SEQ ID Ν0:137, SEQ ID Ν0:139, SEQ ID ΝΟ:141, SEQ ID ΝΟ:143, SEQ ID Ν0:145, SEQ ID Ν0:147, SEQ ID ΝΟ:149, SEQ ID ΝΟ:151, SEQ ID ΝΟ:153, SEQ ID ΝΟ:155, SEQ ID ΝΟ:157, SEQ ID ΝΟ:159, SEQ ID Ν0:161, SEQ ID Ν0:163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID ΝΟ:169, SEQ ID Ν0:171, SEQ ID NO: 173, SEQ ID Ν0:175, SEQ ID ΝΟ:177, SEQ ID Ν0:179, SEQ ID ΝΟ:181, SEQ ID ΝΟ:183, SEQ ID Ν0:185, SEQ ID ΝΟ:187, SEQ ID ΝΟ:189, SEQ ID Ν0:191, SEQ ID ΝΟ:193, SEQ ID Ν0:195, SEQ ID NO: 197, SEQ ID Ν0:199, SEQ ID Ν0:203, SEQ ID Ν0:205, SEQ ID Ν0:207, SEQ ID Ν0:209, SEQ ID Ν0:211, SEQ ID ΝΟ:213, SEQ ID ΝΟ:215, SEQ ID ΝΟ:217, SEQ ID ΝΟ:219, SEQ ID ΝΟ:221, SEQ ID ΝΟ:223, SEQ ID ΝΟ:225, SEQ ID ΝΟ:227, SEQ ID ΝΟ:229, SEQ ID Ν0.231, SEQ ID ΝΟ:233, SEQ ID ΝΟ:235, SEQ ID ΝΟ:237, SEQ ID ΝΟ:239, SEQ ID ΝΟ:241, SEQ BD ΝΟ:243, SEQ ID ΝΟ:245, SEQ ID ΝΟ:247, SEQ ID ΝΟ:249, SEQ ID ΝΟ:251, SEQ ID ΝΟ:253, SEQ ID ΝΟ:255, SEQ ID ΝΟ:257, SEQ ID ΝΟ:259, SEQ ID ΝΟ:261, SEQ ID ΝΟ:263, SEQ ID ΝΟ:265, SEQ ID ΝΟ:267, SEQ ID ΝΟ:269, SEQ ID ΝΟ:271, SEQ ID ΝΟ:273, SEQ LD ΝΟ:275, SEQ ID NQ:277, SEQ ID ΝΟ:281, SEQ EO NQ:283, SEQ ID ΝΟ:285, SEQ ID ΝΟ:287, SEQ ID ΝΟ:289, SEQ ID ΝΟ:291, SEQ ID ΝΟ:293, SEQ JD ΝΟ:295, SEQ IDNO:297, S. EQ EO ΝΟ:299, SEQ ID NQ:301, SEQ LD Ν0:303, SEQ LOΝ0:305, SEQ ID Ν0:307, SEQ ID Ν0:309, SEQ LD Ν0:311, SEQ LDΝΟ:313, SEQ ID ΝΟ:315, SEQ ID ΝΟ:317, SEQ ID ΝΟ:319, SEQ IDΝΟ:321, SEQ ID ΝΟ:323, SEQ LD ΝΟ:325, SEQ LO ΝΟ:327, SEQ IDΝΟ:329, SEQ LD ΝΟ:331, SEQ EO ΝΟ:333, SEQ ID ΝΟ:335, SEQ IDΝΟ:336, SEQ LD ΝΟ:337, ou SEQ LD ΝΟ:338, em que ο referido precursorde monatina, sais deste e combinações deste são empregados para prepa-rar um produto adoçante.
BRPI0708673-3A 2006-03-07 2007-03-07 método para fabricação de polipeptìdeos com atividade de aldolase e polinucleotìdeos que codificam estes polipeptìdeos BRPI0708673A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US77946006P 2006-03-07 2006-03-07
US60/779,460 2006-03-07
US85300506P 2006-10-20 2006-10-20
US60/853,005 2006-10-20
PCT/US2007/005718 WO2007103389A2 (en) 2006-03-07 2007-03-07 Aldolases, nucleic acids encoding them and methods for making and using them

Publications (1)

Publication Number Publication Date
BRPI0708673A2 true BRPI0708673A2 (pt) 2011-06-07

Family

ID=38283673

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0708673-3A BRPI0708673A2 (pt) 2006-03-07 2007-03-07 método para fabricação de polipeptìdeos com atividade de aldolase e polinucleotìdeos que codificam estes polipeptìdeos

Country Status (10)

Country Link
US (3) US8043837B2 (pt)
EP (4) EP2112227B1 (pt)
JP (1) JP5441417B2 (pt)
CN (1) CN101437954B (pt)
AU (1) AU2007223913B2 (pt)
BR (1) BRPI0708673A2 (pt)
CA (1) CA2643416C (pt)
ES (1) ES2416104T3 (pt)
MX (1) MX2008011477A (pt)
WO (1) WO2007103389A2 (pt)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7297800B2 (en) * 2001-12-27 2007-11-20 Ajinomoto Co., Inc. Process of producing glutamate derivatives
US7572607B2 (en) * 2002-04-23 2009-08-11 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of monatin and its precursors
US8372989B2 (en) 2002-04-23 2013-02-12 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of monatin and its precursors
AU2003261722A1 (en) 2002-08-26 2004-03-11 Ajinomoto Co., Inc. NOVEL ALDOLASES AND PROCESS FOR PRODUCING SUBSTITUTED Alpha-KETO ACID
CA2507225C (en) * 2002-12-09 2012-02-07 Ajinomoto Co., Inc. Mutated d-aminotransferase and method for producing optically active glutamic acid derivatives using the same
BRPI0413241A (pt) * 2003-08-01 2006-10-03 Cargill Inc composições de adoçante de mesa de monatina e métodos de fazer as mesmas
ATE360370T1 (de) * 2003-08-14 2007-05-15 Cargill Inc Monatinhaltige kaugummizusammensetzungen und verfahren zu ihrer herstellung
RU2380989C2 (ru) * 2003-08-25 2010-02-10 Карджилл, Инкорпорейтед Питьевая композиция, содержащая монатин, и способы ее получения
JP4829117B2 (ja) * 2003-10-21 2011-12-07 カーギル,インコーポレイティド モナチンおよびモナチン前駆体の製造
US7685737B2 (en) * 2004-07-19 2010-03-30 Earthrenew, Inc. Process and system for drying and heat treating materials
US20070084077A1 (en) * 2004-07-19 2007-04-19 Gorbell Brian N Control system for gas turbine in material treatment unit
US7024800B2 (en) * 2004-07-19 2006-04-11 Earthrenew, Inc. Process and system for drying and heat treating materials
US7024796B2 (en) * 2004-07-19 2006-04-11 Earthrenew, Inc. Process and apparatus for manufacture of fertilizer products from manure and sewage
US8158389B2 (en) 2005-04-20 2012-04-17 Cargill, Incorporated Products and methods for in vivo secretion of monatin
RU2007142666A (ru) * 2005-04-20 2009-05-27 Карджилл, Инкорпорейтед (Us) Продукты и способы для секреции монатина in vivo
US8076108B2 (en) 2005-04-26 2011-12-13 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
US7582455B2 (en) 2005-04-26 2009-09-01 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
US7610692B2 (en) * 2006-01-18 2009-11-03 Earthrenew, Inc. Systems for prevention of HAP emissions and for efficient drying/dehydration processes
US20070163316A1 (en) * 2006-01-18 2007-07-19 Earthrenew Organics Ltd. High organic matter products and related systems for restoring organic matter and nutrients in soil
EP2112227B1 (en) 2006-03-07 2013-05-15 Cargill, Incorporated Aldolases, nucleic acids encoding them and methods for making and using them
CN101490249A (zh) * 2006-05-24 2009-07-22 嘉吉公司 提高平衡反应的产量的方法和系统
US20090198072A1 (en) * 2006-05-24 2009-08-06 Cargill, Incorporated Methods and systems for increasing production of equilibrium reactions
CN101239941B (zh) * 2007-02-08 2012-02-29 味之素株式会社 光学活性化合物的制造方法
US8076107B2 (en) 2007-10-01 2011-12-13 Cargill, Incorporated Production of monatin stereoisomers
US8003361B2 (en) * 2007-10-01 2011-08-23 Cargill Incorporated Production of monatin enantiomers
US8367847B2 (en) * 2007-10-01 2013-02-05 Cargill, Incorporated Production of monatin enantiomers
EP2706122A3 (en) * 2008-01-03 2014-06-18 Verenium Corporation Isomerases, nucleic acids encoding them and methods for making and using them
CA2710683A1 (en) 2008-01-03 2009-07-16 Verenium Corporation Transferases and oxidoreductases, nucleic acids encoding them and methods for making and using them
CN102282156B (zh) * 2008-11-19 2017-03-15 国家政治研究所高级研究中心(高级研究中心) 能够代谢亚磷酸盐作为磷源的转基因植物和真菌
WO2011082365A2 (en) * 2009-12-30 2011-07-07 Cargill, Incorporated Improved bioreactor performance in the production of monatin
JP2013538060A (ja) 2010-08-30 2013-10-10 アルゼダ コーポレーション レブリン酸、レブリン酸エステル、バレロラクトン、およびこれらの誘導体の産生のための発酵経路
US8895249B2 (en) * 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
WO2014194129A2 (en) * 2013-05-29 2014-12-04 Brigham Young University Cell-free synthetic incorporation of non-natural amino acids into proteins
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
EP3330380A1 (en) * 2016-12-05 2018-06-06 Evonik Degussa GmbH Process for producing l-methionine from methional
CN109161483A (zh) * 2018-09-14 2019-01-08 江苏品品鲜生物科技有限公司 一种杏鲍菇菌种复壮筛选方法
BR112021021193A2 (pt) * 2019-04-25 2022-01-04 Zymochem Inc Produção de produtos químicos a partir de fontes renováveis
CN111595923B (zh) * 2020-04-29 2023-05-30 中国石油天然气股份有限公司 一种利用石油组学确定原油热裂解程度的方法
CN112156719B (zh) * 2020-08-26 2022-02-22 夏文杰 一种两性糖脂生物表面活性剂及其制备方法
CN113025602A (zh) * 2021-03-18 2021-06-25 绵阳晟氏健康科技有限公司 固定化精氨酸消旋酶及其制备方法、应用

Family Cites Families (202)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3002889A (en) * 1960-06-20 1961-10-03 Kyowa Hakko Kogyo Kk Method of producing l-glutamic acid
US3128237A (en) * 1961-02-24 1964-04-07 Ajinomoto Kk Process for producing l-glutamic acid by bacterial fermentation
US3399114A (en) * 1964-08-22 1968-08-27 Asahi Chemical Ind Process for producing l-glutamic acid by using bacteria
US5366558A (en) 1979-03-23 1994-11-22 Brink David L Method of treating biomass material
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4371614A (en) * 1980-08-22 1983-02-01 Ajinomoto Co., Inc. E.Coli bacteria carrying recombinant plasmids and their use in the fermentative production of L-tryptophan
US5087571A (en) 1984-06-22 1992-02-11 President And Fellows Of Harvard College Method for providing a cell culture from a transgenic non-human mammal
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
JP2584613B2 (ja) 1985-03-30 1997-02-26 バリベ、マール 組換えdna技術によってdna、rna、ペプタイド、ポリペプタイド、または蛋白質を取得するための方法
US5780292A (en) 1987-04-29 1998-07-14 Alko Group Ltd. Production of phytate degrading enzymes in trichoderma
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5573933A (en) 1987-04-14 1996-11-12 Luminis Pty, Ltd. Transgenic pigs
GB2205834B (en) * 1987-06-15 1990-10-31 South African Inventions 3-(1-amino-1,3-dicarboxy-3-hydroxy-but-4-yl)-indole compounds
US6054270A (en) 1988-05-03 2000-04-25 Oxford Gene Technology Limited Analying polynucleotide sequences
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
US5217879A (en) 1989-01-12 1993-06-08 Washington University Infectious Sindbis virus vectors
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
WO1989011212A2 (en) 1989-08-30 1989-11-30 Wm. Wrigley Jr. Company Method of controlling release of cyclamate in chewing gum and gum produced thereby
US5589583A (en) 1990-01-11 1996-12-31 Monsanto Company Plant promoter
GB2240105B (en) 1990-01-19 1993-06-09 Technology Finance Corp Process for the production of 3-(1-amino-1,3-dicarboxy-3-hydroxy-but-4-yl) indole
AU7791991A (en) 1990-04-24 1991-11-11 Stratagene Methods for phenotype creation from multiple gene populations
WO1991019810A1 (en) 1990-06-15 1991-12-26 California Biotechnology Inc. Transgenic non-human mammal displaying the amyloid-forming pathology of alzheimer's disease
JP3234598B2 (ja) 1990-11-23 2001-12-04 プラント・ジエネテイツク・システムズ・エヌ・ベー 単子葉植物の形質転換方法
WO1992011272A1 (en) 1990-12-20 1992-07-09 Ixsys, Inc. Optimization of binding proteins
US6110700A (en) 1991-03-11 2000-08-29 The General Hospital Corporation PRAD1 cyclin and its cDNA
CN1024903C (zh) * 1991-06-07 1994-06-08 中国石油化工总公司 双烯烃选择加氢转化为单烯烃的镍-钠-硫/氧化铝催化剂
US5922854A (en) 1991-06-14 1999-07-13 Kumar; Ramesh Purifying Human Hemogloblin from transgenic pig red cells and plasmids containing pig globin nucleic acids
CA2075135A1 (en) 1991-08-02 1993-02-03 David E. Ellis Particle-mediated transformation of gymnosperms
US5632957A (en) 1993-11-01 1997-05-27 Nanogen Molecular biological diagnostic systems including electrodes
JPH05236997A (ja) 1992-02-28 1993-09-17 Hitachi Ltd ポリヌクレオチド捕捉用チップ
CA2127807A1 (en) 1992-11-20 1994-06-09 John Maliyakal Transgenic cotton plants producing heterologous bioplastic
US6264999B1 (en) * 1993-09-30 2001-07-24 Wm. Wrigley Jr. Company Chewing gum containing erythritol and method of making
WO1995008914A1 (en) 1993-09-30 1995-04-06 Agracetus, Inc. Transgenic cotton plants producing heterologous peroxidase
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US6468742B2 (en) 1993-11-01 2002-10-22 Nanogen, Inc. Methods for determination of single nucleic acid polymorphisms using bioelectronic microchip
US5965452A (en) 1996-07-09 1999-10-12 Nanogen, Inc. Multiplexed active biologic array
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
JP3698742B2 (ja) 1994-03-01 2005-09-21 協和醗酵工業株式会社 光学活性4−ヒドロキシ−2−ケトグルタル酸の製造法
US5639940A (en) 1994-03-03 1997-06-17 Pharmaceutical Proteins Ltd. Production of fibrinogen in transgenic animals
WO1995024494A1 (en) 1994-03-09 1995-09-14 Abbott Laboratories Humanized milk
CA2184688A1 (en) 1994-03-09 1995-09-14 Pedro Antonio Prieto Transgenic animals producing oligosaccharides and glycoconjugates
US5750870A (en) 1994-06-17 1998-05-12 Agritope, Inc. Plant genetic transformation methods and transgenic plants
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5959171A (en) 1994-08-17 1999-09-28 Pharming B.V. Method for the production of biologically active polypeptides in a mammal's
WO1996006927A1 (en) 1994-09-01 1996-03-07 Merck & Co., Inc. Transgenic animal expressing a familial form of human amyloid precursor protein
US6111166A (en) 1994-09-19 2000-08-29 Medarex, Incorporated Transgenic mice expressing human Fcα and β receptors
US5795737A (en) 1994-09-19 1998-08-18 The General Hospital Corporation High level expression of proteins
US5880327A (en) 1994-09-21 1999-03-09 American National Red Cross Transgenic mammals expressing human coagulation factor VIII
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US6187992B1 (en) 1994-12-05 2001-02-13 Merck & Co., Inc. Transgenic mouse having a disrupted amyloid precursor protein gene
US5830645A (en) 1994-12-09 1998-11-03 The Regents Of The University Of California Comparative fluorescence hybridization to nucleic acid arrays
US5633440A (en) 1994-12-20 1997-05-27 Dna Plant Technology Corporation P119 promoters and their uses
US5705369A (en) 1994-12-27 1998-01-06 Midwest Research Institute Prehydrolysis of lignocellulose
DE69617641T3 (de) 1995-01-26 2009-10-22 Novozymes A/S Xylanase beinhaltende futterzusätze für tiere
US5959098A (en) 1996-04-17 1999-09-28 Affymetrix, Inc. Substrate preparation process
JPH10510433A (ja) 1995-06-06 1998-10-13 アイシス・ファーマシューティカルス・インコーポレーテッド 高いキラル純度のホスホロチオエート結合を有するオリゴヌクレオチド
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
US6057103A (en) 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
US5962258A (en) 1995-08-23 1999-10-05 Diversa Corporation Carboxymethyl cellulase fromthermotoga maritima
WO1997016533A1 (en) 1995-10-31 1997-05-09 The Regents Of The University Of California Mammalian artificial chromosomes and methods of using same
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US5830696A (en) 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
US6171820B1 (en) 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US20030215798A1 (en) 1997-06-16 2003-11-20 Diversa Corporation High throughput fluorescence-based screening for novel enzymes
US6740506B2 (en) 1995-12-07 2004-05-25 Diversa Corporation End selection in directed evolution
US6358709B1 (en) 1995-12-07 2002-03-19 Diversa Corporation End selection in directed evolution
US6361974B1 (en) 1995-12-07 2002-03-26 Diversa Corporation Exonuclease-mediated nucleic acid reassembly in directed evolution
US6022963A (en) 1995-12-15 2000-02-08 Affymetrix, Inc. Synthesis of oligonucleotide arrays using photocleavable protecting groups
US6013440A (en) 1996-03-11 2000-01-11 Affymetrix, Inc. Nucleic acid affinity columns
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6025155A (en) 1996-04-10 2000-02-15 Chromos Molecular Systems, Inc. Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes
US5697987A (en) 1996-05-10 1997-12-16 The Trustees Of Princeton University Alternative fuel
AU3568897A (en) 1996-06-07 1998-01-05 Eos Biotechnology, Inc. Immobilised linear oligonucleotide arrays
US5728555A (en) * 1996-09-30 1998-03-17 Monsanto Company Preparation of d-amino acids by direct fermentative means
EP2261373A3 (en) 1997-01-17 2011-12-14 Codexis Mayflower Holdings, LLC Evolution of whole cells and organisms by recursive sequence recombination
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
IL131966A0 (en) 1997-03-18 2001-03-19 Novo Industri As An in vitro method for construction of a dna library
JP4263248B2 (ja) 1997-03-18 2009-05-13 ノボザイムス アクティーゼルスカブ Dnaのシャッフリングによるライブラリーの作成方法
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
US6333181B1 (en) 1997-04-07 2001-12-25 University Of Florida Research Foundation, Inc. Ethanol production from lignocellulose
US5916780A (en) 1997-06-09 1999-06-29 Iogen Corporation Pretreatment process for conversion of cellulose to fuel ethanol
CA2234412C (en) * 1997-06-09 2008-09-02 Kyowa Hakko Kogyo Co., Ltd. Method for producing optically active compound
US7019827B2 (en) 1997-06-16 2006-03-28 Diversa Corporation GigaMatrix holding tray having through-hole wells
AUPO758297A0 (en) 1997-06-27 1997-07-24 Rowe, James Baber Control of acidic gut syndrome
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
AU8908198A (en) 1997-08-15 1999-03-08 Hyseq, Inc. Methods and compositions for detection or quantification of nucleic acid species
PT1012564E (pt) 1997-09-11 2003-08-29 Bioventures Inc Metodo de producao de arranjos de alta densidade
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
AU1124499A (en) 1997-10-28 1999-05-17 Maxygen, Inc. Human papillomavirus vectors
AU1449499A (en) 1997-10-31 1999-05-24 Maxygen, Incorporated Modification of virus tropism and host range by viral genome shuffling
CA2251263A1 (en) 1997-11-14 1999-05-14 Hajime Karasuyama Transgenic animal allergy models and methods for their use
KR20010032861A (ko) 1997-12-08 2001-04-25 캘리포니아 인스티튜트 오브 테크놀로지 폴리뉴클레오티드 및 폴리펩티드 서열을 형성하는 방법
MXPA00007889A (es) 1998-02-11 2002-09-18 Maxygen Inc Optimizacion de las propiedades inmunomoduladoras de las vacunas geneticas.
JP2002507393A (ja) 1998-02-11 2002-03-12 マキシジェン, インコーポレイテッド 抗原ライブラリー免疫
ATE340870T1 (de) 1998-04-03 2006-10-15 Compound Therapeutics Inc Adressierbare protein arrays
US6156952A (en) 1998-04-09 2000-12-05 Constituent Institution Of The University Of Maryland System HIV transgenic animals and uses therefor
US6048695A (en) 1998-05-04 2000-04-11 Baylor College Of Medicine Chemically modified nucleic acids and methods for coupling nucleic acids to solid support
ATE547532T1 (de) 1998-06-29 2012-03-15 Bristol Myers Squibb Co Verfahren zur erzeugung von hochgradig diversen bibliotheken
FR2782323B1 (fr) 1998-08-12 2002-01-11 Proteus Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues
GB2340755B (en) 1998-08-24 2002-09-25 Cannon Rubber Ltd Breast pump insert
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
US6277489B1 (en) 1998-12-04 2001-08-21 The Regents Of The University Of California Support for high performance affinity chromatography and other uses
WO2000042560A2 (en) 1999-01-19 2000-07-20 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6221653B1 (en) 1999-04-27 2001-04-24 Agilent Technologies, Inc. Method of performing array-based hybridization assays using thermal inkjet deposition of sample fluids
DK1176981T3 (da) 1999-05-07 2006-04-10 Genentech Inc Behandling af autoimmune sygdomme med antagonister som binder til B celleoverflademarkörer
US6653151B2 (en) 1999-07-30 2003-11-25 Large Scale Proteomics Corporation Dry deposition of materials for microarrays using matrix displacement
US6409841B1 (en) 1999-11-02 2002-06-25 Waste Energy Integrated Systems, Llc. Process for the production of organic products from diverse biomass sources
EP1106603A3 (en) 1999-12-06 2003-11-19 Fuji Photo Film Co., Ltd. DNA chip and reactive solid carrier
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
AU2001266978A1 (en) 2000-06-14 2001-12-24 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
US6423145B1 (en) 2000-08-09 2002-07-23 Midwest Research Institute Dilute acid/metal salt hydrolysis of lignocellulosics
AU2001278945A1 (en) 2000-08-10 2002-02-25 Eli Lilly And Company 4-substituted d-glutamic acid derivatives for use as antibiotic
JP2002060382A (ja) 2000-08-22 2002-02-26 Ajinomoto Co Inc モナティンの立体異性体及びその使用、並びにモナティン類の製造方法及びそのための中間体
WO2002029032A2 (en) 2000-09-30 2002-04-11 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
IL150020A0 (en) 2000-10-10 2002-12-01 Diversa Corp High throughput or capillary-based screening for a bioactivity or biomolecule
US6309872B1 (en) 2000-11-01 2001-10-30 Novozymes Biotech, Inc Polypeptides having glucoamylase activity and nucleic acids encoding same
JP2004523219A (ja) 2000-11-30 2004-08-05 ディヴァーサ コーポレイション タンパク質ポリマーの製造方法および前記ポリマーの使用
US20060019913A1 (en) 2001-05-18 2006-01-26 Sirna Therapeutics, Inc. RNA interference mediated inhibtion of protein tyrosine phosphatase-1B (PTP-1B) gene expression using short interfering nucleic acid (siNA)
DE02786364T1 (de) 2001-10-01 2005-01-13 Diversa Inc., San Diego Konstruktion ganzer zellen unter verwendung einer echtzeitanalyse des metabolischen flusses
JP2003171365A (ja) 2001-11-30 2003-06-20 Ajinomoto Co Inc モナティン類及びその製造中間体の製造方法並びに新規中間体
EP1449832A4 (en) * 2001-11-30 2005-02-02 Ajinomoto Kk CRYSTALS OF NON-NATURAL STEREO-ISOMERAL SALTS OF MONATIN AND THEIR USE
US7297800B2 (en) * 2001-12-27 2007-11-20 Ajinomoto Co., Inc. Process of producing glutamate derivatives
KR100673283B1 (ko) 2001-12-27 2007-01-24 아지노모토 가부시키가이샤 글루탐산 유도체의 제조방법
CA2471847C (en) * 2001-12-27 2012-05-15 Ajinomoto Co., Inc. Processes of producing glutamic acid compounds and production intermediates therefor and novel intermediate for the processes
JP2003292484A (ja) 2002-04-01 2003-10-15 Ajinomoto Co Inc γ−ヒドロキシアミノ酸誘導体及びモナティン類の製造方法
KR100902813B1 (ko) 2002-04-23 2009-06-12 카길 인코포레이티드 폴리펩티드 및 생합성 경로
US7572607B2 (en) 2002-04-23 2009-08-11 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of monatin and its precursors
US8372989B2 (en) * 2002-04-23 2013-02-12 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of monatin and its precursors
AU2003261722A1 (en) 2002-08-26 2004-03-11 Ajinomoto Co., Inc. NOVEL ALDOLASES AND PROCESS FOR PRODUCING SUBSTITUTED Alpha-KETO ACID
CA2507225C (en) 2002-12-09 2012-02-07 Ajinomoto Co., Inc. Mutated d-aminotransferase and method for producing optically active glutamic acid derivatives using the same
US6776979B2 (en) 2002-12-30 2004-08-17 Marvin B. Frager Periodontal treatment compound and method of use
AU2003301508A1 (en) * 2003-01-09 2004-08-23 Ajinomoto Co., Inc. Processes for producing glutamic acid derivative and pyroglutamic acid derivative and novel intermediate for production
JP4239600B2 (ja) 2003-01-24 2009-03-18 味の素株式会社 2r−モナティンの製造方法
WO2004085624A2 (en) 2003-03-24 2004-10-07 Diversa Corporation Transaminases, deaminases and aminomutases and compositions and methods for enzymatic detoxification
JP2004331650A (ja) 2003-04-14 2004-11-25 Kanazawa Univ Tlo Inc モナチン類の製造法
JP2004331644A (ja) 2003-04-14 2004-11-25 Kanazawa Univ Tlo Inc モナチン類の製造法
WO2005001105A1 (ja) 2003-06-26 2005-01-06 Ajinomoto Co., Inc. モナティンの製造方法
BRPI0413241A (pt) * 2003-08-01 2006-10-03 Cargill Inc composições de adoçante de mesa de monatina e métodos de fazer as mesmas
ATE360370T1 (de) * 2003-08-14 2007-05-15 Cargill Inc Monatinhaltige kaugummizusammensetzungen und verfahren zu ihrer herstellung
RU2380989C2 (ru) * 2003-08-25 2010-02-10 Карджилл, Инкорпорейтед Питьевая композиция, содержащая монатин, и способы ее получения
JP4829117B2 (ja) * 2003-10-21 2011-12-07 カーギル,インコーポレイティド モナチンおよびモナチン前駆体の製造
JP4500977B2 (ja) 2003-11-05 2010-07-14 味の素株式会社 新規アミノ酸誘導体及び甘味剤
JP5113978B2 (ja) * 2003-11-21 2013-01-09 味の素株式会社 グルタミン酸誘導体の有機アミン塩及びその利用
RU2351587C2 (ru) 2004-02-27 2009-04-10 Адзиномото Ко., Инк. Способ получения монатина
JP4604524B2 (ja) * 2004-03-16 2011-01-05 味の素株式会社 変異型アルドラーゼ、並びにこれを用いた光学活性ihog及び光学活性モナティンの製造方法
JP4604537B2 (ja) * 2004-03-31 2011-01-05 味の素株式会社 L−システイン生産菌及びl−システインの製造法
US20060014260A1 (en) 2004-05-07 2006-01-19 Zhiliang Fan Lower cellulase requirements for biomass cellulose hydrolysis and fermentation
US20060030003A1 (en) 2004-05-12 2006-02-09 Simon Michael R Composition and method for introduction of RNA interference sequences into targeted cells and tissues
US7338763B2 (en) 2004-06-02 2008-03-04 Eppendorf Array Technologies S.A. Method and kit for the detection and/or quantification of homologous nucleotide sequences on arrays
US7935377B2 (en) * 2004-06-04 2011-05-03 Ajinomoto Co., Inc. Crystals of free (2R, 4R)-monatin and use thereof
CA2506247C (en) * 2004-06-07 2012-02-21 Ajinomoto Co., Inc. Novel aldolase, and method for producing optically active ihog and monatin
ATE536418T1 (de) 2004-06-07 2011-12-15 Protiva Biotherapeutics Inc Lipidverkapselte interferenz-rna
US7635563B2 (en) 2004-06-30 2009-12-22 Massachusetts Institute Of Technology High throughput methods relating to microRNA expression analysis
KR101216575B1 (ko) * 2004-07-14 2012-12-31 아지노모토 가부시키가이샤 (2r,4r)-모나틴 칼륨 염 결정 및 이를 함유하는 감미료조성물
US20060019258A1 (en) 2004-07-20 2006-01-26 Illumina, Inc. Methods and compositions for detection of small interfering RNA and micro-RNA
JP2007284349A (ja) * 2004-07-27 2007-11-01 Ajinomoto Co Inc モナティンまたはその塩の製造方法
KR20070062542A (ko) * 2004-10-05 2007-06-15 아지노모토 가부시키가이샤 하이드록시이미노산으로부터 아미노산 유도체의 제조방법
EP1808083B1 (en) * 2004-10-15 2012-12-05 Ajinomoto Co., Inc. Sweetener composition
JP2008530978A (ja) 2005-03-03 2008-08-14 味の素株式会社 4−ハイドロキシ−l−イソロイシン又はその塩の製造法
US8158389B2 (en) * 2005-04-20 2012-04-17 Cargill, Incorporated Products and methods for in vivo secretion of monatin
RU2007142666A (ru) * 2005-04-20 2009-05-27 Карджилл, Инкорпорейтед (Us) Продукты и способы для секреции монатина in vivo
EP1883697A4 (en) 2005-04-26 2010-05-05 Cargill Inc POLYPEPTIDES AND BIOSYNTHESIS PROCEDURES FOR THE PRODUCTION OF STEREOISOMERS OF MONATIN AND THEIR PRECURSORS
US8076108B2 (en) * 2005-04-26 2011-12-13 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
US7582455B2 (en) * 2005-04-26 2009-09-01 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
EP2112227B1 (en) 2006-03-07 2013-05-15 Cargill, Incorporated Aldolases, nucleic acids encoding them and methods for making and using them
CN102690833B (zh) * 2006-03-07 2015-09-09 巴斯夫酶有限责任公司 醛缩酶、编码它们的核酸及制备和使用它们的方法
RU2338784C2 (ru) * 2006-03-24 2008-11-20 Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) Новая альдолаза, днк, кодирующая альдолазу, клетки, трансформированные днк, способ получения альдолазы и способ получения 4-гидрокси-l-изолейцина (варианты)
US20090198072A1 (en) * 2006-05-24 2009-08-06 Cargill, Incorporated Methods and systems for increasing production of equilibrium reactions
CN101490249A (zh) * 2006-05-24 2009-07-22 嘉吉公司 提高平衡反应的产量的方法和系统
US7354746B1 (en) * 2006-12-11 2008-04-08 Ajinomoto Co., Inc. Method for producing optically active IHOG and monatin
CN101239941B (zh) * 2007-02-08 2012-02-29 味之素株式会社 光学活性化合物的制造方法
US8367847B2 (en) * 2007-10-01 2013-02-05 Cargill, Incorporated Production of monatin enantiomers
US8003361B2 (en) 2007-10-01 2011-08-23 Cargill Incorporated Production of monatin enantiomers
US8076107B2 (en) * 2007-10-01 2011-12-13 Cargill, Incorporated Production of monatin stereoisomers
WO2011002469A1 (en) * 2009-07-02 2011-01-06 Cargill, Incorporated Isomerases and epimerases and methods of using
WO2009088482A1 (en) * 2008-01-03 2009-07-16 Cargill, Incorporated Aminotransferase and oxidoreductase nucleic acids and polypeptides and methods of using
JP2012520079A (ja) 2009-03-12 2012-09-06 カーギル・インコーポレイテッド モナチンおよびカルシウムを含む組成物
EP2434910B1 (en) 2009-05-28 2015-10-21 Cargill, Incorporated Shelf stable monatin sweetened beverage
WO2011082363A1 (en) 2009-12-30 2011-07-07 Cargill, Incorporated Membrane separation and purification of monatin
WO2011082351A1 (en) 2009-12-30 2011-07-07 Cargill, Incorporated A polymer and methods of preparing and using a polymer
WO2011082353A1 (en) 2009-12-30 2011-07-07 Cargill, Incorporated Separation and purification of monatin
WO2011082365A2 (en) 2009-12-30 2011-07-07 Cargill, Incorporated Improved bioreactor performance in the production of monatin
WO2014205447A2 (en) 2013-06-21 2014-12-24 Bio-Rad Laboratories, Inc. Microfluidic system with fluid pickups

Also Published As

Publication number Publication date
JP2009528842A (ja) 2009-08-13
JP5441417B2 (ja) 2014-03-12
CN101437954B (zh) 2015-09-09
WO2007103389A3 (en) 2008-01-03
AU2007223913B2 (en) 2013-06-13
EP2316962A1 (en) 2011-05-04
US9518280B2 (en) 2016-12-13
US20080020435A1 (en) 2008-01-24
WO2007103389A9 (en) 2007-11-01
CN101437954A (zh) 2009-05-20
EP2112227B1 (en) 2013-05-15
EP2322643B1 (en) 2014-07-09
US20150111260A1 (en) 2015-04-23
AU2007223913A1 (en) 2007-09-13
EP2112227A1 (en) 2009-10-28
US9005938B2 (en) 2015-04-14
US8043837B2 (en) 2011-10-25
EP1994161A2 (en) 2008-11-26
CA2643416A1 (en) 2007-09-13
WO2007103389A2 (en) 2007-09-13
EP2316962B1 (en) 2014-07-09
US20120009634A1 (en) 2012-01-12
CA2643416C (en) 2016-07-26
MX2008011477A (es) 2008-09-23
ES2416104T3 (es) 2013-07-30
EP2322643A1 (en) 2011-05-18

Similar Documents

Publication Publication Date Title
US9719079B2 (en) Aldolases, nucleic acids encoding them and methods for making and using them
BRPI0708673A2 (pt) método para fabricação de polipeptìdeos com atividade de aldolase e polinucleotìdeos que codificam estes polipeptìdeos
AU2016201456A1 (en) Aldolases, nucleic acids encoding them and methods for making and using them
AU2013251189A1 (en) Aldolases, nucleic acids encoding them and methods for making and using them

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: C12P 17/00 , C07D 209/20 , C12N 9/88 , A23L 1/22

Ipc: C12P 17/00 (2006.01), C07D 209/20 (2006.01), C12N

B07A Technical examination (opinion): publication of technical examination (opinion)
B09B Decision: refusal
B09B Decision: refusal