BRPI0708614A2 - aldolases, ácidos nucléicos codificando as mesmas e métodos para produzir e usar as mesmas - Google Patents
aldolases, ácidos nucléicos codificando as mesmas e métodos para produzir e usar as mesmas Download PDFInfo
- Publication number
- BRPI0708614A2 BRPI0708614A2 BRPI0708614-8A BRPI0708614A BRPI0708614A2 BR PI0708614 A2 BRPI0708614 A2 BR PI0708614A2 BR PI0708614 A BRPI0708614 A BR PI0708614A BR PI0708614 A2 BRPI0708614 A2 BR PI0708614A2
- Authority
- BR
- Brazil
- Prior art keywords
- seq
- polypeptide
- nucleic acid
- sequence
- aldolase
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 202
- 150000007523 nucleic acids Chemical class 0.000 title claims description 408
- 102000039446 nucleic acids Human genes 0.000 title claims description 349
- 108020004707 nucleic acids Proteins 0.000 title claims description 349
- 102000003677 Aldehyde-Lyases Human genes 0.000 title description 22
- 108090000072 Aldehyde-Lyases Proteins 0.000 title description 22
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 claims abstract description 569
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 claims abstract description 567
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 484
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 450
- 229920001184 polypeptide Polymers 0.000 claims abstract description 441
- 230000000694 effects Effects 0.000 claims abstract description 289
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 claims abstract description 190
- 102000004190 Enzymes Human genes 0.000 claims abstract description 96
- 108090000790 Enzymes Proteins 0.000 claims abstract description 95
- 238000004519 manufacturing process Methods 0.000 claims abstract description 47
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 45
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 45
- 239000002157 polynucleotide Substances 0.000 claims abstract description 45
- 210000004027 cell Anatomy 0.000 claims description 145
- 108090000623 proteins and genes Proteins 0.000 claims description 117
- 235000018102 proteins Nutrition 0.000 claims description 85
- 102000004169 proteins and genes Human genes 0.000 claims description 85
- 238000006243 chemical reaction Methods 0.000 claims description 83
- 238000002703 mutagenesis Methods 0.000 claims description 73
- 231100000350 mutagenesis Toxicity 0.000 claims description 73
- 239000000758 substrate Substances 0.000 claims description 72
- 239000000523 sample Substances 0.000 claims description 69
- 230000014509 gene expression Effects 0.000 claims description 62
- 235000001014 amino acid Nutrition 0.000 claims description 57
- 108020004705 Codon Proteins 0.000 claims description 56
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 55
- 150000001875 compounds Chemical class 0.000 claims description 55
- 241000196324 Embryophyta Species 0.000 claims description 54
- 229940024606 amino acid Drugs 0.000 claims description 52
- 238000012360 testing method Methods 0.000 claims description 48
- 150000001413 amino acids Chemical class 0.000 claims description 47
- 239000012634 fragment Substances 0.000 claims description 45
- 239000013598 vector Substances 0.000 claims description 38
- 239000000203 mixture Substances 0.000 claims description 37
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 34
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 29
- 150000003384 small molecules Chemical class 0.000 claims description 29
- 108020004414 DNA Proteins 0.000 claims description 28
- 230000003321 amplification Effects 0.000 claims description 28
- 108091034117 Oligonucleotide Proteins 0.000 claims description 24
- 230000007423 decrease Effects 0.000 claims description 24
- 230000007613 environmental effect Effects 0.000 claims description 24
- 238000003752 polymerase chain reaction Methods 0.000 claims description 24
- 239000007795 chemical reaction product Substances 0.000 claims description 22
- 238000006467 substitution reaction Methods 0.000 claims description 22
- 241001465754 Metazoa Species 0.000 claims description 20
- -1 aliphatic amino acid Chemical class 0.000 claims description 20
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- WHUUTDBJXJRKMK-GSVOUGTGSA-N D-glutamic acid Chemical compound OC(=O)[C@H](N)CCC(O)=O WHUUTDBJXJRKMK-GSVOUGTGSA-N 0.000 claims description 16
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 16
- 230000015572 biosynthetic process Effects 0.000 claims description 16
- 235000013305 food Nutrition 0.000 claims description 16
- 125000003729 nucleotide group Chemical group 0.000 claims description 16
- 239000002243 precursor Substances 0.000 claims description 16
- 239000002253 acid Substances 0.000 claims description 15
- 230000002378 acidificating effect Effects 0.000 claims description 15
- 235000015872 dietary supplement Nutrition 0.000 claims description 15
- 239000002773 nucleotide Substances 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 102000005962 receptors Human genes 0.000 claims description 14
- 108020003175 receptors Proteins 0.000 claims description 14
- 239000000126 substance Substances 0.000 claims description 14
- 108010017192 4-hydroxy-4-methyl-2-oxoglutarate aldolase Proteins 0.000 claims description 13
- 230000001580 bacterial effect Effects 0.000 claims description 13
- 235000013361 beverage Nutrition 0.000 claims description 13
- 230000000295 complement effect Effects 0.000 claims description 13
- 238000012986 modification Methods 0.000 claims description 13
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 12
- 238000010367 cloning Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 230000004048 modification Effects 0.000 claims description 12
- 229910052717 sulfur Inorganic materials 0.000 claims description 12
- 229930182847 D-glutamic acid Natural products 0.000 claims description 11
- 241000238631 Hexapoda Species 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 238000000746 purification Methods 0.000 claims description 11
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 11
- 230000009261 transgenic effect Effects 0.000 claims description 11
- 241000233866 Fungi Species 0.000 claims description 10
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 10
- 230000002210 biocatalytic effect Effects 0.000 claims description 10
- 238000009396 hybridization Methods 0.000 claims description 10
- 239000007788 liquid Substances 0.000 claims description 10
- 239000008188 pellet Substances 0.000 claims description 10
- 210000001519 tissue Anatomy 0.000 claims description 10
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 9
- 239000011203 carbon fibre reinforced carbon Substances 0.000 claims description 9
- 235000013339 cereals Nutrition 0.000 claims description 9
- 238000013519 translation Methods 0.000 claims description 9
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 8
- 241000282414 Homo sapiens Species 0.000 claims description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 8
- 238000007792 addition Methods 0.000 claims description 8
- 125000003118 aryl group Chemical group 0.000 claims description 8
- 238000006911 enzymatic reaction Methods 0.000 claims description 8
- 230000009368 gene silencing by RNA Effects 0.000 claims description 8
- 230000002068 genetic effect Effects 0.000 claims description 8
- 230000013595 glycosylation Effects 0.000 claims description 8
- 238000006206 glycosylation reaction Methods 0.000 claims description 8
- 230000002401 inhibitory effect Effects 0.000 claims description 8
- 210000004962 mammalian cell Anatomy 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000005453 pelletization Methods 0.000 claims description 8
- 239000013612 plasmid Substances 0.000 claims description 8
- 210000005253 yeast cell Anatomy 0.000 claims description 8
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical class OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 claims description 7
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 7
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 7
- 238000003776 cleavage reaction Methods 0.000 claims description 7
- 239000002299 complementary DNA Substances 0.000 claims description 7
- 239000000446 fuel Substances 0.000 claims description 7
- 102000037865 fusion proteins Human genes 0.000 claims description 7
- 108020001507 fusion proteins Proteins 0.000 claims description 7
- 230000002163 immunogen Effects 0.000 claims description 7
- 230000006798 recombination Effects 0.000 claims description 7
- 238000005215 recombination Methods 0.000 claims description 7
- 230000007017 scission Effects 0.000 claims description 7
- 238000011179 visual inspection Methods 0.000 claims description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 6
- 239000012472 biological sample Substances 0.000 claims description 6
- 238000013500 data storage Methods 0.000 claims description 6
- 235000013373 food additive Nutrition 0.000 claims description 6
- 239000002778 food additive Substances 0.000 claims description 6
- 239000000499 gel Substances 0.000 claims description 6
- 238000001727 in vivo Methods 0.000 claims description 6
- 230000001965 increasing effect Effects 0.000 claims description 6
- 230000002503 metabolic effect Effects 0.000 claims description 6
- 230000003505 mutagenic effect Effects 0.000 claims description 6
- 238000002360 preparation method Methods 0.000 claims description 6
- 230000008439 repair process Effects 0.000 claims description 6
- 239000013603 viral vector Substances 0.000 claims description 6
- 241000894006 Bacteria Species 0.000 claims description 5
- 244000068988 Glycine max Species 0.000 claims description 5
- 240000005979 Hordeum vulgare Species 0.000 claims description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 5
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 5
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 5
- 244000061176 Nicotiana tabacum Species 0.000 claims description 5
- 244000061456 Solanum tuberosum Species 0.000 claims description 5
- 239000000654 additive Substances 0.000 claims description 5
- 239000000074 antisense oligonucleotide Substances 0.000 claims description 5
- 238000012230 antisense oligonucleotides Methods 0.000 claims description 5
- 210000004436 artificial bacterial chromosome Anatomy 0.000 claims description 5
- 239000003112 inhibitor Substances 0.000 claims description 5
- 231100000219 mutagenic Toxicity 0.000 claims description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 5
- 239000007787 solid Substances 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000012384 transportation and delivery Methods 0.000 claims description 5
- 241000701161 unidentified adenovirus Species 0.000 claims description 5
- 239000002699 waste material Substances 0.000 claims description 5
- 240000002791 Brassica napus Species 0.000 claims description 4
- 241000588724 Escherichia coli Species 0.000 claims description 4
- 235000010469 Glycine max Nutrition 0.000 claims description 4
- 241000235058 Komagataella pastoris Species 0.000 claims description 4
- 108020004711 Nucleic Acid Probes Proteins 0.000 claims description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 4
- 150000001299 aldehydes Chemical class 0.000 claims description 4
- 125000000539 amino acid group Chemical group 0.000 claims description 4
- 210000004507 artificial chromosome Anatomy 0.000 claims description 4
- 235000008429 bread Nutrition 0.000 claims description 4
- 238000012219 cassette mutagenesis Methods 0.000 claims description 4
- 230000002950 deficient Effects 0.000 claims description 4
- 238000005206 flow analysis Methods 0.000 claims description 4
- 235000013922 glutamic acid Nutrition 0.000 claims description 4
- 239000004220 glutamic acid Substances 0.000 claims description 4
- 239000000833 heterodimer Substances 0.000 claims description 4
- 230000028993 immune response Effects 0.000 claims description 4
- 150000002576 ketones Chemical class 0.000 claims description 4
- 230000014759 maintenance of location Effects 0.000 claims description 4
- 210000000415 mammalian chromosome Anatomy 0.000 claims description 4
- 239000002679 microRNA Substances 0.000 claims description 4
- 239000002853 nucleic acid probe Substances 0.000 claims description 4
- 239000008194 pharmaceutical composition Substances 0.000 claims description 4
- 229940035893 uracil Drugs 0.000 claims description 4
- 108020004459 Small interfering RNA Proteins 0.000 claims description 3
- 108700005078 Synthetic Genes Proteins 0.000 claims description 3
- 235000021307 Triticum Nutrition 0.000 claims description 3
- 239000003242 anti bacterial agent Substances 0.000 claims description 3
- 210000001106 artificial yeast chromosome Anatomy 0.000 claims description 3
- 235000003704 aspartic acid Nutrition 0.000 claims description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 3
- 230000003115 biocidal effect Effects 0.000 claims description 3
- 238000009395 breeding Methods 0.000 claims description 3
- 230000001488 breeding effect Effects 0.000 claims description 3
- 238000004113 cell culture Methods 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 238000009472 formulation Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 229910052751 metal Inorganic materials 0.000 claims description 3
- 239000002184 metal Substances 0.000 claims description 3
- 230000002018 overexpression Effects 0.000 claims description 3
- 239000002245 particle Substances 0.000 claims description 3
- 239000006187 pill Substances 0.000 claims description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 239000000843 powder Substances 0.000 claims description 3
- 239000002689 soil Substances 0.000 claims description 3
- 239000007921 spray Substances 0.000 claims description 3
- 239000003826 tablet Substances 0.000 claims description 3
- 241001515965 unidentified phage Species 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 244000105624 Arachis hypogaea Species 0.000 claims description 2
- 239000004475 Arginine Substances 0.000 claims description 2
- 241000283707 Capra Species 0.000 claims description 2
- 108700010070 Codon Usage Proteins 0.000 claims description 2
- 241001057636 Dracaena deremensis Species 0.000 claims description 2
- 241000702191 Escherichia virus P1 Species 0.000 claims description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 2
- 241000186610 Lactobacillus sp. Species 0.000 claims description 2
- 239000004472 Lysine Substances 0.000 claims description 2
- 230000004988 N-glycosylation Effects 0.000 claims description 2
- 125000000729 N-terminal amino-acid group Chemical group 0.000 claims description 2
- 241000282849 Ruminantia Species 0.000 claims description 2
- 241000187180 Streptomyces sp. Species 0.000 claims description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 2
- 239000012190 activator Substances 0.000 claims description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 2
- 239000011324 bead Substances 0.000 claims description 2
- 235000013405 beer Nutrition 0.000 claims description 2
- 230000001851 biosynthetic effect Effects 0.000 claims description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 2
- 239000000919 ceramic Substances 0.000 claims description 2
- 238000004520 electroporation Methods 0.000 claims description 2
- 230000002538 fungal effect Effects 0.000 claims description 2
- 239000011521 glass Substances 0.000 claims description 2
- 239000010439 graphite Substances 0.000 claims description 2
- 229910002804 graphite Inorganic materials 0.000 claims description 2
- 210000004408 hybridoma Anatomy 0.000 claims description 2
- 239000007943 implant Substances 0.000 claims description 2
- 229960000310 isoleucine Drugs 0.000 claims description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 2
- 108091070501 miRNA Proteins 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 claims description 2
- 229920000642 polymer Polymers 0.000 claims description 2
- 210000001938 protoplast Anatomy 0.000 claims description 2
- 239000011347 resin Substances 0.000 claims description 2
- 229920005989 resin Polymers 0.000 claims description 2
- 230000001177 retroviral effect Effects 0.000 claims description 2
- 239000013589 supplement Substances 0.000 claims description 2
- 239000004474 valine Substances 0.000 claims description 2
- 238000005406 washing Methods 0.000 claims description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 claims 9
- 239000012978 lignocellulosic material Substances 0.000 claims 7
- HSJKGGMUJITCBW-UHFFFAOYSA-N 3-hydroxybutanal Chemical compound CC(O)CC=O HSJKGGMUJITCBW-UHFFFAOYSA-N 0.000 claims 6
- 239000002028 Biomass Substances 0.000 claims 6
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 claims 6
- 108091030071 RNAI Proteins 0.000 claims 6
- 125000003368 amide group Chemical group 0.000 claims 5
- 238000009826 distribution Methods 0.000 claims 3
- BDERNNFJNOPAEC-UHFFFAOYSA-N propan-1-ol Chemical compound CCCO BDERNNFJNOPAEC-UHFFFAOYSA-N 0.000 claims 3
- 239000000700 radioactive tracer Substances 0.000 claims 3
- 244000020551 Helianthus annuus Species 0.000 claims 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims 2
- 239000004473 Threonine Substances 0.000 claims 2
- 244000098338 Triticum aestivum Species 0.000 claims 2
- 229920002678 cellulose Polymers 0.000 claims 2
- 239000001913 cellulose Substances 0.000 claims 2
- 230000000593 degrading effect Effects 0.000 claims 2
- 238000001914 filtration Methods 0.000 claims 2
- 230000033607 mismatch repair Effects 0.000 claims 2
- 241001133760 Acoelorraphe Species 0.000 claims 1
- 241000251468 Actinopterygii Species 0.000 claims 1
- 241000589158 Agrobacterium Species 0.000 claims 1
- 244000025254 Cannabis sativa Species 0.000 claims 1
- 241000287828 Gallus gallus Species 0.000 claims 1
- 240000002024 Gossypium herbaceum Species 0.000 claims 1
- 235000004341 Gossypium herbaceum Nutrition 0.000 claims 1
- 244000299507 Gossypium hirsutum Species 0.000 claims 1
- 235000003222 Helianthus annuus Nutrition 0.000 claims 1
- 229920002488 Hemicellulose Polymers 0.000 claims 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims 1
- 240000004658 Medicago sativa Species 0.000 claims 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims 1
- 240000007594 Oryza sativa Species 0.000 claims 1
- 244000076686 Queensland pidgeon grass Species 0.000 claims 1
- 235000003232 Setaria pumila ssp. pallide fusca Nutrition 0.000 claims 1
- 240000003768 Solanum lycopersicum Species 0.000 claims 1
- 240000003829 Sorghum propinquum Species 0.000 claims 1
- 230000000996 additive effect Effects 0.000 claims 1
- 235000004279 alanine Nutrition 0.000 claims 1
- 125000001931 aliphatic group Chemical group 0.000 claims 1
- 239000006053 animal diet Substances 0.000 claims 1
- 210000003578 bacterial chromosome Anatomy 0.000 claims 1
- 239000013599 cloning vector Substances 0.000 claims 1
- 230000007850 degeneration Effects 0.000 claims 1
- 150000004676 glycans Chemical class 0.000 claims 1
- 230000001279 glycosylating effect Effects 0.000 claims 1
- 239000000710 homodimer Substances 0.000 claims 1
- 239000010903 husk Substances 0.000 claims 1
- 239000002029 lignocellulosic biomass Substances 0.000 claims 1
- 238000000520 microinjection Methods 0.000 claims 1
- 239000003471 mutagenic agent Substances 0.000 claims 1
- 231100000707 mutagenic chemical Toxicity 0.000 claims 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims 1
- 229920001282 polysaccharide Polymers 0.000 claims 1
- 239000005017 polysaccharide Substances 0.000 claims 1
- 238000005086 pumping Methods 0.000 claims 1
- 210000002435 tendon Anatomy 0.000 claims 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims 1
- RMLYXMMBIZLGAQ-HZMBPMFUSA-N (2s,4s)-4-amino-2-hydroxy-2-(1h-indol-3-ylmethyl)pentanedioic acid Chemical compound C1=CC=C2C(C[C@](O)(C[C@H](N)C(O)=O)C(O)=O)=CNC2=C1 RMLYXMMBIZLGAQ-HZMBPMFUSA-N 0.000 abstract description 127
- RMLYXMMBIZLGAQ-UHFFFAOYSA-N (-)-monatin Natural products C1=CC=C2C(CC(O)(CC(N)C(O)=O)C(O)=O)=CNC2=C1 RMLYXMMBIZLGAQ-UHFFFAOYSA-N 0.000 abstract description 101
- 150000003839 salts Chemical class 0.000 abstract description 21
- SLWQCDYJBNGHQV-CQSZACIVSA-N (2r)-2-hydroxy-2-(1h-indol-3-ylmethyl)-4-oxopentanedioic acid Chemical compound C1=CC=C2C(C[C@@](O)(CC(=O)C(=O)O)C(O)=O)=CNC2=C1 SLWQCDYJBNGHQV-CQSZACIVSA-N 0.000 abstract description 4
- 230000006696 biosynthetic metabolic pathway Effects 0.000 abstract description 3
- 229940076788 pyruvate Drugs 0.000 description 173
- 229940088598 enzyme Drugs 0.000 description 70
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical class C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 69
- RSTKLPZEZYGQPY-UHFFFAOYSA-N 3-(indol-3-yl)pyruvic acid Chemical compound C1=CC=C2C(CC(=O)C(=O)O)=CNC2=C1 RSTKLPZEZYGQPY-UHFFFAOYSA-N 0.000 description 44
- 229960004799 tryptophan Drugs 0.000 description 41
- 230000008569 process Effects 0.000 description 33
- 230000002441 reversible effect Effects 0.000 description 20
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- 230000027455 binding Effects 0.000 description 16
- 238000009739 binding Methods 0.000 description 16
- 239000002585 base Substances 0.000 description 15
- 108091026890 Coding region Proteins 0.000 description 14
- 108090000340 Transaminases Proteins 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- QNAYBMKLOCPYGJ-UWTATZPHSA-N L-Alanine Natural products C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 12
- 239000013615 primer Substances 0.000 description 12
- 102000014898 transaminase activity proteins Human genes 0.000 description 12
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 11
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 241000700605 Viruses Species 0.000 description 10
- 230000000707 stereoselective effect Effects 0.000 description 10
- 229930195714 L-glutamate Natural products 0.000 description 9
- KPGXRSRHYNQIFN-UHFFFAOYSA-L 2-oxoglutarate(2-) Chemical compound [O-]C(=O)CCC(=O)C([O-])=O KPGXRSRHYNQIFN-UHFFFAOYSA-L 0.000 description 8
- 229930182827 D-tryptophan Natural products 0.000 description 8
- QIVBCDIJIAJPQS-SECBINFHSA-N D-tryptophane Chemical compound C1=CC=C2C(C[C@@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-SECBINFHSA-N 0.000 description 8
- 229960003767 alanine Drugs 0.000 description 8
- 229910052799 carbon Inorganic materials 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 108010071258 4-hydroxy-2-oxoglutarate aldolase Proteins 0.000 description 7
- 150000008575 L-amino acids Chemical class 0.000 description 7
- 125000002707 L-tryptophyl group Chemical group [H]C1=C([H])C([H])=C2C(C([C@](N([H])[H])(C(=O)[*])[H])([H])[H])=C([H])N([H])C2=C1[H] 0.000 description 7
- 108020004511 Recombinant DNA Proteins 0.000 description 7
- 230000000692 anti-sense effect Effects 0.000 description 7
- 239000013604 expression vector Substances 0.000 description 7
- KHPXUQMNIQBQEV-UHFFFAOYSA-N oxaloacetic acid Chemical compound OC(=O)CC(=O)C(O)=O KHPXUQMNIQBQEV-UHFFFAOYSA-N 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 6
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 6
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 6
- 230000002255 enzymatic effect Effects 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 150000008574 D-amino acids Chemical class 0.000 description 5
- 229930194542 Keto Natural products 0.000 description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000003197 catalytic effect Effects 0.000 description 5
- 235000009508 confectionery Nutrition 0.000 description 5
- IFGCUJZIWBUILZ-UHFFFAOYSA-N sodium 2-[[2-[[hydroxy-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyphosphoryl]amino]-4-methylpentanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound [Na+].C=1NC2=CC=CC=C2C=1CC(C(O)=O)NC(=O)C(CC(C)C)NP(O)(=O)OC1OC(C)C(O)C(O)C1O IFGCUJZIWBUILZ-UHFFFAOYSA-N 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- 239000003981 vehicle Substances 0.000 description 5
- SIKJAQJRHWYJAI-UHFFFAOYSA-N Indole Chemical compound C1=CC=C2NC=CC2=C1 SIKJAQJRHWYJAI-UHFFFAOYSA-N 0.000 description 4
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 4
- 241000209094 Oryza Species 0.000 description 4
- 108091093037 Peptide nucleic acid Proteins 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 239000006227 byproduct Substances 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 125000006302 indol-3-yl methyl group Chemical group [H]N1C([H])=C(C2=C([H])C([H])=C([H])C([H])=C12)C([H])([H])* 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- RQMCNDRMPZBEOD-UHFFFAOYSA-N 2-hydroxy-4-oxobutane-1,2,4-tricarboxylic acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(=O)C(O)=O RQMCNDRMPZBEOD-UHFFFAOYSA-N 0.000 description 3
- 108010003989 D-amino-acid oxidase Proteins 0.000 description 3
- 102000004674 D-amino-acid oxidase Human genes 0.000 description 3
- 229930195713 D-glutamate Natural products 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 102100029727 Enteropeptidase Human genes 0.000 description 3
- 108010013369 Enteropeptidase Proteins 0.000 description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- 241000227653 Lycopersicon Species 0.000 description 3
- 108700011259 MicroRNAs Proteins 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 108091000080 Phosphotransferase Proteins 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 description 3
- 102000006601 Thymidine Kinase Human genes 0.000 description 3
- 108020004440 Thymidine kinase Proteins 0.000 description 3
- 102000004357 Transferases Human genes 0.000 description 3
- 108090000992 Transferases Proteins 0.000 description 3
- 241000209140 Triticum Species 0.000 description 3
- 108010015382 Tryptophan transaminase Proteins 0.000 description 3
- 125000000217 alkyl group Chemical group 0.000 description 3
- 238000007845 assembly PCR Methods 0.000 description 3
- 229910002092 carbon dioxide Inorganic materials 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 102000020233 phosphotransferase Human genes 0.000 description 3
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 230000001568 sexual effect Effects 0.000 description 3
- 125000001424 substituent group Chemical group 0.000 description 3
- 125000000547 substituted alkyl group Chemical group 0.000 description 3
- 125000003107 substituted aryl group Chemical group 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 2
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- 108010051457 Acid Phosphatase Proteins 0.000 description 2
- 102000013563 Acid Phosphatase Human genes 0.000 description 2
- 108010005694 Aspartate 4-decarboxylase Proteins 0.000 description 2
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 2
- LJCWONGJFPCTTL-SSDOTTSWSA-N D-4-hydroxyphenylglycine Chemical compound [O-]C(=O)[C@H]([NH3+])C1=CC=C(O)C=C1 LJCWONGJFPCTTL-SSDOTTSWSA-N 0.000 description 2
- FFEARJCKVFRZRR-SCSAIBSYSA-N D-methionine Chemical compound CSCC[C@@H](N)C(O)=O FFEARJCKVFRZRR-SCSAIBSYSA-N 0.000 description 2
- 229930182818 D-methionine Natural products 0.000 description 2
- 108030001020 D-methionine-pyruvate transaminases Proteins 0.000 description 2
- 108010019475 D-phenylglycine aminotransferase Proteins 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- 108010008292 L-Amino Acid Oxidase Proteins 0.000 description 2
- 102000007070 L-amino-acid oxidase Human genes 0.000 description 2
- 125000000010 L-asparaginyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(=O)N([H])[H] 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 101000969137 Mus musculus Metallothionein-1 Proteins 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 125000003158 alcohol group Chemical group 0.000 description 2
- 125000002947 alkylene group Chemical group 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- 235000005911 diet Nutrition 0.000 description 2
- 229940079919 digestives enzyme preparation Drugs 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 239000010408 film Substances 0.000 description 2
- 230000002414 glycolytic effect Effects 0.000 description 2
- 229910052736 halogen Inorganic materials 0.000 description 2
- 150000002367 halogens Chemical class 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 210000001822 immobilized cell Anatomy 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- PZOUSPYUWWUPPK-UHFFFAOYSA-N indole Natural products CC1=CC=CC2=C1C=CN2 PZOUSPYUWWUPPK-UHFFFAOYSA-N 0.000 description 2
- RKJUIXBNRJVNHR-UHFFFAOYSA-N indolenine Natural products C1=CC=C2CC=NC2=C1 RKJUIXBNRJVNHR-UHFFFAOYSA-N 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 125000000468 ketone group Chemical group 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 210000000723 mammalian artificial chromosome Anatomy 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 239000000693 micelle Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 235000013615 non-nutritive sweetener Nutrition 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000006340 racemization Effects 0.000 description 2
- 238000004064 recycling Methods 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- OVPRPPOVAXRCED-WVZVXSGGSA-N 2-dehydro-3-deoxy-6-phospho-D-gluconic acid Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)CC(=O)C(O)=O OVPRPPOVAXRCED-WVZVXSGGSA-N 0.000 description 1
- 101710142730 2-dehydro-3-deoxy-phosphogluconate aldolase Proteins 0.000 description 1
- SLWQCDYJBNGHQV-UHFFFAOYSA-N 2-hydroxy-2-(1h-indol-3-ylmethyl)-4-oxopentanedioic acid Chemical compound C1=CC=C2C(CC(O)(CC(=O)C(=O)O)C(O)=O)=CNC2=C1 SLWQCDYJBNGHQV-UHFFFAOYSA-N 0.000 description 1
- WXSKVKPSMAHCSG-UHFFFAOYSA-N 4-hydroxy-2-oxoglutaric acid Chemical compound OC(=O)C(O)CC(=O)C(O)=O WXSKVKPSMAHCSG-UHFFFAOYSA-N 0.000 description 1
- RMLYXMMBIZLGAQ-XLLULAGJSA-N 4-hydroxy-4-(indol-3-ylmethyl)glutamic acid Chemical compound C1=CC=C2C(CC(O)(C[C@H](N)C(O)=O)C(O)=O)=CNC2=C1 RMLYXMMBIZLGAQ-XLLULAGJSA-N 0.000 description 1
- VSMPEEWSBJTSLD-UHFFFAOYSA-N 4-hydroxy-4-methyl-2-oxohexanedioic acid Chemical compound OC(=O)CC(O)(C)CC(=O)C(O)=O VSMPEEWSBJTSLD-UHFFFAOYSA-N 0.000 description 1
- LDCYZAJDBXYCGN-VIFPVBQESA-N 5-hydroxy-L-tryptophan Chemical compound C1=C(O)C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 LDCYZAJDBXYCGN-VIFPVBQESA-N 0.000 description 1
- 229940000681 5-hydroxytryptophan Drugs 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- FICLVQOYKYBXFN-SECBINFHSA-N 6-chloro-D-tryptophan zwitterion Chemical compound ClC1=CC=C2C(C[C@@H](N)C(O)=O)=CNC2=C1 FICLVQOYKYBXFN-SECBINFHSA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- 108010041525 Alanine racemase Proteins 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000228257 Aspergillus sp. Species 0.000 description 1
- 241000589151 Azotobacter Species 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 102000004031 Carboxy-Lyases Human genes 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- ZGUNAGUHMKGQNY-SSDOTTSWSA-N D-alpha-phenylglycine Chemical compound OC(=O)[C@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-SSDOTTSWSA-N 0.000 description 1
- CKLJMWTZIZZHCS-UWTATZPHSA-N D-aspartic acid Chemical compound OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 1
- 125000003941 D-tryptophan group Chemical group [H]C1=C([H])C([H])=C2C(C([C@@](N([H])[H])(C(=O)[*])[H])([H])[H])=C([H])N([H])C2=C1[H] 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241001315286 Damon Species 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- CLSDNFWKGFJIBZ-YUMQZZPRSA-N Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O CLSDNFWKGFJIBZ-YUMQZZPRSA-N 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 108700016167 Glutamate racemases Proteins 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 241000842783 Orna Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 102000004879 Racemases and epimerases Human genes 0.000 description 1
- 240000001970 Raphanus sativus var. sativus Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 244000040738 Sesamum orientale Species 0.000 description 1
- 241000592344 Spermatophyta Species 0.000 description 1
- 206010042602 Supraventricular extrasystoles Diseases 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 102000002933 Thioredoxin Human genes 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108010075344 Tryptophan synthase Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 230000006578 abscission Effects 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000012445 acidic reagent Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 150000004716 alpha keto acids Chemical class 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 125000000637 arginyl group Chemical class N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 230000010516 arginylation Effects 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 229940000635 beta-alanine Drugs 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- CREMABGTGYGIQB-UHFFFAOYSA-N carbon carbon Chemical compound C.C CREMABGTGYGIQB-UHFFFAOYSA-N 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 229940124568 digestive agent Drugs 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000006345 epimerization reaction Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 1
- 239000002816 fuel additive Substances 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 230000006251 gamma-carboxylation Effects 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 229960002743 glutamine Drugs 0.000 description 1
- HHLFWLYXYJOTON-UHFFFAOYSA-N glyoxylic acid Chemical compound OC(=O)C=O HHLFWLYXYJOTON-UHFFFAOYSA-N 0.000 description 1
- 150000003278 haem Chemical group 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 239000008123 high-intensity sweetener Substances 0.000 description 1
- 210000000688 human artificial chromosome Anatomy 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000004356 hydroxy functional group Chemical group O* 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 150000002475 indoles Chemical class 0.000 description 1
- 125000001041 indolyl group Chemical group 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- ZAHQPTJLOCWVPG-UHFFFAOYSA-N mitoxantrone dihydrochloride Chemical compound Cl.Cl.O=C1C2=C(O)C=CC(O)=C2C(=O)C2=C1C(NCCNCCO)=CC=C2NCCNCCO ZAHQPTJLOCWVPG-UHFFFAOYSA-N 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- LDCYZAJDBXYCGN-UHFFFAOYSA-N oxitriptan Natural products C1=C(O)C=C2C(CC(N)C(O)=O)=CNC2=C1 LDCYZAJDBXYCGN-UHFFFAOYSA-N 0.000 description 1
- 235000015927 pasta Nutrition 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 229950008882 polysorbate Drugs 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 1
- 239000011589 pyridoxal 5'-phosphate Substances 0.000 description 1
- 235000007682 pyridoxal 5'-phosphate Nutrition 0.000 description 1
- 229940043131 pyroglutamate Drugs 0.000 description 1
- 150000004728 pyruvic acid derivatives Chemical class 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 235000011008 sodium phosphates Nutrition 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 235000020238 sunflower seed Nutrition 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 108010073079 tryptophan racemase Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1022—Transferases (2.) transferring aldehyde or ketonic groups (2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/10—Nitrogen as only ring hetero atom
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/90—Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
- C07K2317/92—Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/03—Oxo-acid-lyases (4.1.3)
- C12Y401/03016—4-Hydroxy-2-oxoglutarate aldolase (4.1.3.16)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/03—Oxo-acid-lyases (4.1.3)
- C12Y401/03017—4-Hydroxy-4-methyl-2-oxoglutarate aldolase (4.1.3.17)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Nutrition Science (AREA)
- Cell Biology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Epidemiology (AREA)
- Oncology (AREA)
- Communicable Diseases (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Coloring Foods And Improving Nutritive Qualities (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
ALDOLASES, áCIDOS NUCLéICOS CODIFICANDO AS MESMAS E MéTODOS PARA PRODUZIR E USAR AS MESMAS. Esta presente invenção refere-se a polipeptídios com atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou KHG aldolase, polinucleotídeos codificando esses poíipeptídios, e métodos para produzir e usar esses polinucleotídeos e polipeptídios. Em algumas modalidades, a presente invenção refere-se a polipeptídios com atividade de aldolase, incluindo atividade de piruvato tal como, sem limitação, atividade de HMG e/ou KHG aldolase, incluindo atividade termoestável e termotolerante, e polinucleotídeos codificando essas enzimas, e à produção e uso desses polinucíeotídeos e polipeptídios. Os polipept(dios de acordo com a invenção podem ser usados em uma variedade de contextos farmacêuticos, agrícolas e industriais. Em algumas modalidades, a invenção fornece polipeptídios e vias biossintéticas que são úteis na produção de ácido R-2-hidróxi 2-(indol-3-ilmetil)-4-cetO glutárico (R-MP) e certos este reoisómeros de monatina, tais como R,R e S,R monatina, e sais dos mesmos, assim como certos estereoisómeros de derivados de monatina, tais como as configurações R,R e S,R, e sais dos mesmos.
Description
Relatório Descritivo da Patente de Invenção para "ALDOLA-SES, ÁCIDOS NUCLÉICOS CODIFICANDO AS MESMAS E MÉTODOSPARA PRODUZIR E USAR AS MESMAS".
REFERÊNCIA CRUZADA AO PEDIDO DE PATENTE RELACIONADO
Este pedido de patente reivindica o benefício do Pedido de Pa-tente Provisório U.S. N0 60/780.515, depositado em 7 de março de 2006.
CAMPO DE ACORDO COM A INVENÇÃO
A presente invenção refere-se à biologia molecular e celular e ábioquímica. Mais especificamente, a presente invenção refere-se a polipep-tídeos que possuem atividade de aldolase, a polinucleotídeos que codificamestes polipeptídeos e a métodos de produção e de utilização destes polinu-cleotídeos e polipeptídeos.
ANTECEDENTE DA INVENÇÃO
A monatina é um adoçante de alta intensidade que possui a fór-mula química:
<formula>formula see original document page 2</formula>
A monatina inclui dois centros quirais que levam a quatro confi-gurações estereoisoméricas potenciais. A configuração R,R (o "estereoisô-mero R,R" ou "R,R monatina"); a configuração S1S (o "estereoisômero S,S"ou "S,S monatina"); a configuração R,S (o "estereoisômero R,S" ou "R,Smonatina"); e a configuração S1R (o "estereoisômero S,R" ou "S,R monati-na"). Como utilizado aqui, a não ser que seja citado de outra maneira, o ter-mo "monatina" é utilizado para se referir a composições que incluem todosos quatro estereoisômeros de monatina, composições que incluem qualquercombinação de estereoisômeros de monatina, (tal como uma composiçãoque inclui apenas os estereoisômeros de monatina R,R e S,S), assim comouma única forma isomérica.
Para as finalidades desta descrição, a estrutura de carbono damon&tina será numerada como ilustrada anteriormente, com o carbono liga-do covalentemente diretamente ao grupo álcool que será identificado como ocarbono da posição 2 e o carbono ligado covalentemente diretamente aogrupo amino que será identificado como o carbono da posição 4. Conse-qüentemente, as referências contidas aqui para R,R monatina, S,S monati-na, R,S monatina e S1R monatina significam: 2R,4R monatina, 2S,4S mona-tina, 2R,4S monatina e 2S,4R monatina, respectivamente, a não ser que se-ja indicado de outra maneira.
Deve ser observado que na literatura, a estrutura de carbono damonatina também foi numerada utilizando uma convenção alternativa, com ocarbono ligado ao grupo álcool sendo o carbono da posição 4 e o carbonoligado ao grupo amino sendo o carbono na posição 2. Conseqüentemente,por exemplo, as referências à 2S,4R monatina nesta descrição seriam asmesmas que as referências à 2R,4S monatina na literatura utilizando a con-venção de numeração alternativa.
Além disso, devido às varias convenções de nomenclatura, amonatina é conhecida através de um número de nomes químicos alternati-vos, incluindo: ácido 2-hidróxi-2-(indol-3-ilmetil)-4-aminoglutárico; ácido 4-amino-2-hidróxi-2-(1 H-indol-3-ilmetil)-pentanedióico; ácido 4-hidróxi-4-(3-indolilmetil) glutâmico; e 3-(1-amino-1,3-dicarbóxi-3-hidróxi-but-4-il)indol.
Certas formas isoméricas de monatina podem ser encontradasno córtex de raízes da planta Schlerochiton ilicifolius localizada na RegiãoTransvaal da África do Sul. Os Pedidos de Patentes U.S. N- 10/422.366 ("oPedido de Patente 366") e 10/979.821 ("o Pedido de Patente 821"), que sãoincorporados aqui como referência, descrevem, inter alia, polipeptídeos, viase microorganismos para produção in vitro e in vivo de monatina.
SUMÁRIO
A presente invenção refere-se a polipeptídeos que possuem ati-vidade de aldolase (posteriormente aqui "aldolases"), incluindo a atividadede piruvato aldolase tal como, sem limitação, atividade de HMG e KHG aldo-lases, polinucleotídeos que codificam os polipeptídeos e os métodos paraprodução e utilização dos polipeptídeos e dos polinucleotídeos. Em algumasmodalidades, a invenção fornece ainda composições (tais como composi-ções farmacêuticas, combustível e composições de aditivos para combustí-vel, alimentos e aditivos para alimentos, bebidas e aditivos para bebidas,produtos alimentícios e aditivos para produtos alimentícios, fármacos e aditi-vos para fármacos, suplementos dietéticos) que compreendem os polipeptí-deos ou os polinucleotídeos de acordo com a invenção. Estas composiçõespodem ser formuladas em uma variedade de formas, tais como comprimi-dos, géis, pílulas, implantes, líquidos, sprays, filmes, micelas, pós, alimentos,péletes alimentícios ou qualquer tipo de forma encapsulada.
Em algumas modalidades, as aldolases e/ou as composiçõesdas mesmas podem ser úteis nos contextos farmacêuticos, industriais e/ouagrícolas.
Em algumas modalidades, as aldolases e/ou as composiçõesdas mesmas podem ser úteis para a formação ou para a clivagem de liga-ções carbono-carbono.
Em algumas modalidades, são fornecidas aldolases que catali-sam as reações de formação de ligações carbono-carbono entre um receptoralfa-ceto ácido e um doador piruvato ou derivado de piruvato (vide o esque-ma de reação abaixo). Em algumas modalidades, o receptor também podeser uma cetona ou um aldeído. Em algumas modalidades, são fornecidasaldolases que possuem atividade de 4-hidróxi-2-oxoglutarato aldolase (taiscomo 2-ceto-4-hidroxiglutarato aldolase, 2-oxo-4-hidroxiglutarato aldolase,KHG-aldolase, EC 4.1.3.16) e catalisam a reação a seguir: 4-hidróxi-2-oxoglutarato <=> piruvato + glioxilato. Em algumas modalidades, são forne-cidas aldolases que possuem atividade de HMG-aldolase (tais como 4-hidróxi-4-metil-2-oxoglutarato aldolase, piruvato aldolase, gama-metil-gama-hidróxi-alfa-cetoglutárico aldolase, 4-hidróxi-4-metil-2-cetoglutarato aldolase,EC 4.1.3.17) e catalisam a reação a seguir: 4-hidróxi-4-metil-2-oxoglütarâto<=> 2 piruvato. Uma HMG aldolase também agirá sobre 4-hidróxi-4-metil-2-oxoadipato e 4-carbóxi-4-hidróxi-2-oxohexadioato.<formula>formula see original document page 5</formula>
R = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída
R2 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída
R3 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída, ácido carboxílico.
Em algumas modalidades, são fornecidas aldolases, tal comouma piruvato aldolase, tal como, sem limitação uma HMG e/ou uma KHGaldolase, que facilitam a produção de um 2-ceto-glutarato substituído em 3,4. Em uma modalidade, a invenção fornece um método de produção de um2-ceto-glutarato substituído em 3, 4 que compreende: (a) o fornecimento deum polipeptídeo que possui uma atividade de aldolase, tal como uma ativi-dade de piruvato aldolase, tal como, sem limitação, uma atividade de HMGaldolase e/ou de KMG de aldolase; (b) o fornecimento de um composto doa-dor e um receptor; e (c) o contato do polipeptídeo da etapa (a) com os com-postos da etapa (b) sob condições em que a aldolase catalisa a síntese deum 2-ceto-glutarato substituído por 3, 4, em que opcionalmente o doador e oreceptor são um piruvato ou um doador de piruvato e um receptor de a-cetoácido, uma cetona e/ou um aldeído.
Em algumas modalidades, são fornecidas aldolases que facili-tam a produção do ácido R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (R-MP), um precursor da monatina. Em algumas modalidades, uma piruvatoaldolase, tal como uma HMG e/ou uma KHG aldolase, pode ser utilizado emassociação com uma D-aminotransferase para produzir um ácido D-glutâmico substituído em 4 ou um derivado do mesmo. Um ácido D-glutâmico substituído em 4 e/ou um derivado do mesmo pode ser utilizadocomo um antibiótico, uma vez que foi descoberto que estes compostos ini-bem a glutamato racemase bacteriana (W00214261A3). Em uma modalida-de, a invenção fornece um método de produção de um ácido D-glutâmicosubstituído em 4 que compreende: (a) o fornecimento de um polipeptídeoque possui uma atividade de aldolase, tal como uma atividade de piruvatoaldolase, tal como, sem limitação, uma atividade de HMG aldolase e/ou deKMG aldolase; (b) o fornecimento de um receptor de α-ceto ácido e um piru-vato ou doador de piruvato; e (c) o contato do polipeptídeo da etapa (a) comos compostos da etapa (b) sob condições em que a aldolase catalisa a sín-tese de um ácido D-glutâmico substituído em 4, em que opcionalmente opolipeptídeo possui atividade de piruvato aldolase, de HMG aldolase e/ou deKHG de aldolase e em que opcionalmente o método compreende ainda ouso de uma D-aminotransferase.
A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes que compreendem uma seqüência de ácido nucléico que pos-sui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%,57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%,83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,96%, 97%, 98%, 99% ou mais ou identidade de seqüência completa (100%)a um ácido nucléico de acordo com a invenção, incluindo as SEQ ID NO:1,SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11,SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ IDNO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39,SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ IDNO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67,SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ IDNO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95,SEQ ID NO:97, SEQ ID NO:99, SEQ ID N0:101, SEQ ID N0:103, SEQ IDNQ:105, SEQ ID NQ:107, SEQ ID NQ:109, SEQ ID NO:111, SEQ ID<table>table see original document page 7</column></row><table>1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100,2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos. Em algumasmodalidades, um ou mais ácidos nucléicos codificam pelo menos um poli-peptídeo que possui uma atividade de aldolase, incluindo atividade de piru-vato tal como, sem limitação, atividade de HMG e/ou de KHG aldolase. Emalgumas modalidades, as identidades de seqüência são determinadas atra-vés da análise com um algoritmo de comparação de seqüências ou atravésde uma inspeção visual.
Em modalidades alternativas, um ou mais ácidos nucléicos codi-ficam pelo menos um polipeptídeo capaz de gerar um anticorpo que se ligaespecificamente a um polipeptídeo da invenção ou estes ácidos nucléicospodem ser utilizados como sondas para a identificação ou para o isolamentode ácidos nucléicos que codificam aldolase ou para inibir a expressão deácidos nucléicos que expressam aldolases.
Os ácidos nucléicos de acordo com a invenção incluem aindaácidos nucléicos isolados, sintéticos ou recombinantes que codificam enzi-mas de acordo com a invenção, tais como enzimas que incluem um ou maispolipeptídeos que possuem uma seqüência que é apresentada nas SEQ IDNO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ IDNO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID N0:20, SEQID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID N0:30,SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ IDN0:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQID N0:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58,SEQ ID N0:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ IDNO:68, SEQ ID N0:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQID NO:78, SEQ ID N0:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86,SEQ ID NO:88, SEQ ID N0:90, SEQ ID NO:92, SEQ ID NO:94, SEQ IDNO:96, SEQ ID NO:98, SEQ ID N0:100, SEQ ID N0:102, SEQ ID N0:104,SEQ ID NO: 106, SEQ ID N0:108, SEQ ID N0:110, SEQ ID NO:112, SEQ IDNO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID N0:120, SEQ IDNO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ IDNO: 130, SEQ ID NO:132 SEQ ID NO: 134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID N0:140 SEQ ID NO:142, SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO:148 SEQ ID N0:150, SEQ ID NO:152, SEQ ID NO: 154, SEQ ID NO: 156 SEQ ID NO:158, SEQ ID N0:160, SEQ ID NO:162, SEQ ID NO: 164 SEQ ID NO: 166, SEQ ID NO:168, SEQ ID N0:170, SEQ ID NO: 172 SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO:178, SEQ ID NO: 180 SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188 SEQ ID N0:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO: 196 SEQ ID NO:198, SEQ ID N0:200, SEQ ID N0:202, SEQ ID N0:204 SEQ ID N0:206, SEQ ID N0:208, SEQ ID N0:210, SEQ ID NO:212 SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID N0.220 SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228 SEQ ID N0:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236 SEQ ID NO:238, SEQ ID N0:240, SEQ ID N0.242, SEQ ID NO:244 SEQ ID NO:246, SEQ ID NO:248, SEQ ID N0:250, SEQ ID NO:252 SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID N0:260 SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268 SEQ ID N0:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276 SEQ ID NO:278, SEQ ID N0:280, SEQ ID NO:282, SEQ ID NO:284 SEQ ID NO:286, SEQ ID NO:288, SEQ ID N0:290, SEQ ID NO:292 SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID N0:300 SEQ ID N0:302, SEQ ID N0:304, SEQ ID N0:306, SEQ ID N0:308 SEQ ID N0:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316 SEQ ID NO:318, SEQ ID N0:320, SEQ ID NO:322, SEQ ID NO:324 SEQ ID NO:326, SEQ ID NO:328, SEQ ID N0:330, SEQ ID NO:332 e SEQ ID NO:334 e subseqüências das mesmas,
variações das mesmas e fragmentos enzimaticamente ativos das mesmas.Em algumas modalidades, o polipeptídeo possui uma atividade de aldolase,incluindo atividade de piruvato tal como, sem limitação, atividade de HMGe/ou de KHG aldolase.
Em algumas modalidades, a invenção fornece ácidos nucléicosque codificam aldolase, tal como que codificam piruvato aldolase, tal comoque codificam HMG e/ou KHG aldolase preferencialmente derivados de cul-turas mistas. Em algumas modalidades, a invenção fornece ácidos nucléicosque codificam enzimas que foram ou que clivam ligações carbono-carbonoisolados de culturas mistas que compreendem os polinucleotídeos de acordocom a invenção, tal como uma seqüência que possui pelo menos aproxima-damente 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de se-qüência completa (100%) a um ácido nucléico de acordo com a invenção, talcomo as SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ IDNO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27,SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ IDNO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55,SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ IDNO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83,SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ IDNO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID N0:101,SEQ ID N0:103, SEQ ID N0:105, SEQ ID N0:107, SEQ ID N0:109, SEQ IDNO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ IDNO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ IDNO: 127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ IDNO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ IDNO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ IDNO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ IDNO: 159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ IDNO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ IDNO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ IDNO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO: 193, SEQ ID NO:195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID N0:201, SEQ ID N0:203, SEQ ID N0:205, SEQ ID N0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID N0:301, SEQ ID N0:303, SEQ ID N0:305, SEQ ID N0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NQ:335, SEQ ID NO:336, SEQ ID NO:337 e SEQ ID NO:338 ao longo de
uma região de pelo menos aproximadamente 50, 75, 100, 150, 200, 250,300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000,1050, 1100, 1150 ou mais.
Em algumas modalidades, a invenção fornece ácidos nucléicosque codificam a enzima aldolase, tal como que codificam a enzima piruvatoaldolase, que codificam a enzima HMG e/ou KHG, incluindo seqüências depolinucleotídeos de acordo com a invenção e os polipeptídeos codificadospelos mesmos, incluindo enzimas de acordo com a invenção, tais como ospolipeptídeos de acordo com a invenção, tais como as SEQ ID NO:2, SEQID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ ID NO:12, SEQID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID N0:20, SEQ ID NO:22,SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NQ:30, SEQ IDΝΟ:32, SEQ ID ΝΟ:34, SEQ ID ΝΟ:36, SEQ ID ΝΟ:38, SEQ ID Ν0:40, SEQID ΝΟ:42, SEQ ID ΝΟ:44, SEQ ID ΝΟ:46, SEQ ID ΝΟ:48, SEQ ID Ν0:50,SEQ ID ΝΟ:52, SEQ ID ΝΟ:54, SEQ ID ΝΟ:56, SEQ ID ΝΟ:58, SEQ IDΝ0:60, SEQ ID ΝΟ:62, SEQ ID ΝΟ:64, SEQ ID ΝΟ:66, SEQ ID ΝΟ:68, SEQID Ν0:70, SEQ ID ΝΟ:72, SEQ ID ΝΟ:74, SEQ ID ΝΟ:76, SEQ ID ΝΟ:78,SEQ ID Ν0:80, SEQ ID ΝΟ:82, SEQ ID ΝΟ:84, SEQ ID ΝΟ:86, SEQ IDΝΟ:88, SEQ ID Ν0:90, SEQ ID ΝΟ:92, SEQ ID ΝΟ:94, SEQ ID ΝΟ:96, SEQID ΝΟ:98, SEQ ID Ν0:100, SEQ ID Ν0:102, SEQ ID Ν0:104, SEQ IDΝ0:106, SEQ ID Ν0:108, SEQ ID Ν0:110, SEQ ID Ν0.Ί12, SEQ IDΝΟ:114, SEQ ID ΝΟ:116, SEQ ID ΝΟ:118, SEQ ID Ν0:120, SEQ IDΝΟ:122, SEQ ID ΝΟ:124, SEQ ID ΝΟ:126, SEQ ID ΝΟ:128, SEQ IDΝ0:130, SEQ ID ΝΟ:132, SEQ ID ΝΟ:134, SEQ ID ΝΟ:136, SEQ IDNO: 138, SEQ ID Ν0:140, SEQ ID ΝΟ:142, SEQ ID ΝΟ:144, SEQ IDNO: 146, SEQ ID ΝΟ:148, SEQ ID Ν0.150, SEQ ID ΝΟ:152, SEQ IDNO: 154, SEQ ID ΝΟ:156, SEQ ID ΝΟ:158, SEQ ID Ν0:160, SEQ ID Ν0:162, SEQ ID Ν0:164, SEQ ID ΝΟ:166, SEQ ID ΝΟ:168, SEQ ID Ν0:170,SEQ ID ΝΟ:172, SEQ ID ΝΟ:174, SEQ ID ΝΟ:176, SEQ ID ΝΟ:178, SEQ ID
Ν0:180, SEQ ID Ν0:182, SEQ ID ΝΟ:184, SEQ ID ΝΟ:186, SEQ ID ΝΟ:188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID Ν0:194, SEQ ID ΝΟ:196, SEQ ID ΝΟ:198, SEQ ID Ν0:200, SEQ ID Ν0:202, SEQ ID Ν0:204, SEQ ID Ν0:206, SEQ ID Ν0:208, SEQ ID Ν0:210, SEQ ID ΝΟ:212, SEQ ID ΝΟ:214, SEQ ID ΝΟ:216, SEQ ID ΝΟ:218, SEQ ID Ν0.220, SEQ ID ΝΟ:222, SEQ ID ΝΟ:224, SEQ ID ΝΟ:226, SEQ ID ΝΟ:228, SEQ ID Ν0:230, SEQ ID ΝΟ:232, SEQ ID ΝΟ:234, SEQ ID ΝΟ:236, SEQ ID ΝΟ:238, SEQ ID Ν0:240, SEQ ID ΝΟ:242, SEQ ID ΝΟ:244, SEQ ID ΝΟ:246, SEQ ID ΝΟ:248, SEQ ID Ν0:250, SEQ ID ΝΟ:252, SEQ ID ΝΟ:254, SEQ ID ΝΟ:256, SEQ ID ΝΟ:258, SEQ ID Ν0:260, SEQ ID ΝΟ:262, SEQ ID ΝΟ:264, SEQ ID ΝΟ:266, SEQ ID ΝΟ:268, SEQ ID Ν0:270, SEQ ID ΝΟ:272, SEQ ID ΝΟ:274, SEQ ID ΝΟ:276, SEQ ID ΝΟ:278, SEQ ID Ν0:280, SEQ ID ΝΟ:282, SEQ ID ΝΟ:284, SEQ ID ΝΟ:286, SEQ ID ΝΟ:288, SEQ 'D Ν0:290, SEQ ID ΝΟ:292, SEQ ID ΝΟ:294, SEQ ID ΝΟ:296. SEQ ID ΝΟ:298, SEQ IDΝ0:300, SEQ ID Ν0.302, SEQ ID Ν0:304, SEQ ID Ν0:306, SEQ IDΝ0:308, SEQ ID Ν0:310, SEQ ID ΝΟ:312, SEQ ID ΝΟ:314, SEQ IDΝΟ:316, SEQ ID ΝΟ:318, SEQ ID Ν0:320, SEQ ID ΝΟ:322, SEQ IDΝΟ:324, SEQ ID ΝΟ:326, SEQ ID ΝΟ:328, SEQ ID Ν0:330, SEQ ID ΝΟ:332ou SEQ ID ΝΟ:334 e fragmentos enzimaticamente ativos dos mesmos, pre-ferencialmente derivados de uma fonte comum, tal como uma fonte ambien-tal. Em algumas modalidades, a invenção fornece ainda ácidos nucléicosque codificam a enzima aldolase, tal como que codificam a enzima piruvatoaldolase, que codificam a enzima HMG e/ou KHG preferencialmente deriva-dos de fontes ambientais, tais como fontes ambientais mistas.
Em algumas modalidades, o algoritmo de comparação de se-qüências é um algoritmo BLAST versão 2.2.2 em que um conjunto de filtrosé ajustado em blastall -p blastp -d "nr pataa" -FFe todas as outras opçõessão ajustadas como padrão.
Outras modalidades da invenção são ácidos nucléicos isolados,sintéticos ou recombinantes que incluem pelo menos 10, 15, 20, 25, 30, 35,40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650,700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300,1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900,1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 ou maisbases consecutivas de uma seqüência de ácido nucléico de acordo com ainvenção, seqüências substancialmente idênticas à mesma e as seqüênciascomplementares à mesma.
Em algumas modalidades, os ácidos nucléicos isolados, sintéti-cos ou recombinantes de acordo com a invenção codificam um polipeptídeoque possui uma atividade de aldolase, incluindo atividade de piruvato tal co-mo, sem limitação, atividade de HMG e/ou de KHG aldolase, que é termoes-tável. O polipeptídeo termoestável de acordo com a invenção pode manteruma atividade de aldolase, tal como uma atividade de piruvato aldolase, talcomo uma atividade de HMG e/ou de KHG aldolase, sob condições quecompreendem uma faixa de temperatura de aproximadamente -100°C atéaproximadamente -80°C, aproximadamente -80°C até aproximadamente -40°C, aproximadamente -40°C até aproximadamente -20°C, aproximada-mente -20°C até aproximadamente 0°C, aproximadamente O0C até aproxi-madamente 37°C, aproximadamente O0C até aproximadamente 5°C, apro-ximadamente 5°C até aproximadamente 15°C, aproximadamente 15°C atéaproximadamente 25°C, aproximadamente 25°C até aproximadamente37°C, aproximadamente 37°C até aproximadamente 45°C, aproximadamen-te 45°C até aproximadamente 55°C, aproximadamente 55°C até aproxima-damente 70°C, aproximadamente 70°C até aproximadamente 75°C, aproxi-madamente 75°C até aproximadamente 85°C, aproximadamente 85°C atéaproximadamente 90°C, aproximadamente 90°C até aproximadamente95°C, aproximadamente 95°C até aproximadamente 100°C, aproximada-mente 100°C até aproximadamente 105°C, aproximadamente 105°C até a-proximadamente 110°C, aproximadamente 11 OcC até aproximadamente120°C ou 95°C, 96°C, 97°C, 98°C, 99°C, 100°C, 101 °C, 102°C, 103°C,104°C, 105°C, 106°C, 107°C, 108°C, 109°C, 110°C, 111°C, 112°C, 113°C,114°C, 115°C ou mais. Os polipeptídeos termoestáveis de acordo com a in-venção podem manter uma atividade de aldolase, tal como uma atividade depiruvato aldolase, tal como uma atividade de HMG e/ou de KHG aldolase,em temperaturas na faixa de aproximadamente -IOO0C até aproximadamen-te -80°C, aproximadamente -80°C até aproximadamente -40°C, aproxima-damente -40°C até aproximadamente -20°C, aproximadamente -20°C atéaproximadamente 0°C, aproximadamente O0C até aproximadamente 5°C,aproximadamente 5°C até aproximadamente 15°C, aproximadamente 15°Caté aproximadamente 25°C, aproximadamente 25°C até aproximadamente37°C, aproximadamente 37°C até aproximadamente 45°C, aproximadamen-te 45°C até aproximadamente 55°C, aproximadamente 55°C até aproxima-damente 70°C, aproximadamente 70°C até aproximadamente 75°C, aproxi-madamente 75°C até aproximadamente 85°C, aproximadamente 85°C atéaproximadamente 90°C, aproximadamente 90°C até aproximadamente95°C, aproximadamente 95°C até aproximadamente 100°C, aproximada-mente 100°C até aproximadamente 105°C, aproximadamente 105°C até a-proximadamente 110oC, aproximadamente 1100C até aproximadamente120°C ou 95°C, 96°C, 97°C, 98°C, 99°C, 100°C, 101 °C, 102°C, 103°C,104°C, 105°C, 106°C, 107°C, 108°C, 109°C, 1100C1 111°C, 112°C, 113°C,114°C, 115°C ou mais. Em algumas modalidades, os polipeptídeos termoes-táveis de acordo com a invenção mantêm uma atividade de aldolase a umatemperatura nas faixas descritas anteriormente, em aproximadamente pH3,0, aproximadamente pH 3,5, aproximadamente pH 4,0, aproximadamentepH 4,5, aproximadamente pH 5,0, aproximadamente pH 5,5, aproximada-mente pH 6,0, aproximadamente pH 6,5, aproximadamente pH 7,0, aproxi-madamente pH 7,5, aproximadamente pH 8,0, aproximadamente pH 8,5,aproximadamente pH 9,0, aproximadamente pH 9,5, aproximadamente pH10,0, aproximadamente pH 10,5, aproximadamente pH 11,0, aproximada-mente pH 11,5, aproximadamente pH 12,0 ou mais.
Em outras modalidades, os ácidos nucléicos isolados, sintéticosou recombinantes codificam um polipeptídeo que possui uma atividade dealdolase, incluindo atividade de piruvato tal como, sem limitação, atividadede HMG e/ou de KHG aldolase, que é termotolerante. Os polipeptídeos ter-motolerantes de acordo com a invenção podem manter uma atividade dealdolase, tal como uma atividade de piruvato aldolase, tal como uma ativida-de de HMG e/ou de KHG aldolase, após a exposição a condições que com-preendem uma temperatura na faixa de aproximadamente -100°C até apro-ximadamente -80°C, aproximadamente -80°C até aproximadamente -40°C,aproximadamente -40°C até aproximadamente -20°C, aproximadamente -20°C até aproximadamente 0°C, aproximadamente OcC até aproximadamen-te 5°C, aproximadamente 5°C até aproximadamente 15°C, aproximadamen-te 15°C até aproximadamente 25°C, aproximadamente 25°C até aproxima-damente 37°C, aproximadamente 37°C até aproximadamente 45°C, aproxi-madamente 450C até aproximadamente 55°C, aproximadamente 55°C atéaproximadamente 70°C, aproximadamente 70°C até aproximadamente75°C, aproximadamente 75°C até aproximadamente 85°C, aproximadamen-te 85°C até aproximadamente 90°C, aproximadamente 90°C até aproxima-damente 95°C, aproximadamente 95°C até aproximadamente 100°C, apro-ximadamente 100°C até aproximadamente 105°C, aproximadamente 105°Caté aproximadamente 110°C, aproximadamente 1100C até aproximadamen-te 120°C ou 95°C, 96°C, 97°C, 98°C, 99°C, 100°C, 1010C1 102°C, 103°C,104°C, 105°C, 106°C, 107°C, 108°C, 109°C, 110°C, 111°C, 112°C, 113°C,114°C, 115°C ou mais. Os polipeptídeos termotolerantes de acordo com ainvenção podem manter uma atividade de aldolase, tal como uma atividadede piruvato aldolase, tal como uma atividade de HMG e/ou de KHG aldolase,após a exposição a uma temperatura na faixa de aproximadamente -100°Caté aproximadamente -80°C, aproximadamente -80°C até aproximadamente-40°C, aproximadamente -40°C até aproximadamente -20°C, aproximada-mente -20°C até aproximadamente 0oC, aproximadamente O0C até aproxi-madamente 5°C, aproximadamente 5°C até aproximadamente 15°C, apro-ximadamente 15°C até aproximadamente 25°C, aproximadamente 25°C atéaproximadamente 37°C, aproximadamente 37°C até aproximadamente45°C, aproximadamente 45°C até aproximadamente 55°C, aproximadamen-te 55°C até aproximadamente 70°C, aproximadamente 70°C até aproxima-damente 75°C, aproximadamente 75°C até aproximadamente 85°C, aproxi-madamente 85°C até aproximadamente 90°C, aproximadamente 90°C atéaproximadamente 95°C, aproximadamente 95°C até aproximadamente100oC, aproximadamente 100°C até aproximadamente 105°C, aproximada-mente 105°C até aproximadamente 110°C, aproximadamente 1100C até a-proximadamente 120°C ou 95°C, 96°C, 97°C, 98°C, 99°C, 100°C, 101 °C,102°C, 103°C, 104°C, 105°C, 106°C, 107°C, 108°C, 109°C, 110oC, 111°C,112°C, 113°C, 114°C, 115°C ou mais. Em algumas modalidades, os polipep-tídeos termotolerantes de acordo com a invenção mantêm uma atividade dealdolase após a exposição a uma temperatura nas faixas descritas anterior-mente, em aproximadamente pH 3,0, aproximadamente pH 3,5, aproxima-damente pH 4,0, aproximadamente pH 4,5, aproximadamente pH 5,0, apro-ximadamente pH 5,5, aproximadamente pH 6,0, aproximadamente pH 6,5,aproximadamente pH 7,0, aproximadamente pH 7,5, aproximadamente pH8,0, aproximadamente pH 8,5, aproximadamente pH 9,0, aproximadamentepH 9,5, aproximadamente pH 10,0, aproximadamente pH 10,5, aproximada-mente pH 11,0, aproximadamente pH 11,5, aproximadamente pH 12,0 oumais.
A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes que compreendem uma seqüência que se hibridiza sob condi-ções rigorosas aos ácidos nucléicos de acordo com a invenção, incluindouma seqüência que é apresentada nas SEQ ID NO:1, SEQ ID NO:3, SEQ IDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ IDNO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33,SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ IDNO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61,SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ IDNO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89,SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ IDNO:99, SEQ ID N0:101, SEQ ID N0:103, SEQ ID N0:105, SEQ ID N0:107,SEQ ID NQ:109, SEQ ID NO:111, SEQ ID NQ:113, SEQ ID NO:115, SEQ ID
NO:117, SEQ ID NO:119, SEQ ID NO: 121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO: 143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO: 149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO: 157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO: 163, SEQ ID NO:165, SEQ ID NO: 167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID N0:201, SEQ ID N0:203, SEQ ID N0:205, SEQ ID N0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ IDNO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ IDNO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ IDNO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ IDNO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ IDNO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ IDNO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ IDNO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ IDNO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ IDN0:301, SEQ ID NQ:303, SEQ ID N0:305, SEQ ID N0:307, SEQ IDN0:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ IDNO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ IDNO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ IDNO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 ou SEQ ID NO:338 ou fragmentos ou subseqüências da mesma. Em algumas modali-dades, os ácidos nucléicos codificam polipeptídeos que possuem uma ativi-dade de aldolase, incluindo atividade de piruvato tal como, sem limitação,atividade de HMG e/ou de KHG aldolase. Os ácidos nucléicos podem terpelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100,150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850,900, 950, 1000, 1050, 1100, 1150, 1200 ou mais resíduos de comprimentoou o comprimento completo do gene ou do produto da transcrição. Em al-gumas modalidades, as condições rigorosas compreendem uma etapa delavagem que compreende uma lavagem em 0,2X SSC a uma temperaturade aproximadamente 65°C durante aproximadamente 15 minutos.
A invenção fornece sondas de ácido nucléico para a identifica-ção ou para o isolamento de ácidos nucléicos que codificam polipeptídeosque possuem uma atividade de aldolase, incluindo atividade de piruvato talcomo, sem limitação, atividade de HMG e/ou de KHG aldolase, em que assondas compreendem aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50,55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450,500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 ou mais, bases con-secutivas de uma seqüência de acordo com a invenção e em que as sondasidentificam o ácido nucléico através de ligação ou de hibridização. As sondaspodem compreender um oligonucleotídeo que compreende entre aproxima-damente 10-100 bases consecutivas de uma seqüência de acordo com ainvenção ou fragmentos ou subseqüências da mesma, por exemplo, 10, 15,20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 ou 100 bases oumais ou qualquer comprimento desejado entre estas.
A invenção fornece sondas de ácido nucléico para a identifica-ção ou para o isolamento de ácidos nucléicos que codificam polipeptídeosque possuem uma atividade de aldolase, incluindo atividade de piruvato, talcomo, sem limitação, atividade de HMG e/ou de KHG aldolase, em que assondas compreendem ácidos nucléicos que compreendem uma seqüênciade pelo menos aproximadamente 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100,150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850,900, 950, 1000 ou mais resíduos de um ácido nucléico de acordo com a in-venção, tal como um polinucleotídeo que possui pelo menos aproximada-mente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%,62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%,75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%,88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de seqüência completa (100%) a um ácido nucléico da inven-ção. Em algumas modalidades, as identidades de seqüência são determina-das através da análise com um algoritmo de comparação de seqüências ouatravés de inspeção visual. Em outras modalidades, as sondas podem com-preender um oligonucleotídeo que compreende entre pelo menos aproxima-damente 10-100 bases consecutivas de uma seqüência de ácido nucléico deacordo com a invenção ou uma subseqüência da mesma, por exemplo, 10,15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 ou 100 basesou mais ou qualquer comprimento desejado entre estas.
A invenção fornece pares de iniciadores para amplificação (talcomo através da PCR) de ácidos nucléicos que codificam polipeptídeos quepossuem atividade de aldolase, incluindo atividade de piruvato tal como, semlimitação, atividade de HMG e/ou de KHG aldolase, em que cada par de ini-ciador é capaz de amplificar um ácido nucléico que compreende uma se-qüência de acordo com a invenção ou fragmentos ou subseqüências damesma (vide a Listagem de Seqüências). Um ou cada membro do par deseqüências de iniciadores de amplificação pode compreender um oligonu-cleotídeo que compreende pelo menos aproximadamente 10 até 50 ou mais,bases consecutivas da seqüência ou aproximadamente 10, 11, 12, 13, 14,15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,35, 36 ou mais bases consecutivas da seqüência. Em algumas modalidades,a invenção fornece pares de iniciadores para amplificação, em que cada parde iniciadores compreende um primeiro membro que possui uma seqüênciaque é apresentada por aproximadamente os primeiros (os a 5') 12, 13, 14,15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,35, 36 ou mais resíduos de um ácido nucléico de acordo com a invenção eum segundo membro que possui uma seqüência que é apresentada por a-proximadamente os primeiros (os a 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 ou mais resíduos dofilamento complementar do primeiro membro.
A invenção fornece ácidos nucléicos que codificam aldolase, taiscomo os que codificam piruvato aldolase, os que codificam HMG e/ou KHGaldolase gerados através da amplificação, tal como a reação em cadeia dapolimerase (PCR), utilizando um par de iniciadores para amplificação de a-cordo com a invenção. Em algumas modalidades, a invenção fornece ácidosnucléicos que codificam aldolase, tais como os que codificam piruvato aldo-lase, que codificam HMG e/ou KHG aldolase gerados através da amplifica-ção, tal como a reação em cadeia da polimerase (PCR), utilizando um par deiniciadores para amplificação de acordo com a invenção. Em algumas moda-lidades, a invenção fornece métodos de produção de uma enzima aldolase,tal como piruvato aldolase, HMG e/ou KHG aldolase através da amplificação,tal como a reação em cadeia da polimerase (PCR), utilizando um par de ini-ciadores para amplificação de acordo com a invenção. Em algumas modali-dades, o par de iniciadores para amplificação amplifica um ácido nucléico deuma biblioteca, tal como uma biblioteca gênica, tal como uma biblioteca am-biental.
A invenção fornece métodos de amplificação de um ácido nu-cléico que codifica um polipeptídeo que possui uma atividade de aldolase,incluindo atividade de piruvato, tal como, sem limitação, atividade de HMGe/ou de KHG aldolase que compreende a amplificação de um ácido nucléicomolde com um par de seqüências iniciadoras para amplificação capaz deamplificar uma seqüência de ácido nucléico de acordo com a invenção oufragmentos ou subseqüências da mesma.
A invenção fornece cassetes de expressão que compreendemum ácido nucléico de acordo com a invenção ou uma subseqüência domesmo. Em algumas modalidades, o cassete de expressão pode compreen-der o ácido nucléico que está ligado de forma operacional a um promotor. Opromotor pode ser um promotor viral, bacteriano, de mamífero, de fungo, delevedura ou vegetal. Em algumas modalidades, o promotor vegetal pode serum promotor de batata, arroz, milho, trigo, tabaco ou cevada. O promotorpode ser um promotor constitutivo. O promotor constitutivo pode compreen-der CaMV35S. Em outras modalidades, o promotor pode ser um promotorque pode ser induzido. Em algumas modalidades, o promotor pode ser umpromotor específico ao tecido ou um promotor regulado pelo desenvolvimen-to. Assim, o promotor pode ser tal como um promotor específico à semente,um específico à folha, um específico à raiz, um específico ao caule ou uminduzido pela abscisão. Em algumas modalidades, o cassete de expressãopode compreender ainda um vetor de expressão vegetal ou de vírus vegetal.
A invenção fornece veículos de clonagem que compreendem umcassete de expressão (tal como um vetor) de acordo com a invenção ou umácido nucléico de acordo com a invenção.Ό veículo de clonagem pode serum vetor viral, um plasmídeo, um fago, um fagemídeo, um cosmídeo, umfosmídeo, um bacteriófago ou um cromossomo artificial. O vetor viral podecompreender um vetor de adenovírus, um vetor retroviral ou um vetor viralassociado a adeno. O veículo de clonagem pode compreender um cromos-somo artificial bacteriano (BAC), um plasmídeo, um vetor derivado do bacte-riófato P1 (PAC), um cromossomo artificial de levedura (YAC) ou um cro-mossomo artificial de mamífero (MAC).
A invenção fornece células transformadas que compreendem osácidos nucléicos de acordo com a invenção ou cassetes de expressão (taiscomo vetores) de acordo com a invenção ou veículos de clonagem de acor-do com a invenção. Em algumas modalidades, a célula transformada podeser uma célula bacteriana, uma célula de mamífero, uma célula de fungo,uma célula de levedura, uma célula de inseto ou uma célula vegetal. Em al-gumas modalidades, a célula vegetal pode ser célula de soja, de colza, desemente oleosa, de tomate, de cana de açúcar, de um cereal, de batata, detrigo, de arroz, de milho, de tabaco ou de cevada.
A invenção fornece animais não-humanos transgênicos quecompreendem um ácido nucléico de acordo com a invenção ou um cassetede expressão (tal como um vetor) de acordo com a invenção. Em algumasmodalidades, o animal é um camundongo, um rato, um porco, uma cabra ouuma ovelha.
A invenção fornece plantas transgênicas que compreendem umácido nucléico de acordo com a invenção ou um cassete de expressão (talcomo um vetor) de acordo com a invenção. A planta transgênica pode seruma planta de cereal, uma planta de milho, uma planta de batata, uma plan-ta de tomate, uma planta de trigo, uma planta de semente oleosa, uma plan-ta de colza, uma planta de soja, uma planta de arroz, uma planta de cevadaou uma planta de tabaco.
A invenção fornece sementes transgênicas que compreendemum ácido nucléico de acordo com a invenção ou um cassete de expressão(tal como um vetor) de acordo com a invenção. A semente transgênica podeser uma semente de planta de cereal, uma semente de milho, um grão detrigo, uma semente oleosa, uma semente de colza, uma semente de soja,uma semente de palma, uma semente de girassol, uma semente de gergilim,uma semente de amendoim ou de uma planta de tabaco.
A invenção fornece oligonucleotídeos anti-sentido que compre-endem seqüências de ácidos nucléicos complementares ou capazes de sehibridizarem sob condições rigorosas aos ácidos nucléicos de acordo com ainvenção. Em algumas modalidades, a invenção fornece métodos de inibiçãoda tradução da mensagem de uma enzima aldolase, tal como piruvato aldo-lase, HMG e/ou KHG aldolase em uma célula que compreendem a adminis-tração à célula ou a expressão na célula de um oligonucleotídeo anti-sentidoque compreende uma seqüência de ácido nucléico complementar ou capazde se hibridizar sob condições rigorosas a um ácido nucléico de acordo coma invenção. Em algumas modalidades, o oligonucleotídeo anti-sentido temaproximadamente 10 até aproximadamente 50, aproximadamente 20 atéaproximadamente 60, aproximadamente 30 até aproximadamente 70, apro-ximadamente 40 até aproximadamente 80 ou aproximadamente 60 até apro-ximadamente 100 bases de comprimento, tais como 10, 15, 20, 25, 30, 35,40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou mais bases de compri-mento.
A invenção fornece métodos de inibição da tradução da mensa-gem de uma enzima aldolase, tal como uma enzima piruvato aldolase, talcomo HMG e/ou KHG aldolase em uma célula que compreendem a adminis-tração à célula ou a expressão na célula de um oligonucleotídeo anti-sentidoque compreende uma seqüência de ácido nucléico complementar ou capazde se hibridizar sob condições rigorosas a um ácido nucléico de acordo coma invenção.
A invenção fornece moléculas de RNA inibidoras de filamentoduplo (RNAi ou interferência com RNA) (incluindo RNA interferente pequenoou siRNAs, para a inibição da transcrição e microRNAs ou miRNAs, para ainibição da tradução) que compreendem uma subseqüência de uma seqüên-cia de acordo com a invenção. Em algumas modalidades, o siRNA tem a-proximadamente 21 até aproximadamente 24 resíduos ou aproximadamentepelo menos 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31,32, 33, 34, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou mais nu-cleotídeos em dúplex de comprimento. Em algumas modalidades, a inven-ção fornece métodos de inibição da expressão de uma enzima aldolase, talcomo uma enzima piruvato aldolase, tal como HMG e/ou KHG aldolase emuma célula que compreendem a administração à célula ou a expressão nacélula de um RNA inibidor de filamento duplo (siRNA ou miRNA), em que oRNA compreende uma subseqüência de uma seqüência de acordo com ainvenção.
A presente invenção refere-se a polipeptídeos isolados, sintéti-cos ou recombinantes que compreendem uma seqüência de aminoácidosque possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%,56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%,69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%,95%, 96%, 97%, 98%, 99% ou mais ou identidade de seqüência completa(100%) a um polipeptídeo ou um peptídeo de acordo com a invenção ao lon-go de uma região de pelo menos aproximadamente 10, 15, 20, 25, 30, 35,40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225,250, 275, 300, 325, 350 ou mais resíduos ou ao longo do comprimento com-pleto do polipeptídeo. Em algumas modalidades, as identidades de seqüên-cia são determinadas através da análise com um algoritmo de comparaçãode seqüências ou através de uma inspeção visual. As seqüências de poli-peptídeos ou de polipeptídeos de acordo com a invenção incluem as SEQ IDNO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ IDNO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID N0:20, SEQID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID N0:30,SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ IDN0:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQID N0:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58,SEQ ID N0:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ IDNO:68, SEQ ID N0:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQID NO:78, SEQ ID N0:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86,SEQ ID NO:88, SEQ ID N0:90, SEQ ID NO:92, SEQ ID NO:94, SEQ IDNO:96, SEQ ID NO:98, SEQ ID N0:100, SEQ ID N0:102, SEQ ID N0:104,SEQ ID NO: 106, SEQ ID N0:108, SEQ ID N0:110, SEQ ID NO:112, SEQ IDNO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID N0:120, SEQ IDNO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ IDN0:130, SEQ ID NO:132, SEQ ID NO: 134, SEQ ID NO:136, SEQ ID NO: 138, SEQ ID NO: 140, SEQ ID NO:142, SEQ ID NO: 144, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO: 150, SEQ ID NO:152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO:158, SEQ ID N0:160, SEQ ID NO:162, SEQ ID NO: 164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID NO: 170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID N0:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO: 186, SEQ ID NO:188, SEQ ID N0:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID N0:200, SEQ ID N0:202, SEQ ID N0:204, SEQ ID N0:206, SEQ ID N0:208, SEQ ID N0:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID N0:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID N0:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID N0:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID N0:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID N0:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID N0:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID N0:280, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID N0:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID N0:300, SEQ ID N0:302, SEQ ID N0:304, SEQ ID N0:306, SEQ ID N0:308, SEQ ID N0:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID N0:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID N0:330, SEQ D NO:332 e SEQ ID NO:334 e subseqüências das mesmas,
variações das mesmas e fragmentos enzimaticamente ativos das mesmas.
Os polipeptídeos de acordo com a invenção incluem ainda fragmentos depelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 80, 85,90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600 ou mais resí-duos de comprimento ou ao longo do comprimento completo de uma enzi-ma. As seqüências de polipeptídeos ou de peptídeos de acordo com a in-venção incluem a seqüência codificada por um ácido nucléico de acordocom a invenção. As seqüências de polipeptídeos ou de peptídeos de acordocom a invenção incluem polipeptídeos ou peptídeos ligados especificamentepor um anticorpo de acordo com a invenção (tais como epítopos) ou polipep-tídeos ou peptídeos que podem gerar um anticorpo de acordo com a inven-ção (tais como um agente imunogênico).
Em algumas modalidades, um polipeptídeo de acordo com a in-venção possui pelo menos uma atividade de enzima aldolase, tal como ativi-dade de enzima piruvato aldolase, tal como de HMG e/ou KHG aldolase. Emoutras modalidades, um polinucleotídeo de acordo com a invenção codificaum polipeptídeo que possui pelo menos uma atividade de enzima aldolase,tal como atividade de enzima piruvato aldolase, tal como de HMG e/ou KHGaldolase.
Uma outra modalidade dA presente invenção refere-se a poli-peptídeos ou peptídeos isolados, sintéticos ou recombinantes que compre-endem pelo menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80,85, 90, 95, 100, 125, 150 ou mais bases consecutivas de seqüências de po-lipeptídeos ou de peptídeos de acordo com a invenção, seqüências substan-cialmente idênticas às mesmas e as seqüências complementares às mes-mas. O peptídeo pode ser, tal como um fragmento imunogênico, um motivo(tal como um sítio de ligação), uma seqüência sinal, uma pré-pró-seqüênciaou um sítio ativo.
A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes que compreendem uma seqüência que codifica um polipeptí-deo que possui uma atividade de enzima aldolase, tal como de piruvato aldo-lase, tal como de HMG e/ou de KHG aldolase e uma seqüência sinal, emque o ácido nucléico compreende uma seqüência de acordo com a inven-ção. Uma "sinal de seqüência" significa um sinal de secreção ou outro domí-nio que facilita a secreção da aldolase de acordo com a invenção da célulahospedeira. O sinal de seqüência pode ser derivado de uma outra enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ouuma enzima sem ser aldolase, tal como sem ser piruvato aldolase, tal comosem ser HMG e/ou sem ser KHG aldolase (um heterólogo). Em algumasmodalidades, a invenção fornece ácidos nucléicos isolados, sintéticos ourecombinantes que compreendem uma seqüência que codifica um polipeptí-deo que possui uma atividade de enzima aldolase, tal como de piruvato aldo-lase, tal como de HMG e/ou de KHG aldolase, em que a seqüência não con-tém uma seqüência sinal e o ácido nucléico compreende uma seqüência deacordo com a invenção. Em algumas modalidades, A presente invenção re-fere-se a polipeptídeos isolados, sintéticos ou recombinantes que compre-endem polipeptídeos de acordo com a invenção que não possuem toda ouparte de uma seqüência sinal. Em algumas modalidades, o polipeptídeo iso-lado, sintético ou recombinante pode compreender o polipeptídeo de acordocom a invenção que compreende uma seqüência sinal heteróloga, tal comouma seqüência sinal de enzima aldolase heteróloga, tal como piruvato aldo-lase, tal como HMG e/ou KHG aldolase ou uma seqüência sinal de enzimasem ser aldolase, tal como sem ser piruvato aldolase, tal como sem serHMG e/ou sem ser KHG aldolase.
Em algumas modalidades, a invenção fornece proteínas quimé-ricas que compreendem um primeiro domínio que compreende uma seqüên-cia sinal de acordo com a invenção e pelo menos um segundo domínio. Aproteína pode ser uma proteína de fusão. O segundo domínio pode compre-ender uma enzima. A proteína pode não ser uma enzima.
A presente invenção refere-se a polipeptídeos quiméricos quecompreendem pelo menos um primeiro domínio que compreende um peptí-deo sinal (SP), uma pré-pró-seqüência e/ou um domínio catalítico (CD) deacordo com a invenção e pelo menos um segundo domínio que compreendeum polipeptídeo ou um peptídeo heterólogo, em que o polipeptídeo ou opeptídeo heterólogo não está naturalmente associado com o peptídeo sinal(SP), a pré-pró-seqüência e/ou o domínio catalítico (CD). Em algumas moda-lidades, o polipeptídeo ou o peptídeo heterólogo não é uma enzima aldolase,tal como piruvato aldolase, HMG e/ou KHG aldolase. O polipeptídeo ou opeptídeo heterólogo pode ser um terminal amino até, um terminal carbóxi atéou em ambas as extremidades do peptídeo sinal (SP), da pré-pró-seqüênciae/ou do domínio cataiítico (CD).
A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes que codificam um polipeptídeo quimérico, em que o polipeptí-deo quimérico compreende pelo menos um primeiro domínio que compreen-de um peptídeo sinal (SP), um pré-pró-domínio e/ou um domínio catalítico(CD) de acordo com a invenção e pelo menos um segundo domínio quecompreende um polipeptídeo ou um peptídeo heterólogo, em que o polipep-tídeo ou o peptídeo heterólogo não está naturalmente associado com o pep-tídeo sinal (SP), o pré-pró-domínio e/ou o domínio catalítico (CD).
A invenção fornece seqüências de sinais isoladas, sintéticas ourecombinantes (tais como peptídeos de sinais) que consistem ou que com-preendem uma seqüência que é apresentada nos resíduos 1 até 14, 1 até15, 1 até 16, 1 até 17, 1 até 18, 1 até 19, 1 até 20, 1 até 21, 1 até 22, 1 até23, 1 até 24, 1 até 25, 1 até 26, 1 até 27, 1 até 28, 1 até 28, 1 até 30, 1 até31, 1 até 32, 1 até 33, 1 até 34, 1 até 35, 1 até 36, 1 até 37, 1 até 38, 1 até40, 1 até 41, 1 até 42, 1 até 43, 1 até 44, 1 até 45, 1 até 46 ou 1 até 47, deum polipeptídeo de acordo com a invenção, tal como as SEQ ID NO:2, SEQID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ ID NO:12, SEQID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID N0:20, SEQ ID NO:22,SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID N0:30, SEQ IDNO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID N0:40, SEQID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID N0:50,SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ IDN0:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQID N0:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78,SEQ ID N0:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ IDNO:88, SEQ ID N0:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQID NO:98, SEQ ID N0:100, SEQ ID N0:102, SEQ ID N0:104, SEQ IDNO: 106, SEQ ID N0:108, SEQ ID N0:110, SEQ ID NO:112, SEQ IDNO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID N0:120, SEQ IDNO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ IDNQ:130, SEQ ID NQ:132, SEQ ID NO:134, SEQ ID NO:136, SEQ IDΝΟ:138, SEQ ID Ν0:140, SEQ ID ΝΟ:142, SEQ ID ΝΟ:144, SEQ IDΝΟ:146, SEQ ID ΝΟ:148, SEQ ID Ν0:150, SEQ ID ΝΟ:152, SEQ IDΝΟ:154, SEQ ID ΝΟ:156, SEQ ID ΝΟ:158, SEQ ID Ν0:160, SEQ ID NO:162, SEQ ID Ν0:164, SEQ ID ΝΟ:166, SEQ ID ΝΟ:168, SEQ ID Ν0:170,SEQ ID ΝΟ:172, SEQ ID ΝΟ:174, SEQ ID ΝΟ:176, SEQ ID ΝΟ:178, SEQ ID
N0:180, SEQ ID NO: 182, SEQ ID NO:184, SEQ ID NO:186, SEQ IDNO:188, SEQ ID N0:190, SEQ ID NO:192, SEQ ID NO:194, SEQ IDNO:196, SEQ ID NO: 198, SEQ ID N0:200, SEQ ID N0:202, SEQ IDN0:204, SEQ ID N0:206, SEQ ID N0:208, SEQ ID N0:210, SEQ IDNO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ IDN0:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ IDNO:228, SEQ ID N0:230, SEQ ID NO:232, SEQ ID NO:234, SEQ IDNO:236, SEQ ID NO:238, SEQ ID N0:240, SEQ ID NO:242, SEQ IDNO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID N0:250, SEQ IDNO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ IDN0:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ IDNO:268, SEQ ID N0:270, SEQ ID NO:272, SEQ ID NO:274, SEQ IDNO:276, SEQ ID NO:278, SEQ ID N0:280, SEQ ID NO:282, SEQ IDNO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID N0:290, SEQ IDNO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ IDN0:300, SEQ ID N0:302, SEQ ID N0:304, SEQ ID N0:306, SEQ IDN0:308, SEQ ID N0:310, SEQ ID NO:312, SEQ ID NO:314, SEQ IDNO:316, SEQ ID NO:318, SEQ ID N0:320, SEQ ID NO:322, SEQ IDNO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID N0:330, SEQ ID NO:332 ou SEQ ID ΝΟ:334. Em algumas modalidades, a invenção fornece seqüên-cias de sinais que compreendem os primeiros 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41,42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61,62, 63, 64, 65, 66, 67, 68, 69, 70 ou mais resíduos amino terminais de um polipeptídeo de acordo com a invenção.
Em algumas modalidades, a atividade da enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase, compreende umaatividade específica de aproximadamente 10 até aproximadamente 12.000unidades por miligrama de proteína. Em outras modalidades, a atividade daenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase, compreende uma atividade específica de aproximadamente 1000 atéaproximadamente 10.000 unidades por miligrama de proteína ou de aproxi-madamente 5000 até aproximadamente 7500 unidades por miligrama deproteína. Alternativamente, a atividade da enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase, compreende uma atividade es-pecífica na faixa de aproximadamente 10 até aproximadamente 7500 unida-des por miligrama de proteína ou de aproximadamente 5000 até aproxima-damente 12.000 unidades por miligrama de proteína. Em algumas modalida-des, a atividade da enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase, compreende uma atividade específica na faixa deaproximadamente 10 até aproximadamente 5000 unidades por miligrama deproteína ou de aproximadamente 7500 até aproximadamente 10.000 unida-des por miligrama de proteína. Em outras modalidades, a atividade da enzi-ma aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolasecompreende uma atividade específica na faixa de aproximadamente 10 atéaproximadamente 2500 unidades por miligrama de proteína. Alternativamen-te, a atividade da enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase compreende uma atividade específica na faixa de apro-ximadamente 10 até aproximadamente 1000 unidades por miligrama de pro-teína. Um exemplo de método para medir a atividade de aldolases diferen-tes, tais como piruvato aldolases, tais como enzimas HMG e/ou KHG aldola-ses, utiliza um substrato geral, 4-carbóxi-4-hidróxi-2-oxoadipato ("CHA"). Umensaio típico compreende 50 mM de fosfato de sódio pH 7,5, 1 mM de Mg-Cl2, 1 mM de CHA, 10 pg/mL de D-Iactato desidrogenase ("LDH") de Lacto-bacillus Ieichmanii (Sigma-AIdrich, St. Louis, MO), 0,5 mM de NADH. O en-saio é iniciado através da adição da enzima que será medida. A liberação depiruvato, acoplada com a formação de NAD+ é monitorada continuamenteem um espectrofotômetro em 340 nm. Uma unidade de atividade enzimáticaé definida como a quantidade que libera piruvato suficiente para diminuir aabsorbância em 340 nm em 1 DO por minuto.
Em outras modalidades, a tolerância térmica da enzima aldola-se, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, compre-ende a retenção de pelo menos metade da atividade específica da enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase apósser aquecida a uma temperatura elevada, tal como uma temperatura de a-proximadamente 0°C até aproximadamente 20°C, aproximadamente 20°Caté aproximadamente 37°C, aproximadamente 37°C até aproximadamente50°C, aproximadamente 50°C até aproximadamente 70°C, aproximadamen-te 70°C até aproximadamente 75°C, aproximadamente 75°C até aproxima-damente 80°C, aproximadamente 80°C até aproximadamente 85°C, aproxi-madamente 85°C até aproximadamente 90°C, aproximadamente 90°C atéaproximadamente 95°C, aproximadamente 95°C até aproximadamente100°C, aproximadamente 100°C até aproximadamente 1100C ou maior. Al-ternativamente, a tolerância térmica pode compreender a reteção da ativida-de específica de aproximadamente 10 até aproximadamente 12.000 unida-des por miligrama de proteína ou de aproximadamente 5000 até aproxima-damente 10.000 unidades por miligrama de proteína, após ser aquecida auma temperatura elevada como descrito anteriormente. Em outras modali-dades, a tolerância térmica pode compreender a retenção da atividade es-pecífica na faixa de aproximadamente 10 até aproximadamente 5000 unida-des por miligrama de proteína após ser aquecida a uma temperatura eleva-da, como descrito anteriormente.
A presente invenção refere-se a polipeptídeos isolados, sintéti-cos ou recombinantes de acordo com a invenção, em que os polipeptídeoscompreendem pelo menos um sítio de glicosilação. Em algumas modalida-des, a glicosilação pode ser uma glicosilação ligada a N. Em algumas moda-lidades, o polipeptídeo pode ser glicosilado após ser expresso em um hos-pedeiro de P. pastoris ou de S. pombe ou em uma célula hospedeira demamífero.
Em algumas modalidades, o polipeptídeo pode manter a ativida-de de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHGaldolase sob condições que compreendem aproximadamente pH 6,5, pH 6,pH 5,5, pH 5, pH 4,5, pH 4,0, pH 3,5, pH 3,0 ou pH menor (mais ácido). Emoutras modalidades, o polipeptídeo pode reter uma atividade de enzima al-dolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase sob5 condições que compreendem aproximadamente pH 7, pH 7,5 pH 8,0, pH~ 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11,0, pH 11,5, pH 12, pH 12,5 Ou pHmaior (mais básico). Em algumas modalidades, o polipeptídeo pode manteruma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase após a exposição a condições que compreendem apro-ximadamente pH 6,5, pH 6, pH 5,5, pH 5, pH 4,5, pH 4,0, pH 3,5, pH 3,0 oupH menor (mais ácido). Em outras modalidades, o polipeptídeo pode manteruma atividade de enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase após a exposição a condições que compreendem apro-ximadamente pH 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH11,0, pH 11,5, pH 12, pH 12,5 ou pH maior (mais básico).
Em algumas modalidades, a enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção pos-sui atividade sob condições alcalinas, tais como as condições alcalinas dosintestinos, tais como do intestino delgado. Em algumas modalidades, o poli-peptídeo pode manter atividade após a exposição ao pH ácido do estômago.
A invenção fornece preparações de proteína que compreendemum polipeptídeo (incluindo peptídeos) de acordo com a invenção, em que apreparação de proteína compreende um líquido, um sólido ou um gel. Emalgumas modalidades, a invenção fornece heterodímeros que compreendemum polipeptídeo de acordo com a invenção e um segundo membro, tal comoum polipeptídeo ou outro (segundo) domínio. O segundo membro do hetero-dímero pode ser uma enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase diferente ou uma outra proteína. Em algumas mo-dalidades, o segundo domínio pode ser um polipeptídeo e o heterodímeropode ser uma proteína de fusão. Em algumas modalidades, o segundo do-mínio pode ser um epítopo ou uma marcação. Em algumas modalidades, ainvenção fornece homomultímeros, incluindo, mas não limitados a homodí-meros, homotrímeros, homotetrâmeros, homopentâmeros e homohexâme-ros, que compreendem um polipeptídeo de acordo com a invenção.
A presente invenção refere-se a polipeptídeos imobilizados (in-cluindo peptídeos) que possuem atividade de enzima aldolase, tal como pi-ruvato aldolase, tal como HMG e/ou KHG aldolase, em que o polipeptídeoimobilizado compreende um polipeptídeo de acordo com a invenção, um po-lipeptídeo codificado por um ácido nucléico de acordo com a invenção ou umpolipeptídeo que compreende um polipeptídeo de acordo com a invenção eum segundo domínio. Em algumas modalidades, o polipeptídeo pode serimobilizado em uma célula, um metal, uma resina, um polímero, uma cerâ-mica, um vidro, um microeletrodo, uma partícula de grafite, uma conta, umgel, uma placa, um arranjo ou um tubo capilar.
A invenção fornece ainda arranjos que compreendem um ácidonucléico imobilizado de acordo com a invenção, incluindo, tal como sondasde acordo com a invenção. Em algumas modalidades, a invenção forneceainda arranjos que compreendem um anticorpo de acordo com a invenção.
A invenção fornece anticorpos isolados, sintéticos ou recombi-nantes que se ligam especificamente a um polipeptídeo de acordo com ainvenção ou a um polipeptídeo codificado por um ácido nucléico de acordocom a invenção. Estes anticorpos de acordo com a invenção podem ser umanticorpo monoclonal ou um policlonal. Em algumas modalidades, a inven-ção fornece hibridomas que compreendem um anticorpo de acordo com ainvenção, tal como um anticorpo que se liga especificamente a um polipeptí-deo de acordo com a invenção ou a um polipeptídeo codificado por um ácidonucléico de acordo com a invenção. Em algumas modalidades, a invençãofornece ácidos nucléicos que codificam estes anticorpos.
A invenção fornece métodos de isolamento ou de identificaçãode polipeptídeos que possuem atividade de enzima aldolase, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase que compreendem as eta-pas de: (a) fornecimento de um anticorpo de acordo com a invenção; (b) for-necimento de uma amostra que compreende polipeptídeos; e (c) contato daamostra da etapa (b) com o anticorpo da etapa (a) sob condições em que oanticorpo pode se ligar especificamente ao polipeptídeo, isolando ou identifi-cando assim um polipeptídeo que possui uma atividade de enzima aldolase,tal como piruvato aldolase, tal como HMG e/ou KHG aldolase.
A invenção fornece métodos de produção de um anticorpo anti-5 enzima aldolase, tal como antipiruvato aldolase, tal como anti-HMG e/ou an-ti-KHG aldolase que compreendem a administração a um animal não huma-no de um ácido nucléico de acordo com a invenção ou um polipeptídeo deacordo com a invenção ou subseqüências do mesmo em uma quantidadesuficiente para gerar uma resposta imunológica humoral, produzindo assimum anticorpo antienzima aldolase, tal como antipiruvato aldolase, tal comoanti-HMG e/ou anti-KHG aldolase. Em algumas modalidades, a invençãofornece métodos de produção de uma resposta imunológica antialdolase, talcomo antipiruvato aldolase, tal como anti-HMG e/ou anti-KHG aldolase (celu-lar ou humoral) que compreendem a administração a um animal não humanode um ácido nucléico de acordo com a invenção ou de um polipeptídeo deacordo com a invenção ou subseqüências do mesmo em uma quantidadesuficiente para gerar uma resposta imunológica (celular ou humoral).
A invenção fornece métodos de produção de um polipeptídeorecombinante que compreendem as etapas de: (a) fornecimento de um ácidonucléico de acordo com a invenção ligado de forma operacional a um promo-tor; e (b) expressão do ácido nucléico da etapa (a) sob condições que permi-tem a expressão do polipeptídeo, produzindo assim um polipeptídeo recom-binante. Em algumas modalidades, o método pode compreender ainda atransformação de uma célula hospedeira com o ácido nucléico da etapa (a)seguida pela expressão do ácido nucléico da etapa (a), produzindo assimum polipeptídeo recombinante em uma célula transformada.
A invenção fornece métodos para a identificação de um polipep-tídeo que possui atividade de enzima aldolase, tal como piruvato aldolase,tal como HMG e/ou KHG aldolase que compreendem as etapas a seguir: (a)fornecimento de um polipeptídeo de acordo com a invenção; ou de um poli-peptídeo codificado por um ácido nucléico de acordo com a invenção; (b)fornecimento do substrato da enzima aldolase, tal como da piruvato aldola-se, tal como da HMG e/ou da KHG aldolase; e (c) contato do polipeptídeo oude um fragmento ou de uma variação do mesmo da etapa (a) com o substra-to da etapa (b) e detecção de um decréscimo na quantidade de substrato oude um aumento na quantidade de um produto de reação, em que um de-créscimo na quantidade do substrato ou um aumento na quantidade do pro-duto de reação detecta um polipeptídeo que possui uma atividade de enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Emalgumas modalidades, o substrato é um carboidrato, um composto que com-preende carboidrato e/ou um imitador de carboidrato.
A invenção fornece métodos para a identificação do substrato daenzima aldolase, tal como da piruvato aldolase, tal como da HMG e/ou daKHG aldolase que compreendem as etapas a seguir: (a) fornecimento de umpolipeptídeo de acordo com a invenção; ou de um polipeptídeo codificadopor um ácido nucléico de acordo com a invenção; (b) fornecimento de umsubstrato de teste; e (c) contato do polipeptídeo da etapa (a) com o substratode teste da etapa (b) e detecção de um decréscimo na quantidade de subs-trato ou de um aumento na quantidade de produto de reação, em que umdecréscimo na quantidade do substrato ou um aumento na quantidade deum produto de reação identifica o substrato de teste como um substrato daenzima aldolase, tal como da piruvato aldolase, da HMG e/ou da KHG aldolase.
A invenção fornece métodos de determinação do fato de umcomposto de teste se ligar especificamente a um polipeptídeo que compre-endem as etapas a seguir: (a) expressão de um ácido nucléico ou de umvetor que compreende o ácido nucléico sob condições permissivas para atradução do ácido nucléico em um polipeptídeo, em que o ácido nucléicocompreende um ácido nucléico de acordo com a invenção ou fornecimentode um polipeptídeo de acordo com a invenção; (b) fornecimento de um com-posto de teste; (c) contato do polipeptídeo com o composto de teste; e (d)determinação do fato do composto de teste da etapa (b) se ligar especifica-mente ao polipeptídeo.
A invenção fornece métodos para a identificação de um modula-dor de uma atividade de enzima aldolase, tal como piruvato aldolase, tal co-mo HMG e/ou KHG aldolase que compreendem as etapas a seguir: (a) for-necimento de um polipeptídeo de acordo com a invenção ou de um polipep-tídeo codificado por um ácido nucléico de acordo com a invenção; (b) forne-cimento de um composto de teste; (c) contato do polipeptídeo da etapa (a)5 com o composto de teste da etapa (b) e medida de uma atividade de umaenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase, em que uma alteração em na atividade da enzima aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldolase medida na presença docomposto de teste comparada com a atividade na ausência do composto deteste fornece uma determinação de que o composto de teste modula a ativi-dade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase. Em algumas modalidades, a atividade da enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase pode ser medidaatravés do fornecimento de um substrato da enzima aldolase, tal como dapiruvato aldolase, da HMG e/ou da KHG aldolase e da detecção de um de-créscimo na quantidade do substrato ou de um aumento na quantidade deum produto de reação ou de um aumento na quantidade do substrato ou deum decréscimo na quantidade de um produto de reação. Um decréscimo naquantidade do substrato ou um aumento na quantidade do produto de rea-ção com o composto de teste quando comparada com a quantidade desubstrato ou de produto de reação sem o composto de teste identifica ocomposto de teste como um ativador da atividade de enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase. Um aumento naquantidade do substrato ou um decréscimo na quantidade do produto dereação com o composto de teste quando comparada com a quantidade desubstrato ou de produto de reação sem o composto de teste identifica ocomposto de teste como um inibidor da atividade de enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase.
A invenção fornece sistemas de computador que compreendemum processador e um dispositivo de armazenamento de dados em que o ditodispositivo de armazenamento de dados tem armazenada no mesmo umaseqüência de polipeptídeo ou uma seqüência de ácido nucléico de acordocom a invenção (tal como um polipeptídeo ou um peptídeo codificado por umácido nucléico de acordo com a invenção). Em algumas modalidades, o sis-tema de computador pode compreender ainda um algoritmo de comparaçãode seqüências e um dispositivo de armazenamento de dados que possuipelo menos uma seqüência de referência armazenada no mesmo. Em outrasmodalidades, o algoritmo de comparação de seqüências compreende umprograma de computador que indica polimorfismos. Em algumas modalida-des, o sistema de computador pode compreender ainda um identificador queidentifica uma ou mais características na dita seqüência. Em algumas moda-lidades, a invenção fornece meios que podem ser lidos pelo computador quepossuem armazenados nos mesmos uma seqüência de polipeptídeo ou umaseqüência de ácido nucléico de acordo com a invenção. Em algumas moda-lidades, a invenção fornece métodos para a identificação de uma caracterís-tica em uma seqüência que compreendem as etapas de: (a) leitura da se-qüência utilizando um programa de computador que identifica uma ou maiscaracterísticas em uma seqüência, em que a seqüência compreende umaseqüência de polipeptídeo ou uma seqüência de ácido nucléico de acordocom a invenção; e (b) identificação de uma ou mais características na se-20 qüência com o programa de computador. Em algumas modalidades, a in-venção fornece métodos para a comparação de uma primeira seqüênciacom uma segunda seqüência que compreendem as etapas de: (a) leitura daprimeira seqüência e da segunda seqüência através do uso de um programade computador que compara as seqüências, em que a primeira seqüênciacompreende uma seqüência de polipeptídeo ou uma seqüência de ácidonucléico de acordo com a invenção; e (b) determinação de diferenças entrea primeira seqüência e a segunda seqüência com o programa de computa-dor. A etapa de determinação das diferenças entre a primeira seqüência e asegunda seqüência pode compreender ainda a etapa de identificação depolimorfismos. Em algumas modalidades, o método pode compreender ain-da um identificador que identifica uma ou mais características em uma se-qüência. Em outras modalidades, o método pode compreender a leitura daprimeira seqüência utilizando um programa de computador e a identificaçãode uma ou mais características na seqüência.
A invenção fornece métodos para o isolamento ou para a recu-peração de um ácido nucléico que codifica um polipeptídeo que possui umaatividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase partindo de uma amostra, tal como uma amostra ambiental,que compreendem as etapas de: (a) fornecimento de um par de seqüênciasiniciadoras da amplificação para a amplificação de um ácido nucléico quecodifica um polipeptídeo que possui uma atividade de enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase, em que o par deiniciadores é capaz de amplificar um ácido nucléico de acordo com a inven-ção; (b) isolamento de um ácido nucléico da amostra ou tratamento da a-mostra de forma que o ácido nucléico na amostra seja acessível para a hi-bridização com o par de iniciadores para amplificação; e, (c) combinação doácido nucléico da etapa (b) com o par de iniciadores para amplificação daetapa (a) e amplificação do ácido nucléico da amostra, isolando ou recupe-rando assim um ácido nucléico que codifica um polipeptídeo que possui umaatividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase de uma amostra. Um ou cada membro do par de seqüênciasiniciadoras da amplificação pode compreender um oligonucleotídeo quecompreende um par de seqüências iniciadoras da amplificação de acordocom a invenção, tal como possuindo pelo menos aproximadamente 10 até50 bases consecutivas de uma seqüência de acordo com a invenção. Emuma modalidade da invenção, a amostra é uma amostra ambiental.
A invenção fornece métodos para o isolamento ou para a recu-peração de um ácido nucléico que codifica um polipeptídeo que possui umaatividade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase de uma amostra, tal como uma amostra ambiental, que com-preendem as etapas de: (a) fornecimento de uma sonda de polinucleotídeoque compreende um ácido nucléico de acordo com a invenção ou uma sub-seqüência do mesmo; (b) isolamento de um ácido nucléico da amostra outratamento da amostra de forma que o ácido nucléico na amostra seja aces-sível para a hibridização com uma sonda de polinucleotídeo da etapa (a); (c)combinação do ácido nucléico isolado ou da amostra tratada da etapa (b)com a sonda de polinucleotídeo da etapa (a); e (d) isolamento de um ácidonucléico que se hibridiza especificamente com a sonda de polinucleotídeo daetapa (a), isolando ou recuperando assim um ácido nucléico que codifica umpolipeptídeo que possui uma atividade de enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase de uma amostra. A amostra po-de compreender uma amostra de água, uma amostra líquida, uma amostrade solo, uma amostra de ar ou uma amostra biológica. Em algumas modali-dades, a amostra biológica pode ser derivada de uma célula bacteriana, umacélula de protozoário, uma célula de inseto, uma célula de levedura, umacélula vegetal, uma célula de fungo ou uma célula de mamífero. Em umamodalidade da invenção, a amostra é uma amostra ambiental.
A invenção fornece métodos de produção de uma variação deum ácido nucléico que codifica um polipeptídeo que possui uma atividade deenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase que compreendem as etapas de: (a) fornecimento de um ácido nucléicomolde que compreende um ácido nucléico de acordo com a invenção; e (b)modificação, deleção ou adição de um ou mais nucleotídeos na seqüênciamolde ou uma combinação das memsas, para gerar uma variação do ácidonucléico molde. Em algumas modalidades, o método pode compreender a-inda a expressão da variação de ácido nucléico para gerar uma variação dopolipeptídeo da enzima aldolase, tal como da piruvato aldolase, tal como daHMG e/ou da KHG aldolase. As modificações, adições ou deleções podemser intoduzidas através de um método que compreende PCR propensa aerros, embaralhamento, mutagênese direcionada por oligonucleotídeo, PCRde montagem, mutagênese por PCR sexual, mutagênese in vivo, mutagêne-se com cassete, mutagênese de conjunto recursivo, mutagênese de conjun-to exponencial, mutagênese específica ao sítio, remontagem gênica, Muta-gênese de Saturação de Sítio Gênico (GSSM), remontagem de ligação sinté-tica (SLR), Mutagênese de Saturação Cromossômica (CSM) ou uma combi-nação dos mesmos. Em outras modalidades, as modificações, adições oudeleções são introduzidas através de um método que compreende recombi-nação, recombinação de seqüência recursiva, mutagênese de DNA modifi-cado com fosfotioato, mutagênese com molde contendo uracila, mutagênesede dúplex com espaços, mutagênese de reparo de combinações erradaspontuais, mutagênese com cepa hospedeira deficiente em relação ao repa-ro, mutagênese química, mutagênese radiogênica, mutagênese de deleção,mutagênese de seleção de restrição, mutagênese de purificação de restri-ção, síntese de gene artificial, mutagênese de conjunto, criação de multíme-ros de ácidos nucléicos quiméricos e uma combinação dos mesmos.
Em algumas modalidades, o método pode ser iterativamenterepetido até que uma enzima aldolase, tal como piruvato aldolase, HMG e/ouKHG aldolase que possui uma atividade alterada ou diferente ou uma estabi-lidade alterada ou diferente daquela de um polipeptídeo codificado pelo áci-do nucléico molde seja produzida. Em algumas modalidades, a variação dopolipeptídeo da enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase é termotolerante e mantém alguma atividade após serexposta a uma temperatura elevada. Em outras modalidades, a variação dopolipeptídeo da enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase tem maior glicosilação quando comparada com a enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase codi-ficada por um ácido nucléico molde. Alternativamente, a variação do polipep-tídeo da aldolase, tal como da piruvato aldolase, tal como da HMG e/ou daKHG aldolase possui uma atividade de enzima aldolase, tal como de piruva-to aldolase, tal como de HMG e/ou de KHG aldolase sob uma temperaturaalta, em que a enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase codificada pelo ácido nucléico molde não é ativa sob atemperatura alta. Em algumas modalidades, o método pode ser repetido deforma iterativa até que uma seqüência codificadora da enzima aldolase, talcomo piruvato aldolase, HMG e/ou KHG aldolase que possui um uso de có-dons alterado daquele do ácido nucléico molde seja produzida. Em outrasmodalidades, o método pode ser repetido de forma iterativa até um gene daenzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase quepossui nível maior ou menor de expressão de mensagem ou de estabilidadeque o do ácido nucléico molde seja produzido.
A invenção fornece métodos para a modificação de códons emum ácido nucléico que codifica um polipeptídeo que possui uma atividade deenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase para aumentar sua expressão em uma célula hospedeira, o métodocompreendendo as etapas a seguir: (a) fornecimento de um ácido nucléicode acordo com a invenção que codifica um polipeptídeo que possui uma ati-vidade de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase; e, (b) identificação de um códon não preferido ou menos pre-ferido no ácido nucléico da etapa (a) e substituição do mesmo por um códonpreferido ou utilizado de forma neutra que codifica o mesmo aminoácido queo do códon substituído, em que um códon preferido é um códon super-representado nas seqüências codificadoras em genes na célula hospedeirae um códon não preferido ou menos preferido é um códon sub-representadonas seqüências codificadoras em genes na célula hospedeira, modificandoassim o ácido nucléico para aumentar sua expressão em uma célula hospe-deira.
A invenção fornece métodos para a modificação de códons emum ácido nucléico que codifica um polipeptídeo que possui uma atividade deenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase; o método compreendendo as etapas a seguir: (a) fornecimento de umácido nucléico de acordo com a invenção; e, (b) identificação de um códonno ácido nucléico da etapa (a) e substituição do mesmo por um códon dife-rente que codifica o mesmo aminoácido que o códon substituído, modifican-do assim os códons em um ácido nucléico que codifica uma enzima aldola-se, tal como piruvato aldolase, HMG e/ou KHG aldolase.
A invenção fornece métodos para a modificação de códons emum ácido nucléico que codifica um polipeptídeo que possui uma atividade deenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase para aumentar sua expressão em uma célula hospedeira, o métodocompreendendo as etapas a seguir: (a) fornecimento de um ácido nucléicode acordo com a invenção que codifica um polipeptídeo da enzima aldolase,tal como piruvato aldolase, HMG e/ou KHG aldolase; e, (b) identificação deum códon não preferido ou menos preferido no ácido nucléico da etapa (a) esubstituição do mesmo por um códon preferido ou utilizado de forma neutraque codifica o mesmo aminoácido que o códon substituído, em que um có-don preferido é um códon super-representado nas seqüências codificadorasem genes na célula hospedeira e um códon não preferido ou menos preferi-do é um códon sub-representado nas seqüências codificadoras em genes nacélula hospedeira, modificando assim o ácido nucléico para aumentar a suaexpressão em uma célula hospedeira.
A invenção fornece métodos para a modificação de um códonem um ácido nucléico que codifica um polipeptídeo que possui uma ativida-de de enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHGaldolase para diminuir a sua expressão em uma célula hospedeira, o métodocompreendendo as etapas a seguir: (a) fornecimento de um ácido nucléicode acordo com a invenção; e (b) identificação de pelo menos um códon pre-ferido no ácido nucléico da etapa (a) e substituição do mesmo por um códonnão preferido ou menos preferido que codifica o mesmo aminoácido que ocódon substituído, em que um códon preferido é um códon super-representado nas seqüências codificadoras em genes em uma célula hos-pedeira e um códon não preferido ou menos preferido é um códon sub-representado em seqüências codificadoras em genes na célula hospedeira,modificando assim o ácido nucléico para diminuir a sua expressão em umacélula hospedeira. Em algumas modalidades, a célula hospedeira pode seruma célula bacteriana, uma célula de fungo, uma célula de inseto, uma célu-la de levedura, uma célula vegetal ou uma célula de mamífero.
A invenção fornece métodos para a produção de uma bibliotecade ácidos nucléicos que codifica um grande número de sítios ativos ou ossítios de ligação ao substrato da enzima aldolase modificados, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase, em que os sítios ativos ouos sítios de ligação ao substrato modificados são derivados de um primeiroácido nucléico que compreende uma seqüência que codifica um primeirosítio ativo ou um primeiro sítio de ligação ao substrato o método compreen-dendo as etapas a seguir: (a) fornecimento de um primeiro ácido nucléicoque codifica um primeiro sítio ativo ou um primeiro sítio de ligação ao subs-trato, em que a primeira seqüência de ácido nucléico compreende uma se-qüência que se hibridiza sob condições rigorosas a um ácido nucléico deacordo com a invenção e o ácido nucléico codifica um sítio ativo da enzimaaldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase ou um sítio deligação ao substrato da enzima aldolase, tal como da piruvato aldolase, daHMG e/ou da KHG aldolase; (b) fornecimento de um conjunto de oligonucle-otídeos mutagênicos que codificam variações de aminoácidos que ocorremnaturalmente em um grande número de códons direcionados no primeiroácido nucléico; e, (c) utilização do conjunto de oligonucleotídeos mutagêni-cos para gerar um conjunto de variações de ácidos nucléicos que codificamo sítio ativo ou que codificam o sítio de ligação ao substrato que codificamuma faixa de variações de aminoácidos em cada códon de aminoácido quesofreu mutação, produzindo assim uma biblioteca de ácidos nucléicos quecodifica um grande número de sítios ativos ou de sítios ativos de ligação aosubstrato da enzima aldolase modificados, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase. Em algumas modalidades, o método com-preende a mutagênese de um primeiro ácido nucléico da etapa (a) atravésde um método que compreende um sistema de evolução direcionado otimi-zado, Mutagênese de Saturação do Sítio Gênico (GSSM), remontagem deligação sintética (SLR), PCR propensa a erros, embaralhamento, mutagêne-se direcionada por oligonucleotídeo, PCR de montagem, mutagênese porPCR sexual, mutagênese in vivo, mutagênese com cassete, mutagênese deconjunto recursivo, mutagênese de conjunto exponencial, mutagênese espe-cífica ao sítio, remontagem gênica e uma combinação dos mesmos. Em ou-tras modalidades, o método compreende a mutagênese do primeiro ácidonucléico da etapa (a) ou variações através de um método que compreenderecombinação, recombinação de seqüência recursiva, mutagênese de DNAmodificado com fosfotioato, mutagênese com molde contendo uracila, muta-gênese de dúplex com espaços, mutagênese de reparo de combinaçõeserradas pontuais, mutagênese com cepa hospedeira deficiente em relaçãoao reparo, mutagênese química, mutagênese radiogênica, mutagênese dedeleção, mutagênese de seleção de restrição, mutagênese de purificação derestrição, síntese de gene artificial, mutagênese de conjunto, criação de mul-tímeros de ácidos nucléicos quiméricos e uma combinação dos mesmos.
A invenção fornece métodos para a produção de uma moléculapequena que compreendem as etapas a seguir: (a) fornecimento de umgrande número de enzimas biossintéticas capazes de sintetizar ou de modi-ficar uma molécula pequena, em que uma das enzimas compreende umaenzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase codifi-cada por um ácido nucléico de acordo com a invenção; (b) fornecimento deum substrato para pelo menos uma das enzimas da etapa (a); e (c) e reaçãodo substrato da etapa (b) com as enzimas sob condições que facilitam umgrande número de reações biocatalíticas para gerar uma molécula pequenaatravés de uma série de reações biocatalíticas. Em algumas modalidades, ainvenção fornece métodos para a modificação de uma molécula pequenaque compreendem as etapas a seguir: (a) fornecimento de uma enzima aldo-lase, tal como piruvato aldolase, HMG e/ou KHG aldolase, em que a enzimacompreende um polipeptídeo de acordo com a invenção ou um polipeptídeocodificado por um ácido nucléico de acordo com a invenção ou uma subse-qüência do mesmo; (b) fornecimento de uma molécula pequena; e (c) reaçãoda enzima da etapa (a) com a molécula pequena da etapa (b) sob condiçõesque facilitam uma reação enzimática catalisada por uma enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase, modificando as-sim uma molécula pequena através da reação enzimática de uma aldolase,tal como piruvato aldolase, HMG e/ou KHG aldolase. Em algumas modalida-des, o método pode compreender um grande número de substratos de mo-léculas pequenas para a enzima da etapa (a), gerando assim uma bibliotecade moléculas pequenas modificadas através de pelo menos uma reação en-zimática catalisada por uma enzima aldolase, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase. Em algumas modalidades, o método podecompreender um grande número de enzimas adicionais sob condições quefacilitam um grande número de reações biocatalíticas através das enzimaspara formar uma biblioteca de moléculas pequenas modificadas produzidasatravés do grande número de reações enzimáticas. Em outras modalidades,o método pode compreender ainda a etapa de teste da biblioteca para de-terminar se uma molécula pequena modificada particular que exibe ümá ati-vidade desejada está presente dentro da biblioteca. A etapa de teste da bi-blioteca pode compreender ainda as etapas de eliminação de forma sistemá-tica de todas menos uma das reações biocatalíticas utilizadas para a produ-ção de uma parte do grande número das moléculas pequenas modificadasdentro da biblioteca através do teste da parte da molécula pequena modifi-cada em relação à presença ou à ausência da molécula pequena modificadaparticular com uma atividade desejada e de identificação de pelo menos umareação biocatalítica específica que produz a molécula pequena modificadaparticular de atividade desejada.
A invenção fornece métodos para a determinação de um frag-mento funcional de uma enzima aldolase, tal como piruvato aldolase, HMGe/ou KHG aldolase que compreendem as etapas de: (a) fornecimento deuma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase,em que a enzima compreende um polipeptídeo de acordo com a invençãoou um polipeptídeo codificado por um ácido nucléico de acordo com a inven-ção ou uma subseqüência do mesmo; e (b) deleção de um grande númerode resíduos de aminoácidos da seqüência da etapa (a) e teste da subse-qüência remanescente em relação a uma atividade de enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase, determinandoassim um fragmento funcional de uma enzima aldolase, tal como piruvatoaldolase, HMG e/ou KHG aldolase. Em algumas modalidades, a atividade daenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase é medida através do fornecimento de um substrato da enzima aldolase,tal como da piruvato aldolase, da HMG e/ou da KHG aldolase e da detecçãode um decréscimo na quantidade do substrato ou de um aumento na quanti-dade de um produto de reação.
A invenção fornece métodos para engenharia de células inteirasde novos fenótipos ou modificados através do uso da análise de fluxo meta-bólico em tempo real, o método compreendendo as etapas a seguir: (a) pro-dução de uma célula modificada através da modificação da composição ge-nética de uma célula, em que a composição genética é modificada atravésda adição à célula de um ácido nucléico de acordo com a invenção; (b) culti-vo da célula modificada para gerar um grande número de células modifica-das; (c) medida de pelo menos um parâmetro metabólico da célula atravésdo monitoramento da cultura de células da etapa (b) em tempo real; e, (d)análise dos dados da etapa (c) para determinar se o parâmetro medido dife-re de uma medida comparável em uma célula não modificada sob condiçõessimilares, identificando assim um fenótipo engenheirado na célula utilizandoa análise de fluxo metabólico em tempo real. Em algumas modalidades, acomposição genética da célula pode ser modificada através de um métodoque compreende a deleção de uma seqüência ou a modificação de uma se-qüência na célula ou o nocaute da expressão de um gene. Em algumas mo-dalidades, o método pode compreender ainda a seleção de uma célula quecompreendem um fenótipo recém-engenheirado. Em outras modalidades, ométodo pode compreender o cultivo da célula selecionada, gerando assimuma nova cepa de células que compreende um fenótipo recém-engenheirado.
A invenção fornece métodos de aumento da tolerância térmicaou da estabilidade térmica de um polipeptídeo de enzima aldolase, tal comopiruvato aldolase, HMG e/ou KHG aldolase, o método compreendendo a gli-cosilação de um polipeptídeo de enzima aldolase, tal como piruvato aldola-se, HMG e/ou KHG aldolase, em que o polipeptídeo compreende pelo me-nos trinta aminoácidos contíguos de um polipeptídeo de acordo com a in-venção; ou um polipeptídeo codificado por uma seqüência de ácido nucléicode acordo com a invenção, aumentando assim a tolerância térmica ou a es-tabilidade térmica do polipeptídeo de aldolase, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase. Em algumas modalidades, a atividade espe-cífica da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase pode ser termoestável ou termotolerante a uma temoeraturana faixa de mais que aproximadamente 37°C até aproximadamente 95°C.
A invenção fornece métodos para a superexpressão de uma umpolipeptídeo recombinante de aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase em uma célula que compreendem a expressão deum vetor que compreende um ácido nucléico que compreende um ácido nu-cléico de acordo com a invenção ou uma seqüência de ácido nucléico deacordo com a invenção, em que as identidades de seqüências são determi-nadas através da análise com um algoritmo de comparação de seqüênciasou através de inspeção visual, em que a superexpressão é realizada atravésdo uso de um promotor de alta atividade, um vetor dicistrônico ou através daamplificação gênica do vetor.
A invenção fornece métodos de produção de uma planta trans-gênica que compreendem as etapas a seguir: (a) introdução de uma se-qüência de ácido nucléico heteróloga na célula, em que a seqüência de áci-do nucléico heteróloga compreende uma seqüência de ácido nucléico deacordo com a invenção, produzindo assim uma célula vegetal transformada;e (b) produção de uma planta transgênica partindo da célula transformada.Em algumas modalidades, a etapa (a) pode compreender ainda a introduçãoda seqüência de ácido nucléico heteróloga através de eletroporação ou mi-croinjeção de protoplastos de células vegetais. Em outras modalidades, aetapa (a) pode compreender ainda a introdução da seqüência de ácido nu-cléico heteróloga diretamente no tecido vegetal através do bombardeio departículas de DNA. Alternativamente, a etapa (a) pode compreender ainda aintrodução da seqüência de ácido nucléico heteróloga no DNA da célula ve-getal utilizando um hospedeiro de Agrobacterium tumefaciens. Em algumasmodalidades, a célula vegetal pode ser uma célula de cana de açúcar, debeterraba, de soja, de tomate, de batata, de milho, de arroz, de trigo, de ta-baco ou de cevada.
A invenção fornece métodos de expressão de uma seqüência deácido nucléico heteróloga em uma célula vegetal que compreendem as eta-pas a seguir: (a) transformação da célula vegetal com uma seqüência deácido nucléico heteróloga ligada de forma operacional a um promotor, emque a seqüência de ácido nucléico heteróloga compreende um ácido nucléi-co de acordo com a invenção; (b) cultivo da planta sob condições em que aseqüência de ácido nucléico heteróloga é expressa na célula vegetal. Emalgumas modalidades, a invenção fornece métodos de expressão de umaseqüência de ácido nucléico heteróloga em uma célula vegetal que compre-endem as etapas a seguir: (a) transformação da célula vegetal com uma se-qüência de ácido nucléico heteróloga ligada de forma operacional a um pro-motor, em que a seqüência de ácido nucléico heteróloga compreende umaseqüência de acordo com a invenção; (b) cultivo da planta sob condições emque a seqüência de ácido nucléico heteróloga é expressa na célula vegetal.
A invenção fornece produtos alimentícios ou alimentos que com-preendem um polipeptídeo de acordo com a invenção ou um polipeptídeocodificado por um ácido nucléico de acordo com a invenção. Em algumasmodalidades, a invenção fornece alimentos, produtos alimentícios, líquidostais como bebidas (tais como sucos de frutas ou cerveja), pães ou massasou produtos de panificação ou precursores de bebidas (tal como mosto), quecompreendem um polipeptídeo de acordo com a invenção. Em outras moda-lidades, a invenção fornece alimentos, produtos alimentícios ou aditivos parabebidas que compreendem um polipeptídeo de acordo com a invenção. Emalgumas modalidades, a invenção fornece alimentos ou suplementos nutri-cionais, tais como para um ser humano ou um animal, que compreendemum polipeptídeo de acordo com a invenção, tal como um polipeptídeo codifi-cado pelo ácido nucléico de acordo com a invenção.
Em algumas modalidades, o polipeptídeo no alimento ou no su-plemento nutricional pode estar glicosilado. Em algumas modalidades, a in-venção fornece matrizes de fornecimento de enzimas comestíveis que com-preendem um polipeptídeo de acordo com a invenção, tal como um polipep-tídeo codificado pelo ácido nucléico de acordo com a invenção. Em algumasmodalidades, a matriz de fornecimento compreende um pélete. Em algumasmodalidades, o polipeptídeo pode estar glicosilado. Em algumas modalida-des, a atividade da enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase é termotolerante. Em outras modalidades, a ativi-dade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase é termoestável.
A invenção fornece alimentos, produtos alimentícios ou suple-mentos nutricionais que compreendem um polipeptídeo de acordo com ainvenção. Em algumas modalidades, a invenção fornece métodos para autilização de uma enzima aldolase, tal como piruvato aldolase, HMG e/ouKHG aldolase como um suplemento nutricional na dieta de um animal, o mé-todo compreendendo: a preparação de um suplemento nutricional contendouma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolaseque compreende pelo menos trinta aminoácidos contíguos de um polipeptí-deo de acordo com a invenção; e a administração do suplemento nutricionala um animal. O animal pode ser um ser humano, um ruminante ou um ani-mal monogástrico. A enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase pode ser preparada através da expressão de umpolinucleotídeo que codifica a enzima aldolase, tal como piruvato aldolase,tal como HMG e/ou KHG aldolase em um organismo selecionado do grupoque consiste em uma bactéria, uma levedura, uma planta, um inseto, umfungo e um animal. O organismo pode ser selecionado do grupo que consis-te em S. pombe, S. cerevisiae, Pichia pastoris, E. coli, Streptomyces sp.,Bacillus sp. Pseudomonas sp., Aspergillus sp. e Lactobacillus SP.
A invenção fornece matrizes de fornecimento de enzimas co-mestíveis que compreendem uma enzima aldolase recombinante termoestá-vel, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, tal comoum polipeptídeo de acordo com a invenção. Em algumas modalidades, ainvenção fornece métodos para o fornecimento de um suplemento de enzi-ma aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase a um ani-mal, o método compreendendo: a preparação de uma matriz de fornecimen-to de enzimas comestível na forma de péletes que compreende um veículocomestível granulado e uma enzima aldolase recombinante termoestável, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase, em que as péle-tes dispersam rapidamente a enzima aldolase, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase contida nas mesmas dentro de meios aquo-sos e a administração da matriz de fornecimento de enzimas comestível aoanimal. A enzima aldolase recombinante, tal como piruvato aldolase, tal co-mo HMG e/ou KHG aldolase pode compreender um polipeptídeo de acordocom a invenção. A enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase pode ser glicosilada para fornecer estabilidade tér-mica nas condições de peletização. A matriz de fornecimento pode ser for-mada através da peletização de uma mistura que compreende um embriãode grão e uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHGaldolase. As condições de peletização podem incluir a aplicação de vapor.As condições de peletização podem compreender a aplicação de uma tem-peratura em excesso de aproximadamente 80°C durante aproximadamente5 minutos e a enzima mantém uma atividade específica de pelo menos 350até aproximadamente 900 unidades por miligrama de enzima.
Em algumas modalidades, a invenção fornece composições far-macêuticas que compreendem uma enzima aldolase, tal como piruvato aldo-lase, HMG e/ou KHG aldolase de acordo com a invenção ou um polipeptídeocodificado por um ácido nucléico de acordo com a invenção. Em algumasmodalidades, a composição farmacêutica atua como um agente àuxiliadordigestivo.
Em algumas modalidades, um composto contendo ligação car-bono-carbono é colocado em contato com um polipeptídeo de acordo com ainvenção que possui atividade de enzima aldolase, tal como atividade deenzima piruvato aldolase, tal como de HMG e/ou de KHG aldolase, em umpH que varia de aproximadamente pH 3,0 até aproximadamente 9,0, apro-ximadamente 3,0 até aproximadamente 10,0, aproximadamente 3,0 até a-proximadamente 11,0 ou mais. Em outras modalidades, um composto quecontém ligação carbono-carbono é colocado em contato com a enzima aldo-lase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, a umatemperatura de pelo menos aproximadamente 55°C, 60°C, 65°C, 70°C,75°C, 80°C, 85°C, 90°C ou mais.
Esta descrição fornece, entre outras coisas, polipeptídeos quesão úteis na facilitação de uma reação em processos para a produção demonatina, derivados de monatina e sais dos mesmos, por exemplo, na pro-dução de ácido R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (também referi-do como monatina R-alfa ceto ácida, precursor de R-monatina, R-MP e aforma alfa ceto de monatina), um precursor para certos estereoisômeros demonatina, tais como R,R e S,R monatina. A descrição fornece ainda méto-dos de produção de monatina, derivados de monatina e sais e produtos decondensação interna dos mesmos utilizando um ou mais polipeptídeos dainvenção. Os métodos de síntese de R-MP, estereoisômeros de monatinae/ou estereoisômeros de derivados de monatina incluem o uso de um oumais polipeptídeos com atividade de aldolase de qualquer uma das SEQ IDNO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ IDNO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID N0:20, SEQID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID N0:30,SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ IDN0:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQID N0:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58,SEQ ID N0:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ IDNO:68, SEQ ID N0:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQID NO:78, SEQ ID N0:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86,SEQ ID NO:88, SEQ ID N0:90, SEQ ID NO:92, SEQ ID NO:94, SEQ IDNO:96, SEQ ID NO:98, SEQ ID N0:100, SEQ ID N0:102, SEQ ID N0:104,SEQ ID N0:106, SEQ ID N0:108, SEQ ID N0:110, SEQ ID NO:112, SEQ IDNO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID N0:120, SEQ IDNO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ IDN0:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ IDNO:138, SEQ ID N0:140, SEQ ID NO:142, SEQ ID NO:144, SEQ IDNO: 146, SEQ ID NO:148, SEQ ID N0:150, SEQ ID NO:152, SEQ IDNO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID N0:160, SEQ IDNO:162, SEQ ID NO:164, SEQ ID NO:166, SEQ ID NO:168, SEQ IDNO: 170, SEQ ID NO:172, SEQ ID NO:174, SEQ ID NO:176, SEQ IDNO:178, SEQ ID N0:180, SEQ ID NO:182, SEQ ID NO:184, SEQ IDNO:186, SEQ ID NO:188, SEQ ID N0:190, SEQ ID NO:192, SEQ IDNO: 194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID N0:200, SEQ IDN0:202, SEQ ID N0:204, SEQ ID N0:206, SEQ ID N0:208, SEQ IDN0:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ IDNO:218, SEQ ID N0:220, SEQ ID NO:222, SEQ ID NO:224, SEQ IDNO:226, SEQ ID NO:228, SEQ ID N0:230, SEQ ID NO:232, SEQ IDNO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID N0:240, SEQ IDNO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ IDN0:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ IDNO:258, SEQ ID N0:260, SEQ ID NO:262, SEQ ID NO:264, SEQ IDNO:266, SEQ ID NO:268, SEQ ID N0:270, SEQ ID NO:272, SEQ IDNO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID N0:280, SEQ IDNO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ IDN0:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ IDNO:298, SEQ ID N0:300, SEQ ID N0:302, SEQ ID N0:304, SEQ IDN0:306, SEQ ID N0:308, SEQ ID N0:310, SEQ ID NO:312, SEQ IDNO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID N0:320, SEQ IDNO:322, SEQ ID NQ:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID
Ν0:330, SEQ ID ΝΟ:332 e SEQ ID ΝΟ:334 e fragmentos ativos enzimatica-mente dos mesmos.
Ainda, os métodos de síntese de R-MP, estereoisômeros demonatina e/ou estereoisômeros de derivados de monatina podem incluir ouso de um polipeptídeo com atividade de aldolase codificado por uma se-qüência de ácido nucléico que possui pelo menos aproximadamente 50%,51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%,77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%,90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identi-dade de seqüência completa (100%) ao ácido nucléico de acordo com a in-venção, incluindo as SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ IDNO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ IDNO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35,SEQ ID ΝΟ:37, SEQ ID ΝΟ:39, SEQ ID Ν0:41, SEQ ID ΝΟ:43, SEQ IDΝΟ:45, SEQ ID ΝΟ:47, SEQ ID ΝΟ:49, SEQ ID Ν0:51, SEQ ID ΝΟ:53, SEQID ΝΟ:55, SEQ ID ΝΟ:57, SEQ ID ΝΟ:59, SEQ ID Ν0:61, SEQ ID ΝΟ:63,SEQ ID ΝΟ:65, SEQ ID ΝΟ:67, SEQ ID ΝΟ:69, SEQ ID Ν0:71, SEQ IDΝΟ:73, SEQ ID ΝΟ:75, SEQ ID ΝΟ:77, SEQ ID ΝΟ:79, SEQ ID Ν0:81, SEQID ΝΟ:83, SEQ ID ΝΟ:85, SEQ ID ΝΟ:87, SEQ ID ΝΟ:89, SEQ ID Ν0:91,SEQ ID ΝΟ:93, SEQ ID ΝΟ:95, SEQ ID ΝΟ:97, SEQ ID ΝΟ:99, SEQ ID
Ν0:101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID Ν0:107, SEQ ID Ν0:109, SEQ ID ΝΟ:111, SEQ ID ΝΟ:113, SEQ ID ΝΟ:115, SEQ ID ΝΟ:117, SEQ ID ΝΟ:119, SEQ ID ΝΟ:121, SEQ ID ΝΟ:123, SEQ ID ΝΟ:125, SEQ ID ΝΟ:127, SEQ ID ΝΟ:129, SEQ ID ΝΟ:131, SEQ ID ΝΟ:133, SEQ ID ΝΟ:135, SEQ ID ΝΟ:137, SEQ ID ΝΟ:139, SEQ ID ΝΟ:141, SEQ ID ΝΟ:143, SEQ ID ΝΟ:145, SEQ ID ΝΟ:147, SEQ ID ΝΟ:149, SEQ ID ΝΟ:151, SEQ ID ΝΟ:153, SEQ ID ΝΟ:155, SEQ ID ΝΟ:157, SEQ ID ΝΟ:159, SEQ ID ΝΟ:161, SEQ ID ΝΟ:163, SEQ ID ΝΟ:165, SEQ ID NO: 167, SEQ ID ΝΟ:169, SEQ ID ΝΟ:171, SEQ ID ΝΟ:173, SEQ ID ΝΟ:175, SEQ ID NO: 177, SEQ ID ΝΟ:179, SEQ ID ΝΟ:181, SEQ ID ΝΟ:183, SEQ ID ΝΟ:185, SEQ ID ΝΟ.Ί87, SEQ ID ΝΟ:189, SEQ ID ΝΟ:191, SEQ ID ΝΟ:193, SEQ ID ΝΟ:195, SEQ ID ΝΟ:197, SEQ ID ΝΟ:199, SEQ ID Ν0:201, SEQ ID Ν0:203, SEQ ID Ν0:205, SEQ ID Ν0:207, SEQ ID Ν0:209, SEQ ID ΝΟ:211, SEQ ID ΝΟ:213, SEQ ID ΝΟ:215, SEQ ID ΝΟ:217, SEQ ID ΝΟ:219, SEQ ID ΝΟ:221, SEQ ID ΝΟ:223, SEQ ID ΝΟ:225, SEQ ID ΝΟ:227, SEQ ID ΝΟ:229, SEQ ID ΝΟ:231, SEQ ID ΝΟ:233, SEQ ID ΝΟ:235, SEQ ID ΝΟ:237, SEQ ID ΝΟ:239, SEQ ID ΝΟ:241, SEQ ID ΝΟ:243, SEQ ID ΝΟ:245, SEQ ID ΝΟ:247, SEQ ID ΝΟ:249, SEQ ID ΝΟ:251, SEQ ID ΝΟ:253, SEQ ID ΝΟ:255, SEQ ID ΝΟ:257, SEQ ID ΝΟ:259, SEQ ID ΝΟ:261, SEQ ID ΝΟ:263, SEQ ID ΝΟ:265, SEQ ID NO:267, SEQ ID ΝΟ:269, SEQ ID ΝΟ:271, SEQ ID ΝΟ:273, SEQ ID ΝΟ:275, SEQ ID ΝΟ:277, SEQ ID ΝΟ:279, SEQ ID ΝΟ:281, SEQ ID ΝΟ:283, SEQ ID ΝΟ:285, SEQ ID ΝΟ:287, SEQ ID ΝΟ:289, SEQ ID ΝΟ:291, SEQ ID ΝΟ:293, SEQ ID ΝΟ:295, SEQ ID ΝΟ:297, SEQ ID ΝΟ:299, SEQ IDΝ0:301, SEQ ID Ν0:303, SEQ ID Ν0:305, SEQ ID Ν0:307, SEQ IDΝ0:309, SEQ ID Ν0:311, SEQ ID ΝΟ:313, SEQ ID ΝΟ:315, SEQ IDΝΟ:317, SEQ ID ΝΟ:319, SEQ ID ΝΟ:321, SEQ ID ΝΟ:323, SEQ IDΝΟ:325, SEQ ID ΝΟ:327, SEQ ID ΝΟ:329, SEQ ID ΝΟ:331, SEQ IDΝΟ:333, SEQ ID ΝΟ:335, SEQ ID ΝΟ:336, SEQ ID ΝΟ:337 e SEQ IDΝΟ:338 ao longo de uma região de pelo menos aproximadamente 10, 15,20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500,550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200,1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800,1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450,2500 ou mais resíduos.
Além disso, os métodos de síntese de R-MP, estereoisômerosde monatina e/ou estereoisômeros de derivados de monatina podem incluir ouso de um polipeptídeo com atividade de aldolase codificado por uma se-qüência de ácido nucléico que se hibridiza sob condição rigorosa a um ácidonucléico das SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17,SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ IDNO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45,SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ IDNO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73,SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ IDNO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NQ:101,SEQ ID N0:103, SEQ ID N0:105, SEQ ID N0:107, SEQ ID N0:109, SEQ IDNO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ IDNO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ IDNO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ IDNO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ IDNO: 143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NÒ:149, SEQ IDNO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ IDNO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO:165, SEQ IDNO:167, SEQ ID NO: 169, SEQ ID NO:171, SEQ ID NO:173, SEQ IDNO: 175, SEQ ID NO:177, SEQ ID NO: 179, SEQ ID NO:181, SEQ IDNO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ IDNO:191, SEQ ID NO: 193, SEQ ID NO:195, SEQ ID NO:197, SEQ IDNO: 199, SEQ ID N0:201, SEQ ID N0:203, SEQ ID N0:205, SEQ IDN0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ IDNO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ IDNO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ IDNO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ IDNO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ IDNO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ IDNO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ IDNO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ IDNO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ IDNO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ IDNO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ IDNO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID N0:301, SEQ IDN0:303, SEQ ID N0:305, SEQ ID N0:307, SEQ ID N0:309, SEQ IDNO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ IDNO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ IDNO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ IDNO:335, SEQ ID NO:336, SEQ ID NO:337 e SEQ ID NO:338. A invenção fornece um método, que compreende: a produção deum produto escolhido de monatina, derivados de monatina, sais dos mes-mos e combinações dos mesmos em uma vide de várias etapas, em queuma reação na vide é facilitada por um ou mais polipeptídeos escolhidos dospolipeptídeos isolados ou recombinantes que compreendem a seqüência deaminoácidos das SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8,SEQ ID N0:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ IDNO:18, SEQ ID NQ:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQID ΝΟ:28, SEQ ID Ν0:30, SEQ ID ΝΟ:32, SEQ ID ΝΟ:34, SEQ ID ΝΟ:36,SEQ ID ΝΟ:38, SEQ ID Ν0:40, SEQ ID ΝΟ:42, SEQ ID ΝΟ:44, SEQ IDΝΟ:46, SEQ ID ΝΟ:48, SEQ ID Ν0:50, SEQ ID ΝΟ:52, SEQ ID ΝΟ:54, SEQID ΝΟ:56, SEQ ID ΝΟ:58, SEQ ID Ν0:60, SEQ ID ΝΟ:64, SEQ ID ΝΟ:66,SEQ ID ΝΟ:68, SEQ ID Ν0:70, SEQ ID ΝΟ:72, SEQ ID ΝΟ:74, SEQ IDΝΟ:76, SEQ ID ΝΟ:78, SEQ ID Ν0:80, SEQ ID ΝΟ:82, SEQ ID ΝΟ:84, SEQID ΝΟ:86, SEQ ID ΝΟ:88, SEQ ID Ν0:90, SEQ ID ΝΟ:92, SEQ ID ΝΟ:94,SEQ ID ΝΟ:96, SEQ ID ΝΟ:98, SEQ ID NQ:100, SEQ ID NQ:102, SEQ ID
Ν0:106, SEQ ID NQ:108, SEQ ID ΝΟ:110, SEQ ID Ν0:112, SEQ ID ΝΟ:114, SEQ ID ΝΟ:116, SEQ ID ΝΟ:118, SEQ ID Ν0:120, SEQ ID ΝΟ:122, SEQ ID ΝΟ:124, SEQ ID ΝΟ:126, SEQ ID ΝΟ:128, SEQ ID Ν0:130, SEQ ID ΝΟ:132, SEQ ID NO: 134, SEQ ID NO: 136, SEQ ID ΝΟ:138, SEQ ID NO: 140, SEQ ID ΝΟ:142, SEQ ID NO: 144, SEQ ID ΝΟ:146, SEQ ID ΝΟ:148, SEQ ID Ν0:150, SEQ ID ΝΟ:152, SEQ ID ΝΟ:154, SEQ ID NO: 156, SEQ ID ΝΟ:158, SEQ ID Ν0:160, SEQ ID ΝΟ:162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID ΝΟ:168, SEQ ID Ν0:170, SEQ ID ΝΟ:172, SEQ ID ΝΟ:174, SEQ ID ΝΟ:176, SEQ ID ΝΟ:178, SEQ ID Ν0:180, SEQ ID ΝΟ:182, SEQ ID ΝΟ:184, SEQ ID ΝΟ:186, SEQ ID NO: 188, SEQ ID Ν0:190, SEQ ID ΝΟ:192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID ΝΟ:198, SEQ ID Ν0:200, SEQ ID Ν0:204, SEQ ID Ν0:206, SEQ ID Ν0:208, SEQ ID Ν0:210, SEQ ID ΝΟ:212, SEQ ID ΝΟ:214, SEQ ID ΝΟ:216, SEQ ID ΝΟ:218, SEQ ID Ν0:220, SEQ ID ΝΟ:222, SEQ ID ΝΟ:224, SEQ ID ΝΟ:226, SEQ ID ΝΟ:228, SEQ ID Ν0:230, SEQ ID ΝΟ:232, SEQ ID ΝΟ:234, SEQ ID ΝΟ:236, SEQ ID ΝΟ:238, SEQ ID Ν0:240, SEQ ID ΝΟ:242, SEQ ID ΝΟ:244, SEQ ID ΝΟ:246, SEQ ID ΝΟ:248, SEQ ID Ν0:250, SEQ ID ΝΟ:252, SEQ ID ΝΟ:254, SEQ ID ΝΟ:256, SEQ ID ΝΟ:258, SEQ ID Ν0:260, SEQ ID ΝΟ:262, SEQ ID ΝΟ:264, SEQ ID ΝΟ:266, SEQ ID ΝΟ:268, SEQ ID Ν0:270, SEQ ID ΝΟ:272, SEQ ID ΝΟ:274, SEQ ID ΝΟ:276, SEQ ID ΝΟ:278, SEQ ID ΝΟ:282, SEQ ID ΝΟ:284, SEQ ID ΝΟ:286, SEQ ID ΝΟ:288, SEQ ID Ν0:290, SEQ ID ΝΟ:292, SEQ ID ΝΟ:294, SEQ ID ΝΟ:296, SEQ ID ΝΟ:298, SEQ ID Ν0:300, SEQ IDΝ0:302, SEQ ID Ν0:304, SEQ ID Ν0:306, SEQ ID Ν0:308, SEQ IDΝ0:310, SEQ ID ΝΟ:312, SEQ ID ΝΟ:314, SEQ ID ΝΟ:316, SEQ IDΝΟ:318, SEQ ID Ν0:320, SEQ ID ΝΟ:322, SEQ ID ΝΟ:324, SEQ IDΝΟ:326, SEQ ID ΝΟ:328, SEQ ID Ν0:330, SEQ ID ΝΟ:332 ou SEQ IDΝΟ:334 ou fragmentos ou subseqüências dos mesmos que possuem ativi-dade de aldolase. Em algumas modalidades, os fragmentos ou as subse-qüências dos mesmos possuem uma atividade de aldolase de pelo menos0,2 mg MP/mg de proteína/h. Em outras modalidades, os fragmentos ou assubseqüências dos mesmos possuem uma atividade de aldolase de pelomenos 0,1 mg MP/mg de proteína/h. Em algumas modalidades, a reaçãofacilitada por um ou mais polipeptídeos de acordo com a invenção é realiza-da em aproximadamente 1,0 até aproximadamente 10,0 mM de MgCI2. Emoutras modalidades, a reação facilitada por um ou mais polipeptídeos de a-cordo com a invenção é realizada em aproximadamente pH 7,0 até aproxi-madamente pH 11,5. Ainda em outras modalidades, a reação facilitada porum ou mais polipeptídeos de acordo com a invenção é realizada em aproxi-madamente 0,005% até aproximadamente 1% de detergente polissorbato.
Em algumas modalidades, a reação é uma reação entre indol-3-piruvato e uma fonte de carbono C3. Em algumas modalidades, a reaçãoproduz preferencialmente o ácido R-2-hidróxi-2-(indol-3-il-metil)-4-cetoglutárico em relação ao ácido 5-2-^Γόχί-2-(^οΙ^3-ΐΙ-ιτιβΙίΙ)-4-cetoglutárico.
Em algumas modalidades, o produto feito através da vide de vá-rias etapas é a monatina, sais da mesma e combinações dos mesmos.
Em outras modalidades, pelo menos uma de R,R-monatina, R-Smonatina ou uma combinação das mesmas é produzida em maior quantida-de que S,S-monatina ou S,R-monatina na vide de várias etapas. Em algu-mas modalidades, a R,R monatina é produzida em maior quantidade queR,S-monatina, S,S-monatina e S,R-monatina na vide de várias etapas.
A invenção fornece um método, que compreende: a produção deum produto escolhido de monatina, derivados de monatina, sais dos mes-mos e combinações dos mesmos em uma vide de várias etapas, em queuma reação na vide é facilitada por pelo menos um polipeptídeo codificadopor uma seqüência de ácido nucléico que compreende uma seqüência quepossui uma porcentagem de identidade de seqüências de pelo menos 50% àSEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ IDNO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37,SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ IDNO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:61, SEQ ID NO:63, SEQID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73,SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ IDNO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID N0:103,SEQ ID NQ:105, SEQ ID NQ:107, SEQ ID NQ:109, SEQ ID NO:111, SEQ ID
NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO: 123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO;129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO: 155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO: 163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID N0:203, SEQ ID N0:205, SEQ ID N0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NQ:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ IDΝΟ:259, SEQ ID ΝΟ:261, SEQ ID ΝΟ:263, SEQ ID ΝΟ:265, SEQ IDΝΟ:267, SEQ ID ΝΟ:269, SEQ ID ΝΟ:271, SEQ ID ΝΟ:273, SEQ IDΝΟ:275, SEQ ID ΝΟ:277, SEQ ID ΝΟ:281, SEQ ID ΝΟ:283, SEQ IDΝΟ:285, SEQ ID ΝΟ:287, SEQ ID ΝΟ:289, SEQ ID ΝΟ:291, SEQ IDΝΟ:293, SEQ ID ΝΟ:295, SEQ ID ΝΟ:297, SEQ ID ΝΟ:299, SEQ IDΝ0:301, SEQ ID Ν0:303, SEQ ID Ν0:305, SEQ ID Ν0:307, SEQ IDΝ0:309, SEQ ID Ν0:311, SEQ ID ΝΟ:313, SEQ ID ΝΟ:315, SEQ IDΝΟ:317, SEQ ID ΝΟ:319, SEQ ID ΝΟ:321, SEQ ID ΝΟ:323, SEQ IDΝΟ:325, SEQ ID ΝΟ:327, SEQ ID ΝΟ:329, SEQ ID ΝΟ:331, SEQ IDΝΟ:333, SEQ ID ΝΟ:335, SEQ ID ΝΟ:336, SEQ ID ΝΟ:337 ou SEQ IDΝΟ:338. Em algumas modalidades, a porcentagem de identidade de se-qüências é de pelo menos 95%. Em outras modalidades, a porcentagem deidentidade de seqüências é de 100%.
A invenção fornece um método que compreende uma reaçãoque produz preferencialmente o ácido R-2-hidróxi-2-(indol-3-il-metil)-4-cetoglutárico em relação ao ácido S-2-hidróxi-2-(indol-3-il-metil)-4-cetoglutárico em que pelo menos um polipeptídeo codificado pela seqüênciade ácido nucléico que compreende uma seqüência que possui pelo menos95% de identidade de seqüência às SEQ ID NO: 28, SEQ ID NO:116, SEQID NO:298, SEQ ID NO: 44, SEQ ID NO:54, SEQ ID NO: 148, SEQ ID NO:46, SEQ ID NO:134, SEQ ID NO:142, SEQ ID NO:122, SEQ ID NO:74, SEQID NO: 64, SEQ ID NO: 108, SEQ ID NO:96, SEQ ID NO:126, SEQ IDN0:80, SEQ ID NO:36, SEQ ID NO:62, SEQ ID NO:112, SEQ ID N0:130,SEQ ID NO:94, SEQ ID NO:58, SEQ ID N0:50, SEQ ID N0:106, SEQ IDNO:42, SEQ ID NO:278, SEQ ID NO:162, SEQ ID NO:276, SEQ ID NO:178,SEQ ID NO:166, SEQ ID NO:218, SEQ ID NO:224, SEQ ID NO:226, SEQ IDNO:244, SEQ ID N0:250, SEQ ID NO:252, SEQ ID NO:264, SEQ IDNO:268, SEQ ID NO:272, SEQ ID NO:184, SEQ ID NO:282, SEQ IDNO:186, SEQ ID NO:192, SEQ ID N0:200, SEQ ID NO:284, SEQ IDNO:172, SEQ ID N0:180, SEQ ID NO:168, SEQ ID NO:228, SEQ IDNO:236, SEQ ID NO:238, SEQ ID N0:240 e SEQ ID NO:156 é utilizado parafacilitar uma reação em uma vide de várias etapas.A invenção fornece um método que compreende: a produção deum produto escolhido de monatina, derivados de monatina, sais dos mes-mos e combinações dos mesmos em uma vide de várias etapas, em queuma reação na vide é facilitada por pelo menos um polipeptídeo codificadopor uma seqüência de ácido nucléico que compreende uma seqüência quese hibridiza sob condição rigorosa a um ácido nucléico da SEQ ID NO:1,SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11,SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ IDNO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39,SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ IDNO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQID NO:59, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69,SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ IDNO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97,SEQ ID NO:99, SEQ ID NQ:103, SEQ ID NQ:105, SEQ ID NQ:107, SEQ ID
N0:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO: 127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO: 145, SEQ ID NO:147, SEQ ID NO: 149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO: 157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO: 163, SEQ ID NO:165, SEQ ID NO: 167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO: 199, SEQ ID N0:203, SEQ ID N0:205, SEQ ID N0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ IDNO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ IDNO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ IDNO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ IDNO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ IDNO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ IDNO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ IDNO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ IDNO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ IDNO:297, SEQ ID NO:299, SEQ ID N0:301, SEQ ID N0:303, SEQ IDN0:305, SEQ ID N0:307, SEQ ID NO:309, SEQ ID NO:311, SEQ IDNO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ IDNO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ IDNQ:329, SEQ ID NQ:331, SEQ ID NO:333, SEQ ID NO:335, SEQ IDΝΟ:336, SEQ ID ΝΟ:337 ou SEQ ID ΝΟ:338.
A invenção fornece ainda um método que compreende: a produ-ção de um produto escolhido de precursor de monatina, sais do mesmo ecombinações dos mesmos, em uma vide de várias etapas, em que uma rea-ção na vide é facilitada por um ou mais polipeptídeos escolhidos de polipep-tídeos isolados ou recombinantes que compreendem a seqüência de amino-ácidos da SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ IDN0:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQID N0:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28,SEQ ID N0:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ IDNO:38, SEQ ID N0:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQID NO:48, SEQ ID N0:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56,SEQ ID NO:58, SEQ ID N0:60, SEQ ID NO:64, SEQ ID NO:66, SEQ IDNO:68, SEQ ID N0:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQID NO:78, SEQ ID N0:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86,SEQ ID NO:88, SEQ ID N0:90, SEQ ID NO:92, SEQ ID NO:94, SEQ IDNO:96, SEQ ID NO:98, SEQ ID N0:100, SEQ ID N0:104, SEQ ID N0:106,SEQ ID N0:108, SEQ ID N0:110, SEQ ID NO:112, SEQ ID NO:114, SEQ IDNO:116, SEQ ID NQ:118, SEQ ID NQ:120, SEQ ID NQ:122, SEQ IDNO:124, SEQ ID NO: 126, SEQ ID NO:128, SEQ ID N0:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO: 140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO: 146, SEQ ID NO:148, SEQ ID N0:150, SEQ ID NO:152, SEQ ID NO: 154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID N0:160, SEQ ID NO: 162, SEQ ID NO:164, SEQ ID NO: 166, SEQ ID NO:168, SEQ ID NO: 170, SEQ ID NO:172, SEQ ID NO: 174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID NO: 180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ ID N0:190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ ID NO:198, SEQ ID N0:200, SEQ ID N0:204, SEQ ID N0:206, SEQ ID N0:208, SEQ ID N0:210, SEQ ID NO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID N0:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ ID N0:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ ID NO:238, SEQ ID N0:240, SEQ ID NO:242, SEQ ID NO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID N0:250, SEQ ID NO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID N0:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ ID N0:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ ID NO:278, SEQ ID NO:282, SEQ ID NO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID N0:290, SEQ ID NO:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID N0:300, SEQ ID N0:302, SEQ ID N0:304, SEQ ID N0:306, SEQ ID N0:308, SEQ ID N0:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ ID NO:318, SEQ ID N0:320, SEQ ID NO:322, SEQ ID NO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID N0:330, SEQ ID NO:332 ou SEQ ID NO:334 ou fragmentos ou subseqüências dos mesmos que possuem atividade de aldolase, em queo dito precursor de monatina, sais do mesmo e combinações dos mesmossão doces.
A invenção fornece adicionalmente um método que compreende:a produção de um produto escolhido de precursor de monatina, sais domesmo e combinações dos mesmos, em uma vide de várias etapas, em queuma reação na vide é facilitada por pelo menos um polipeptídeo codificadopor uma seqüência de ácido nucléico que compreende uma seqüência quepossui uma porcentagem de identidade de seqüências de pelo menos 50% àSEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ IDNO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37,SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ IDNO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQID NO:57, SEQ ID NO:59, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67,SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ IDNO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95,SEQ ID NO:97, SEQ ID NO:99, SEQ ID NQ:103, SEQ ID NQ:105, SEQ ID
NO: 107, SEQ ID N0:109, SEQ ID NO:111, SEQ ID NO:113, SEQ IDNO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ IDNO:123, SEQ ID NO:125, SEQ ID NO: 127, SEQ ID NO:129, SEQ IDNO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ IDNO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ IDNO: 147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ IDNO:155, SEQ ID NO: 157, SEQ ID NO:159, SEQ ID NO:161, SEQ IDNO:163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO:169, SEQ IDNO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ IDNO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ IDNO:187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO:193, SEQ IDNO:195, SEQ ID NO:197, SEQ ID NO: 199, SEQ ID N0:203, SEQ IDN0:205, SEQ ID N0:207, SEQ ID N0.209, SEQ ID NO:211, SEQ IDNO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ IDNO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ IDNO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ IDNO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ IDNO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ IDNO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ IDNO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ IDNO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ IDNO:277, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ IDNO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ IDNO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID N0:301, SEQ IDN0:303, SEQ ID N0:305, SEQ ID N0:307, SEQ ID N0:309, SEQ IDNO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ IDNO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ IDNQ:327, SEQ ID NO:329, SEQ ID NQ:331, SEQ ID NQ:333, SEQ ID
ΝΟ:335, SEQ ID ΝΟ:336, SEQ ID ΝΟ:337 ou SEQ ID ΝΟ:338, em que ο ditoprecursor de monatina, sais do mesmo e combinações dos mesmos são do-ces.
A invenção fornece ainda um método, que compreende: a pro-dução de um produto escolhido de precursor de monatina, sais do mesmo ecombinações dos mesmos, em uma vide de várias etapas, em que uma rea-ção na vide é facilitada por pelo menos um polipeptídeo codificado por umaseqüência de ácido nucléico que compreende uma seqüência que se hibridi-za sob condição rigorosa a um ácido nucléico da SEQ ID NO:1, SEQ IDNO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ IDNO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31,SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ IDNO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59,SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ IDNO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89,SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ IDNO:99, SEQ ID N0:103, SEQ ID N0:105, SEQ ID N0:107, SEQ ID N0:109,SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ IDNO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ IDNO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO: 139, SEQ ID NO:141, SEQ ID NO: 143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO: 163, SEQ ID NO:165, SEQ ID NO:167, SEQ ID NO: 169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO: 177, SEQ ID NO:179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO: 187, SEQ ID NO:189, SEQ ID NO:191, SEQ ID NO: 193, SEQ ID NO:195, SEQ ID NO:197, SEQ ID NO: 199, SEQ ID N0:203, SEQ ID N0:205, SEQ ID N0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID N0:301, SEQ ID N0:303, SEQ ID N0:305, SEQ ID N0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 ou SEQ ID NO:338, em que o dito precursor de monatina, sais do mesmo ecombinações dos mesmos são doces.
Em um esforço para ser conciso, sempre, que intermediá-rios/produtos forem identificados no relatório descritivo e nas reivindicações(tal como monatina, precursor de monatina ou derivado(s) de monatina) co-mo sendo formados, o termo "e/ou sais dos mesmos" deve ser entendidocomo sendo incluído quando aplicável. Em outras palavras, por exemplo, aexpressão "indol-3-piruvato é convertido em MP" deve ser entendida comosendo lida "ácido indol-3-pirúvico é convertido em MP e/ou sais do mesmo".
Um perito comum, na verdade, consideraria que sob as condições de reaçãomostradas os sais dos intermediários/produtos estão de fato presentes.
De acordo com algumas modalidades, o método produz umacomposição de monatina ou de derivado de monatina em que o componentede monatina ou de derivado de monatina da composição inclui apenas asformas R1R e S1R de monatina ou de derivado de monatina. O termo "ape-nas" quando utilizado para indicar que apenas certos isômeros são forma-dos, significa que a vide produziria apenas os isômeros identificados se aracemização não ocorresse. Conseqüentemente, o termo "apenas" não deveser tomado como significando a ausência de outros isômeros, mas ao invésdisso, um perito comum entenderia que outras formas isoméricas podemestar presentes em uma quantidade relativamente pequena devido à race-mização que pode ocorrer. De acordo com algumas modalidades, o métodoproduz uma composição em que o componente de monatina ou de derivadofS de monatina da composição inclui apenas a forma R,R de monatina ou dederivado de monatina (exceto até a extensão que a racemização ocorre re-sultando em outras formas isoméricas).
Como utilizado aqui, a expressão "composição de monatina"significa composições que incluem um ou mais isômeros de monatina; otermo pode também significar apenas uma única forma isomérica de monati-na e nada mais.
Como utilizado aqui, a expressão "composição de derivado demonatina" significa composições que incluem um ou mais isômeros de umderivado de monatina; o termo pode também significar apenas uma únicaforma isomérica do derivado de monatina e nada mais.
Como utilizado aqui, a expressão "derivado de monatina" possuia estrutura a seguir:<formula>formula see original document page 67</formula>
em que,
Ra, Rb, Rc Rd e Re cada um independentemente representaqualquer substituinte selecionado de um átomo de hibridização, um grupohidroxila, um grupo Ci-C3 alquila, um grupo CrC3 alcóxi, um grupo amino ouum átomo de halogênio, tal como um átomo de iodo, um átomo de bromo,um átomo de cloro ou um átomo de flúor. Entretanto, Ra, Rb, Rc, Rd e Re nãopodem ser todos simultaneamente hidrogênio. Alternativamente, Rb e Rc,e/ou Rd e Re podem juntos formar um grupo Ci-C4 alquileno, respectivamente.
Como utilizado aqui, "indol-3-piruvato substituído" significa queum ou mais átomos de carbono do anel indol do indol-3-piruvato são inde-pendentemente substituídos por um ou mais dos grupos substituintes Ra, Rb,Rc, Rd e Re definidos anteriormente. Entretanto, Ra, Rb, Rc, Rd e Re não po-dem ser todos simultaneamente hidrogênio. Alternativamente, Rb e Rc, e/ouRd e Re podem juntos formar um grupo Ci-C4 alquileno, respectivamente.
Como utilizado aqui, "triptofano substituído" significa que um oumais átomos de carbono do anel indol do triptofano é independentementesubstituído por um ou mais dos grupos substituintes Ra, Rb, Rc, Rd e Re defi-nidos anteriormente. Entretanto, Ra, Rb, Rc, Rd e Re não podem ser todossimultaneamente hidrogênio. Alternativamente, Rb e Rc, e/ou Rd e Re podemjuntos formar um grupo CrC4 alquileno, respectivamente. Em uma modali-dade, o triptofano substituído contém o(s) mesmo(s) grupo(s) substituinte(s)no anel indol como o derivado final de monatina.
Além disso, as vias biossintéticas para a produção de monatinadescritas aqui podem utilizar um triptofano substituído para produzir deriva-dos de monatina que provavelmente são doces. Em algumas modalidades, otriptofano substituído que serão utilizados nas vias biossintéticas descritasaqui incluem triptofano clorado e 5-hidroxitriptofano.
Por exemplo, os D-triptofanos clorados, que possuem similarida-des estruturais com a R,R monatina, foram identificados como adoçantesnão nutritivos (particularmente 6-cloro-D-triptofano). Similarmente, foi desco-berto que as formas de monatina halogenadas e substituídas por hidróxi e-ram doces. Pedido de Patente U.S. Publicado N0 2005/0118317. Os halogê-nios e os grupos hidroxila poderiam ser substituídos por hidrogênio, particu-larmente nas posições 1-4 do anel benzeno no indol de triptofano, sem inter-ferir nas conversões subseqüentes em D- ou L-triptofano, indol-3-piruvato,MP ou monatina. Foi mostrado na literatura que os indóis substituídos sãosubstratos para enzimas PLP e produziram triptofanos substituídos. Fukuda,D.S. e outros, "Production of Substituted L-Tryptophans by Fermentation",Appl. Environ. Microbiol., 21:841-43 (1971). O halogênio não parece impedirde forma estérica o mecanismo catalítico das subunidades beta da triptofanosintase e a especificidade enanciomérica também estava intacta.
Em algumas modalidades da presente invenção, é fornecido umprocesso para a produção de uma composição de monatina, que inclui aprodução de indol-3-piruvato partindo de L-triptofano, a produção de ácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico ("precursor de monatina" ou "MP")partindo de indol-3-piruvato e a produção de monatina partindo de MP. Areação de L-triptofano para produzir indol-3-piruvato é facilitada por uma en-zima que possui maior especificidade, maior atividade ou ambas em relaçãoao L-triptofano que em relação a R-MP, R1R monatina ou ambos. De acordocom certas modalidades, a reação de indol-3-piruvato é facilitada por umaenzima que possui atividade de aldolase específica a R e produz conse-qüentemente R-MP. De acordo com certas modalidades, é fornecida umaenzima racemase que pode facilitar a epimerização do subproduto de ami-noácido da reação de triptofano partindo de uma forma isomérica em umaoutra forma isomérica.Em algumas modalidades de acordo com a invenção, é forneci-do um processo para a produção de uma composição de monatina, que in-clui a produção de indol-3-piruvato partindo de L-triptofano, a produção deácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico ("precursor de monatina" ou"MP") partindo de indol-3-piruvato e a produção de monatina partindo de MP.A reação de L-triptofano para produzir indol-3-piruvato é facilitada por uma- enzima que possui maior especificidade, maior atividade ou ambas em rela-ção ao L-triptofano que em relação a R-MP, R,R monatina ou ambos e a re-ação de MP para formar monatina é facilitada por uma enzima, que é este-reosseletiva em relação a R-MP. O termo "estereosseletivo" significa queuma enzima possui maior especificidade, maior atividade ou ambas em rela-ção a um isômero - neste caso em relação a R-MP versus S-MP - que umoutro. Em modalidades preferidas, uma enzima estereosseletiva possui ati-vidade limitada em relação a um isômero quando comparada com um outro.Atividade "limitada" significa a atividade que é minimamente ou não percep-tível, por exemplo, que é determinada de acordo com os experimentos for-necidos aqui.
Deve ser observado que, quando são feitas referências a umasérie de reações tal como nos parágrafos anteriores, a invenção não requercada etapa para ser explicitamente realizada; é suficiente que as etapas po-dem ser realizadas de forma implícita. Em outras palavras, por exemplo, oprocesso para a produção de uma composição de monatina, que inclui aprodução de indol-3-piruvato partindo de L-triptofano, a produção de ácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico ("precursor de monatina" ou "MP")partindo de indol-3-piruvato e a produção de monatina partindo de MP, emque cada reação é facilitada por uma enzima apropriada, pode ser realizadoatravés da combinação de L-triptofano com as enzimas e do ajuste das con-dições de forma que as reações enumeradas poderiam ocorrer. Em tal casoo L-triptofano poderia reagir para produzir indol-3-piruvato, o indol-3-piruvatoproduzido partindo da reação de L-triptofano poderia reagir para formar o MPe o MP produzido partindo da reação de indol-3-piruvato poderia reagir paraformar monatina. O processo poderia também ser realizado, com a finalida-de de exemplo, através do fornecimento de um composto que pode produzirL-triptofano, sob condições adequadas para que a produção de L-triptofanoocorra e da combinação de tal composto com enzimas capazes de facilitar asérie de reações apresentadas sob condições que seriam adequadas paraque estas reações ocorressem. Como ainda um outro exemplo, o processopoderia ser realizado através do forencimento de um microorganismo enge-- nheirado geneticamente para produzir monatina de acordo com a vide des-crita e do fornecimento de condições apropriadas para que o processo defermentação ocorra. Por exemplo, um microorganismo, que produza natu-ralmente grandes quantidades de L-triptofano poderia ser engenheirado ge-neticamente para produzir ou superproduzir uma ou mais das enzimas utili-zadas para facilitar as reações na vide para monatina e condições apropria-das poderiam ser fornecidas de forma que o microorganismo produziria as-sim monatina.
Em outras modalidades de acordo com a invenção, é fornecidoum processo para a produção de monatina, em que um substrato forma umL-aminoácido quando o L-triptofano é convertido em indol-3-piruvato, o indol-3-piruvato reage para formar MP (que pode incluir tanto R-MP quanto S-MPembora inclua preferencialmente apenas ou predominantemente R-MP) e oL-aminoácido reage para regenerar (também referido aqui como "reciclo") osubstrato quando R-MP é convertido em R,R monatina. A reação de R-MPpara formar R,R monatina é facilitada através da estereoinversão da amino-transferase tal como D-metionina aminotransferase (EC 2.6.1.41) ou umaenzima que possui atividade de D-fenilglicina aminotransferase.
Em outras modalidades de acordo com a invenção, é fornecidoum processo para a produção de uma composição de monatina, que inclui aprodução de D-triptofano partindo de L-triptofano, a produção de indol-3-piruvato partindo de D-triptofano, a produção de R-MP partindo de indol-3-piruvato e a produção de R,R monatina partindo de R-MP. A produção do D-triptofano partindo do L-triptofano é facilitada por uma triptofano racemase eequivalentes funcionais da mesma. Em certas modalidades adicionais, asreações de D-triptofano para formar indol-3-piruvato e de MP para formarmonatina são facilitadas pela mesma enzima. Ainda em outras modalidadesadicionais, a reação de indol-3-piruvato é facilitada por uma enzima quepossui atividade de aldolase específica a R e conseqüentemente o R-MP éformado e as reações de D-triptofano para formar indol-3-piruvato e de R-MPpara formar R1R monatina são facilitadas pela mesma enzima.
Em algumas modalidades de acordo com a invenção, é forneci-- do um processo para a produção de um derivado de monatina, que inclui aprodução do derivado de monatina partindo de um indol-3-piruvato substituí-do e piruvato, utilizando uma enzima que possui atividade de aldolase espe-cífica a R para catalisar a reação.
Os detalhes de uma ou mais modalidades da invenção são a-presentados nas figuras em anexo e na descrição abaixo. Outras caracterís-ticas, objetivos e vantagens de acordo com a invenção serão evidentes par-tindo da descrição e das figuras e das reivindicações. Como seria compre-endido partindo da descrição contida aqui, a invenção é capaz de fazer mo-dificações em várias modalidades, todas sem sair do espírito e do âmbito dapresente invenção. Conseqüentemente, as figuras e a descrição detalhadadevem ser consideradas como tendo natureza ilustrativa e não de restrição.
Todas as publicações, as patentes, os pedidos de patentes, asseqüências do GenBank e os depósitos na ATCC, citados aqui são expres-samente incorporados aqui como referência para todas as finalidades.BREVE DESCRIÇÃO DAS FIGURAS
As figuras a seguir são ilustrativas das modalidades da invençãoe não significam que limitam o âmbito da invenção que é abrangido pelasreivindicações.
A figura 1 é um gráfico de fluxo que mostra um exemplo de umprocesso enzimático para a produção de R,R monatina partindo de L-triptofano de acordo com a invenção. Neste exemplo, o processo inclui autilização de uma L-aminotransferase (cujos exemplos incluem uma L-triptofano aminotransferase, uma aminotransferase L-aromática, uma L-aspartato aminotransferase e uma L-alanina aminotransferase) na reação deL-triptofano que possui maior especificidade e/ou seletividade pelo L-triptofano como um substrato que por R-MP e/ou o processo inclui a utiliza-ção de uma L-aminoácido oxidase com atividade e/ou especificidade limitadapela R1R monatina como um substrato. N0 exemplo específico representadograficamente na figura 1, uma L-aminotransferase ou uma L-aminoácido oxi-- dase converte L-triptofano em indol-3-piruvato, o indol-3-piruvato é reagidocom uma aldolase específica a R e piruvato para produzir monatina R-alfa-ceto ácida (R-MP) e a R-MP é convertida em R,R monatina por uma D-aminotransferase ou uma D-aminoácido desidrogenase. Como mostrado nafigura 1, as reações são reversíveis, mas para as finalidades da invenção,não é necessário que as reações ocorram na direção inversa.
A figura 2 é um gráfico de fluxo que mostra um exemplo de umoutro process para a produção de R1R monatina de acordo com a invenção.Neste exemplo, o processo inclui a utilização de uma enzima para converterR-MP em monatina que é estereosseletiva em relação a R-MP. Nc exemploespecífico representado graficamente na figura 2, é mostrado que o triptofa-no é convertido em indol-3-piruvato em uma reação reversível. O indol-3-piruvato pode ser reagido com uma aldolase não estereoespecífica paraformar de forma reversível a monatina alfa-ceto ácida (tanto R- quanto S-MP). A R-MP é convertida de forma reversível em R,R monatina através deuma D-aminotransferase estereosseletiva ou uma D-aminoácido desidroge-nase estereosseletiva. Qualquer S-MP que é formada através da aldolasenão estereoespecífica pode ser convertida de volta em indol-3-piruvato seuma D-aminotransferase ou uma D-aminoácido desidrogenase estereossele-tiva for utilizada. Para as finalidades da invenção, não é necessário que asreações mostradas como sendo reversíveis ocorram na direção inversa.
A figura 3 é um gráfico de fluxo que mostra um exemplo de ain-da um outro processo para a produção de R1R monatina partindo de L-triptofano de acordo com a invenção. Neste exemplo, o processo inclui aconversão de L-triptofano em D-triptofano utilizando uma triptofano racema-se e utilizando um produto de D-aminoácido na reação acoplada com a rea-ção que forma indol-3-piruvato como um substrato na reação acoplada coma reação que forma R,R monatina. N0 exemplo específico representado gra-ficamente na figura 3, o L-triptofano é convertido em D-triptofano através deuma triptofano racemase em uma reação reversível. 0 D-triptofano é reagidocom alfa-cetoglutarato (α-KG) e uma D-aminotransferase de especificidadeampla para produzir indol-3-piruvato e D-glutamato. O indol-3-piruvato é rea-gido com piruvato e uma aldolase específica a R e convertido em R-monatina alfa-ceto ácida (R-MP) e a R-MP é reagida com uma D-aminotransferase de especificidade ampla e o D-glutamato para formar R,Rmonatina e alfa-cetoglutarato (α-KG). Como mostrado na figura 3, cada umadas reações é reversível, mas para as finalidades da invenção, não é neces-sário que as reações ocorram na direção inversa.
A figura 4 é um gráfico de fluxo que mostra um exemplo de ain-da um outro processo para a produção de R1R monatina partindo de L-triptofano de acordo com a invenção. Neste exemplo, o processo inclui aconversão do L-aminoácido formado na reação acoplada com a reação de L-triptofano em um D-aminoácido; este D-aminoácido atua como um doadoramino para a reação em que a R-MP é convertida em R,R monatina. N0 e-xemplo específico representado graficamente na figura 4, o L-triptofano éreagido com uma L-aminotransferase e alfa-cetoglutarato para produzir in-dol-3-piruvato e L-glutamato. O indol-3-piruvato é reagido com piruvato euma aldolase específica a R e convertido em R-monatina alfa-ceto ácida (R-MP) e a R-MP é reagida com uma D-aminotransferase de especificidadeampla e D-glutamato para formar R,R monatina e alfa-cetoglutarato. Comomostrado na figura 4, as reações são reversíveis, mas para as finalidades dainvenção, não é necessário que as reações ocorram na direção inversa.
A figura 5 é um gráfico de fluxo que mostra um exemplo de ain-da um outro processo para a produção de R,R monatina partindo de L-triptofano de acordo com a invenção. Neste exemplo, o processo inclui afacilitação enzimática da conversão de R-MP em R,R monatina utilizandouma enzima de estereoinversão de forma que o L-aminoácido formado pelareação acoplada à reação de L-triptofano pode ser utilizado como um subs-trato para a reação acoplada à reação de R-MP em R,R monatina. N0 exem-plo específico representado graficamente na figura 5, o L-triptofano é reagidocom uma L-aminotransferase e oxaloacetato, piruvato ou alfa-cetoglutarato(α-KG) para produzir indol-3-piruvato e L-aspartato (se o oxaloacetato forutilizado), L-alanina (se o piruvato for utilizado) ou L-glutamato (se o a-KGfor utilizado). O indol-3-piruvato é reagido com piruvato e uma aldolâse es-pecífica a R e convertido em R-monatina alfa-ceto ácida (R-MP) e a R-MP éreagida com uma aminotransferase de estereoinversão e L-aspartato, L-alanina ou L-glutamato para formar R1R monatina e oxaloacetato (se o L-aspartato for utilizado), piruvato (se a L-alanina for utilizada) ou alfa-cetoglutarato (α-KG, se o L-glutamato for utilizado). Como mostrado na figu-ra 5, as reações são reversíveis, mas para as finalidades da invenção, não énecessário que as reações ocorram na direção inversa.
A figura 6 é um gráfico de fluxo que mostra um exemplo de ain-da um outro processo para a produção de R,R monatina de acordo com apresente invenção. Neste exemplo, o processo inclui o reciclo do L-aminoácido produzido na reação que forma indol-3-piruvato com o D-aminoácido utilizado como um reagente com a R-MP na reação formandoR,R monatina através de uma série de reações de conversão. N0 exemploespecífico representado graficamente na figura 6, o L-triptofano é reagido deforma reversível com uma L-aminotransferase e oxaloacetato para produzirindol-3-piruvato e L-aspartato. O indol-3-piruvato é reagido de uma maneirareversível com piruvato e uma aldolase específica a R e convertido em R-monatina alfa-ceto ácida (R-MP) e a R-MP é reagida de forma reversívelcom uma D-aminotransferase e D-alanina para formar R,R monatina e piru-vato. O L-aspartato é convertido em L-alanina e CO2 utilizando uma asparta-to 4-descarboxilase. A L-alanina é convertida em D-alanina com uma alaninaracemase. Para as finalidades da invenção, não é necessário que as rea-ções mostradas como sendo reversíveis ocorram ria direção inversa.
A figura 7 é um gráfico de fluxo que mostra um exemplo de ain-da um outro processo para a produção de R,R monatina de acordo com apresente invenção. Neste exemplo, o processo inclui empurrar a reação doL-triptofano para frente (isto é, conduzir a reação em direção à produção deindol-3-piruvato) através da conversão do subproduto de L-aminoácido de talreação em um outro produto. Neste exemplo, o subproduto de L-aminoácidoL-aspartato é convertido em L-alanina em uma reação irreversível utilizandouma descarboxilase. N0 exemplo específico representado graficamente nafigura 7, o L-triptofano é reagido de forma reversível com uma L--aminotransferase e com alfa-cetoglutarato (α-KG) ou oxaloacetato para pro-duzir indol-3-piruvato e L-glutamato (se o α-KG for utilizado) ou L-aspartato* (se o oxaloacetato for utilizado). O indol-3-piruvato é reagido de forma rever-sível com piruvato e uma aldolase específica a R e convertido em R-monatina alfa-ceto ácida (R-MP). A R-MP é reagida de uma maneira reversí-vel com uma D-aminotransferase e um D-aminoácido para formar R,R mona-tina e qualquer um de oxaloacetato, piruvato ou α-KG. O L-glutamato ou o L-aspartato que era um produto da reação da L-aminotransferase é convertidoem 4-aminobutanoato e CO2 (se o L-glutamato for o substrato) ou em β-alanina e CO2 (se o L-aspartato for o substrato) utilizando um ácido glutâmi-co ou uma aspartato descarboxilase. Para as finalidades da invenção, não énecessário que as reações mostradas como sendo reversíveis ocorram nadireção inversa.
A figura 8 é um gráfico de fluxo que mostra um exemplo de ain-da um outro processo para a produção de R1R monatina de acordo com apresente invenção. Neste exemplo, o processo inclui o reciclo do subprodutode aminoácido da reação de L-triptofano com o reagente de aminoácido dareação de R-MP através de uma série de reações de conversão. N0 exemploespecífico representado graficamente na figura 8, o L-triptofano é reagido deforma reversível com uma L-aminotransferase e com alfa-cetoglutarato (a-KG) para produzir indol-3-piruvato e L-glutamato. O indol-3-piruvato é reagi-do de forma reversível com piruvato e uma aldolase específica a R e conver-tido em R-monatina alfa-ceto ácida (R-MP). A R-MP é reagida de uma ma-neira reversível com uma D-aminotransferase e D-alanina para formar R,Rmonatina e piruvato. Uma L-alanina aminotransferase e o piruvato são utili-zados para converter de forma reversível o L-glutamato que era um produtoda reação da L-aminotransferase de volta em α-KG, com L-alanina como umco-produto. Uma alanina racemase converte de forma reversível a L-alaninana D-alanina que é útil na terceira reação, a reação da D-aminotransferase.Para as finalidades da invenção, não é necessário que as reações mostra-das como sendo reversíveis ocorram na direção inversa.
A figura 9 é um diagrama em blocos de um sistema de computa-dor.
A figura 10 é um diagrama de fluxo que ilustra uma modalidade- de um processo para a comparação de uma nova seqüência de nucleotídeosou de proteína com um banco de dados de seqüências com a finalidade dedeterminar os níveis de homologia entre a nova seqüência e as seqüênciasno banco de dados.
A figura 11 é um diagrama de fluxo que ilustra uma modalidadede um processo em um computador para a determinação do fato de duasseqüências serem homólogas.
A figura 12 é um diagrama de fluxo que ilustra uma modalidadede um processo identificador 300 para a detecção da presença de uma ca-racterística em uma seqüência.
As figuras 13 e 14 juntas ilustram as atividades de 58 aldolasesdiferentes (cada uma identificada por seu número de SEQ ID específico) naformação do precursor de monatina (MP) que é medida por LC/MS/MS.
A figura 15 ilustra o efeito de ditiotreitol sobre a produção demonatina pelo polipeptídeo com atividade de aldolase da SEQ ID NO:88.
Os símbolos de referência similares nas várias figuras indicamelementos similares.
DESCRIÇÃO DETALHADA
Um número de modalidades foi descrito anteriormente e é des-crito em maiores detalhes infra. As modalidades da invenção incluem um oumais dos aspectos descritos.
Abreviações e Termos
As explicações a seguir dos termos e dos métodos são forneci-das para descrever melhor a presente descrição e para guiar os versados natécnica na prática da presente descrição. Como utilizado aqui, "incluindo"significa "compreendendo". Em adição, as formas no sigular "um" ou "uma"ou "o" ou "a" incluem referências no plural a não ser que o contexto determi-ne claramente de outra maneira. Por exemplo, a referência a "compreen-dendo uma proteína" inclui uma ou um grande número de tais proteínas e areferência a "compreendendo a célula" inclui referência a uma ou mais célu-las e equivalentes das mesmas conhecidas pelos versados na técnica e as-sim por diante. O termo "aproximadamente" abrange a faixa de erro experi-- mental que ocorre em qualquer medida. A não ser que seja citado de outramaneira, é presumido que todos os números de medidas possuem a palavra"aproximadamente" na frente dos mesmos mesmo se a palavra "aproxima-damente" não for expressamente utilizada.
Substituição conservativa: uma substituição de um aminoácidopor um outro aminoácido em um polipeptídeo, cuja substituição possui poucoaté nenhum impacto sobre a atividade do polipeptídeo. A substituição é con-siderada conservativa independente do fato dos aminoácidos alterados pa-recerem estruturalmente ou funcionalmente similares. Por exemplo, de formaideal, um polipeptídeo de triptofano aminotransferase que inclui uma ou maissubstituições conservativas mantém a atividade de triptofano aminotransfe-rase. Pode ser produzido um polipeptídeo que contém uma ou mais substitu-ições conservativas através da manipulação da seqüência de nucleotídeosque codifica tal polipeptídeo utilizando, por exemplo, procedimentos padroni-zados tal como a mutagênese direcionada ao sítio ou a PCR ou outros mé-todos conhecidos pelos versados na técnica.
Os exemplos não-limitantes de aminoácidos que podem sersubstituídos por um aminoácido original em uma proteína e que podem serconsiderados como substituições conservativas se houver pouco até ne-nhum impacto sobre a atividade do polipeptídeo incluem: Ala substituída porser ou thr; arg substituída por gln, his ou lys; asn substituída por glu, gln, lys,his, asp; asp substituída por asn, glu ou gln; cys substituída por ser ou ala;gln substituída por asn, glu, lys, his, asp ou arg; glu substituída por asn, glnlys ou asp; gly substituída por pro; his substituída por asn, lys, gln, arg, tyr;ile substituída por leu, met, vai, phe; leu substituída por ile, met, vai, phe; Iyssubstituída por asn, glu, gln, his, arg; met substituída por ile, leu, vai, phe;phe substituída por trp, tyr, met, ile ou leu; ser substituída por thr, ala; thrsubstituída por ser ou ala; trp substituído por phe, tyr; tyr substituída por his,phe ou trp; e vai substituída por met, ile, leu.
Informação adicional sobre as substituições conservativas podeser encontrada, dentre outros locais, em Ben-Bassat e outros, (J. Bacteriol.169:751-7, 1987), O1Regan e outros, (Gene 77:237-51, 1989), Sahin-Toth eoutros, (Protein Sei. 3:240-7, 1994), Hochuli e outros, (Bio/Technology6:1321-5, 1988), WO 00/67796 (Curd e outros) e em livros textos padroniza-dos de genética e biologia molecular.
Derivado: Para as finalidades do relatório descritivo e das reivin-dicações, uma substância é "derivada" de um organismo ou uma fonte sequalquer um ou mais dos seguintes for verdadeiro: 1) a substância está pre-sente no organismo/fonte; 2) a substância é removida do hospedeiro nativo;ou, 3) a substância é removida do hospedeiro nativo e é derivada, por e-xemplo, por mutagênese.
Isolado: O termo "isolado" como utilizado aqui se refere a qual-quer substância removida de seu hospedeiro nativo; a substância não preci-sa estar purificada. Por exemplo, "ácido nucléico isolado" refere-se a um á-cido nucléico que ocorre naturalmente que não está imediatamente contíguoa ambas as seqüências com as quais está imediatamente contíguo (uma naextremidade a 5' e uma na extremidade a 3') no genoma que ocorre natu-ralmente do organismo do qual é derivado. Por exemplo, um ácido nucléicoisolado pode ser, sem limitação, uma molécula de DNA recombinante dequalquer comprimento, contanto que uma das seqüências de ácidos nucléi-cos normalmente encontradas imediatamente flanqueando tal molécula deDNA recombinante em um genoma que ocorre naturalmente seja removidaou esteja ausente. Assim, um ácido nucléico isolado inclui, sem limitação,um DNA recombinante que existe na forma de uma molécula separada (talcomo um cDNA ou um fragmento de DNA genômico produzido através daPCR ou do tratamento com endonucleases de restrição) independente deoutras seqüências assim como DNA recombinante que é incorporado em umvetor, um plasmídeo de replicação autônoma, um vírus (tal como um retroví-rus, um adenovírus ou um herpes vírus) ou no DNA genômico de um proca-rioto ou eucarioto. Em adição, um ácido nucléico isolado pode incluir umamolécula de DNA recombinante que faz parte de uma seqüência de ácidonucléico híbrida ou de fusão.
Como utilizado aqui, o termo "isolado" significa que o material(tal como uma proteína ou um ácido nucléico de acordo com a invenção) é- removido de seu ambiente original (tal como o ambiente natural se ocorrernaturalmente). Por exemplo, um polinucleotídeo ou um polipeptídeo que o-corre naturalmente presente em um animal vivo não está isolado, mas omesmo polinucleotídeo ou polipeptídeo, separado de alguns ou de todos osmateriais co-existentes no sistema natural, está isolado. Tais polinucleotí-deos poderiam fazer parte de um vetor e/ou tais polinucleotídeos ou polipep-tídeos poderiam fazer parte de uma composição e ainda estar isolados pelofato de que tal vetor ou composição não faz parte de seu ambiente natural.
O termo "isolado" como utilizado aqui com referência ao ácidonucléico inclui ainda qualquer ácido nucléico que não ocorre naturalmenteporque as seqüências de ácidos nucléicos que não ocorrem naturalmentenão são encontradas na natureza e não possuem seqüências imediatamentecontíguas em um genoma que ocorre naturalmente. Por exemplo, o ácidonucléico que não ocorre naturalmente tal como um ácido nucléico engenhei-rado é considerado como sendo um ácido nucléico isolado. O ácido nucléicoengenheirado pode ser feito utilizando técnicas de clonagem molecular oude síntese química de ácidos nucléicos comuns. O ácido nucléico que nãoocorre naturalmente isolado pode ser independente de outras seqüências ouincorporado em um vetor, um plasmídeo de replicação autônoma, um vírus(tal como um retrovírus, um adenovírus ou um herpes vírus) ou o DNA ge-nômico de um procarioto ou um eucarioto. Em adição, um ácido nucléico quenão ocorre naturalmente pode incluir uma molécula de ácido nucléico quefaz parte de uma seqüência de ácido nucléico híbrida ou de fusão.
Purificado: O termo "purificado" como utilizado aqui não requerpureza absoluta, mas ao invés disso é pretendido como um termo relativo.Assim, por exemplo, uma preparação de polipeptídeo ou de ácido nucléicopurificada pode ser uma em que o polipeptídeo ou o ácido nucléico em ques-tão esteja em uma concentração maior que o polipeptídeo ou o ácido nucléi-co que estaria em seu ambiente natural dentro de um organismo ou em umaconcentração maior que no ambiente do qual foi removido.
Os ácidos nucléicos individuais obtidos partindo de uma bibliote-ca foram purificados de forma convencional até a homogeneidade eletroforé-tica. As seqüências obtidas partindo destes clones não podiam ser obtidasdiretamente partindo da biblioteca ou partindo do DNA humano total. Os áci-dos nucléicos purificados de acordo com a invenção foram purificados par-tindo do restante do DNA genômico no organismo em pelo menos IO4-IO6vezes. Em algumas modalidades, o termo "purificado" inclui ácidos nucléicosque foram purificados do restante do DNA genômico ou de outras seqüên-cias em uma biblioteca ou outro ambiente em pelo menos uma ordem degrandeza, tal como, em algumas modalidades, duas ou três ordens ou qua-tro ou cinco ordens de grandeza.
Aminoácido: "Aminoácido" ou "seqüência de aminoácidos" comoutilizado aqui refere-se a uma seqüência de oligopeptídeo, de peptídeo, depolipeptídeo ou de proteína ou a um fragmento, uma parte ou uma subuni-dade de qualquer um destes e a moléculas que ocorrem naturalmente ousintéticas. "Aminoácido" ou "seqüência de aminoácidos" inclui uma seqüên-cia de oligopeptídeo, de peptídeo, de polipeptídeo ou de proteína ou umfragmento, uma parte ou uma subunidade de qualquer um destes e molécu-las que ocorrem naturalmente ou sintéticas. O termo "polipeptídeo" comoutilizado aqui, refere-se a aminoácidos ligados a cada outro através de Iiga-ções peptídicas ou ligações peptídicas modificadas, isto é, isoésteres peptí-dicos e pode conter aminoácidos modificados sem ser os 20 aminoácidoscodificados por genes. Os polipeptídeos podem ser modificados através deprocessos naturais, tal como o processamento pós-tradução ou através detécnicas de modificação química que são bem-conhecidas na técnica. Asmodificações podem ocorrer em qualquer lugar no polipeptídeo, incluindo aestrutura peptídica, as cadeias laterais de aminoácidos e os terminais aminoe carboxila. Será considerado que o mesmo tipo de modificação pode estarpresente nos mesmos ou em graus variáveis em vários sítios em um certopolipeptídeo. Ainda, um certo polipeptídeo pode ter muitos tipos de modifica-ções. As modificações incluem acetilação, acilação, ADP-ribosilação, amida-ção, ligação covalente de flavina, ligação covalente de um porção heme, Ii-gação covalente de um nucleotídeo ou de um derivado de nucleotídèo, liga-ção covalente de um lipídeo ou de um derivado de lipídeo, ligação covalentede um fosfatidilinositol, ciclização de reticulação, formação de ligação dissul-feto, desmetilação, formação de ligações cruzadas covalentes, formação decisteína, formação de piroglutamato, formilação, gama-carboxilação, glicosi-lação, formação de ancoragem de GPI, hidroxilação, iodização, metilação,miristoliação, oxidação, peguilação, processamento de glucan hidrolase, fos-forilação, prenilação, racemização, selenoilação, sulfação e adição mediadapor RNA de transferência de aminoácidos para á proteína tal como arginila-ção. (Vide Creighton, T.E., Proteins - Structure and Molecular Properties 2-Ed., W.H. Freeman and Company, Nova Iorque (1993); Posttranslational Co-valent Modification of Proteinsi B.C. Johnson, Ed., Academic Press, NovaIorque, pp. 1-12 (1983)). Os peptídeos e os polipeptídeos de acordo com ainvenção incluem ainda todas as formas "miméticas" e "peptídeomiméticas",que são descritas em detalhes adicionais, abaixo.
Polipeptídeo Que Possui Uma Atividade de Aldolase: Por um"polipeptídeo que possui uma atividade de aldolase" entende-se um polipep-tídeo que por si só ou em associação com um ou mais polipeptídeos adicio-nais (que possuem a mesma seqüência ou uma diferente), é uma proteínacom a atividade enzimática de uma aldolase.
Recombinante: Polipeptídeos ou proteínas "recombinantes" refe-rem-se a polipeptídeos ou proteínas produzidas através de técnicas do DNArecombinante; isto é, produzidas partindo de células transformadas por umconstructo de DNA exógeno que codifica o polipeptídeo ou a proteína dese-jada. Os polipeptídeos ou as proteínas "sintéticas" são aquelas preparadasatravés da síntese química. Os métodos de síntese química de peptídeosem fase sólida também podem ser utilizados para sintetizar o polipeptídeoou os fragmentos de acordo com a invenção. Tal método é conhecido natécnica desde o início dos anos 60 (Merrifield, R. B., J. Am. Chem. Soc.,85:2149-2154, 1963) (Vide também Stewart, J. M. e Young, J. D., Solid Pha-se Peptide Synthesis, 2- Ed., Pierce Chemical Co., Rockford, Ill., pp. 11-12))e foi recentemente empregado no planejamento de peptídeos em laboratórioe nos kits de síntese disponíveis comercialmente (Cambridge Research Bio-chemicals). Tais kits de laboratório disponíveis comercialmente foram utiliza-vam geralmente os ensinamentos de Η. M. Geysen e outros, Proc. Natl. A-cad. Sci., USA, 81:3998 (1984) e fornecem a síntese de peptídeos sobre asextremidades de um grande número de "bastões" ou "pinos" os quais todossão conectados a uma única placa.
Substancialmente Idêntica: A expressão "substancialmente idên-tica" no contexto de dois ácidos nucléicos ous polipeptídeos, se refere a du-as ou mais seqüências que possuem, tal como pelo menos aproximadamen-te 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%,63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%,76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais deidentidade de resíduos (seqüência) de nucleotídeos ou de aminoácidos,quando comparadas e alinhadas para correspondência máxima, que é me-dida utilizando um dos algoritmos de comparação de seqüências conhecidosou através de inspeção visual. Em outras modalidades, a identidade subs-tancial existe ao longo de uma região de pelo menos aproximadamente 100ou mais resíduos e mais comumente as seqüências são substancialmenteidênticas ao longo de pelo menos aproximadamente 150 até 200 ou maisresíduos. Em algumas modalidades, as seqüências são substancialmenteidênticas ao longo do comprimento total das regiões codificadoras.
Adicionalmente, uma seqüência de aminoácidos "substancial-mente idêntica" é uma seqüência que difere de uma seqüência de referênciaem uma ou mais substituições, deleções ou inserções de aminoácidos con-servativas ou não conservativas. Em algumas modalidades, substituição o-corre em um sítio que não é o sítio ativo da molécula ou alternativamente asubstituição ocorre em um sítio que é o sítio ativo da molécula, contanto queo polipeptídeo mantenha essencialmente suas propriedades funcionais (en-zimáticas). Uma substituição de aminoácido conservativa, por exemplo,substitui um aminoácido por um outro da mesma classe (tal como a substitu-ição de um aminoácido hidrofóbico, tal como isoleucina, valina, Ieucina ou„ metionina, por um outro ou a substituição de um aminoácido polar por umoutro, tal como a substituição de arginina por lisina, ácido glutâmico por áci-do aspártico ou glutamina por asparagina). Um ou mais aminoácidos podemser deletados, por exemplo, de um polipeptídeo de aldolase, tal como piruva-to aldolase, HMG e/ou KHG aldolase, resultando na modificação da estruturado polipeptídeo, sem alterar significativamente sua atividade biológica. Porexemplo, os aminoácidos amino ou carboxil terminais que não são necessá-rios para a atividade biológica da enzima aldolase, tal como piruvato aldola-se, tal como HMG e/ou KHG aldolase podem ser removidos. As seqüênciasde polipeptídeos modificadas de acordo com a invenção podem ser analisa-das em relação à atividade biológica da enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase através de qualquer número demétodos, incluindo o contato da seqüência de polipeptídeo modificada comum substrato e a determinação se o polipeptídeo modificado diminui a quan-tidade de substrato específico no ensaio ou aumenta os bioprodutos da rea-ção enzimática de um polipeptídeo de aldolase funcional, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase com o substrato.
Fragmento: Um "fragmento" como utilizado aqui em relação auma proteína ou um polipeptídeo ou um ácido nucléico é uma parte da prote-ína, do polipeptídeo ou do ácido nucléico, respectivamente. Os fragmentospodem ter a mesma ou substancialmente a mesma seqüência de aminoáci-dos ou de ácido nucléico que a seqüência de proteína, de polipeptídeo ou deácido nucléico mais longa da qual o fragmento é derivado. Os fragmentosque possuem estruturas tridimensionais diferentes quando comparados comaquelas da proteína, do polipeptídeo ou do ácido nucléico mais longo tam-bém são incluídos. Um exemplo disso, é uma molécula "pró-forma", tal comouma pró-proteína de atividade baixa que pode ser modificada através de cli-vagem para produzir uma enzima madura com atividade significativamentemaior. Um fragmento de uma proteína ou de um polipeptídeo pode ser umaparte enzimaticamente ativa de uma proteína ou de um polipeptídeo.
Aminotransferase de Estereoinversão: Uma "aminotransferasede estereoinversão" é um polipeptídeo capaz de produzir preferencial ou se-letivamente um produto de aminoácido quiral (tal como monatina) enquantoutiliza um substrato de quiralidade oposta como o doador de amino. Por e-xemplo, uma aminotransferase de estereoinversão pode ser uma D-fenilglicina aminotransferase (também chamada de D-4-hidroxifenilglicinaaminotransferase) que utiliza preferencial ou seletivamente o L-glutamatocomo um substrato para produzir R1R monatina. Os exemplos não-limitantesde aminotransferases de estereoinversão incluem D-metionina aminotransfe-rase (EC 2.6.1.41) e enzimas que possuem atividade de D-fenilglicina ami-notransferase ou atividade de D-4-hidroxifenilglicina aminotransferase.
A presente invenção refere-se a polipeptídeos com atividade dealdolase, incluindo de piruvato tal como, sem limitação, atividade de HMGe/ou KHG aldolase, polinucleotídeos que codificam os mesmos e métodosde produção e de utilização destes polinucleotídeos e polipeptídeos. Em al-gumas modalidades, a invenção fornece ainda enzimas aldolase, tais comoenzimas piruvato aldolase, tal como HMG e/ou KHG aldolase, polinucleotí-deos que codificam estas enzimas, o uso de tais polinucleotídeos e polipep-tídeos.
Em algumas modalidades, a invenção fornece aldolases modifi-cadas ou que sofreram evolução, tais como piruvato aldolases, HMG e/ouKHG aldolases, com maior atividade específica quando comparadas com asaldolases não modificadas ou que não sofreram evolução, respectivamente.
Em algumas modalidades, são fornecidas aldolases, tal como apiruvato aldolase, tal como, sem limitação a HMG e/ou a KHG aldolase, quefacilitam a produção de um 2-ceto-glutarato substituído em 3, 4. Em umamodalidade, a invenção fornece um método de produção de um 2-ceto-glutarato substituído em 3, 4 que compreende: (a) o fornecimento de um po-lipeptídeo que possui uma atividade de aldolase, tal como uma atividade depiruvato aldolase, tal como, sem limitação, uma atividade de HMG aldolasee/ou de KMG aldolase; (b) o fornecimento de um composto doador e de umreceptor; e (c) o contato do polipeptídeo da etapa (a) com os compostos daetapa (b) sob condições em que a aldolase catalisa a síntese de um 2-ceto-glutarato substituído em 3, 4, em que opcionalmente o doador e o receptorsão um piruvato ou um doador de piruvato e um receptor α-ceto ácido, umacetona e/ou um aldeído.
Em uma outra modalidade da invenção, uma piruvato aldolase,tal como uma HMG e/ou KHG aldolase, pode ser utilizada em associaçãocom uma D-aminotransferase para produzir um ácido D-glutâmico substituí-do em 4 ou um derivado do mesmo. Um ácido D-glutâmico substituído em 4e/ou um derivado do mesmo pode ser utilizado como um antibiótico, umavez que foi descoberto que estes compostos inibem a glutamato racemasebacteriana. Em uma modalidade, a invenção fornece um método de produ-ção de um ácido D-glutâmico substituído em 4 que compreende: (a) o forne-cimento de um polipeptídeo que possui uma atividade de aldolase, tal comouma atividade de piruvato aldolase, tal como, sem limitação, uma atividadede HMG aldolase e/ou de KMG aldolase; (b) o fornecimento de um receptorα-ceto ácido e um piruvato ou um doador de piruvato; e (c) o contato do poli-peptídeo da etapa (a) com os compostos da etapa (b) sob condições em quea aldolase catalisa a síntese de um ácido D-glutâmico substituído em 4, emque opcionalmente o polipeptídeo possui atividade de piruvato aldolase, deHMG aldolase e/ou de KHG aldolase e em que opcionalmente o métodocompreende ainda o uso de uma D-aminotransferase.
Em algumas modalidades a invenção fornece composições (taiscomo preparações de enzimas, alimentos e aditivos para alimentos, produ-tos alimentícios e aditivos para produtos alimentícios, bebida e aditivos parabebidas, fármacos e aditivos para fármacos e suplementos dietéticos) quecompreendem as enzimas, os polipeptídeos ou os polinucleotídeos de acor-do com a invenção. Estas composições podem ser formuladas em uma vari-edade de formas, tais como na forma de líquidos, géis, pílulas, comprimidos,sprays, filmes, micelas, pós, alimento, péletes de produtos alimentícios ouformas encapsuladas, incluindo formas nanoencapsuladas.Os ensaios para a medida da atividade de aldolase, incluindo aatividade de piruvato tal como, sem limitação, a atividade de HMG e/ou deKHG aldolase, tais como para a determinação se um polipeptídeo possuiatividade de aldolase, incluindo atividade de piruvato tal como, sem Iimita-- ção, atividade de HMG e/ou de KHG aldolase, são bem-conhecidos na téc-nica e estão dentro do âmbito de acordo com a invenção; vide E.E. Dekker &s R.P. Kitson, J. Biol. Chem. 267, 10507-10514, 1992; Taha TS, Deits TL, Pu-rification and characterization of 2-keto-3-deoxy-6-fosfogluconate aldolasefrom Azotobacter vinelandir. evidence that the enzyme is bifunctional towards2-keto-4-hydroxy glutarate cleavage, Biochem Biophys Res Commun. Abrilde 1994 15;200(1):459-66; Dekker EE1 Kobes RD, Grady SR, 2-keto-4-hydroxyglutarate aldolase from bovine liver, Methods Enzymol. 1975;42:280-5; Dekker EE, Nishihara H, Grady SR1 Methods Enzymol. 1975;42:285-90, 2-keto-4-hydroxyglutarate aldolase from Escherichia colr, Nishihara H, DekkerEE, Biochim Biophys Acta. Julho de 1969 8;185(1):255-7, A stereospecific 2-keto-4-hydroxyglutarate aldolase from Escherichia eoli. Um exemplo de umensaio adequado para a determinação se um polipeptídeo possui atividadede aldolase, tal como atividade de piruvato aldolase, tal como de HMG e/oude KHG aldolase é descrito no Exemplo 3.
Em algumas modalidades, as aldolases da invenção podem serutilizadas de forma eficaz em uma variedade de condições de pH, incluindo,por exemplo, de uma faixa de aproximadamente 3,0 até aproximadamente12,0. Em outras modalidades, as aldolases da invenção podem ser utilizadasem aproximadamente pH 3,0, 4,0, 4,5, 5,0, 5,5, 6,0, 6,5, 7,0, 7,5, 8,0, 8,5,9,0, 9,5, 10,0, 10,5, 11,0, 11,5 ou aproximadamente 12,0. As condições dereação conduziada sob condições ácidas ou alcalinas também podem servantajosas, tal como em algumas aplicações industriais ou farmacêuticas deenzimas de acordo com a invenção.
A invenção refere-se a polipeptídeos de aldolase, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invençãoem uma variedade de formas e formulações. Nos métodos de acordo com ainvenção, os polipeptídeos de aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase de acordo com a invenção são utilizados em umavariedade de formas e formulações. Por exemplo, os polipeptídeos purifica-dos de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldola-se podem ser utilizados nas preparações de enzimas mobilizadas para aprodução de ácido R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (R-MP) ecertos estereoisômeros de monatina, tais como R1R e S1R monatina e sais" dos mesmos, assim como certos estereoisômeros de derivados de monati-na, tais como configurações de derivados de R,R e S,R monatina e sais dosmesmos ou em aplicações de auxílio farmacêutico ou dietético. Alternativa-mente, as enzimas de acordo com a invenção podem ser utilizadas direta-mente em processos para produzir o ácido R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (R-MP) e certos estereoisômeros de monatina, tais como R,Re S,R monatina e sais dos mesmos, assim como certos estereoisômeros dederivados de monatina, tais como as configurações dos derivados de R1ReS,R monatina e sais dos mesmos, para processar alimentos, líquidos ouprodutos alimentícios e similares.
Em algumas modalidades, os polipeptídeos de aldolase, tal co-mo piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com ainvenção podem ser expressos em um microorganismo utilizando procedi-mentos conhecidos na técnica. Em algumas modalidades, os polipeptídeosde aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolasede acordo com a invenção podem ser imobilizados sobre um suporte sólidoantes do uso nos métodos de acordo com a invenção. Os métodos para aimobilização de enzimas sobre suportes sólidos são comumente conhecidosna técnica, por exemplo, J. Mol. Cat. B: Enzymatic 6 (1999) 29-39; Chivata eoutros Biocatalysis: Immobilized cells and enzymes, J Mol. Cat. 37 (1986) 1-24: Sharma e outros, Immobilized Biomaterials Techniques and Applications,Angew. Chem. Int. Ed. Engl. 21 (1982) 837-54: Laskin (Ed.), Enzymes andImmobilized Cells in Biotechnology.
Ácidos Nucléicos. Sondas e Moléculas Inibidoras
A invenção fornece ácidos nucléicos isolados e recombinantes,tais como, vide a Listagem de Seqüências; ácidos nucléicos que codificampolipeptídeos, incluindo as seqüências de polinucleotídeos de acordo com ainvenção, tais como, vide a Listagem de Seqüências; incluindo cassetes deexpressão tais como vetores de expressão e vários veículos de clonagemque compreendem os ácidos nucléicos de acordo com a invenção. Em al-gumas modalidades, a invenção inclui ainda métodos para descobrir, identi-ficar ou isolar novas seqüências de polipeptídeos de aldolase, tal como piru-vato aldolase, HMG e/ou KHG aldolase utilizando os ácidos nucléicos deacordo com a invenção. Em algumas modalidades, a invenção inclui aindamétodos para inibir a expressão de genes que codificam e produtos datranscrição de aldolase, tal como piruvato aldolase, tal como HMG e/ou KHGaldolase utilizando os ácidos nucléicos de acordo com a invenção.
São também fornecidos métodos para a modificação dos ácidosnucléicos de acordo com a invenção, incluindo a produção de variações deácidos nucléicos de acordo com a invenção, através de, tal como a remonta-gem com ligação sintética, sistema de evolução direcionada otimizada e/oumutagênese de saturação tal como mutagênese de saturação de sítio gênico(GSSM). O termo "mutagênese de saturação", Mutagênese de Saturação deSítio Gênico ou "GSSM" inclui um método que utiliza iniciadores de oligonu-cleotídeos degenerados para introduzir mutações pontuais em um polinucle-otídeo, como descrito em detalhes, abaixo. O termo "sistema de evoluçãodirecionada otimizada" ou "evolução direcionada otimizada" inclui um méto-do para a remontagem de fragmentos de seqüências de ácidos nucléicosrelacionadas, tais como genes relacionados e explicado em detalhes abaixo.
O termo "remontagem de ligação sintética" ou "SLR" inclui um método deligação de fragmentos de oligonucleotídeos de uma maneira não-estocásticae explicado em detalhes abaixo. O termo "variação" refere-se a polinucleotí-deos ou polipeptídeos de acordo com a invenção modificados em um oumais pares de bases, códons, íntrons, éxons ou resíduos de aminoácidos(respectivamente) e ainda mantêm a atividade biológica de uma aldolase, talcomo piruvato aldolase, HMG e/ou KHG aldolase de acordo com a invenção.
As variações podem ser produzidas através de qualquer número de meiosincluindo métodos tais como, por exemplo, PCR propensa a erros, embara-lhamento, mutagênese direcionada por oligonucleotídeo, PCR de montagem,mutagênese por PCR sexual, mutagênese in vivo, mutagênese com cassete,mutagênese de conjunto recursivo, mutagênese de conjunto exponencial,mutagênese específica ao sítio, remontagem gênica, GSSM e qualquercombinação dos mesmos.
Os ácidos nucléicos de acordo com a invenção podem ser pro-duzidos, isolados e/ou manipulados através de, tal como clonagem e ex-pressão de bibliotecas de cDNA, amplificação de mensagem ou DNA genô-mico através da PCR e similar. Por exemplo, as seqüências de acordo coma invenção eram inicialmente derivadas de fontes ambientais. Assim, emalgumas modalidades, a invenção fornece ácidos nucléicos que codificam aenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase e os polipeptídeos codificados pelos mesmos, preferencialmente deri-vados de uma fonte comum, tal como uma fonte ambiental, de cultura mistaou bacteriana.
Na prática dos métodos de acordo com a invenção, os geneshomólogos podem ser modificados através da manipulação de um ácido nu-cléico molde, como descrito aqui. Em algumas modalidades, a invenção po-de ser praticada em associação com qualquer método ou protocolo ou dis-positivo conhecido na técnica, que são bem-descritos na literatura científicae de patente.
As expressões "ácido nucléico" ou "seqüência de ácido nucléico"como utilizados aqui se referem a um oligonucleotídeo, um nucleotídeo, umpolinucleotídeo ou a um fragmento de qualquer um destes, ao DNA ou aoRNA de origem genômica ou sintética que podem ter filamento simples oufilamento duplo e podem representar um filamento sentido ou anti-sentido(complementar), ao ácido nucléico de peptídeos (PNA) ou a qualquer mate-rial similar a DNA ou similar a RNA, de origem natural ou sintética. As ex-pressões "ácido nucléico" ou "seqüência de ácido nucléico" incluem oligonu-cleotídeo, nucleotídeo, polinucleotídeo ou um fragmento de qualquer umdestes, DNA ou RNA (tal como mRNA, rRNA, tRNA, iRNA) de origem genô-mica ou sintética que podem ter filamento simples ou filamento duplo e po-dem representar um filamento sentido ou anti-sentido, ácido nucléico de pep-tídeos (PNA) ou qualquer material similar a DNA ou similar a RNA, de ori-gem natural ou sintética, incluindo, tal como iRNA, ribonucleoproteínas (taiscomo iRNAs de filamento duplo, tais como iRNPs). O termo abrange ácidosnucléicos, isto é, oligonucleotídeos, que contêm análogos conhecidos denucleotídeos naturais. O termo abrange ainda estruturas similares a ácidosnucléicos com estruturas sintéticas, vide tal como Mata (1997) Toxicol. Appl.Pharmacol. 144:189-197; Strauss-Soukup (1997) Biochemistry 36:8692-8698; Samstag (1996) Antisense Nucleic Acid Drug Dev 6:153-156. Oligo-nucleotídeo" inclui um polidesoxinucleotídeo de filamento simples ou doisfilamentos de polidesoxinucleotídeos complementares que podem ser sinte-tizados quimicamente. Tais oligonucleotídeos sintéticos não possuem fosfatoa 5' e assim não se ligarão com um outro oligonucleotídeo sem a adição deum fosfato com um ATP na presença de uma quinase. Um oligonucleotídeosintético pode se ligar a um fragmento que não foi desfosforilado.
Uma "seqüência codificadora de" ou uma "seqüência de nucleo-tídeos que codifica" um polipeptídeo ou uma proteína particular, é uma se-qüência de ácido nucléico que pode ser transcrita e traduzida em um poli-peptídeo ou uma proteína quando colocada sob o controle de seqüênciasreguladoras apropriadas. O termo "gene" significa o segmento de DNA en-volvido na produção de uma cadeia de polipeptídeo; inclui regiões que pre-cedem e após a região codificadora (líder e "trailer") bem como, quando apli-cável, seqüências intermediárias (íntrons) entre os segmentos codificadoresindividuais (éxons). Uma seqüência promotora está "ligada de forma opera-cional a" uma seqüência codificadora quando a RNA polimerase que inicia atranscrição no promotor irá transcrever a seqüência codificadora no mRNA."Ligado de forma operacional" como utilizado aqui se refere a uma relaçãofuncional entre dois ou mais segmentos de ácidos nucléicos (tal como DNA).
Pode se referir à relação funcional de seqüência reguladora da transcriçãocom uma seqüência transcrita. Por exemplo, um promotor está ligado deforma operacional a uma seqüência codificadora, tal como um ácido nucléicode acordo com a invenção, se estimular ou modular a transcrição da se-qüência codificadora em uma célula hospedeira apropriada ou outro sistemade expressão. Geralmente, as seqüências promotoras reguladoras da trans-crição que estão ligadas de forma operacional a uma seqüência transcritaestão fisicamente contíguas à seqüência transcrita, isto é, atuam em eis. En-tretanto, algumas seqüências reguladoras da transcrição, tais como intensifi-cadores, não precisam estar fisicamente contíguas ou localizadas em proxi-midade íntima com as seqüências codificadoras cuja transcrição estas au-mentam.
O termo "cassete de expressão" como utilizado aqui se refere auma seqüência de nucleotídeos que é capaz de afetar a expressão de umgene estrutural (isto é, uma seqüência que codifica proteína, tal como umaenzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase deacordo com a invenção) em um hospedeiro compatível com tais seqüências.Os cassetes de expressão incluem pelo menos um promotor ligado de formaoperacional à seqüência que codifica o polipeptídeo; e, opcionalmente, aoutras seqüências, tais como sinais de término da transcrição. Também po-dem ser utilizados fatores adicionais necessários ou que auxiliam a realiza-ção da expressão, tais como intensificadores, fatores alfa. Assim, os casse-tes de expressão incluem ainda plasmídeos, vetores de expressão, vírusrecombinantes, qualquer forma de vetor de "DNA nu" recombinante e simila-res. Um "vetor" compreende um ácido nucléico que pode infectar, transfec-tar, transduzir de forma transitória ou permanente uma célula. Será reconhe-cido que um vetor pode ser um ácido nucléico nu ou um ácido nucléico com-plexado com proteína ou lipídeo. O vetor compreende opcionalmente ácidosnucléicos e/ou proteínas e/ou membranas virais ou bacterianas (tal comouma membrana celular, um envelope lipídico viral etc.). Os vetores incluem,mas não estão limitados a replicons (tais como replicons de RNA, bacterió-fagos) aos quais os fragmentos de DNA podem ser ligados e se tornar repli-cados. Os vetores incluem assim, mas não estão limitados a RNA, DNA ouRNA circular ou linear com autorreplicação autônoma (tais como plasmí-deos, vírus e similares, vide a Patente U.S. N0 5.217.879) e incluem tantoplasmídeos de expressão quanto sem ser de expressão. Quando um micro-organismo ou uma cultura de células recombinantes for descrita como umhospedeiro de um "vetor de expressão" isto inclui tanto DNA circular quantolinear extracromossômico e DNA que foi incorporado no(s) cromossomo(s)do hospedeiro. Quando um vetor estiver sendo mantido por uma célula hos-pedeira, o vetor pode ser replicado de forma estável pelas células durante amitose na forma de uma estrutura autônoma ou é incorporado dentro do ge-noma do hospedeiro.
Como utilizado aqui, o termo "recombinante" abrange ácidos nu-cléicos adjacentes a um ácido nucléico "estrutural" ao qual não estão adja-centes em seu ambiente natural. Em algumas modalidades, "enriquecer" osácidos nucléicos representará aproximadamente 5% ou mais do de insertosde ácidos nucléicos em uma população de moléculas estruturais de ácidonucléico. As moléculas estruturais de acordo com a invenção incluem ácidosnucléicos tais como vetores de expressão, ácidos nucléicos de auto-replicação, vírus, ácidos nucléicos de integração e outros vetores ou ácidosnucléicos utilizados para manter ou manipular um inserto de ácido nucléicode interesse. Em algumas modalidades, os ácidos nucléicos enriquecidosrepresentam aproximadamente 15% ou mais do número de insertos de áci-dos nucléicos na população de moléculas estruturais recombinantes. Emalgumas modalidades, os ácidos nucléicos enriquecidos representam apro-ximadamente 50% ou mais do número de insertos de ácidos nucléicos napopulação de moléculas estruturais recombinantes. Em algumas modalida-des, os ácidos nucléicos enriquecidos representam aproximadamente 90%ou mais do número de insertos de ácidos nucléicos na população de molécu-Las estruturais recombinantes.
Uma modalidade da invenção é um ácido nucléico isolado, sinté-tico ou recombinante que compreende uma das seqüências de acordo com ainvenção ou um fragmento que compreende pelo menos 10, 15, 20, 25, 30,35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 ou mais bases consecutivasde um ácido nucléico de acordo com a invenção. Os ácidos nucléicos isola-dos, sintéticos ou recombinantes podem compreender DNA, incluindo cDNA,DNA genômico e DNA sintético. O DNA pode ter filamento duplo ou filamentosimples ou se tiver filamento simples pode ser o filamento codificador ou ofilamento não codificador (anti-sentido). Alternativamente, os ácidos nucléi-cos isolados, sintéticos ou recombinantes compreendem RNA.
Os ácidos nucléicos isolados, sintéticos ou recombinantes deacordo com a invenção podem ser utilizados para preparar um dos polipep-tídeos de acordo com a invenção ou fragmentos que compreendem pelo" menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 ou mais aminoácidosconsecutivos de um dos polipeptídeos de acordo com a invenção. Conse-qüentemente, uma outra modalidade da invenção é um ácido nucléico isola-do, sintético ou recombinante que codifica um dos polipeptídeos de acordocom a invenção ou fragmentos que compreendem pelo menos 5, 10, 15, 20,25, 30, 35, 40, 50, 75, 100 ou 150 ou mais aminoácidos consecutivos de umdos polipeptídeos de acordo com a invenção. As seqüências codificadorasdestes ácidos nucléicos podem ser idênticas a uma das seqüências codifi-cadoras de um dos ácidos nucléicos de acordo com a invenção ou podemser seqüências codificadoras diferentes que codificam um daqueles de acor-do com a invenção que possuem pelo menos 5, 10, 15, 20, 25, 30, 35, 40,50, 75, 100 ou 150 ou mais aminoácidos consecutivos de um dos polipeptí-deos de acordo com a invenção, como um resultado da redundância ou dadegeneração do código genético. O código genético é bem-conhecido pelosversados na técnica e pode ser obtido, tal como na página 214 de B. Lewin,Genes VI, Oxford University Press, 1997.
O ácido nucléico isolado que codifica um dos polipeptídeos dainvenção e seqüências substancialmente idênticas aos mesmos, pode inclu-ir, mas não está limitado: à seqüência codificadora de um ácido nucléico deacordo com a invenção e seqüências codificadoras adicionais, tais comoseqüências líderes ou seqüências de pró-proteína e seqüências não codifi-cadoras, tais como íntrons ou seqüências não codificadoras a 5' e/ou a 3' daseqüência codificadora. Assim, como utilizado aqui, o termo "polinucleotídeoque codifica um polipeptídeo" abrange um polinucleotídeo que inclui a se-qüência codificadora do polipeptídeo assim como um polinucleotídeo queinclui seqüência codificadora e/ou não codificadora adicional.Alternativamente, as seqüências de ácidos nucléicos da inven-ção e as seqüências substancialmente idênticas às mesmas, podem sofrermutagênese utilizando técnicas convencionais, tal como mutagênese dire-cionada ou sítio ou outras técnicas familiares aos versados na técnica, parava introdução de alterações silenciosas nos polinucleotídeos o de acordo coma invenção. Como utilizado aqui, "alterações silenciosas" incluem, por exem-plo, alterações que não modificam a seqüência de aminoácidos codificadapelo polinucleotídeo. Tais alterações podem ser desejáveis com a finalidadede aumentar o nível do polipeptídeo produzido pelas células hospedeirascontendo um vetor que codifica o polipeptídeo através da introdução de có-dons ou de pares de códons que ocorrem freqüentemente no organismohospedeiro.
A invenção refere-se ainda a polinucleotídeos que possuem alte-rações de nucleotídeos que resultam em substituições, adições, deleções,fusões e truncamentos de aminoácidos no polipeptídeos de acordo com ainvenção. Tais alterações de nucleotídeos podem ser introduzidas utilizandotécnicas tais como mutagênese direcionada ao sítio, mutagênese químicaaleatória, deleção com exonuclease Ill e outras técnicas do DNA recombi-nante. Alternativamente, tais alterações de nucleotídeos podem ser varia-ções alélicas que ocorrem naturalmente que são isoladas através da identifi-cação de ácidos nucléicos que se hibridizam especificamente com sondasque compreendem pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150,200, 300, 400 ou 500 bases consecutivas de uma das seqüências de acordocom a invenção (ou as seqüências complemèntares às mesmas) sob condi-ções de rigor alto, moderado ou baixo que são fornecidas aqui.
Técnicas Gerais
Os ácidos nucléicos utilizados para a prática desta invenção,seja RNA, siRNA, miRNA, ácido nucléico anti-sentido, cDNA, DNA genômi-co, vetores, vírus ou híbridos dos mesmos, podem ser isolados partindo deuma variedade de fontes, engenheiradas geneticamente, amplificadas e/ouexpressas/geradas de forma recombinante. Os polipeptídeos recombinantes(tais como as enzimas aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase) gerados partindo destes ácidos nucléicos podem serisolados individualmente ou clonados e testados em relação a uma atividadedesejada. Qualquer sistema de expressão recombinante pode ser utilizado,incluindo sistemas de expressão em células de bactéria, de mamífero, deJevedura, de inseto ou de planta.
Alternativamente, estes ácidos nucléicos podem ser sintetizadosin vitro através de técnicas de síntese química bem-conhecidas, como des-crito, tal como, em Adams (1983) J. Am. Chem. Soe. 105:661; Belousov(1997) Nucleic Acids Res. 25:3440-3444; Frenkel (1995) Free Radie. Biol.Med. 19:373-380; Blommers (1994) Biochemistry 33:7886-7896; Narang(1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68:109; Beau-cage (1981) Tetra. Lett. 22:1859; Patente U.S. N0 4.458.066.
As técnicas para a manipulação de ácidos nucléicos, tais comosubclonagem, sondas de marcação (tal como marcação com iniciador alea-tório utilizando polimerase de Klenow, tradução com pequenos cortes, ampli-ficação), seqüenciamento, hibridização e similares são bem-descritas na lite-ratura científica e de patente, vide Sambrook, ed., MOLECULAR CLONING:A LABORATORY MANUAL (2â ED.), Vols. 1-3, Cold Spring Harbor Labora-tory, (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel,ed. John Wiley & Sons, Inc., Nova Iorque (1997); LABORATORY TECHNI-QUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATIONWITH NUCLEIC ACID PROBES, Parte I. Theory and Nucleic Acid Preparati-on, Tijssen, ed. Elsevier, N.Y. (1993).
Um outro meio útil de obtenção e de manipulação de ácidos nu-cléicos utilizado para a prática dos métodos de acordo com a invenção é aclonagem partindo de amostras genômicas e, se desejado, a seleção e areclonagem de insertos isolados ou amplificados partindo de, tal como clo-nes genômicos ou clones de cDNA. As fontes de ácido nucléico utilizadasnos métodos de acordo com a invenção incluem bibliotecas genômicas oude cDNA contidas em, tal como cromossomos artificiais de mamífero(MACs). Vide as Patentes U.S. N- 5.721.118; 6.025.155; cromossomos arti-ficiais humanos, vide Rosenfeld (1997) Nat. Genet. 15:333-335; cromosso-mos artificiais de levedura (YAC); cromossomos artificiais de bactéria (BAC);cromossomos artificiais P1, vide Woon (1998) Genomics 50:306-316; veto-res derivados de P1 (PACs), vide Kern (1997) Biotechniques 23:120-124;cosmídeos, vírus recombinantes, fagos ou plasmídeos.
Em algumas modalidades, um ácido nucléico que codifica umpolipeptídeo de acordo com a invenção é montado em uma fase apropriadacom uma seqüência líder capaz de direcionar a secreção do polipeptídeotraduzido ou de fragmento do mesmo.
A invenção fornece proteínas de fusão e ácidos nucléicos quecodificam as mesmas. Um polipeptídeo de acordo com a invenção pode serfundido com um peptídeo ou um polipeptídeo heterólogo, tal como peptídeoscom identificação N-terminal que conferem características desejadas, talcomo maior estabilidade ou purificação simplificada. Os peptídeos e os poli-peptídeos de acordo com a invenção também podem ser sintetizados e ex-pressos na forma de proteínas de fusão com um ou mais domínios adicio-nais ligados aos mesmos para, tal como a produção de um peptídeo maisimunogênico, para isolar mais facilmente um peptídeo sintetizado de formarecombinante, para identificar e isolar anticorpos e células B que expressamanticorpos e similares. Os domínios que facilitam a detecção e a purificaçãoincluem, tais como peptídeos que quelam metais tais como extensões depolihistidina e módulos de histidina-triptofano que permitem a purificaçãosobre metais imobilizados, domínios de proteína A que permitem a purifica-ção sobre imunoglobulina imobilizada e o domínio utilizado no sistema deextensão/purificação por afinidade de FLAGS (Immunex Corp, Seattle WA).A inclusão de seqüências Iigantes que podem ser clivadas tal como o FatorXa ou a enteroquinase (Invitrogen, Carlsbad, CA) entre um domínio de puri-ficação e o peptídeo ou o polipeptídeo que compreende o motivo para facili-tar a purificação. Por exemplo, um vetor de expressão pode incluir uma se-qüência de ácido nucléico que codifica um epítopo ligada a seis resíduos dehistidina seguida por uma tiorredoxina e um sítio de clivagem da enteroqui-nase (vide tal como Williams (1995) Biochemistry 34:1787-1797; Dobeli(1998) Protein Expr. Purif. 12:404-414). Os resíduos de histidina facilitam adetecção e a purificação enquanto o sítio de clivagem da enteroquinase for-nece meios para a purificação do epítopo partindo do restante da proteína defusão. A tecnologia relativa aos vetores que codificam proteínas de fusão e aaplicação das proteínas de fusão são bem-descritas na literatura científica e5 ,de patente, vide tal como Kroll (1993) DNA CeIL Biol., 12:441-53.Seqüências de Controle da Transcrição e da Tradução
A invenção fornece seqüências de ácidos nucléicos (tais comoDNA) de acordo com a invenção ligadas de forma operacional à(s) seqüen-ciais) de controle da expressão (tal(is) como da transcrição ou da tradução),tal(is) como promotores ou intensificadores, para direcionar ou modular asíntese/expressão de RNA. A seqüência de controle da expressão pode es-tar em um vetor de expressão. Os exemplos de promotores bacterianos in-cluem lacl, IacZ, T3,17, gpt, Iambda PR, PL e trp. Os exemplos de promoto-res eucarióticos incluem o inicial imediato do CMV, da timidina quinase doHSV, SV40 inicial e tardio, LTRs de retrovírus e metalotioneína I de camun-dongo.
Como utilizado aqui, o termo "promotor" inclui todas as seqüên-cias capazes de controlar a transcrição de uma seqüência codificadora emuma célula, tal como uma célula vegetal ou animal. Assim, os promotoresutilizados nos constructos de acordo com a invenção incluem elementos decontrole da transcrição e seqüências reguladoras que atuam em eis que es-tão envolvidos na regulação ou na modulação da sincronia e/ou da taxa detranscrição de um gene. Por exemplo, um promotor pode ser um elementode controle da transcrição que atua em eis, incluindo um intensificador, umpromotor, um terminador da transcrição, uma origem de replicação, uma se-qüência de integração cromossômica, regiões não traduzidas a 5' e a 3' ouuma seqüência intrônica, que está envolvida na regulação da transcrição.Estas seqüências que atuam em eis podem interagir com proteínas ou ou-tras moléculas biológicas para realizar (ligar/desligar, regular, modular etc.) atranscrição. Os promotores "constitutivos" são aqueles que controlam a ex-pressão continuamente sob a maior parte das condições ambientais e está-gios do desenvolvimento ou diferenciação celular. Os promotores "que po-dem ser induzidos" ou "que podem ser regulados" direcionam a expressãodo ácido nucléico de acordo com a invenção sob a influência de condiçõesambientais ou condições do desenvolvimento. Os exemplos de condiçõesambientais que podem afetar a transcrição pelos promotores que podem serjnduzidos incluem condições anaeróbicas, temperatura elevada, seca oupresença de luz.
Os promotores "específicos ao tecido" são elementos de contro-le da transcrição que são ativos apenas em células ou tecidos ou órgãosparticulares, tais como em plantas ou animais. A regulação específica aotecido pode ser conseguida através de certos fatores intrínsecos que garan-tem que os genes que codificam proteínas específicas a um certo tecido sãoexpressos. É sabido que tais fatores existem em mamíferos e plantas deforma que permitam que tecidos específicos se desenvolvam.
Os promotores adequados para a expressão de um polipeptídeoem bactérias incluem os promotores Iac ou trp de E. coli, o promotor lacl, opromotor IacZ1 o promotor T3, o promotor T7, o promotor gpt, o promotorIambda PR, o promotor Iambda PL, os promotores de óperons que codificamenzimas glicolíticas tal como 3-fosfoglicerato quinase (PGK) e o promotor dafosfatase ácida. Os promotores eucarióticos incluem o promotor inicial ime-diato do CMV, o promotor da timidina quinase de HSV, os promotores dechoque térmico, os promotores de SV40 inicial e tardio, LTRs de retrovírus eo promotor da metalotioneína-l de camundongo. Outros promotores conhe-cidos por controlarem a expressão de genes em células procarióticas ou eu-carióticas ou seus vírus também podem ser utilizados. Os promotores ade-quados para a expressão do polipeptídeo ou de fragmento do mesmo embactérias incluem os promotores Iac ou trp de E. coli, o promotor lacl, o pro-motor IacZ, o promotor 73, o promotor 77, o promotor gpt, o promotor Iamb-da Pr, o promotor Iambda Pl, os promotores de óperons que codificam en-zimas glicolíticas tal como a 3-fosfoglicerato quinase (PGK) e o promotor dafosfatase ácida. Os promotores de fungos incluem o promotor do fator a. Ospromotores eucarióticos incluem o promotor inicial imediato do CMV, o pro-motor da timidina quinase do HSV, os promotores de choque térmico, ospromotores do SV40 inicial e tardio, LTRs de retrovírus e o promotor da me-talotioneína-l de camundongo. Outros promotores conhecidos por controla-rem a expressão de genes em células procarióticas ou eucarióticas ou seusvírus também podem ser utilizados.
Promotores Vegetais Específicos ao Tecido
A invenção fornece cassetes de expressão que podem ser ex-pressos de uma maneira específica ao tecido, tais como aqueles que podemexpressar uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHGaldolase de acordo com a invenção de uma maneira específica ao tecido.
Em algumas modalidades, a invenção fornece ainda plantas ou sementesque expressam uma enzima aldolase, tal como piruvato aldolase, HMG e/ouKHG aldolase de acordo com a invenção de uma maneira específica ao teci-do. A especificidade ao tecido pode ser específica à semente, específica aocaule, específica à folha, específica à raiz, específica ao fruto e similares.
O termo "planta" inclui plantas inteiras, partes de plantas (taiscomo folhas, caules, flores, raízes etc.), protoplastos de plantas, sementes ecélulas vegetais e progênie da mesma. A classe de plantas que pode serutilizada no método de acordo com a invenção é geralmente tão amplaquanto a classe de plantas superiores sensível às técnicas de transforma-ção, incluindo angiospermas (plantas monocotiledôneas e dicotiledôneas),assim como gimnospermas. Esta inclui plantas de uma variedade de níveisde ploidia, incluindo estados poliplóides, diplóides, haplóides e hemizogotos.
Como utilizado aqui, o termo "planta transgênica" inclui plantas ou célulasvegetais nas quais uma seqüência de ácido nucléico heteróloga foi inserida,tal como os ácidos nucléicos e os vários constructos recombinantes (taiscomo cassetes de expressão) de acordo com a invenção.
Em algumas modalidades, um promotor constitutivo tal como opromotor 35S de CaMV pode ser utilizado pára a expressão em partes es-pecíficas da planta ou da semente ou ao longo de toda a planta. Por exem-pio, para a superexpressão, pode ser empregado um fragmento de promotorde planta que irá direcionar a expressão de um ácido nucléico em alguns ouem todos os tecidos de uma planta, tal como uma planta regenerada. Taispromotores são referidos aqui como promotores "constitutivos" e são ativossob a maior parte das condições ambientais e estágios do desenvolvimentoou diferenciação celular. Os exemplos de promotores constitutivos incluem aregião de início da transcrição 35S do vírus mosaico da couve-flor (CaMV), opromotor a 1' ou a 2' derivado do T-DNA de Agrobacterium tumefaciens eoutras regiões de início da transcrição de vários genes vegetais conhecidos'pelos peritos. Tais genes incluem, tal como ACT11 de Arabidopsis (Huang(1996) Plant Moi Biol. 33:125-139); Cat3 de Arabidopsis (GenBank No.U43147, Zhong (1996) Mol. Gen. Genet. 251:196-203); o gene que codifica aproteína dessaturase carreadora de estearoil-acila de Brassica napus (Gen-bank No. X74782, Solocombe (1994) Plant Physioi 104:1167-1176); GPcIdo milho (GenBank No. X15596; Martinez (1989) J. Moi Biol 208:551 -565); oGpc2 do milho (GenBank No. U45855, Manjunath (1997) Plant Moi Bioi33:97-112); promotores de plantas descritos nas Patentes U.S. N—4.962.028; 5.633.440.
A invenção utiliza promotores específicos ao tecido ou constituti-vos derivados de vírus que podem incluir, tal como o promotor subgenômicode tobamovírus (Kumagai (1995) Proc. Natl. Acad. Sei. USA 92:1679-1683; ovírus baciliforme tungro do arroz (RTBV), que se replica apenas em célulasdo floema em plantas de arroz infectadas, com seu promotor que controla aforte expressão do gene repórter específico ao floema; o promotor do vírusmosaico da nervura da mandioca (CVMV), com maior atividade em elemen-tos vasculares, nas células do mesófilo foliar e nas extremidades das raízes(Verdaguer (1996) Plant Mol. Biol. 31:1129-1139).
Em algumas modalidades, o promotor de planta direciona a ex-pressão do ácido nucléico que expressa a enzima aldolase, tal como piruva-to aldolase, tal como HMG e/ou KHG aldolase em um tipo de tecido, órgãoou célula específico (isto é, promotores específicos ao tecido) ou pode deoutra maneira estar sob um controle ambiental ou do desenvolvimento maispreciso ou sob o controle de um promotor que pode ser induzido. Os exem-plos de condições ambientais que podem afetar a transcrição incluem condi-ções anaeróbicas, temperatura elevada, a presença de luz ou aspersão comagentes químicos/hormônios. Por exemplo, a invenção incorpora o promotordo milho que pode ser induzido pela seca (Busk (1997) supra); o promotorda batata que pode ser induzido pelo frio, pela seca e por altas concentra-ções de sal (Kirch (1997) Plant Mol. Biol. 33:897 909).
Em algumas modalidades, os promotores específicos ao tecidopromovem a transcrição apenas dentro de um certo período de tempo deestágio do desenvolvimento dentro de tal tecido. Vide Blazquez (1998) PlantCell 10:791-800, caracterização do promotor do gene LEAFY de Arabidop-sis. Vide também Cardon (1997) PIantJ 12:367-77, que descreve o fator detranscrição SPL3, que reconhece um motivo de seqüência conservado naregião do promotor do gene AP1 de identidade do meristema floral de A. tha-liana·, e Mandei (1995) Plant Molecular Biology, Vol. 29, pp 995-1004, quedescreve o promotor elF4 de meristema. Os promotores específicos ao teci-do que são ativos ao longo de todo o ciclo de vida de um tecido particularpodem ser utilizados. Em algumas modalidades, os ácidos nucléicos de a-cordo com a invenção estão ligados de forma operacional a um promotorprimariamente ativo apenas em células de fibras de algodão. Em algumasmodalidades, os ácidos nucléicos de acordo com a invenção estão ligadosde forma operacional a um promotor ativo primariamente durante os estágiosde alongamento das células de fibra do algodão, tal como descrito por Rine-hart (1996) supra. Os ácidos nucléicos podem estar ligados de forma opera-cional ao promotor do gene Fbl2A para serem expressos preferencialmenteem células de fibra do algodão (Ibid). Vide também, John (1997) Proc. Natl.Acad. Sei. USA 89:5769-5773; John e outros, Patentes U.S. N- 5.608.148 e5.602.321, que descrevem promootres específicos à fibra de algodão e mé-todos para a construção de plantas de algodão transgênicas. Os promotoresespecíficos à raiz também podem ser utilizados para expressar os ácidosnucléicos de acordo com a invenção. Os exemplos de promotores específi-cos à raiz incluem o promotor do gene de álcool desidrogenase (DeLisIe(1990) Int. Rev. Cytol. 123:39-60). Outros promotores que podem ser utiliza-dos para a expressão dos ácidos nucléicos de acordo com a invenção inclu-em, tais como promotores específicos ao óvulo, específicos ao embrião, es-pecíficos ao endosperma, específicos ao integumento, específicos ao reves-timento de semente ou alguma combinação dos mesmos; um promotor es-pecífico à folha (vide Busk (1997) Plant J. 11:1285 1295, que descreve umpromotor específico à folha no milho); o promotor ORF13 de Agrobacteriumrhizogenes (que exibe alta atividade nas raízes, vide Hansen (1997) supra);um promotor específico ao pólen do milho (vide Guerrero (1990) Mol. Gen.Genet. 224:161 168); um promotor do tomate ativo durante o amadurecimen-to dos frutos, senescência e abscisão das folhas e, até uma extensão menor,de flores pode ser utilizado (vide Blume (1997) Plant J. 12:731 746); um pro-motor específico ao pistilo do gene SK2 da batata (vide Ficker (1997) PlantMol. Biol. 35:425 431); o gene Blec4 da ervilha, que é ativo no tecido da epi-derme de ápices de brotos vegetativos e florais de alfafa transgênica tornan-do-o uma ferramenta útil para direcionar a expressão de genes estranhospara a camada epidérmica de brotos ou fibras que crescem ativamente; ogene BEL1 específico ao óvulo (vide Reiser (1995) Cell 83:735-742, Gen-Bank No. U39944); e/ou o promotor em Klee, Patente U.S. N0 5.589.583,que descreve uma região promotora de planta que é capaz de conferir altosníveis de transcrição no tecido meristemático e/ou em células que se divi-dem rapidamente.
Em algumas modalidades, os promotores de plantas que podemser induzidos após a exposição a hormônios vegetais, tais como auxinas,são utilizados para expressar os ácidos nucléicos de acordo com a invenção.Por exemplo, a invenção pode utilizar o fragmento promotor E1 dos elemen-tos de resposta à auxina (AuxREs) na soja (Glicina max L.) (Liu (1997) PlantPhysiol. 115:397-407); o promotor GST6 de Arabidopsis que responde à au-xina (que também responde ao ácido salicílico e ao peróxido de hidrogênio)(Chen (1996) Plant J. 10: 955-966); o promotor parC que pode ser induzidopor auxina do tabaco (Sakai (1996) Piant Celi Physiol. 37:906-913); um ele-mento de resposta à biotina de planta (Streit (1997) Mol. Plant Microbe Inte-ract. 10:933-937); e, o promotor que responde ao hormônio de estresse áci-do abscísico (Sheen (1996) Science 274:1900-1902).
Os ácidos nucléicos de acordo com a invenção também podemestar ligados de forma operacional a promotores de planta que podem serinduzidos após a exposição a reagentes químicos que podem ser aplicadosna planta, tais como herbicidas ou antibióticos. Por exemplo, o promotorln2-2 do milho, ativado por agentes de segurança de herbicida benzenossul-fonamida, pode ser utilizado (De Veylder (1997) Plant Cell Physiol.38:568-577); a aplicação de agentes de segurança de herbicidas diferentesinduz padrões de expressão gênica distintos, incluindo a expressão na raiz,nos hidatódios e no meristema apical de brotos. A seqüência codificadorapode estar sob o controle de, tal como um promotor que pode ser induzidopor tetraciclina, tal como descrito com plantas de tabaco transgênicas con-tendo o gene da arginina descarboxilase de Avena sativa L. (aveia) (Mas-grau (1997) Plant J. 11:465-473); ou, um elemento de resposta ao ácido sa-licílico (Stange (1997) Plant J. 11:1315-1324). Utilizando promotores induzi-dos quimicamente (tal como por hormônio ou pesticida), isto é, promotor queresponde a um reagente químico que pode ser aplicado na planta transgêni-ca no campo, a expressão de um polipeptídeo de acordo com a invençãopode ser induzida em um estágio particular do desenvolvimento da planta.
Assim, a invenção fornece ainda plantas transgênicas que contêm um geneque pode ser induzido que codifica polipeptídeos de acordo com a invençãocuja faixa de hospedeiros é limitada às espécies vegetais-alvos, tais comomilho, arroz, cevada, soja, tomate, trigo, batata ou outras plantas de cultivo,que pode ser induzido em qualquer estágio de desenvolvimento da planta decultivo.
Um versado na técnica reconhecerá que um promotor de plantaespecífico ao tecido pode controlar a expressão de seqüências ligadas deforma operacional em tecidos sem ser o tecido-alvo. Assim, em algumasmodalidades, um promotor específico ao tecido é um que controla a expres-são preferencialmente no tecido ou no tipo de célula-alvo, mas também podelevar a alguma expressão em outros tecidos.
Os ácidos nucléicos de acordo com a invenção também podemestar ligados de forma operacional a promotores de plantas que podem serinduzidos após a exposição a reagentes químicos. Estes reagentes incluem,tais como herbicidas, auxinas sintéticas ou antibióticos que podem ser apli-cados, tal como borrifados, sobre as plantas transgênicas. A expressão quepode ser induzida dos ácidos nucléicos que produzem a enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com ainvenção permitirá que o cultivador selecione plantas com a expressão e/oua atividade ótima da enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase. Assim, o desenvolvimento de partes de plantaspode ser controlado. Desta maneira a invenção fornece os meios para facili-tar a colheita de plantas e de partes de plantas. Por exemplo, em várias mo-dalidades, o promotor ln2-2 do milho, ativado por agentes de segurança doherbicida benzenossulfonamida, é utilizado (De Veylder (1997) Plant CellPhysiol. 38:568-577); a aplicação de agentes de segurança de herbicidasdiferentes induz padrões de expressão gênica distintos, incluindo a expres-são na raiz, nos hidatódios e no meristema apical de brotos. As seqüênciascodificadoras de acordo com a invenção estão ainda sob o controle de umpromotor que pode ser induzido por tetraciclina, tal como descrito com plan-tas de tabaco transgênicas contendo o gene da arginina descarboxilase deAvena sativa L. (aveia) (Masgrau (1997) Plant J. 11:465-473); ou, um ele-mento que responde ao ácido salicílico (Stange (1997) Plant J.11:1315-1324).
Em algumas modalidades, a expressão apropriada do polipeptí-deo pode requerer uma região de poliadenilação na extremidade a 3' da re-gião codificadora. A região de poliadenilação pode ser derivada do gene na-tural, de uma variedade de outros genes vegetais (ou de animais ou outros)ou de genes no T-DNA de Agrobacteria.
Vetores de Expressão e Veículos de Clonagem
A invenção fornece vetores de expressão e veículos de clona-gem que compreendem os ácidos nucléicos de acordo com a invenção, taiscomo seqüências que codificam as enzimas aldolases, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção. Osvetores de expressão e os veículos de clonagem de acordo com a invençãopodem compreender partículas virais, baculovírus, fago, plasmídeos, fage-mídeos, cosmídeos, fosmídeos, cromossomos artificiais de bactéria, DNAviral (tal como vaccinia, adenovírus, foul pox vírus, pseudorraiva e derivadosde SV40), cromossomos artificiais baseados em P1, plasmídeos de levedu-ra, cromossomos artificiais de levedura e quaisquer outros vetores específi-cos para hospedeiros específicos de interesse (tais como bacilos, Aspergll-Ius e levedura). Os vetores de acordo com a invenção podem incluir seqüên-cias de DNA cromossômicas, não cromossômicas e sintéticas. Grandes nú-meros de vetores adequados são conhecidos pelos versados na técnica eestão disponíveis comercialmente. Os exemplos de vetores incluem: bacteri-anos: vetores pQE® (Qiagen, Valencia, CA), plasmídeos pBLUESCRIPT®,vetores pNH, vetores Iambda-ZAP (Stratagene, La Jolla, CA); vetores p-trc99a, pKK223-3, pDR540, pRIT2T (GE Healthcare, Piscataway, NJ), pET(Novagen, Madison, Wl); Eucarióticos: pXT1, pSG5 (Stratagene, La Jolla,CA), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). Entretanto, qualqueroutro plasmídeo ou outro vetor pode ser utilizado contanto que possam serreplicados e sejam viáveis no hospedeiro. Vetores com baixo número de có-pias ou com alto número de cópias podem ser empregados na presente in-venção. "Plasmídeos" podem ser disponíveis comercialmente, disponíveispublicamente em uma base irrestrita ou podem ser construídos partindo deplasmídeos disponíveis de acordo com procedimentos publicados. Os plas-mídeos equivalentes aos descritos aqui são conhecidos na técnica e serãoevidentes ao perito comum na técnica.
O vetor de expressão pode compreender um promotor, um sítiode ligação ao ribossomo para o início da tradução e um terminador da trans-crição. O vetor pode incluir ainda seqüências apropriadas para amplificar aexpressão. Os vetores de expressão de mamíferos podem compreenderuma origem de replicação, quaisquer sítios de ligação ao ribossomo neces-sários, um sítio de poliadenilação, sítios doadores e receptores de proces-samento, seqüências de término da transcrição e seqüências não transcritasflanqueadoras a 5'. Em algumas modalidades, as seqüências de DNA deri-vadas dos sítios de processamento e de poliadenilação de SV40 podem serutilizadas para fornecer os elementos genéticos não transcritos necessários.Em algumas modalidades, os vetores de expressão contêm umou mais genes marcadores que podem ser selecionados para permitir a se-leção de células hospedeiras que contêm o vetor. Tais marcadores que po-dem ser selecionados incluem genes que codificam dihidrofolato redutase ougenes que conferem resistência à neomicina para a cultura de células euca-rióticas, genes que conferem resistência à tetraciclina ou à ampicilina em E.colie o gene TRP1 de S. cerevisiae. As regiões promotoras podem ser sele-cionadas de qualquer gene desejado utilizando vetores com cloranfenicoltransferase (CAT) ou outros vetores com marcadores que podem ser sele-cionados.
Em algumas modalidades, os vetores para a expressão do poli-peptídeo ou de um fragmento do mesmo em células eucarióticas contêmintensificadores para aumentar os níveis de expressão. Os intensificadoressão elementos de DNA que atuam em eis que podem ter de aproximada-mente 10 até aproximadamente 300 pb de comprimento. Podem atuar sobreum promotor para aumentar sua transcrição. Os exemplos de intensificado-res incluem o intensificador de SV40 do lado tardio da origem de replicação100 até 270 pb, o intensificador do promotor inicial de citomegalovírus, o in-tensificador de polioma do lado tardio da origem de replicação e os intensifi-cadores de adenovírus.
Uma seqüência de ácido nucléico pode ser inserida dentro deum vetor através de vários procedimentos. Em geral, a seqüência é ligadana posição desejada no vetor após a digestão do inserto e do vetor com en-donucleases de restrição apropriadas. Alternativamente, as pontas cegastanto no inserto quanto no vetor podem ser ligadas. Uma variedade de técni-cas de clonagem é conhecida na literatura, tais como as descritas em Au-subel e outros Current Protocols in Molecular Biology, John Wiley & Sons,Inc. 1997 e Sambrook e outros, Molecular Cloning: A Laboratory Manual 2-Ed., Cold Spring Harbor Laboratory Press (1989). Tais procedimentos e ou-tros são considerados como estando dentro do âmbito dos versados na téc-nica.
O vetor pode estar na forma de uma plasmídeo, uma partículaviral ou um fago. Outros vetores incluem seqüências de DNA cromossômi-cas, não cromossômicas e sintéticas, derivados de SV40; plasmídeos bacte-rianos, DNA de fago, baculovírus, plasmídeos de levedura, vetores deriva-dos de combinações de plasmídeos ou DNA de fago, DNA viral tal comovaccinia, adenovírus, fowl pox vírus e pseudorraiva. Uma variedade de veto-res de clonagem e de expressão para uso com hospedeiros procarióticos eeucarióticos é descrita por, tal como Sambrook.
Os vetores bacterianos particulares que podem ser utilizadosincluem os plasmídeos disponíveis comercialmente que compreendem oselementos genéticos do vetor de clonagem bem-conhecido pBR322 (ATCC37017), pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Suécia), GEM1(Promega Biotec, Madison, Wl, USA) pQE70, pQE60, pQE-9 (Qiagen, Va-lencia, CA), pD10, psiX174 pBLUESCRIPT Il KS, pNH8A, pNH16a, pNH18A,pNH46A (Stratagene, La Jolla, CA), ptrc99a, pKK223-3, pKK233-3, DR540,pRIT5 (Pharmacia), pKK232-8, pET (Novagen, Madison, Wl) e pCM7. Osvetores eucarióticos particulares incluem pSV2CAT, pOG44, pXT1, pSG (S-tratagene, La Jolla, CA) pSVK3, pBPV, pMSG e pSVL (Pharmacia). Entre-tanto, qualquer outro vetor pode ser utilizado contanto que possa ser repli-cado e viável na célula hospedeira.
Os ácidos nucléicos de acordo com a invenção podem ser ex-pressos em cassetes de expressão, vetores ou víruses e expressos de for-ma transitória ou estável em células vegetais e sementes. Um exemplo desistema de expressão transitória utiliza sistemas de expressão epissomal, talcomo o RNA viral do vírus mosaico da couve-flor (CaMV) gerado no núcleoatravés da transcrição de um minicromossomo epissomal contendo DNAsuperenrolado, vide Covey (1990) Proc. Natl. Acad. Sei. USA 87:1633-1637.Alternativamente, as seqüências codificadoras, isto é, todas ou subfragmen-tos de seqüências de acordo com a invenção podem ser inseridos dentro dogenoma da célula vegetal hospedeira se tornando uma parte integral doDNA cromossômico do hospedeiro. Os produtos da transcrição sentido ouanti-sentido podem ser expressos dessa maneira. Um vetor que compreendeas seqüências (tais como promotores ou regiões codificadoras) dos ácidosnucléicos de acordo com a invenção pode compreender um gene marcadorque confere um fenótipo que pode ser selecionado em uma célula vegetal ouuma semente. Por exemplo, o marcador pode codificar resistência a biocida,tal como resistência a antibiótico, tal como resistência à canamicina, a G418,à bleomicina, à higromicina ou resistência a herbicida, tal como resistência aclorossulfurona ou Basta.
Os vetores de expressão capazes de expressar ácidos nucléicose proteínas em plantas são bem-conhecidos na técnica e podem incluir, taiscomo vetores de Agrobacterium spp., vírus X da batata (vide Angell (1997)EMBO J. 16:3675-3684), vírus mosaico do tabaco (vide Casper (1996) Gene173:69-73), vírus de enfezamento vermelho do tomate (vide Hillman (1989)Virology 169:42-50), vírus "etch" do tabaco (vide Dolja (1997) Virology234:243-252), vírus mosaico dourado do feijão (vide Morinaga (1993) Micro-biol Immunol. 37:471-476), vírus mosaico da couve-flor (vide Cecchini (1997)Mol. Plant Microbe Interact. 10:1094-1101), elemento que pode sofrer trans-posição Ac/Ds do milho (vide Rubin (1997) Mol. Cell. Biol. 17:6294-6302;Kunze (1996) Curr. Top. Microbiol. Immunol. 204:161-194) e o elemento quepode sofrer transposição agente de mutação supressor do milho (Spm) (videSchlappi (1996) Plant Mol. Biol. 32:717-725); e derivados dos mesmos.
Em algumas modalidades, o vetor de expressão pode ter doissistemas de replicação para permitir que seja mantido em dois organismos,por exemplo, em células de mamífero ou de inseto para a expressão e emum hospedeiro procariótico para clonagem e amplificação. Além disso, paraos vetores de expressão de integração, o vetor de expressão pode conterpelo menos uma seqüência homóloga ao genoma da célula hospedeira. Po-de conter duas seqüências homólogas que flanqueiam o constructo de ex-pressão. O vetor de integração pode ser direcionado para um lócus específi-co na célula hospedeira através da seleção da seqüência homóloga apropri-ada para inclusão no vetor. Os constructos para os vetores de integraçãosão bem-conhecidos na técnica.
Os vetores de expressão de acordo com a invenção podem in-cluir ainda um gene marcador que pode ser selecionado para permitir a se-leção de cepas bacterianas que foram transformadas, tais como genes quetornam as bactérias resistentes a fármacos tais como ampicilina, cloranfeni-col, eritromicina, canamicina, neomicina e tetraciclina. Os marcadores quepodem ser selecionados também podem incluir genes biossintéticos, taiscomo aqueles nas vias biossintéticas de histidina, triptofano e leucina.
A seqüência de DNA no vetor de expressão está ligada de formaoperacional a seqüência(s) de controle da expressão apropriada(s) (promo-tor) para direcionar a síntese de RNA. Os promotores bacterianos citadosem particular incluem lacl, IacZ, T3, T7, gpt, Iambda Pr, Pl e trp. Os promo-tores eucarióticos incluem o inicial imediato de CMV, da timidina quinase doHSV, o SV40 inicial e tardio, LTRs de retrovírus e metalotioneína-l de ca-mundongo. A seleção do vetor e do promotor apropriados está bem dentrodo nível de um perito comum na técnica. O vetor de expressão contém aindaum sítio de ligação ao ribossomo para o início da tradução e um terminadorda transcrição. O vetor também pode incluir seqüências apropriadas para aamplificação da expressão. As regiões promotoras podem ser selecionadasde qualquer gene desejado utilizando vetores com cloranfenicol transferase(CAT) ou outros vetores com marcadores que podem ser selecionados. Emadição, os vetores de expressão em algumas modalidades contêm um oumais genes marcadores que podem ser selecionados para fornecer uma ca-racterística fenotípica para a seleção de células hospedeiras transformadastal como dihidrofolato redutase ou resistência à neomicina para a cultura decélulas eucarióticas ou tal como resistência à tetraciclina ou à ampicilina emE. coli.
Os vetores de expressão de mamífero também podem compre-ender uma origem de replicação, quando necessário sítios de ligação ao ri-bossomo, um sítio de poliadenilação, sítios doadores e receptores de pro-cessamento, seqüências de término da transcrição e seqüências não trans-critas flanqueadoras a 5'. Em algumas modalidades, as seqüências de DNAderivadas dos sítios de processamento e de poliadenilação de SV40 podemser utilizadas para fornecer os elementos genéticos não transcritos necessários.Os vetores para a expressão do polipeptídeo ou de um fragmen-to do mesmo em células eucarióticas também podem conter intensificadorespara aumentar os níveis de expressão. Os intensificadores são elementos deDNA que atuam em eis, geralmente com aproximadamente 10 até aproxi-madamente 300 pb de comprimento que atuam sobre um promotor paraaumentar a sua transcrição. Os exemplos incluem o intensificador de SV40do lado tardio da origem de replicação 100 até 270 pb, o intensificador dopromotor inicial de citomegalovírus, o intensificador de polioma do lado tardioda origem de replicação e os intensificadores de adenovírus.
Em adição, os vetores de expressão podem conter um ou maisgenes marcadores que podem ser selecionados para permitir a seleção decélulas hospedeiras contendo o vetor. Tais marcadores que podem ser sele-cionados incluem genes que codificam dihidrofolato redutase ou genes queconferem resistência à neomicina para cultura de células eucarióticas, genesque conferem resistência à tetraciclina ou à ampicilina em E. coli e o geneTRP1 de S. cerevisiae.
Em algumas modalidades, o ácido nucléico que codifica um dospolipeptídeos de acordo com a invenção e as seqüências substancialmenteidênticas ao mesmo ou fragmentos que compreendem pelo menos aproxi-madamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 ou mais amino-ácidos consecutivos do mesmo é montado na fase apropriada com uma se-qüência líder capaz de direcionar a secreção do polipeptídeo traduzido ou deum fragmento do mesmo. Em algumas modalidades, o ácido nucléico podecodificar um polipeptídeo de fusão em que um dos polipeptídeos de acordocom a invenção ou fragmentos que compreendem pelo menos 5, 10, 15, 20,25, 30, 35, 40, 50, 75, 100 ou 150 ou mais aminoácidos consecutivos domesmo é fundido a peptídeos ou polipeptídeos heterólogos, tais como peptí-deos com identificação N-terminal que conferem características desejadas,tal como maior estabilidade ou purificação simplificada.
A seqüência de DNA apropriada pode ser inserida dentro do ve-tor através de uma variedade de procedimentos. Em geral, a seqüência deDNA é ligada na posição desejada no vetor após a digestão do inserto e dovetor com endonucleases de restrição apropriadas. Alternativamente, as ex-tremidades cegas tanto no inserto quanto no vetor podem ser ligadas. Umavariedade de técnicas de clonagem é descrita em Ausubel e outros CurrentProtocols in Molecular Biology, John Wiley & Sons, Inc. 1997 e Sambrook eoutros, Molecular Cloning: A Laboratory Manual 2- Ed., Cold Spring HarborLaboratory Press (1989). Tais procedimentos e outros são considerados co-mo estando dentro do âmbito dos versados na técnica.
O vetor pode, por exemplo, estar na forma de um plasmídeo, deuma partícula viral ou de um fago. Outros vetores incluem seqüências deDNA cromossômicas, não cromossômicas e sintéticas, derivados de SV40;plasmídeos bacterianos, DNA de fago, baculovírus, plasmídeos de levedura,vetores derivados de combinações de plasmídeos e DNA de fago, DNA viraltal como vaccinia, adenovírus, fowl pox vírus e pseudorraiva. Uma variedadede vetores de clonagem e de expressão para uso com hospedeiros procarió-ticos e eucarióticos é descrita por Sambrook e outros, Molecular Cloning: ALaboratory Manual, 2- Ed., Cold Spring Harbor, N.Y., (1989).
Células Hospedeiras e Células Transformadas
A invenção fornece ainda células transformadas que compreen-dem seqüências de ácidos nucléicos de acordo com a invenção, tais comoas seqüências que codificam enzimas aldolases, tais como piruvato aldola-ses, HMG e/ou KHG aldolase de acordo com a invenção ou vetores de acor-do com a invenção. A célula hospedeira pode ser qualquer uma das célulashospedeiras familiares ao versado na técnica, incluindo células procarióticas,células eucarióticas, tais como células bacterianas, células de fungo, célulasde levedura, células de mamífero, células de inseto ou células vegetais. Osexemplos de células bacterianas incluem quaisquer espécies de Streptomy-ces, Staphylococcus, Pseudomonas ou Bacillus, incluindo E. coli, Bacillussubtilis, Pseudomonas fluorescens, Bacillus cereus ou Salmonella typhimuri-um. Os exemplos de células de fungo incluem quaisquer espécies de Asper-gillus. Os exemplos de células de levedura incluem quaisquer espécies dePichia, Saccharomyces, Schizosaccharomyces ou Schwanniomyces1 inclu-indo Piehia pastoris, Saccharomyces cerevisiae ou Schizosaccharomycespombe. Os exemplos de células de inseto incluem quaisquer espécies deSpodoptera ou Drosophila, incluindo Drosophila S2 e Spodoptera Sf9. Osexemplos de células de animais incluem CHO, COS ou Bowes melanoma ouqualquer linhagem de células de camundongo ou humana. A seleção de umhospedeiro apropriado está dentro das habilidades daqui versados na técni-ca. As técnicas para transformação de uma ampla variedade de especies deplantas superiores são bem-conhecidas e descritas na literatura técnica ecientífica. Vide Weising (1988) Ann. Rev. Genet. 22:421-477; Patente U.S.N0 5.750.870.
O vetor pode ser introduzido nas células hospedeiras utilizandoqualquer uma de uma variedade de técnicas, incluindo transformação, trans-fecção, transdução, infecção viral, pistolas de genes ou transferência de ge-nes mediada por Ti. Os métodos particulares incluem transfecção com fosfa-to de cálcio, transfecção mediada por DEAE-Dextrano1 lipofecção ou eletro-poração (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Bio-logy, (1986)).
Em algumas modalidades, os ácidos nucléicos ou os vetores deacordo com a invenção são introduzidos nas células para seleção, assim, osácidos nucléicos entram nas células de uma maneira adequada para a ex-pressão subseqüente do ácido nucléico. O método de introdução é determi-nado em grande parte pelo tipo de célula-alvo. Os exemplos de métodosincluem precipitação com CaPO4, fusão de lipossomos, lipofecção (tal comoLIPOFECTIN®), eletroporação, infecção viral etc. Os ácidos nucléicos candi-datos podem se integrar de forma estável no genoma da célula hospedeira(por exemplo, com introdução retroviral) ou podem existir de forma transitóriaou estável no citoplasma (isto é, através do uso de plasmídeos tradicionais,utilizando seqüências reguladoras padronizadas, marcadores de seleçãoetc.). Como muitas seleções farmaceuticamente importantes requerem alvosde células humanas ou de mamífero de modelo, podem ser utilizados veto-res retrovirais capazes de transfectar tais alvos.
Quando apropriado, células hospedeiras engenheiradas podemser cultivadas em meios nutricionais convencionais modificados quando a-propriado para a ativação de promotores, para a seleção de transformantesou para a amplificação dos genes de acordo com a invenção. Após a trans-formação de uma cepa hospedeira adequada e o cultivo da cepa hospedeiraaté uma densidade de células apropriada, o promotor selecionado pode serinduzido através de meios apropriados (tal como alteração na temperaturaou indução química) e as células podem ser cultivadas durante um períodoadicional para permitir que estas produzam o polipeptídeo desejado oufragmento do mesmo.
As células podem ser coletadas por centrifugação, rompidas a -través de meios físicos ou químicos e o extrato bruto resultante é mantidopara purificação adicional. As células microbianas empregadas para a ex-pressão de proteínas podem ser rompidas através de qualquer método con-veniente, incluindo ciclos de congelamento-descongelamento, ultra-som,rompimento mecânico ou o uso de agentes de Iise celular. Tais métodos sãobem-conhecidos para aqueles versados na técnica. O polipeptídeo expressoou fragmento do mesmo pode ser recuperado e purificado partindo de cultu-ras de células recombinantes através de métodos que incluem precipitaçãocom sulfato de amônio ou com etanol, extração ácida, cromatografia de trocaaniônica ou catiônica, cromatografia em fosfocelulose, cromatografia de inte-ração hidrofóbica, cromatografia por afinidade, cromatografia em hidroxilapa-tita e cromatografia em lectina. As etapas de redobramento de proteínas po-dem ser utilizadas, quando necessário, para completar a configuração dopolipeptídeo. Se desejado, a cromatografia líquida de alto desempenho (H-PLC) pode ser empregada para as etapas de purificação final.
Os constructos nas células hospedeiras podem ser utilizados deuma maneira convencional para produzir o produto gênico codificado pelaseqüência recombinante. Dependendo do hospedeiro empregado em umprocedimento de produção recombinante, os polipeptídeos produzidos pelascélulas hospedeiras contendo o vetor podem ser glicosilados ou podem sernão-glicosilados. Os polipeptídeos de acordo com a invenção podem ou nãoincluir também um resíduo de aminoácido metionina inicial.
Os sistemas de tradução isentos de células também podem serempregados para produzir um polipeptídeo de acordo com a invenção. Ossistemas de tradução isento de células podem utilizar mRNAs transcritospartindo de um constructo de DNA que compreende um promotor ligado deforma operacional a um ácido nucléico que codifica o polipeptídeo ou umfragmento do mesmo. Em algumas modalidades, o constructo de DNA podeser Iinearizado antes da realização de uma reação de transcrição in vitro. OmRNA transcrito é então incubado com um extrato de tradução isenta decélulas apropriado, tal como um extrato de reticulócitos de coelho, para pro-duzir o polipeptídeo desejado ou um fragmento do mesmo.
Os vetores de expressão podem conter um ou mais genes mar-cadores que podem ser selecionados para fornecer uma característica feno-típica para a seleção de células hospedeiras transformadas tal como dihidro-folato redutase ou resistência à neomicina para a cultura de células eucarió-ticas ou tal como resistência à tetraciclina ou à ampicilina em E. coli.
As células hospedeiras que contêm os polinucleotídeos de inte-resse, tais como os ácidos nucléicos de acordo com a invenção, podem sercultivadas em meios nutricionais convencionais quando apropriado para aativação de promotores, para a seleção de transformantes ou para a amplifi-cação de genes. As condições de cultura, tais como temperatura, pH e simi-lar, são aquelas utilizadas previamente com a célula hospedeira selecionadapara a expressão e serão evidentes àqueles versados na técnica. Os clonesque são identificados como possuindo a atividade enzimática especificadapodem então ser seqüenciados para identificar a seqüência de polinucleotí-deo que codifica uma enzima que possui a atividade aumentada.
A invenção fornece métodos para a superexpressão de enzimasaldolases recombinantes, tais como piruvato aldolases, tal como HMG e/ouKHG aldolase em células que compreendem a expressão de um vetor quecompreende um ácido nucléico de acordo com a invenção, tal como um áci-do nucléico que compreende uma seqüência de ácido nucléico com pelomenos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%,58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%,71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%,84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%,97%, 98%, 99% ou mais identidade de seqüência com uma seqüência deacordo com a invenção ao longo de uma região de pelo menos aproxima-damente 100 resíduos, em que as identidades de seqüência são determina-das através da análise com um algoritmo de comparação de seqüências ouatravés de inspeção visual ou um ácido nucléico que se hibridiza sob condi-ções rigorosas a uma seqüência de ácido nucléico de acordo com a inven-ção ou a uma subseqüência da mesma. A superexpressão pode ser realiza-da através de quaisquer meios, tal como o uso de um promotor de alta ativi-dade, um vetor dicistrônico ou através da amplificação gênica do vetor.
Os ácidos nucléicos de acordo com a invenção podem ser ex-pressos ou superexpressos, em qualquer sistema de expressão in vitro ou invivo. Quaisquer sistemas de cultura de células podem ser empregados paraexpressar ou superexpressar, uma proteína recombinante, incluindo culturasbacterianas, de inseto, de levedura, de fungo ou de mamífero. A superex-pressão pode ser realizada através da escolha apropriada de promotores,intensificadores, vetores (tal como o uso de vetores de replicon, vetores di-cistrônicos (vide Gurtu (1996) Biochem. Biophys. Res. Commun. 229:295-8),meios, sistemas de cultura e similares. Em algumas modalidades, a amplifi-cação gênica utilizando marcadores de seleção, tal como glutamina sinteta-se (vide Sanders (1987) Dev. Biol. Stand. 66:55-63), em sistemas de célulasé utilizada para superexpressar os polipeptídeos de acordo com a invenção.
Os detalhes adicionais em relação a esta abordagem estão naliteratura pública e/ou são conhecidos àqueles versados na técnica. Em umexemplo não-limitante particular, tal literatura disponível publicamente incluia EP 0659215 (WO 9403612 A1) (Nevalainen e outros); Lapidot, A., Me-chaly, A., Shoham, Y., Overexpression and single-step purification of athermostable xylanase from Bacillus stearothermophilus T-6", J. Biotechnol.Nov 51:259-64 (1996); Lüthi, E., Jasmat, N.B., Bergquist, P.L., "Xylanasefrom the extremely thermophilic bacterium Caldocellum saccharolyticum: o-verexpression of the gene in Escherichia coli and characterization of the ge-ne product", Appl. Environ. Microbiol. Setembro 56:2677-83 (1990); e Sung,W.L., Luk, C.K., Zahab1 D.M., Wakarchuk, W., "Overexpression of the Bacil-Ius subtilis and circulans xylanases in Escherichia coli", Protein Expr. Purif.Jun 4:200-6 (1993), embora estas referências não ensinem as enzimas dainvenção do presente pedido de patente.
A célula hospedeira pode ser qualquer uma das células hospe-deiras familiares àqueles versados na técnica, incluindo células procarióti-cas, células eucarióticas, células de mamífero, células de inseto ou célulasvegetais. Como exemplos representativos de hospedeiros apropriados, po-dem ser mencionados: células bacterianas, tais como de E. coli, Streptomy-ces, Bacillus subtilis, Bacillus cereus, Salmonella typhimurium e várias espé-cies dentro dos gêneros Pseudomonas, Streptomyces e Staphylococcus,células de fungo, tais como de Aspergillus, de levedura tal como qualquerespécie de Pichia, Saccharomyces, Schizosaccharomyces, Schwanniomy-ces, incluindo Pichia pastoris, Saccharomyces cerevisiae ou Schizosaccha-romyces pombe, células de inseto tais como Drosophila S2 e SpodopteraSf9, células de animais tal como CHO, COS ou Bowes melanoma e adenovi-ruses. A seleção de um hospedeiro apropriado está dentro das capacidadesdos versados na técnica.
O vetor pode ser introduzido nas células hospedeiras utilizandoqualquer uma de uma variedade de técnicas, incluindo transformação, trans-fecção, transdução, infecção viral, pistolas gênicas ou transferência gênicamediada por Ti. Os métodos particulares incluem transfecção com fosfato decálcio, transfecção mediada por DEAE-Dextrano, lipofecção ou eletropora-ção (Davis, L., Dibner1 M., Battey, I., Basic Methods in Molecular Biology,(1986)).
Quando apropriado, as células hospedeiras engenheiradas po-dem ser cultivadas em meios nutricionais convencionais modificados quandoapropriado para a ativação de promotores, para a seleção de transformantesou para a amplificação dos genes de acordo com a invenção. Após a trans-formação de uma cepa hospedeira adequada e o cultivo da cepa hospedeiraaté uma densidade de células apropriada, o promotor selecionado pode serinduzido através de meios apropriados (tal como alteração da temperaturaou indução química) e as células podem ser cultivadas durante um períodoadicional para permitir que estas produzam o polipeptídeo desejado ou umfragmento do mesmo.
As células podem ser coletadas por centrifugação, rompidas a-través de meios físicos ou químicos e o extrato bruto resultante é mantidopara purificação adicional. As células microbianas empregadas para a ex-pressão de proteínas podem ser rompidas através de qualquer método con-veniente, incluindo ciclos de congelamento-descongelamento, ultra-som,rompimento mecânico ou uso de agentes de Iise celular. Tais métodos sãobem-conhecidos pelos versados na técnica. O polipeptídeo expresso ou umfragmento do mesmo pode ser recuperado e purificado partindo de culturasde células recombinantes através de métodos que incluem precipitação comsulfato de amônio ou com etanol, extração ácida, cromatografia de troca ani-ônica ou catiônica, cromatografia em fosfocelulose, cromatografia com inte-ração hidrofóbica, cromatografia por afinidade, cromatografia em hidroxilapa-tita e cromatografia em lectina. As etapas de redobramento das proteínaspodem ser utilizadas, quando necessário, para completar a configuração dopolipeptídeo. Se desejado, a cromatografia líquida de alto desempenho (H-PLC) pode ser empregada para as etapas de purificação final.
Vários sistemas de culturas de células de mamífero também po-dem ser empregados para expressar a proteína recombinante. Os exemplosde sistemas de expressão de mamífero incluem as linhagens COS-7 de fi-broblastos de rins de macaco (descritas por Gluzman, Cell1 23:175, 1981) eoutras linhagens de células capazes de expressar proteínas partindo de umvetor compatível, tais como as linhagens de células C127, 3T3, CHO, HeLae BHK.
Os constructos nas células hospedeiras podem ser utilizados deuma maneira convencional para produzir o produto gênico codificado pelaseqüência recombinante. Dependendo do hospedeiro empregado em umprocedimento de produção recombinante, os polipeptídeos produzidos pelascélulas hospedeiras contendo o vetor podem ser glicosilados ou podem sernão-glicosilados. Os polipeptídeos de acordo com a invenção podem ou nãoincluir ainda um resíduo de aminoácido metionina inicial.
Alternativamente, os polipeptídeos de acordo com a invenção oufragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50,75, 100 ou 150 ou mais aminoácidos consecutivos dos mesmos podem serproduzidos de forma sintética através de sintetizadores convencionais depeptídeos, tais como os discutidos abaixo. Em outras modalidades, os frag-mentos ou as partes dos polipeptídeos podem ser empregadas para a pro-dução do polipeptídeo de comprimento completo correspondente através dasíntese peptídica; portanto, os fragmentos podem ser empregados comointermediários para a produção dos polipeptídeos de comprimento completo.
Os sistemas de tradução isentos de células também podem serempregados para a produção de um dos polipeptídeos de acordo com a in-venção ou dos fragmentos que compreendem pelo menos 5, 10, 15, 20, 25,30, 35, 40, 50, 75, 100 ou 150 ou mais aminoácidos consecutivos dos mes-mos utilizando mRNAs transcritos partindo de um constructo de DNA quecompreende um promotor ligado de forma operacional a um ácido nucléicoque codifica o polipeptídeo ou fragmento do mesmo. Em algumas modalida-des, o constructo de DNA pode ser Iinearizado antes da realização de umareação de transcrição in vitro. O mRNA transcrito é então incubado com umextrato de tradução isenta de células apropriado, tal como um extrato de re-ticulócitos de coelho, para a produção do polipeptídeo desejado ou de umfragmento do mesmo.
Amplificacão de Ácidos Nucléicos
Na prática da invenção, os ácidos nucléicos de acordo com ainvenção e os ácidos nucléicos que codificam as enzimas aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a inven-ção ou os ácidos nucléicos modificados de acordo com a invenção, podemser reproduzidos através de amplificação, tal como da PCR. A amplificaçãotambém pode ser utilizada para clonar ou modificar os ácidos nucléicos deacordo com a invenção. Assim, a invenção fornece pares de seqüências ini-ciadoras de amplificação para a amplificação dos ácidos nucléicos de acordocom a invenção. Um versado na técnica pode planejar os pares de seqüên-cias iniciadoras de amplificação para qualquer parte de ou para o compri-mento completo destas seqüências.
Em algumas modalidades, a invenção fornece ácidos nucléicosamplificados através de pares de iniciadores de amplificação de acordo coma invenção, tais como os pares de iniciadores que são apresentados por a-proximadamente os primeiros (a 5') 12,13, 14, 15, 16, 17, 18, 19, 20, 21, 22,23, 24 ou 25 ou mais resíduos de ácidos nucléicos de acordo com a inven-ção e aproximadamente os primeiros (a 5') 15, 16,17,18, 19, 20, 21, 22, 23,24 ou 25 ou mais resíduos dos filamentos complementares. Em algumasmodalidades, a invenção fornece pares de seqüências iniciadoras de ampli-ficação para a amplificação de um ácido nucléico que codifica um polipeptí-deo que possui uma atividade de enzima aldolase, tal como piruvato aldola-se, tal como HMG e/ou KHG aldolase, em que o par de iniciadores é capazde amplificar um ácido nucléico que compreende uma seqüência de acordocom a invenção ou fragmentos ou subseqüências do mesmo. Um ou cadamembro do par de seqüências iniciadoras de amplificação pode compreen-der um oligonucleotídeo que compreende pelo menos aproximadamente 10até 50 ou mais bases consecutivas da seqüência ou aproximadamente 12,13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 ou mais bases consecuti-vas da seqüência. Em algumas modalidades, a invenção fornece pares deiniciadores de amplificação, em que o par de iniciadores compreende umprimeiro membro que possui uma seqüência que é apresentada por aproxi-madamente os primeiros (a 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23,24 ou 25 ou mais resíduos de um ácido nucléico de acordo com a invençãoe um segundo membro que possui uma seqüência que é apresentada poraproximadamente os primeiros (a 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24 ou 25 ou mais resíduos do filamento complementar do primeiro membro.
A invenção fornece enzimas aldolase, tal como piruvato aldola-se, tal como HMG e/ou KHG aldolase geradas através de amplificação, talcomo através da reação em cadeia da polimerase (PCR), utilizando um parde iniciadores de amplificação de acordo com a invenção. Em algumas mo-dalidades, a invenção fornece métodos de produção de uma enzima aldola-se, tal como piruvato aldolase, HMG e/ou KHG aldolase através de amplifi-cação, tal como da PCR1 utilizando um par de iniciadores de amplificação deacordo com a invenção. Em algumas modalidades, o par de iniciadores deamplificação amplifica um ácido nucléico partindo de uma biblioteca, tal co-mo uma biblioteca gênica, tal como uma biblioteca ambiental.
As reações de amplificação também podem ser utilizadas paraquantificar a quantidade de ácido nucléico em uma amostra (tal como aquantidade de mensagem em uma amostra de células), marcar o ácido nu-cléico (tal como a aplicação do mesmo em um arranjo ou um "blot"), detectaro ácido nucléico ou quantificar a quantidade de um ácido nucléico específicoem uma amostra. Em algumas modalidades da invenção, a mensagem iso-lada de uma célula ou de uma biblioteca de cDNA é amplificada.
O versado na técnica pode selecionar e planejar iniciadores deamplificação de oligonucleotídeos adequados. Os métodos de amplificaçãotambém são bem-conhecidos na técnica e incluem, tais como a reação emcadeia da polimerase, PCR (vide PCR PROTOCOLS, A GUIDE TO ME-THODS AND APPLICATIONS, ed. Innis, Academic Press, N.Y. (1990) ePCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y., a reaçãoem cadeia da Iigase (LCR) (vide Wu (1989) Genomics 4:560; Landegren(1988) Science 241:1077; Barringer (1990) Gene 89:117); amplificação portranscrição (vide Kwoh (1989) Proc. Natl. Acad. Sei. USA 86:1173); e repli-cação de seqüência auto-sustentada (vide Guatelli (1990) Proc. Natl. Acad.Sei. USA 87:1874); amplificação pela Q Beta replicase (vide Smith (1997) J.Clin. Microbiol. 35:1477-1491), ensaio de amplificação pela Q-beta replicaseautomatizado (vide Burg (1996) Mol. Cell. Probes 10:257-271) e outras téc-nicas mediadas pela RNA polimerase (tal como NASBA, Cangene, Missis-sauga, Ontário); vide ainda Berger (1987) Methods Enzymol. 152:307-316;Ausubel e outros Current Protocols in Molecular Biology, John Wilay & Sons,Inc. 1997 e Sambrook e outros, Molecular Cloning: A Laboratory Manual 2-Ed., Cold Spring Harbor Laboratory Press (1989). Patentes U.S. N-4.683.195 e 4.683.202; Sooknanan (1995) Biotechnology 13:563-564.Determinação da Identidade de Seqüência em Ácidos Nucléicos e Polipeptídeos
A invenção fornece ácidos nucléicos que compreendem seqüên-cias que possuem pelo menos aproximadamente 50%, 51%, 52%, 53%,54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%,67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%,80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%,93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de seqüênciascompleta (100%) (homologia) a um ácido nucléico de acordo com a invenção(vide a Listagem de Seqüências) ao longo de uma região de pelo menos a-proximadamente 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550,600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250,1300, 1350, 1400, 1450, 1500, 1550 ou mais resíduos. Em algumas modali-dades, A presente invenção refere-se a polipeptídeos que compreendemseqüências que possuem pelo menos aproximadamente 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de se-qüências completa (100%) a um polipeptídeo de acordo com a invenção (vi-de a Listagem de Seqüências). A extensão da identidade de seqüências(homologia) pode ser determinada utilizando qualquer programa de compu-tador e parâmetros associados, incluindo os descritos aqui, tal como BLAST2.2.2. ou FASTA versão 3.0t78, com os parâmetros preestabelecidos.
As seqüências de ácidos nucléicos de acordo com a invençãopodem compreender pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150,200, 300, 400 ou 500 ou mais nucleotídeos consecutivos de uma seqüênciade acordo com a invenção e seqüências substancialmente idênticas àsmesmas. As seqüências homólogas e os fragmentos de seqüências de áci-dos nucléicos de acordo com a invenção podem se referir a uma seqüênciaque possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%,56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%,69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%,95%, 96%, 97%, 98%, 99% ou mais de identidade de seqüências (homologi-a) a estas seqüências. A homologia (identidade de seqüências) pode serdeterminada utilizando qualquer um dos programas de computador e parâ-metros descritos aqui, incluindo FASTA versão 3.0t78 com os parâmetrospredeterminados. As seqüências homólogas incluem ainda seqüências deRNA em que as uridinas substituem as timinas nas seqüências de ácidosnucléicos de acordo com a invenção. As seqüências homólogas podem serobtidas utilizando qualquer um dos procedimentos descritos aqui ou podemresultar da correção de um erro de seqüenciamento. Será considerado queas seqüências de ácidos nucléicos de acordo com a invenção podem serrepresentadas no formato de caracteres simples tradicional (vide a capa in-terna de Stryer, Lubert. Biochemistry, 3â Ed., W. H Freeman & Co., NovaIorque.) ou em qualquer outro formato que registre a identidade dos nucleo-tídeos em uma seqüência.
Em algumas modalidades, os programas de comparação de se-qüências identificados aqui são utilizados neste aspecto de acordo com ainvenção, isto é, para determinar se uma seqüência de ácido nucléico ou depolipeptídeo está dentro do âmbito de acordo com a invenção. Entretanto, asidentidades das seqüências de proteínas e/ou de ácidos nucléicos (homolo-gias) podem ser avaliadas utilizando qualquer algoritmo ou programa decomparação de seqüências conhecido na técnica. Tais algoritmos e progra-mas incluem, mas não estão limitados a TBLASTN, BLASTP, FASTA,TFASTA e CLUSTALW (vide Pearson e Lipman, Proc. Natl. Acad. Sei. USA85(8):2444-2448, 1988; Altschul e outros, J. Mol. Biol. 215(3):403-410, 1990;Thompson Nucleic Acids Res. 22(2):4673-4680, 1994; Higgins e outros, Me-thods Enzymol. 266:383-402, 1996; Altschul e outros, J. Mol. Biol.215(3):403-410, 1990; Altschul e outros, Nature Genetics 3:266-272,1993).
Em algumas modalidades, a homologia ou a identidade é medi-da utilizando um software de análise de seqüências (tal como Sequence A-nalysis Software Package of the Genetics Computer Group, University ofWisconsin Biotechnology Center, 1710 University Avenue1 Madison1 Wl53705). Tais software combinam seqüências similares através da atribuiçãode graus de homologia a várias deleções, substituições e outras modifica-ções. Em algumas modalidades, os termos "homologia" e "identidade" nocontexto de duas ou mais seqüências de ácidos nucléicos ou de polipeptí-deos, se referem a duas ou mais seqüências ou subseqüências que são asmesmas ou que possuem uma porcentagem especificada de resíduos deaminoácidos ou de nucleotídeos que são os mesmos quando comparados ealinhados para a correspondência máxima ao longo de uma janela de com-paração ou região determinada que é medida utilizando qualquer número dealgoritmos de comparação de seqüências ou através de alinhamento manuale inspeção visual. Em algumas modalidades, para a comparação de se-qüências, uma seqüência atua como uma seqüência de referência, a qual asseqüências de teste são comparadas. Quando é utilizado um algoritmo decomparação de seqüências, as seqüências de teste e de referência são in-seridas em um computador, as coordenadas das subseqüências são deter-minadas, se necessário e os parâmetros do programa de algoritmo de se-qüência são determinados. Os parâmetros do programa predeterminadospodem ser utilizados ou parâmetros alternativos podem ser determinados. Oalgoritmo de comparação de seqüências calcula então a porcentagem deidentidade de seqüências para as seqüências de teste em relação à seqüên-cia de referência, com base nos parâmetros do programa.
Uma "janela de comparação", como utilizado aqui, inclui referên-cia a um segmento de qualquer um do número de posições contíguas sele-cionadas do grupo que consiste em 20 até 600, geralmente aproximadamen-te 50 até aproximadamente 200, mas geralmente aproximadamente 100 atéaproximadamente 150 em que uma seqüência pode ser comparada comuma seqüência de referência do mesmo número de posições contíguas apósas duas seqüências serem alinhadas de forma ótima. Os métodos de ali-nhamento de seqüência para comparação são bem-conhecidos na técnica.
O alinhamento ótimo de seqüências para comparação pode ser realizado, talcomo através do algoritmo de homologia local de Smith & Waterman, Adv.Appl. Math. 2:482, 1981, através do algoritmo de alinhamento de homologiade Needleman & Wunsch, J. Mol. Biol 48:443, 1970, através do método debusca por similaridade de Person & Lipman, Proc. Nat1I. Acad. Sei. USA85:2444, 1988, através de implementações computarizadas destes algorit-mos (GAP, BESTFIT, FASTA e TFASTA no Wisconsin Genetics SoftwarePackage, Genetics Computer Group, 575 Science Dr., Madison, Wl) ou atra-vés de alinhamento manual e inspeção visual. Outros algoritmos para de-terminar a homologia ou a identidade incluem, por exemplo, em adição a umprograma BLAST (Basic Local Alignment Search Tool at the National Centerfor Biological Information), ALIGN, AMAS (Analysis of Multiply Aligned Se-quences), AMPS (Protein Multiple Sequence Alignment), ASSET (AlignedSegment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN (Bio-Iogical Sequence Comparative Analysis Node), BLIMPS (BLocks IMProvedSearcher), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W,CONSENSUS, LCONSENSUS, WCONSENSUS, algoritmo de Smith-Waterman, DARWIN, algoritmo de Las Vegas, FNAT (Forced Nucleotide A-lignment Tool), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Fris-tensky Sequence Analysis Package), GAP (Global Alignment Program), GE-NAL, GIBBS, GenQuest, ISSC (Sensitive Sequence Comparison), LALIGN(Local Sequence Alignment), LCP (Local Content Program), MACAW (Multi-ple Alignment Construction & Analysis Workbench), MAP (Multiple AlignmentProgram), MBLKP, MBLKN, PIMA (Pattern-Induced Multi-sequence Align-ment), SAGA (Sequence Alignment by Genetic Algorithm) e WHAT-IF. Taisprogramas de alinhamento também podem ser utilizados para buscas embancos de dados de genoma para identificar seqüências de polinucleotídeosque possuem seqüências substancialmente idênticas. Um número de ban-cos de dados de genoma está disponível, por exemplo, uma parte substan-cial do genoma humano está disponível como parte do Human Genome Se-quencing Project (Projeto de Seqüenciamento do Genoma Humano) (Gibbs,1995). Pelo menos vinte e um outros genomas já foram seqüenciados, inclu-indo, por exemplo, de M. genitalium (Fraser e outros, Science 270:397-403(1995)), M. jannaschii (Bult e outros, Science 23:1058-73 (1996)), H. influen-zae (Fleischmann e outros, Science 265:496-512 (1995)), E. coli (Blattner eoutros, Science 277:1453-74 (1997)) e levedura (S. cerevisiae) (Mewes eoutros, Nature 387:7-65 (1997)) e D. melanogaster (Adams e outros, Science287:2185-95 (2000)). Um progresso significativo também foi feito no seqüen-ciamento dos genomas de organismo modelo, tal como camundongo, C. e-Iegans e Arabadopsis sp. Vários bancos de dados contendo informação ge-nômica anotada com alguma informação funcional são mantidos por organi-zações diferentes e podem ser acessados através da internet.
Em algumas modalidades, são utilizados os algoritmos deBLAST e BLAST 2.0, que são descritos em Altschul e outros, Nuc. AcidsRes. 25:3389-3402, 1977 e Altschul e outros, J. Mol. Biol. 215:403-410,1990, respectivamente. O software para realizar as análises de BLAST estádisponível publicamente através do National Center for Bioteehnology Infor-mation. Este algoritmo envolve primeiro a identificação de pares de seqüên-cia de alto escore (HSPs) através da identificação de palavras curtas decomprimento W na seqüência de busca, que se combinam ou satisfazemalgum escore T de limiar com valor positivo quando alinhadas com uma pa-lavra do mesmo comprimento em uma seqüência do banco de dados. T éreferido como o limiar de escore da palavra da vizinhança (Altschul e outros,supra). Estas combinações iniciais das palavras da vizinhança atuam comoagentes iniciadores para começar as buscas para encontrar HSPs mais lon-gos contendo as mesmas. As combinações de palavras são estendidas emambas as direções ao longo de cada seqüência ao longo de o mais longe oescore de alinhamento cumulativo puder ser aumentado. Os escores cumu-Iativos são calculados utilizando, para as seqüências de nucleotídeos, osparâmetros M (escore de recompensa para um par de resíduos que combi-nam; sempre >0). Para as seqüências de aminoácidos, uma matriz de atribu-ição de escore é utilizada para calular o escore cumulativo. A extensão dascombinações de palavras em cada direção é interrompida quando: o escorede alinhamento diminui na quantidade X de seu valor máximo atingido; oescore cumulativo vai até zero ou abaixo, devido ao acúmulo de um ou maisalinhamentos de resíduos com escore negativo; ou o final de qualquer umadas seqüências é atingido. Os parâmetros W, T e X do algoritmo de BLASTdeterminam a sensibilidade e a velocidade do alinhamento. O programaBLASTN (para seqüências de nucleotídeos) utiliza como padrões um com-primento de palavra (W) de 11, uma expectativa (E) de 10, M=5, N=-4 e umacomparação de ambos os filamentos. Para as seqüências de aminoácidos, oprograma BLASTP utiliza como padrões um comprimento de palavara de 3 eexpectativas (E) de 10 e a matriz de obtenção de escore BLOSUM62 (videHenikoff & Henikoff, Proc. Natl. Acad. Sei. USA 89:10915, 1989) alinhamen-tos (B) de 50, expectativa (E) de 10, M=5, N= -4 e uma comparação de am-bos os filamentos.
O algoritmo de BLAST também realiza uma análise estatísticada similaridade entre duas seqüências (vide Karlin & Altschul, Proc. Natl.Acad. Sei. USA 90:5873, 1993). Uma medida da similaridade fornecida peloalgoritmo de BLAST é a menor probabilidade de soma (P(N))1 que forneceuma indicação da probabilidade através da qual uma combinação entre duasseqüências de nucleotídeos ou de aminoácidos ocorreria ao acaso. Por e-xemplo, um ácido nucléico é considerado similar a uma seqüência de refe-rência se a menor probabilidade de soma em uma comparação do ácido nu-cléico de teste com o ácido nucléico de referência for menor que aproxima-damente 0,2, em algumas modalidades menor que aproximadamente 0,01 eem outras modalidades menor que aproximadamente 0,001.
Em algumas modalidades, as homologias das seqüências deproteínas e de ácidos nucléicos são avaliadas utilizando a Basic Local A-Iignment Search Tool ("BLAST"). Em particular, cinco programas BLAST es-pecíficos são utilizados para realizar a tarefa a seguir:
(1) BLASTP e BLAST3 comparam uma seqüência de busca de aminoáci-dos contra um banco de dados de seqüências de proteínas;
(2) BLASTN compara uma seqüência de busca de nucleotídeos contra umbanco de dados de seqüências de nucleotídeos;
(3) BLASTX compara os produtos da tradução conceituai de seis quadrosde uma seqüência de nucleotídeos de busca (ambos os filamentos)contra um banco de dados de seqüências de proteínas;(4) TBLASTN compara uma seqüência de proteína de busca contra umbanco de dados de seqüências de nucleotídeos traduzidas em todos osseis quadros de leitura (ambos os filamentos); e
(5) TBLASTX compara as traduções nos seis quadros de uma seqüênciade busca de nucleotídeos contra as traduções nos seis quadros de umbanco de dados de seqüências de nucleotídeos.
Os programas BLAST identificam seqüências homólogas atravésda identificação de segmentos similares, que são referidos aqui como "paresde segmento com escore alto", entre uma seqüência de aminoácidos ou deácido nucléico de busca e uma seqüência de teste que é, em algumas mo-dalidades, obtida partindo de um banco de dados de seqüências de proteí-nas ou de ácidos nucléicos. Os pares de segmentos com escore alto são,em algumas modalidades, identificados (isto é, alinhados) através de umamatriz de obtenção de escore, muitas da qual são conhecidas na técnica.
Em algumas modalidades, a matriz de obtenção de escore é a matriz BLO-SUM62 (Gonnet (1992) Science 256:1443-1445; Henikoff e Henikoff (1993)Proteins 17:49-61). Menos em algumas modalidades, as matrizes PAM ouPAM250 também podem ser utilizadas (vide Schwartz e Dayhoff, eds., 1978,Matrices for Detecting Distance Relationships: Atlas of Protein Sequence andStructure, Washington: National Biomedical Research Foundation). Os pro-gramas BLAST podem ser acessados através da U.S. National Library ofMedicine.
Os parâmetros utilizados com os algoritmos anteriores podemser adaptados dependendo do comprimento da seqüência e do grau de ho-mologia estudado. Em algumas modalidades, os parâmetros podem ser pa-râmetros preestabelecidos utilizados pelos algoritmos na ausência de instru-ções do usuário.
Sistemas de Computador e Produtos de Programas de Computador
A invenção fornece computadores, sistemas de computador,meios que podem ser lidos pelo computador, produtos de programas decomputador e similares gravados ou armazenados nos mesmos as seqüên-cias de ácidos nucléicos e de polipeptídeos de acordo com a invenção. Adi-cionalmente, na prática dos métodos de acordo com a invenção, tal comopara determinar e identificar identidades de seqüências (para determinar seum ácido nucléico está dentro do âmbito de acordo com a invenção), homo-Iogias estruturais, motivos e similares in silico, uma seqüência de ácido nu-cléico ou de polipeptídeo de acordo com a invenção pode ser armazenada,gravada e manipulada em qualquer meio que possa ser lido e acessado porum computador.
Como utilizado aqui, as palavras "gravado" e "armazenado" sereferem a um processo para armazenar informação em um meio de compu-tador. Um versado na técnica pode facilmente adotar quaisquer métodosconhecidos para gravar informação em um meio que pode ser lido pelocomputador para gerar produtos que compreendem uma ou mais das se-qüências de ácidos nucléicos e/ou de polipeptídeos de acordo com a inven-ção. Como utilizado aqui, os termos "computador", "programa de computa-dor" e "processador" são utilizados em seus contextos gerais mais amplos eincorporam todos tais dispositivos, que são descritos em detalhes, abaixo.
Uma "seqüência codificadora de" ou uma "seqüência que codifica" um poli-peptídeo ou uma proteína particular, é uma seqüência de ácido nucléico queé transcrita e traduzida em um polipeptídeo ou uma proteína quando coloca-da sob o controle de seqüências reguladoras apropriadas.
Os polipeptídeos de acordo com a invenção incluem as seqüên-cias de acordo com a invenção e seqüências substancialmente idênticas àsmesmas e subseqüências e fragmentos enzimaticamente ativos de qualqueruma das seqüências anteriores. Em algumas modalidades, as seqüênciasde polipeptídeos substancialmente idênticas ou homólogas se referem auma seqüência de polipeptídeo que possui pelo menos 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de se-qüências completa (100%) (homologia) à seqüência de acordo com a invenção.A homologia (identidade de seqüência) pode ser determinadautilizando qualquer um dos programas de computador e parâmetros descri-tos aqui. Uma seqüência de ácido nucléico ou de polipeptídeo de acordocom a invenção pode ser armazenada, gravada e manipulada em qualquermeio que possa ser lido e acessado por um computador. Como utilizado a-qui, as palavras "gravado" e "armazenado" se referem a um processo paraarmazenar informação em um meio de computador. Um versado na técnicapode facilmente adotar qualquer um dos métodos conhecidos atualmentepara registrar informação em um meio que pode ser lido pelo computadorpara gerar produtos que compreendem uma ou mais das seqüências de áci-dos nucléicos de acordo com a invenção, uma ou mais das seqüências depolipeptídeos de acordo com a invenção. Uma outra modalidade da inven-ção é um meio que pode ser lido pelo computador que possui gravado nomesmo pelo menos 2, 5, 10, 15 ou 20 ou mais seqüências de ácidos nucléi-cos ou de polipeptídeos de acordo com a invenção.
Uma outra modalidade da invenção é um meio que pode ser lidopelo computador que possui gravada no mesmo uma ou mais das seqüên-cias de ácidos nucléicos de acordo com a invenção. Uma outra modalidadeda invenção é um meio que pode ser lido pelo computador que possui gra-vada no mesmo uma ou mais das seqüências de polipeptídeos de acordocom a invenção. Uma outra modalidade da invenção é um meio que podeser lido pelo computador que possui gravada no mesmo pelo menos 2, 5,10,15 ou 20 ou mais das seqüências de ácidos nucléicos ou de polipeptídeosque são apresentadas anteriormente.
Os meios que podem ser lidos pelo computador incluem meiosque podem ser lidos de forma magnética, meios que podem ser lidos deforma ótica, meios que podem ser lidos eletronicamente e meios magnéti-cos/ópticos. Por exemplo, os meios que podem ser lidos pelo computadorpodem ser um disco rígido, um disquete, uma fita magnética, CD-ROM, Digi-tal Versatile Disk (DVD), Random Access Memory (RAM) ou Read OnlyMemory (ROM) assim como outros tipos de outros meios conhecidos pelosversados na técnica.Algumas modalidades da invenção incluem sistemas (tais comosistemas com base na internet), tais como sistemas de computador que ar-mazenam e manipulam a informação das seqüências descritas aqui. Umexemplo de um sistema de computador 100 é ilustrado na forma de diagra-ma de blocos na figura 9. Como utilizado aqui, "um sistema de computador"refere-se aos componentes de hardware, aos componentes de software eaos componentes de armazenamento de dados utilizados para analisar umaseqüência de nucleotídeos de uma seqüência de ácido nucléico de acordocom a invenção ou de uma seqüência de polipeptídeo de acordo com a in-venção. Em algumas modalidades, o sistema de computador 100 inclui umprocessador para o processamento, para acessar e para manipular os dadosdas seqüências. O processador 105 pode ser qualquer tipo bem-conhecidode unidade de processamento central, tal como, por exemplo, o Pentium Illda Intel Corporation ou processador similar da Sun, Motorola, Compaq, AMDou International Business Machines.
Em algumas modalidades, o sistema de computador 100 é umsistema de finalidade geral que compreende o processador 105 e um oumais componentes de armazenamento de dados interno 110 para o armaze-namento de dados e um ou mais dispositivos de recuperação de dados pararecuperar os dados armazenados nos componentes de armazenamento dedados. Um versado na técnica pode considerar rapidamente que um dossistemas de computador disponíveis atualmente é adequado.
Em uma modalidade, o sistema de computador 100 inclui umprocessador 105 conectado a um bus (barramento) que é conectado a umamemória principal 115 (em uma modalidade, implementada como RAM) eum ou mais dispositivos de armazenamento de dados internos 110, tal comoum disco rígido e/ou outros meios que podem ser lidos pelo computador quepossuem dados gravados nos mesmos. Em algumas modalidades, o siste-ma de computador 100 inclui ainda um ou mais dispositivos de recuperaçãode dados 118 para a leitura dos dados armazenados nos dispositivos de ar-mazenamento de dados internos 110.
O dispositivo de recuperação de dados 118 pode representar,por exemplo, um drive de disquete, um drive de disco compacto, um drive defita magnética ou um modem capaz de se conectar com um sistema de ar-mazenamento de dados remoto (tal como através da internet) etc. Em algu-mas modalidades, o dispositivo de armazenamento de dados interno 110 éum meio removível que pode ser lido pelo computador tal como um disquete,um disco compacto, uma fita magnética etc. contendo controle lógico e/oudados gravados nos mesmos. O sistema de computador 100 pode incluirvantajosamente ou ser programado por um software apropriado para a leitu-ra do controle lógico e/ou dos dados partindo do componente de armazena-mento de dados uma vez que é inserido no dispositivo de recuperação de dados.
O sistema de computador 100 inclui um display (mostrador) 120que é utilizado para exibir os resultados a um usuário do computador. Deveser também citado que o sistema de computador 100 pode estar ligado aoutros sistemas de computador 125a-c em uma rede ou rede de área amplapara fornecer acesso centralizado ao sistema de computador 100.
O software para acessar e para processar as seqüências de nu-cleotídeos de uma seqüência de ácido nucléico de acordo com a invenção eseqüências substancialmente idênticas à mesma ou uma seqüência de poli-peptídeo de acordo com a invenção e seqüências substancialmente idênti-cas à mesma, (tais como ferramentas de busca, ferramentas de comparaçãoe ferramentas de modelagem etc.) podem ficar na memória principal 115durante a execução.
Em algumas modalidades, o sistema de computador 100 podecompreender ainda um algoritmo de comparação de seqüências para acomparação de uma seqüência de ácido nucléico de acordo com a invençãoe seqüências substancialmente idênticas à mesma ou uma seqüência depolipeptídeo de acordo com a invenção e seqüências substancialmente idên-ticas à mesma, armazenado em um meio que pode ser lido pelo computadorcom seqüência(s) de nucleotídeos ou de polipeptídeo(s) de referência arma-zenada) em um meio que pode ser lido pelo computador. Um "algoritmo decomparação de seqüências" refere-se a um ou mais programas que são im-plementados (de forma local ou remota) no sistema de computador 100 paracomparar uma seqüência de nucleotídeos com outras seqüências de nucleo-tídeos e/ou compostos armazenados dentro de um meio de armazenamentode dados. Por exemplo, o algoritmo de comparação de seqüências podecomparar as seqüências de nucleotídeos de uma seqüência de ácido nucléi-co de acordo com a invenção e seqüências substancialmente idênticas àmesma ou uma seqüência de polipeptídeo de acordo com a invenção e se-qüências substancialmente idênticas à mesma, armazenadas em um meioque pode ser lido pelo computador com seqüências de referência armaze-nadas em um meio que pode ser lido pelo computador para identificar homo-Iogias ou motivos estruturais.
A figura 10 é um diagrama de fluxo que ilustra uma modalidadede um processo 200 para a comparação de uma nova seqüência de nucleo-tídeos ou de proteína com um banco de dados de seqüências com a finali-dade de determinar os níveis de homologia entre a nova seqüência e as se-qüências no banco de dados. Os bancos de dados de seqüências podem serum banco de dados privado armazenado dentro do sistema de computador100 ou um banco de dados público tal como GENBANK que está disponívelatravés da Internet.
O processo 200 começa em um estado de início 201 e então semove para um estado 202 em que a nova seqüência que será comparada éarmazenada em uma memória em um sistema de computador 100. Comodiscutido anteriormente, a memória poderia ser qualquer tipo de memória,incluindo RAM ou um dispositivo de armazenamento interno.
O processo 200 então se move para um estado 204 em que umbanco de dados de seqüências é aberto para análise e comparação. O pro-cesso 200 então se move para um estado 206 em que a primeira seqüênciaarmazenada no banco de dados é lida em uma memória no computador.
Uma comparação é então realizada em um estado 210 para determinar se aprimeira seqüência é a mesma que a segunda seqüência. É importante ob-servar que esta etapa não está limitada à realização de uma comparaçãoexata entre a nova seqüência e a primeira seqüência no banco de dados.Métodos bem-conhecidos são conhecidos pelos versados na técnica para acomparação de duas seqüências de nucleotídeos ou de proteínas, mesmose não forem idênticas. Por exemplo, podem ser introduzidos espaços emuma seqüência para aumentar o nível de homologia entre as duas seqüên-cias testadas. Os parâmetros que controlam os espaços ou outras caracte-rísticas que são introduzidas em uma seqüência durante a comparação sãonormalmente inseridos pelo usuário do sistema de computador.
Uma vez que uma comparação das duas seqüências foi realiza-da no estado 210, é feita uma determinação em um estado de decisão 210se as duas seqüências forem as mesmas. Evidentemente, o termo "mesma"não está limitado às seqüências que são absolutamente idênticas. As se-qüências que estão dentro dos parâmetros de homologia inseridos pelo usu-ário serão marcadas como "as mesmas" no processo 200.
Se for feita uma determinação de que as duas seqüências sãoas mesmas, o processo 200 se move para um estado 214 em que o nomeda seqüência do banco de dados é exibido para o usuário. Este estado noti-fica o usuário que a seqüência com o nome exibido satisfaz às restrições dehomologia que foram inseridas. Uma vez que o nome da seqüência armaze-nada é exibido para o usuário, o processo 200 se move para um estado dedecisão 218 em que é feita uma determinação se há mais seqüências nobanco de dados. Se não houver mais seqüências no banco de dados, entãoo processo 200 termina em um estado final 220. Entretanto, se houver maisseqüências no banco de dados, então o processo 200 se move para um es-tado 224 em que um indicador é movido para a seqüência seguinte no bancode dados de forma que esta possa ser comparada com a nova seqüência.Desta maneira, a nova seqüência é alinhada e comparada com cada se-qüência no banco de dados.
Deve ser citado que se foi feita uma determinação no estado dedecisão 212 de que as seqüências não eram homólogas, então o processo200 se moveria imediatamente para o estado de decisão 218 com a finalida-de de determinar se quaisquer outras seqüências estavam disponíveis nobanco de dados para comparação.Conseqüentemente, uma modalidade da invenção é um sistemade computador que compreende um processador, um dispositivo de arma-zenamento de dados que possui armazenado no mesmo uma seqüência deácido nucléico de acordo com a invenção e seqüências substancialmenteidênticas à mesma ou uma seqüência de polipeptídeo de acordo com a in-venção e seqüências substancialmente idênticas à mesma, um dispositivode armazenamento de dados que possui armazenadas de forma que podeser recuperada no mesmo seqüências de nucleotídeos ou seqüências depolipeptídeos de referência que serão comparadas com uma seqüência deácido nucléico dé acordo com a invenção e seqüências substancialmenteidênticas à mesma ou uma seqüência de polipeptídeo de acordo com a in-venção e seqüências substancialmente idênticas à mesma e uma seqüênciade comparação para realizar a comparação. A seqüência de comparaçãopode indicar um nível de homologia entre as seqüências comparadas ou i-dentificar motivos estruturais no código do ácido nucléico descrito anterior-mente de uma seqüência de ácido nucléico de acordo com a invenção e se-qüências substancialmente idênticas à mesma ou uma seqüência de poli-peptídeo de acordo com a invenção e seqüências substancialmente idênti-cas à mesma ou pode identificar motivos estruturais nas seqüências que sãocomparadas com estes códigos de ácidos nucléicos e códigos de polipeptí-deos. Em algumas modalidades, o dispositivo de armazenamento de dadospode ter armazenado no mesmo as seqüências de pelo menos 2, 5, 10, 15,20, 25, 30 ou 40 ou mais das seqüências de ácidos nucléicos de acordo coma invenção e seqüências substancialmente idênticas às mesmas ou as se-qüências de polipeptídeos de acordo com a invenção e seqüências substan-cialmente idênticas às mesmas.
Uma outra modalidade da invenção é um método para determi-nar o nível de homologia entre uma seqüência de ácido nucléico de acordocom a invenção e seqüências substancialmente idênticas à mesma ou umaseqüência de polipeptídeo de acordo com a invenção e seqüências substan-cialmente idênticas à mesma e uma seqüência de nucleotídeos de referên-cia. O método inclui a leitura do código de ácido nucléico ou do código depolipeptídeo e a seqüência de nucleotídeos ou de polipeptídeo de referênciaatravés do uso de um programa de computador que determina os níveis dehomologia e que determina a homologia entre o código de ácido nucléico ouo código de polipeptídeo e a seqüência de nucleotídeos ou de polipeptídeode referência com o programa de computador. O programa de computadorpode ser qualquer um de um número de programas de computador para de-terminar os níveis de homologia, incluindo os enumerados especificamenteaqui, (tal como BLAST2N com os parâmetros preestabelecidos ou comquaisquer parâmetros modificados). O método pode ser implementado utili-zando os sistemas de computador descritos anteriormente. O método podetambém ser realizado através da leitura de pelo menos 2, 5, 10, 15, 20, 25,30 ou 40 ou mais das seqüências de ácidos nucléicos descritas anteriormen-te de acordo com a invenção e seqüências substancialmente idênticas àsmesmas ou as seqüências de polipeptídeos de acordo com a invenção eseqüências substancialmente idênticas às mesmas através do uso do pro-grama de computador e da determinação da homologia entre os códigos deácidos nucléicos ou dos códigos de polipeptídeos e seqüências de nucleotí-deos ou seqüências de polipeptídeos de referência.
A figura 11 é um diagrama de fluxo que ilustra uma modalidadede um processo 250 em um computador para determinar se duas seqüên-cias são homólogas. O processo 250 começa no estado de início 252 e en-tão se move para um estado 254 em que uma primeira seqüência que serácomparada é armazenada em uma memória. A segunda seqüência que serácomparada é então armazenada em uma memória em um estado 256. Oprocesso 250 então se move para um estado 260 em que o primeiro caracterna primeira seqüência é lido e então para um estado 262 em que o primeirocaracter da segunda seqüência é lido. Deve ser entendido que se a seqüên-cia for uma seqüência de nucleotídeos, então o caracter seria normalmenteA, T, C, G ou U. Se a seqüência for uma seqüência de proteína, então, emalgumas modalidades, está no código de aminoácido de uma única letra deforma que as primeira e segunda seqüências podem ser facilmente compa-radas.É feita uma determinação em um estado de decisão 264 se osdois caracteres são os mesmos. Se forem os mesmos, então o processo 250se move para um estado 268 em que os caracteres seguintes nas primeira esegunda seqüências são lidos. É então feita uma determinação se os carac-teres seguintes são os mesmos. Se forem, então o processo 250 continuaneste "loop" até que dois caracteres não sejam os mesmos. Se for feita umadeterminação de que os dois caracteres seguintes não são os mesmos, oprocesso 250 se move para um estado de decisão 274 para determinar sehá quaisquer mais caracteres em qualquer seqüência que será lida.
Se não houver quaisquer mais caracteres para serem lidos, en-tão o processo 250 se move para um estado 276 em que o nível de homolo-gia entre as primeira e segunda seqüências é exibido para o usuário. O nívelde homologia é determinado através do cálculo da proporção de caracteresentre as seqüências que eram as mesmas do número total de seqüências naprimeira seqüência. Assim, se cada caracter em uma primeira seqüência de100 nucleotídeos se alinhar a cada caracter em uma segunda seqüência, onível de homologia seria de 100%.
Alternativamente, o programa de computador pode ser um pro-grama de computador que compara as seqüências de nucleotídeos de umaseqüência de ácido nucléico que é apresentada na invenção, com uma oumais seqüências de nucleotídeos de referência com a finalidade de determi-nar se o código de ácido nucléico de acordo com a invenção e seqüênciassubstancialmente idênticas ao mesmo, diferem de uma seqüência de ácidonucléico de referência em uma ou mais posições. Opcionalmente tal pro-grama registra o comprimento e a identidade de nucleotídeos inseridos, de-Ietados ou substituídos em relação à seqüência do polinucleotídeo de refe-rência ou uma seqüência de ácido nucléico de acordo com a invenção e se-qüências substancialmente idênticas à mesma. Em algumas modalidades, oprograma de computador pode ser um programa que determina se uma se-qüência de ácido nucléico de acordo com a invenção e seqüências substan-cialmente idênticas à mesma, contêm um polimorfismo de um único nucleo-tídeo (SNP) em relação a uma seqüência de nucleotídeos de referência.Conseqüentemente, uma outra modalidade da invenção é ummétodo para determinar se uma seqüência de ácido nucléico de acordo coma invenção e seqüências substancialmente idênticas à mesma, diferem emum ou mais nucleotídeos de uma seqüência de nucleotídeos de referênciaque compreende as etapas de leitura do código do ácido nucléico e da se-qüência de nucleotídeos de referência através do uso de um programa decomputador que identifica diferenças entre seqüências de ácidos nucléicos ede identificação de diferenças entre o código do ácido nucléico e a seqüên-cia de nucleotídeos de referência com o programa de computador. Em al-gumas modalidades, o programa de computador é um programa que identifi-ca polimorfismos de um único nucleotídeo. O método pode ser implementa-do através dos sistemas de computador descritos anteriormente e do méto-do ilustrado na figura 11.0 método também pode ser realizado através daleitura de pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüênciasde ácidos nucléicos de acordo com a invenção e seqüências substancial-mente idênticas às mesmas e das seqüências de nucleotídeos de referênciaatravés do uso do programa de computador e da identificação de diferençasentre os códigos de ácidos nucléicos e as seqüências de nucleotídeos dereferência com o programa de computador.
Em outras modalidades, o sistema com baseado em computadorpode compreender ainda um identificador para identificar característicasdentro de uma seqüência de ácido nucléico de acordo com a invenção ouuma seqüência de polipeptídeo de acordo com a invenção e seqüênciassubstancialmente idênticas à mesma. Um "identificador" refere-se a um oumais programas que identificam certas características dentro de uma se-qüência de ácido nucléico de acordo com a invenção ou uma seqüência depolipeptídeo de acordo com a invenção. Em algumas modalidades, o identi-ficador pode compreender um programa que identifica um quadro aberto deleitura em uma seqüência de ácido nucléico de acordo com a invenção eseqüências substancialmente idênticas à mesma.
A figura 12 é um diagrama de fluxo que ilustra uma modalidadede um processo identificador 300 para a detecção da presença de uma ca-racterística em uma seqüência. O processo 300 começa no estado de início302 e então se move para um estado 304 em que uma primeira seqüênciaque será verificada em relação às características é armazenada em umamemória 115 no sistema de computador 100. O processo 300 então se mo-ve para um estado 306 em que um banco de dados de características deseqüência é aberto. Tal banco de dados incluiria uma lista de atributos decada característica junto com o nome da característica. Por exemplo, umnome de característica poderia ser "Códon de Início" e o atributo seria"ATG". Um outro exemplo seria o nome da característica "TAATAA Box" e oatributo da característica seria "TAATAA". Um exemplo de tal banco de da-dos é produzido pelo University of Wisconsin Genetics Computer Group. Al-ternativamente, as características podem ser motivos de polipeptídeos estru-turais tais como alfa hélices, folhas beta ou motivos de polipeptídeos funcio-nais tais como sítios ativos enzimáticos, motivos hélice-volta-hélice ou outrosmotivos conhecidos pelos versados na técnica.
Uma vez que o banco de dados de características é aberto noestado 306, o processo 300 se move para um estado 308 em que a primeiracaracterística é lida partindo do banco de dados. É então feita uma compa-ração do atributo da primeira característica com a primeira seqüência em umestado 310. É então feita uma determinação em um estado de decisão 316se o atributo da característica foi encontrado na primeira seqüência. Se oatributo tiver sido encontrado, então o processo 300 se move para um esta-do 318 em que o nome da característica encontrada é exibido para o usuá-rio.
O processo 300 então se move para um estado de decisão 320em que é feita uma determinação se há mais características no banco dedados. Se não houver mais características, então o processo 300 terminaem um estado final 324. Entretanto, se houver mais características no bancode dados, então o processo 300 lê a característica de seqüência seguinte em um estado 326 e entra em "loop" de volta para o estado 310 em que oatributo da característica seguinte é comparado contra a primeira seqüência.Deve ser citado, que se o atributo da característica não for encontrado naprimeira seqüência no estado de decisão 316, o processo 300 se move dire-tamente para o estado de decisão 320 com a finalidade de determinar se háquaisquer mais características no banco de dados.
Conseqüentemente, uma outra modalidade da invenção é ummétodo de identificação de uma característica dentro de uma seqüência deácido nucléico de acordo com a invenção e seqüências substancialmenteidênticas à mesma ou uma seqüência de polipeptídeo de acordo com a in-venção e seqüências substancialmente idênticas à mesma, que compreendea leitura do(s) código(s) de ácido nucléico ou do(s) código(s) de polipeptídeoatravés do uso de um programa de computador que identifica característicascontidas no(s) mesmo(s) e da identificação de características dentro do(s)código(s) de ácido nucléico com o programa de computador. Em algumasmodalidades, o programa de computador compreende um programa decomputador que identifica quadros abertos de leitura. O método pode serrealizado através de leitura de uma única seqüência ou de pelo menos 2, 5,10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácidos nucléicos de a -cordo com a invenção e seqüências substancialmente idênticas às mesmasou das seqüências de polipeptídeos de acordo com a invenção e seqüênciassubstancialmente idênticas às mesmas, através do uso do programa decomputador e da identificação de características dentro dos códigos de ácidonucléico ou dos códigos de polipeptídeo com o programa de computador.
Uma seqüência de ácido nucléico de acordo com a invenção eseqüências substancialmente idênticas à mesma ou uma seqüência de poli-peptídeo de acordo com a invenção e seqüências substancialmente idênti-cas à mesma, podem ser armazenadas e manipuladas em uma variedadede programas de processamento de dados em uma variedade de formatos.Por exemplo, uma seqüência de ácido nucléico de acordo com a invenção eseqüências substancialmente idênticas à mesma ou uma seqüência de poli-peptídeo de acordo com a invenção e seqüências substancialmente idênti-cas à mesma, podem ser armazenadas na forma de texto em um arquivo deprocessamento de palavras, tal como Microsoft WORD® ou WORDPER-FECT® ou na forma de um arquivo ASCII em uma variedade de programasde bancos de dados familiares aos versados na técnica, tal como DB2®, SY-BASE® ou ORACLE®. Em adição, muitos programas de computador e ban-cos de dados podem ser utilizados como algoritmos de comparação de se-qüências, identificadores ou fontes de seqüências de nucleotídeos ou deseqüências de polipeptídeos de referência que serão comparadas com umaseqüência de ácido nucléico de acordo com a invenção e seqüências subs-tancialmente idênticas à mesma ou uma seqüência de polipeptídeo de acor-do com a invenção e seqüências substancialmente idênticas à mesma. Nãoé pretendido que a lista a seguir limite a invenção, mas que forneça orienta-ção a programas e bancos de dados que são úteis com as seqüências deácidos nucléicos de acordo com a invenção e seqüências substancialmenteidênticas às mesmas ou as seqüências de polipeptídeos de acordo com ainvenção e seqüências substancialmente idênticas às mesmas.
Os programas e os bancos de dados que podem ser utilizadosincluem, mas não estão limitados a: MACPATTERN® (EMBL), DISCO-VERYBASE® (Molecular Applications Group), GENEMINE® (Molecular Appli-cations Group), LOOK® (Molecular Applications Group), MACLOOK® (Mole-cular Applications Group), BLAST e BLAST2 (NCBI), BLASTN e BLASTX(Altschul e outros, J. Mol. Biol. 215: 403, 1990), FASTA (Pearson e Lipman,Proc. Natl. Acad. Sei. USA, 85: 2444, 1988), FASTDB (Brutlag e outrosComp. App. Biosci. 6:237-245, 1990), CATALYST® (Molecular SimulationsInc.), Catalyst/SHAPE® (Molecular Simulations Inc.), Cerius2.DBAccess®(Molecular Simulations Inc.), HYPOGEN® (Molecular Simulations Inc.), IN-SIGHT II®, (Molecular Simulations Inc.), DISCOVER® (Molecular SimulationsInc.), CHARMm® (Molecular Simulations Inc.), FELIX® (Molecular Simulati-ons Inc.), DELPHI®, (Molecular Simulations Inc.), QuanteMM®, (MolecularSimulations Inc.), Homology (Molecular Simulations Inc.), MODELER® (Mo-lecular Simulations Inc.), ISIS® (Molecular Simulations Inc.), Quanta/ProteinDesign (Molecular Simulations Inc.), WebLab (Molecular Simulations Inc.),WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Mo-lecular Simulations Inc.), SeqFoId (Molecular Simulations Inc.), o banco dedados do MDL Available Chemicals Directory, o banco de dados do MDLDrug Data Report, o banco de dados da Comprehensive Medicinal Chemis-try, o banco de dados DerwentS1S World Drug Index1 o banco de dados Bi-oByteMasterFile, banco de dados Genbank e o banco de dados Genseqn.Muitos outros programas e bancos de dados seriam evidentes para um ver-sado na técnica fornecida a presente descrição.
Os motivos que podem ser detectados utilizando os programasanteriores incluem as seqüências que codificam zíperes de leucina, motivosde hélice-volta-hélice, sítios de glicosilação, sítios de ubiquitinação, alfa héli-ces e folhas beta, seqüências de sinais que codificam peptídeos de sinaisque direcionam a secreção das proteínas codificadas, seqüências implicadasna regulação da transcrição tais como homeoboxes, filamentos ácidos, sítiosativos enzimáticos, sítios de ligação ao substrato e sítios de clivagem enzi-mática.
Hibridizacão de Ácidos Nucléicos
A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes que se hibridizam sob condições rigorosas com uma seqüênciade acordo com a invenção (tal como SEQ ID NO:1, SEQ ID NO:3, SEQ IDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ IDNO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33,SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ IDNO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61,SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ IDNO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89,SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ IDNO:99, SEQ ID N0:101, SEQ ID N0:103, SEQ ID N0:105, SEQ ID N0:107,SEQ ID NO: 109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ IDNO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ IDNO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ IDNO: 133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ IDNO:141, SEQ ID NO:143, SEQ ID NO: 145, SEQ ID NO:147, SEQ ID NO: 149, SEQ ID NO:151, SEQ ID NO: 153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO: 159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO: 189, SEQ ID NO:191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID N0:201, SEQ ID N0:203, SEQ ID N0.205, SEQ ID N0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID N0:301, SEQ ID N0:303, SEQ ID N0:305, SEQ ID N0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ ID NO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ ID NO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ ID NO:329, SEQ ID NO:331, SEQ ID NO:333, SEO ID NO:335, SEQ ID NO:336, SEQ ID NO:337 ou SEQ ID
NO:338. As condições rigorosas podem ser condições altamente rigorosas,condições com rigor médio e/ou condições de baixo rigor, incluindo as con-dições de rigor alto e reduzido descritas aqui. Em algumas modalidades, é origor das condições de lavagem que apresentam as condições que determi-nam se um ácido nucléico está dentro do âmbito de acordo com a invenção,como discutido abaixo.
"Hibridização" refere-se ao processo através do qual um filamen-to de ácido nucléico se liga a um filamento complementar através do parea-mento de bases. As reações de hibridização podem ser sensíveis e seletivasde forma que uma seqüência particular de interesse pode ser identificadamesmo em amostras em que está presente em baixas concentrações. Ascondições rigorosas adequadas podem ser definidas, por exemplo, pelasconcentrações de sal ou de formamida nas soluções de pré-hibridização ede hibridização ou pela temperatura de hibridização e são bem-conhecidasna técnica. Em outras modalidades, o rigor pode ser aumentado através daredução da concentração de sal, do aumento da concentração de formamidaou da elevação da temperatura de hibridização. Em outras modalidades, osácidos nucléicos de acordo com a invenção são definidos por sua capacida-de de se hibridizarem sob várias condições rigorosas (tais como altas, mé-dias e baixas), como apresentado aqui.
Em algumas modalidades, a hibridização sob condições de alto rigor compreende aproximadamente 50% de formamida a aproximadamente37°C até 42°C. Em algumas modalidades, as condições de hibridizaçãocompreendem condições de rigor reduzido em aproximadamente 35% até25% de formamida a aproximadamente 30°C até 35°C. Em algumas modali-dades, as condições de hibridização compreendem condições de alto rigor,tal como 42°C em 50% de formamida, 5X de SSPE, 0,3% de SDS e 200pg/mL de DNA de esperma de salmão cisalhado e desnaturado. Em algu-mas modalidades, as condições de hibridização compreendem estas condi-ções de rigor reduzido, mas em 35% de formamida a uma temperatura redu-zida de 35°C. A faixa de temperatura correspondente a um nível particularde rigor pode ser adicionalmente reduzida através do cálculo da proporçãode purinas em relação a pirimidinas do ácido nucléico de interesse e do ajus-te da temperatura de acordo. As variações sobre as faixas e as condiçõesanteriores são bem-conhecidas na técnica.
Em outras modalidades, os ácidos nucléicos de acordo com ainvenção que são definidos pela sua capacidade de se hibridizarem sobcondições rigorosas podem ter entre aproximadamente cinco resíduos e ocomprimento completo do ácido nucléico de acordo com a invenção; de for-ma que podem ter pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65,70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650,700, 750, 800, 850, 900, 950, 1000 ou mais resíduos de comprimento. Osácidos nucléicos mais curtos que o comprimento completo também estãoincluídos. Estes ácidos nucléicos podem ser úteis como, tais como sondasde hibridização, sondas de marcação, sondas de oligonucleotídeo para PCR,siRNA ou miRNA (de filamento simples ou duplo), seqüências anti-sentidoou que codificam peptídeos que se ligam a anticorpos (epítopos), motivos,sítios ativos e similares.
Em algumas modalidades, os ácidos nucléicos de acordo com ainvenção são definidos pela sua capacidade de se hibridizarem sob condi-ções de alto rigor que compreendem de aproximadamente 50% de formami-da a aproximadamente 37°C até 42°C. Em algumas modalidades, os ácidosnucléicos de acordo com a invenção são definidos por sua capacidade de sehibridizarem sob condições que compreendem rigor reduzido em aproxima-damente 35% até 25% de formam ida a aproximadamente 30°C até 35°C.
Alternativamente, os ácidos nucléicos de acordo com a invençãosão definidos por sua capacidade de se hibridizarem sob condições quecompreendem alto rigor a 42°C em 50% de formamida, 5X de SSPE, 0,3%de SDS e uma seqüência repetitiva que bloqueia ácido nucléico, tal comocot-1 ou DNA de esperma de salmão (tal como 200 pg/mL de DNA de es-perma de salmão cisalhado e desnaturado). Em algumas modalidades, osácidos nucléicos de acordo com a invenção são definidos por sua capacida-de de se hibridizarem sob condições de rigor reduzido que compreendem35% ou 40% de formamida a uma temperatura reduzida de 35°C ou 42°C.
Nas reações de hibridização de ácidos nucléicos, as condiçõesutilizadas para atingir um nível particular de rigor variarão, dependendo danatureza dos ácidos nucléicos que serão hibridizados. Por exemplo, o com-primento, o grau de complementaridade, a composição da seqüência de nu-cleotídeos (tal como conteúdo de GC v. AT) e o tipo de ácido nucléico (talcomo RNA v. DNA) das regiões de hibridização dos ácidos nucléicos podemser considerados na seleção das condições de hibridização. Uma considera-ção adicional é se um dos ácidos nucléicos está imobilizado, por exemplo,sobre um filtro.
A hibridização pode ser realizada sob condições de baixo rigor,de rigor moderado ou de alto rigor. Como um exemplo de hibridização deácidos nucléicos, uma membrana de polímero contendo ácidos nucléicosdesnaturados imobilizados é primeiramente pré-hibridizada durante 30 minu-tos a 45°C em uma solução que consiste em 0,9 M de NaCI, 50 mM deNaH2PO4, pH 7,0, 5,0 mM de Na2EDTA, 0,5% de SDS, 10X Denhardt1S e 0,5mg/mL de ácido polirriboadenílico. Aproximadamente 2 X 107 cpm (atividadeespecífica de 4-9 X 108 cpm/pg) de sonda de oligonucleotídeo marcada naextremidade com 32P são então adicionadas à solução. Após 12-16 horas deincubação, ã membrana é lavada durante 30 minutos à temperatura ambien-te em 1X SET (150 mM de NaCI, 20 mM de cloridrato de Tris, pH 7,8, 1 mMde Na2EDTA) contendo 0,5% de SDS, seguidos por uma lavagem de 30 mi-nutos em 1X SET fresco à Tm-10°C para a sonda de oligonucleotídeo. Amembrana é então exposta ao filme auto-radiográfico para a detecção desinais de hibridização. Todas as hibridizações anteriores seriam considera-das como sob condições de alto rigor.
Após a hibridização, um filtro pode ser lavado para removerqualquer sonda detectável ligada de forma inespecífica. O rigor utilizado pa-ra lavar os filtros pode ser também variado dependendo da natureza dosácidos nucléicos que serão hibridizados, do comprimento dos ácidos nuclél·cos que serão hibridizados, do grau de complementaridade, da composiçãode seqüência de nucleotídeos (tal como conteúdo de GC v. AT) e do tipo deácido nucléico (tal como RNA v. DNA). Os exemplos de lavagens em condi-ções de rigor progressivamente maior são os seguintes: 2X SSC, 0,1% deSDS à temperatura ambiente durante 15 minutos (baixo rigor); 0,1 X SSC,0,5% de SDS à temperatura ambiente durante 30 minutos até 1 hora (rigormoderado); 0,1 X SSC, 0,5% de SDS durante 15 até 30 minutos entre a tem-peratura de hibridização e 68°C (alto rigor); e 0,15 M de NaCI durante 15minutos a 72°C (rigor muito alto). Uma lavagem de baixo rigor final pode serrealizada em 0,1 X SSC à temperatura ambiente. Os exemplos anterioressão meramente ilustrativos de um conjunto de condições que pode ser utili-zado para lavar os filtros. Um versado na técnica saberia que há vários pro-tocolos para lavagens com rigor diferente. Alguns outros exemplos são for-necidos abaixo.
Em algumas modalidades, as condições de hibridização com-preendem uma etapa de lavagem que compreende uma lavagem durante 30minutos à temperatura ambiente em uma solução que compreende 1X 150mM de NaCI1 20 mM de cloridrato de Tris, pH 7,8, 1 mM de Na2EDTA, 0,5%de SDS, seguida por uma lavagem de 30 minutos em solução fresca.
Os ácidos nucléicos que se hibridizaram com a sonda são identi-ficados por auto-radiografia ou outras técnicas convencionais.
Os procedimentos anteriores podem ser modificados para a i-dentificação de ácidos nucléicos que possuem níveis decrescentes de iden-tidade de seqüência (homologia) com a seqüência da sonda. Por exemplo,para a obtenção de ácidos nucléicos de identidade de seqüência (homologi-a) decrescente com a sonda detectável, podem ser utilizadas condições me-nos rigorosas. Por exemplo, a temperatura de hibridização pode ser diminuí-da em incrementos de 5°C partindo de 68°C até 42°C em um tampão de hi-bridização que possui uma concentração de Na+ de aproximadamente 1 M.
Após a hibridização, o filtro pode ser lavado com 2X SSC, 0,5% de SDS natemperatura de hibridização. Estas condições são consideradas como sendocondições "moderadas" acima de 50°C e condições "baixas" abaixo de 50°C.Um exemplo específico de condições de hibridização "moderadas" é quandoa hibridização anterior é realizada a 55°C. Um exemplo específico de condi-ções de hibridização de "baixo rigor" é quando a hibridização anterior é reali-zada a 45°C.
Alternativamente, a hibridização pode ser realizada em tampões,tal como 6X SSC, contendo formamida a uma temperatura de 42°C. Nestecaso, a concentração de formamida no tampão de hibridização pode ser re-duzida em incrementos de 5% partindo de 50% até 0% para identificar clo-nes que possuem níveis decrescentes de homologia com a sonda. Após ahibridização, o filtro pode ser lavado com 6X SSC, 0,5% de SDS a 50°C. Es-tas condições são consideradas como sendo condições "moderadas" acimade 25% de formamida e condições "baixas" abaixo de 25% de formamida.Um exemplo específico de condições de hibridização "moderadas" é quandoa hibridização anterior é conduzida em 30% de formamida. Um exemplo es-pecífico de condições de hibridização de "baixo rigor" é quando a hibridiza-ção anterior é realizada em 10% de formamida.
Entretanto, a seleção de um formato de hibridização pode nãoser crítica - é o rigor das condições de lavagem que mostra as condiçõesque determinam se um ácido nucléico está dentro do âmbito de acordo coma invenção. As condições de lavagem utilizadas para identificar ácidos nu-cléicos dentro do âmbito de acordo com a invenção incluem, tal como: umaconcentração de sal de aproximadamente 0,02 molar em pH 7 e uma tempe-ratura de pelo menos aproximadamente 50°C ou aproximadamente 55°C atéaproximadamente 60°C; ou uma concentração de sal de aproximadamente0,15 M de NaCI a 72°C durante aproximadamente 15 minutos; ou uma con-centração de sal de aproximadamente 0,2X SSC a uma temperatura de pelomenos aproximadamente 50°C ou aproximadamente 55°C até aproximada-mente 60°C durante aproximadamente 15 até aproximadamente 20 minutos;ou o complexo de hibridização é lavado duas vezes com uma solução comuma concentração de sal de aproximadamente 2X SSC contendo 0,1% deSDS à temperatura ambiente durante 15 minutos e então lavado duas vezespor 0,1 X SSC contendo 0,1% de SDS a 68°C durante 15 minutos; ou condi-ções equivalentes. Vide Sambrook ed., Molecular Cloning: A LaboratoryManual (2- ed.), vols. 1-3, Cold Spring Harbor Laboratory (1989), LABORA-TORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY:HYBRIDIZATION WITH NUCLEIC ACID PROBES, Parte I. Theory and Nu-cleic Acid Preparation, Tijssen1 ed. Elsevier, N.Y. (1993) e Ausubel, ed. JohnWiley & Sons, Inc., Nova Iorque (1997) para uma descrição de tampão SSCe condições equivalentes.
Estes métodos podem ser utilizados para isolar ou para identifi-car ácidos nucléicos de acordo com a invenção e seqüências substancial-mente idênticas aos mesmos. Por exemplo, os métodos anteriores podemser utilizados para isolar ou identificar ácidos nucléicos que possuem umaseqüência com pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%,55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%,68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%,- 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%,94%, 95%, 96%, 97%, 98%, 99% ou mais identidade de seqüência (homolo-gia) a uma seqüência de ácido nucléico selecionada do grupo que consisteem uma das seqüências de acordo com a invenção e seqüências substanci-almente idênticas à mesma ou fragmentos que compreendem pelo menosaproximadamente 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400ou 500 bases consecutivas da mesma e as seqüências complementares àmesma. A identidade de seqüência (homologia) pode ser medida utilizando oalgoritmo de alinhamento. Por exemplo, os polinucleotídeos homólogos po-dem ter uma seqüência codificadora que é uma variação alélica que ocorrenaturalmente de uma das seqüências codificadoras descritas aqui. Tais vari-ações alélicas podem ter uma substituição, uma deleção ou uma adição deum ou mais nucleotídeos quando comparadas com os ácidos nucléicos deacordo com a invenção. Adicionalmente, os procedimentos anteriores podemser utilizados para isolar ácidos nucléicos que codificam polipeptídeos quepossuem pelo menos aproximadamente 99%, 95%, pelo menos 90%, pelomenos 85%, pelo menos 80%, pelo menos 75%, pelo menos 70%, pelo me-nos 65%, pelo menos 60%, pelo menos 55% ou pelo menos 50% de identi-dade de seqüência (homologia) a um polipeptídeo de acordo com a invençãoou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40,50, 75, 100 ou 150 aminoácidos consecutivos dos mesmos que são determi-nados utilizando um algoritmo de alinhamento de seqüências (tal como oalgoritmo FASTA versão 3.0t78 com os parâmetros preestabelecidos).
Sondas de Oliqonucleotídeos e Métodos para Utilização das mesmas
A invenção fornece ainda sondas de ácidos nucléicos que po-dem ser utilizadas, tal como para a identificação, para a amplificação ou parao isolamento de ácidos nucléicos que codificam uma atividade de enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase oufragmentos dos mesmos ou para a identificação de genes da enzima aldola-se, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Em algu-mas modalidades, a sonda compreende pelo menos aproximadamente 10bases consecutivas de um ácido nucléico de acordo com a invenção. Alter-nativamente, uma sonda de acordo com a invenção pode ter pelo menosaproximadamente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150 ouaproximadamente 10 até 50, aproximadamente 20 até 60 aproximadamente30 até 70, bases consecutivas de uma seqüência que é apresentada em umácido nucléico de acordo com a invenção. As sondas identificam um ácidonucléico através da ligação e/ou da hibridização. As sondas podem ser utili-zadas em arranjos de acordo com a invenção, vide a discussão abaixo, in-cluindo tais como arranjos capilares. As sondas de acordo com a invençãotambém podem ser utilizadas para isolar outros ácidos nucléicos ou polipep-tídeos.
Os ácidos nucléicos isolados, sintéticos ou recombinantes deacordo com a invenção, as seqüências complementãres aos mesmos ou umfragmento que compreende pelo menos aproximadamente 10, 15, 20, 25,30, 35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 bases consecutivas deuma das seqüências de acordo com a invenção ou as seqüências comple-mentãres à mesma também podem ser utilizadas como sondas para deter-minar se uma amostra biológica, tal como uma amostra do solo, contém umorganismo que possui uma seqüência de ácido nucléico de acordo com ainvenção ou um organismo do qual o ácido nucléico foi obtido. Em tais pro-cedimentos, uma amostra biológica que potencialmente carrega o organismodo qual o ácido nucléico foi isolado é obtida e os ácidos nucléicos são obti-dos partindo da amostra. Os ácidos nucléicos são colocados em contatocom a sonda sob condições que permitem que a sonda se hibridize especifi-camente com quaisquer seqüências complementãres às quais estão presen-tes aqui.
Quando necessário, as condições que permitem que a sonda sehibridize especificamente com as seqüências complementãres podem serdeterminadas colocando a sonda em contato com as seqüências comple-mentares provenientes das amostras conhecidas por conterem a seqüênciacomplementar assim como seqüências de controle que não contêm a se-qüência complementar. As condições de hibridização, tal como a concentra-ção de sal do tampão de hibridização, a concentração de formamida do tam-pão de hibridização ou a temperatura de hibridização, podem ser variadaspara identificar condições que permitem que a sonda se hibridize especifi-camente com ácidos nucléicos complementares.
Se a amostra contiver o organismo do qual o ácido nucléico foiisolado, a hibridização específica da sonda é então detectada. A hibridizaçãopode ser detectada através da marcação da sonda com um agente detectá-vel tal como um isótopo radioativo, um corante fluorescente ou uma enzimacapaz de catalisar a formação de um produto detectável.
Muitos métodos para a utilização das sondas marcadas paradetectar a presença de ácidos nucléicos complementares em uma amostrasão familiares aos versados na técnica. Estes incluem Southern Blots, Nor-thern Blots, procedimentos de hibridização em colônias e dot blots. Os pro-tocolos para cada um destes procedimentos são fornecidos em Ausubel eoutros Current Protocols in Molecular Biology, John Wiley & Sons, Inc.(1997) e Sambrook e outros, Molecular Cloning: A Laboratory Manual 2- Ed.,Cold Spring Harbor Laboratory Press (1989).
Alternativamente, mais de uma sonda (pelo menos uma que écapaz de se hibridizar especificamente com quaisquer seqüências comple-mentares que estão presentes na amostra de ácido nucléico), podem serutilizadas em uma reação de amplificação para determinar se a amostra con-tém um organismo que contém uma seqüência de ácido nucléico de acordocom a invenção (tal como um organismo do qual o ácido nucléico foi isola-do). Em algumas modalidades, as sondas compreendem oligonucleotídeos.
Em algumas modalidades, a reação de amplificação pode compreender umareação de PCR. Os protocolos de PCR são descritos em Ausubel e Sambro-ok, supra. Alternativamente, a amplificação pode compreender uma reaçãoem cadeia da ligase, 3SR ou uma reação de deslocamento de filamento.(Vide Barany, F., "The Ligase Chain Reaction in a PCR World", PCR Me-thods and Applications 1:5-16, 1991; E. Fahy e outros, "Self-sustained Se-quence Replication (3SR): An Isothermal Transcription-based AmplificationsSystem Alternative to PCR", PCR Methods and Applications 1:25-33, 1991; e- Walker G.T. e outros, "Strand Displaeement Amplification-an Isothermal invitro DNA Amplifieation Technique", Nucleic Acid Research 20:1691-1696,1992). Em tais procedimentos, os ácidos nucléicos na amostra são coloca-dos em contato com as sondas, a reação de amplificação é realizada e qual-quer produto da amplificação resultante é detectado. O produto da amplifica-ção pode ser detectado através da realização da eletroforese em gel com osprodutos de reação e da coloração do gel com um agente intercalador talcomo brometo de etídio. Alternativamente, uma ou mais das sondas podemser marcadas com um isótopo radioativo e a presença de um produto daamplificação radioativo pode ser detectada através de auto-radiografia apósa eletroforese em gel.
As sondas derivadas de seqüências próximas às extremidadesdas seqüências de acordo com a invenção, também podem ser utilizadas emprocedimentos de "caminhada" sobre os cromossomos ("chromosome wal-king") para identificar clones contendo seqüências genômicas localizadasadjacentes às seqüências de acordo com a invenção. Tais métodos permi-tem o isolamento de genes que codificam proteínas adicionais do organismohospedeiro.
Em algumas modalidades, os ácidos nucléicos isolados, sintéti-cos ou recombinantes de acordo com a invenção, as seqüências comple-mentares aos mesmos ou um fragmento que compreende pelo menos 10,15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 ou mais basesconsecutivas de uma das seqüências de acordo com a invenção ou as se-qüências complementares à mesma são utilizadas como sondas para identi-ficar e isolar ácidos nucléicos relacionados. Em algumas modalidades, osácidos nucléicos relacionados podem ser cDNAs ou DNAs genômicos deorganismos sem ser aquele do qual o ácido nucléico foi isolado. Por exem-plo, os outros organismos podem ser organismos relacionados. Em tais pro-cedimentos, uma amostra de ácido nucléico é colocada em contato com asonda sob condições que permitam que a sonda se hibridize especificamen-te com as seqüências relacionadas. A hibridização da sonda com os ácidosnucléicos do organismo relacionado é então detectada utilizando qualquerum dos métodos descritos anteriormente.
Variando o rigor das condições de hibridização utilizadas paraidentificar ácidos nucléicos, tais como cDNAs ou DNAs genômicos, que sehibridizam com a sonda detectável, os ácidos nucléicos que possuem níveisdiferentes de homologia com a sonda podem ser identificados e isolados. Origor pode ser variado realizando a hibridização em temperaturas variáveisabaixo das temperaturas de fusão das sondas. A temperatura de fusão, Tm,é a temperatura (sob força iônica e pH definidos) em que 50% da seqüênciaalvo se hibridizam a uma sonda perfeitamente complementar. Condiçõesmuito rigorosas são selecionadas para serem iguais à ou aproximadamente5°C inferiores à Tm para uma sonda particular. A temperatura de fusão podeser calculada utilizando as fórmulas a seguir:
Para sondas entre 14 e 70 nucleotídeos de comprimento a tem-peratura de fusão (Tm) é calculada utilizando a fórmula: Tm=81,5+16,6(log[Na+])+0,41 (fração de G+C)-(600/N) em que N é o comprimento da sonda.
Se a hibridização for realizada em uma solução contendo for-mamida, a temperatura de fusão pode ser calculada utilizando a equação:Tm=81,5+16,6(log [Na+])+0,41 (fração de G+C)-(0,63% de formamida)-(600/N) em que N é o comprimento da sonda.
A pré-hibridização pode ser realizada em 6X SSC, 5X reagentede Denhardt, 0,5% de SDS, 100 pg/mL de DNA de esperma de salmãofragmentado desnaturado ou 6X SSC, 5X reagente de Denhardt, 0,5% deSDS, 100 pg/mL de DNA de esperma de salmão fragmentado desnaturado,50% de formamida. As fórmulas para as soluções de SSC e de Denhardtsão listadas em Sambrook e outros, supra.
Em algumas modalidades, a hibridização é realizada através daadição da sonda detectável nas soluções de pré-hibridização listadas anteri-ormente. Quando a sonda compreender DNA de filamento duplo, é desnatu-rada antes da adição na solução de hibridização. Em algumas modalidades,o filtro é colocado em contato com a solução de hibridização durante um pe-ríodo de tempo suficiente para permitir que a sonda se hibridize com os cD-NAs ou com os DNAs genômicos contendo seqüências complementares àmesma ou homólogas à mesma. Para as sondas com mais de 200 nucleotí-deos de comprimento, a hibridização pode ser realizada a 15-25°C abaixo daTm. Para as sondas mais curtas, tais como sondas de oligonucleotídeo, ahibridização pode ser realizada a 5-100C abaixo da Tm. Em algumas modali-dades, para hibridizações em 6X SSC, a hibridização é realizada a aproxi-madamente 68°C. Geralmente, para as hibridizações em soluções contendo50% de formamida, a hibridização é realizada a aproximadamente 42°C.Inibicão da Expressão de Enzimas Aldolases
A invenção fornece ácidos nucléicos complementares (tais comoseqüências anti-sentido para) aos ácidos nucléicos de acordo com a inven-ção, tais como ácidos nucléicos que codificam enzimas aldolases, tais comoácidos nucléicos que compreendem anti-sentido, siRNA, Mima, ribozimas.
Os ácidos nucléicos de acordo com a invenção que compreendem seqüên-cias anti-sentido podem ser capazes de inibir o transporte, o processamentoou a transcrição de genes que codificam enzimas aldolases. A inibição podeser realizada através do direcionamento do DNA genômico ou do RNA men-sageiro. A transcrição ou a função do ácido nucléico alvo pode ser inibida,por exemplo, através de hibridização e/ou de clivagem. Um exemplo de con-junto de inibidores fornecido pela presente invenção inclui oligonucleotídeosque são capazes de se ligar ao gene ou à mensagem da enzima aldolase,tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, em qualquerum dos casos prevenindo ou inibindo a produção ou a função de uma enzi-ma aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. A associ-ação pode ser através de hibridização específica à seqüência. Uma outraclasse útil de inibidores inclui oligonucleotídeos que causam a inativação oua clivagem da mensagem da enzima aldolase, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase. O oligonucleotídeo pode ter atividade deenzima que causa tal clivagem, tal como ribozimas. O oligonucleotídeo podeser modificado quimicamente ou conjugado com uma enzima ou uma com-posição capaz de clivar o ácido nucléico complementar. Um conjunto de mui-tos tais oligonucleotídeos diferentes pode ser verificado em relação àquelescom a atividade desejada. Assim, a invenção fornece várias composiçõespara a inibição da expressão da enzima aldolase, tal como piruvato aldolase,tal como HMG e/ou KHG aldolase em um nível de ácido nucléico e/ou deproteína, tais como anti-sentido, siRNA, miRNA e ribozimas que compreen-dem seqüências da enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase de acordo com a invenção e os anticorpos antialdo-lase, tal como antipiruvato aldolase, tal como anti-HMG e/ou anti-KHG aldo-lase de acordo com a invenção.
A inibição da expressão da enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase pode ter uma variedade de apli-cações industriais. Por exemplo, a inibição da expressão da enzima aldola-se, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase pode retar-dar ou prevenir a deterioração. Em algumas modalidades, o uso de compo-sições de acordo com a invenção que inibem a expressão e/ou a atividadede enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHGaldolase, tais como anticorpos, oligonucleotídeos anti-sentido, ribozimas,siRNA e miRNA é feito para retardar ou prevenir a deterioração. Assim, emalgumas modalidades, a invenção fornece métodos e composições quecompreendem a aplicação sobre uma planta ou um produto vegetal (tal co-mo um cereal, um grão, um fruto, uma semente, uma raiz, uma folha etc.) deanticorpos, oligonucleotídeos anti-sentido, ribozimas, siRNA e miRNA de a-cordo com a invenção para retardar ou prevenir a deterioração. Estas com-posições também podem ser expressas pela planta (tal como uma plantatransgênica) ou um outro organismo (tal como uma bactéria ou outro micro-organismo transformado com um gene de enzima aldolase, tal como piruvatoaldolase, HMG e/ou KHG aldolase de acordo com a invenção).
As composições de acordo com a invenção para a inibição daexpressão da enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase (tal como anti-sentido, iRNA, ribozimas, anticorpos) po-dem ser utilizadas como composições farmacêuticas, tais como agentes antipatogênicos ou em outras terapias, tais como antimicrobianos para, tal comoSalmonella.
Oliaonucleotídeos Anti-sentido
A invenção fornece oligonucleotídeos anti-sentido capazes de seligar à mensagem da enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase que, em algumas modalidades, podem inibir a ati-vidade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase através do direcionamento do mRNA. As estratégias para oplanejamento de oligonucleotídeos anti-sentido são bem-descritas na litera-tura científica e de patente e o versado na técnica pode planejar tais oligo-nucleotídeos da enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase utilizando os novos reagentes de acordo com a invenção.
Por exemplo, os protocolos de "gene walking"/mapeamento de RNA paraselecionar oligonucleotídeos anti-sentido eficientes são bem-conhecidos natécnica, vide Ho (2000) Methods Enzymol. 314:168-183, que descreve umensaio de mapeamento de RNA, que é baseado em técnicas molecularespadronizadas para fornecer um método fácil e confiável para a seleção deseqüências anti-sentido potentes. Vide também Smith (2000) Eur. J. Pharm.Sei. 11:191-198.
Os ácidos nucléicos que ocorrem naturalmente são utilizadoscomo oligonucleotídeos anti-sentido. Os oligonucleotídeos anti-sentido po-dem ter qualquer comprimento; por exemplo, em outras modalidades, osoligonucleotídeos anti-sentido possuem aproximadamente 5 até aproxima-damente 100, aproximadamente 10 até aproximadamente 80, aproximada-mente 15 até aproximadamente 60, aproximadamente 18 até aproximada-mente 40. O comprimento ótimo pode ser determinado através da verifica-ção de rotina. Os oligonucleotídeos anti-sentido podem estar presentes emqualquer concentração. A concentração ótima pode ser determinada atravésda verificação de rotina. É conhecida uma ampla variedade de análogos denucleotídeos e de ácidos nucléicos sintéticos que não ocorrem naturalmenteque pode controlar este problema potencial. Por exemplo, os ácidos nucléi-cos de peptídeo (PNAs) que contêm estruturas não-iônicas, tais como uni-dades de N-(2-aminoetil) glicina podem ser utilizados. Os oligonucleotídeosanti-sentido que possuem ligações fosforotioato também podem ser utiliza-dos, como descrito na WO 97/03211; na WO 96/39154; em Mata (1997) To-xicol Appl Pharmacol 144:189-197; Antisense Therapeutics, ed. Agrawal(Humana Press, Totowa, N.J., 1996). Os oligonucleotídeos anti-sentido quepossuem análogos de estruturas de DNA sintéticos fornecidos pela invençãotambém podem incluir ácidos nucléicos fosforo-ditioato, metilfosfonato, fosfo-ramidato, alquil fosfotriéster, sulfamato, 3'-tioacetal, metileno (metilimino), 3'-N-carbamato e morfolino carbamato, como descrito anteriormente.
A metodologia de química combinatória pode ser utilizada paracriar vastos números de oligonucleotídeos que podem ser facilmente verifi-cados em relação a oligonucleotídeos específicos que possuem afinidades eespecificidades de ligação apropriadas para qualquer alvo, tal como as se-qüências sentido e anti-sentido da enzima aldolase, tal como piruvato aldo-Iase1 tal como HMG e/ou KHG aldolase de acordo com a invenção (videGold (1995) J. of Biol. Chem. 270:13581-13584).
Ribozimas Inibidoras
A invenção fornece ribozimas capazes de se ligar à mensagemda enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHGaldolase enzima. Estas ribozimas podem inibir a atividade da enzima aldola-se, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase através de,tal como o direcionamento do mRNA. As estratégias para planejar ribozimase selecionar a seqüência anti-sentido específica à enzima aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldolase para direcionamentosão bem-descritas na literatura científica e de patente e o versado na técnicapode planejar tais ribozimas utilizando novos reagentes de acordo com ainvenção. As ribozimas atuam através da ligação com um RNA alvo atravésda parte de ligação com o RNA alvo de uma ribozima que é mantida em pro-ximidade íntima com uma parte enzimática do RNA que cliva o RNA alvo.Assim, a ribozima reconhece e se liga a um RNA através do pareamento debases complementares e uma vez ligada ao sítio correto, atua enzimatica-mente para clivar e inativar o RNA alvo. A clivagem de um RNA alvo de talmaneira destruirá sua capacidade de direcionar a síntese de uma proteínacodificada se a clivagem ocorrer na seqüência codificadora. Após uma ribo-zima ter se ligado e clivado seu RNA alvo, pode ser liberada de tal RNA parase ligar e clivar novos alvos repetidamente.
Em alguns casos, a natureza enzimática de uma ribozima podeser vantajosa em relação a outras tecnologias, tal como a tecnologia anti-sentido (em que uma molécula de ácido nucléico simplesmente se liga a umácido nucléico alvo para bloquear sua transcrição, tradução ou associaçãocom uma outra molécula) uma vez que a concentração eficiente de ribozimanecessária para realizar um tratamento terapêutico pode ser menor que a deum oligonucleotídeo anti-sentido. Esta vantagem potencial reflete a capaci-dade da ribozima de atuar enzimaticamente. Assim, uma única molécula deribozima é capaz de clivar muitas moléculas de RNA alvo. Em algumas mo-dalidades, uma ribozima é um inibidor altamente específico, com a especifi-cidade de inibição dependendo não somente do mecanismo de ligação depareamento de bases, mas também do mecanismo através do qual a molé-cula inibe a expressão do RNA ao qual se liga. Ou seja, a inibição é causadapela clivagem do RNA alvo e assim a especificidade é definida como a pro-porção da taxa de clivagem do RNA alvo em relação à taxa de clivagem doRNA que não é alvo. Este mecanismo de clivagem é dependente de fatoresadicionais aos envolvidos no pareamento de bases. Assim, a especificidadede ação de uma ribozima pode ser maior que a da ligação do oligonucleotí-deo anti-sentido ao mesmo sítio de RNA.
A ribozima de acordo com a invenção, tal como uma moléculade RNA de ribozima enzimática, pode ser formada em um motivo "cabeça demartelo" (hammerhead), um motivo em "grampo de cabelo" (hairpin), na for-ma de um motivo do vírus delta da hepatite, um motivo do íntron do grupo Ie/ou um RNA similar a RNaseP em associação com uma seqüência guia deRNA. Os exemplos de motivos "cabeça de martelo" são descritos por, talcomo Rossi (1992) Aids Research and Human Retroviruses 8:183; os moti-vos em "grampo de cabelo" por Hampel (1989) Biochemistry 28:4929 eHampel (1990) Nuc. Acids Res. 18:299; o motivo do vírus delta da hepatitepor Perrotta (1992) Biochemistry 31:16; o motivo RNaseP por Guerrier-Takada (1983) Cell 35:849; e o íntron do grupo I por Cech Patente U.S. N04.987.071. Não é pretendido que a citação destes motivos específicos sejalimitante. Os versados na técnica reconhecerão que uma ribozima de acordocom a invenção, tal como uma molécula de RNA enzimática desta invenção,pode possuir um sítio de ligação ao substrato específico complementar auma ou mais regiões do RNA do gene alvo. Uma ribozima de acordo com ainvenção pode ter uma seqüência de nucleotídeos dentro ou que circunda talsítio de ligação ao substrato que confere uma atividade de clivagem de RNAà molécula.
Interferência de RNA (RNAi)
Em algumas modalidades, a invenção fornece moléculas inibido-ras de RNA, as assim chamadas moléculas "RNAi", que compreendem se-qüências da enzima aldolase, tal como piruvato aldolase, HMG e/ou KHGaldolase de acordo com a invenção. A molécula de RNAi pode compreenderuma molécula de RNA de filamento duplo (dsRNA), tal como moléculas desiRNA, miRNA e/ou RNA em grampo de cabelo curto (shRNA). A moléculade RNAi1 tal como siRNA (RNA inibidor pequeno) e/ou miRNA (microRNA),pode inibir a expressão de um gene da enzima aldolase, tal como piruvatoaldolase, HMG e/ou KHG aldolase. Em algumas modalidades, a molécula deRNAi, tal como siRNA e/ou miRNA, tem aproximadamente 11,12, 13, 14,15,16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou mais nucleotídeos emdúplex de comprimento. Embora a invenção não esteja limitada por qualquermecanismo de ação particular, o RNAi pode entrar em uma célula e causar adegradação de um RNA de filamento simples (ssRNA) de seqüências simila-res ou idênticas, incluindo mRNAs endógenos. Quando uma célula é expos-ta ao RNA de filamento duplo (dsRNA), o mRNA do gene homólogo é de-gradado seletivamente através de um processo chamado de interferência deRNA (RNAi). Um mecanismo básico possível por trás da RNAi é a quebra deum RNA de filamento duplo (dsRNA) que se combina com uma seqüênciagênica específica em pedaços curtos chamados de RNAs interferentes, queativam a degradação do mRNA que se combina com sua seqüência. Emalgumas modalidades, os RNAis de acordo com a invenção são utilizadosem terapias de silenciamento gênico, vide Shuey (2002) Drug Discov. Today7:1040-1046. Em algumas modalidades, a invenção fornece métodos paradegradar seletivamente o RNA utilizando as moléculas de RNAi1 tal comosiRNA e/ou miRNA, de acordo com a invenção. O processo pode ser prati-cado in vitro, ex vivo ou in vivo. Em algumas modalidades, as moléculas deRNAi de acordo com a invenção podem ser utilizadas para gerar uma muta-ção de perda de função em uma célula, um órgão ou um animal.
Em um aspecto, a introdução intracelular do RNAi é através dainternalização de um Iigante específico à célula-alvo ligado a uma proteínade ligação ao RNA que compreende um RNAi (tal como microRNA) que éabsorvida. O Iigante é específico a um antígeno de superfície celular alvoexclusivo. O Iigante pode ser internalizado espontaneamente após a ligaçãoao antígeno de superfície celular. Se o antígeno de superfície celular exclu-sivo não for naturalmente internalizado após a ligação com seu ligante, ainternalização pode ser promovida pela incorporação de um peptídeo ricoem arginina ou outro peptídeo permeável à membrana, na estrutura do ligan-te ou da proteína de ligação ao RNA ou pela ligação de tal peptídeo ao Iigan-te ou à proteína de ligação ao RNA. Vide as Publicações de Patentes U.S.N— 20060030003; 20060025361; 20060019286; 20060019258. Em um as-pecto, a invenção fornece formulações à base de lipídeos para o fornecimen-to, de forma a introduzir os ácidos nucléicos da invenção como partículas deácido nucléico-lipídeo que compreendem uma molécula de RNAi em umacélula, vide, por exemplo, a Publicação de Patente U.S. N0 20060008910.Modificação de Ácidos Nucléicos - Produção de Enzimas Variantes da Invenção
A invenção fornece métodos de produção de variantes dos áci-dos nucléicos de acordo com a invenção, tais como os que codificam umaenzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase. Estesmétodos podem ser repetidos ou utilizados em várias combinações para ge-rar enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHGaldolase que possuem uma atividade alterada ou diferente ou uma estabili-dade alterada ou diferente daquela de uma enzima aldolase, tal como piru-vato aldolase, HMG e/ou KHG aldolase codificada pelo ácido nucléico mol-de. Estes métodos também podem ser repetidos ou utilizados em váriascombinações, de forma a gerar variações na expressão gênica/de mensa-gem, na tradução da mensagem ou na estabilidade da mensagem. Em ou-tras modalidades, a composição genética de uma célula é alterada atravésde, tal como a modificação de um gene homólogo ex vivo, seguida por suareinserção na célula.
Um ácido nucléico de acordo com a invenção pode ser alteradoatravés de qualquer meio. Por exemplo, métodos aleatórios ou estocásticosou métodos não-estocásticos ou de "evolução direcionada", vide a PatenteU.S. N0 6.361.974. Os métodos para a mutação aleatória de genes são bem-conhecidos na técnica, vide a Patente U.S. N0 5.830.696. Por exemplo, a-gentes mutagênicos podem ser utilizados para mutar aleatoriamente um ge-ne. Os agentes mutagênicos incluem, tal como luz ultravioleta ou irradiaçãogama ou um agente mutagênico químico, tal como mitomicina, ácido nitroso,psoralenos fotoativados, isoladamente ou em combinação, para a induçãode quebras no DNA susceptíveis ao reparo através da recombinação. Outrosagentes mutagênicos químicos incluem, por exemplo, bissulfito de sódio,ácido nitroso, hidroxilamina, hidrazina ou ácido fórmico. Outros agentes mu-tagênicos são análogos de precursores de nucleotídeos, tal como nitroso-guanidina, 5-bromouracila, 2-aminopurina ou acridina. Estes agentes podemser adicionados em uma reação de PCR no lugar do precursor de nucleotí-deo mutando assim a seqüência. Agentes intercalantes tais como proflavina,acriflavina, quinacrina e similares também podem ser utilizados.
Qualquer técnica na biologia molecular pode ser utilizada, talcomo a mutagênese por PCR aleatória, vide Rice (1992) Proc. Natl. Acad.Sei. USA 89:5467-5471; ou, a mutagênese combinatória com vários casse-tes, vide Crameri (1995) Biotechniques 18:194-196. Alternativamente, osácidos nucléicos, tais como genes, podem ser remontados após fragmenta-ção aleatória ou "estocástica", vide as Patentes U.S. N— 6.291.242;6.287.862; 6.287.861; 5.955.358; 5.830.721; 5.824.514; 5.811.238;5.605.793. Em outras modalidades, modificações, adições ou deleções sãointroduzidas através da PCR propensa a erros, embaralhamento, mutagêne-se direcionada por oligonucleotídeo, PCR de montagem, mutagênese porPCR sexual, mutagênese in vivo, mutagênese com cassete, mutagênese deconjunto recursivo, mutagênese de conjunto exponencial, mutagênese espe-cífica ao sítio, remontagem gênica (tal como GeneReassembIy, vide PatenteU.S. N0 6.537.776), Mutagênese de Saturação de Sítio Gênico (GSSM), re-montagem de ligação sintética (SLR), recombinação, recombinação de se-qüência recursiva, mutagênese de DNA modificado com fosfotioato, muta-gênese com molde contendo uracila, mutagênese de dúplex com espaços,mutagênese de reparo de combinações erradas pontuais, mutagênese comcepa hospedeira deficiente em relação ao reparo, mutagênese química, mu-tagênese radiogênica, mutagênese de deleção, mutagênese de seleção derestrição, mutagênese de purificação de restrição, síntese de gene artificial,mutagênese de conjunto, criação de multímeros de ácidos nucléicos quimé-ricos, Mutagênese de Saturação Cromossômica (CSM) e/ou uma combina-ção destes e outros métodos.
As publicações a seguir descrevem uma variedade de procedi-mentos e/ou métodos de recombinação recursiva que podem ser incorpora-dos nos métodos de acordo com a invenção: Stemmer (1999) "Molecularbreeding of viruses for targeting and other clinicai properties" Tumor Targe-ting 4:1-4; Ness (1999) Nature Biotechnology 17:893-896; Chang (1999) Έ-volution of a cytokine using DNA family shuffling" Nature Biotechnology17:793-797; Minshull (1999) "Protein evolution by molecular breeding" Cur-rent Opinion in Chemical Biology 3:284-290; Christians (1999) "Directed evo-lution of thymidine kinase for AZT fosforylation using DNA family shuffling"Nature Biotechnology 17:259-264; Crameri (1998) "DNA shuffling of a familyof genes from diverse species accelerates directed evolution" Nature391:288-291; Crameri (1997) "Molecular evolution of an arsenate detoxifica-tion pathway by DNA shuffling", Nature Biotechnology 15:436-438; Zhang(1997) "Directed evolution of an effective fucosidase from a galactosidase byDNA shuffling and screening" Proc. Natl. Acad. Sei. USA 94:4504-4509; Pat-ten e outros (1997) "Applications of DNA Shuffling to Pharmaceuticals andVaecines" Current Opinion in Bioteehnology 8:724-733; Crameri e outros(1996) "Construction and evolution of antibody-phage Iibraries by DNA shuf-fling" Nature Medicine 2:100-103; Gates e outros (1996) "Affinity selectiveisolation of Iigands from peptide Iibraries through display on a Iac repressorheadpiece dimer'" Journal of Molecular Biology 255:373-386; Stemmer(1996) "Sexual PCR and Assembly PCR" Em: The Encyelopedia of Molecu-lar Biology. VCH Publishers, Nova Iorque, pp.447-457; Crameri e Stemmer(1995) "Combinatorial multiple cassette mutagenesis creates ali the permuta-tions of mutant and wildtype cassettes" BioTechniques 18:194-195; Stemmere outros (1995) "Single-step assembly of a gene and entire plasmid form Iar-ge numbers of oligodeoxyribonucleotides" Gene, 164:49-53; Stemmer (1995)"The Evolution of Molecular Computation" Science 270: 1510; Stemmer(1995) "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer(1994) "Rapid evolution of a protein in vitro by DNA shuffling" Nature370:389-391; e Stemmer (1994) "DNA shuffling by random fragmentationand reassembly: In vitro recombination for molecular evolution". Proc. Natl.Acad. Sei. USA 91:10747-10751.
Os métodos de mutação para gerar diversidade incluem, por e-xemplo, mutagênese direcionada ao sítio (Ling e outros (1997) "Approachesto DNA mutagenesis: an overview" Anal Biochem. 254(2): 157-178; Dale eoutros (1996) "Oligonucleotide-directed random mutagenesis using the fosfo-rothioate method" Methods Mol. Biol. 57:369-374; Smith (1985) "In vitro mu-tagenesis" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985) "Strate-gies and applications of in vitro mutagenesis" Science 229:1193-1201; Carter(1986) "Site-directed mutagenesis" Biochem. J. 237:1-7; e Kunkel (1987)"The efficiency of oligonucleotide directed mutagenesis" em Nucleic Acids &Molecular Biology (Eckstein, F. e Lilley, D. M. J. eds., Springer Verlag, Ber-Iin)); mutagênese utilizando moldes contendo uracila (Kunkel (1985) "Rapidand efficient site-specific mutagenesis without phenotypic selection" Proc.Natl. Acad. Sei. USA 82:488-492; Kunkel e outros (1987) "Rapid and efficientsite-specific mutagenesis without phenotypic selection" Methods in Enzymol.154, 367-382; e Bass e outros (1988) "Mutant Trp repressors with new DNA-binding specificities" Science 242:240-245); mutagênese direcionada poroligonucleotídeo (Methods in Enzymol. 100: 468-500 (1983); Methods inS Enzymol. 154: 329-350 (1987); Zoller (1982) "Oligonucleotide-directed muta-genesis using M13-derived vectors: an efficient and general procedure forthe production of point mutations in any DNA fragment" Nucleic Acids Res.10:6487-6500; Zoller & Smith (1983) Oligonucleotide-directed mutagenesisof DNA fragments cloned into M13 vectors" Methods in Enzymol. 100:468-500; e Zoller (1987) Oligonucleotide-directed mutagenesis: a simple methodusing two oligonucleotide primers and a single-stranded DNA template" Me-thods in Enzymol. 154:329-350); mutagênese de DNA modificado com fosfo-tioato (Taylor (1985) "The use of fosforothioate-modified DNA in restrictionenzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13: 8749-8764;Taylor (1985) "The rapid generation of oligonucleotide-directed mutations athigh frequency using fosforothioate-modified DNA" Nucl. Acids Res. 13:8765-8787 (1985); Nakamaye (1986) "Inhibition of restriction endonucleaseNei I cleavage by fosforothioate groups and its application to oligonucleotide-directed mutagenesis" Nucl. Acids Res. 14: 9679-9698; Sayers (1988) "Y-TExonucleases in fosforothioate-based oligonucleotídeo-directed mutagene-sis" Nucl. Acids Res. 16:791-802; e Sayers e outros (1988) "Strand specificcleavage of fosforothioate-containing DNA by reaction with restriction endo-nucleases in the presence of ethidium bromide" Nucl. Acids Res. 16: 803-814); mutagênese utilizando DNA em dúplex com espaços (Kramer e outros(1984) "The gapped dúplex DNA approach to oligonucleotide-directed muta-tion construction" Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Me-thods in Enzymol. "Oligonucleotide-directed construction of mutations videgapped dúplex DNA" 154:350-367; Kramer (1988) "Improved enzymatic invitro reactions in the gapped dúplex DNA approach to oligonucleotide-directed construction of mutations" Nucl. Acids Res. 16: 7207; e Fritz (1988)"Oligonucleotide-directed construction of mutations: a gapped dúplex DNAprocedure without enzymatic reactions in vitro" Nucl. Acids Res. 16: 6987-6999).
Os protocolos adicionais que podem ser utilizados para a práticada invenção incluem reparo de pareamentos errados pontuais (Kramer(1984) "Point Mismatch Repair" Cell 38:879-887), mutagênese utilizando ce-pas hospedeiras deficientes em relação ao reparo (Carter e outros (1985)"Improved oligonucleotide site-directed mutagenesis using M13 vectors" Nu-cl. Acids Res. 13: 4431-4443; e Carter (1987) "Improved oligonucleotide-directed mutagenesis using M13 vectors" Methods in Enzymol. 154: 382-403), mutagênese de deleção (Eghtedarzadeh (1986) "Use of oligonucleoti-des to generate Iarge deletions" Nucl. Acids Res. 14: 5115), seleção de res-trição e purificação por seleção de restrição e por restrição (Wells e outros(1986) "Importance of hydrogen-bond formation in stabilizing the transitionstate of subtilisin" Phil. Trans. R. Soe. Lond. A 317: 415-423), mutagêneseatravés da síntese do gene total (Nambiar e outros (1984) "Total synthesisand cloning of a gene coding for the ribonuclease S protein" Science 223:1299-1301; Sakamar e Khorana (1988) "Total synthesis and expressão of agene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin)" Nucl. Acids Res. 14: 6361-6372; Wells e outros(1985) "Cassette mutagenesis: an efficient method for generation of multiplemutations at defined sites" Gene 34:315-323; e Grundstrom e outros (1985)
"Oligonucleotide-directed mutagenesis by microscale 'shot-gun' gene syn-thesis" Nucl. Acids Res. 13: 3305-3316), reparo de quebras em filamentoduplo (Mandecki (1986); Arnold (1993) "Protein engineering for unusual envi-ronments" Current Opinion in Biotechnology 4:450-455. "Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a methodfor site-specific mutagenesis" Proc. Natl. Acad. Sei. USA, 83:7177-7181). Osdetalhes adicionais sobre muitos dos métodos acima podem ser encontradosem Methods in Enzymology Volume 154, que descreve também controlesúteis para solucionar problemas com vários métodos de mutagênese.
Os protocolos que podem ser utilizados para a prática da inven-ção são descritos, tal como na Patente U.S. N0 5.605.793 a Stemmer (25 defevereiro de 1997), "Methods for In Vitro Recombination"; Patente U.S. N05.811.238 a Stemmer e outros (22 de setembro de 1998) "Methods for Ge-nerating Polynucleotides having Desired Characteristics by Iterative Selecti-on and Recombination"; Patente U.S. N0 5.830.721 a Stemmer e outros (3de novembro de 1998), "DNA Mutagenesis by Random Fragmentation andReassembly"; Patente U.S. N0 5.834.252 a Stemmer e outros (10 de novem-bro de 1998) "End-Complementary Polimerase Reaction"; Patente U.S. N05.837.458 a Minshull e outros (17 de novembro de 1998), "Methods andCompositions for Cellular and Metabolie Engineering"; WO 95/22625, Stem-mer e Crameri, "Mutagenesis by Random Fragmentation and Reassembly";WO 96/33207 por Stemmer e Lipsehutz "End Complementary PolimeraseChain Reaction"; WO 97/20078 por Stemmer e Crameri "Methods for Gene-rating Polynucleotides having Desired Charaeteristies by Iterative Seleetionand Recombination"; WO 97/35966 por Minshull e Stemmer, "Methods andCompositions for Cellular and Metabolic Engineering"; WO 99/41402 porPunnonen e outros "Targeting of Genetic Vaccine Vectors"; WO 99/41383por Punnonen e outros "Antigen Library Immunization"; WO 99/41369 porPunnonen e outros "Genetic Vaccine Veetor Engineering"; WO 99/41368 porPunnonen e outros "Optimization of Immunomodulatory Properties of Gene-tic Vaccines"; EP 752008 por Stemmer e Crameri, "DNA Mutagenesis byRandom Fragmentation and Reassembly"; EP 0932670 por Stemmer "Evol-ving Cellular DNA Uptake by Recursive Sequence Recombination"; WO99/23107 por Stemmer e outros, "Modification of Virus Tropism and HostRange by Viral Genome Shuffling"; WO 99/21979 por Apt e outros, "HumanPapillomavirus Vectors"; WO 98/31837 por dei Cardayre e outros "Evolutionof Whole Cells and Organisms by Recursive Sequence Recombination"; WO98/27230 por Patten e Stemmer, "Methods and Compositions for PolypeptideEngineering"; WO 98/27230 por Stemmer e outros, "Methods for Optimizati-on of Gene Therapy by Recursive Sequence Shuffling and Selection", WO00/00632, "Methods for Generating Highly Diverse Libraries", WO 00/09679,"Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banksand Resulting Sequences", WO 98/42832 por Arnold e outros, "Recombina-tion of Polynucleotide Sequences Using Random or Defined Primers", WO99/29902 por Arnold e outros, "Method for Creating Polynucleotide and Poly-peptide Sequences", WO 98/41653 por Vind, "An in Vitro Method for Cons-truction of a DNA Library", WO 98/41622 por Borchert e outros, "Method forConstructing a Library Using DNA Shuffling" e WO 98/42727 por Pati e Zar-è ling, "Sequence Alterations using Homologous Recombination".
Os protocolos que podem ser utilizados na prática da invenção(que fornecem detalhes em relação aos vários métodos de obtenção de di-versidade) são descritos, tal como no Pedido de Patente U.S. N0 de série(USSN) 09/407.800, "SHUFFLING OF CODON ALTERED GENES" por Pat-ten e outros depositado em 28 de setembro de 1999; "EVOLUTION OFWHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOM-BINATION" por dei Cardayre e outros, Patente U.S. N0 6.379.964; OLIGO-NUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION" por Cramerie outros, Patentes U.S. N25 6.319.714; 6.368.861; 6.376.246; 6.423.542;6.426.224 e PCT/US00/01203; "USE OF CODON-VARIED OLIGONUCLE-OTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING" por Welch e outros,Patente U.S. N0 6.436.675; "METHODS FOR MAKING CHARACTER S-TRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIREDCHARACTERISTICS" por Selifonov e outros, depositada em 18 de janeirode 2000, (PCT/US00/01202) e, tal como "METHODS FOR MAKING CHA-RACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVINGDESIRED CHARACTERISTICS" por Selifonov e outros, depositado em 18de julho de 2000 (Patente U.S. N0 de Série 09/618.579); "METHODS OFPOPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMU-LATIONS" por Selifonov e Stemmer, depositada em 18 de janeiro de 2000(PCT/US00/01138); e "SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLA-TION" por Affholter, depositado em 6 de setembro de 2000 (Patente U.S. N0de Série 09/656.549); e Patentes U.S. N22 6.177.263; 6.153.410.
Os métodos não-estocásticos ou de "evolução direcionada" in-cluem, tal como mutagênese de saturação, tal como Mutagênese de Satura-ção de Sítio Gênico (GSSM), remontagem de ligação sintética (SLR) ou umacombinação das mesmas é utilizada para modificar os ácidos nucléicos deacordo com a invenção para gerar enzimas aldolase, tal como piruvato aldo-lase1 tal como HMG e/ou KHG aldolase com propriedades novas ou altera-das (tal como a atividade sob condições altamente ácidas ou alcalinas, tem-peraturas altas ou baixas e similares). Os polipeptídeos codificados pelosácidos nucléicos modificados podem ser verificados em relação a uma ativi-dade antes de testar em relação à formação ou à clivagem de ligações car-bono-carbono ou outra atividade. Qualquer modalidade de teste ou protocolopode ser utilizado, tal como a utilização de uma plataforma com arranjo capi-lar. Vide as Patentes U.S. N25 6.361.974; 6.280.926; 5.939.250.Mutaaênese de Saturação de Sítio Gênico ou GSSM
A invenção fornece ainda métodos para a produção de enzimautilizando a Mutagênese de Saturação de Sítio Gênico ou GSSM, que é des-crita aqui e também nas Patentes U.S. N- 6.171.820 e 6.579.258. Em algu-mas modalidades, iniciadores de códons contendo uma seqüência N,N,G/Tdegenerada são utilizados para introduzir mutações pontuais em um polinu-cleotídeo, tal como uma enzima aldolase, tal como piruvato aldolase, HMGe/ou KHG aldolase ou um anticorpo de acordo com a invenção, de forma agerar um conjunto de polipeptídeos de progênie em que uma faixa completade substituições de aminoácidos isolados é representada em cada posiçãode aminoácido, tal como um resíduo de aminoácido em um sítio ativo da en-zima ou um sítio de ligação ao Iigante direcionado para ser modificado. Es-tes oligonucleotídeos podem compreender uma primeira seqüência homólo-ga contígua, uma seqüência N,N,G/T degenerada e, opcionalmente, umasegunda seqüência homóloga. Os produtos da tradução da progênie a ju-sante provenientes do uso de tais oligonucleotídeos incluem todas as altera-ções de aminoácidos possíveis em cada sítio de aminoácido ao longo dopolipeptídeo, porque a degeneração da seqüência N,N,G/T inclui códonspara todos os 20 aminoácidos. Em algumas modalidades, um tal oligonucle-otídeo degenerado (compreendido de, tal como um cassete N,N,G/T dege-nerado) é utilizado para submeter cada códon original no molde de polinu-cleotídeo parental a uma faixa completa de substituições de códons. Em ou-tras modalidades, pelo menos dois cassetes degenerados são utilizados - nomesmo oligonucleotídeo ou não, para submeter pelo menos dois códonsoriginais em um molde de polinucleotídeo parental a uma faixa completa desubstituições de códons. Por exemplo, mais de uma seqüência N,N,G/T po-de estar contida em um oligonucleotídeo para introduzir mutações de amino-ácidos em mais de um sítio. Este grande número de seqüências N,N,G/Tpode ser diretamente contíguo ou separado por uma ou mais seqüências denucleotídeos adicionais. Em outras modalidades, os oligonucleotídeos quepodem servir para a introdução de adições e deleções podem ser utilizadosisoladamente ou em combinação com os códons contendo uma seqüênciaN,N,G/T, para introduzir qualquer combinação ou permutação de adições,deleções e/ou substituições de aminoácidos.
Em algumas modalidades, a mutagênese simultânea de duas oumais posições de aminoácidos contíguas é feita utilizando um oligonucleotí-deo que contém tripletos de N,N,G/T contíguos, isto é, uma seqüência(N,N,G/T)n degenerada. Em outras modalidades, são utilizados os cassetesdegenerados que possuem menos degeneração que a seqüência N,N,G/T.
Por exemplo, pode ser desejável em alguns casos utilizar (tal como em umoligonucleotídeo) uma seqüência em tripleto degenerada compreendida a-penas de um N, em que o dito N pode estar na primeira, na segunda ou naterceira posição do tripleto. Quaisquer outras bases incluindo combinações epermutações das mesmas podem ser utilizadas nas duas posições restantesdo tripleto. Alternativamente, pode ser desejável em alguns casos utilizar (talcomo em um oligo) uma seqüência em tripleto Ν,Ν,Ν degenerada.
Em algumas modalidades, o uso de tripletos degenerados (taiscomo tripletos N,N,G/T) permite a produção sistemática e fácil de uma faixacompleta de aminoácidos naturais possíveis (para um total de 20 aminoáci-dos) em cada uma e toda posição de aminoácido em um polipeptídeo (emoutras modalidades, os métodos incluem ainda a produção de menos quetodas as substituições possíveis por resíduo ou códon, posição de aminoáci-do). Por exemplo, para um polipeptídeo de 100 aminoácidos, podem ser ge-radas 2000 espécies distintas (isto é, 20 aminoácidos possíveis por posiçãoX 100 posições de aminoácidos). Através do uso de um oligonucleotídeo oude um conjunto de oligonucleotídeos contendo um tripleto N,N,G/T degene-rado, 32 seqüências individuais podem codificar todos os 20 aminoácidosnaturais possíveis. Assim, em um recipiente de reação em que uma seqüên-cia de polinucleotídeo parental é submetida à mutagênese de saturação utili-zando pelo menos um tal oligonucleotídeo, são gerados 32 polinucleotídeosde progênie possíveis que codificam 20 polipeptídeos distintos. Em contras-te, o uso de um oligonucleotídeo não degenerado na mutagênese direciona-da ao sítio leva a apenas um produto de polipeptídeo de progênie por recipi-ente de reação. Os oligonucleotídeos não degenerados podem opcionalmen-te ser utilizados em combinação com os iniciadores degenerados divulga-dos; por exemplo, os oligonucleotídeos não degenerados podem ser utiliza-dos para gerar mutações pontuais específicas em um polinucleotídeo de tra-balho. Isto fornece um meio para gerar mutações pontuais silenciosas espe-cíficas, mutações pontuais que levam a alterações de aminoácidos corres-pondentes e mutações pontuais que causam a produção de códons de tér-mino e a expressão correspondente de fragmentos polipeptídicos.
Em algumas modalidades, cada recipiente de reação de muta-gênese de saturação contém polinucleotídeos que codificam pelo menos 20moléculas de polipeptídeos de progênie (tais como enzimas aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase) de forma quetodos os 20 aminoácidos naturais são representados em uma posição deaminoácido específica que corresponde à posição do códon que sofre muta-gênese no polinucleotídeo parental (outras modalidades utilizam menos quetodas as 20 combinações naturais). Os polipeptídeos de progênie degenera-dos 32 vezes gerados partindo de cada recipiente de reação de mutagênesede saturação podem ser submetidos à amplificação clonal (tal como clona-dos em um hospedeiro adequado, tal como um hospedeiro de E. coli, utili-zando, tal como um vetor de expressão) e submetidos à seleção de expres-são. Quando é identificado através da seleção que um polipeptídeo de pro-gênie individual exibe uma alteração favorável na propriedade (quando com-parado com o polipeptídeo parental, tal como maior atividade de formaçãoou de clivagem de carbono-carbono sob condições alcalinas ou ácidas), estepode ser seqüenciado para identificar a substituição de aminoácido corres-pondente favorável contida no mesmo.
Em algumas modalidades, após a mutagênese de cada e toda aposição de aminoácido em um polipeptídeo parental utilizando a mutagêne-se de saturação que é divulgada aqui, as alterações de aminoácidos favorá-veis podem ser identificadas em mais de uma posição de aminoácido. Podeser gerada uma ou mais novas moléculas de progênie que contêm umacombinação de todas ou parte destas substituições de aminoácidos favorá-veis. Por exemplo, se 2 alterações de aminoácidos favoráveis específicasforem identificadas em cada uma das 3 posições de aminoácido em um poli-peptídeo, as permutações incluem 3 possibilidades em cada posição (ne-nhuma alteração do aminoácido original e cada uma de duas alterações fa-voráveis) e 3 posições. Assim, há 3 χ 3 χ 3 ou 27 possibilidades totais, inclu-indo 7 que foram verificadas anteriormente - 6 mutações pontuais isoladas(isto é, 2 em cada uma de três posições) e nenhuma alteração em qualquerposição.
Ainda em uma outra modalidade, a mutagênese de saturação desítio pode ser utilizada junto com o embaralhamento, a quimerização, a re-combinação e outros processos de mutagênese, junto com a seleção. Estainvenção fornece o uso de qualquer(quaisquer) processo(s) de mutagênese,incluindo a mutagênese de saturação, de uma maneira iterativa. Em um e-xemplo, o uso iterativo de qualquer(quaisquer) processo(s) de mutagênese éfeito em combinação com a seleção.
A invenção fornece ainda o uso de iniciadores de códons depropriedade (contendo uma seqüência Ν,Ν,Ν degenerada) para introduzirmutações pontuais em um polinucleotídeo, de forma a gerar um conjunto depolipeptídeos de progênie em que uma faixa completa de substituições deum único aminoácido é representada em cada posição de aminoácido (Mu-tagênese de Saturação de Sítio Gênico (GSSM)). Os oligos utilizados sãocompreendidos contiguamente de uma primeira seqüência homóloga, umaseqüência Ν,Ν,Ν degenerada e, em algumas modalidades, mas não neces-sariamente, uma segunda seqüência homóloga. Os produtos da tradução deprogênie a jusante provenientes do uso de tais oligos incluem todas as alte-rações de aminoácidos possíveis em cada sítio de aminoácido ao longo dopolipeptídeo, porque a degeneração da seqüência Ν,Ν,Ν inclui códons paratodos os 20 aminoácidos.
Em algumas modalidades, um tal oligo degenerado (compreen-dido de um cassete Ν,Ν,Ν degenerado) é utilizado para submeter cada có-don original em um molde de polinucleotídeo parental a uma faixa completade substituições de códons. Em outras modalidades, pelo menos dois casse-tes Ν,Ν,Ν degenerados são utilizados - no mesmo oligo ou não, para subme-ter pelo menos dois códons originais em um molde de polinucleotídeo paren-tal a uma faixa completa de substituições de códons. Assim, mais de umaseqüência Ν,Ν,Ν pode estar contida em um oligo para introduzir mutaçõesde aminoácidos em mais de um sítio. Este grande número de seqüênciasΝ,Ν,Ν pode estar diretamente contíguo ou separado por uma ou mais se-qüências de nucleotídeos adicionais. Em outras modalidades, os oligos úteispara a introdução de adições e deleções podem ser utilizados isoladamenteou em combinação com os códons que contêm uma seqüência Ν,Ν,Ν, paraintroduzir qualquer combinação ou permutação de adições, deleções e/ousubstituições de aminoácidos.
Em algumas modalidades, é possível mutagenizar simultanea-mente duas ou mais posições de aminoácidos contíguas utilizando um oligoque contém tripletos Ν,Ν,Ν, isto é, uma seqüência (N,N,N)n degenerada. Emoutras modalidades, a presente invenção fornece o uso de cassetes degene-rados que possuem menos degeneração que a seqüência Ν,Ν,Ν. Por exem-plo, pode ser desejável em alguns casos utilizar (tal como em um oligo) umaseqüência de tripleto degenerada compreendida de apenas um N, em que oN pode estar na primeira, na segunda ou na terceira posição do tripleto.
Quaisquer outras bases incluindo quaisquer combinações e permutaçõesdas mesmas podem ser utilizadas nas duas posições restantes do tripleto.Alternativamente, pode ser desejável em alguns casos utilizar (tal como emum oligo) uma seqüência de tripleto Ν,Ν,Ν degenerada N,N,G/T ou uma se-qüência de tripleto N,N, G/C.
Em algumas modalidades, o uso de um tripleto degenerado (talcomo N,N,G/T ou uma seqüência de tripleto N,N, G/C) é vantajoso por váriasrazões. Em algumas modalidades, esta invenção fornece meios para gerarsistematicamente e bastante facilmente a substituição da faixa completa deaminoácidos possíveis (para um total de 20 aminoácidos) em cada e todaposição de aminoácido em um polipeptídeo. Assim, para um polipeptídeo de100 aminoácidos, a invenção fornece maneiras de gerar sistematicamente ebastante facilmente 2000 espécies distintas (isto é, 20 aminoácidos possí-veis por posição vezes 100 posições de aminoácido). É considerado que éfornecido, através do uso de um oligo contendo um N,N,G/T degenerado ouuma seqüência de tripleto N,N, G/C, 32 seqüências individuais que codificam20 aminoácidos possíveis. Assim, em um recipiente de reação em que umaseqüência de polinucleotídeo parental é submetida à mutagênese de satura-ção utilizando um tal oligo, são gerados 32 polinucleotídeos de progênie dife-rentes que codificam 20 polipeptídeos distintos. Em contraste, o uso de umoligo não degenerado na mutagênese direcionada ao sítio leva a apenas umproduto de polipeptídeo de progênie por recipiente de reação.
Esta invenção fornece ainda o uso de oligos não degenerados,que podem ser opcionalmente utilizados em combinação com os iniciadoresdegenerados divulgados. É considerado que em algumas situações, é vanta-joso utilizar oligos não degenerados para gerar mutações pontuais específi-cas em um polinucleotídeo de trabalho. Isto fornece meios para gerar muta-ções pontuais silenciosas específicas, mutações pontuais que levam a alte-rações de aminoácidos correspondentes e mutações pontuais que causam aprodução de códons de término e a expressão correspondente de fragmen-tos polipeptídicos.
Assim, em algumas modalidades desta invenção, cada recipien-te de reação de mutagênese de saturação contém polinucleotídeos que codi-ficam pelo menos 20 moléculas de polipeptídeo de progênie de forma quetodos os 20 aminoácidos são representados em uma posição de aminoácidoespecífica que corresponde à posição do códon que sofreu mutagênese nopolínucleotídeo parental. Os polipeptídeos de progênie degenerados 32 ve-zes gerados partindo de cada recipiente de mutagênese de saturação po-dem ser submetidos à amplificação clonal (tal como clonados em um hospe-deiro de E. coli adequado utilizando um vetor de expressão) e submetidos àverificação da expressão. Quando é identificado através da verificação queum polipeptídeo de progênie individual exibe uma alteração favorável napropriedade (quando comparado com o polipeptídeo parental), este pode serseqüenciado para identificar a substituição de aminoácido favorável corres-pondente contida no mesmo.
Em algumas modalidades, após a mutagênese de cada e todaposição de aminoácido em um polipeptídeo parental utilizando a mutagêne-se de saturação que é divulgada aqui, alterações de aminoácidos favoráveissão identificadas em mais de uma posição de aminoácido. Pode ser geradauma ou mais novas moléculas de progênie que contêm uma combinação detodas ou de parte destas substituições de aminoácidos favoráveis. Por e-xemplo, se 2 alterações de aminoácidos favoráveis específicas forem identi-ficadas em cada uma das 3 posições de aminoácido em um polipeptídeo, aspermutações incluem 3 possibilidades em cada posição (nenhuma alteraçãodo aminoácido original e cada uma de duas alterações favoráveis) e 3 posi-ções. Assim, há 3 χ 3 χ 3 ou 27 possibilidades totais, incluindo 7 que forampreviamente verificadas - 6 mutações pontuais isoladas (isto é, 2 em cadauma de três posições) e nenhuma alteração em qualquer posição.
A invenção fornece o uso da mutagênese de saturação em com-binação com processos de mutagênese adicionais, tal como o processo emque dois ou mais polinucleotídeos relacionados são introduzidos em umacélula hospedeira adequada de forma que um polínucleotídeo híbrido é ge-rado através da recombinação e do reaporção redutivo.
Em adição à realização da mutagênese ao longo da seqüênciainteira de um gene, a presente invenção mostra que a mutagênese pode serutilizada para substituir qualquer um de um número de bases em uma se-qüência de polínucleotídeo, em que o número de bases que será submetidoà mutagênese é, em algumas modalidades cada número inteiro de 15 até100.000. Assim, ao invés de submeter à mutagênese cada posição ao longode uma molécula, pode-se submeter todas ou um número de bases distinto(em algumas modalidades um subconjunto totalizando 15 até 100.000) àmutagênese. Em algumas modalidades, um nucleotídeo separado é utilizadopara mutagenizar cada posição ou grupo de posições ao longo de uma se-qüência de polinucleotídeo. Um grupo de 3 posições que será submetido àmutagênese pode ser um códon. As mutações podem ser introduzidas utili-zando um iniciador mutagênico, contendo um cassete heterólogo, tambémreferido como um cassete mutagênico. Os exemplos de cassetes podem terde 1 até 500 bases. Cada posição de nucleotídeo em tais cassetes heterólo-gos é N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T,A/C/G ou E, em que E é qualquer base que não é A, C, G ou T (E pode serreferida como um oligo de planejamento).
Em algumas modalidades, a mutagênese de saturação é com-preendida da mutagênese de um conjunto completo de cassetes mutagêni-cos (em que cada cassete tem, em algumas modalidades, aproximadamente1-500 bases de comprimento) na seqüência de polinucleotídeo definida queserá submetida à mutagênese (em que a seqüência que será submetida àmutagênese tem, em algumas modalidades, de aproximadamente 15 até100.000 bases de comprimento). Assim, um grupo de mutações (variando de1 até 100 mutações) é introduzido em cada cassete que será submetido àmutagênese. Um aporção de mutações que será introduzido em um cassetepode ser diferente ou o mesmo de um segundo aporção de mutações queserá introduzido em um segundo cassete durante a aplicação de uma roda-da de mutagênese de saturação. Tais aporçãos são exemplificados por de-leções, adições, aporçãos de códons particulares e aporçãos de cassetes denucleotídeos particulares.
Em algumas modalidades, as seqüências definidas que serãosubmetidas à mutagênese incluem um gene inteiro, uma vide, um cDNA, umquadro aberto de leitura (ORF) inteiro e um promotor inteiro, um intensifica-dor, um repressor/transativador, uma origem de replicação, um íntron, umoperador ou qualquer grupo funcional de polinucleotídeo. Geralmente, "se-qüências definidas" para esta finalidade podem ser qualquer polinucleotídeoque seja uma seqüência de polinucleotídeo de 15 bases e seqüências depolinucleotídeos de comprimentos entre 15 bases e 15.000 bases (esta in-venção cita especificamente cada número inteiro intermediário). As conside-rações na escolha dos aporçãos de códons incluem tipos de aminoácidoscodificados por um cassete mutagênico degenerado.
Em algumas modalidades, um aporção de mutações que podeser introduzido em um cassete mutagênico, esta invenção fornece especifi-camente substituições de códons (utilizando oligos degenerados) que codifi-cam 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 e 20 aminoáci-dos em cada posição e uma biblioteca de polipeptídeos codificados pelosmesmos.
Remontaaem de Ligação Sintética (SLR)
A invenção fornece um sistema de modificação gênica não-estocástico denominado "remontagem de ligação sintética" ou simplesmente"SLR", um "processo de evolução direcionada", para gerar polipeptídeos,tais como enzimas aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase ou anticorpos de acordo com a invenção, com propriedadesnovas ou alteradas.
A SLR é um método de ligação de fragmentos de oligonucleotí-deo de forma não-estocástica. Este método difere do embaralhamento deoligonucleotídeos estocástico pelo fato de que os blocos de constructo deácido nucléico não são embaralhados, concatenados ou quimerizados deforma aleatória, mas ao invés disso, são montados de forma não-estocástica. Vide as Patentes U.S. N25 6.773.900; 6.740.506; 6.713.282;6.635.449; 6.605.449; 6.537.776. Em algumas modalidades, a SLR compre-ende as etapas a seguir: (a) fornecimento de um polinucleotídeo molde, emque o polinucleotídeo molde compreende uma seqüência que codifica umgene homólogo: (b) fornecimento de um grande número de polinucleotídeosde bloco de constructo, em que os polinucleotídeos de bloco de constructosão planejados para a remontagem por "cross-over" com o polinucleotídeomolde em uma seqüência predeterminada e um polinucleotídeo de bloco deconstructo compreende uma seqüência que é uma variação do gene homó-logo e uma seqüência homóloga ao polinucleotídeo molde flanqueando aseqüência variante; (c) combinação de um polinucleotídeo de bloco de cons-tructo com um polinucleotídeo molde de forma que o polinucleotídeo de blo-6 co de constructo sofra remontagem por "cross-over" com o polinucleotídeopara gerar polinucleotídeos que compreendem variações da seqüência dogene homólogo.
A SLR não depende da presença de altos níveis de homologiaentre os polinucleotídeos que sofrerão rearranjo. Assim, este método podeser utilizado para gerar de forma não-estocástica bibliotecas (ou conjuntos)de moléculas de progênie compreendidas de mais de 10100 quimeras dife-rentes. A SLR pode ser utilizada para gerar bibliotecas compreendidas demais de io1000 quimeras de progênie diferentes. Assim, as modalidades dapresente invenção incluem métodos não-estocásticos de produção de umconjunto de moléculas de ácidos nucléicos quiméricas finalizadas passandopor perto de uma ordem de montagem geral que é escolhida pelo planeja-mento. Este método inclui as etapas de produção através do planejamentode um grande número de blocos de constructo de ácidos nucléicos específi-cos que possuem extremidades que podem ser ligadas mutuamente compa-tíveis úteis e de montagem destes blocos de constructo de ácidos nucléicos,de forma que uma ordem de montagem geral planejada é conseguida.
As extremidades que podem ser ligadas mutuamente compatí-veis dos blocos de constructo de ácidos nucléicos que serão montados sãoconsideradas como sendo "úteis" para este tipo de montagem ordenada sepossibilitarem que os blocos de constructo sejam acoplados em ordens pre-determinadas. Assim, a ordem de montagem geral em que os blocos deconstructo de ácidos nucléicos podem ser acoplados é especificada peloplanejamento das extremidades que podem ser ligadas. Se mais de umaetapa de montagem tiver que ser utilizada, a ordem de montagem geral emque os blocos de constructo de ácidos nucléicos podem ser acoplados étambém especificada pela ordem seqüencial da(s) etapa(s) de montagem.Em algumas modalidades, os pedaços de constructo anelados são tratadoscom uma enzima, tal como uma Iigase (tal como T4 DNA ligase), para con-seguir a ligação covalente dos pedaços de constructo.
Em algumas modalidades, o planejamento dos blocos de cons-tructo de oligonucleotídeos é obtido através da análise de um conjunto demoldes de seqüências de ácidos nucléicos progenitoras que servem comouma base para a produção de um conjunto de progênie de polinucleotídeosquiméricos finalizados. Estes moldes de oligonucleotídeos parentais servemassim como uma fonte de informação de seqüência que auxilia no planeja-mento dos blocos de constructo de ácidos nucléicos que serão submetidos àmutagênese, tal como quimerizados ou embaralhados. Em algumas modali-dades deste método, as seqüências de um grande número de moldes deácidos nucléicos parentais são alinhadas com a finalidade de selecionar umou mais pontos de demarcação. Os pontos de demarcação podem ser loca-lizados em uma área de homologia e são compreendidos de um ou maisnucleotídeos. Estes pontos de demarcação são, em algumas modalidades,compartilhados por pelo menos dois dos moldes progenitores. Os pontos dedemarcação podem ser assim utilizados para delinear os limites dos blocosde constructo de oligonucleotídeos que serão gerados com a finalidade derearranjar os polinucleotídeos parentais. Os pontos de demarcação identifi-cados e selecionados nas moléculas progenitoras servem como pontos dequimerização potenciais na montagem das moléculas de progênie quiméri-cas finais. Um ponto de demarcação pode ser uma área de homologia (com-preendida de pelo menos uma base nucleotídica homóloga) compartilhadapor pelo menos duas seqüências de polinucleotídeos parentais. Alternativa-mente, um ponto de demarcação pode ser uma área de homologia que écompartilhada por pelo menos a metade das seqüências de polinucleotídeosparentais ou pode ser uma área de homologia que é compartilhada por pelomenos dois terços das seqüências de polinucleotídeos parentais. Aindamais, em algumas modalidades, um ponto de demarcação útil é uma área dehomologia que é compartilhada por pelo menos três quartos das seqüênciasde polinucleotídeos parentais ou pode ser compartilhada por quase todas asseqüências de polinucleotídeos parentais. Em algumas modalidades, umponto de demarcação é uma área de homologia que é compartilhada portodas as seqüências de polinucleotídeos parentais.
Em algumas modalidades, um processo de remontagem de liga-ção é realizado exaustivamente com a finalidade de gerar uma bibliotecaexaustiva de polinucleotídeos quiméricos de progênie. Em outras palavras,todas as combinações ordenadas possíveis dos blocos de constructo de áci-dos nucléicos são representadas no conjunto de moléculas de ácidos nucléi-cos quiméricas finalizadas. Ao mesmo tempo, em outras modalidades, a or-dem de montagem (isto é, a ordem de montagem de cada bloco de construc-to na seqüência 5' a 3' de cada ácido nucléico quimérico finalizado) em cadacombinação é através do planejamento (ou não-estocástica) como descritoanteriormente. Devido à natureza não-estocástica desta invenção, a possibi-lidade de subprodutos indesejados é enormemente reduzida.
Em outras modalidades, o método de remontagem de ligação érealizado de forma sistemática. Por exemplo, o método é realizado com afinalidade de gerar uma biblioteca compartimentalizada sistematicamente demoléculas de progênie, com compartimentos que podem ser verificados deforma sistemática, tal como um por um. Em outras palavras, esta invençãofornece que, através do uso seletivo e criterioso de blocos de constructo deácidos nucléicos específicos, acoplado com o uso seletivo e criterioso dereações de montagem em etapas sistemáticas, um planejamento pode serconseguido quando conjuntos específicos de produtos de progênie são feitosem cada um dos vários recipientes de reação. Isto permite que um procedi-mento de exame e verificação sistemático seja realizado. Assim, estes mé-todos permitem que um número potencialmente muito grande de moléculasde progênie seja verificado de forma sistemática em grupos menores. Devi-do a sua capacidade de realizar quimerizações de uma maneira que é alta-mente flexível e ainda exaustiva e sistemática também, particularmentequando há um baixo nível de homologia entre as moléculas progenitoras,estes métodos possibilitam a produção de uma biblioteca (ou conjunto) com-preendida de um grande número de moléculas de progênie. Devido à natu-reza não-estocástica da presente invenção de remontagem de ligação, asmoléculas de progênie geradas em algumas modalidades compreendemuma biblioteca de moléculas de ácidos nucléicos quiméricas finalizadas quepossuem uma ordem de montagem geral que é escolhida pelo planejamen-to. A mutagênese de saturação e os métodos de evolução djrecionada otimi-zada também podem ser utilizados para gerar espécies moleculares de pro-gênie diferentes. É considerado que a invenção fornece liberdade de escolhae controle em relação à seleção de pontos de demarcação, do tamanho e donúmero dos blocos de constructo de ácidos nucléicos e do tamanho e doplanejamento dos acoplamentos. É considerado, além disso, que o requeri-mento de homologia intermolecular é altamente relaxado para a operabilida-de desta invenção. Na verdade, os pontos de demarcação podem ainda serescolhidos em áreas de pouca ou nenhuma homologia intermolecular. Porexemplo, devido à oscilação dos códons, isto é, a degeneração de códons,substituições de nucleotídeos podem ser introduzidas nos blocos de cons-tructo de ácidos nucléicos sem alterar o aminoácido codificado originalmenteno molde progenitor correspondente. Alternativamente, um códon pode seralterado de forma que a codificação de um aminoácido original seja alterada.
Esta invenção mostra que tais substituições podem ser introduzidas no blocode constructo de ácido nucléico com a finalidade de aumentar a incidênciade pontos de demarcação intermoleculares homólogos e assim permitir queum número maior de acoplamentos seja atingido entre os blocos de cons-tructo, que por sua vez permite que um número maior de moléculas quiméri-cas de progênie seja gerado.
Remontaaem Gênica Sintética
Em algumas modalidades, a presente invenção fornece um mé-todo não-estocástico denominado remontagem gênica sintética, que é dealguma maneira relacionada com o embaralhamento estocástico, exceto queos blocos de constructo de ácidos nucléicos não são embaralhados ou con-catenados ou quimerizados de forma aleatória, mas, ao invés disso, sãomontados de forma não-estocástica. Vide a Patente U.S. N0 6.537.776.
O método de remontagem gênica sintética não depende da pre-sença de um alto nível de homologia entre os polinucleotídeos que serãoembaralhados. A invenção pode ser utilizada para gerar bibliotecas (ou con-juntos) de forma não-estocástica de moléculas de progênie compreendidasde mais de 10100 quimeras diferentes. De modo concebível, a remontagemgênica sintética pode ainda ser utilizada para gerar bibliotecas compreendi-é das de mais de 1o1000 quimeras de progênie diferentes.
Assim, em algumas modalidades, a invenção fornece um méto-do não-estocástico de produção de um conjunto de moléculas de ácidos nu-cléicos quiméricas finalizadas que possuem uma ordem de montagem geralque é escolhida por planejamento, cujo método é compreendido das etapasde produção através de planejamento de um grande número de blocos deconstructo de ácidos nucléicos específicos que possuem extremidades quepodem ser ligadas mutuamente compatíveis úteis e da montagem destesblocos de constructo de ácidos nucléicos, de forma que uma ordem de mon-tagem geral planejada é conseguida.
As extremidades que podem ser ligadas mutuamente compatí-veis dos blocos de constructo de ácidos nucléicos que serão montados sãoconsideradas como sendo "úteis" para este tipo de montagem ordenada sepossibilitarem que os blocos de constructo sejam acoplados em ordens pre-determinadas. Assim, em algumas modalidades, a ordem de montagem ge-ral em que os blocos de constructo de ácidos nucléicos podem ser acopla-dos é especificada pelo planejamento das extremidades que podem ser liga-das e, se mais de uma etapa de montagem tiver que ser utilizada, então aordem de montagem geral em que os blocos de constructo de ácidos nucléi-cos podem ser acoplados é também especificada pela ordem seqüencialda(s) etapa(s) de montagem. Em uma modalidade da invenção, os pedaçosde constructo anelados são tratados com uma enzima, tal como uma Iigase(tal como T4 DNA ligase) para conseguir a ligação covalente dos pedaços deconstructo.
Em uma outra modalidade, o planejamento dos blocos de cons-tructo de ácidos nucléicos é obtido após a análise das seqüências de umconjunto de moldes de ácidos nucléicos progenitores que servem como umabase para a produção de um conjunto de progênie de moléculas de ácidosnucléicos quiméricas finalizadas. Estes moldes de ácidos nucléicos progeni-tores servem assim como uma fonte de informação de seqüência que auxiliano planejamento dos blocos de constructo de ácidos nucléicos que serãosubmetidos à mutagênese, isto é, quimerizados ou embaralhados.
Em um exemplo, a invenção fornece a quimerização de uma fa-mília de genes relacionados e sua família codificada de produtos relaciona-dos. Em um exemplo particular, os produtos codificados são enzimas. Asenzimas aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-Iase da presente invenção podem sofrer mutagênese de acordo com os mé-todos descritos aqui.
Assim, de acordo com uma modalidade da invenção, as seqüên-cias de um grande número de moldes de ácidos nucléicos progenitores (taiscomo polinucleotídeos de acordo com a invenção) são alinhadas com a fina-lidade de selecionar um ou mais pontos de demarcação, cujos pontos dedemarcação podem estar localizados em uma área de homologia. Os pontosde demarcação podem ser utilizados para delinear os limites dos blocos deconstructo de ácidos nucléicos que serão gerados. Assim, os pontos de de-marcação identificados e selecionados nas moléculas progenitoras servemcomo pontos de quimerização potenciais na montagem das moléculas deprogênie.
Em algumas modalidades, um ponto de demarcação útil é umaárea de homologia (compreendida de pelo menos uma base nucleotídicahomóloga) compartilhada por pelo menos dois moldes progenitores, mas oponto de demarcação pode ser uma área de homologia que é compartilhadapor pelo menos a metade dos moldes progenitores, pelo menos dois terçosdos moldes progenitores, pelo menos três quartos dos moldes progenitorese, em algumas modalidades, em quase todos os moldes progenitores. Aindamais, em algumas modalidades, também um ponto de demarcação útil éuma área de homologia que é compartilhada por todos os moldes progenitores.
Em uma modalidade, o processo de remontagem gênica é reali-zado exaustivamente com a finalidade de gerar uma biblioteca exaustiva.Em outras palavras, todas as combinações ordenadas possíveis dos blocosde constructo de ácidos nucléicos são representadas no conjunto de molécu-las de ácidos nucléicos quiméricas finalizadas. Ao mesmo tempo, a ordemde montagem (isto é, a ordem de montagem de cada bloco de constructo naseqüência 5' a 3' de cada ácido nucléico quimérico finalizado) em cada com-binação é através do planejamento (ou não-estocástica). Devido à naturezanão-estocástica do método, a possibilidade de subprodutos indesejados éenormemente reduzida.
Em outras modalidades, o método mostra que o processo deremontagem gênica é realizado de forma sistemática, por exemplo, para ge-rar uma biblioteca compartimentalizada sistemática, com compartimentosque podem ser verificados de forma sistemática, tal como um por um. Emoutras palavras, a invenção mostra que, através do uso seletivo e criteriosode blocos de constructo de ácidos nucléicos específicos, acoplado com ouso seletivo e criterioso de reações de montagem em etapas seqüenciais,um planejamento experimental pode ser conseguido quando conjuntos es-pecíficos de produtos de progênie são produzidos em cada um dos váriosrecipientes de reação. Isto permite que um procedimento de exame e verifi-cação sistemático seja realizado. Assim, permite que um número potencial-mente muito grande de moléculas de progênie seja verificado de forma sis-temática em grupos menores.
Devido a sua capacidade de realizar quimerizações de uma ma-neira que é altamente flexível e ainda exaustiva e sistemática também, parti-cularmente quando há um baixo nível de homologia entre as moléculas pro-genitoras, a presente invenção fornece a produção de uma biblioteca (ouconjunto) compreendida de um grande número de moléculas de progênie.Devido à natureza não-estocástica da presente invenção de remontagemgênica, as moléculas de progênie geradas em algumas modalidades com-preendem uma biblioteca de moléculas de ácidos nucléicos quiméricas fina-lizadas que possuem uma ordem de montagem geral que é escolhida atra-vés do planejamento. Em algumas modalidades, tal biblioteca produzida écompreendida de mais de 103 até mais de io1000 espécies moleculares deprogênie diferentes.
Em algumas modalidades, um conjunto de moléculas de ácidosnucléicos quiméricas finalizadas, produzido como descrito é compreendidode um polinucleotídeo que codifica um polipeptídeo. Em uma modalidade,este polinucleotídeo é um gene, que pode ser um gene feito pelo ser huma-no. Em uma outra modalidade, este polinucleotídeo é uma vide gênica, quepode ser uma vide gênica produzida pelo ser humano. Em algumas modali-dades, a invenção mostra que um ou mais genes feitos pelo ser humanogerados pela invenção podem ser incorporados em uma vide gênica feitapelo ser humano, tal como uma vide que pode ser operada em um organis-mo eucariótico (incluindo uma planta).
Em um outro exemplo, a natureza sintética da etapa em que osblocos de constructo são gerados permite o planejamento e a introdução denucleotídeos (tal como um ou mais nucleotídeos, que podem ser, por exem-plo, códons ou íntrons ou seqüências reguladoras) que podem ser posteri-ormente opcionalmente removidos em um processo in vitro (tal como atravésde mutagênese) ou em um processo in vivo (tal como através da utilizaçãoda capacidade de processamento de um organismo hospedeiro). É conside-rado que em muitos casos a introdução destes nucleotídeos pode tambémser desejável por muitas outras razões em adição ao benefício de criar umponto de demarcação útil.
Assim, em algumas modalidades, a invenção mostra que umbloco de constructo de ácido nucléico pode ser utilizado para introduzir umíntron. Assim, a invenção mostra que os íntrons podem ser introduzidos emum gene feito pelo ser humano de acordo com a invenção. Em algumas mo-dalidades, a invenção mostra ainda que íntrons funcionais podem ser intro-duzidos em uma vide gênica feita pelo ser humano de acordo com a inven-ção. Conseqüentemente, a invenção fornece a produção de um polinucleotí-deo quimérico que é um gene feito pelo ser humano que contém um (oumais) íntron(s) introduzido(s) artificialmente.
A invenção fornece ainda a produção de um polinucleotídeoquimérico que é uma vide gênica feita pelo ser humano que contém um (oumais) íntron(s) introduzido(s) artificialmente. Em algumas modalidades, o(s)íntron(s) introduzido(s) artificialmente são funcionais em uma ou mais célulashospedeiras para o processamento gênico muito no fato de que os íntronsque ocorrem naturalmente servem funcionalmente para o processamentoê gênico. Em algumas modalidades, a invenção fornece processos de produ-ção de polinucleotídeos contendo íntrons feitos pelo ser humano que serãointroduzidos nos organismos hospedeiros para recombinação e/ou proces-samento.
Um gene feito pelo ser humano produzido utilizando a invençãotambém pode servir como um substrato para recombinação com um outroácido nucléico. Similarmente, uma vide gênica feita pelo ser humano utili-zando a invenção também pode servir como um substrato para recombina-ção com um outro ácido nucléico. Em algumas modalidades, a recombina-ção é facilitada por ou ocorre em áreas de homologia entre o gene contendoíntrons produzido pelo ser humano e um ácido nucléico, que serve como umparceiro de recombinação. Em algumas modalidades, o parceiro de recom-binação pode também ser um ácido nucléico gerado pela invenção, incluindoum gene feito pelo ser humano ou uma vide gênica feita pelo ser humano. Arecombinação pode ser facilitada por ou pode ocorrer em áreas de homolo-gia que existem em um (ou mais) íntron(s) introduzido(s) artificialmente nogene feito pelo ser humano.
Em algumas modalidades, o método de remontagem gênica sin-tética de acordo com a invenção utiliza um grande número de blocos deconstructo de ácidos nucléicos, dos quais cada um, em algumas modalida-des, possui duas extremidades que podem ser ligadas. As duas extremida-des que podem ser ligadas em cada bloco de constructo de ácido nucléicopodem ser duas extremidades cegas (isto é, cada uma possuindo uma pontapendurada de zero nucleotídeo) ou em algumas modalidades uma pontacega e uma ponta coesiva ou mais em algumas modalidades ainda duaspontas coesivas. Em algumas modalidades, uma ponta coesiva útil para estafinalidade pode ser uma ponta coesiva a 3' ou uma ponta coesiva a 5'. As-sim, um bloco de constructo de ácido nucléico pode ter uma ponta coesiva a3' ou alternativamente uma ponta coesiva a 5' ou alternativamente duas pon-tas coesivas a 3' ou alternativamente duas pontas coesivas a 5'. A ordemgeral em que os blocos de constructo de ácidos nucléicos são montados pa-ra formar uma molécula de ácido nucléico quimérico finalizado é determina-la da através do planejamento experimental intencional e não é aleatória.
Em algumas modalidades, um bloco de constructo de ácido nu-cléico é gerado através da síntese química de dois ácidos nucléicos de fila-mento simples (também referidos como oligos de filamento simples) e colo-cando-os em contato de forma a permitir que se anelem para formar um blo-co de constructo de ácido nucléico de filamento duplo. Um bloco de cons-tructo de ácido nucléico de filamento duplo pode ter tamanho variável. Ostamanhos destes blocos de constructo podem ser grandes ou pequenos. Osexemplos de tamanhos para o bloco de constructo variam de 1 par de bases(não incluindo quaisquer pontas coesivas) até 100.000 pares de bases (nãoincluindo quaisquer pontas coesivas). Outros exemplos de faixas de tama-nhos são também fornecidos que possuem limites inferiores de 1 pb até10.000 pb (incluindo cada valor de número inteiro intermediário) e limitessuperiores de 2 pb até 100.000 pb (incluindo cada valor de número inteirointermediário).
Há muitos métodos através dos quais pode ser gerado um blocode constructo de ácido nucléico de filamento duplo que é útil para a inven-ção; e estes são conhecidos na técnica e podem ser facilmente realizadospelo versado na técnica. Em algumas modalidades, um bloco de constructode ácido nucléico de filamento duplo é gerado produzindo primeiramentedois ácidos nucléicos de filamento simples e permitindo que se anelem paraformar um bloco de constructo de ácido nucléico de filamento duplo. Os doisfilamentos de um bloco de constructo de ácido nucléico de filamento duplopodem ser complementares em todos os nucleotídeos não considerandoqualquer um que forme uma ponta coesiva; não contendo assim pareamen-tos errados, não considerando qualquer(quaisquer) ponta(s) coesiva(s). Emuma outra modalidade, os dois filamentos de um bloco de constructo de áci-do nucléico de filamento duplo são complementares em menos que todos osnucleotídeos não considerando qualquer um que forme uma ponta coesiva.Assim, de acordo com esta modalidade, um bloco de constructo de ácidonucléico de filamento duplo pode ser utilizado para introduzir degeneraçãode códons. Em algumas modalidades a degeneração de códons é introduzi-á da utilizando a mutagênese de saturação ao sítio descrita aqui, utilizando umou mais cassetes N,N,G/T ou alternativamente utilizando um ou mais casse-tes Ν,Ν,Ν.
O método de recombinação in vivo de acordo com a invençãopode ser realizado de forma cega em um grupo de híbridos ou alelos desco-nhecidos de um polinucleotídeo ou uma seqüência específica. Entretanto,não é necessário conhecer a seqüência de DNA ou de RNA real do polinu-cleotídeo específico. A abordagem de utilizar recombinação dentro de umapopulação misturada de genes pode ser útil para produzir quaisquer proteí-nas úteis, por exemplo, uma aldolase de acordo com a invenção ou uma va-riação da mesma. Esta abordagem pode ser utilizada para gerar proteínasque possuem especificidade ou atividade alterada. A abordagem pode tam-bém ser útil para a produção de seqüências de ácidos nucléicos híbridas,por exemplo, regiões promotoras, íntrons, éxons, seqüências intensificado-ras, regiões não traduzidas a 3' ou regiões não traduzidas a 5' de genes.
Assim, esta abordagem pode ser utilizada para gerar genes que possuemmaiores taxas de expressão. Esta abordagem também pode ser útil no estu-do de seqüências de DNA repetitivas. Finalmente, esta abordagem pode serútil para produzir ribozimas ou aptâmeros de acordo com a invenção.
Em algumas modalidades, a invenção descrita aqui é direciona-da para o uso de ciclos repetidos de reaporção redutor, recombinação e se-leção que permitem a evolução molecular direcionada de seqüências linea-res altamente complexas, tal como DNA, RNA ou proteínas através da re-combinação.
Sistema de Evolução Direcionada Otimizada
A invenção fornece um sistema de modificação gênica não-estocástico denominado "sistema de evolução direcionada otimizada" paragerar polipeptídeos, tais como enzimas aldolase, tal como piruvato aldolase,tal como HMG e/ou KHG aldolase ou anticorpos de acordo com a invenção,com propriedades novas ou alteradas. Em algumas modalidades, a evoluçãodirecionada otimizada é direcionada ao uso de ciclos repetidos de reaporçãoredutor, recombinação e seleção que permitem a evolução molecular dire-cionada de ácidos nucléicos através da recombinação.
A evolução direcionada otimizada permite a produção de umagrande população de seqüências quiméricas evoluídas, em que a populaçãoproduzida é significativamente enriquecida em relação a seqüências quepossuem um número predeterminado de eventos de "crossover". Um eventode "crossover" é um ponto em uma seqüência quimérica em que uma trocana seqüência ocorre de uma variação parental com uma outra variação pa-rental. Tal ponto é normalmente na junção de onde os oligonucleotídeos dosdois parentais são ligados para formar uma única seqüência. Este métodopermite o cálculo das concentrações corretas das seqüências de oligonucle-otídeos de forma que a população quimérica final de seqüências é enrique-cida em relação ao número escolhido de eventos de "crossover". Isto forne-ce mais controle em relação à escolha de variações quiméricas que possu-em um número predeterminado de eventos de "crossover".
Em adição, este método fornece meios convenientes para explo-rar uma quantidade tremenda de espaço de variantes de proteínas possíveisem comparação com outros sistemas. Previamente, se fossem geradas, porexemplo, 1013 moléculas quiméricas durante uma reação, seria extremamen-te difícil testar tal alto número de variações quiméricas em relação a umaatividade particular. Além disso, uma parte significativa da população deprogênie teria um número muito alto de eventos de "crossover" que resulta-riam em proteínas que eram menos prováveis de possuírem níveis maioresde uma atividade particular. Utilizando estes métodos, a população de molé-culas quiméricas pode ser enriquecida em relação às variações que possu-em um número particular de eventos de "crossover". Assim, embora aindapossam ser geradas 1013 moléculas quiméricas durante uma reação, cadauma das moléculas escolhidas para análise adicional possui mais provavel-mente, por exemplo, apenas três eventos de "crossover". Devido ao fato deque a população de progênie resultante pode estar inclinada a possuir umnúmero predeterminado de eventos de "crossover", os limites das varieda-des funcionais entre as moléculas quiméricas são reduzidos. Isto fornece umnúmero mais controlável de variáveis quando é calculado qual oligonucleotí-deo dos polinucleotídeos parentais originais poderia ser responsável por afe-tar uma característica particular.
Um método para criar uma seqüência de polinucleotídeo de pro-gênie quimérica é criar oligonucleotídeos que correspondem a fragmentosou partes de cada seqüência parental. Cada oligonucleotídeo em algumasmodalidades inclui uma região exclusiva de sobreposição de forma que amistura dos oligonucleotídeos juntos resulta em uma nova variação que pos-sui cada fragmento de oligonucleotídeo montado na ordem correta. Alternati-vamente, os protocolos para a prática destes métodos de acordo com a in-venção podem ser encontrados nas Patentes U.S. N- 6.773.900; 6.740.506;6.713.282; 6.635.449; 6.605.449; 6.537.776; 6.361.974.
O número de oligonucleotídeos gerados para cada variação pa-rental exibe uma relação com o número total de "crossovers" resultantes namolécula quimérica que é criada em última análise. Por exemplo, três varia-ções de seqüências de nucleotídeos parentais poderiam ser fornecidas parasofrer uma reação de ligação com a finalidade de encontrar uma variaçãoquimérica que possui, por exemplo, maior atividade à temperatura alta. Co-mo um exemplo, um conjunto de 50 seqüências de oligonucleotídeos podeser gerado correspondendo a cada uma das partes de cada variação paren-tal. Conseqüentemente, durante o processo de remontagem por ligação po-deria haver até 50 eventos de "crossover" dentro de cada uma das seqüên-cias quiméricas. A probabilidade de que cada um dos polinucleotídeos qui-méricos gerados conterá oligonucleotídeos de cada variação parental emordem alternada é muito baixa. Se cada fragmento de oligonucleotídeo esti-ver presente na reação de ligação na mesma quantidade molar é provávelque nas mesmas posições os oligonucleotídeos do mesmo polinucleotídeoparental se liguem um após o outro e assim não resultarão em um evento de"crossover". Se a concentração de cada oligonucleotídeo de cada parentalfor mantida constante durante qualquer etapa de ligação neste exemplo, háuma chance de 1/3 (assumindo 3 parentais) que um oligonucleotídeo damesma variação parental se ligar dentro da seqüência quimérica e não pro-duzir "crossover".
Conseqüentemente, uma função de densidade da probabilidade(PDF) pode ser determinada para prever a população de eventos de "cros-sover" prováveis de ocorrer durante cada etapa em uma reação de ligaçãodado um número ajustado de variações parentais, um número de oligonu-cleotídeos que correspondem a cada variação e as concentrações de cada variação durante cada etapa na reação de ligação. A estatística e a matemá-tica por trás da determinação da PDF são descritas abaixo. Utilizando estesmétodos, pode-se calcular tal função de densidade da probabilidade e assimenriquecer a população de progênie quimérica em relação a um númeropredeterminado de eventos de "crossover" resultantes de uma reação deligação particular. Além disso, um número alvo de eventos de "crossover"pode ser predeterminado e o sistema é então programado para calcular asquantidades iniciais de cada oligonucleotídeo parental durante cada etapana reação de ligação para resultar em uma função de densidade da probabi-lidade que se concentra no número predeterminado de eventos de "crosso-ver". Estes métodos são direcionados ao uso de ciclos repetidos de reapor-ção redutor, recombinação e seleção que permitem a evolução moleculardirecionada de um ácido nucléico que compreende um polipeptídeo atravésda recombinação. Este sistema permite produzir uma grande população deseqüências quiméricas evoluídas, em que a população gerada é significati-vãmente enriquecida em relação a seqüências que possuem um númeropredeterminado de eventos de "crossover". Um evento de "crossover" é umponto em uma seqüência quimérica em que uma troca na seqüência ocorrede uma variação parental com uma outra variação parental. Tal ponto ficanormalmente na junção em que os oligonucleotídeos dos dois parentais sãoligados para formar uma única seqüência. O método permite o cálculo dasconcentrações corretas de seqüências de oligonucleotídeos de forma que apopulação quimérica final de seqüências é enriquecida em relação ao núme-ro escolhido de eventos de "crossover". Isto fornece mais controle em rela-ção à escolha de variações quiméricas que possuem um número predeter-minado de eventos de "crossover".
Em adição, estes métodos fornecem um meio conveniente paraexplorar uma quantidade tremenda do espaço de variações de proteínaspossíveis em comparação com outros sistemas. Utilizando os métodos des-critos aqui, a população de moléculas quiméricas pode ser enriquecida emrelação a tais variações que possuem um número particular de eventos de"crossover". Assim, embora ainda possam ser geradas 1013 moléculas qui-méricas durante uma reação, cada uma das moléculas escolhidas para aná-lise adicional possui mais provavelmente, por exemplo, apenas três eventosde "crossover". Devido ao fato de que a população de progênie resultantepode estar inclinada a possuir um número predeterminado de eventos de"crossover", os limites das variedades funcionais entre as moléculas quimé-ricas são reduzidos. Isto fornece um número mais controlável de variáveisquando é calculado qual oligonucleotídeo dos polinucleotídeos parentais ori-ginais poderia ser responsável por afetar uma característica particular.
Em algumas modalidades, o método cria uma seqüência de po-linucleotídeo de progênie quimérica através da criação de oligonucleotídeosque correspondem a fragmentos ou a partes de cada seqüência parental.Cada oligonucleotídeo em algumas modalidades inclui uma região exclusivade sobreposição de forma que a mistura dos oligonucleotídeos juntos resultaem uma nova variação que possui cada fragmento de oligonucleotídeo mon-tado na ordem correta. Vide também as Patentes U.S. N- 6.773.900;6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776; 6.361.974.
Determinação de Eventos de "Crossover"
As modalidades da invenção incluem um sistema e um softwareque recebem uma função de densidade da probabilidade (PDF) do "crosso-ver" desejado, o número de genes parentais que serão remontados e o nú-mero de fragmentos na remontagem como entradas. A saída deste progra-ma é uma "PDF de fragmento" que pode ser utilizada para determinar umprotocolo para produzir genes remontados e a PDF de "crossover" estimadade tais genes. O processamento descrito aqui é, em algumas modalidades,realizado em MATLAB® (The Mathworks, Natick, Massachusetts) uma lin-guagem de programação e um ambiente de desenvolvimento para computa-ção técnica.
Processos Iterativos
Qualquer processo de acordo com a invenção pode ser repetidode forma iterativa, de forma que um ácido nucléico que codifica um fenótipode enzima aldolase alterado ou novo, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase de acordo com a invenção, pode ser identificado,reisolado, modificado novamente, testado novamente em relação à ativida-de. Este processo pode ser repetido de forma iterativa até que um fenótipodesejado seja engenheirado. Por exemplo, uma vide anabólica ou catabólicabioquímica inteira pode ser engenheirada em uma célula, incluindo, tal comoa atividade da enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase.
Similarmente, se for determinado que um oligonucleotídeo parti-cular não possui efeito de forma alguma sobre a característica desejada (talcomo um novo fenótipo de enzima aldolase, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase), este pode ser removido como uma variávelatravés da síntese de oligonucleotídeos parentais maiores que incluem aseqüência que será removida. Devido ao fato de que a incorporação da se-qüência dentro de uma seqüência maior previne quaisquer eventos de"crossover", não haverá mais qualquer variação desta seqüência nos polinu-cleotídeos de progênie. Esta prática iterativa de determinação de quais oli-gonucleotídeos estão mais relacionados com a característica desejada equais não estão relacionados, permite a exploração mais eficiente de todasas variações de proteínas possíveis que poderiam fornecer uma característi-ca ou uma atividade particular.
Embaralhamento in vivo
Em várias modalidades, o embaralhamento in vivo de moléculasé utilizado nos métodos de acordo com a invenção para fornecer variaçõesde polipeptídeos de acordo com a invenção, tais como anticorpos de acordocom a invenção ou enzimas aldolases de acordo com a invenção, tal comopiruvato aldolase, HMG e/ou KHG aldolase e similares. O embaralhamentoin vivo pode ser realizado utilizando a propriedade natural das células pararecombinar multímeros. Embora a recombinação in vivo tenha fornecido arota natural principal para a diversidade molecular, a recombinação genéticapermanece um processo relativamente complexo que envolve 1) o reconhe-cimento de homologias; 2) a clivagem de filamentos, a invasão de filamentose as etapas metabólicas que levam à produção de quiasma recombinante; efinalmente 3) a resolução do quiasma em moléculas recombinadas distintas.A formação do quiasma requer o reconhecimento de seqüências homólogas.
Em outras modalidades, a invenção inclui um método para aprodução de um polinucleotídeo híbrido de pelo menos um primeiro polinu-cleotídeo e um segundo polinucleotídeo. Em algumas modalidades, a inven-ção pode ser utilizada para produzir um polinucleotídeo híbrido através daintrodução de pelo menos um primeiro polinucleotídeo e um segundo polinu-cleotídeo (tal como um ou ambos, sendo uma seqüência de acordo com ainvenção que codifica uma enzima aldolase, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase) que compartilham pelo menos uma regiãode homologia de seqüência parcial em uma célula hospedeira adequada. Asregiões de homologia de seqüência parcial promovem processos que resul-tam na reorganização de seqüências produzindo um polinucleotídeo híbrido.O termo "polinucleotídeo híbrido", como utilizado aqui, é qualquer seqüênciade nucleotídeos que resulta do método da presente invenção e contém aseqüência de pelo menos duas seqüências de polinucleotídeos originais.Tais polinucleotídeos híbridos podem resultar de eventos de recombinaçãointermolecular que promovem a integração de seqüências entre moléculasde DNA. Em adição, tais polinucleotídeos híbridos podem resultar de pro-cessos de reaporção redutor intramolecular que utilizam seqüências repeti-das para alterar uma seqüência de nucleotídeos dentro de uma molécula deDNA.
Em algumas modalidades, o reaporção in vivo se concentra emprocessos "intermoleculares" coletivamente referidos como "recombinação";que em bactérias, é geralmente visto como um fenômeno "dependente deRecA". Em algumas modalidades, a invenção pode se basear nos processosde recombinação de uma célula hospedeira para recombinar e reagruparseqüências ou na capacidade das células de mediar processos redutorespara diminuir a complexidade de seqüências quase repetidas na célula atra-vés de deleção. Este processo de "reaporção redutor" ocorre através de umprocesso independente de RecA "intramolecular".
Em outras modalidades da invenção, novos polinucleotídeos po-dem ser gerados através do processo de reaporção redutor. O método en-volve a produção de constructos que contêm seqüências consecutivas (se-qüências codificadoras originais), sua inserção em um vetor apropriado esua introdução subseqüente em uma célula hospedeira apropriada. O rea-porção das identidades moleculares individuais ocorre através de processoscombinatórios entre as seqüências consecutivas no constructo que possuiregiões de homologia ou entre unidades quase repetidas. O processo dereaporção recombina e/ou reduz a complexidade e a extensão das seqüên-cias repetidas e resulta na produção de novas espécies moleculares. Váriostratamentos podem ser aplicados para aumentar a taxa de reaporção. Estespoderiam incluir o tratamento com luz ultravioleta ou com agentes químicosque danificam o DNA e/ou o uso de linhagens de células que exibem níveismaiores de "instabilidade genética". Assim, o processo de reaporção podeenvolver recombinação homóloga ou a propriedade natural de seqüênciasquase repetidas de direcionar sua própria evolução.
As seqüências repetidas ou "quase repetidas" desempenhamuma função na instabilidade genética. Em algumas modalidades, "quase re-petições" são repetições que não estão restritas à sua estrutura de unidadesoriginal. As unidades quase repetidas podem ser apresentadas na forma deum arranjo de seqüências em um constructo; unidades consecutivas de se-qüências similares. Uma vez ligadas, as junções entre as seqüências conse-cutivas se tornam essencialmente invisíveis e a natureza quase repetitiva doconstructo resultante é agora contígua no nível molecular. O processo dedeleção que a célula realiza para reduzir a complexidade do constructo re-sultante opera entre as seqüências quase repetidas. As unidades quase re-petidas fornecem um repertório praticamente ilimitado de moldes sobre osquais os eventos de deslizamento podem ocorrer. Em algumas modalidades,os constructos que contêm as quase repetições fornecem assim eficiente-mente elasticidade molecular suficiente de forma que eventos de deleção (epotencialmente de inserção) podem ocorrer virtualmente em qualquer localdentro das unidades quase repetitivas.
Quando as seqüências quase repetidas estão todas ligadas namesma orientação, por exemplo, cabeça à cauda ou vice-versa, a célula nãopode distinguir unidades individuais. Conseqüentemente, o processo redutorpode ocorrer ao longo das seqüências. Em contraste, quando, por exemplo,as unidades são apresentadas cabeça à cabeça, ao invés de cabeça à cau-da, a inversão determina os pontos finais da unidade adjacente de forma quea formação da deleção favorecerá a perda de unidades distintas. Assim, épreferível com o presente método que as seqüências estejam na mesmaorientação. A orientação aleatória de seqüências quase repetidas resultarána perda de eficiência de reaporção, enquanto que a orientação coerentedas seqüências oferecerá a maior eficiência. Entretanto, embora o fato depossuir menos das seqüências contíguas na mesma orientação diminua aeficiência, pode ainda fornecer elasticidade suficiente para a recuperaçãoefetiva de novas moléculas. Os constructos podem ser feitos com as se-qüências quase repetidas na mesma orientação para permitir maior eficiência.
As seqüências podem ser montadas em uma orientação cabeçaà cauda utilizando qualquer um de uma variedade de métodos, incluindo osseguintes:
a) Podem ser utilizados iniciadores que incluem uma cabeça poli-A e umacauda poli-T que quando tornados filamento simples forneceriam orien-tação. Isto é realizado possuindo as primeiras poucas bases dos inicia-dores feitas de RNA e conseqüentemente facilmente removidas comRNaseH.
b) Podem ser utilizados iniciadores que incluem sítios de clivagem de res-trição exclusivos. Vários sítios, uma bateria de seqüências isoladas eetapas de síntese e de ligação repetidas seriam requeridos.
c) As poucas bases internas do iniciador poderiam ser tioladas e uma e-xonuclease poderia ser utilizada para produzir moléculas com cauda deforma apropriada.
Em algumas modalidades, a recuperação das seqüências rea-grupadas se baseia na identificação de vetores de clonagem com um índicerepetitivo reduzido (RI). As seqüências codificadoras reagrupadas podementão ser recuperadas através de amplificação. Os produtos são reclonadose expressos. A recuperação de vetores de clonagem com Rl reduzido podeser realizada através de:
1) o uso de vetores mantidos apenas estavelmente quando o constructotiver a complexidade reduzida.
2) a recuperação física de vetores encurtados através de procedimentosfísicos. Neste caso, o vetor de clonagem seria recuperado utilizandoprocedimentos de isolamento de plasmídeos padronizados e fraciona-dos em relação ao tamanho em um gel de agarose ou coluna com umafaixa de peso molecular baixo utilizando procedimentos padronizados.
3) a recuperação de vetores contendo genes interrompidos que podemser selecionados quando o tamanho do inserto diminui.
4) o uso de técnicas de seleção direta com um vetor de expressão e aseleção apropriada.
As seqüências codificadoras (por exemplo, genes) de organis-mos relacionados podem demonstrar um alto grau de homologia e codificarprodutos de proteínas bastante diversos. Estes tipos de seqüências são par-ticularmente úteis na presente invenção como quase repetições. Entretanto,embora os exemplos ilustrados abaixo demonstrem o reaporção de seqüên-cias codificadoras originais aproximadamente idênticas (quase repetições),este processo não está limitado a tais repetições aproximadamente idênticas.
O exemplo a seguir demonstra um exemplo de método de acor-do com a invenção. São descritas as seqüências de ácidos nucléicos codifi-cadoras (quase repetições) derivadas de três (3) espécies isoladas. Cadaseqüência codifica uma proteína com um conjunto distinto de propriedades.Cada uma das seqüências difere em um único ou em poucos pares de ba-ses em uma única posição na seqüência. As seqüências quase repetidassão amplificadas separadamente ou coletivamente e ligadas em montagensaleatórias de forma que todas as permutações e combinações possíveis se-jam disponíveis na população de moléculas ligadas. O número de unidadesquase repetidas pode ser controlado pelas condições de montagem. O nú-mero médio de unidades quase repetidas em um constructo é definido comoo índice repetitivo (RI).
Uma vez formados, os constructos podem ou não ser fraciona-dos por tamanho em um gel de agarose de acordo com protocolos publica-dos, inseridos em um vetor de clonagem e transfectados em uma célulahospedeira apropriada. As células são então propagadas e o "reaporção re-dutor" é realizado. A taxa do processo de reaporção redutor pode ser esti-mulada através da introdução de danos no DNA se desejado. O fato da re-dução no Rl ser mediada pela formação de deleções entre seqüências repe-tidas através de um mecanismo "intramolecular" ou mediada por eventossimilares à recombinação através de mecanismos "intermoleculares" é ima-terial. O resultado final é um reaporção das moléculas em todas as combina-ções possíveis.
Opcionalmente, o método compreende a etapa adicional de veri-ficação dos membros da biblioteca do conjunto embaralhado para identificaros membros da biblioteca embaralhados individuais que possuem a capaci-dade de se ligar ou de outra maneira interagir ou catalisar uma reação parti-cular (tal como um domínio catalítico de uma enzima) com uma macromolé-cula predeterminada, tal como, por exemplo, um receptor proteináceo, umoligossacarídeo, um virion ou outro composto ou estrutura predeterminada.
Os polipeptídeos que são identificados partindo de tais bibliote-cas podem ser utilizados para finalidades terapêuticas, de diagnóstico, depesquisa e relacionadas (tais como catalisadores, solutos para aumentar aosmolaridade de uma solução aquosa e similares) e/ou podem ser submeti-dos a um ou mais ciclos adicionais de embaralhamento e/ou seleção.
Em outras modalidades, é previsto que antes ou durante a re-combinação ou o reaporção, os polinucleotídeos gerados pelo método deacordo com a invenção podem ser submetidos a agentes ou processos quepromovem a introdução de mutações nos polinucleotídeos originais. A intro-dução de tais mutações aumentaria a diversidade de polinucleotídeos híbri-dos e polipeptídeos codificados partindo dos mesmos. Os agentes ou osprocessos que promovem a mutagênese podem incluir, mas não estão limi-tados a: (+)-CC-1065 ou um análogo sintético tal com (+)-CC-1065-(N3- Adenina (Vide Sun e Hurley, (1992); um aduto de 4'-fluro-4-aminobifenila N-acetilado ou desacetilado capaz de inibir a síntese de DNA (Vide, por exem-plo, van de Poll e outros (1992)); ou um aduto de 4-aminobifenila N-acetiladoou desacetilado capaz de inibir a síntese de DNA (Vide também, van de Polle outros (1992), pp. 751-758); cromo trivalente, um sal de cromo trivalente,um aduto de DNA de hidrocarboneto aromático policíclico (PAH) capaz deinibir a replicação do DNA, tal como 7-bromometil-benz[a]antraceno ("BMA"),tris(2,3-dibromopropil)fosfato ("Tris-BP"), 1,2-dibromo-3-cloropropano("DBCP"), 2-bromoacroleína (2BA), benzo[a]pireno-7,8-dihidrodiol-9-10-epóxido ("BPDE"), um sal de halogênio de platina(ll), N-hidróxi-2-amino-3-metilimidazo[4,5-/]-quinolina ("N-hidróxi-IQ") e N-hidróxi-2-amino-1-metil-6-fenilimidazo[4,5-/|-pÍridina ("N-hidróxi-PhlP"). Os exemplos de meios pararetardar ou interromper a amplificação pela PCR consistem em luz UV (+)-CC-1065 e (+)-CC-1065-(N3-Adenina). Os meios particularmente abrangidossão adutos de DNA ou polinucleotídeos que compreendem os adutos deDNA dos polinucleotídeos ou do conjunto de polinucleotídeos, que podemser liberados ou removidos através de um processo que inclui o aquecimen-to da solução que compreende os polinucleotídeos antes do processamentoadicional.
Em outras modalidades a invenção está direcionada a um méto-do de produção de proteínas recombinantes que possuem atividade biológi-ca através do tratamento de uma amostra que compreende polinucleotídeosde molde de filamento duplo que codificam uma proteína do tipo selvagemsob condições de acordo com a invenção que fornecem a produção de poli-nucleotídeos híbridos ou reagrupados.
Produção de Variações de Seqüências
A invenção fornece ainda métodos adicionais para a produçãode variações de seqüências das seqüências de ácidos nucléicos (tal comoenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase) de acordo com a invenção. Em algumas modalidades, a invenção for-nece ainda métodos adicionais para isolar enzimas aldolase, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase utilizando os ácidos nucléi-cos e os polipeptídeos de acordo com a invenção. Em algumas modalida-des, a invenção fornece variações de uma seqüência que codifica uma en-zima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase (tal comoum gene, um cDNA ou uma mensagem) de acordo com a invenção, que po-dem ser alteradas através de quaisquer meios, incluindo, tais como métodosaleatórios e estocásticos ou métodos não-estocásticos ou de "evolução dire-cionada", como descrito anteriormente.
As variações isoladas podem ser as que ocorrem naturalmente.A variação pode também ser criada in vitro. As variações podem ser criadasutilizando técnicas de engenharia genética tais como mutagênese direciona-da ao sítio, mutagênese química aleatória, procedimentos de deleção comExonuclease Ill e técnicas de clonagem padronizadas. Alternativamente, taisvariações, fragmentos, análogos ou derivados podem ser criados utilizandosíntese química ou procedimentos de modificação. Outros métodos de pro-dução de variações também são familiares aos versados na técnica. Estesincluem procedimentos em que as seqüências de ácidos nucléicos obtidaspartindo de isolados naturais são modificadas para gerar ácidos nucléicosque codificam polipeptídeos que possuem características que aumentam seuvalor em aplicações industriais ou de laboratório. Em tais procedimentos, umgrande número de seqüências variantes que possuem uma ou mais diferen-ças de nucleotídeos em relação à seqüência obtida partindo do isolado natu-ral é gerado e caracterizado. Estas diferenças de nucleotídeos podem resul-tar em alterações de aminoácidos em relação aos polipeptídeos codificadospelos ácidos nucléicos provenientes dos isolados naturais.
Por exemplo, as variações podem ser criadas utilizando a PCRpropensa a erros. Em algumas modalidades de PCR propensa a erros, aPCR é realizada sob condições em que a fidelidade de cópias da DNA poli-merase é baixa, de forma que uma taxa alta de mutações pontuais é obtidaao longo do comprimento total do produto da PCR. A PCR propensa a errosé descrita, tal como em Leung, D.W. e outros, (1989) Technique 1:11-15; eCaldwell, R.C. & Joyce, G.F., (1992) PCR Methods Applic. 2:28-33. Sucin-tamente, em tais procedimentos, os ácidos nucléicos que serão submetidosà mutagênese são misturados com os iniciadores da PCR, o tampão de rea-ção, MgCI2, MnCI2, Taq polimerase e uma concentração apropriada dedNTPs para atingir uma taxa alta de mutação pontual ao longo do compri-mento total do produto da PCR. Por exemplo, a reação pode ser realizadautilizando 20 fmoles de ácido nucléico que será submetido à mutagênese, 30pmoles de cada iniciador da PCR, um tampão de reação compreendendo 50mM de KCI, 10 mM de Tris HCI (pH 8,3) e 0,01% de gelatina, 7 mM de Mg-Cl2, 0,5 mM de MnCI2, 5 unidades de Taq polimerase, 0,2 mM de dGTP, 0,2mM de dATP, 1 mM de dCTP e 1 mM de dTTP. A PCR pode ser realizadadurante 30 ciclos de 94°C durante 1 minuto, 45°C durante 1 minuto e 72°Cdurante 1 minuto. Entretanto, será considerado que estes parâmetros podemser variados quando apropriado. Os ácidos nucléicos mutagenizados sãoclonados em um vetor apropriado e as atividades dos polipeptídeos codifica-dos pelos ácidos nucléicos mutagenizados são avaliadas.
Em algumas modalidades, as variações são criadas utilizandomutagênese direcionada por oligonucleotídeo para gerar mutações específi-cas ao sítio em qualquer DNA clonado de interesse. A mutagênese com oli-gonucleotídeo é descrita, tal como em Reidhaar-Olson (1988) Science241:53-57. Sucintamente, em tais procedimentos um grande número de oli-gonucleotídeos de filamento duplo que carregam uma ou mais mutações queserão introduzidas no DNA clonado é sintetizado e inserido do DNA clonadoque será submetido à mutagênese. Em algumas modalidades, os clonescontendo o DNA mutagenizado são recuperados, expressos e as atividadesdo polipeptídeo codificado ali são avaliadas.
Um outro método para produzir variações é a PCR de monta-gem. A PCR de montagem envolve a montagem de um produto da PCR pro-veniente de uma mistura de fragmentos de DNA pequenos. Um grande nú-mero de reações da PCR diferentes ocorre em paralelo no mesmo frasco,com os produtos de uma reação iniciando os produtos de uma outra reação.A PCR de montagem é descrita na técnica, tal como na Patente U.S. N05.965.408.
Em algumas modalidades, a mutagênese por PCR sexual é umexemplo de método de produção de variações de acordo com a invenção.
Em algumas modalidades de mutagênese por PCR sexual a recombinaçãohomóloga forçada ocorre entre moléculas de DNA de seqüência de DNAdiferente, mas altamente relacionada in vitro, como um resultado da frag-mentação aleatória da molécula de DNA com base na homologia de se-qüência, seguida pela fixação do "crossover" através da extensão do inicia-dor em uma reação da PCR. A mutagênese por PCR sexual é descrita, talcomo em Stemmer (1994) Proc. Natl. Acad. Sei. USA 91:10747-10751. Su-cintamente, em tais procedimentos um grande número de ácidos nucléicosque será recombinado é digerido com DNase para gerar fragmentos quepossuem um tamanho médio de 50-200 nucleotídeos. Os fragmentos do ta-manho desejado são purificados e ressuspensos em uma mistura de PCR. APCR é realizada sob condições que facilitam a recombinação entre os frag-mentos de ácidos nucléicos. Por exemplo, a PCR pode ser realizada atravésda ressuspensão dos fragmentos purificados a uma concentração de 10-30ng/pL em uma solução de 0,2 mM de cada dNTP, 2,2 mM de MgCI2, 50 mMde KCI, 10 mM de Tris HCI, pH 9,0 e 0,1% de Triton X-100. 2,5 unidades deTaq polimerase por 100 μΙ_ de mistura de reação são adicionadas e a PCR érealizada utilizando o regime a seguir: 94°C durante 60 segundos, 94°C du-rante 30 segundos, 50-55°C durante 30 segundos, 72°C durante 30 segun-dos (30-45 vezes) e 72°C durante 5 minutos. Entretanto, será consideradoque estes parâmetros podem ser variados quando apropriado. Em algumasmodalidades, os oligonucleotídeos podem ser incluídos nas reações da P-CR. Em outras modalidades, o fragmento de Klenow da DNA polimerase Ipode ser utilizado em um primeiro conjunto de reações da PCR e a Taq po-limerase pode ser utilizada em um conjunto subseqüente de reações daPCR. As seqüências recombinantes são isoladas e as atividades dos poli-peptídeos que codificam são avaliadas.
Em algumas modalidades, são criadas variações através de mu·tagênese in vivo. Em algumas modalidades, as mutações aleatórias em umaseqüência de interesse são geradas através da propagação da seqüência deinteresse em uma cepa bacteriana, tal como uma cepa de E. coli, que carre-ga mutações em uma ou mais das vias de reparo do DNA. Tais cepas "demutação" possuem uma taxa de mutação aleatória maior que um parental dotipo selvagem. A propagação do DNA em uma destas cepas irá eventual-mente gerar mutações dentro do DNA. As cepas de mutação adequadaspara uso na mutagênese in vivo são descritas na Publicação PCT N0 WO91/16427, publicada em 31 de outubro de 1991, intitulada "Methods for Phe-notype Creation from Multiple Gene Populations".
As variações também podem ser geradas utilizando mutagênesecom cassete. Na mutagênese com cassete uma pequena região de uma mo-lécula de DNA de filamento duplo é substituída por um "cassete" de oligonu-cleotídeo sintético que difere da seqüência nativa. O oligonucleotídeo con-tém freqüentemente seqüência nativa completamente e/ou parcialmente ale-atória.
A mutagênese de conjunto recursivo pode também ser utilizadapara gerar variações. A mutagênese de conjunto recursivo é um algoritmopara a engenharia de proteínas (mutagênese de proteínas) desenvolvidopara produzir populações diversas de mutantes relacionados fenotipicamen-te cujos membros diferem em relação à seqüência de aminoácidos. Estemétodo utiliza um mecanismo de retroinformação para controlar rodadassucessivas de mutagênese com cassete combinatória. A mutagênese deconjunto recursivo é descrita, tal como em Arkin (1992) Proc. Natl. Acad. Sei.USA 89:7811-7815.
Em algumas modalidades, as variações são criadas utilizandomutagênese de conjunto exponencial. A mutagênese de conjunto exponen-cial é um processo para gerar bibliotecas combinatórias com uma alta por-centagem de mutantes exclusivos e funcionais, em que grupos pequenos deresíduos são escolhidos aleatoriamente em paralelo para identificar, em ca-da posição alterada, aminoácidos que levam a proteínas funcionais. A muta-gênese de conjunto exponencial é descrita, tal como em Delegrave (1993)Biotechnology Res. 11:1548-1552. As mutagêneses aleatória e direcionadaao sítio são descritas, tal como em Arnold (1993) Current Opinion in Biote-chnology 4:450-455.
Em algumas modalidades, as variações são criadas utilizandoprocedimentos de embaralhamento em que partes de um grande número deácidos nucléicos que codificam polipeptídeos distintos são fundidas juntaspara criar seqüências de ácidos nucléicos quiméricas que codificam polipep-tídeos quiméricos que são descritos na Patente U.S. N0 5.965.408, deposi-tada em 9 de julho de 1996, intitulada. "Method of DNA Reassembly by Inter-rupting Synthesis" e na Patente U.S. N0 5.939.250, depositada em 22 demaio de 1996, intitulada, "Production of Enzymes Having Desired Activitiesby Mutagenesis.
As variações dos polipeptídeos de acordo com a invenção po-dem ser variações em que um ou mais dos resíduos de aminoácidos dospolipeptídeos das seqüências de acordo com a invenção são substituídospor um resíduo de aminoácido conservado ou não conservado (em algumasmodalidades, um resíduo de aminoácido conservado) e tal resíduo de ami-noácido substituído pode ou não ser um codificado pelo código genético.
Em algumas modalidades, as substituições conservativas sãoaquelas que substituem um certo aminoácido em um polipeptídeo por umoutro aminoácido de características similares. Em algumas modalidades, assubstituições conservativas de acordo com a invenção compreendem assubstituições a seguir: substituições de um aminoácido alifático tal como A-lanina, Valina, Leucina e Isoleucina por um outro aminoácido alifático; substi-tuição de uma Serina por uma Treonina ou vice-versa; substituição de umresíduo ácido tal como ácido Apártico e ácido Glutâmico por um outro resí-duo ácido; substituição de um resíduo que carrega um grupo amida, tal co-mo Asparagina e Glutamina, por um outro resíduo que carrega um grupoamida; troca de um resíduo básico tal como Lisina e Arginina por um outroresíduo básico; e substituição de um resíduo aromático tal como Fenilalani-na, Tirosina por um outro resíduo aromático.
Outras variações são aquelas em que um ou mais dos resíduosde aminoácidos de um polipeptídeo de acordo com a invenção incluem umgrupo substituto. Em algumas modalidades, outras variações são aquelasem que o polipeptídeo está associado com um outro composto, tal como umcomposto para aumentar a meia-vida do polipeptídeo (por exemplo, polieti-Ieno glicol). Variações adicionais são aquelas em que aminoácidos adicio-nais são fundidos ao polipeptídeo, tal como uma seqüência líder, uma se-qüência secretora, uma seqüência de pró-proteína ou uma seqüência quefacilita a purificação, o enriquecimento ou a estabilização do polipeptídeo.
Em algumas modalidades, os fragmentos, os derivados e os a -nálogos mantêm a mesma função ou atividade biológica que os polipeptí-deos de acordo com a invenção e seqüências substancialmente idênticasaos mesmos. Em outras modalidades, o fragmento, o derivado ou o análogoinclui uma pró-proteína, de forma que o fragmento, o derivado ou o análogopode ser ativado através da clivagem da parte de pró-proteína para produzirum polipeptídeo ativo.
Otimização de Códons para Atingir Altos Níveis de Expressão de Proteínaem Células Hospedeiras
A invenção fornece métodos para modificar ácidos nucléicos quecodifica uma enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase para modificar (tal como para otimizar) o uso de códons.Em algumas modalidades, a invenção fornece métodos para a modificaçãode códons em um ácido nucléico que codifica uma enzima aldolase, tal comopiruvato aldolase, HMG e/ou KHG aldolase para aumentar ou diminuir suaexpressão em uma célula hospedeira. Em algumas modalidades, a invençãofornece ainda ácidos nucléicos que codificam uma enzima aldolase, tal comopiruvato aldolase, HMG e/ou KHG aldolase modificada para aumentar suaexpressão em uma célula hospedeira, a enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase modificada dessa maneira e mé-todos de produção de enzimas aldolases, tal como piruvato aldolase, tal co-mo HMG e/ou KHG aldolase. O método compreende a identificação de umcódon "não preferido" ou "menos preferido" no ácido nucléico que codifica aenzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase e a substituição de um ou mais destes códons não preferidos ou menospreferidos por um "códon preferido" que codifica o mesmo aminoácido que ocódon substituído e pelo menos um códon não preferido ou menos preferidono ácido nucléico foi substituído por um códon preferido que codifica o mes-mo aminoácido. Um códon preferido é um códon super-representado nasseqüências codificadoras nos genes na célula hospedeira e um códon nãopreferido ou menos preferido é um códon sub-representado nas seqüênciascodificadoras nos genes na célula hospedeira.
As células hospedeiras para a expressão dos ácidos nucléicos,cassetes e vetores de expressão de acordo com a invenção incluem bacté-rias, levedura, fungos, células vegetais, células de inseto e células de mamí-fero (vide a discussão, acima). Assim, a invenção fornece métodos para aotimização do uso de códons em todas estas células, ácidos nucléicos comcódons alterados e polipeptídeos produzidos pelos ácidos nucléicos comcódons alterados. Os exemplos de células hospedeiras incluem bactériasgram negativas, tal como Escheriehia colr, bactérias gram positivas, tais co-mo Streptomyces sp., Lactobacillus gasseri, Lactococcus laetis, Laetocoecuseremoris, Bacillus subtilis, Bacillus eereus. Os exemplos de células hospe-deiras incluem ainda organismos eucarióticos, tais como várias leveduras,tais como Saccharomyees sp., incluindo Saccharomyees eerevisiae, Sehizo-saeeharomyees pombe, Piehia pastoris e Kluyveromyces laetis, Hansenulapolimorpha, Aspergillus nigere células e linhagens de células de mamífero ecélulas e linhagens de células de inseto. Assim, a invenção inclui ainda áci-dos nucléicos e polipeptídeos otimizados em relação à expressão nestesorganismos e espécies.
Por exemplo, os códons de um ácido nucléico que codifica umaenzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase isola-do de uma célula bacteriana são modificados de forma que o ácido nucléicoé expresso de forma ótima em uma célula bacteriana diferente da bactériada qual a enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase foi derivada, uma levedura, um fungo, uma célula vegetal,uma célula de inseto ou uma célula de mamífero. Os métodos para a otimi-zação de códons são bem-conhecidos na técnica, vide a Patente U.S. N05.795.737; Baca (2000) Int. J. Parasitol. 30:113-118; Hale (1998) Protein Ex-pr. Purif. 12:185-188; Narum (2001) Infect. Immun. 69:7250-7253. Vide tam-bém Narum (2001) Infect. Immun. 69:7250-7253, que descreve a otimizaçãode códons em sistemas de camundongo; Outchkourov (2002) Protein Expr.Purif. 24:18-24, que descreve a otimização de códons em levedura; Feng(2000) Biochemistry 39:15399-15409, que descreve a otimização de códonsem E coli·, Humphreysf(2000) Protein Expr. Purif. 20:252-264, que descrevea otimização do uso de códons que afeta a secreção em E coli.
Animais não-humanos Transgênicos
A invenção fornece animais não-humanos transgênicos quecompreendem um ácido nucléico, um polipeptídeo (tal como uma enzimaaldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase), um casseteou um vetor de expressão ou uma célula transfectada ou transformada deacordo com a invenção. Em algumas modalidades, a invenção fornece aindamétodos de produção e de utilização destes animais não-humanos transgê-nicos.
Os animais não-humanos transgênicos podem ser, tais comocães, cabras, coelhos, ovelhas, cavalos, peixes, porcos (incluindo todos ossuínos, porcos castrados e animais relacionados), vacas, ratos e camundon-gos, que compreendem os ácidos nucléicos de acordo com a invenção. Es-tes animais podem ser utilizados, tal como modelos in vivo para estudar aatividade da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase enzima ou como modelos para selecionar agentes que alte-ram a atividade da enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase in vivo. As seqüências codificadoras para os poli-peptídeos que serão expressos nos animais não-humanos transgênicos po-dem ser planejadas para serem constitutivas ou sob o controle de fatoresreguladores da transcrição específicos ao tecido, específicos ao desenvolvi-mento ou que podem ser induzidos.
Os animais não-humanos transgênicos podem ser planejados egerados utilizando qualquer método conhecido na técnica; vide as PatentesU.S. N— 6.211.428; 6.187.992; 6.156.952; 6.118.044; 6.111.166; 6.107.541;5.959.171; 5.922.854; 5.892.070; 5.880.327; 5.891.698; 5.639.940;5.573.933; 5.387.742; 5.087.571, que descrevem a produção e a utilizaçãode células e óvulos transformados e camundongos, ratos, coelhos, ovelhas,porcos, frangos, cabras, peixes e vacas transgênicos. Vide também, tal co-mo Pollock (1999) J. Immunol. Methods 231:147-157, que descreve a produ-ção de proteínas recombinantes no leite de animais leiteiros transgênicos;Baguisi (1999) Nat. Biotechnol. 17:456-461, que demonstra a produção decabras transgênicas. A Patente U.S. N0 6.211.428, descreve a produção e autilização de mamíferos não-humanos transgênicos que expressam em seuscérebros um constructo de ácido nucléico que compreende uma seqüênciade DNA. A Patente U.S. N0 5.387.742, descreve a injeção de seqüências deDNA recombinantes clonadas ou sintéticas nos óvulos fertilizados de ca-mundongos, a implantação dos óvulos injetados em fêmeas pseudoprenhese o crescimento até o termpo de camundongos transgênicos. A Patente U.S.N0 6.187.992, descreve a produção e a utilização de um camundongo trans-gênico.
"Animais nocauteados" também podem ser utilizados para a prá-tica dos métodos de acordo com a invenção. Por exemplo, em algumas mo-dalidades, os animais transgênicos ou modificados de acordo com a inven-ção compreendem um "animal nocauteado", tal como um "camundongo no-cauteado", engenheirado para não expressar um gene endógeno, que ésubstituído por um gene que expressa uma enzima aldolase, tal como piru-vato aldolase, HMG e/ou KHG aldolase de acordo com a invenção ou umaproteína de fusão que compreende uma enzima aldolase, tal como piruvatoaldolase, HMG e/ou KHG aldolase de acordo com a invenção.Plantas e Sementes Transgênicas
A invenção fornece plantas e sementes transgênicas que com-preendem um ácido nucléico, um polipeptídeo (tal como uma enzima aldola-se, tal como piruvato aldolase, HMG e/ou KHG aldolase), um cassete ou umvetor de expressão ou uma célula transfectada ou transformada de acordocom a invenção. A invenção fornece ainda produtos ou subprodutos vege-tais, tais como frutos, óleos, sementes, folhas, extratos e similares, incluindoqualquer parte da planta, que compreende um ácido nucléico e/ou um poli-peptídeo (tal como uma xilanase) da invenção, tal como em que o ácido nu-cléico ou o polipeptídeo da invenção é heterólogo à planta, à parte da planta,à semente etc. A planta transgênica (que inclui partes da planta, frutos, se-mentes etc.) pode ser dicotiledônea (uma dicotiledônea) ou monocotiledônea(uma monocotiledônea). Em algumas modalidades, a invenção fornece ain-da métodos de produção e de utilização destas plantas e sementes transgê-nicas. A planta ou a célula vegetal transgênica que expressa um polipeptí-deo da presente invenção pode ser construída de acordo com qualquer mé-todo conhecido na técnica. Vide, por exemplo, a Patente U.S. N0 6.309.872.
Os ácidos nucléicos e os constructos de expressão de acordocom a invenção podem ser introduzidos em uma célula vegetal através dequalquer meio. Por exemplo, os ácidos nucléicos ou os constructos de ex-pressão podem ser introduzidos no genoma de um hospedeiro vegetal dese-jado ou os ácidos nucléicos ou os constructos de expressão podem ser epis-somos. A introdução no genoma de uma planta desejada pode ser tal que aprodução da enzima aldolase do hospedeiro, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase é regulada por elementos de controle datranscrição ou da tradução endógenos. Em algumas modalidades, a inven-ção fornece ainda "plantas nocauteadas" em que a inserção da seqüênciagênica através de, tal como recombinação homóloga, interrompeu a expres-são do gene endógeno. Os meios para gerar plantas "nocauteadas" sãobem-conhecidos na técnica, vide Strepp (1998) Proc Natl. Acad. Sei. USA95:4368-4373; Miao (1995) Plant J 7:359-365. Vide a discussão sobre plan-tas transgênicas, abaixo.Os ácidos nucléicos de acordo com a invenção podem ser utili-zados para conferir características desejadas em essencialmente qualquerplanta, tal como em pJantas que produzem amido, tais como batata, tomate,soja, beterrabas, milho, trigo, arroz, cevada e similares. Os ácidos nucléicosde acordo com a invenção podem ser utilizados para manipular vias metabó-Iicas de uma planta com a finalidade de otimizar ou alterar a expressão daenzima aldolase do hospedeiro, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase. Os ácidos nucléicos de acordo com a invenção podemalterar os níveis de expressão ou de atividade ou alterar características decompostos ou de enzimas produzidas naturalmente em uma planta. Alterna-tivamente, uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHGaldolase de acordo com a invenção pode ser utilizada na produção de umaplanta transgênica para produzir um composto que não é naturalmente pro-duzido por tal planta. Isto pode diminuir os custos da produção ou criar umnovo produto.
Em algumas modalidades, a primeira etapa na produção de umaplanta transgênica envolve a produção de um constructo de expressão paraa expressão em uma célula vegetal. Estas técnicas são bem-conhecidas natécnica. Podem incluir a seleção e a clonagem de um promotor, uma se-qüência codificadora para facilitar a ligação eficiente de ribossomos ao mR-NA e a seleção das seqüências terminadoras do gene apropriadas. Um e-xemplo de promotor constitutivo é CaMV35S, proveniente do vírus mosaicoda couve-flor, que resulta geralmente em um alto grau de expressão emplantas. Outros promotores são mais específicos e respondem a estímulosno ambiente interno ou externo da planta. Um exemplo de promotor que po-de ser induzido pela luz é o promotor do gene cab, que codifica a proteínade ligação com clorofilas a/b principal.
Em algumas modalidades, o ácido nucléico é modificado paraatingir maior expressão em uma célula vegetal. Por exemplo, é provável queuma seqüência de acordo com a invenção tenha uma maior porcentagem depares de nucleotídeos A-T comparada com a observada em uma planta, quealgumas preferem pares de nucleotídeos G-C. Portanto, os nucleotídeos A-Tna seqüência codificadora podem ser substituídos por nucleotídeos G-C semalterar significativamente a seqüência de aminoácidos para aumentar a ob-tenção do produto gênico em células vegetais.
Um gene marcador selecionável pode ser adicionado no cons-tructo gênico com a finalidade de identificar células ou tecidos vegetais quetiveram o transgene integrado de forma bem-sucedida. Este pode ser neces-sário porque conseguir a incorporação e a expressão de genes em célulasvegetais é um evento raro, que ocorre apenas em um baixo percentual dostecidos e das células alvos. Os genes marcadores selecionáveis codificamproteínas que fornecem resistência a agentes que são normalmente tóxicospara as plantas, tais como antibióticos ou herbicidas. Somente as célulasvegetais que tiveram o gene marcador selecionável integrado sobreviverãoquando cultivadas em um meio contendo o antibiótico ou o herbicida apro-priado. Como para outros genes inseridos, os genes marcadores tambémrequerem seqüências promotoras e de término para o funcionamento apro-priado.
Em algumas modalidades, a produção de plantas ou sementestransgênicas compreende a incorporação de seqüências de acordo com ainvenção e, opcionalmente, genes marcadores em um constructo de expres-são alvo (tal como um plasmídeo), junto com o posicionamento do promotore das seqüências terminadoras. Isto pode envolver a transferência do genemodificado para dentro da planta através de um método adequado. Por e-xemplo, um constructo pode ser introduzido diretamente no DNA genômicoda célula vegetal utilizando técnicas tais como a eletroporação e a microinje-ção de protoplastos da célula vegetal ou os constructos podem ser introduzi-das diretamente no tecido vegetal utilizando métodos de balística, tal como obombardeio de partículas de DNA. Por exemplo, vide Christou (1997) PlantMol. Biol. 35:197-203; Pawlowski (1996) Mol. Biotechnol. 6:17-30; Klein(1987) Nature 327:70-73; Takumi (1997) Genes Genet. Syst. 72:63-69, quediscutem o uso do bombardeio de partículas para introduzir transgenes notrigo; e Adam (1997) supra, para o uso do bombardeio de partículas paraintroduzir YACs em células vegetais. Por exemplo, Rinehart (1997) supra,utilizou o bombardeio de partículas para gerar plantas de algodão transgêni-cas. O aparelho para acelerar as partículas é descrito na Patente U.S. N05.015.580; e, instrumento de aceleração de partículas Bio-Rad (BioIistics)PDS-2000 disponível comercialmente (Bio-Rad, Hercules, CA); vide tam-bém, John, Patente U.S. N0 5.608.148; e Ellis, Patente U.S. N0 5.681.730,que descrevem a transformação mediada por partículas de gimnospermas.
Em algumas modalidades, os protoplastos podem ser imobiliza-dos e injetados com ácidos nucléicos, tal como um constructo de expressão.Embora a regeneração da planta partindo de protoplastos não é fácil em ce-reais, a regeneração da planta é possível em legumes utilizando embriogê-nese somática partindo de calos derivados de protoplastos. Os tecidos orga-nizados podem ser transformados com DNA nu utilizando a técnica de pisto-la gênica, em que o DNA é revestido em microprojéteis de tungstênio, atira-do 1/100a o tamanho das células, que carrega o DNA profundamente paradentro das células e das organelas. O tecido transformado é então induzidoa se regenerar, geralmente através da embriogênese somática. Esta técnicafoi bem-sucedida em várias espécies de cereais incluindo milho e arroz.
Os ácidos nucléicos, tais como constructos de expressão, tam-bém podem ser introduzidos nas células vegetais utilizando vírus recombi-nantes. As células vegetais podem ser transformadas utilizando vetores vi-rais, tais como vetores derivados do vírus mosaico do tabaco (Rouwendal(1997) Plant Mol. Biol. 33:989-999), vide Porta (1996) "Use of viral repliconsfor the expression of genes in plants", Mol. Biotechnol. 5:209-221.
Alternativamente, os ácidos nucléicos, tal como um constructode expressão, podem ser combinados com regiões flanqueadoras de T-DNAadequadas e introduzidos em um vetor de hospedeiro de Agrobacterium tu-mefaciens convencional. As funções de virulência do hospedeiro Agrobacte-rium tumefaciens irão direcionar a inserção do constructo e do marcador ad-jacente no DNA da célula vegetal quando a célula for infectada pelas bacté-rias. As técnicas de transformação mediada por Agrobacterium tumefaciens,incluindo o desarmamento e o uso de vetores binários, são bem-descritas naliteratura científica. Vide Horsch (1984) Science 233:496-498; Fraley (1983)Proc. NatL Acad. Sei. USA 80:4803 (1983); Gene Transferto Plants, Potry-kus, ed. (Springer-Verlag, Berlin 1995). O DNA em uma célula de A. tumefa-ciens fica contido no cromossomo bacteriano assim como em uma outra es-trutura conhecida como um plasmídeo Ti (indutor de tumor). O plasmídeo Ticontém um filamento de DNA denominado T-DNA (-20 kb de comprimento)que é transferido para a célula vegetal no processo de infecção e uma sériede genes vir (virulência) que direcionam o processo de infecção. A. tumefa-ciens pode infectar somente uma planta através de ferimentos: quando umaraiz ou um caule de planta é ferido, emite certos sinais químicos, em respos-ta aos quais, os genes vir de A. tumefaciens se tornam ativados e direcio-nam uma série de eventos necessários para a transferência do T-DNA doplasmídeo Ti para o cromossomo da planta. O T-DNA então entra na célulavegetal através do ferimento. Uma especulação é que o T-DNA aguarda atéque o DNA da planta seja replicado ou transcrito, então se insere no DNA daplanta exposto. Para utilizar A. tumefaciens como um vetor de transgene, aseção indutora de tumor do T-DNA tem que ser removida, enquanto sãomantidas as regiões de borda do T-DNA e os genes vir. O transgene é entãoinserido entre as regiões de borda do T-DNA, quando é transferido para acélula vegetal e se torna integrado nos cromossomos da planta.
A invenção fornece a transformação de plantas monocotiledô-neas utilizando os ácidos nucléicos de acordo com a invenção, incluindo ce-reais importantes, vide Hiei (1997) Plant Mol. Biol. 35:205-218. Vide também,Horsch, Science (1984) 233:496; Fraley (1983) Proc. Natl. Acad. Sci USA80:4803; Thykjaer (1997) supra; Park (1996) Plant Mol. Biol. 32:1135-1148,que discutem a integração do T-DNA no DNA genômico. Vide tambémD1HaIIuin, Patente U.S. N0 5.712.135, que descreve um processo para a in-tegração estável de um DNA que compreende um gene que é funcional emuma célula de um cereal ou em outra planta monocotiledônea.
Em algumas modalidades, a terceira etapa envolve a seleção ea regeneração de plantas inteiras capazes de transmitir o gene alvo incorpo-rado para a geração seguinte. Tais técnicas de regeneração podem utilizar amanipulação de certos fitohormônios em um meio de cultura de tecido. Emalgumas modalidades, o método utiliza um marcador de biocida e/ou de her-bicida que foi introduzido junto com as seqüências de nucleotídeos deseja-das. A regeneração da planta partindo de protoplastos cultivados é descritaem Evans e outros, Protoplasts Isolation and Culture, Handbook of Plant CellCulture, pp. 124-176, MacMiIIiIan Publishing Company1 Nova Iorque, 1983; eBinding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press,Boca Raton, 1985. A regeneração também pode ser obtida partindo de ca-los, explantes, órgãos de plantas ou partes dos mesmos. Tais técnicas deregeneração são descritas de forma geral em Klee (1987) Ann. Rev. of PlantPhys. 38:467-486. Para a obtenção de plantas inteiras partindo de tecidostransgênicos tais como embriões imaturos, estes podem ser cultivados sobcondições ambientais controlados em uma série de meios contendo nutrien-tes e hormônios, um processo conhecido como cultura de tecido. Uma vezque plantas inteiras são geradas e produzem semente, começa a avaliaçãodaprogênie.
Em algumas modalidades, após o cassete de expressão ser in-corporado de forma estável em plantas transgênicas, este pode ser introdu-zido em outras plantas através de cruzamento sexual. Qualquer um de umnúmero de técnicas de cruzamento padronizadas pode ser utilizado, depen-dendo da espécie que será cruzada. Devido ao fato de que a expressãotransgênica dos ácidos nucléicos de acordo com a invenção leva a altera-ções fenotípicas, as plantas que compreendem os ácidos nucléicos recom-binantes de acordo com a invenção podem ser cruzadas sexualmente comuma segunda planta para a obtenção de um produto final. Assim, a sementede acordo com a invenção pode ser derivada de um cruzamento entre duasplantas transgênicas de acordo com a invenção ou de um cruzamento entreuma planta de acordo com a invenção e uma outra planta. Os efeitos dese-jados (tal como a expressão dos polipeptídeos de acordo com a invençãopara produzir uma planta em que o comportamento de florescimento é alte-rado) podem ser aumentados quando ambas as plantas parentais expres-sam os polipeptídeos (tal como uma enzima aldolase, tal como piruvato aldo-lase, HMG e/ou KHG aldolase) de acordo com a invenção. Os efeitos dese-jados podem ser passados para gerações de plantas futuras através de mei-os de propagação padronizados.
Em algumas modalidades, os ácidos nucléicos e os polipeptí-deos de acordo com a invenção são expressos em ou inseridos em qualquerplanta ou semente. As plantas transgênicas de acordo com a invenção po-dem ser dicotiledôneas ou monocotiledôneas. Os exemplos de plantastransgênicas monocotiledôneas de acordo com a invenção são gramíneas,tais como capim do prado (capim azul, Poa), gramínea de forragem tal comofestuca, Lolium, gramínea temperada, tal como Agrostis e cereais, tais comotrigo, aveia, centeio, cevada, arroz, sorgo e milho. Os exemplos de plantastransgênicas dicotiledôneas de acordo com a invenção são tabaco, legumes,tais como tremoceiros, batata, beterraba de açúcar, ervilha, feijão e soja eplantas crucíferas ^família Brassicaceae), tais como couve-flor, semente decolza e o organismo modelo intimamente relacionado Arabidopsis thaliana.
Assim, as plantas e as sementes transgênicas de acordo com a invençãoincluem uma faixa ampla de plantas, que inclui, mas não está limitada a es-pécies dos gêneros Anacardium, Arachis, Asparagus, Atropa, Avena, Brassi-ca, Citrus, Citruilus, Capsicum, Carthamus, Cocos, Coffea, Cucumis, Cucur-bita, Daucus, Eiaeis, Fragaria, Giicina, Gossypium, Heiianassim, Heterocal-lis, Hordeum, Hyoscyamus, Lactuca, Linum, Lolium, Lupinus, Lycopersicon,Malus, Manihot, Majorana, Medicago, Nicotiana, Olea, Oryza, Panieum,Pannisetum, Persea, Phaseolus, Pistachia, Pisum, Pyrus, Prunus, Rapha-nus, Ricinus, Secale, Senecio, Sinapis, Solanum, Sorghum, Theobromus,Trigonella, Triticum, Vicia, Vitis, Vigna e Zea.
Em modalidades alternativas, os ácidos nucléicos de acordocom a invenção são expressos em plantas que contêm células fibrosas, queincluem, tais como algodão, árvore do algodão de seda (Kapok, Ceiba pen-tandra), salgueiro do deserto, arbusto do creosoto, Eurotia lanata, pau debalsa, rami, Hibiscus cannabinus, cânhamo, vinagreira, juta, sisal abacá elinho. Em modalidades alternativas, as plantas transgênicas de acordo coma invenção podem ser membros do gênero Gossypium, incluindo membrosde qualquer espécie de Gossypium, tal como G. arboreum, G. herbaceum,G. barbadense e G. hirsutum.
A invenção fornece ainda plantas transgênicas que serão utiliza-das para produzir grandes quantidades dos polipeptídeos (tal como uma en-zima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldolase ou anti-corpo) de acordo com a invenção. Por exemplo, vide Palmgren (1997)Trends Genet. 13:348; Chong (1997) Transgenic Res. 6:289-296 (que pro-duz proteína do leite humano beta-caseína em plantas transgênicas de bata-ta utilizando um promotor da manopina sintase (masl',21) bidirecional quepode ser induzido por auxina com métodos de transformação com discosfoliares mediada por Agrobacterium tumefaciens).
Utilizando procedimentos conhecidos, um versado na técnicapode selecionar plantas de acordo com a invenção através da detecção doaumento ou da diminuição do mRNA ou da proteína do transgene em plan-tas transgênicas. Os meios para detectar e quantificar os mRNAs ou as pro-teínas são bem-conhecidos na técnica.
Polipeptídeos e Peptídeos
Em algumas modalidades, A presente invenção refere-se a poli-peptídeos isolados, sintéticos ou recombinantes que possuem uma identida-de de seqüência (tal como pelo menos aproximadamente 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade ou ho-mologia de seqüência completa (100%)) a uma seqüência de acordo com ainvenção, tal como proteínas que possuem uma seqüência que é apresenta-da na SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ IDN0:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQID N0:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28,SEQ ID N0:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ IDNO:38, SEQ ID N0:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQID NO:48, SEQ ID N0:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56,SEQ ID NO:58, SEQ ID NQ:60, SEQ ID NO:62, SEQ ID NO:64, SEQ IDΝΟ:66, SEQ ID ΝΟ:68, SEQ ID Ν0:70, SEQ ID ΝΟ:72, SEQ ID ΝΟ:74, SEQID ΝΟ:76, SEQ ID ΝΟ:78, SEQ ID Ν0:80, SEQ ID ΝΟ:82, SEQ ID ΝΟ:84,SEQ ID ΝΟ:86, SEQ ID ΝΟ:88, SEQ ID Ν0:90, SEQ ID ΝΟ:92, SEQ IDΝΟ:94, SEQ ID ΝΟ:96, SEQ ID ΝΟ:98, SEQ ID Ν0:100, SEQ ID Ν0:102,SEQ ID NQ:104, SEQ ID Ν0:106, SEQ ID NQ:108, SEQ ID NQ:110, SEQ ID
ΝΟ:112, SEQ ID ΝΟ:114, SEQ ID Ν0:116, SEQ ID ΝΟ:118, SEQ IDNO: 120, SEQ ID ΝΟ:122, SEQ ID ΝΟ:124, SEQ ID Ν0:126, SEQ IDNO: 128, SEQ ID Ν0:130, SEQ ID ΝΟ:132, SEQ ID ΝΟ:134, SEQ IDΝΟ:136, SEQ ID ΝΟ:138, SEQ ID Ν0:140, SEQ ID ΝΟ:142, SEQ IDNO: 144, SEQ ID ΝΟ:146, SEQ ID ΝΟ:148, SEQ ID Ν0:150, SEQ IDΝΟ:152, SEQ ID NO: 154, SEQ ID ΝΟ:156, SEQ ID ΝΟ:158, SEQ IDNO: 160, SEQ ID NO: 162, SEQ ID Ν0:164, SEQ ID Ν0:166, SEQ IDNO: 168, SEQ ID NO: 170, SEQ ID Ν0:172, SEQ ID Ν0:174, SEQ IDΝΟ:176, SEQ ID ΝΟ:178, SEQ ID Ν0:180, SEQ ID Ν0:182, SEQ IDNO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID Ν0:190, SEQ IDΝΟ:192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID ΝΟ:198, SEQ IDΝ0:200, SEQ ID Ν0:202, SEQ ID Ν0:204, SEQ ID Ν0:206, SEQ IDΝ0:208, SEQ ID Ν0:210, SEQ ID ΝΟ:212, SEQ ID ΝΟ:214, SEQ IDΝΟ:216, SEQ ID ΝΟ:218, SEQ ID Ν0:220, SEQ ID ΝΟ:222, SEQ IDΝΟ:224, SEQ ID ΝΟ:226, SEQ ID ΝΟ:228, SEQ ID Ν0:230, SEQ IDΝΟ:232, SEQ ID ΝΟ:234, SEQ ID ΝΟ:236, SEQ ID ΝΟ:238, SEQ IDΝ0:240, SEQ ID ΝΟ:242, SEQ ID ΝΟ:244, SEQ ID ΝΟ:246, SEQ IDΝΟ:248, SEQ ID Ν0:250, SEQ ID ΝΟ:252, SEQ ID ΝΟ:254, SEQ IDΝΟ:256, SEQ ID ΝΟ:258, SEQ ID Ν0:260, SEQ ID ΝΟ:262, SEQ IDΝΟ:264, SEQ ID ΝΟ:266, SEQ ID ΝΟ:268, SEQ ID Ν0:270, SEQ IDΝΟ:272, SEQ ID ΝΟ:274, SEQ ID ΝΟ:276, SEQ ID ΝΟ:278, SEQ IDΝ0:280, SEQ ID ΝΟ:282, SEQ ID ΝΟ:284, SEQ ID ΝΟ:286, SEQ IDΝΟ:288, SEQ ID Ν0:290, SEQ ID ΝΟ:292, SEQ ID ΝΟ:294, SEQ IDΝΟ:296, SEQ ID ΝΟ:298, SEQ ID Ν0:300, SEQ ID Ν0:302, SEQ IDΝ0:304, SEQ ID Ν0:306, SEQ ID Ν0:308, SEQ ID Ν0:310, SEQ IDΝΟ:312, SEQ ID ΝΟ:314, SEQ ID ΝΟ:316, SEQ ID ΝΟ:318, SEQ IDΝ0:320, SEQ ID ΝΟ:322, SEQ ID ΝΟ:324, SEQ ID ΝΟ:326, SEQ IDΝΟ:328, SEQ ID Ν0:330, SEQ ID ΝΟ:332 ou SEQ ID ΝΟ:334 e fragmentosenzimaticamente ativos das mesmas. A porcentagem de identidade de se-qüência pode ser ao longo do comprimento completo do polipeptídeo ou, aidentidade pode ser ao longo de pelo menos aproximadamente 50, 60, 70,80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 oumais resíduos.
Os polipeptídeos de acordo com algumas modalidades da in-venção também podem ser mais curtos que o comprimento completo dospolipeptídeos. Em outras modalidades, A presente invenção refere-se a poli-peptídeos (peptídeos, fragmentos) que variam em tamanho entre aproxima-damente 5 e o comprimento completo de um polipeptídeo, tal como uma en-zima, tal como uma enzima aldolase, tal como piruvato aldolase, HMG e/ouKHG aldolase; os exemplos de tamanhos sendo de aproximadamente 5, 10,15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150,175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 ou mais resí-duos, tais como resíduos contíguos de uma enzima aldolase, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção.Os peptídeos de acordo com a invenção (tal como uma subseqüência de umpolipeptídeo de acordo com a invenção) podem ser úteis como, tais comosondas de marcação, antígenos (agentes imunogênicos), toleragenos, moti-vos, sítios ativos da enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase (tais como "domínios catalíticos"), seqüências desinais e/ou pré-pró-domínios.
Em outras modalidades, os polipeptídeos de acordo com a in-venção que possuem atividade de aldolase, tal como atividade de piruvatoaldolase, tal como de HMG e/ou de KHG aldolase são membros de um gê-nero de polipeptídeos que compartilham elementos estruturais, tais comoresíduos de aminoácidos, que se correlacionam com a atividade de aldolaseincluindo atividade de piruvato tal como, sem limitação, atividade de HMGe/ou KHG aldolase. Estes elementos estruturais compartilhados podem serutilizados para a produção de rotina de variações de aldolase, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase. Estes elementos estrutu-rais compartilhados de enzimas aldolases, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase de acordo com a invenção podem ser utiliza-dos como guia para a produção de rotina de variações de enzimas aldola-ses, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase dentro do âmbito do gênero dos polipeptídeos de acordo com a invenção.
Como utilizado aqui, o termo "aldolase, tal como piruvato aldola-se, tal como HMG e/ou KHG aldolase" abrange qualquer polipeptídeo ouenzimas capazes de catalisar a reação de adição de aldol ou a reação deretro-aldol (tais como os polipeptídeos de acordo com a invenção, vide tam- bém a Tabela 1 e os Exemplos 4, 5 e 6, abaixo) ou qualquer modificação deum material que contém ligações carbono-carbono, tal como na produção deácido R-2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico (R-MP) e certos estereoi-sômeros de monatina, tal como R,R e S,R monatina e sais dos mesmos.
Os polipeptídeos de acordo com algumas modalidades da in-venção catalisam a formação de ligações carbono-carbono em uma reaçãode aldol e possuem a capacidade de utilizar piruvato ou fosfoenolpiruvatocomo o componente nucleofílico na síntese de uma estrutura de 4-hidróxi-2-cetobutirato que é mostrada no esquema geral abaixo.
<formula>formula see original document page 217</formula>
R = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída
R2 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída
R3 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída, ácido carboxílico.
Sem ficar ligado à teoria, acredita-se que o fragmento de quatrocarbonos conservado preparado em todas as condensações catalisadas porpiruvato aldolase é tanto densamente quanto diferencialmente funcionaliza-do. Além disso, em cada aduto, quatro estados de oxidação diferentes decarbono ficam contidos em quatro carbonos contíguos. A estrutura prepara-da através das piruvato aldolases permite assim a preparação de ácidos a-amino-Y-hidroxicarboxílicos, ácidos β-hidroxicarboxílicos, ácidos α,γ-dihidroxicarboxílicos e açúcares 2-desoxialdose como mostrado no esquemaabaixo.
<formula>formula see original document page 218</formula>
Portanto, as piruvato aldolases de acordo com algumas modali-dades da invenção podem ser sinteticamente versáteis e podem ser utiliza-das na preparação de uma faixa ampla de produtos para uso em produtosalimentícios para animais, alimentos para seres humanos, processos indus-triais e produtos farmacêuticos (vide, por exemplo, Gijsen, H.J.M. e outros,Recent Advances in the Chemoenzymatic Synthesis of Carbohidrates andCarbohidrate Mimetics, Chem. Rev. 1996, 96, 443-473; Henderson, D.P. eoutros J. Org. Chem., Stereospecific Preparation of the N-Terminal AminoAcid Moiety of Nikkomycins KX and KZ vide a Multiple Enzyme Synthesis,1997, 62, 7910-7911; Wymer, N. & Toone, E.J. Enzyme-catalyzed Synthesisof Carbohidrates. Current Opin. Chemical Biology, 2000, 4, 110-119).
Os polipeptídeos de acordo com algumas modalidades da in-venção podem ter mais de um tipo de atividade enzimática, especificamenteatividade de aldolase e uma atividade adicional, por exemplo, como apresen-tado na Tabela 1, abaixo. Por exemplo, um polipeptídeo de acordo com ainvenção pode ter atividade de aldolase, atividade de piruvato aldolase,HMG e/ou KHG aldolase. Adicionalmente, o polipeptídeo pode ter ou pode-se acreditar que tenha, atividade enzimática adicional com base em suaclassificação EC. A Tabela 1 inclui a coluna "Número EC Previsto". Um nú-mero EC é o número atribuído a um tipo de enzima de acordo com um es-quema de nomenclatura de enzima padronizada desenvolvida pela EnzymeCommission of the Nomenclature Committee of the International Union ofBiochemistry and Molecular Biology (IUBMB). Os resultados na coluna de"Número EC Previsto" são determinados por uma busca por BLAST contraum banco de dados de Kegg (Kyoto Encyclopedia of Genes and Genomes).Se a combinação de BLAST principal (também chamada de uma "coincidên-cia") tiver um valor de E igual ou menor que e"6, o número EC atribuído àcombinação principal é inserido na tabela. O número EC da coincidênciaprincipal é utilizado como um guia para o que o número EC da seqüência dainvenção poderia ser. Em casos em que apenas um número EC parcial éfornecido, apenas uma classificação ampla poderia ser atribuída com basena coincidência principal. Por exemplo, na primeira fileira, para a SEQ IDN0:2, codificada pela SEQ ID N0:1, o Número EC Previsto é listado como"2...". Portanto, a classificação atribuída é de forma ampla uma transferase.Para a SEQ ID NO:26, codificada pela SEQ ID NO:25, a classificação maisespecífica que poderia ser atribuída com base na coincidência principal écomo uma aldeído-liase.
Tabela 1
<table>table see original document page 219</column></row><table><table>table see original document page 220</column></row><table><table>table see original document page 221</column></row><table>SEQ ID NO: Ativi- dade Sub- classe da al- dolase Simero SinalPSinaKAA visto6" = Amin0ácicl0) Fonte83, 84 Aldo- Iase HMG 2... Desconhecida85, 86 Aldo- Iase HMG 2... Desconhecida87, 88 Aldo- Iase HMG 2... Desconhecida89, 90 Aldo- Iase HMG 2... Desconhecida91,92 Aldo- Iase HMG 2... Desconhecida93, 94 Aldo- Iase HMG 2... Desconhecida95, 96 Aldo- Iase HMG 2... Desconhecida97, 98 Aldo- Iase HMG 2... Desconhecida99, 100 Aldo- Iase HMG 2... Desconhecida101, 102 Aldo- Iase HMG 2... Desconhecida103, 104 Aldo- Iase HMG 2... Desconhecida105, 106 Aldo- Iase HMG 2... Desconhecida107, 108 Aldo- Iase HMG 2... Desconhecida109, 110 Aldo- Iase HMG 2... Desconhecida111, 112 Aldo- Iase HMG 2... Desconhecida113, 114 Aldo- Iase HMG 2... Desconhecida115, 116 Aldo- Iase HMG 2... Desconhecida117, 118 Aldo- Iase HMG 2... Desconhecida<table>table see original document page 223</column></row><table>SEQ ID NO: Ativi- dade Sub- classe da al- dolase Número EC Pre- visto SinaIP Sinal (AA = Aminoácido) Fonte155, 156 Aldo- Iase HMG 2... Desconhecida157, 158 Aldo- Iase HMG 2... Desconhecida159, 160 Aldo- Iase HMG 2... Desconhecida161, 162 Aldo- Iase HMG 2... Desconhecida163, 164 Aldo- Iase HMG 2... Desconhecida165, 166 Aldo- Iase HMG 2... Desconhecida167, 168 Aldo- Iase HMG 2... Desconhecida169, 170 Aldo- Iase HMG 2... Desconhecida171, 172 Aldo- Iase HMG 2... Desconhecida173, 174 Aldo- Iase HMG 2... Desconhecida175, 176 Aldo- Iase HMG 2... Desconhecida177, 178 Aldo- Iase HMG 2... Desconhecida179, 180 Aldo- Iase HMG 2... Desconhecida181, 182 Aldo- Iase HMG 2... AA1-31 Desconhecida183, 184 Aldo- Iase HMG 2... Desconhecida185, 186 Aldo- Iase HMG 2... Desconhecida187, 188 Aldo- Iase HMG 2... Desconhecida189, 190 Aldo- Iase HMG 2... DesconhecidaSEQ ID NO: Ativi- dade Sub- classe da al- dolase SinalPSinaKAA visto " = Amin0ácicl0) Fonte191, 192 Aldo- Iase HMG 2... Desconhecida193, 194 Aldo- Iase HMG 2... Desconhecida195, 196 Aldo- Iase HMG 2... Desconhecida197, 198 Aldo- Iase HMG 2... Desconhecida199, 200 Aldo- Iase HMG 2... Desconhecida201, 202 Aldo- Iase HMG 2... Desconhecida203, 204 Aldo- Iase HMG 2... Desconhecida205, 206 Aldo- Iase HMG 2... Desconhecida207, 208 Aldo- Iase HMG 2... Desconhecida209, 210 Aldo- Iase HMG 2... Desconhecida211, 212 Aldo- Iase HMG 2... Desconhecida213, 214 Aldo- Iase HMG 2... Desconhecida215, 216 Aldo- Iase HMG 2... Desconhecida217, 218 Aldo- Iase HMG 2... Desconhecida219, 220 Aldo- Iase HMG 2... Desconhecida221, 222 Aldo- Iase HMG 2... Desconhecida223, 224 Aldo- Iase HMG 2... Desconhecida225, 226 Aldo- Iase HMG 2... DesconhecidaSEQ ID NO: Ativi- dade Sub- classe da al- dolase Número EC Pre- visto SinaIP Sinal (AA = Aminoácido) Fonte227, 228 Aldo- Iase HMG 2... Desconhecida229, 230 Aldo- Iase HMG 2... Desconhecida231, 232 Aldo- Iase HMG 2... Desconhecida233, 234 Aldo- Iase HMG 2... Desconhecida235, 236 Aldo- Iase HMG 2... Desconhecida237, 238 Aldo- Iase HMG 2... Desconhecida239, 240 Aldo- Iase HMG 2... Desconhecida241, 242 Aldo- Iase HMG 2... Desconhecida243, 244 Aldo- Iase HMG 2... Desconhecida245, 246 Aldo- Iase HMG 2... Desconhecida247, 248 Aldo- Iase HMG 2... Desconhecida249, 250 Aldo- Iase HMG 2... Desconhecida251, 252 Aldo- Iase HMG 2... Desconhecida253, 254 Aldo- Iase HMG 2... Desconhecida255, 256 Aldo- Iase HMG 2... Desconhecida257, 258 Aldo- Iase HMG 2... Desconhecida259, 260 Aldo- Iase HMG 2... AA1-18 Desconhecida261, 262 Aldo- Iase HMG 2... DesconhecidaSEQ ID NO: Ativi- dade Sub- classe da al- dolase ^mera SinalPSinaKAA . re" =Aminoácido) visto ' Fonte263, 264 Aldo- Iase HMG 2... Desconhecida265, 266 Aldo- Iase HMG 2... Desconhecida267, 268 Aldo- Iase HMG 2... Desconhecida269, 270 Aldo- Iase HMG 2... Desconhecida271, 272 Aldo- Iase HMG 2... Desconhecida273, 274 Aldo- Iase HMG 2... Desconhecida275, 276 Aldo- Iase HMG 2... Desconhecida277, 278 Aldo- Iase HMG 2... Desconhecida279, 280 Aldo- Iase HMG 2... Desconhecida281, 282 Aldo- Iase HMG 2... Desconhecida283, 284 Aldo- Iase HMG 2... Desconhecida285, 286 Aldo- Iase HMG 2... Desconhecida287, 288 Aldo- Iase HMG 2... Desconhecida289, 290 Aldo- Iase HMG 2... Desconhecida291, 292 Aldo- Iase HMG 2... Desconhecida293, 294 Aldo- Iase HMG 2... Desconhecida295, 296 Aldo- Iase HMG 2... Desconhecida297, 298 Aldo- iase HMG 2... DesconhecidaSEQ ID NO: Ativi- dade Sub- classe da al- dolase ^mero SinalPSinaKAA visto6" = Aminoácid°) Fonte299, 300 Aldo- Iase HMG 2.1.. Desconhecida301, 302 Aldo- Iase HMG 2.1.. Desconhecida303, 304 Aldo- Iase HMG 2.1.. Desconhecida305, 306 Aldo- Iase KHG 4.1.2.14 Desconhecida307, 308 Aldo- Iase KHG 4.1.2.14 Desconhecida309, 310 Aldo- Iase KHG 4.1.2.14 Desconhecida311, 312 Aldo- Iase KHG 4.1.2.14 Desconhecida313, 314 Aldo- Iase KHG 4.1.2.14 Desconhecida315, 316 Aldo- Iase KHG 4.1.2.14 Desconhecida317, 318 Aldo- Iase KHG 4.1.2.14 Desconhecida319, 320 Aldo- Iase KHG 4.1.3.16 Desconhecida321, 322 Aldo- Iase KHG 4.1.2.14 Desconhecida323, 324 Aldo- Iase KHG 4.1.2.14 Desconhecida325, 326 Aldo- Iase KHG 4.1.2.14 Desconhecida327, 328 Aldo- Iase KHG 4.1.2.14 Desconhecida329, 330 Aldo- Iase KHG 4.1.3.16 Desconhecida331, 332 Aldo- Iase KHG 4.1.2.14 Desconhecida333, 334 Aldo- Iase KHG 4.1.2.14 DesconhecidaOs polipeptídeos e os peptídeos de acordo com a invenção po-dem ser isolados de fontes naturais, podem ser sintéticos ou podem ser po-lipeptídeos gerados de forma recombinante. Os peptídeos e as proteínaspodem ser expressos de forma recombinante in vitro ou in vivo. Os peptí-deos e os polipeptídeos de acordo com a invenção podem ser produzidos eisolados utilizando qualquer método conhecido na técnica. Os polipeptídeose os peptídeos de acordo com a invenção também podem ser sintetizados,inteiros ou em parte, utilizando métodos químicos bem-conhecidos na técni-ca. Vide, tal como Caruthers (1980) Nucleic Acids Res. Symp. Ser. 215-223;Horn (1980) Nucleic Acids Res. Symp. Ser. 225-232; Banga, A.K., Therapeu-tic Peptides and Proteins, Formulation, Processing and Delivery Systems(1995) Technomic Publishing Co., Lancaster, PA. Por exemplo, a síntese depeptídeos pode ser realizada utilizando várias técnicas em fase sólida (vide,tal como Roberge (1995) Science 269:202; Merrifield (1997) Methods Enzy-mol. 289:3-13) e a síntese automatizada pode ser conseguida, tal como utili-zando o ABI 431A Peptide Synthesizer (Perkin Elmer) de acordo com as ins-truções fornecidas pelo fabricante.
Os peptídeos e os polipeptídeos de acordo com a invenção tam-bém podem ser glicosilados. A glicosilação pode ser adicionada após a tra-dução quimicamente ou através de mecanismos biossintéticos celulares, emque os últimos incorporam o uso de motivos de glicosilação conhecidos, quepodem ser nativos ou podem ser adicionados como um peptídeo ou adicio-nados na seqüência que codifica o ácido nucléico. A glicosilação pode serligada a O ou ligada a N.
Em algumas modalidades, quando indicado, os peptídeos e ospolipeptídeos de acordo com a invenção podem incluir todas as formas "mi-méticas" e "peptídeo miméticas". Os termos "mimético" e "peptídeo miméti-co" referem-se a um composto químico sintético que possui substancialmen-te as mesmas características estruturais e/ou funcionais dos polipeptídeosde acordo com a invenção. O mimético pode ser inteiramente composto deanálogos não naturais sintéticos de aminoácidos ou é uma molécula quimé-rica de aminoácidos de peptídeos parcialmente naturais e de análogos deaminoácidos parcialmente não naturais. O mimético também pode incorporarqualquer quantidade de substituições conservativas de aminoácidos naturaiscontanto que tais substituições também não alterem substituição a estruturae/ou a atividade do mimético. Como com os polipeptídeos de acordo com ainvenção que são variações ou membros conservativos de um gênero depolipeptídeos de acordo com a invenção (tal como que possuem aproxima-damente 50% ou mais identidade de seqüência a uma seqüência de acordocom a invenção), experimentos de rotina determinação se um mimético estádentro do âmbito de acordo com a invenção, isto é, que sua estrutura e/oufunção não está substancialmente alterada. Assim, em algumas modalida-des, uma composição de miméticos está dentro do âmbito de acordo com ainvenção se possuir atividade de uma enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase.
As composições de miméticos de polipeptídeos de acordo com ainvenção podem conter qualquer combinação de componentes estruturaisnão naturais. Em uma modalidade alternativa, as composições de miméticosde acordo com a invenção incluem um ou todos dos três grupos estruturais aseguir: a) grupos de ligação aos resíduos sem ser as ligações amida natru-ais ("ligação peptídica"); b) resíduos não naturais no lugar de resíduos deaminoácidos que ocorrem naturalmente; ou c) resíduos que induzem mime-tismo estrutural secundário, isto é, para induzir ou estabilizar uma estruturasecundária, tal como uma volta beta, uma volta gama, uma folha beta, umaconformação em hélice alfa e similares. Por exemplo, um polipeptídeo deacordo com a invenção pode ser caracterizado como um mimético quandotodos ou alguns de seus resíduos estão ligados através de meios químicossem ser ligações peptídicas naturais. Os resíduos peptidomiméticos indivi-duais podem ser ligados através de ligações peptídicas, outras ligaçõesquímicas ou meios de acoplamento, tais como glutaraldeído, ésteres de N-hidroxissuccinimida, maleimidas bifuncionais, Ν,Ν'-diciclohexilcarbodiimida(DCC) ou Ν,Ν'-diisopropilcarbodiimida (DIC). Os grupos de ligação que po-dem ser uma alternativa para ligações amida tradicionais ("ligação peptídi-ca") incluem, tal como cetometileno (tal como -C(=0)-CH2- para -C(=0)-NH-), aminometileno (CH2-NH), etileno, olefina (CH=CH)1 éter (CH2-O)1 tioéter(CH2-S), tetrazol (CN4-), tiazol, retroamida, tioamida ou éster (vide Spatola(1983) em Chemistry and Biochemistry of Amino Acids, Peptides and Prote-ins, Vol. 7, pp 267-357, "Peptide Backbone Modifications", Marcell Dekker,NY).
Um polipeptídeo de acordo com a invenção também pode sercaracterizado como um mimético por conter todos ou alguns resíduos nãonaturais no lugar de resíduos de aminoácidos que ocorrem naturalmente. Osresíduos não naturais são bem-descritos na literatura científica e de patente;alguns dos exemplos de composições não naturais úteis como miméticos deresíduos de aminoácidos naturais e diretrizes são descritos abaixo. Os mi-méticos de aminoácidos aromáticos podem ser gerados através da substitui-ção por, tal como D- ou L- nafilalanina; D- ou L- fenilglicina; D- ou L-2 tienoi-lalanina; D- ou L-1, -2, 3- ou 4- pirenoilalanina; D- ou L-3 tienoilalanina; D- ouL-(2-piridinil)-alanina; D- ou L-(3-piridinil)-alanina; D- ou L-(2-pirazinil)-alanina; D- ou L-(4-isopropil)-fenilglicina; D-(trifluorometil)-fenilglicina; D-(trifluorometil)-fenilalanina; D-p-fluoro-fenilalanina; D- ou L-p-bifenilfenilalanina; D- ou L-p-metóxi-bifenilfenilalanina; D- ou L-2-indol(alquil)alaninas; e, D- ou L-alquilaininas, em que alquila pode ser metila,etila, propila, hexila, butila, pentila, isopropila, iso-butila, sec-isotila, iso-pentila substituído ou não-substituído ou aminoácidos não ácidos. Os anéisaromáticos de um aminoácido não natural incluem, tais como anéis aromáti-cos de tiazolila, tiofenila, pirazolila, benzimidazolila, naftila, furanila, pirrolila e piridila.
Os miméticos de aminoácidos ácidos podem ser gerados atra-vés da substituição por, tal como aminoácidos não carboxilados enquantouma carga negativa é mantida; (fosfono)alanina; treonina sulfatada. Os gru-pos laterais carboxila (tal como aspartila ou glutamila) também podem sermodificados seletivamente através da reação com carbodiimidas (R1-N-C-N-R') tal como 1-ciclohexil-3(2-morfolinil-(4-etil) carbodiimida ou 1-etil-3(4-azonia-4,4- dimetolpentil) carbodiimida. Aspartila ou glutamila podem tam-bém ser convertidos em resíduos asparaginila e glutaminila através da rea-ção com íons de amônio. Os miméticos de aminoácidos básicos podem sergerados através da substituição por, tal como (em adição à Iisina e arginina)os aminoácidos ornitina, citrulina ou ácido (guanidino)-acético ou ácido (gua-nidino)alquil-acético, em que alquila é como definido anteriormente. O deri-vado de nitrila (tal como contendo a porção CN no lugar de COOH) pode sersubstituído por asparagina ou glutamina. Os resíduos de asparaginila e glu-taminila podem ser desaminados nos resíduos aspartila ou glutamina cor-respondentes. Os miméticos de resíduo de arginina podem ser gerados a-través da reação de arginila com, tal como um ou mais reagentes conven-cionais, incluindo, tal como fenilglioxal, 2,3-butanodiona, 1,2-ciclo-hexanodiona ou ninhidrina, em algumas modalidades sob condições alcali-nas. Os miméticos de resíduo de tirosina podem ser gerados através da rea-ção de tirosila com, tal como compostos de diazônio aromáticos ou tetrani-trometano. O N-acetilimidizol e o tetranitrometano podem ser utilizados paraformar espécies de O-acetil tirosila e derivados 3-nitro, respectivamente. Osmiméticos de resíduo de cisteína podem ser gerados através da reação deresíduos cisteinila com, tal como alfa-haloacetatos tal como ácido 2-cloroacético ou cloroacetamida e aminas correspondentes; para fornecerderivados de carboximetila ou carboxiamidometila. Os miméticos de resíduode cisteína também podem ser gerados através da reação de resíduos decisteinila com, tal como bromo-trifluoroacetona, ácido alfa-bromo-beta-(5-imidozoil) propiônico; fosfato de cloroacetila, N-alquilmaleimidas, dissulfetode 3-nitro-2-piridila; dissulfeto de metil 2-piridila; p-cloromercuribenzoato; 2-cloromercuri-4 nitrofenol; ou, cloro-7-nitrobenzo-oxa-1,3-diazol. Os miméti-cos de Iisina podem ser gerados (e os resíduos amino terminais podem seralterados) através da reação de Iisinila com, tal como anidridos do ácidosuccínico ou outro carboxílico. A Iisina e outros miméticos de resíduos con-tendo alfa-amino também podem ser gerados através da reação com imido-ésteres, tais como reações catalisadas por picolinimidato de metila, fosfatopiridoxal, piridoxal, cloroborohidreto, ácido trinitro-benzenossulfônico, O-metilisouréia, 2,4, pentanodiona e transamidase com glioxilato. Os miméticosde metionina podem ser gerados através da reação com, tal como sulfóxidode metionina. Os miméticos de prolina incluem, tal como ácido pipecólico,ácido tiazolidina carboxílico, 3- ou 4- hidróxi prolina, desidroprolina, 3- ou 4-metilprolina ou 3,3,-dimetilprolina. Os miméticos de resíduo de histidina po-dem ser gerados através da reação de histidila com, tal como dietilprocarbo-nato ou brometo de para-bromofenacila. Outros miméticos incluem, tal comoos gerados através da hidroxilação de prolina e lisina; da fosforilação dosgrupos hidroxila de resíduos serila ou treonila; da metilação dos grupos alfa-amino de lisina, arginina e histidina; da acetilação da amina N-terminal; dametilação dos resíduos de amida da cadeia principal ou da substituição porN-metil aminoácidos; ou da amidação de grupos carboxila C-terminais.
Em algumas modalidades, um resíduo, tal como um aminoácido,de um polipeptídeo de acordo com a invenção também pode ser substituídopor um aminoácido (resíduo peptidomimético) da quiralidade oposta. Emalgumas modalidades, qualquer aminoácido que ocorre naturalmente naconfiguração L (que também pode ser referido como R ou S, dependendo daestrutura da entidade química) pode ser substituído pelo aminoácido domesmo tipo estrutural químico ou um peptidomimético, mas da quiralidadeoposta, referido como o D-aminoácido, mas também pode ser referido comoa forma R ou S.
A invenção fornece ainda métodos para a modificação dos poli-peptídeos de acordo com a invenção através de processos naturais, tal co-mo processamento pós-tradução (tal como fosforilação, acilação etc) ou a-través de técnicas de modificação química e os polipeptídeos modificadosresultantes. As modificações podem ocorrer em qualquer local no polipeptí-deo, incluindo na estrutura peptídica, nas cadeias laterais de aminoácidos ounos terminais amino ou carboxila. Será considerado que o mesmo tipo demodificação pode estar presente nos mesmos graus ou variáveis em váriossítios em um certo polipeptídeo. Ainda, um certo polipeptídeo pode ter mui-tos tipos de modificações. Em algumas modalidades, as modificações inclu-em acetilação, acilação, ADP-ribosilação, amidação, ligação covalente deflavina, ligação covalente de um porção heme, ligação covalente de um nu-cleotídeo ou um derivado de nucleotídeo, ligação covalente de um lipídeo oude um derivado de lipídeo, ligação covalente de um fosfatidiliriositol, ciclica-ção de reticulação, formação de ponte dissulfeto, desmetilação, formação deligações cruzadas covalentes, formação de cisteína, formação de pirogluta-mato, formilação, gama-carboxilação, glicosilação, formação de ancoragemde GPI1 hidroxilação, iodinação, metilação, miristoliação, oxidação, peguila-ção, processamento proteolítico, fosforilação, prenilação, racemização, sele-noilação, sulfação e adição de aminoácidos mediada por RNA de transferên-cia para proteína tal como arginilação. Vide, Creighton, T.E., Proteins - S-tructure and Molecular Properties 2- Ed., W.H. Freeman and Company, NovaIorque (1993); Posttranslational Covalent Modification of Proteins, B.C. John-son, Ed., Academic Press, Nova Iorque, pp. 1-12 (1983).
Os métodos de síntese química de peptídeos em fase sólida po-dem também ser utilizados para sintetizar o polipeptídeo os fragmentos deacordo com a invenção. Tal método é conhecido na técnica desde o iníciodos anos 60 (Merrifield, R. B., J. Am. Chem. Soc., 85:2149-2154, 1963) (Vi-de também Stewart1J. M. e Young, J. D., Solid Phase Peptide Synthesis, 2-Ed., Pierce Chemical Co., Rockford, Ill., pp. 11-12)) e foi recentemente em-pregado nos kits de planejamento e de síntese de peptídeos em laboratóriodisponíveis comercialmente (Cambridge Research Biochemicals). Tais kitsde laboratório disponíveis comercialmente utilizaram de forma geral os ensi-namentos de Η. M. Geysen e outros, Proc. Natl. Acad. Sci., USA, 81:3998(1984) e fornecem a síntese de peptídeos sobre extremidades de um grandenúmero de "bastões" ou "pinos" os quais todos são conectados a uma placaisolada. Quando tal sistema é utilizado, uma placa de bastões ou de pinos éinvertida e inserida e uma segunda placa de cavidades ou reservatórios cor-respondentes, que contêm soluções para a ligação ou para a ancoragem doaminoácido apropriado às extremidades dos pinos ou dos bastões. Repetin-do tal processo, isto é, invertendo e inserido as extremidades dos bastões edos pinos em soluções apropriadas, os aminoácidos são construídos empeptídeos desejados. Em adição, está disponível um número de sistemas desíntese de peptídeos FMOC disponíves. Por exemplo, a montagem de umpolipeptídeo ou de um fragmento pode ser realizada sobre um suporte sólidoutilizando um sintetizador de peptídeos automático da Applied Biosystems,Inc. Model 431 A®. Tal equipamento fornece acesso rápido aos peptídeos deacordo com a invenção, através da síntese direta ou através da síntese deuma série de fragmentos que podem ser acoplados utilizando outras técni-cas.
Os polipeptídeos de acordo com a invenção incluem enzimasaldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase emuma forma ativa ou inativa. Por exemplo, os polipeptídeos de acordo com ainvenção incluem pró-proteínas antes da "maturação" ou do processamentode pré-pró-seqüências, tal como através da enzima que processa a pró-proteína, tal como uma convertase da pró-proteína para gerar uma proteínamadura "ativa". Os polipeptídeos de acordo com a invenção incluem enzi-mas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolaseinativas por outras razões, tal como antes da "activação" através de um e-vento de processamento pós-tradução, tal como uma ação de endo- ou exo-peptidase ou proteinase, um evento de fosforilação, uma amidação, umaglicosilação ou uma sulfação, um evento de dimerização e similares. Os po-lipeptídeos de acordo com a invenção incluem todas as formas ativas, inclu-indo subseqüências ativas, tais como domínios catalíticos ou sítios ativos daenzima.
A invenção inclui enzimas aldolases imobilizadas, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase, anticorpos antialdolase, talcomo antipiruvato aldolase, tal como anti-HMG e/ou anti-KHG aldolase efragmentos dos mesmos. Em algumas modalidades, a invenção fornece mé-todos para inibir a atividade de uma enzima aldolase, tal como piruvato aldo-lase, tal como HMG e/ou KHG aldolase, tal como utilizando mutantes negati-vos dominantes ou anticorpos antialdolase, tal como antipiruvato aldolase,tal como anti-HMG e/ou anti-KHG aldolase de acordo com a invenção. Emalgumas modalidades, a invenção inclui heterocomplexos, tais como proteí-nas de fusão, heterodímeros etc., que compreendem as enzimas aldolases,tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo coma invenção.Em algumas modalidades, os polipeptídeos de acordo com ainvenção podem ter uma atividade de enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase, sob várias condições, tais comoextremas em pH e/ou em temperatura ou, em algumas modalidades, na pre-sença de agentes oxidantes. Em algumas modalidades, a invenção fornecemétodos que levam a preparações de enzimas aldolases alternativas, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase com eficiências eestabilidades catalíticas diferentes, tais como em relação à temperatura, a-gentes oxidantes e condições de lavagem variáveis. Em algumas modalida-des, as variações da enzima aldolase, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase podem ser produzidas utilizando técnicas de muta-gênese direcionada ao sítio e/ou mutagênese aleatória. Em algumas modali-dades, a evolução direcionada pode ser utilizada para produzir uma grandevariedade de variações de enzimas aldolases, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase com especificidades e estabilidades alterna-tivas.
As proteínas de acordo com a invenção são também úteis comoreagentes para pesquisa para identificar moduladores de enzimas aldolases,tal como piruvato aldolase, tal como HMG e/ou KHG aldolase, tais como ati-vadores ou inibidores da atividade de enzimas aldolases, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase. Sucintamente, as amostras deteste (compostos, caldos de cultura, extratos e similares) são adicionadasaos ensaios de enzimas aldolases, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase para determinar sua capacidade de inibir a cliva-gem do substrato. Os inibidores identificados desta maneira podem ser utili-zados na indústria e na pesquisa para reduzir ou prevenir proteólise indese-jada. Como com as enzimas aldolases, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase, os inibidores podem ser combinados para aumen-tar o espectro de atividade.
As enzimas de acordo com a invenção também são úteis comoreagentes de pesquisa para digerir proteínas ou no seqüenciamento de pro-teínas. Por exemplo, as enzimas aldolases, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase podem ser utilizadas para quebrar polipeptí-deos em fragmentos menores para o seqüenciamento utilizando, tal comoum seqüenciador automático.
A invenção fornece ainda métodos de descoberta de novas en-zimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase enzimas utilizando os ácidos nucléicos, os polipeptídeos e os anticorposde acordo com a invenção. Em algumas modalidades, bibliotecas de fage-mídeos são verificadas em relação à descoberta baseada na expressão deenzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG al-dolase. Em outras modalidades, bibliotecas de fago Iambda são verificadasem relação à descoberta baseada na expressão de enzimas aldolases, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase. A verificação dasbibliotecas de fagos ou de fagemídeos pode permitir a detecção de clonestóxicos; aumentar o acesso ao substrato; reduzir a necessidade de enge-nheirar um hospedeiro, omitindo o potencial a qualquer tendência resultanteda excisão de massa da biblioteca; e, crescimento mais rápido em densida-des baixas de clones. A verificação de bibliotecas de fagos ou de fagemí-deos pode ser feita em fase líquida ou em fase sólida. Em algumas modali-dades, a invenção fornece verificação em fase líquida. Isto fornece maiorflexibilidade nas condições de ensaio; fleximidade adicional de substrato;maior sensibilidade para clones mais fracos; e facilidade de automação emrelação à verificação em fase sólida.
A invenção fornece métodos de verificação utilizando as proteí-nas e os ácidos nucléicos de acordo com a invenção e automação robóticapara possibilitar a execução de muitos milhares de reações biocatalíticas eensaios de verificação em um período de tempo curto, tal como por dia, bemcomo garantindo um alto nível de acurácia e de reprodutibilidade (vide a dis-cussão de arranjos, abaixo). Como um resultado, uma biblioteca de compos-tos derivados pode ser produzida em uma questão de semanas. Para ensi-namentos adicionais sobre a modificação de moléculas, incluindo moléculaspequenas, vide o PCT/US94/09174; Patente U.S. N0 6.245.547.
Em algumas modalidades, os polipeptídeos ou os fragmentos deacordo com a invenção são obtidos através de procedimentos de enriqueci-mento bioquímico ou de purificação. A seqüência de polipeptídeos ou defragmentos potencialmente homólogos pode ser determinada através de en-saios de enzimas aldolases, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase enzima (vide os Exemplos 3, 4 e 5, abaixo), eletroforese emgel e/ou microsseqüenciamento. A seqüência do polipeptídeo ou do fragmen-to esperado de acordo com a invenção pode ser comparada com a de umpolipeptídeo de acordo com a invenção ou de um fragmento, tal como quecompreende pelo menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50,75, 100 ou 150 ou mais aminoácidos consecutivos do mesmo utilizandoqualquer um dos programas descritos anteriormente.
Uma outra modalidade da invenção é um ensaio para a identifi-cação de fragmentos ou de variações de acordo com a invenção, que man-têm a função enzimática dos polipeptídeos de acordo com a invenção. Porexemplo, os fragmentos ou as variações dos ditos polipeptídeos, podem serutilizadas para catalisar reações bioquímicas, que indicam que o fragmentoou a variação mantém a atividade enzimática de um polipeptídeo de acordocom a invenção. Um exemplo de ensaio para a determinação do fato de queos fragmentos de variações mantêm a atividade enzimática dos polipeptí-deos de acordo com a invenção inclui as etapas de: colocar em contato ofragmento ou a variação do polipeptídeo com uma molécula de substrato sobcondições que permitem que o fragmento ou a variação do polipeptídeo fun-cione e detectar um decréscimo no nível de substrato ou um aumento nonível do produto de reação específico entre o polipeptídeo e o substrato.
A presente invenção explora as propriedades catalíticas exclusi-va das enzimas. Embora o uso de biocatalisadores (isto é, enzimas purifica-das ou brutas, células não vivas ou vivas) nas transformações químicasnormalmente requera a identificação de um biocatalisador particular que rea-ja com um composto de partida específico, a presente invenção utiliza bioca-talisadores selecionados e condições de reação que são específicas paragrupos funcionais que estão presentes em muitos compostos de partida, taiscomo moléculas pequenas. Cada biocatalisador é específico para um grupofuncional ou para vários grupos funcionais relacionados e pode reagir commuitos compostos de partida contendo este grupo funcional.
Em algumas modalidades, as reações biocatalíticas produzemuma população de derivados partindo de um único composto de partida. Es-tes derivados podem ser submetidos a uma outra rodada de reações bioca-talíticas para produzir uma segunda população de compostos derivados. Mi-lhares de variações da molécula pequena ou do composto original podemser produzidos com cada repetição de derivatização biocatalítica.
As enzimas reagem em sítios específicos de um composto departida sem afetar o resto da molécula, um processo que é muito difícil deconseguir utilizando métodos químicos tradicionais. Este alto grau de especi-ficidade biocatalítica fornece os meios de identificação de um composto ativoisolado dentro da biblioteca. A biblioteca é caracterizada pela série de rea-ções biocatalíticas utilizadas para produzi-la, um assim chamado "históricobiossintético". A verificação da biblioteca em relação a atividades biológicase a determinação das identidades do histórico biossintético identificam a se-qüência de reação específica que produz o composto ativo. A seqüência dereação é repetida e a estrutura do composto sintetizado é determinada. Estemodo de identificação, ao contrário de outras abordagens de síntese e deverificação, não requer tecnologias de imobilização e os compostos podemser sintetizados e testados livremente em solução utilizando virtualmentequalquer tipo de ensaio de verificação. É importante observar, que o altograu de especificidade de reações enzimáticas sobre os grupos funcionaispermite a "determinação" de reações enzimáticas específicas que constitu-em a biblioteca produzida de forma biocatalítica.
Em algumas modalidades, as etapas do procedimento são reali-zadas utilizando automação robótica que possibilita a execução de muitosmilhares de reações biocatalíticas e/ou ensaios de verificação por dia assimcomo garante um alto nível de acurácia e reprodutibilidade. A automaçãorobótica também pode ser utilizada para verificar a atividade de aldolase pa-ra determinar se um polipeptídeo está dentro do âmbito de acordo com ainvenção. Como um resultado, em algumas modalidades, uma biblioteca decompostos derivados pode ser produzida em uma questão de semanas quepoderia levar anos para ser produzida utilizando métodos de verificaçãoquímica ou enzimática "tradicionais".
Em uma modalidade, a invenção fornece métodos para a modifi-cação de moléculas pequenas, que compreendem o contato de um polipep-tídeo codificado por um polinucleotídeo descrito aqui ou fragmentos enzima-ticamente ativos do mesmo com uma molécula pequena para produzir umamolécula pequena modificada. Uma biblioteca de moléculas pequenas modi-ficadas é testada para determinar se uma molécula pequena modificada estápresente dentro da biblioteca, que exibe uma atividade desejada. Uma rea-ção biocatalítica específica que produz a molécula pequena modificada deatividade desejada é identificada através da eliminação sistemática de cadauma das reações biocatalíticas utilizadas para produzir uma parte da biblio-teca e então do teste das moléculas pequenas produzidas na parte da biblio-teca em relação à presença ou à ausência da molécula pequena modificadacom a atividade desejada. As reações biocatalíticas específicas que produ-zem a molécula pequena modificada de atividade desejada são opcional-mente repetidas. As reações biocatalíticas são realizadas com um grupo debiocatalisadores que reagem com porçãos estruturais distintos encontradosdentro da estrutura de uma molécula pequena, cada biocatalisador é especí-fico para um porção estrutural ou um grupo de porçãos estruturais relaciona-dos; e cada biocatalisador reage com muitas moléculas pequenas diferentesque contêm a porção estrutural distinto.
Seqüências de Sinais, Pré-pró-domínios e Domínios Catalíticos de EnzimasAldolases. Tal como Piruvato Aldolase. tal como HMG e/ou KHG Aldolase
A invenção fornece seqüências de sinais (tais como peptídeosde sinais (SPs)), pré-pró-domínios e domínios catalíticos (CDs) de enzimasaldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. OsSPs, os pré-pró-domínios e/ou os CDs de acordo com a invenção podem serpeptídeos isolados, sintéticos ou recombinantes ou podem fazer parte deuma proteína de fusão, tal como um domínio heterólogo em uma proteínaquimérica. Em algumas modalidades, a invenção fornece ácidos nucléicosque codificam estes domínios catalíticos (CDs), pré-pró-domínios e seqüên-cias de sinais (SPs, tal como um peptídeo que possui uma seqüência quecompreende/que consiste em resíduos amino terminais de um polipeptídeode acordo com a invenção).
A invenção fornece seqüências de sinais isoladas, sintéticas ourecombinantes (tais como peptídeos de sinais) que consistem em ou quecompreendem uma seqüência que é apresentada nos resíduos 1 até 14, 1até 15, 1 até 16, 1 até 17, 1 até 18, 1 até 19, 1 até 20, 1 até 21, 1 até 22, 1até 23, 1 até 24, 1 até 25, 1 até 26, 1 até 27, 1 até 28, 1 até 28, 1 até 30, 1até 31, 1 até 32, 1 até 33, 1 até 34, 1 até 35, 1 até 36, 1 até 37, 1 até 38, 1até 40, 1 até 41, 1 até 42, 1 até 43, 1 até 44, 1 até 45, 1 até 46 ou 1 até 47ou mais, de um polipeptídeo de acordo com a invenção, tal como os polipep-tídeos de acordo com a invenção, vide também a Tabela 1, Exemplos 4, 5 e6, abaixo e a Listagem de Seqüências. Por exemplo, a Tabela 1, acima, a-presenta exemplos de seqüências de sinais (líderes) de acordo com a inven-ção, tal como no polipeptídeo que possui uma seqüência que é apresentadana SEQ ID NO:66, codificada, tal como pela SEQ ID NO:65, possui uma se-qüência sinal que compreende (ou que consiste em) os 27 resíduos aminoterminais ou MSIVVTKIERAGAAAVAALRTSGVATV (SEQ ID N0:407) quecorrespondem aos primeiros 27 aminoácidos da SEQ ID NO:66.
Em algumas modalidades, a invenção fornece seqüências desinais que compreendem os primeiros 14, 15, 16, 17, 18, 19, 20, 21, 22, 23,24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43,44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63,64, 65, 66, 67, 68, 69, 70 ou mais resíduos amino terminais de um polipeptí-deo de acordo com a invenção.
A invenção inclui polipeptídeos com ou sem uma seqüência sinale/ou uma pré-pró-seqüência. Em algumas modalidades, a invenção incluipolipeptídeos com seqüências de sinais heterólogas e/ou pré-pró-seqüências. A pré-pró-seqüência (incluindo uma seqüência de acordo com ainvenção utilizada como um pré-pró-domínio heterólogo) pode ficar localiza-da na extremidade amino terminal ou carbóxi terminal da proteína. Em algu-mas modalidades, a invenção inclui ainda seqüências de sinais, pré-pró-seqüências e domínios catalíticos isolados, sintéticos ou recombinantes (taiscomo "sítios ativos") que compreendem as seqüências de acordo com a in-venção. O polipeptídeo que compreende uma seqüência sinal de acordocom a invenção pode ser uma enzima aldolase, tal como piruvato aldolase,HMG e/ou KHG aldolase de acordo com a invenção ou uma outra enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ouuma outra enzima ou outro polipeptídeo. Os métodos para a identificação deseqüências de domínios e seqüências de sinais "pré-pró" são bem-conhecidos na técnica, vide Van de Ven (1993) Crit. Rev. Oncog. 4(2):115-136. Por exemplo, para identificar uma pré-pró-seqüência, a proteína é puri-ficada partindo do espaço extracelular e a seqüência da proteína N-terminalé determinada e comparada com a forma não processada.
As seqüências de sinais (SPs) e/ou pré-pró-seqüências da en-zima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolasede acordo com a invenção podem ser peptídeos isolados, sintéticos ou re-combinantes ou seqüências ligadas com uma outra enzima aldolase, tal co-mo piruvato aldolase, tal como HMG e/ou KHG aldolase ou um polipeptídeosem ser de aldolase, tal como sem ser de piruvato aldolase, por exemplo,sem ser de HMG e/ou sem ser de KHG aldolase, tal como uma proteína defusão (quimérica). Em algumas modalidades, A presente invenção refere-sea polipeptídeos que compreendem seqüências de sinais da enzima aldolase,tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo coma invenção. Em algumas modalidades, os polipeptídeos que compreendemseqüências de sinais SPs e/ou pré-pró da enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção com-preendem seqüências heterólogas a de uma enzima aldolase, tal como piru-vato aldolase, HMG e/ou KHG aldolase de acordo com a invenção (tal comouma proteína de fusão que compreende um SP e/ou pré-pró de acordo coma invenção e seqüências de uma outra enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase ou de uma proteína sem ser al-dolase, tal como sem ser piruvato aldolase, por exemplo, sem ser HMG e/ousem ser KHG aldolase). Em algumas modalidades, a invenção enzimas al-dolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase deacordo com a invenção com SPs e/ou pré-pró-seqüências heterólogas, taiscomo seqüências com uma seqüência sinal de levedura. Uma enzima aldo-lase, tal como piruvato aldolase, HMG e/ou KHG aldolase de acordo com ainvenção pode compreender um SP e/ou pré-pró heterólogo em um vetor, talcomo um vetor da série pPIC (Invitrogen, Carlsbad, CA).
Em algumas modalidades, os SPs e/ou as pré-pró-seqüênciasde acordo com a invenção são identificadas após a identificação de novospolipeptídeos de aldolase, tal como piruvato aldolase, tal como HMG e/ouKHG aldolase. As vias através das quais as proteínas são selecionadas etransportadas para sua localização celular apropriada são freqüentementereferidas como vias de direcionamento de proteínas. Um dos elementosmais importantes em todos estes sistemas de direcionamento é uma se-qüência de aminoâcidos curta no terminal amino de um polipeptídeo recém-sintetizado chamado de seqüência sinal. Esta seqüência sinal direciona umaproteína à sua localização apropriada na célula e é removida durante otransporte ou quando a proteína atinge seu destino final. A maioria das pro-teínas lisossomais, de membrana ou secretadas possui uma seqüência sinalamino terminal que as marca para a translocação para dentro do lúmen doretículo endoplasmático. As seqüências de sinais podem variar em compri-mento de aproximadamente 10 até 65 ou mais resíduos de aminoâcidos.Vários métodos de reconhecimento de seqüências de sinais são conhecidospelos versados na técnica. Por exemplo, em algumas modalidades, novospeptídeos de sinais de enzimas aldolases, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase são identificados por um método referidocomo SinalP. O SinaIP utiliza uma rede neural combinada que reconhecetanto os peptídeos de sinais quanto seus sítios de clivagem. (Nielsen (1997)"Identification of prokaryotic and eukaryotic signal peptides and prediction oftheir cleavage sites". Protein Engineering 10:1-6.
Em algumas modalidades, as enzimas aldolases, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invençãonão possuem SPs e/ou pré-pró-seqüências ou "domínios". Em algumas mo-dalidades, a invenção fornece as enzimas aldolases, tal como piruvato aldo-lase, tal como HMG e/ou KHG aldolase de acordo com a invenção que nãopossuem todo ou parte de um SP e/ou um pré-pró-domínio. Em algumasmodalidades, a invenção fornece seqüências de ácidos nucléicos que codifi-ca uma seqüência sinal (SP) e/ou pré-pró de uma enzima aldolase, tal comopiruvato aldolase, tal como HMG e/ou KHG aldolase ligada de forma opera-cional a uma seqüência de ácido nucléico de uma enzima aldolase diferente,tal como piruvato aldolase, tal como HMG e/ou KHG aldolase ou, opcional-mente, pode ser desejada uma seqüência sinal (SPs) e/ou um pré-pró-domínio de uma proteína sem ser aldolase, tal como sem ser piruvato aldo-lase, por exemplo, sem ser HMG e/ou sem ser KHG aldolase.
A invenção fornece ainda polipeptídeos isolados, sintéticos ourecombinantes que compreendem seqüências de sinais (SPs), pré-pró-domínio e/ou domínios catalíticos (CDs) de acordo com a invenção e se-qüências heterólogas. As seqüências heterólogas são seqüências que nãoestão naturalmente associadas (tal como a uma enzima) com um SP, umpré-pró-domínio e/ou um CD. A seqüência à qual o SP, o pré-pró-domínioe/ou o CD não está naturalmente associado pode estar na extremidade ami-no terminal, na extremidade carbóxi terminal do SP, do pré-pró-domínio e/oudo CD e/ou em ambas as extremidades do SP e/ou do CD. Em algumasmodalidades, A presente invenção refere-se a polipeptídeos isolados, sinté-ticos ou recombinantes que compreendem (ou que consistem em) um poli-peptídeo que compreende uma seqüência sinal (SP), um pré-pró-domínioe/ou um domínio catalítico (CD) de acordo com a invenção contanto que nãoesteja associado com qualquer seqüência à qual está naturalmente associa-do (tal como uma seqüência de enzima aldolase, tal como piruvato aldolase,HMG e/ou KHG aldolase). Similarmente, em algumas modalidades, a inven-ção fornece ácidos nucléicos isolados, sintéticos ou recombinantes que codi-ficam estes polipeptídeos. Assim, em algumas modalidades, o ácido nucléicoisolado, sintético ou recombinante de acordo com a invenção compreendeuma seqüência codificadora de uma seqüência sinal (SP), um pré-pró-domínio e/ou um domínio catalítico (CD) de acordo com a invenção e umaseqüência heteróloga (isto é, uma seqüência que não está naturalmente as-sociada com uma seqüência sinal (SP), um pré-pró-domínio e/ou um domí-nio catalítico (CD) de acordo com a invenção). A seqüência heteróloga podeestar na extremidade do terminal a 3', na extremidade do terminal a 5' e/ouem ambas as extremidades da seqüência codificadora do SP, do pré-pró-domínio e/ou do CD.
Bibliotecas de Enzimas e Peptídeos Híbridos (guiméricos) de Aldolase. talcomo Piruvato Aldolase. tal como HMG e/ou KHG Aldolase
Em algumas modalidades, a invenção fornece enzimas e proteí-nas de fusão híbridas de aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase, incluindo bibliotecas de peptídeos, que compreendem asseqüências de acordo com a invenção. As bibliotecas de peptídeos de acor-do com a invenção podem ser utilizadas para isolar moduladores peptídicos(tais como ativadores ou inibidores) de alvos, tais como substratos de enzi-mas, receptores, enzimas aldolases, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase enzima. As bibliotecas de peptídeos de acordo coma invenção podem ser utilizadas para identificar parceiros de ligação formaisde alvos, tais como ligantes, tais como citocinas, hormônios e similares. Emalgumas modalidades, a invenção fornece proteínas quiméricas que com-preendem uma seqüência sinal (SP), um pré-pró-domínio e/ou um domíniocatalítico (CD) de acordo com a invenção ou uma combinação dos mesmose uma seqüência heteróloga (vide acima).
Em algumas modalidades, as proteínas de fusão de acordo coma invenção (tal como a porção de peptídeo) são estabilizadas de forma con-formacional (em relação aos peptídeos linerares) para permitir uma afinidadede ligação maior em relação aos alvos. Em algumas modalidades, a inven-ção fornece fusões de enzimas aldolases, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase de acordo com a invenção e outros peptí-deos, incluindo peptídeos conhecidos e peptídeos aleatórios. Estes podemser fundidos de tal maneira que a estrutura das enzimas aldolases, tal comopiruvato aldolase, tal como HMG e/ou KHG aldolase não é significativamenteperturbada e o peptídeo é estabilizado de forma conformacional metaboli-camente ou estruturalmente. Isto permite a criação de uma biblioteca depeptídeos que é facilmente monitorada tanto em relação à sua presençadentro das células quanto à sua quantidade.
As variações de seqüências de aminoácidos de acordo com ainvenção podem ser caracterizadas por uma natureza predeterminada davariação, uma característica que os separa de uma forma que ocorre natu-ralmente, tal como uma variação alélica ou interespécies de uma seqüênciade uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldola-se. Em algumas modalidades, as variações de acordo com a invenção exi-bem a mesma atividade biológica qualitativa que o análogo que ocorre natu-ralmente. Alternativamente, as variações podem ser selecionadas por possu-írem características modificadas. Em algumas modalidades, embora o sítioou a região para a introdução de uma variação de seqüência de aminoácidosseja predeterminada, a mutação per se não precisa ser predeterminada. Porexemplo, para otimizar o desempenho de uma mutação em um certo sítio, amutagênese aleatória pode ser realizada no códon ou na região alvo e asvariações de enzimas aldolases expressas, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase podem ser selecionadas em relação à com-binação ótima de atividade desejada. As técnicas para produzir mutaçõespor substituição em sítios predeterminados no DNA que possuem uma se-qüência conhecida são bem-conhecidas, como discutido aqui, por exemplo,mutagênese com iniciador M13 e mutagênese por PCR. A seleção dos mu-tantes pode ser feita utilizando, tal como ensaios de formação ou de cliva-gem de ligações carbono-carbono. Em outras modalidades, as substituiçõesde aminoácidos podem ser resíduos isolados; as inserções podem ser naordem de aproximadamente 1 até 20 aminoácidos, embora inserções consi-deravelmente maiores possam ser feitas. As deleções podem variar de a -proximadamente 1 até aproximadamente 20, 30, 40, 50, 60, 70 resíduos oumais. Para a obtenção de um derivado final com as propriedades ótimas,substituições, deleções, inserções ou qualquer combinação das mesmaspode ser utilizada. Geralmente, estas alterações são feitas em alguns ami-noácidos para minimizar a alteração da molécula. Entretanto, alteraçõesmaiores podem ser toleradas em certas circunstâncias.
A invenção fornece enzimas aldolases, tal como piruvato aldola-se, tal como HMG e/ou KHG aldolase em que a estrutura da base estruturalpolipeptídica, a estrutura secundária ou a terciária, tal como uma estruturaem alfa-hélice ou em folha beta, foi modificada. Em algumas modalidades, acarga ou a hidrofobicidade foi modificada. Em algumas modalidades, a mas-sa de uma cadeia lateral foi modificada. Alterações substanciais na funçãoou na identidade imunológica são feitas através da seleção de substituiçõesque são menos conservativas. Por exemplo, podem ser feitas substituiçõesque afetam mais significativamente: a estrutura da base estrutural polipeptí-dica na área da alteração, por exemplo, uma estrutura em alfa-hélice ou emfolha beta; uma carga ou um sítio hidrofóbico da molécula, que pode estarem um sítio ativo;_ou_uma cadeia lateral._Em algumas modalidades, a inven^ção fornece substituições no polipeptídeo de acordo com a invenção em que
(a) um resíduo hidrophílico, tal como serila ou treonila, é substituído por umresíduo hidrofóbico, tal como leucila, isoleucila, fenilalanila, valila ou alanila;
(b) uma cisteína ou uma prolina é substituída por qualquer outro resíduo; (c)um resíduo que possui uma cadeia lateral eletropositiva, tal como lisila, argi-nila ou histidila, é substituído por um resíduo eletronegativo, tal como gluta-mila ou aspartila; ou (d) um resíduo que possui uma cadeia lateral volumosa,tal como fenilalanina, é substituído por um que não possui uma cadeia late-ral, tal como glicina. As variações podem exibir a mesma atividade biológicaqualitativa (isto é, uma atividade de enzima aldolase, tal como piruvato aldo-lase, tal como HMG e/ou KHG aldolase) embora as variações possam serselecionadas para modificar as características das enzimas aldolases, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase quando necessá-rio.
Em algumas modalidades, as enzimas aldolases, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invençãocompreendem epítopos ou marcações para purificação, seqüências de si-nais ou outras seqüências de fusão etc. Em algumas modalidades, as enzi-mas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolasede acordo com a invenção podem ser fundidas com um peptídeo aleatóriopara formar um polipeptídeo de fusão. Por "fundido" ou "ligado de forma ope-racional" entende-se aqui que o peptídeo aleatório e a enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase estão ligados jun-tos, de tal maneira a minimizar a quebra da estabilidade da estrutura da en-zima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase,de forma que mantenha a atividade de enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase. O polipeptídeo de fusão (ou opolinucleotídeo de fusão que codifica o polipeptídeo de fusão) pode compre-ender componentes adicionais bem como, incluir vários peptídeos em váriasalças.
Em algumas modalidades, os peptídeos e os ácidos nucléicosque os codificam são produzidos de forma aleatória, de forma completamen-te aleatória ou estão inclinados à sua "randomização", tal como na freqüên-cia de nucleotídeos/resíduos geral ou por posição. "Randomizado" significaque cada ácido nucléico e peptídeo consiste essencialmente de nucleotídeose aminoácidos aleatórios, respectivamente. Em algumas modalidades, osácidos nucléicos que dão origem aos peptídeos podem ser sintetizados qui-micamente e assim podem incorporar qualquer nucleotídeo em qualquer po-sição. Assim, quando os ácidos nucléicos são expressos para formar peptí-deos, qualquer resíduo de aminoácido pode ser incorporado em qualquerposição. O processo de síntese pode ser planejado para gerar ácidos nucléi-cos aleatórios, para permitir a formação de todas ou da maior parte dascombinações possíveis ao longo do comprimento do ácido nucléico, forman-do assim uma biblioteca de ácidos nucléicos aleatórios. A biblioteca podefornecer uma população com estrutura suficientemente diversa de produtosde expressão aleatórios para afetar uma faixa com probabilidade suficientede respostas celulares para fornecer uma ou mais células que exibem umaresposta desejada. Assim, a invenção fornece bibliotecas de interação gran-des o suficiente de forma que pelo menos um de seus membros tenha umaestrutura que forneça sua afinidade para alguma molécula, proteína ou outrofator.
Em algumas modalidades, uma enzima aldolase, tal como piru-vato aldolase, HMG e/ou KHG aldolase de acordo com a invenção é umaenzima com vários domínios que compreende um peptídeo sinal, um módulode ligação a carboidratos, um domínio catalítico de enzima aldolase, tal co-mo piruvato aldolase, HMG e/ou KHG aldolase, um Iigante e/ou um outrodomínio catalítico.
A invenção fornece métodos e seqüências para produzir polipep-tídeos quiméricos que podem codificar polipeptídeos híbridos biologicamenteativos (tais como enzimas aldolases híbridas, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase). Em algumas modalidades, os polinucleotí-deos originais (tal como um ácido nucléico de acordo com a invenção) codi-ficam polipeptídeos biologicamente ativos. Em algumas modalidades, ummétodo de acordo com a invenção produz novos polipeptídeos híbridos atra-vés da utilização de processos celulares que integram a seqüência dos poli-nucleotídeos originais de forma que o polinucleotídeo híbrido resultante codi-fica um polipeptídeo que demonstra atividades derivadas, mas diferentes, dados polipeptídeos biologicamente ativos originais (tal como aldolase ou anti-corpo de acordo com a invenção). Por exemplo, os polinucleotídeos originaispodem codificar uma enzima particular (tal como aldolase) partindo ou en-contrada em microorganismos diferentes. Uma enzima codificada por umprimeiro polinucleotídeo de um organismo ou variação pode, por exemplo,funcionar eficientemente sob uma condição ambiental particular, tal comoalta salinidade. Uma enzima codificada por um segundo polinucleotídeo deum organismo diferente ou variação pode funcionar eficientemente sob umacondição ambiental diferente, tal como temperaturas extremamente altas.Um polinucleotídeo híbrido que contém seqüências provenientes dos primei-ro e segundo polinucleotídeos originais pode codificar uma enzima que exibecaracterísticas de ambas as enzimas codificadas pelos polinucleotídeos ori-ginais. Assim, a enzima codificada pelo polinucleotídeo híbrido de acordocom a invenção pode funcionar eficientemente sob condições ambientaiscompartilhadas por cada uma das enzimas codificadas pelos primeiro e se-undo polinucleotídeos, tais como alta salinidade e temperaturas extremas.
Em algumas modalidades, um polipeptídeo híbrido gerado atra-vés de um método de acordo com a invenção pode exibir atividade enzimáti-ca especializada não exibida nas enzimas originais. Por exemplo, após a5 recombinação e/ou o reaporção redutor de polinucleotídeos que codificamenzimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG al-dolase, o polipeptídeo híbrido resultante codificado por um polinucleotídeohíbrido pode ser verificado em relação a atividades enzimáticas especializa-das sem ser de aldolase, tal como sem ser piruvato aldolase, tal como sem
10 ser HMG e/ou sem ser KHG-aldolase, tais como atividades de hidrolase,peptidase, fosforilase etc., obtidas de cada uma das enzimas originais. Emalgumas modalidades, o polipeptídeo híbrido é verificado para determinartais funcionalidades químicas que distinguem o polipeptídeo híbrido dos po-lipeptídeos parentais originais, tal como a temperatura, o pH ou a concentra-
15 ção de sal em que o polipeptídeo híbrido funciona.
Em algumas modalidades, a presente invenção refere-se a ummétodo para a produção de um polipeptídeo híbrido biologicamente ativo epara a verificação de tal polipeptídeo em relação à maior atividade atravésde:
20 1) introdução de pelo menos um primeiro polinucleotídeo em ligação ope-racional e um segundo polinucleotídeo em ligação operacional, pelomenos o primeiro polinucleotídeo e segundo polinucleotídeo comparti-lhando pelo menos uma região de homologia de seqüência parcial, emuma célula hospedeira adequada;
25 2) cultivo da célula hospedeira sob condições que promovem a reorgani-zação da seqüência resultante em um polinucleotídeo híbrido em liga-ção operacional;
3) expressão de um polipeptídeo híbrido codificado pelo polinucleotídeohíbrido;
30 4) seleção do polipeptídeo híbrido sob condições que promovem a identi-ficação de maior atividade biológica; e5) isolamento do polinucleotídeo que compreende o polipeptídeo híbrido.Isolamento e Descoberta de Enzimas Aldolases
A invenção fornece métodos para o isolamento e para a desco-berta de enzima aldolase, tal como piruvato aldolase, HMG e/ou KHG aldo-lases e dos ácidos nucléicos que as codificam. Os polinucleotídeos ou asenzimas podem ser isoladas partindo de organismos individuais ("isolados"),coleções de organismos que foram cultivados em meios definidos ("enrique-cimento de culturas") ou organismos não cultivados ("amostras ambientais").Os organismos podem ser isolados através de, tal como "peneiração" bioló-gica in vivo (vide a discussão, abaixo). O uso de uma abordagem indepen-dente de cultura para produzir polinucleotídeos que codificam novas ativida-des biológicas partindo de amostras ambientais é mais preferível porquepermite acessar recursos que não foram aproveitados de biodiversidade. Ospolinucleotídeos ou as enzimas também podem ser isolados de qualquer umde vários organismos, tais como bactérias. Em adição, células, polinucleotí-deos ou enzimas integrais também podem ser isoladas partindo de prepara-ções enzimáticas brutas derivadas de culturas destes organismos, tais comobactérias.
"Bibliotecas ambientais" são geradas partindo de amostras am-bientais e representam os genomas coletivos de organismos que ocorremnaturalmente arquivados em vetores de clonagem que podem ser propaga-dos em hospedeiros procarióticos adequados. Devido ao fato de que o DNAclonado é inicialmente extraído diretamente das amostras ambientais, asbibliotecas não estão limitadas à pequena fração de procariotos que podemser cultivados em cultura pura. Adicionalmente, uma normalização do DNAambiental presente nestas amostras poderia permitir uma representaçãomais equivalente do DNA proveniente de todas as espécies presentes naamostra original. Isto pode aumentar drasticamente a eficiência de descober-ta de genes interessantes partindo de constituintes em menor quantidade daamostra que podem ser sub-representados em várias ordens de grandezacomparados com as espécies dominantes.
Em algumas modalidades, as bibliotecas gênicas geradas par-tindo de um ou mais microorganismos não cultivados são verificadas em re-lação a uma atividade de interesse. As vias potenciais que codificam molé-culas bioativas de interesse são primeiramente capturadas em células proca-rióticás na forma de bibliotecas de expressão gênica. Em algumas modali-dades, os polinucleotídeos que codificam as atividades de interesse são iso-j5 lados de tais bibliotecas e introduzidos em uma célula hospedeira. A célulahospedeira é cultivada sob condições que promovem a recombinação e/ou oreaporção redutor criando biomoléculas potencialmente ativas com ativida-des novas ou maiores.
A "peneiração" biológica in vivo pode ser realizada utilizando10 máquinas baseadas em FACS e sem serem óticas (tais como magnéticas).Em algumas modalidades, as bibliotecas gênicas complexas são construídascom vetores que contêm elementos que estabilizam o RNA transcrito. Porexemplo, a inclusão de seqüências que resultam em estruturas secundáriastais como grampos que são planejados para flanquear as regiões transcritas15 do RNA serviriam para aumentar sua estabilidade, aumentando assim suameia-vida dentro da célula. As moléculas de sonda utilizadas no processo de"peneiração" biológica consistem em oligonucleotídeos marcados com molé-culas repórteres que emitem fluorescência apenas após a ligação da sondacom uma molécula alvo. Estas sondas são introduzidas nas células recom-20 binantes partindo da biblioteca utilizando um de vários métodos de transfor-mação. As moléculas de sonda se ligam ao mRNA alvo transcrito resultandoem moléculas em heteroduplex de DNA/RNA. A ligação da sonda com umalvo produzirá um sinal fluorescente que é detectado e selecionado pelamáquina de FACS durante o processo de seleção.25 Em algumas modalidades, a subclonagem é realizada para iso-
lar adicionalmente seqüências de interesse. Na subclonagem, uma parte deDNA é amplificada, digerida, geralmente por enzimas de restrição, para cor-tar a seqüência desejada, a seqüência desejada é ligada em um vetor recep-tor e é amplificada. Em cada etapa na subclonagem, a parte é verificada em30 relação à atividade de interesse, para garantir que o DNA que codifica a pro-teína estrutural não foi excluído. O inserto pode ser purificado em qualqueretapa da subclonagem, por exemplo, através de eletroforese em gel antesda ligação em um vetor ou quando as células que contêm o vetor receptor eas células que não contêm o vetor receptor são colocadas em meios seleti-vos contendo, por exemplo, um antibiótico, que matará as células que nãocontêm o vetor receptor. Os métodos específicos de subclonagem de inser-tos de cDNA em vetores são bem-conhecidos na técnica (Sambrook e ou-tros, Molecular Cloning: A Laboratory Manual, 2â Edi, Cold Spring HarborLaboratory Press (1989)). Em outras modalidades, as enzimas de acordocom a invenção são subclones. Tais subclones podem diferir do clone origi-nal, por exemplo, em comprimento, uma mutação, um "tag" ou uma marca-ção.
Os microorganismos dos quais o polinucleotídeo pode ser des-coberto, isolado ou preparado incluem microorganismos procarióticos, taiscomo Eubacteria e Archaebacteria e microorganismos eucarióticos inferiorestais como fungos, algumas algas e protozoários. Os polinucleotídeos podemser descobertos, isolados ou preparados partindo de amostras ambientaisem cujo caso o ácido nucléico pode ser recuperado sem o cultivo de um or-ganismo ou recuperado partindo de um ou mais organismos cultivados. Emalgumas modalidades, tais microorganismos podem ser extremófilos, taiscomo hipertermófilos, psicrófilos, psicrotróficos, halófilos, barófilos e acidófi-los. Podem ser utilizados os polinucleotídeos que codificam enzimas isola-das de microorganismos extremofílicos. As enzimas desta invenção podemfuncionar a temperaturas acima de 100°C, tais como as encontradas em fon-tes quentes terrestres e ventos térmicos da profundeza do mar ou a tempe-raturas abaixo de 0°C, tais como as encontradas em águas árticas, em am-biente saturado com sal, tal como o encontrado no Mar Morto, em valores depH em torno de O, tais como os encontrados em depósitos de carvão e fon-tes geotérmicas ricas em enxofre ou em valores de pH maiores que 11, taiscomo os encontrados em lama de esgoto. Em algumas modalidades, as en-zimas de acordo com a invenção possuem alta atividade ao longo de todauma faixa ampla de temperaturas e pHs.
Os polinucleotídeos selecionados e isolados como descrito ante-riormente aqui são introduzidos em uma célula hospedeira adequada. Umacélula hospedeira adequada é qualquer célula que é capaz de promover arecombinação e/ou o reaporção redutor. Os polinucleotídeos selecionados,em algumas modalidades, já estão em um vetor que inclui seqüências decontrole apropriadas. A célula hospedeira pode ser uma célula eucariótica|5 superior, tal como uma célula de mamífero ou uma célula eucariótica inferior,tal como uma célula de levedura ou, em algumas modalidades, a célula hos-pedeira pode ser uma célula procariótica, tal como uma célula bacteriana. Aintrodução do constructo na célula hospedeira pode ser realizada através datransfecção com fosfato de cálcio, transfecção mediada por DEAE-Dextrano10 ou eletroporação.
Os exemplos de hospedeiros incluem células bacterianas, taiscomo, E. coli, Streptomyces, Salmonella typhimuriurrr, células de fungo, talcomo levedura; células de insetos tais como Drosophila S2 e SpodopteraSf9; células de animais tal como CHO, COS ou melanoma de Bowes; ade-15 novírus; e células vegetais; vide a discussão anterior. A seleção de um hos-pedeiro apropriado é considerada como estando dentro do âmbito dos ver-sados na técnica partindo dos ensinamentos contidos aqui.
Vários sistemas de cultura de células de mamíferos podem serempregados para expressar uma proteína recombinante; os exemplos de20 sistemas de expressão de mamíferos incluem as linhagens COS-7 de fibro-blastos de rins de macaco, descritas em "SV40-transformed simian cellssupport the replication of early SV40 mutants" (Gluzman, 1981) e outras li-nhagens de células capazes de expressar um vetor compatível, por exem-plo, as linhagens de células C127, 3T3, CHO, HeLa e BHK. Os vetores de25 expressão de mamífero podem compreender uma origem de replicação, umpromotor e um intensificador adequados e também quaisquer sítios de liga-ção de ribossomos necessários, sítio de poliadenilação, sítios doadores ereceptores de processamento, seqüências de término da transcrição e se-qüências não transcritas flanqueadoras a 5'. As seqüências de DNA deriva-30 das dos sítios de processamento e de poliadenilação de SV40 podem serutilizadas para fornecer os elementos genéticos não transcritos necessários.
Em outras modalidades, os ácidos nucléicos, os polipeptídeos eos métodos de acordo com a invenção são utilizados em vias bioquímicas oupara gerar novos polinucleotídeos que codificam vias bioquímicas partindode um ou mais óperons ou aporçãos gênicos ou partes dos mesmos. Porexemplo, bactérias e muitos procariotos possuem um mecanismo coordena-do para regular genes cujos produtos estão envolvidos em processos rela-cionados. Os genes são agrupados em estruturas referidas como "aporçãosgênicos", em um único cromossomo e são transcritos juntos sob o controlede uma única seqüência reguladora, incluindo um único promotor que iniciaa transcrição do aporção inteiro. Assim, um aporção gênico é um grupo degenes adjacentes que são idênticos ou relacionados, geralmente em relaçãoa sua função (um exemplo de uma vide bioquímica codificada por aporçãosgênicos são policetídeos).
Em algumas modalidades, o DNA do aporção gênico é isoladopartindo de organismos diferentes e ligados em vetores, tais como vetoresque contêm seqüências reguladoras da expressão que podem controlar eregular a produção de uma proteína detectável ou a atividade do arranjo re-lacionado com a proteína partindo dos aporçãos gênicos ligados. O uso devetores que possuem uma capacidade excepcionalmente grande para a in-trodução de DNA exógeno pode ser apropriado para o uso com tais apor-çãos gênicos e são descritos com a finalidade de exemplo aqui como inclu-indo o fator f (ou fator de fertilidade) de E. coli. Este fator f de E. coli é umplasmídeo que realiza uma transferência em alta freqüência dele mesmodurante a conjugação e é ideal para atingir e propagar de forma estávelfragmentos de DNA grandes, tais como aporçãos gênicos provenientes deamostras microbianas misturadas. Em uma modalidade, os vetores de clo-nagem, referidos como "fosmídeos" ou vetores de cromossomo artificial bac-teriano (BAC) são utilizados. Estes são derivados do fator f de E. coli que écapaz de integrar de forma estável segmentos grandes de DNA genômico.Quando integrado com o DNA proveniente de uma amostra ambiental nãocultivada misturada, torna possível atingir fragmentos genômicos grandes naforma de uma "biblioteca de DNA ambiental" estável. Um outro tipo de vetorpara uso na presente invenção é um vetor de cosmídeo. Os vetores de cos-mídeo foram originalmente planejados para clonar e propagar sementosgrandes de DNA genômico. A clonagem em vetores de cosmídeo é descritaem detalhes em Sambrook e outros, Molecular Cloning: A Laboratory Manu-al, 2- Ed., Cold Spring Harbor Laboratory Press (1989). Uma vez ligados emum vetor apropriado, dois ou mais vetores contendo aporçãos gênicos depolicetídeo sintase diferentes podem ser introduzidos em uma célula hospe-deira adequada. As regiões de homologia de seqüência parcial compartilha-das pelos aporçãos gênicos promoverão processos que resultam na reorga-nização de seqüências em um aporção gênico híbrido. O novo aporção gê-nico híbrido pode então ser verificado em relação a maiores atividades nãoobservadas nos aporçãos gênicos originais.
Os métodos para a verificação em relação a várias atividadesenzimáticas são conhecidos pelos versados na técnica e são discutidos aolongo de todo o presente relatório descritivo, vide os Exemplos 1, 2 e 3, a-baixo. Tais métodos podem ser empregados quando são isolados os poli-peptídeos e os polinucleotídeos de acordo com a invenção.
Em algumas modalidades, a invenção fornece métodos para adescoberta e para o isolamento de aldolases, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase ou compostos para modificar a atividade des-tas enzimas, utilizando uma abordagem celular (vide a discussão, abaixo).
Podem ser selecionados os supostos clones que codificam aldolase, tal co-mo piruvato aldolase, tal como HMG e/ou KHG aldolase partindo da bibliote-ca de DNA genômico.
Metodologias de Seleção e Dispositivos de Monitoramento "On-Line"
Na prática dos métodos de acordo com a invenção, uma varie-dade de aparelhos e metodologias pode ser utilizada em associação com ospolipeptídeos e os ácidos nucléicos de acordo com a invenção, tal como pa-ra selecionar polipeptídeos em relação à atividade de enzima aldolase, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase, para selecionarcompostos como moduladores potenciais, tais como ativadores ou inibido-res, de uma atividade de enzima aldolase, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase, para anticorpos que se ligam a um polipeptí-deo de acordo com a invenção, para ácidos nucléicos que se hibridizam comum ácido nucléico de acordo com a invenção, para selecionar células queexpressam um polipeptídeo de acordo com a invenção e similares. Em adi-ção, aos formatos de arranjos descritos em detalhes abaixo para a verifica-ção de amostras, também podem ser utilizados formatos alternativos para aprática dos métodos de acordo com a invenção. Tais formatos incluem, porexemplo, espectrômetros de massa, cromatógrafos, tal como HPLC de altacirculação e outras formas de cromatografia líquida e formatos menores, taiscomo placas de 1536 cavidades, placas de 384 cavidades e assim por dian-te. Os apartos de seleção de alta circulação podem ser adaptados e utiliza-dos para a prática dos métodos de acordo com a invenção, vide os Pedidosde Patentes U.S. Nffil 20020001809; 20050272044.
Arranjos de Capilares
Os ácidos nucléicos ou os polipeptídeos de acordo com a inven-ção podem ser imobilizados ou aplicados em um arranjo. Os arranjos podemser utilizados para verificar ou monitorar bibliotecas de composições (taiscomo moléculas pequenas, anticorpos, ácidos nucléicos etc.) em relação àsua capacidade de se ligar a ou de modular a atividade de um ácido nucléicoou de um polipeptídeo de acordo com a invenção. Os arranjos de capilares,tal como o GIGAMATRIX®, Diversa Corporation, èan Diego, CA; e arranjosdescritos em, tal como o Pedido de Patente U.S. N0 20020080350 A1; WO0231203 A; WO 0244336 A, fornecem um aparato alternativo para sustentare verificar amostras. Em algumas modalidades, o arranjo de capilares incluium grande número de capilares formadas dentro de um arranjo de capilaresadjacentes, em que cada capilar compreende pelo menos uma parede quedefine um lúmen para manter uma amostra. O lúmen pode ser cilíndrico,quadrado, hexagonal ou qualquer outra forma geométrica contanto que asparedes formem um lúmen para a retenção de um líquido ou de uma amos-tra. Os capilares do arranjo de capilares podem ser mantidos juntos em pro-ximidade íntima para formar uma estrutura planar. Os capilares podem serligados juntos, sendo fundidos (tal como quando os capilares são feitos devidro), colados, ligados ou apertados lado a lado. Adicionalmente, o arranjode capilares pode incluir material intersticial disposto entre capilares adja-centes no arranjo, formando assim um dispositivo planar sólido contendo umgrande número de orifícios lado a lado.
Um arranjo de capilares pode ser formado de qualquer número-5 de capilares individuais, por exemplo, uma faixa de 100 até 4.000.000 decapilares. Ainda, um arranjo de capilares que possui aproximadamente100.000 ou mais capilares individuais pode ser formado no tamanho e noformato padronizados de uma placa Microtiter® para encaixe dentro de umequipamento de laboratório padronizado. Os Iumens são preenchidos manu-10 almente ou automaticamente utilizando a ação dos capilares ou microinjeçãoutilizando uma agulha fina. As amostras de interesse podem ser subseqüen-temente removidas dos capilares individuais para análise ou caracterizaçãoadicional. Por exemplo, uma sonda similar a uma agulha fina é posicionadaem comunicação fluida com um capilar selecionado para adicionar ou remo-15 ver material do lúmen.
Em um ensaio de seleção em um único recipiente, os compo-nentes do ensaio são misturados fornecendo uma solução de interesse, an-tes da inserção dentro do arranjo de capilares. O lúmen é preenchido atra-vés da ação dos capilares quando pelo menos uma parte do arranjo é imer-20 sa em uma solução de interesse. Reações e/ou atividade química ou biológi-ca em cada capilar é monitorada em relação a eventos detectáveis. Um e-vento detectável é freqüentemente referido como uma "coincidência", quepode geralmente ser distinguida de uma "não coincidência" produzindo capi-lares através da detecção ótica. Assim, os arranjos de capilares permitem25 ponderosamente uma detecção paralela de "coincidências".
Em um ensaio de seleção em vários recipientes, um polipeptídeoou um ácido nucléico, tal como um ligante, pode ser introduzido em um pri-meiro componente, que é introduzido em pelo menos uma parte de um capi-lar de um arranjo de capilares. Uma bolha de ar pode então ser introduzida30 no capilar atrás do primeiro componente. Um segundo componente podeentão ser introduzido no capilar, em que o segundo componente é separadodo primeiro componente pela bolha de ar. O primeiro e o segundo compo-nentes podem então ser misturados através da aplicação de pressão hidros-tática em ambos os lados do arranjo de capilares para haver colapso com abolha. O arranjo de capilares é então monitorado em relação a um eventodetectável resultante da reação ou de uma não reação dos dois componen-tes.
Em um ensaio de seleção de ligação, uma amostra de interessepode ser introduzida na forma de um primeiro líquido marcado com uma par-tícula detectável dentro de um capilar de um arranjo de capilaridades, emque o lúmen do capilar é revestido com um material de ligação para a liga-ção da partícula detectável ao lúmen. O primeiro líquido pode ser então re-movido do tubo capilar, em que a partícula detectável ligada é mantida den-tro do capilar e um segundo líquido pode ser introduzido dentro do tubo capi-lar. O capilar é então monitorado em relação a um evento detectável resul-tante da reação ou da não reação da partícula com o segundo líquido.Arranjos ou "Biochips"
Os ácidos nucléicos ou os polipeptídeos de acordo com a inven-ção podem ser imobilizados a ou aplicados em um arranjo. Os arranjos po-dem ser utilizados para selecionar ou monitorar bibliotecas de composições(tais como moléculas pequenas, anticorpos, ácidos nucléicos etc.) em rela-ção a sua capacidade de se ligar a ou de modular a atividade de um ácidonucléico ou de um polipeptídeo de acordo com a invenção. Por exemplo, emalgumas modalidades da invenção, um parâmetro monitorado é a expressãodo produto da transcrição de um gene de uma enzima aldolase, tal comopiruvato aldolase, HMG e/ou KHG aldolase. Um ou mais ou todos os produ-tos da transcrição de uma célula podem ser medidos através da hibridizaçãode uma amostra que compreende os produtos da transcrição da célula ou osácidos nucléicos representativos de ou complementares aos produtos datranscrição de uma célula, através da hybridização com ácidos nucléicosimobilizados sobre um arranjo ou um "biochip". Utilizando um "arranjo" deácidos nucléicos sobre um microchip, alguns ou todos os produtos da trans-crição de uma célula podem ser quantificados simultaneamente. Alternati-vamente, os arranjos que compreendem ácido nucléico genômico tambémpodem ser utilizados para determinar o genótipo de uma cepa recém-engenheirada produzida através dos métodos de acordo com a invenção. Os"arranjos de polipeptídeos" também podem ser utilizados para quantificarsimultaneamente um grande número de proteínas. A presente invenção po-de ser praticada com qualquer "arranjo" conhecido, também referido comoum "microarranjo" ou um "arranjo de ácido nucléico" ou um "arranjo de poli-peptídeo" ou um "arranjo de anticorpo" ou um "biochip" ou uma variação dosmesmos. Os arranjos são genericamente um grande número de "pontos" ou"elementos alvos", cada elemento alvo compreendendo uma quantidade de-finida de uma ou mais moléculas biológicas, tais como oligonucleotídeos,imobilizados sobre uma área definida de uma superfície de substrato para aligação específica com uma molécula da amostra, tal como produtos datranscrição de mRNA.
O termo "arranjo" ou "microarranjo" ou "biochip" ou "chip" comoutilizado aqui é um grande número de elementos alvos, cada elemento alvocompreendendo uma quantidade definida de um ou mais polipeptídeos (in-cluindo anticorpos) ou ácidos nucléicos imobilizados sobre uma área definidade uma superfície de substrato, como discutido em detalhes adicionais, a -baixo.
Na prática dos métodos de acordo com a invenção, qualquerarranjo e/ou método conhecido de produção e de utilização dos arranjos po-de ser incorporado totalmente ou em parte ou variações do mesmo, comodescrito, por exemplo, nas Patentes U.S. N- 6.277.628; 6.277.489
6.261.7766.013.4405.632.9575.700.637
6.258.606; 6.054.2705.965.452; 5.959.0985.556.752; 5.143.854
6.045.996; 6.022.9635.830.645; 5.770.4565.800.992; 5.744.305
6.048.6955.856.1745.807.522
5.556.752; 5.434.049; vide também, tal como WO 99/51773; WO99/09217; WO 97/46313; WO 96/17958; vide também, tal como Johnston(1998) Curr. Biol. 8.R171-R174; Schummer (1997) Biotechniques 23:1087-1092; Kern (1997) Biotechniques 23:120-124; Solinas-Toldo (1997) Genes,Chromosomes & Câncer 20:399-407; Bowtell (1999) Nature Genetics Supp.21:25-32. Vide também os pedidos de patentes U.S. publicados N-20010018642; 20010019827; 20010016322; 20010014449; 20010014448;20010012537;20010008765.
Anticorpos e Métodos de Seleção Baseados em Anticorpos
A invenção fornece anticorpos isolados, sintéticos ou recombi-nantes que se ligam especificamente a uma enzima aldolase, tal como piru-vato aldolase, HMG e/ou KHG aldolase de acordo com a invenção. Estesanticorpos podem ser utilizados para isolar, identificar ou quantificar as en-zimas aldolases, tal como piruvato aldolase, tal como HMG e/ou KHG aldo-lase de acordo com a invenção ou polipeptídeos relacionados. Estes anti-corpos podem ser utilizados para isolar outros polipeptídeos dentro do âmbi-to da invenção ou outras enzimas aldolases relacionadas, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase. Os anticorpos podem ser plane-jados para se ligarem a um sítio ativo de uma enzima aldolase, tal como pi-ruvato aldolase, HMG e/ou KHG aldolase. Assim, a invenção fornece méto-dos de inibição de enzimas aldolases, tal como piruvato aldolase, tal comoHMG e/ou KHG aldolase utilizando os anticorpos de acordo com a inyenção(vide a discussão anterior em relação às aplicações de composições anti-enzima aldolase, tal como antipiruvato aldolase, tal como anti-HMG e/ou an-ti-KHG aldolase de acordo com a invenção).
O termo "anticorpo" inclui um peptídeo ou um polipeptídeo deri-vado de, modelado após ou codificado substancialmente por um gene deimunoglobulina ou genes de imunoglobulinas ou fragmentos dos mesmos,capaz de se ligar especificamente a um antígeno ou a um epítopo, vide Fun-damental Immunology, Terceira Edição, W.E. Paul, ed., Raven Press, N.Y.(1993); Wilson (1994) J. Immunol. Methods 175:267-273; Yarmush (1992) J.Biochem. Biophys. Methods 25:85-97. O termo anticorpo inclui partes que seligam a antígenos, isto é, "sítios de ligação a antígenos", (tais como fragmen-tos, subseqüências, regiões de determinação da complementaridade (C-DRs)) que mantêm a capacidade de se ligarem a um antígeno, incluindo (i)um fragmento FAB, um fragmento monovalente que consiste dos domíniosVL, VH, CL e CH1; (ii) um fragmento F(ab')2, um fragmento bivalente com-preendendo dois fragmentos Fab ligados por uma ponte bissulfeto na regiãoda junção; (iii) um fragmento Fd que consiste dos domínios VH e CH1; (iv)um fragmento Fv que consiste dos domínios VL e VH de um único braço deum anticorpo, (v) um fragmento dAb (Ward e outros, (1989) Nature 341:544-546), que consiste em um domínio VH; e (vi) uma região de determinação dacomplementaridade (CDR) isolada. Os anticorpos de cadeia simples sãotambém incluídos como referência no termo "anticorpo".
A invenção fornece fragmentos das enzimas de acordo com ainvenção (tais como peptídeos) incluindo fragmentos imunogênicos (tais co-mo subseqüências) de um polipeptídeo de acordo com a invenção. Em al-gumas modalidades, a invenção fornece composições que compreendemum polipeptídeo ou um peptídeo de acordo com a invenção e adjuvantes ouveículos e similares.
Os anticorpos podem ser utilizados na imunoprecipitação, nacoloração, em colunas de imunoafinidade e similares. Se desejado, as se-qüências de ácidos nucléicos que codificam antígenos específicos podemser geradas através da imunização seguida pelo isolamento do polipeptídeoou do ácido nucléico, da amplificação ou da clonagem e da imobilização dopolipeptídeo sobre um arranjo de acordo com a invenção. Alternativamente,os métodos de acordo com a invenção podem ser utilizados para modificar aestrutura de um anticorpo produzido por uma célula que será modificado, talcomo a afinidade de um anticorpo pode ser aumentada ou diminuída. Alémdisso, a capacidade de produzir ou de modificar anticorpos pode ser um fe-nótipo engenheirado em uma célula através dos métodos de acordo com ainvenção.
Os métodos de imunização, produção e isolamento de anticor-pos (policlonais e monoclonais) são conhecidos pelos versados na técnica esão descritos na literatura científica e de patente, vide Coligan1 CURRENTPROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY (1991); Stites (eds.)BASIC AND CLINICAL IMMUNOLOGY (7â ed.) Lange Medicai Publications,Los Altos, CA ("Stites"); Goding, MONOCLONAL ANTIBODIES: PRlNCI-PLES AND PRACTICE (2â ed.) Academic Press, Nova Iorque, NY (1986);Kohler (1975) Nature 256:495; Harlow (1988) ANTIBODIES, A LABORA-TORY MANUAL, Cold Spring Harbor Publications, Nova Iorque. Os anticor-pos também podem ser produzidos in vitro, tal como utilizando bibliotecas deexibição por fagos expressando sítios de ligação a anticorpos recombinan-tes, em adição aos métodos tradicionais in vivo utilizando animais. Vide, Ho-ogenboom (1997) Trends Biotechnol. 15:62-70; Katz (1997) Annu. Rev. Bio-phys. Biomol. Struct. 26:27-45.
Os polipeptídeos de acordo com a invenção ou fragmentos quecompreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150aminoácidos consecutivos dos mesmos, podem também ser utilizados para10 produzir anticorpos que se ligam especificamente aos polipeptídeos ou aosfragmentos. Os anticorpos resultantes podem ser utilizados em procedimen-tos de cromatografia por imunoafinidade para isolar ou purificar o polipeptí-deo ou para determinar se o polipeptídeo está presente em uma amostrabiológica. Em tais procedimentos, uma preparação de proteína, tal como um15 extrato ou uma amostra biológica é colocada em contato com um anticorpocapaz de se ligar especificamente a um dos polipeptídeos de acordo com ainvenção ou a fragmentos que compreendem pelo menos 5, 10, 15, 20, 25,30, 35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos dos mesmos.
Nos procedimentos de imunoafinidade, o anticorpo é ligado a um20 suporte sólido, tal como uma conta ou outra matriz de coluna. A preparaçãode proteína é colocada em contato com o anticorpo sob condições em que oanticorpo se liga especificamente a um dos polipeptídeos de acordo com ainvenção ou a um fragmento dos mesmos. Após uma lavagem para removerproteínas ligadas de forma não específica, os polipeptídeos ligados especifi-25 camente são eluídos.
A capacidade das proteínas em uma amostra biológica de seligar ao anticorpo pode ser determinada utilizando uma variedade de proce-dimentos familiares aos versados na técnica. Por exemplo, a ligação podeser determinada através da marcação do anticorpo com uma marcação de-30 tectável tal como um agente fluorescente, uma marcação enzimática ou umradioisótopo. Alternativamente, a ligação do anticorpo à amostra pode serdetectada utilizando um anticorpo secundário que possui tal marcação de-tectável sobre o mesmo. Os ensaios particulares incluem ensaios de ELISA,ensaios em sanduíche, ensaios radioimunológicos e Western Blots.
Os anticorpos policlonais gerados contra os polipeptídeos deacordo com a invenção ou fragmentos que compreendem pelo menos 5, 10,15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos dosmesmos podem ser obtidos através da injeção direta dos polipeptídeos emum animal ou através da administração dos polipeptídeos a um animal, porexemplo, um não humano. O anticorpo obtido dessa maneira pode se ligarao próprio polipeptídeo. Dessa maneira, mesmo uma seqüência que codificaapenas um fragmento do polipeptídeo pode ser utilizada para produzir anti-corpos que podem se ligar ao polipeptídeo nativo inteiro. Tais anticorpos po-dem então ser utilizados para isolar o polipeptídeo das células que expres-sam tal polipeptídeo.
Para a preparação de anticorpos monoclonais, qualquer técnicaque forneça os anticorpos produzidos por culturas de linhagens de célulascontínuas pode ser utilizada. Os exemplos incluem a técnica de hibridoma(Kohler e Milstein, Nature, 256:495-497. 1975), a técnica de trioma, a técnicade hibridoma de células B humanas (Kozbor e outros, Immunology Today4:72, 1983) e a técnica de EBV-hibridoma (Cole e outros, 1985, em Mono-clonal Antibodies and Câncer Therapy, Alan R. Liss, Inc., pp. 77-96).
As técnicas descritas para a produção de anticorpos de cadeiaúnica (Patente U.S. N0 4.946.778) podem ser adaptadas para a produção deanticorpos de cadeia única para os polipeptídeos de acordo com a invençãoou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40,50, 75, 100 ou 150 aminoácidos consecutivos dos mesmos. Alternativamen-te, camundongos transgênicos podem ser utilizados para expressar anticor-pos para estes polipeptídeos ou fragmentos dos mesmos.
Os anticorpos gerados contra os polipeptídeos de acordo com ainvenção ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30,35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos dos mesmos podemser utilizados na seleção em relação a polipeptídeos similares provenientesde outros organismos e amostras. Em tais técnicas, os polipeptídeos prove-nientes do organismo são colocados em contato com o anticorpo e os poli-peptídeos que se ligam especificamente ao anticorpo são detectados. Qual-quer um dos procedimentos descritos anteriormente pode ser utilizado paradetectar a ligação ao anticorpo. Um tal ensaio de seleção é descrito emShulman H, Eberhard A1 Eberhard C, Ulitzur S, Keinan E, Bioorg Med ChemLett. 2000 Oct 16;10(20):2353-6, Highly sensitive and rapid detection of anti-body catalysis by Iuminescent bactéria.
Kits
A invenção fornece kits que compreendem as composições, taiscomo ácidos nucléicos, cassetes de expressão, vetores, células, sementesou plantas transgênicas ou partes de plantas, polipeptídeos (tal como umaenzima aldolase) e/ou anticorpos de acordo com a invenção. Os kits contêmainda material instrucional que ensina as metodologias e os usos industriais,médicos e dietéticos de acordo com a invenção, como descrito aqui.
Engenharia de Células Inteiras e Medida de Parâmetros Metabólicos
Os métodos de acordo com a invenção fornecem evolução decélulas inteiras ou engenharia de células inteiras, de uma célula para desen-volver uma nova cepa de células que possui um novo fenótipo, tal como umaatividade nova ou modificada de enzima aldolase, tal como piruvato aldola-se, tal como HMG e/ou KHG aldolase, através da modificação da composi-ção genética da célula. Vide o pedido de Patente U.S. N0 20040033975.
A composição genética pode ser modificada através da adiçãona célula de um ácido nucléico de acordo com a invenção, tal como umaseqüência codificadora de uma enzima de acordo com a invenção. VideW00229032; W00196551.
Para detectar o novo fenótipo, pelo menos um parâmetro meta-bólico de uma célula modificada é monitorado em um quadro de tempo em"tempo real" ou "online". Em algumas modalidades, um grande número decélulas, tal como uma cultura de células, é monitorado em "tempo real" ou"online". Em algumas modalidades, um grande número de parâmetros meta-bólicos é monitorado em "tempo real" ou "online". Os parâmetros metabóli-cos podem ser monitorados utilizando as enzimas aldolases, tal como piru-vato aldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção.
A análise do fluxo metabólico (MFA) se baseia em uma estruturabioquímica conhecida. Uma matriz metabólica linearmente independente éconstruída com base na lei de conservação de massa e na hipótese de es-tado pseudo-estacionário (PSSH) nos metabólitos intracelulares. Na práticados métodos de acordo com a invenção, são estabelecidas redes metabóli-cas, incluindo:
• a identidade de todos os substratos, os produtos e metabólitos inter-mediários da vide
• a identidade de todas as reações químicas de interconversão dos me-tabólitos da vide, da estequiometria das reações da vide,
• a identidade de todas as enzimas que catalisam as reações, da cinéticade reação das enzimas,
• as interações reguladoras entre os componentes da vide, tais comointerações alostéricas, interações enzima-enzima etc,
• a compartimentalização intracelular de enzimas ou qualquer outra or-ganização supramolecular das enzimas e
• a presença de quaisquer gradientes de concentração de metabólitos,enzimas ou moléculas efetoras ou barreiras de difusão para o seu mo-vimento.
Uma vez que a rede metabólica para uma certa cepa é construí-da, a apresentação matemática através da noção de matriz pode ser intro-duzida para estimar os fluxos metabólicos intracelulares se os dados de me-taboloma online estiverem disponíveis. O fenótipo metabólico se baseia nasalterações da rede metabólica total dentro de uma célula. O fenótipo meta-bólico se baseia na alteração da utilização da vide em relação a condiçõesambientais, regulação genética, estado do desenvolvimento e o genótipo etc.Em algumas modalidades dos métodos de acordo com a invenção, após ocálculo de MFA online, o comportamento dinâmico das célülas, seu fenótipoe outras propriedades são analisados através da investigação da utilizaçãoda vide. Por exemplo, se o fornecimento de glicose for aumentado e o dooxigênio for diminuído durante a fermentação por leveduras, a utilização dasvias respiratórias será reduzida e/ou interrompida e a utilização das viasfermentativas dominará. O controle do estado fisiológico de culturas de célu-las se tornará possível após a análise da vide. Os métodos de acordo com ainvenção podem ajudar a determinar como manipular a fermentação através-5 da determinação de como alterar o fornecimento de substrato, a temperatu-ra, o uso de indutores etc. para controlar o estado fisiológico de células parase mover ao longo da direção desejada. Na prática dos métodos de acordocom a invenção, os resultados de MFA podem também ser comparados comos dados de transcriptoma e de proteoma para planejar experimentos e pro-10 tocolos para a engenharia metabólica ou o embaralhamento gênico etc.
Na prática dos métodos de acordo com a invenção, qualquerfenótipo modificado ou novo pode ser conferido e detectado, incluindo novascaracterísticas ou melhoradas na célula. Qualquer aspecto do metabolismoou do crescimento pode ser monitorado.15 Monitoramento da expressão de um produto da transcrição de mRNA
Em algumas modalidades da invenção, o fenótipo engenheiradocompreende o aumento ou a diminuição da expressão de um produto datranscrição de mRNA (tal como uma mensagem de enzima aldolase, tal co-mo piruvato aldolase, HMG e/ou KHG aldolase) ou da produção de novos20 produtos da transcrição (tal como uma enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase enzima) em uma célula. Estaexpressão maior ou menor pode ser analisada através do teste em relação àpresença de uma enzima aldolase, tal como piruvato aldolase, HMG e/ouKHG aldolase de acordo com a invenção ou através de ensaios da atividade25 da enzima aldolase, tal como piruvato aldolase, tal como HMG e/ou KHGaldolase. Os produtos da transcrição ou mensagens de mRNA, também po-dem ser detectados e quantificados através de qualquer método conhecidona técnica, incluindo, tal como Northern blots, reações de amplificação quan-titativas, hibridização a arranjos e similares. As reações de amplificação30 quantitativas incluem, tal como PCR quantitativa, incluindo, tal como reaçãoem cadeia da polimerase com transcrição inversa quantitativa ou RT-PCR;RT-PCR em tempo real quantitativa ou "RT-PCR cinética em tempo real"(vide Kreuzer (2001) Br. J. Haematol. 114:313-318; Xia (2001) Transplantati-on 72:907-914).
Em algumas modalidades da invenção, o fenótipo engenheiradoé produzido através do nocaute da expressão de um gene homólogo. A se-qüência codificadora do gene ou um ou mais elementos de controle datranscrição podem ser nocauteados, tais como promotores ou intensificado-res. Assim, a expressão de um produto da transcrição pode ser completa-mente eliminada ou apenas diminuída.
Em algumas modalidades da invenção, o fenótipo engenheiradocompreende o aumento da expressão de um gene homólogo. Isto pode serrealizado através do nocaute de um elemento de controle negativo, incluindoum elemento regulador da transcrição que atua em eis ou em trans ou atra-vés da mutagênese de um elemento de controle positivo. Um ou mais outodos os produtos da transcrição de uma célula podem ser medidos atravésda hibridização de uma amostra que compreende os produtos da transcriçãoda célula ou os ácidos nucléicos representativos de ou complementares aosprodutos da transcrição de uma célula, através da hibridização a ácidos nu-cléicos imobilizados em um arranjo.
Monitoramento da expressão de polipeptídeos. peptídeos e aminoácidos
Em algumas modalidades da invenção, o fenótipo engenheiradocompreende o aumento ou a diminuição da expressão de um polipeptídeo(tal como uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHGaldolase) ou da produção de novos polipeptídeos em uma célula. Esta ex-pressão maior ou menor pode ser analisada através da determinação daquantidade de enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase presente ou através de ensaios da atividade da enzimaaldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase. Ospolipeptídeos, os peptídeos e os aminoácidos também podem ser detecta-dos e quantificados através de qualquer método conhecido na técnica, inclu-indo, tal como ressonância magnética nuclear (RMN), espectrofotometria,radiografia (marcação radioativa de proteínas), eletroforese, eletroforese emcapilar, cromatografia líquida de alto desempenho (HPLC), cromatografia emcamada fina (TLC), cromatografia por hiperdifusão, vários métodos imunoló-gicos, tais como imunoprecipitação, imunodifusão, imunoeletroforese, radio-imunoensaios (RIAs), ensaios imunoabsorventes ligados à enzimas (ELI-SAs), ensaios imunofluorescentes, eletroforese em gel (tal como SDS-PAGE), coloração com anticorpos, separador de células ativado por f Iuores-cência (FACS), espectrometria de massa por pirólise, Espectrometria de In-fravermelho com Transformação de Fourier1 espectrometria de Raman, GC-MS e LC-EIectrospray e espectrometrias de massa por eletrospray em tan-dem cap-LC e similares. As novas atividades biológicas também podem serverificadas utilizando métodos ou variações dos mesmos, descritos na Pa-tente U.S. N0 6.057.103. Além disso, como discutido abaixo em detalhes, umou mais ou todos os polipeptídeos de uma célula podem ser medidos utili-zando um arranjo de proteínas.Aplicações Industriais, Farmacêuticas e outras
Os polipeptídeos de acordo com a invenção (tais como que pos-suem aldolase, tal como piruvato aldolase, tal como HMG e/ou KHG aldola-se) podem catalisar a formação ou a clivagem de ligações carbono-carbono.As enzimas de acordo com a invenção podem ser catalisadores altamenteseletivos. Em algumas modalidades, a invenção fornece processos industri-ais utilizando enzimas de acordo com a invenção, tal como na indústria far-macêutica ou de suplementação nutricional (dietética), nas indústrias de ali-mentos ou de produtos alimentícios, tal como nos métodos para a produçãode alimentos e produtos alimentícios e aditivos para alimentos e produtosalimentícios. Em algumas modalidades, a invenção fornece processos queutilizam as enzimas de acordo com a invenção na indústria médica, tal comopara produzir produtos farmacêuticos ou agentes de auxílio ou de suplemen-tação dietética ou suplementos e aditivos alimentícios.Conversão de biomassa e produção de biocombustíveis limpos
A invenção fornece enzimas, tais como aldolases, incluindo piru-vato aldolases tais como, sem limitação, HMG e/ou KHG aldolases (incluindomisturas ou "coquetéis" de enzimas) e métodos para a conversão de umabiomassa ou qualquer material lignocelulósico (por exemplo, qualquer com-posição que compreenda celulose, hemicelulose e lignina), em combustíveis(por exemplo, bioetanol, biobutanol, biopropanol, biometanol, biodiesel), utili-zando as enzimas da invenção, em adição a produtos alimentícios, alimen-tos e produtos químicos. Assim, as composições e os métodos da invençãofornecem alternativas eficientes e sustentáveis ou adjuntos para uso de pro-dutos à base de petróleo, por exemplo, como uma mistura de bioetanol egasolina. A invenção fornece organismos que expressam as enzimas da in-venção para a participação em ciclos químicos que envolvem a conversãode biomassa natural. Em uma modalidade, as enzimas e os métodos para aconversão são utilizados em conjuntos de enzimas para a despolimerizaçãoeficiente de polímeros de celulose e de hemicelulose em porçãos de carbonoque podem ser metabolizados. A invenção fornece métodos para descobrir eimplementar as mais eficientes das enzimas para possibilitar estes novosprocessos importantes de "conversão de biomassa" e industriais de energiaalternativa.
Os métodos da invenção incluem ainda pegar o material de Iig-nocelulose convertido (processado pelas enzimas da invenção) e transfor-má-lo em um combustível (por exemplo, bioetanol, biobutanol, biopropanol,biometanol, biodiesel) através da fermentação e/ou da síntese química. Emuma modalidade, os açúcares produzidos são fermentados e/ou os produtosque não podem ser fermentados são gaseificados.
As enzimas da invenção (incluindo, por exemplo, organismos,tais como microorganismos, por exemplo, fungos, levedura ou bactérias queproduzem e em algumas modalidades que secretam as enzimas recombi-nantes da invenção) podem ser utilizadas em ou incluídas/integradas emqualquer estágio de qualquer processo de conversão de biomassa, por e-xemplo, em qualquer uma etapa, várias etapas ou incluídas em todas as e-tapas ou todos os métodos a seguir de processos de conversão de biomas-sa ou todas estas alternativas de biocombustível:
Combustão direta: a queima de material através do calor direto e é atecnologia de biomassa mais simples; pode ser muito econômica seuma fonte de biomassa estiver à mão.Pirólise: é a degradação térmica de biomassa através de calor na au-sência de oxigênio. Em uma modalidade, a biomassa é aquecida atéuma temperatura entre aproximadamente 427 e 760 graus Celsius (800e 1400 graus Fahrenheit), mas nenhum oxigênio é introduzido parasustentar a combustão resultante na criação de gás, óleo combustível ecarvão vegetal.
Gaseificação: a biomassa pode ser utilizada para produzir metano atra-vés do aquecimento ou da digestão anaeróbica. Syngas1 uma misturade monóxido de carbono e hidrogênio, pode ser derivada de biomass.Gás de Aterro Sanitário: é gerado através da deterioração (digestãoanaeróbica) de lixo enterrado em aterros sanitários. Quando o lixo or-gânico se decompõe, gera gás que consiste em aproximadamente 50%de metano, o componente principal do gás natural.Digestão anaeróbica: converte matéria orgânica em uma mistura demetano, o componente principal do gás natural e do dióxido de carbo-no. Em uma modalidade, a biomassa, tal como esgoto, estrume ou re-síduos de processamento de alimentos, é misturada com água e ali-mentada em um tanque de digestão sem ar.Fermentação
Fermentação Alcoólica: o álcool combustível é produzido através daconversão de amido em açúcar, da fermentação do açúcar em álcool,então da separação da mistura de álcool e água por destilação. Esto-ques de alimentação tais como trigo, cevada, batatas e sucata de pa-pel, serragem e palha contendo açúcar, amido ou celulose podem serconvertidos em álcool através da fermentação com levedura.Transesterificação: Um exemplo de reação para a conversão de óleoem biodiesel é chamado de transesterificação. O processo de transes-terificação reage um álcool (como metanol) com os óleos triglicerídeoscontidos em óleos vegetais, gorduras animais ou graxas recicladas,formando ésteres alquila de ácidos graxos (biodiesel) e glicerina. A re-ação requer calor e um catalisador básico forte, tal como hidróxido desódio ou hidróxido de potássio.• Biodiesel: O biodiesel é uma mistura de ésteres alquila de ácidos gra-xos produzida partindo de óleos vegetais, gorduras animais ou graxasrecicladas. O biodiesel pode ser utilizado como um combustível paraveículos em sua forma pura, mas é geralmente utilizado como um aditi-vo de diesel de petróleo para reduzir os níveis de particulados, monóxi-do de carbono, hidrocarbonetos e ar tóxicos provenientes de veículoscom motor a diesel.
• Hidrólise: inclui a hidrólise de um composto, por exemplo, uma biomas-sa, tal como um material de lignocelulose, catalisada utilizando umaenzima da presente invenção.
• Congeneração: é a produção simultânea de mais de uma forma de e-nergia utilizando um único combustível e uma única instalação. Emuma modalidade, a cogeneração de biomassa possui um crescimentomais potencial que a produção de biomassa isoladamente porque acogeneração produz tanto calor quanto eletricidade.
Em uma modalidade, os polipeptídeos da invenção possuemuma atividade de aldolase, incluindo atividade de piruvato aldolase, tal como,sem limitação, atividade de HMG e/ou KHG aldolase ou outra atividade en-zimática para gerar biodiesel, bioetanol, biobutanol, biopropanol ou biometa-nol, partindo de um material orgânico, por exemplo, uma biomassa, tal comocomposições derivadas de plantas e animais, incluindo qualquer planta decultivo agrícola ou outro estoque de alimentação renovável, um resíduo agrí-cola ou restos de animais ou os componentes orgânicos de esgotos munici-pais e industriais ou microorganismos tais como algas ou levedura. Em umamodalidade, os polipeptídeos da invenção são utilizados em processos paraa conversão de biomassa de lignocelulose em etanol, butanol, propanol, me-tanol ou são de outra maneira utilizados em processos para a hidrólise oupara a digestão de biomateriais de forma que podem ser utilizados como umbiocombustível (incluindo bioetanol, biobutanol, biopropanol, biometanol oubiodiesel) ou para tornar mais fácil que a biomassa seja processada em umcombustível. Em uma modalidade alternativa, os polipeptídeos da invençãosão utilizados em processos para um processo de transesterificação quereage um álcool (como metanol) com um óleo triglicerídeo contido em umóleo vegetal, uma gordura animal ou graxas recicladas, formando ésteresalquila de ácidos graxos (biodiesel) e glicerina. Em uma modalidade, o biodi-esel é produzido partindo de óleo de soja ou óleos de cozinha reciclados. Asgorduras animais, outros óleos vegetais e outros óleos reciclados tambémpodem ser utilizados para produzir biodiesel, dependendo de seus custos edisponibilidade. Em uma outra modalidade, misturas de todos os tipos degorduras e óleos são utilizadas para produzir um combustível biodiesel dainvenção.
As enzimas da invenção também podem ser utilizadas no refinode glicerina. O subproduto glicerina contém catalisador não reagido e sa-bões que são neutralizados com um ácido. Água e álcool são removidos pa-ra produzir 50% até 80% de glicerina bruta. O restante dos contaminantesinclui gorduras e óleos, que podem ser processados utilizando os polipeptí-deos da invenção. Em grandes plantas de biodiesel da invenção, a glicerinapode ser adicionalmente purificada, por exemplo, até 99% ou uma purezamaior, para as indústrias farmacêuticas e de cosméticos.
O bioetanol, o biobutanol, o biopropanol, o biometanol e/ou obiodiesel são produzidos utilizando os polipeptídeos da invenção que podemser utilizados com oxigenados de combustível para melhorar as característi-cas de combustão. A adição de oxigênio resulta na combustão mais comple-ta, que reduz emissões de monóxido de carbono. Este é um outro benefícioambiental da substituição de combustíveis de petróleo por biocombustíveis(por exemplo, um combustível da invenção). Um bioetanol, um biobutanol,um biopropanol, um biometanol e/ou um biodiesel feito utilizando as compo-sições e/ou os métodos desta invenção pode ser misturado com gasolinapara formar uma mistura E10 (aproximadamente 5% até 10% de etanol eaproximadamente 90% até 95% de gasolina), mas pode ser utilizado emconcentrações mais altas tal como E85 ou em sua forma pura. Um bioetanol,um biobutanol, um biopropanol, um biometanol e/ou um biodiesel feito utili-zando as composições e/ou os métodos desta invenção podem ser mistura-dos com diesel de petróleo para formar uma mistura B20 (20% de biodiesele 80% de diesel de petróleo), embora outros níveis de mistura possam serutilizados até B100 (biodiesel puro).
A invenção fornece ainda prpcessos para a produção de etanol("bioetanol"), butanol ("biobutanol"), propanol ("biopropanol"), metanol ("bio-metanol") e/ou diesel ("biodiesel") partindo de composições que compreen-dem biomassa de lignocelulose. O material de biomassa de Iignocelulosepode ser obtido partindo de plantas de cultivo agrícolas, como um subprodu-to da produção de alimentos ou de produtos alimentícios ou como produtosde resíduos de lignocelulose, tais como resíduos de plantas e sucata de pa-pel. Os exemplos de fontes vegetais ou de resíduos vegetais para o trata-mento com os polipeptídeos da invenção incluem algas marinhas, algas,grãos, verds, caules, folhas, cascas, folhelhos, sabugos de milho, forragemde milho, palha, gramíneas (por exemplo, capim indiano, tal como Sorghas-trum nutans; ou, Panicum virgatum, por exemplo, espécies de Panicum, talcomo Panicum virgatum) e similares, assim como madeira, lascas de madei-ra, pasta de madeira e serragem. Os exemplos de sucata de papel adequa-dos para o tratamento com os polipeptídeos da invenção incluem papel defotocópia descartado, papel de impressora de computador, papel de agenda,papel de bloco de notas, papel para digitação de textos e similares, assimcomo jornais, revistas, papelão e materiais de embalagem à base de papel.
Em uma modalidade, as enzimas e os métodos da invenção po-dem ser utilizados em associação com meios mais "tradicionais" de produ-ção de etanol, metanol, butanol, propanol e/ou diesel partindo de biomassa,por exemplo, como métodos que compreendem a hidrólise de materiais delignocelulose submetendo o material de lignocelulose seco em um reator aum catalisador compreendido de uma solução diluída de um ácido forte e umsal metálico; isto pode diminuir a energia de ativação ou a temperatura, dahidrólise de celulose para a obtenção de rendimentos maiores de açúcares;vide, por exemplo, as Patentes U.S. N- 6.660.506; e 6.423.145.
Uma outra modalidade que incorpora o uso de enzimas da in-venção compreende a hidrólise do material de IignoceJuIose contendo hemi-celulose, celulose e Iignina submetendo o material a uma etapa de hidrólisede primeiro estágio em um meio aquoso a uma temperatura e a uma pres-são escolhidas para realizar a despolimerização primária de hemicelulosesem a despolimerização principal de celulose em glicose. Esta etapa resultaem uma suspensão em que a fase aquosa líquida contém monossacarídeosdissolvidos resultantes da despolimerização de hemicelulose e uma fasesólida que contém celulose e lignina. Uma etapa de hidrólise de segundoestágio pode compreender condições de forma que pelo menos uma partemaior da celulose é despolimerizada, tal etapa resultando em uma fase a-quosa líquida contendo produtos de despolimerização da celulose dissolvi-dos/solúveis. Vide, por exemplo, a Patente U.S. N0 5.536.325. As enzimasda invenção podem ser adicionadas em qualquer estágio deste exemplo deprocesso.
Uma outra modalidade que incorpora o uso das enzimas da in-venção compreende o processamento de um material de biomassa contendolignocelulose através de um ou mais estágios de hidrólise com ácido diluídocom aproximadamente 0,4% até 2% de ácido forte; e o tratamento de umcomponente de lignocelulose sólido não reagido do material de biomassahidrolisado com ácido através da deslignificação alcalina para produzir pre-cursores para termoplásticos e derivados biodegradáveis. Vide, por exemplo,a Patente U.S. N0 6.409.841. As enzimas da invenção podem ser adiciona-das em qualquer estágio neste exemplo de processo.
Uma outra modalidade que incorpora o uso das enzimas da in-venção compreende a pré-hidrólise do material de lignocelulose em um rea-tor de pré-hidrólise; a adição de um líquido ácido ao material de Iignocelulo-se sólido para produzir uma mistura; o aquecimento da mistura até a tempe-ratura de reação; a manutenção da temperatura de reação durante temposuficiente para fracionar o material de lignocelulose em uma parte solubiliza-da contendo pelo menos aproximadamente 20% da lignina proveniente domaterial de lignocelulose e uma fração sólida contendo celulose; a remoçãode uma parte solubilizada proveniente da fração sólida enquanto está à oupróxima à temperatura de reação em que a celulose na fração sólida é tor-nada mais susceptível à digestão enzimática; e a recuperação de uma partesolubilizada. Vide, por exemplo, a Patente U.S. N0 5.705.369. As enzimas dainvenção podem ser adicionadas em qualquer estágio deste exemplo deprocesso.
A invenção fornece métodos para a produção de composiçõescombustíveis para motores (por exemplo, para motores com ignição comcentelha com base em hidrocarbonetos líquidos misturados com um álcoolde grau de combustível produzido utilizando uma enzima ou um método dainvenção. Em uma modalidade, os combustíveis produzidos através do usode uma enzima da invenção compreendem, por exemplo, gás de carvão, gáslíquido ou natural, etanol líquido, metanol, butanol, propanol e/ou misturas dediesel. Em uma modalidade, um co-solvente é 2-metiltetrahidrofurano (M-THF) derivado da biomassa. Vide, por exemplo, a Patente U.S. N06.712.866.
Em uma modalidade, os métodos da invenção para a degrada-ção enzimática de lignocelulose, por exemplo, para a produção de etanolpartindo do material de lignocelulose, também podem compreender o uso detratamento com ultra-som do material de biomassa; vide, por exemplo, a Pa-tente U.S. N0 6.333.181.
Em uma outra modalidade, os métodos da invenção para a pro-dução de bioetanol, biobutanol, biopropanol, biometanol e/ou biodiesel par-tindo de um substrato de celulose compreendem o fornecimento de umamistura de reação na forma de uma suspensão que compreende substratode celulose, uma enzima desta invenção e um agente de fermentação (porexemplo, dentro de um recipiente de reação, tal como um biorreator de ali-mentação com sólidos de forma semicontínua) e a mistura de reação é rea-gida sob condições suficientes para iniciar e manter uma reação de fermen-tação (como descrito, por exemplo, no Pedido de Patente U.S. N020060014260). Em uma modalidade, cálculos experimentais e teóricos po-dem determinar uma freqüência de alimentação ótima. Em uma modalidade,quantidades adicionais do substrato de celulose e da enzima são fornecidasao recipiente de reação em um intervalo de acordo com a freqüência de ali-mentação otimizada.Um exemplo de processo para a produção de biocombustíveis(tais como bioetanol, biobutanol, biopropanol, biometanol e/ou biodiesel) dainvenção é descrito nos Pedidos de Patentes U.S. Publicados N-20050069998; 20020164730; e em uma modalidade compreende estágiosde trituração da biomassa de Iignocelulose (por exemplo, até um tamanho de15-30 mm), submetendo o produto obtido ao pré-tratamento com explosãode vapor (por exemplo, a uma temperatura de 190-230°C) durante entre 1 e10 minutos em um reator; coletando o material pré-tratado em um ciclone ouproduto relacionado de produção; e separando as frações líquidas e sólidaspor filtração em uma prensa de filtração, introduzindo a fração sólida em umdepósito de fermentação e adicionando uma ou mais enzimas da invenção,por exemplo, uma enzima celulase e/ou beta-glucosidase (por exemplo, dis-solvida em tampão citrato com pH 4,8).
Um outro exemplo de processo para a produção de biocombus-tíveis (tais como bioetanol, biobutanol, biopropanol, biometanol e/ou biodie-sel) da invenção que compreende a utilização das enzimas da invençãocompreende o pré-tratamento de um material de partida que compreendeum estoque de alimentação de Iignocelulose compreendendo pelo menoshemicelulose e celulose. Em uma modalidade, o material de partida compre-ende batatas, soja (semente de colza), cevada, centeio, milho, aveia, trigo,beterraba ou cana de açúcar ou um componente ou resíduo ou subprodutoda produção de alimentos ou de produtos alimentícios. O material de partida("estoque de alimentação") é reagido em condições que rompem a estruturadas fibras das plantas para realizar pelo menos uma hidrólise parcial da he-micelulose e da celulose. As condições de rompimento podem compreender,por exemplo, submeter o material de partida a uma temperatura média de180°C até 270°C em pH 0,5 até 2,5 durante um período de aproximadamen-te 5 segundos até 60 minutos; ou, à temperatura de 220°C até 270°C, empH 0,5 até 2,5 durante um período de 5 segundos até 120 segundos ou e-quivalente. Isto gera um estoque de alimentação com maior capacidade deacesso que será digerido por uma enzima, por exemplo, uma enzima celula-se da invenção. Patente U.S. N0 6.090.595.Os exemplos de condições para a hidrólise do material de Iigno-celulose incluem reações a temperaturas entre aproximadamente 30°C e48°C e/ou um pH entre aproximadamente 4,0 e 6,0. Outros exemplos decondições incluem uma temperatura entre aproximadamente 30°C e 60°C eum pH entre aproximadamente 4,0 e 8,0.
As enzimas de acordo com a invenção podem catalisar reaçõescom estéreo, régio e quimiosseletividades exclusivas. As enzimas aldolases,tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de acordo coma invenção podem ser engenheiradas para funcionarem em vários solventes,operarem em pHs extremos (por exemplo, pHs altos e pHs baixos), tempera-turas extremas (por exemplo, temperaturas altas e temperaturas baixas),níveis de salinidade extremos (por exemplo, salinidade alta e salinidade bai-xa) e catalisar reações com compostos que não são relacionados estrutu-ralmente aos seus substratos fisiológicos naturais.
Produtos Alimentícios ou Alimentos e Aditivos para Produtos Alimentícios eAlimentos
Em adição ao fornecimento de agentes de auxílio ou suplemen-tos dietéticos ou suplementos e aditivos para alimentos, a invenção forneceainda composições e métodos para o tratamento de produtos alimentícios ede alimentos e aditivos para alimentos ou produtos alimentícios para sereshumanos e animais utilizando um polipeptídeo de acordo com a invenção, talcomo uma proteína que possui atividade de enzimas aldolases, tal comopiruvato aldolase, tal como HMG e/ou KHG aldolase de acordo com a inven-ção e/ou os anticorpos de acordo com a invenção. Em algumas modalida-des, a invenção fornece produtos alimentícios, alimentos e aditivos para a-nimais que compreendem enzimas aldolases, tal como piruvato aldolase, talcomo HMG e/ou KHG aldolase de acordo com a invenção e/ou anticorpos deacordo com a invenção. O animal pode ser qualquer animal de fazenda ouqualquer animal.
O aditivo para produtos alimentícios para animais de acordo coma invenção podem ser um produto enzimático granulado que pode ser facil-mente misturado com componentes de produtos alimentícios. Alternativa-mente, os aditivos para produtos alimentícios de acordo com a invenção po-dem formar um componente de uma pré-mistura. O produto enzimático gra-nulado de acordo com a invenção pode ser revestido ou não revestido. Otamanho da partícula dos granulados de enzima pode ser compatível com ode componentes do produto alimentício e de pré-mistura. Isto fornece ummeio seguro e conveniente de incorporar enzimas em produtos alimentícios.Alternativamente, o aditivo para produtos alimentícios para animais de acor-do com a invenção pode ser uma composição líquida estabilizada. Esta podeser uma suspensão aquosa ou à base de óleo. Vide a Patente U.S. N06.245.546.
As enzimas aldolases, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase da presente invenção, na modificação de produto alimen-tício ou de alimento, podem processar o alimento ou o produto alimentício invitro (através de componentes de modificação do produto alimentício ou doalimento) ou in vivo. Os polipeptídeos de acordo com a invenção podem seradicionados às composições de produtos alimentícios ou de alimentos.
Em algumas modalidades, uma enzima de acordo com a inven-ção é adicionada em combinação com uma outra enzima, tal como beta-galactosidases, catalases, lacases, celulases, outras aldolases, endoglicosi-dases, endo-beta-1,4-lacases, amiloglucosidases, glucosidases, glicose i-somerases, glicosiltransferases, lipases, fosfolipases, lipooxigenases, beta-lacases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, fitases,glucoamilases, pectinases, redutases, oxidases, descarboxilases, fenoloxi-dases, Iigninases1 pululanases, arabinanases, hemicelulases, mananases,cilolacases, xilanases, pectina acetil esterases, ramnogalacturonana acetilesterases, proteases, peptidases, proteinases, poligalacturonases, ranoga-lacturonases, galactanases, pectina liases, transglutaminases, pectina meti-lesterases, celobiohidrolases e/ou transglutaminases. Estes produtos de di-gestão enzimática são mais digeríveis pelo animal. Assim, as enzimas aldo-lases, tal como piruvato aldolase, tal como HMG e/ou KHG aldolase de a-cordo com a invenção podem contribuir para a energia disponível do produtoalimentício ou do alimento ou para a capacidade de digestão do alimento oudo produto alimentício através da quebra da celulose.
Em outras modalidades, a enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase de acordo com a invenção podeser fornecida através da expressão das enzimas diretamente em plantas decultivo transgênicas para produtos alimentícios (tal como plantas transgêni-cas, verds e similares), tais como grãos, cereais, milho, soja, semente desoja, tremoços e similares. Como discutido anteriormente, a invenção forne-ce plantas, partes de plantas e células vegetais transgênicas que compreen-dem uma seqüência de ácido nucléico que codifica um polipeptídeo de acor-do com a invenção. Em algumas modalidades, o ácido nucléico é expressode forma que a enzima aldolase, tal como piruvato aldolase, tal como HMGe/ou KHG aldolase de acordo com a invenção seja produzida em quantida-des que podem ser recuperadas. A enzima aldolase, tal como piruvato aldo-lase, tal como HMG e/ou KHG aldolase pode ser recuperada partindo dequalquer planta ou parte de planta. Alternativamente, a planta ou a parte deplanta contendo o polipeptídeo recombinante pode ser utilizada de forma aaumentar a qualidade de um alimento ou de um produto alimentício, tal co-mo melhorando o valor nutricional, a palatabilidade etc.
Em algumas modalidades, a matriz de fornecimento de enzimade acordo com a invenção está na forma de várias partículas, péletes ougrânulos distintos. Por "grânulos" entende-se partículas que estão comprimi-das ou compactadas, tal como através de uma peletização, extrusão oucompactação similar para remover água da matriz. Tal compressão ou com-pactação das partículas também promove a coesão intrapartícula das partí-cuias. Por exemplo, os grânulos podem ser preparados através da peletiza-ção do substrato baseado no grão em um moinho de peletização. Os péletespreparadas dessa maneira são trituradas ou desagregadas até um tamanhode grânulos adequado para uso como um adjuvante no produto alimentíciopara animais. Devido ao fato de que a matriz por si só é aprovada para usoem produto alimentício para animais, esta pode ser utilizada como um dilu-ente para o fornecimento de enzimas em produto alimentício para animais.
Em algumas modalidades, a enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase contida em uma matriz e méto-dos de fornecimento de enzimas é uma enzima aldolase termoestável, talcomo piruvato aldolase, tal como HMG e/ou KHG aldolase, como descritoaqui, de forma que resista à inativação da enzima aldolase, tal como piruvatoaldolase, tal como HMG e/ou KHG aldolase durante a produção quandotemperaturas elevadas e/ou vapor pode ser empregado para preparar a ma-triz de fornecimento da enzima peletizada. Durante a digestão do produtoalimentício que contém uma matriz de fornecimento de enzima da invenção,fluidos digestivos aquosos causarão a liberação da enzima ativa. Outros tl·pos de enzimas termoestáveis e suplementos nutricionais que são termoes-táveis podem também ser incorporados na matriz de fornecimento para libe-ração sob qualquer tipo de condições aquosas.
Em algumas modalidades, um revestimento é aplicado às partí-culas de matriz enzimática com finalidades diferentes, tal como para adicio-nar sabor ou suplemento nutricional ao produto alimentício para animais,para retardar a liberação de suplementos para produtos alimentícios paraanimais e de enzimas em condições gástricas e similares. Em algumas mo-dalidades, o revestimento é aplicado para atingir uma finalidade funcional,por exemplo, sempre que for desejável retardar a liberação da enzima par-tindo das partículas da matriz ou para controlar as condições sob as quais aenzima será liberada. A composição do material de revestimento pode ser talque é seletivamente quebrada por um agente ao qual é susceptível (tal comocalor, ácido ou base, enzimas ou outros agentes químicos). Alternativamen-te, dois ou mais revestimentos susceptíveis a tais agentes de quebra diferen-tes podem ser aplicados consecutivamente às partículas da matriz.
A invenção também está direcionada a um processo para a pre-paração de uma matriz de liberação de enzima. De acordo com a invenção,o processo compreende o fornecimento de várias partículas distintas de umsubstrato baseado em grãos em um tamanho de partícula adequado parauso como uma matriz de liberação de enzima, em que as partículas compre-endem uma enzima aldolase, tal como piruvato aldolase, HMG e/ou KHGaldolase codificada por uma seqüência de aminoácidos de acordo com ainvenção. Em algumas modalidades, o processo inclui a compactação ou acompressão das partículas da matriz de liberação de enzima em grânulos, oque na maior parte de algumas modalidades é realizado através da peletiza-ção. O inibidor de bolor e o agente de coesão, quando utilizados, podem seradicionados em qualquer momento adequado e, em algumas modalidadessão misturados com o substrato baseado em grãos nas proporções deseja-das antes da peletização do substrato baseado em grãos. O teor de umidadeno produto alimentício em moinho de péletes em algumas modalidades estánas faixas apresentadas anteriormente em relação ao teor de umidade noproduto acabado, e, em algumas modalidades, é de aproximadamente 14-15%. Em algumas modalidades, a umidade é adicionada ao estoque de ali-mentação na forma de uma preparação aquosa da enzima para levar o es-toque de alimentação a este teor de umidade. A temperatura no moinho depéletes em algumas modalidades é levada até aproximadamente 82°C comvapor. O moinho de péletes pode ser operado sob quaisquer condições queconfiram função suficiente ao estoque de alimentação para fornecer péletes.O próprio processo de peletização é um processo com custo eficiente para aremoção de água da composição que contém enzima.
As composições e os métodos de acordo com a invenção podemser praticados em associação com a administração de pré-bióticos, que sãoaçúcares de alto peso molecular, tais como fruto-oligossacarídeos (FOS);galacto-oligossacarídeos (GOS), material GRAS (Geralmente ReconhecidoComo Seguro (Generally Recognized As Safe)). Estes pré-bióticos podemser metabolizados por algumas bactérias do ácido láctico pró-bióticas (LAB).Não são digeríveis pela maioria dos microorganismos intestinais.
Tratamento de Alimentos e Processamento de Alimentos
A invenção fornece alimentos e produtos alimentícios que com-preendem as enzimas de acordo com a invenção e os métodos para a utili-zação das enzimas de acordo com a invenção no processamento de alimen-tos e produtos alimentícios. As enzimas aldolases, tal como piruvato aldola-se, HMG e/ou KHG aldolase de acordo com a invenção possuem várias apli-cações na indústria de processamento de alimentos. Em algumas modalida-des, a invenção fornece métodos para a hidrólise de composições que com-preendem celulose, incluindo, tal como uma célula vegetal, uma célula bac-teriana, uma célula de levedura, uma célula de inseto ou uma célula animalou qualquer planta ou parte de planta ou qualquer alimento ou produto ali-mentício, um produto residuais e similares.
Por exemplo, a invenção fornece produtos alimentícios ou ali-mentos que compreendem uma enzima aldolase, tal como piruvato aldolase,HMG e/ou KHG aldolase da invenção, tal como em um produto alimentício,um líquido, tal como uma bebida (tal como um suco de frutas ou uma cerve-ja), um pão ou uma massa de pão ou um produto de panificação ou umabebida alcoólica (tal como uma cerveja) ou um precursor de bebida (tal comomosto).
Os processos para tratamento de alimentos de acordo com ainvenção também podem incluir o uso de qualquer combinação de outrasenzimas tais como triptofanases ou tirosina descarboxilases, lacases, cata-lases, lacases, outras aldolases, celulases, endoglicosidases, endo-beta-1,4-lacases, amiloglucosidases, glucosidases, glicose isomerases, glicosiltrans-ferases, lipases, fosfolipases, lipooxigenases, beta-lacases, endo-beta-1,3(4)-lacases, cutinases, peroxidases, amilases, fitases, glucoamilases,pectinases, redutases, oxidases, descarboxilases, fenoloxidases, ligninases,pululanases, arabinanases, hemicelulases, mananases, cilolacases, xilana-ses, pectina acetil esterases, ramnogalacturonana acetil esterases, protea-ses, peptidases, proteinases, poligalacturonases, ramnogalacturonases, ga-lactanases, pectina liases, transglutaminases, pectina metilesterases, celo-biohidrolases e/ou transglutaminases.
Composições Farmacêuticas e Suplementos Dietéticos
A invenção fornece ainda composições farmacêuticas e suple-mentos dietéticos (tais como agentes de auxílio dietético) que compreendemuma aldolase de acordo com a invenção. A atividade da aldolase compreen-de a atividade de piruvato aldolase, de HMG e/ou de KHG aldolase. Em al-gumas modalidades, as composições farmacêuticas e os suplementos dieté-ticos (tais como agentes de auxílio dietético) são formulados para ingestãooral.
Os compostos para tratamento periodôntico podem compreen-der uma enzima de acordo com a invenção, tal como descrito na PatenteU.S. N0 6.776.979. As composições e os métodos para o tratamento ou paraa profilaxia de síndrome de gengiva ácida podem compreender uma enzimade acordo com a invenção, tal como descrito na Patente U.S. N0 6.468.964.
Em outras modalidades, tratamento de feridas, implantes e simi-lares compreendem enzimas antimicrobianas (tais como que atuam comoantibiótico), incluindo uma enzima de acordo com a invenção (incluindo, talcomo seqüências de acordo com a invenção). As enzimas de acordo com ainvenção podem também ser utilizadas em curativos de alginato, tratamentode barreira antimicrobiana, curativos para queimaduras, bandagens de com-pressão, ferramentas para diagnóstico, curativos em gel, tratamentos hidros-seletivos, curativos hidrocelulares (espuma), curativos hidrocoloidais, curati-vos I.V, mantas incisivas, curativos de baixa aderência, curativos com absor-ção de odores, bandagens em pasta, curativos pós-operatórios, controle decicatrização, cuidado da pele, curativos de filme transparente e/ou fecha-mento de feridas. As enzimas de acordo com a invenção podem ser utiliza-das na limpeza de feridas, preparação de leito de feridas, para tratar úlcerasde pressão, úlceras nas pernas, queimaduras, úlceras diabéticas nos pés,cicatrizes, fixação IV, feridas cirúrgicas e feridas menores. As enzimas deacordo com a invenção podem ser utilizadas em composições enzimáticasde eliminação de resíduos esterilizadas, tais como ungüentos. Em váriasmodalidades, a aldolase é formulada na forma de um comprimido, um gel,uma pílula, um implante, um líquido, um spray, um filme, uma micela, um pó,um alimento, um pélete de produto alimentício ou na forma de uma formula-ção encapsulada.
As composições farmacêuticas e os suplementos dietéticos deacordo com a invenção também podem incluir o uso de qualquer combina-ção de outras enzimas tais como beta-galactosidases, catalases, lacases,celulases, outras aldolases, endoglicosidases, endo-beta-1,4-lacases, amilo-glucosidases, glucosidases, glicose isomerases, glicosiltransferases, lipases,fosfolipases, lipooxigenases, beta-lacases, endo-beta-1,3(4)-lacases, cutina-ses, peroxidases, amilases, fitases, glucoamilases, pectinases, redutases,oxidases, descarboxilases, fenoloxidases, ligninases, pululanases, arabina-nases, hemicelulases, mananases, cilolacases, xilanases, pectina acetil es-terases, ramnogalacturonana acetil esterases, proteases, peptidases, protei-nases, poligalacturonases, ramnogalacturonases, galactanases, pectina Iia-ses, transglutaminases, pectina metilesterases, celobiohidrolases e/outransglutaminases.
Vias Biossintéticas para a Produção de R.R e Outros Estereoisômeros daMonatina
Como descrito, inter alia, na WO 03/091396 A2 (vide as figuras1-3 e 11-13), a monatina pode ser produzida partindo de triptofano atravésde uma vide de várias etapas que envolvem conversões biológicas (isto é, afacilitação da reação de um substrato em um produto com um polipeptídeo).
Uma vide descrita envolve a conversão biológica de triptofano em indol-3-piruvato, a conversão biológica de indol-3-piruvato no ácido 2-hidróxi 2-(indol-3-ilmetil)-4-ceto glutárico ("MP") e a conversão biológica de MP emmonatina. Em algumas modalidades, os polipeptídeos da invenção podemser utilizados para facilitar a reação de indol-3-piruvato para formar MP. Emalgumas modalidades, os polipeptídeos da invenção podem ser utilizadospara facilitar preferencialmente a produção de R-MP.
Em algumas'modalidades, um ou mais polipeptídeos escolhidosde polipeptídeos isolados ou recombinantes da SEQ ID NO:2, SEQ ID NO:4,SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ ID NO:12, SEQ ID NO:14,SEQ ID NO:16, SEQ ID NO:18, SEQ ID N0:20, SEQ ID NO:22, SEQ IDNO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID N0:30, SEQ ID NO:32, SEQID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID N0:40, SEQ ID NO:42,SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID N0:50, SEQ IDNO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID N0:60, SEQID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID N0:70,SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ IDN0:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQID Ν0:90, SEQ ID ΝΟ:92, SEQ ID ΝΟ:94, SEQ ID ΝΟ:96, SEQ ID ΝΟ:98,SEQ ID NO: 100, SEQ ID Ν0:102, SEQ ID Ν0:104, SEQ ID Ν0:106, SEQ IDNO: 108, SEQ ID Ν0:110, SEQ ID Ν0:112, SEQ ID ΝΟ:114, SEQ IDΝΟ:116, SEQ ID ΝΟ:118, SEQ ID Ν0:120, SEQ ID ΝΟ:122, SEQ IDNO: 124, SEQ ID ΝΟ:126, SEQ ID ΝΟ:128, SEQ ID Ν0:130, SEQ IDNO: 132, SEQ ID ΝΟ:134, SEQ ID Ν0:136, SEQ ID ΝΟ:138, SEQ IDNO: 140, SEQ ID ΝΟ:142, SEQ ID ΝΟ:144, SEQ ID ΝΟ:146, SEQ IDΝΟ:148, SEQ ID Ν0:150, SEQ ID ΝΟ:152, SEQ ID ΝΟ:154, SEQ IDNO: 156, SEQ ID ΝΟ:158, SEQ ID Ν0:160, SEQ ID ΝΟ:162, SEQ IDNO: 164, SEQ ID ΝΟ:166, SEQ ID ΝΟ:168, SEQ ID Ν0:170, SEQ IDNO: 172, SEQ ID ΝΟ:174, SEQ ID Ν0:176, SEQ ID ΝΟ:178, SEQ IDNO: 180, SEQ ID ΝΟ:182, SEQ ID ΝΟ:184, SEQ ID ΝΟ:186, SEQ IDΝΟ:188, SEQ ID Ν0:190, SEQ ID ΝΟ:192, SEQ ID ΝΟ:194, SEQ IDNO: 196, SEQ ID ΝΟ:198, SEQ ID Ν0:200, SEQ ID Ν0:202, SEQ IDΝ0:204, SEQ ID Ν0:206, SEQ ID Ν0:208, SEQ ID Ν0:210, SEQ IDΝΟ:212, SEQ ID ΝΟ:214, SEQ ID Ν0:216, SEQ ID ΝΟ:218, SEQ IDΝ0:220, SEQ ID ΝΟ:222, SEQ ID ΝΟ:224, SEQ ID ΝΟ:226, SEQ IDΝΟ:228, SEQ ID Ν0:230, SEQ ID ΝΟ:232, SEQ ID ΝΟ:234, SEQ IDΝΟ:236, SEQ ID ΝΟ:238, SEQ ID Ν0:240, SEQ ID ΝΟ:242, SEQ IDΝΟ:244, SEQ ID ΝΟ:246, SEQ ID ΝΟ:248, SEQ ID Ν0:250, SEQ IDΝΟ:252, SEQ ID ΝΟ:254, SEQ ID Ν0:256, SEQ ID ΝΟ:258, SEQ IDΝ0:260, SEQ ID ΝΟ:262, SEQ ID ΝΟ:264, SEQ ID ΝΟ:266, SEQ IDΝΟ:268, SEQ ID Ν0:270, SEQ ID ΝΟ:272, SEQ ID ΝΟ:274, SEQ IDΝΟ:276, SEQ ID ΝΟ:278, SEQ ID Ν0:280, SEQ ID ΝΟ:282, SEQ IDΝΟ:284, SEQ ID ΝΟ:286, SEQ ID ΝΟ:288, SEQ ID Ν0:290, SEQ IDΝΟ:292, SEQ ID ΝΟ:294, SEQ ID ΝΟ:296, SEQ ID ΝΟ:298, SEQ IDΝ0:300, SEQ ID Ν0:302, SEQ ID Ν0:304, SEQ ID Ν0:306, SEQ IDΝ0:308, SEQ ID Ν0:310, SEQ ID ΝΟ:312, SEQ ID ΝΟ:314, SEQ IDΝΟ:316, SEQ ID ΝΟ:318, SEQ ID Ν0:320, SEQ ID ΝΟ:322, SEQ IDΝΟ:324, SEQ ID ΝΟ:326, SEQ JD ΝΟ:328, SEQ ID Ν0:330, SEQ ID ΝΟ:332ou SEQ ID ΝΟ:334 ou fragmentos ou subseqüências dos mesmos que pos-suem atividade de aldolase podem ser úteis na facilitação de uma reaçãodentro de uma vide de várias etapas para a obtenção de um produto esco-lhido de monatina, derivados de monatina, sais dos mesmos e combinaçõesdos mesmos. Em uma modalidade, os polipeptídeos com atividade de aldo-Iase podem ser úteis na facilitação de uma reação em que o indol-3-piruvatoé convertido em MP com uma etapa dentro de uma vide de várias etapaspara a obtenção de um produto escolhido de monatina, derivados de mona-tina, sais dos mesmos e combinações dos mesmos.
Em uma outra modalidade, um ou mais polipeptídeos escolhidosde polipeptídeos isolados ou recombinantes com atividade de HMG aldolasede qualquer uma da SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ IDNO:8, SEQ ID N0:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQID NO:18, SEQ ID N0:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26,SEQ ID NO:28, SEQ ID N0:30, SEQ ID NO:32, SEQ ID NO:34, SEQ IDNO:36, SEQ ID NO:38, SEQ ID N0:40, SEQ ID NO:42, SEQ ID NO:44, SEQID NO:46, SEQ ID NO:48, SEQ ID N0:50, SEQ ID NO:52, SEQ ID NO:54,SEQ ID NO:56, SEQ ID NO:58, SEQ ID N0:60, SEQ ID NO:62, SEQ IDNO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID N0:70, SEQ ID NO:72, SEQID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID N0:80, SEQ ID NO:82,SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID N0:90, SEQ IDNO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID N0:100,SEQ ID NO: 102, SEQ ID N0:104, SEQ ID N0:106, SEQ ID N0:108, SEQ IDNO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ IDNO:118, SEQ ID N0:120, SEQ ID NO:122, SEQ ID NO:124, SEQ IDNO: 126, SEQ ID NO:128, SEQ ID N0:130, SEQ ID NO:132, SEQ IDNO: 134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID N0:140, SEQ IDNO: 142, SEQ ID NO:144, SEQ ID NO:146, SEQ ID NO:148, SEQ IDNO: 150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ IDNO:158, SEQ ID N0:160, SEQ ID NO:162, SEQ ID NO:164, SEQ IDNO:166, SEQ ID NO:168, SEQ ID N0:170, SEQ ID NO:172, SEQ IDNO: 174, SEQ ID NO:176, SEQ ID NO:178, SEQ ID N0:180, SEQ IDNO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ ID NO:188, SEQ IDNO: 190, SEQ ID NO:192, SEQ ID NO:194, SEQ ID NO:196, SEQ IDNO:198, SEQ ID N0:200, SEQ ID N0:202, SEQ ID N0:204, SEQ IDN0:206, SEQ ID N0:208, SEQ ID N0:210, SEQ ID NO:212, SEQ IDNO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ ID N0:220, SEQ IDNO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ ID NO:228, SEQ IDN0:230, SEQ ID NO:232, SEQ ID NO:234, SEQ ID NO:236, SEQ IDNO:238, SEQ ID N0:240, SEQ ID NO:242, SEQ ID NO:244, SEQ IDNO:246, SEQ ID NO:248, SEQ ID N0:250, SEQ ID NO:252, SEQ IDNO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ ID N0:260, SEQ IDNO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ ID NO:268, SEQ IDN0:270, SEQ ID NO:272, SEQ ID NO:274, SEQ ID NO:276, SEQ IDNO:278, SEQ ID N0:280, SEQ ID NO:282, SEQ ID NO:284, SEQ IDNO:286, SEQ ID NO:288, SEQ ID N0:290, SEQ ID NO:292, SEQ IDNO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID NQ:300, SEQ IDNQ:302, SEQ ID NQ:304 ou fragmentos ou subseqüências dos mesmos que possuem atividade de aldolase podem ser úteis na facilitação de uma reaçãoentre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro deuma vide de várias etapas para a obtenção de um produto escolhido de mo-natina, derivados de monatina, sais dos mesmos e combinações dos mes-mos. Em uma modalidade, os polipeptídeos com atividade de HMG aldolasepodem ser úteis na facilitação de uma reação em que o indol-3-piruvato éconvertido em MP como uma etapa dentro de uma vide de várias etapaspara a obtenção de um produto escolhido de monatina, derivados de mona-tina, sais dos mesmos e combinações dos mesmos.
Ainda em uma outra modalidade, um ou mais polipeptídeos es-colhidos de polipeptídeos isolados ou recombinantes com atividade de KHGaldolase de qualquer uma da SEQ ID N0:306, SEQ ID N0:308, SEQ IDN0:310, SEQ ID NO:312, SEQ ID NO:314, SEQ ID NO:316, SEQ IDNO:318, SEQ ID N0:320, SEQ ID NO:322, SEQ ID NO:324, SEQ IDNO:326, SEQ ID NO:328, SEQ ID N0:330, SEQ ID NO:332 ou SEQ IDNO:334 ou fragmentos ou subseqüências dos mesmos que possuem ativi-dade de aldolase podem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma vide devárias etapas para a obtenção de um produto escolhido de monatina, deri-vados de monatina, sais dos mesmos e combinações dos mesmos. Em umamodalidade, os polipeptídeos com atividade de KHG aldolase podem serúteis na facilitação de uma reação em que o indol-3-piruvato é convertido emMP como uma etapa dentro de uma vide de várias etapas para a obtençãode um produto escolhido de monatina, derivados de monatina, sais dosmesmos e combinações dos mesmos.
Adicionalmente, um ou mais polipeptídeos codificados por umaou mais seqüências de ácidos nucléicos que possuem pelo menos aproxi-madamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%,61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%,74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%,87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% oumais ou identidade de seqüência completa (100%) a um ácido nucléico deacordo com a invenção, incluindo as SEQ ID NO:1, SEQ ID NO:3, SEQ IDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ IDNO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33,SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ IDNO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61,SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ IDNO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89,SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ IDNO:99, SEQ ID N0:101, SEQ ID N0:103, SEQ ID N0:105, SEQ ID N0:107,SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ IDNO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ IDNO: 125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ IDNO: 133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ IDNO:141, SEQ ID ΝΟ.Ί43, SEQ ID NO:145, SEQ ID NO:147, SEQ IDNO: 149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ IDNO: 157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO: 163, SEQ IDNO: 165, SEQ ID NO: 167, SEQ ID NO: 169 SEQ ID NO:171, SEQ IDNO:173, SEQ ID NO: 175, SEQ ID NO: 177 SEQ ID NO:179, SEQ IDNO:181, SEQ ID NO: 183, SEQ ID NO: 185 SEQ ID NO: 187, SEQ IDNO:189, SEQ ID NO:191, SEQ ID NO: 193 SEQ ID NO:195, SEQ IDNO: 197, SEQ ID NO: 199, SEQ ID N0:201 SEQ ID N0:203, SEQ IDN0:205, SEQ ID N0:207, SEQ ID N0:209 SEQ ID NO:211, SEQ IDNO:213, SEQ ID NO:215, SEQ ID NO:217 SEQ ID NO:219, SEQ IDNO:221, SEQ ID NO:223, SEQ ID NO:225 SEQ ID NO:227, SEQ IDNO:229, SEQ ID NO:231, SEQ ID NO:233 SEQ ID NO:235, SEQ IDNO:237, SEQ ID NO:239, SEQ ID NO:241 SEQ ID NO:243, SEQ IDNO:245, SEQ ID NO:247, SEQ ID NO:249 SEQ ID NO:251, SEQ IDNO:253, SEQ ID NO:255, SEQ ID NO:257 SEQ ID NO:259, SEQ IDNO:261, SEQ ID NO:263, SEQ ID NO:265 SEQ ID NO:267, SEQ IDNO:269, SEQ ID NO:271, SEQ ID NO:273 SEQ ID NO:275, SEQ IDNO:277, SEQ ID NO:279, SEQ ID NO:281 SEQ ID NO:283, SEQ IDNO:285, SEQ ID NO:287, SEQ ID NO:289 SEQ ID NO:291, SEQ IDNO:293, SEQ ID NO:295, SEQ ID NO:297 SEQ ID NO:299, SEQ IDN0:301, SEQ ID N0:303, SEQ ID NO: 305 SEQ ID N0:307, SEQ IDN0:309, SEQ ID NO:311, SEQ ID NO:313 SEQ ID NO:315, SEQ IDNO:317, SEQ ID NO:319, SEQ ID NO:321 SEQ ID NO:323, SEQ IDNO:325, SEQ ID NO:327, SEQ ID NO:329 SEQ ID NO:331, SEQ IDNO:333, SEQ ID NO:335, SEQ ID NO:336, SEQ ID NO:337 e SEQ ID
NO:338 ao longo de uma região de pelo menos aproximadamente 10, 15,20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500,550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200,1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800,1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450,2500 ou mais resíduos podem ser úteis na facilitação de uma reação entreindol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de umavide de várias etapas para a obtenção de um produto escolhido de monatina,derivados de monatina, sais dos mesmos e combinações dos mesmos. Emuma modalidade, o um ou mais polipeptídeos ou fragmentos ou subseqüên-cias dos mesmos com atividade de aldolase podem ser úteis na facilitaçãode uma reação em que o indol-3-piruvato é convertido em MP como umaetapa dentro de uma vide de várias etapas para a obtenção de um produtoescolhido de monatina, derivados de monatina, sais dos mesmos e combi-nações dos mesmos.
Em uma outra modalidade da invenção, um ou mais polipeptí-deos com atividade de HMG aldolase codificados por uma seqüência de áci-dos nucléicos que possui pelo menos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de se-qüência completa (100%) a um ácido nucléico de acordo com a invenção,incluindo as SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17,SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ IDNO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45,SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ IDNO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73,SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ IDNO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID N0:101,SEQ ID NO: 103, SEQ ID N0:105, SEQ ID N0:107, SEQ ID N0:109, SEQ IDNO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ IDNO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ IDNO: 127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ IDNO: 135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ IDNO: 143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ IDNO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ IDNO:159, SEQ ID NO:161, SEQ ID NO: 163, SEQ ID NO:165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO:171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO:181, SEQ ID NO:183, SEQ ID NO:185, SEQ ID NO:187, SEQ ID NO: 189, SEQ ID NO:191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID N0:201, SEQ ID N0:203, SEQ ID N0:205, SEQ ID N0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID N0:301, SEQ ID
Ν0:303, SEQ ID Ν0:305 ao longo de uma região de pelo menos aproxima-damente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350,400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050,1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650,1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300,2350, 2400, 2450, 2500 ou mais resíduos podem ser úteis na facilitação deuma reação entre indol-3-piruvato e uma fonte de carbono C3 como umaetapa dentro de uma vide de várias etapas para a obtenção de um produtoescolhido de monatina, derivados de monatina, sais dos mesmos e combi-nações dos mesmos. Em uma modalidade, o um ou mais polipeptídeos comatividade de HMG aldolase podem ser úteis na facilitação de uma reação emque o indol-3-piruvato é convertido em MP como uma etapa dentro de umavide de várias etapas para a obtenção de um produto escolhido de monatina,derivados de monatina, sais dos mesmos e combinações dos mesmos.Ainda em uma outra modalidade da invenção, um ou mais poli-peptídeos com atividade de KHG aldolase codificados por uma seqüência deácidos nucléicos que possui pelo menos aproximadamente 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de se-qüência completa (100%) a um ácido nucléico de acordo com a invenção,incluindo as SEQ ID N0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ IDNO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ IDNO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ IDNO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ IDNO:336, SEQ ID NO:337 e SEQ ID NO:338 ao longo de uma região de pelomenos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150,200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900,950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500,1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100,2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos podem ser úteisna facilitação de uma reação entre indol-3-piruvato e uma fonte de carbonoC3 como uma etapa dentro de uma vide de várias etapas para a obtençãode um produto escolhido de monatina, derivados de monatina, sais dosmesmos e combinações dos mesmos. Em uma modalidade, o um ou maispolipeptídeos com atividade de KHG aldolase podem ser úteis na facilitaçãode uma reação em que o indol-3-piruvato é convertido em MP como umaetapa dentro de uma vide de várias etapas para a obtenção de um produtoescolhido de monatina, derivados de monatina, sais dos mesmos e combi-nações dos mesmos.
Além disso, um ou mais polipeptídeos com atividade de aldolasecodificados por uma seqüência de ácidos nucléicos que se hibridiza sobcondição rigorosa com um ácido nucléico das SEQ ID NO:1, SEQ ID NO:3,SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13,SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ IDΝΟ:23, SEQ ID ΝΟ:25, SEQ ID ΝΟ:27, SEQ ID ΝΟ:29, SEQ ID Ν0:31, SEQID ΝΟ:33, SEQ ID ΝΟ:35, SEQ ID ΝΟ:37, SEQ ID ΝΟ:39, SEQ ID Ν0:41,SEQ ID ΝΟ:43, SEQ ID ΝΟ:45, SEQ ID ΝΟ:47, SEQ ID ΝΟ:49, SEQ IDΝΟ:51, SEQ ID ΝΟ:53, SEQ ID ΝΟ:55, SEQ ID ΝΟ:57, SEQ ID ΝΟ:59, SEQID Ν0:61, SEQ ID ΝΟ:63, SEQ ID ΝΟ:65, SEQ ID ΝΟ:67, SEQ ID ΝΟ:69,SEQ ID Ν0:71, SEQ ID ΝΟ:73, SEQ ID ΝΟ:75, SEQ ID ΝΟ:77, SEQ IDΝΟ:79, SEQ ID Ν0:81, SEQ ID ΝΟ:83, SEQ ID ΝΟ:85, SEQ ID ΝΟ:87, SEQID ΝΟ:89, SEQ ID Ν0:91, SEQ ID ΝΟ:93, SEQ ID ΝΟ:95, SEQ ID ΝΟ:97,SEQ ID ΝΟ:99, SEQ ID Ν0:101, SEQ ID Ν0:103, SEQ ID Ν0:105, SEQ IDΝ0:107, SEQ ID Ν0:109, SEQ ID ΝΟ:111, SEQ ID ΝΟ:113, SEQ IDΝΟ:115, SEQ ID ΝΟ:117, SEQ ID ΝΟ:119, SEQ ID ΝΟ:121, SEQ IDNO: 123, SEQ ID ΝΟ:125, SEQ ID ΝΟ:127, SEQ ID ΝΟ:129, SEQ IDΝΟ:131, SEQ ID ΝΟ:133, SEQ ID ΝΟ:135, SEQ ID ΝΟ:137, SEQ IDΝΟ:139, SEQ ID ΝΟ:141, SEQ ID ΝΟ:143, SEQ ID ΝΟ:145, SEQ IDNO: 147, SEQ ID ΝΟ:149, SEQ ID Ν0:151, SEQ ID ΝΟ:153, SEQ IDNO: 155, SEQ ID ΝΟ:157, SEQ ID ΝΟ:159, SEQ ID Ν0:161, SEQ IDΝ0:163, SEQ ID ΝΟ:165, SEQ ID ΝΟ:167, SEQ ID ΝΟ:169, SEQ IDΝ0:171, SEQ ID ΝΟ:173, SEQ ID ΝΟ:175, SEQ ID ΝΟ:177, SEQ IDΝΟ:179, SEQ ID Ν0:181, SEQ ID ΝΟ:183, SEQ ID ΝΟ:185, SEQ IDΝΟ:187, SEQ ID ΝΟ:189, SEQ ID Ν0:191, SEQ ID ΝΟ:193, SEQ IDΝ0:195, SEQ ID ΝΟ:197, SEQ ID ΝΟ:199, SEQ ID Ν0:201, SEQ IDΝ0:203, SEQ ID Ν0:205, SEQ ID Ν0:207, SEQ ID Ν0:209, SEQ IDΝ0:211, SEQ ID ΝΟ:213, SEQ ID ΝΟ:215, SEQ ID ΝΟ:217, SEQ IDΝΟ:219, SEQ ID ΝΟ:221, SEQ ID ΝΟ:223, SEQ ID ΝΟ:225, SEQ IDΝΟ:227, SEQ ID ΝΟ:229, SEQ ID ΝΟ:231, SEQ ID ΝΟ:233, SEQ IDΝΟ:235, SEQ ID ΝΟ:237, SEQ ID ΝΟ:239, SEQ ID ΝΟ:241, SEQ IDΝΟ:243, SEQ ID ΝΟ:245, SEQ ID ΝΟ:247, SEQ ID ΝΟ:249, SEQ IDΝΟ:251, SEQ ID ΝΟ:253, SEQ ID ΝΟ:255, SEQ ID ΝΟ:257, SEQ IDΝΟ:259, SEQ ID ΝΟ:261, SEQ ID ΝΟ:263, SEQ ID ΝΟ:265, SEQ IDΝΟ:267, SEQ ID ΝΟ:269, SEQ ID ΝΟ:271, SEQ ID ΝΟ:273, SEQ IDΝΟ:275, SEQ ID ΝΟ:277, SEQ ID ΝΟ:279, SEQ ID ΝΟ:281, SEQ IDΝΟ:283, SEQ ID ΝΟ:285, SEQ ID ΝΟ:287, SEQ ID ΝΟ:289, SEQ IDΝΟ:291, SEQ ID ΝΟ:293, SEQ ID ΝΟ:295, SEQ ID ΝΟ:297, SEQ IDΝΟ:299, SEQ ID Ν0:301, SEQ ID Ν0:303, SEQ ID Ν0:305, SEQ IDΝ0:307, SEQ ID Ν0:309, SEQ ID Ν0:311, SEQ ID ΝΟ:313, SEQ IDΝΟ:315, SEQ ID ΝΟ:317, SEQ ID ΝΟ:319, SEQ ID ΝΟ:321, SEQ IDΝΟ:323, SEQ ID ΝΟ:325, SEQ ID ΝΟ:327, SEQ ID ΝΟ:329, SEQ IDΝΟ:331, SEQ ID ΝΟ:333, SEQ ID ΝΟ:335, SEQ ID ΝΟ:336, SEQ ID ΝΟ:337e SEQ ID ΝΟ:338 podem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de uma videde várias etapas para a obtenção de um produto escolhido de monatina, de-rivados de monatina, sais dos mesmos e combinações dos mesmos. Emuma modalidade, o um ou mais polipeptídeos com atividade de aldolase po-dem ser úteis na facilitação de uma reação em que o indol-3-piruvato é con-vertido em MP como uma etapa dentro de uma vide de várias etapas para aobtenção de um produto escolhido de monatina, derivados de monatina, saisdos mesmos e combinações dos mesmos.
Em uma outra modalidade da invenção, um ou mais polipeptí-deos com atividade de HMG aldolase codificados por uma seqüência de áci-dos nucléicos que se hibridiza sob condições rigorosas com um ácido nu-cléico das SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17,SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ IDNO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45,SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73,SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ IDNO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID N0:101,SEQ ID NO: 103, SEQ ID N0:105, SEQ ID N0:107, SEQ ID N0:109, SEQ IDNO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ IDNQ:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ IDNO:127, SEQ ID NO: 129, SEQ ID NO:131, SEQ ID NO: 133, SEQ IDNO:135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO:141, SEQ IDNO: 143, SEQ ID NO: 145, SEQ ID NO:147, SEQ ID NO: 149, SEQ IDNO:151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO:157, SEQ IDNO: 159, SEQ ID NO:161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ IDNO: 167, SEQ ID NO: 169, SEQ ID NO:171, SEQ ID NO: 173, SEQ IDNO: 175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ IDNO:183, SEQ ID NO: 185, SEQ ID NO:187, SEQ ID NO: 189, SEQ IDNO:191, SEQ ID NO:193, SEQ ID NO:195, SEQ ID NO:197, SEQ IDNO:199, SEQ ID N0:201, SEQ ID N0:203, SEQ ID N0:205, SEQ IDN0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ IDNO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ IDNO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ IDNO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ IDNO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ IDNO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ IDNO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ IDNO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ IDNO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ IDNO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ IDNO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ IDNO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID N0:301, SEQ IDN0:303, SEQ ID NQ:305 podem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fonte de carbono C3 como uma etapa dentro de umavide de várias etapas para a obtenção de um produto escolhido de monatina,derivados de monatina, sais dos mesmos e combinações dos mesmos. Emuma modalidade, o um ou mais polipeptídeos com atividade de HMG aldola-se podem ser úteis na facilitação de uma reação em que o indol-3-piruvato éconvertido em MP como uma etapa dentro de uma vide de várias etapaspara a obtenção de um produto escolhido de monatina, derivados de mona-tina, sais dos mesmos e combinações dos mesmos.
Ainda em uma outra modalidade da invenção, um ou mais poli-peptídeos com atividade de KHG aldolase codificados por uma seqüência deácidos nucléicos que se hibridiza sob condições rigorosas com um ácido nu-cléico das SEQ ID N0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ IDNO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ IDNO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ IDNO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ IDNO:336, SEQ ID NO:337 e SEQ ID NO:338 podem ser úteis na facilitação deuma reação entre indol-3-piruvato e uma fonte de carbono C3 como umaetapa dentro de uma vide de várias etapas para a obtenção de um produtoescolhido de monatina, derivados de monatina, sais dos mesmos e combi-nações dos mesmos. Em uma modalidade, o um ou mais polipeptídeos comatividade de KHG aldolase podem ser úteis na facilitação de uma reação emque o indol-3-piruvato é convertido em MP como uma etapa dentro de umavide de várias etapas para a obtenção de um produto escolhido de monatina,derivados de monatina, sais dos mesmos e combinações dos mesmos.
Os polipeptídeos com atividade de aldolase descritos aqui po-dem ser úteis na facilitação de uma reação entre indol-3-piruvato e uma fon-te de carbono C3. A fonte de carbono C3 pode ser, mas não está limitada aoxaloacetato, piruvato ou um derivado de piruvato, tal como fosfoenolpiruva-to. Em uma modalidade, a fonte de carbono C3 é piruvato.
Os exemplos de enzimas úteis para a conversão do produto dereação entre indol-3-piruvato e a fonte de carbono C3 em monatina incluemmembros das classes de enzimas: triptofano aminotransferases (2.6.1.27),triptofano desidrogenases (1.4.1.19), D-aminoácido desidrogenases(1.4.99.1), glutamato desidrogenases (1.4.1.2-4), fenilalanina desidrogenase(EC 1.4.1.20), triptofano-fenilpiruvato transaminases (2.6.1.28) ou, de formamais geral, membros da família das aminotransferases (2.6.1.-) tais comoaspartato aminotransferase (EC 2.6.1.1), tirosina (aromática) aminotransfe-rase (2.6.1.5), D-triptofano aminotransferase ou D-alanina (2.6.1.21) amino-transferase (vide a figura 2 da WO 03/091396 A2). Esta reação também po-de ser realizada utilizando reações químicas. A aminação do ceto ácido (MP)é realizada através da aminação redutora utilizando amônia e cianoborohi-d reto de sódio. As figuras 11-13 da WO 03/091396 A2 mostram polipeptí-deos adicionais que podem ser utilizados para converter MP em monatina,assim como que fornecem maiores rendimentos de monatina partindo deindol-3-piruvato ou triptofano. Em uma modalidade, estas enzimas são utili-zadas para catalisar a conversão de MP1 o produto de reação entre indol-3-
piruvato e piruvato, em monatina.* O perfil de sabor de uma composição de monatina pode ser alte-rado através do controle da quantidade relativa dos vários estereoisômerosde monatina na composição. A presente descrição fornece vias e substân-cias para a produção de composições de monatina com uma porcentagemdesejada de R1R monatina e/ou S,R monatina.
A quiralidade dos compostos de monatina produzidos atravésdas vias divulgadas pode ser afetada tanto pelo pH quanto pelos polipeptí-deos utilizados para as conversões biológicas. Os polipeptídeos com ativi-dade de aldolase descritos aqui, podem ser utilizados para controlar a quira-lidade da monatina carbono-2 (vide a Fórmula I, acima) na reação em que oindol-3-piruvato é convertido em MP.
Uma vez que o produto de reação da reação entre indol-3-piruvato e a fonte de carbono C3 é obtido, o grupo amino pode ser adiciona-do de forma estéreoespecífica. A configuração R ou S do carbono-4 (vide aFórmula I acima) pode ser gerada dependendo do fato de uma aminotransfe-rase ácida D- ou L-aromática ser utilizada. Muitas aminotransferases sãoespecíficas para o L-isômero, entretanto, há D-triptofano aminotransferasesem certas plantas (Kohiba e Mito, Proceedings of the 8th International Sym-posium on Vitamin B6 and Carbonyl Catalysis, Osaka, Japão 1990). Alémdisso, as D-alanina aminotransferases (2.6.1.21), as D-metionina-piruvatoaminotransferases (2.6.1.41) e tanto a (R)-3-amino-2-metilpropanoato ami-notransferase (2.6.1.61), quanto a (S)-3-amino-2-metilpropanoato amino-transferase (2.6.1.22) e a D-fenilglicina aminotransferase foram identificadas.Certas aminotransferases podem aceitar apenas o substrato para esta rea-ção com uma configuração particular no carbono C2. Portanto, mesmo se aconversão no produto de reação entre indol-3-piruvato e a fonte de carbonoC3 não for estereoespecífica, a estereoquímica do produto final pode sercontrolada através da seleção apropriada de uma aminotransferase. Devidoao fato de que as reações são reversíveis, o produto de reação não reagido(isômero indesejado) pode ser reciclado de volta em seus constituintes euma mistura racêmica do produto de reação pode ser formada novamente.
Um exemplo de um doador amino adequado para a adição deum grupo amino ao produto de reação da reação entre o indol-3-piruvato e afonte de carbono C3 inclui, mas não está limitado a um aminoácido, tal comoalanina, aspartato, lisina, glutamato, glicina e triptofano.
Referindo-se agora às figuras, pode ser citado o seguinte. Osgráficos de fluxo identificam vias para a produção de monatina, mas não es-tão limitados a qualquer método particular para a realização das vias. Porexemplo, as vias podem ser realizadas in vivo, in vitro ou uma combinaçãodos mesmos.
Além disso, a realização das vias não requer que cada um doscomponentes identificados (tais como reagentes e enzimas) seja explicita-mente fornecido pelo técnico, contanto que componentes ou fontes de com-ponentes suficientes e condições de reação sejam fornecidos de forma quea vide pode ser potencialmente realizada. Em outras palavras, por exemplo,se uma figura representar um processo para a produção de uma composiçãode monatina, que inclui a produção de indol-3-piruvato partindo de L-triptofano, a produção de ácido 2-hidróxi 2-(indol-3ilmetil)-4-ceto glutárico("precursor de monatina" ou "MP") partindo de indol-3-piruvato e a produçãode monatina partindo de MP, em que cada reação é facilitada por uma enzi-ma apropriada, é considerado que a realização de tal vide inclui a combina-ção de L-triptofano com α-cetoglutarato e enzimas consideradas para a faci-litação das reações identificadas e sob condições adequadas para que cadauma das reações ocorra sem fornecer explicitamente também indol-3-piruvato ou MP. Em tal caso o L-triptofano poderia reagir com a-cetoglutarato para produzir indol-3-piruvato. Devido às condições ajustadase à enzima fornecida, o indol-3-piruvato produzido partindo da reação com L-triptofano poderia reagir para formar MP e então devido às condições ajus-tadas e à enzima fornecida, o MP produzido partindo da reação com indol-3-piruvato poderia reagir para formar monatina.
Deve ainda ser citado que a prática das vias descritas não re-quer que o técnico forneça explicitamente os materiais de partida ou as en-zimas identificadas. Em outras palavras, é considerado que a realização dequalquer uma das vias que identifica o L-triptofano como um material de par-tida incluiria o fornecimento de um composto que pode produzir L-triptofano,sob condições adequadas para que a produção de L-triptofano ocorra e acombinação de tal composto com enzimas capazes de facilitar a série dereações apresentadas sob condições que seriam adequadas para tais rea-ções ocorram. Como um outro exemplo, é também considerado que a reali-zação da vide identificada incluiria o fornecimento de um microorganismoengenheirado geneticamente para produzir monatina de acordo com a videdescrita e o fornecimento de condições apropriadas para que o processo defermentação ocorra. Por exemplo, um microorganismo, que produz natural-mente grandes quantidades de L-triptofano poderia ser geneticamente en-genheirado para produzir ou superproduzir uma ou mais das enzimas utiliza-das para facilitar as reações na vide para monatina e condições apropriadasseriam fornecidas de forma que o microorganismo produziria assim monati-na.
A figura 1 identifica a modalidade particular em que uma aldola-se específica a R facilita a reação de indol-3-piruvato e piruvato para formarform R-MP. O gráfico de fluxo da figura 1 representa esquematicamente umprocesso de acordo com a invenção para a produção de uma composição demonatina que inclui R,R monatina. Como mostrado na figura 1, a vide geralenvolve uma reação de triptofano para formar indol-3-piruvato, uma reaçãode indol-3-piruvato para produzir MP e uma reação de MP para produzir mo-natina, incluindo R,R monatina.
A figura 1 ilustra ainda permutações específicas desta vide geral,planejadas para aumentar a produção da forma R,R da monatina às custasdas formas S,S, R,S e S, da monatina. Em particular, a figura 1 ilustra a mo-dalidade em que: a enzima aminotransferase utilizada na reação de L-triptofano possui maior atividade e/ou especificidade por tal reação versus asreações de MP e 4S monatina ou a oxidase possui maior atividade e/ou es-pecificidade pelo L-triptofano que pela 4R monatina; a enzima que facilita areação de indol-3-piruvato é um polipeptídeo com atividade de aldolase di-vulgado aqui e, a enzima que facilita a reação de MP é uma D-enzima deespecificidade ampla, preferencialmente envolvida em funcionar mais efici-entemente com o isômero R de MP.
A figura 1 ilustra também permutações particulares planejadaspara tornar a produção de R,R monatina mais econômica. Por exemplo, nafigura 1, o L-triptofano - ao contrário do D-triptofano ou de combinações deL- e D-triptofano - é identificado como o material de partida. Embora a esco-lha da forma específica de triptofano não tenha impacto sobre a quiralidadedos compostos de monatina finais na composição de monatina (devido aofato de que a reação de triptofano forma indol-3-piruvato, que não possuiquiralidade), algumas pessoas podem preferir utilizar o L-triptofano como ummaterial de partida pelo menos porque o L-triptofano é atualmente menosdispendioso e pode ser obtido mais facilmente que o D-triptofano.
Enfocando agora a primeira reação mostrada na figura 1, quan-do o triptofano é convertido em indol-3-piruvato qualquer um ou mais de alfa-cetoglutarato, oxaloacetato e piruvato reagem para formar um aminoácido(glutamato, aspartato e alanina, respectivamente). A figura 1 representa amodalidade em que o material de partida de triptofano é o L-triptofano e oalfa-cetoglutarato, oxaloacetato e/ou o piruvato produzem a forma de L-isômero do aminoácido (tal como L-glutamato, L-aspartato e/ou L-alanina,respectivamente).
Como mostrado na figura 1, uma abordagem par aumentar aprodução de R,R monatina envolve a facilitação da reação de L-triptofanocom uma enzima que possui maior especificidade, maior atividade ou ambasem relação ao triptofano ao contrário do MP ou monatina e a facilitação dareação de MP com uma D-enzima. Como é divulgado na WO 03/091396 A2,certas enzimas podem facilitar a reação de triptofano para produzir indol-3-piruvato, assim como a reação de aminação de MP para produzir monatina.O uso de uma L-aminotransferase na etapa de aminação cria um centro qui-ral S na posição C-4 da monatina, enquanto o uso de uma D-enzima cria umcentro quiral D na posição C-4 da monatina. Assim, no exemplo em que umaL-aminotransferase, que facilita a reação de triptofano, é também ativa nareacão de MP, também podem ser formadas R1S e S1S monatinas, depen-dendo da forma de MP presente. Em adição, certas outras enzimas - as L-aminoácido oxidases - podem não facilitar apenas a reação de triptofano emindol-3-piruvato, mas podem ter uma subatividade para a degradação daR,R monatina. De acordo com algumas modalidades, esta subatividade de4R é minimizada ou eliminada. Uma subatividade de oxidase sobre as for-mas 4S de monatina diminuiria ou minimizaria as mesmas do produto final epoderia ser desejável dependendo da composição final desejada. Conse-qüentemente, quanto maior a especificidade e/ou a atividade da L-enzimaescolhida para o triptofano versus o MP ou a monatina, maior é a quantidadede R,R e de S,R produzida versus S1S e R,S monatina.
As enzimas adequadas para a reação de triptofano, de acordocom a modalidade ilustrada na figura 1, incluem: L-aminotransferases capa-zes de facilitar uma reação de L-triptofano para formar indol-3-piruvato e quepossuem maior especificidade por tal reação em relação à reação de R-MPpara formar isômeros 4S de monatina; e, L-aminoácido oxidases capazes defacilitar uma reação de L-triptofano para formar indol-3-piruvato e que pos-suem maior especificidade e/ou atividade por tal reação versus a reação deisômeros 4R de monatina para formar MP e equivalentes funcionais de qual-quer um dos anteriores. Mais especificamente, os exemplos não-limitantesde enzimas adequadas podem ser escolhidos de L-triptofano aminotransfe-rases (E.C. 2.6.1.27) e tirosina (aromática) aminotransferases (EC 2.6.1.5) eL-aminoácido oxidases (EC 1.4.3.2) e mutantes derivados de enzimas quepossuem atividade de aspartato aminotransferase.
O Exemplo 16 identifica uma enzima específica, um polipeptídeoHEXaspC mutante que inclui uma substituição de Pro 9 por Tyr e uma subs-tituição de Arg 122 por Gly úteis para facilitar as reações de L-triptofano e a-KG, oxaloacetato, piruvato ou combinações dos mesmos para formar indol-3-piruvato e L-glutamato, L-aspartato e L-alanina, respectivamente. Umaoutra enzima específica que possui atividade "limitada" é TatA, a L-triptofanoaminotransferase de S. meliloti. Outras enzimas adequadas para a reaçãode triptofano de acordo com modalidades preferidas da vide mostrada nafigurfc 1 incluem aquelas com as características a seguir: uma enzima quecausa a transaminação de MP a uma taxa de 1/10 ou menor que a taxa deL-triptofano como no Exemplo 16 ou uma enzima quando utilizada com umaracemase, como no Exemplo 18, que produz mais de 90% dos isômeros 4Rde monatina.
Os exemplos de enzimas que não possuem maior especificidadepela conversão de L-triptofano em indol-3-piruvato comparada com a con-versão de MP em monatina incluem: HEXAspC (Exemplo 16), aminotransfe-rase de especificidade ampla de Leishmania major (WO 03/091396 A2), aaminotransferase suína (WO 03/091396 A2) e TatA de Rhodobacter sphae-roides (Exemplo 18). Estas enzimas podem, entretanto, podem ser desen-volvidas, por exemplo, através de mutagênese para possuírem atividade li-mitada por R-MP e/ou R,R monatina versus triptofano.
Enfocando agora a segunda reação identificada na figura 1, aescolha da enzima para facilitar a reação de indol-3-piruvato em MP influen-cia a quantidade relativa de R,R monatina versus S,R monatina produzida.Em geral, quanto maior a quantidade relativa de R-MP versus S-MP produ-zido, maior a quantidade relativa de R,R monatina versus S,R monatina pro-duzida (quando uma D-enzima facilita a reação de MP em monatina). Quan-do é desejada uma composição de monatina que possui a forma R,R demonatina como seu único componente de monatina, uma enzima que produzseletivamente R-MP ao invés de S-MP (uma "enzima específica a R") deveser utilizada. Os polipeptídeos com atividade de aldolase descritos aqui sãoúteis na produção seletiva de R-MP, ao invés de S-MP. Vários exemplos deenzimas aldolases altamente específicas a R são demonstrados na Tabela1, acima, nos Exemplos 4, 5 e 6, abaixo e na Listagem de Seqüências.
Enfocando agora a última etapa da vide identificada na figura 1,é mostrado que a reação de R-MP para formar R,R monatina é facilitada poruma D-aminotransferase de especificidade ampla, por exemplo, D-alaninaaminotransferase (E.C. 2.6.1.21, também conhecida como D-aminoácidoaminotransferase ou D-aspartato aminotransferase) ou uma D-aminoácidodesidrogenase. Como discutido anteriormente, a conversão de MP em mo-natiria é uma reação de aminação, que cria um centro quiral no carbono C-4da monatina. Quando a forma quiral R é desejada na posição C-4, devemser utilizadas enzimas que produzem centros quirais "R" em aminoácidos.
De acordo com algumas modalidades, a D-aminotransferasepossui maior especificidade, maior atividade ou ambas para R-MP que paraindol-3-piruvato. De acordo com algumas modalidades, a D-aminotransferase possui atividade limitada para o indol-3-piruvato. As enzi-mas com tais características podem ser desenvolvidas ou mutadas partindode enzimas existentes, por exemplo, como mostrado no Exemplo 16.
Os Exemplos 9 até 12 ilustram a produção de R,R-monatina par-tindo de D-triptofano.
A figura 2 ilustra um método de produção de R,R monatina e S,Rmonatina. Enquanto que em uma modalidade da figura 1, a aldolase utiliza-da na reação de indol-3-piruvato para formar R-MP influencia a proporção deR,R:S,R formada, em uma modalidade da figura 2, a D-enzima que facilita aconversão de MP em monatina influencia a proporção de R,R:S,R formada.De acordo com a vide da figura 2, se uma enzima não estereoespecífica forutilizada para facilitar a conversão de indol-3-piruvato em MP, então tanto S-MP quanto R-MP podem ser formados. Se uma aldolase não estereosseleti-va for utilizada para converter indol-3-piruvato em MP, então uma transami-nase estereosseletiva é necessária para converter o MP em R,R monatinaou S,R monatina. Como mostrado na figura 2, o uso de uma D-aminotransferase ou uma D-aminoácido desidrogenase que é estereoespe-cífica para R-MP resulta na produção de R,R monatina.
A figura 3 ilustra uma outra vide alternativa para direcionar aprodução de R,R monatina. A vide da figura 3 é uma modificação da vide dafigura 1, em que o indol-3-piruvato é produzido indiretamente, ao invés dediretamente, partindo de L-triptofano. Mais especificamente, o L-triptofano éconvertido em D-triptofano e o D-triptofano é então convertido em indol-3-piruvato.
A conversão de L-triptofano em D-triptofano pode ser facilitadapor uma triptofano racemase ou um equivalente funcional da mesma. O E-xenfplo 15 fornece fontes potenciais de triptofano racemases e métodos deseleção para a identificação de tais enzimas. É também considerado queuma triptofano racemase pode ser desenvolvida (tal como através de muta-gênese ou de engenharia recombinante) para melhor desempenho partindode uma aminoácido racemase existente.
Os exemplos não-limitantes de triptofano racemases incluemhomólogos ou mutantes de aminoácido racemases (EC 5.1.1.-), por exem-plo, serina racemase, em que os homólogos ou os mutantes são capazes deconverter L-triptofano em D-triptofano. Os exemplos não-limitantes de fontespartindo das quais a aminoácido racemase pode ser derivada incluem: mi-croorganismos tais como Salmonella typhimurium, Escherichia coli, Bacillussubtilis, Pseudomonas aeruginosa, Vibrio eholerae, Schizosaccaroycespombe, Bacillus eereus, Enteroeoceus gallinarum, Pedioeoceus pentosa-eeus, Baeillus pumilus, Lactobacillus fermenti, LactobaciHus brevis, Aquifexpyrophilus, Laetobaeilli, Streptoeoeeus, Anabaena sp., Pseudomonas striata,Lentinus edodes, Seapharea brouhtonii Desulfurococcus sp., Thermocoeeussp. e Pseudomonas striata. Os exemplos não-limitantes adicionais de fontespartindo das quais a aminoácido racemase pode ser derivada incluem bicho-da-seda, cérebro de rato ou cérebro de camundongo.
Os exemplos não-limitantes de fontes potenciais partindo dasquais as triptofano racemases adequadas podem ser derivadas incluem: mi-croorganismos tais como Pseudômonas, por exemplo, Pseudomonas ehloro-raphis (Pseudomonas aurereofaeiens) (ATCC15926) e Burkholderia pyrroei-na (ATCC15958). Os exemplos não-limitantes adicionais de fontes potenci-ais partindo das quais as triptofano racemases adequadas podem ser deri-vadas incluem plantas, por exemplo, plantas de tabaco, tal como Nieotianatabaeum, plantas de trigo, tal como Tritieum aestivum, beterraba, tomates eScleroehiton ilieifolius.A via mostrada na figura 3 tem certos benefícios, incluindo quemesmo quando a R,R monatina é o produto desejado, a mesma enzima po-de ser utilizada para a reação que produz indol-3-piruvato assim como paraa reação que produz monatina. Ou seja, na vide ilustrada na figura 1, uma L-amirnotransferase (ou L-enzima adequada) facilita a reação que produz indol-3-pjruvato, mas uma D-aminotransferase facilita a reação que produz mona-tina. Em contraste, na vide da figura 3, certa D-aminotransferase que facilitaa reação que produz indol-3-piruvato, também pode facilitar a reação queproduz monatina. Conseqüentemente, nas vias de acordo com a figura 3 asD-aminotransferases de especificidade ampla podem ser preferidas quandohouver um desejo de utilizar a mesma enzima para a reação que forma in-dol-3-piruvato assim como para a reação que forma monatina. Em contraste,nas vias de acordo com as figuras 1, 2, 4, 6, 7 e 8 a produção de monatinapode ser levada adiante mais eficientemente quando é escolhida uma D-aminotransferase que possui atividade e/ou especificidade limitada pelo in-dol-3-piruvato quando comparado ao R-MP.
Um outro benefício da vide representada esquematicamente nafigura 3 é que o produto de aminoácido da reação acoplada com a reaçãoque produz indol-3-piruvato pode ser utilizada agora como um material departida na reação acoplada com a reação que produz monatina. Ou seja, navide ilustrada na figura 1, o L-triptofano reage para produzir indol-3-piruvatoe, ao mesmo tempo, o oxaloacetato, o alfa-cetoglutarato e/ou o piruvato rea-gem para produzir um L-aminoácido. Devido ao fato de que a reação de R-MP para formar monatina é acoplada com uma reação que utiliza um D-aminoácido como um substrato, o L-aminoácido da reação que forma indol-3-piruvato não é, sob as condições mostradas, reciclado para uso na reaçãoacoplada com a reação de R-MP. Em contraste, na vide ilustrada na figura 3,a reação de D-triptofano para formar indol-3-piruvato é acoplada com umareação que forma um produto de D-aminoácido, cujo D-aminoácido pode serreciclado para uso na reação acoplada com a reação de R-MP. Isto permiteutilizar quantidades não estequiométricas de receptor de amino na etapa um.Em algumas modalidades da invenção, o D-aminoácido e D-alanina.As figuras 4 e 5 ilustram modificações adicionais da vide mos-trada na figura 1, cujas modificações são direcionadas para a reciclagem doproduto de aminoácido formado através da reação acoplada com a reaçãode L-triptofano com o reagente de aminoácido da reação acoplada com areação de MP em monatina.
Voltando para a figura 4, a reciclagem é realizada fornecendouma enzima que pode facilitar a conversão de um L-aminoácido em um D-aminoácido e vice-versa. Mais especificamente, como é mostrado na figura4, α-KG reage para formar L-glutamato quando o L-triptofano reage paraformar indol-3-piruvato, pode ser fornecida uma glutamato racemase (EC5.1.1.3) ou um equivalente funcional que pode facilitar a conversão de L-glutamato em D-glutamato e vice-versa. Em tal caso, o L-glutamato formadoao longo da produção de indol-3-piruvato é removido em virtude de sua con-versão em D-glutamato e o D-glutamato formado partindo da conversão deL-glutamato fica então disponível como um substrato para a reação acopladacom a reação de MP em monatina. Similarmente, o α-KG formado na reaçãode D-glutamato fica disponível como um substrato para a reação acopladacom a reação de L-triptofano em indol-3-piruvato.
Os exemplos não-limitantes de fontes potenciais partindo dasquais uma glutamato racemase pode ser derivada incluem Pediococcus pen-tosaeeus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis, E.eoli, Aquifex pyrophilus e Bacillus subtilis. Mais especificamente (tambémnão-limitante), a glutamato racemase pode ser expressa partindo de um áci-do nucléico tal como o gene murl de Pedioeoceus pentaosaeeus (Número deAcesso do Genbank L22789) ou a glutamato racemase de Laetobaeillus bre-vis.
Quando o oxaloacetato reage para formar o L-aspartato quandoo L-triptofano reage para formar o indol-3-piruvato, uma aspartato racemase(EC 5.1.1.13) ou um equivalente funcional pode ser fornecido para convertero L-aspartato em D-aspartato. Em tal caso, o L-aspartato ao longo da produ-ção de indol-3-piruvato é removido em virtude de sua conversão em D-aspartato e o D-aspartato formado partindo da conversão de L-aspartato ficaentão disponível como um substrato para a reação acoplada com a reaçãode MP em monatina. Similarmente, o oxaloacetato formado na reação de D-aspartato fica disponível para atuar como um substrato para a reação aco-plada com a reação de L-triptofano em indol-3-piruvato.
Os exemplos não-limitantes de enzimas adequadas que possu-em^atividade de aspartato racemase incluem ASPR-101 (BioCatalytics, Inc.,Pasadena, CA) e homólogos ou mutantes de uma aminoácido racemase (EC5.1.1.-) que são capazes de facilitar a conversão de L-aspartato em D-aspartato.
Os exemplos não-limitantes de fontes potenciais partindo dasquais as aspartato racemases podem ser derivadas incluem: Desulfuroeoe-eus, Thermococeus, molusco bivalve Scapharca brouhtonii, Acinetobacter,Agrobaeterium, Archaeoglobus, Bacillus, Bordetella, Bradyrhizobium, Brevi-baeterium, Burkholderia, Campylobaeter, Candida, Caulobaeter, Clostridium,Desulfitobaeterium, Desulfotalea, Enteroeoeeus, Erwinia, Eseheriehia, Ferro-plasma, Helieobaeter, Klebsiella, Laetobaeillus, Mannheimia, Medieago, Me-sorhizobium, Metanoeoeeus, Metanosareina, Oeeanobaeillus, Oenoeoeeus,Pedioeoeeus, Polaribaeter, Pseudomonas, Pyroeoeeus, Ralsonia, Shigella,Sinorhizobium, Salmonella, Sphingomonas, Streptoeoeeus, Thermoanaero-baeter, Vibrio, Wolinella, Xanthomonas, Xanthobaeter, Yersinia e Zymomo-nas.
Quando o piruvato reage para formar a L-alanina quando o L-triptofano reage para formar o indol-3-piruvato, uma alanina racemase ou umequivalente funcional pode ser fornecido para converter a L-alanina em D-alanina. Em tal caso, a L-alanina formada ao longo da produção de indol-3-piruvato é removida em virtude de sua conversão em D-alanina e a D-alanina formada partindo da conversão de L-alanina fica então disponívelpara atuar como um substrato para a reação acoplada com a reação de MPem monatina. Similarmente, o piruvato formado na reação de D-alanina ficadisponível para atuar como um substrato para a reação acoplada com a rea-ção de L-triptofano em indol-3-piruvato.
Os exemplos não-limitantes de alanina racemases adequadasincluem A8936 (Sigma-AIdrich, St. Louis, MO).
Os exemplos não-limitantes de fontes potenciais partindo dasquais a alanina racemase pode ser derivada incluem: Brucella abortus, S-treptococcus faecalis Salmonella typhimurium, Escherichia coli, Bacillus sub-tilis, Bacillus stearothermophilus, Pseudomonas aeruginosa, Vibrio eholerae,Schizosacearoyees pombe, Bacillus eereus e Lentinus edodes.
Os Exemplos 18 e 21 ilustram o uso das racemases anteriores,seu impacto sobre o aumento da proporção do produto de monatina deseja-do e fornecem fontes potenciais para as enzimas racemases.
Voltando para a figura 5, uma aminotransferase de estereoinver-são é utilizada para facilitar a reação de R-MP em monatina. Embora tipica-mente a reação de R-MP (ou de S-MP) para formar R,R monatina (ou S1Rmonatina) esteja acoplada com a reação de um D-aminoácido, uma amino-transferase de estereoinversão pode facilitar as reações acopladas de R-MP(ou de S-MP) para formar R1R monatina (ou S,R monatina) utilizando um L-aminoácido. Desta maneira, o produto de L-aminoácido da reação da L-triptofano aminotransferase pode ser utilizado como um substrato para atransaminação de MP em monatina e o produto (isto é, oxaloacetato, piruva-to e/ou α-KG) da reação acoplada com a reação de MP em monatina podeser utilizado como um material de partida para a reação acoplada com a re-ação de L-triptofano em indol-3-piruvato. Os exemplos não-limitantes de a -minotransferases de estereoinversão que podem ser utilizadas incluem D-fenilglicina aminotransferase (EC 2.6.1.72, também conhecida como D-4-hidroxifenilglicina aminotransferase) e D-metionina aminotransferase (EC2.6.1.41, também conhecida como D-met-aminotransferase e D-metionina-piruvato aminotransferase). Os exemplos não-limitantes de fontes potenciaispartindo das quais a D-fenilglicina aminotransferase pode ser derivada inclu-em Pseudômonas, tal como Pseudomonas putida LW-4 e Pseudomonasstutzeri ST-201. Os exemplos não-limitantes de fontes potenciais partindodas quais a D-metionina aminotransferase pode ser derivada incluem couve-flor e amendoim.
Os Exemplos 19 e 20 juntos fornecem fontes potenciais de en-zimas de estereoinversão e métodos de produção de tais enzimas. Os e-xemplos fornecem ainda métodos de seleção para a identificação de taisenzimas. É também considerado que tais enzimas podem ser desenvolvidaspartindo das enzimas de estereoinversão conhecidas e encontradas na natu-reza. Como um exemplo não-limitante, a aminotransferase de estereoinver-são. pode ser um homólogo ou um mutante de uma D-aminoácido amino-transferase ou um homólogo ou um mutante de uma aminoácido racemase(EC 5.1.1.-).
As figuras 6-8 ilustram ainda modificações na vide da figura 1.As vias ilustradas nas figuras 6-8 fornecem métodos para empurrar as rea-ções em equilíbrio à diante através da remoção do subproduto da reação detriptofano e, em alguns casos, para fornecer substrato para a reação de MP.
Voltando para a figura 6, a vide mostrada remove o produto deL-aminoácido da reação acoplada com a reação de triptofano através daconversão do mesmo em um L-aminoácido diferente e então fornece umsubstrato para a reação acoplada com a reação de MP através da conversãodo L-aminoácido recém-formado em um D-aminoácido. Especificamente, émostrado que o L-triptofano reage junto com o oxaloacetato para formar in-dol-3-piruvato e L-aspartato. Uma aspartato 4-descarboxilase (EC 4.1.1.12)ou um equivalente funcional é utilizado para facilitar a conversão de L-aspartato em L-alanina e dióxido de carbono e uma enzima com atividade dealanina racemase é utilizada para facilitar a conversão de L-alanina em D-alanina, cuja D-alanina pode servir como um doador de amino para a con-versão de R-MP em monatina.
Voltando para a figura 7, a vide mostrada ilustra métodos adicio-nais para a remoção do produto de L-aminoácido da reação acoplada com areação de triptofano. As modalidades que são apresentadas na figura produ-zem subproduto(s) que fica(m) indisponível(veis) para reagir na direção in-versa, por exemplo, devido à volatilidade (tal como dióxido de carbono) ouatravés da conversão espontânea em um produto final não reativo. Um e-xemplo de tal abordagem inclui, quando o α-KG reage junto com o L-triptofano para produzir L-glutamato, pode ser fornecida uma glutamato des-carboxilase (EC 4.1.1.15) ou um equivalente funcional que pode facilitar aconversão de L-glutamato em 4-aminobutanoato (com dióxido de carbonocomo um subproduto). Os exemplos não-limitantes de fontes potenciais par-tindo das quais a L-glutamato descarboxilase pode ser derivada incluem:Clostridium perfringens, C. welchii ou E. coli.
Um outro exemplo de tal abordagem para mover a reação detriptofano à diante inclui, quando o oxaloacetato reage junto com o L-triptofano, uma aspartato descarboxilase (EC 4.1.1.11) ou um equivalentefuncional pode ser fornecido para facilitar a conversão de L-aspartato em β-alanina (com dióxido de carbono como um subproduto).
Voltando para a figura 8, a vide mostrada ilustra ainda métodosadicionais para a remoção do produto de L-aminoácido da reação acopladacom a reação de triptofano e o fornecimento de um substrato para a reaçãoacoplada com a reação de MP. Especificamente, quando o α-KG reage juntocom o L-triptofano para formar L-glutamato, uma enzima com atividade de L-alanina aminotransferase e piruvato podem ser fornecidos, em que a enzimaL-alanina aminotransferase facilita a reação de piruvato e L-glutamato paraformar L-alanina. Uma alanina racemase ou equivalente funcional tambémpode ser fornecido com a finalidade de facilitar a conversão da L-alanina emD-alanina, cuja D-alanina pode ser utilizada como um substrato junto comMP para formar monatina e piruvato. Vide os Exemplos 18 e 21.
Vias Biossintéticas para Produzir R.R e Outros Estereoisômeros de Deriva-dos de Monatina
Os métodos da invenção descrita incluem a utilização dos poli-peptídeos com atividade de aldolase descritos aqui que podem ser utilizadospara facilitar a reação entre um indol-3-piruvato substituído e uma fonte decarbono C3.
As enzimas úteis para facilitar uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3 incluem um ou mais polipep-tídeos com atividade de aldolase de qualquer uma das SEQ ID NO:2, SEQID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ ID NO:12, SEQID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID N0:20, SEQ ID NO:22,SEQ ID ΝΟ:24, SEQ ID ΝΟ:26, SEQ ID ΝΟ:28, SEQ ID Ν0:30, SEQ IDΝΟ:32, SEQ ID ΝΟ:34, SEQ ID ΝΟ:36, SEQ ID ΝΟ:38, SEQ ID Ν0:40, SEQID ΝΟ:42, SEQ ID ΝΟ:44, SEQ ID ΝΟ:46, SEQ ID ΝΟ:48, SEQ ID Ν0:50,SEQ ID ΝΟ:52, SEQ ID ΝΟ:54, SEQ ID ΝΟ:56, SEQ ID ΝΟ:58, SEQ IDΝ0:60, SEQ ID ΝΟ:62, SEQ ID ΝΟ:64, SEQ ID ΝΟ:66, SEQ ID ΝΟ:68, SEQID _ΝΟ:70, SEQ ID ΝΟ:72, SEQ ID ΝΟ:74, SEQ ID ΝΟ:76, SEQ ID ΝΟ:78,SEQ ID Ν0:80, SEQ ID ΝΟ:82, SEQ ID ΝΟ:84, SEQ ID ΝΟ:86, SEQ IDΝΟ:88, SEQ ID Ν0:90, SEQ ID ΝΟ:92, SEQ ID ΝΟ:94, SEQ ID ΝΟ:96, SEQID ΝΟ:98, SEQ ID NQ:100, SEQ ID NQ:102, SEQ ID NQ:104, SEQ ID
Ν0:106, SEQ ID Ν0:108, SEQ ID Ν0:110, SEQ ID Ν0:112, SEQ ID ΝΟ:114, SEQ ID NO: 116, SEQ ID ΝΟ:118, SEQ ID Ν0:120, SEQ ID NO: 122, SEQ ID ΝΟ:124, SEQ ID Ν0:126, SEQ ID ΝΟ:128, SEQ ID Ν0:130, SEQ ID NO: 132, SEQ ID Ν0:134, SEQ ID ΝΟ:136, SEQ ID NO: 138, SEQ ID Ν0:140, SEQ ID Ν0:142, SEQ ID Ν0:144, SEQ ID ΝΟ:146, SEQ ID ΝΟ:148, SEQ ID Ν0:150, SEQ ID Ν0:152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID ΝΟ:158, SEQ ID Ν0:160, SEQ ID NO: 162, SEQ ID ΝΟ:164, SEQ ID Ν0:166, SEQ ID ΝΟ:168, SEQ ID NO: 170, SEQ ID Ν0:172, SEQ ID Ν0:174, SEQ ID ΝΟ:176, SEQ ID ΝΟ:178, SEQ ID Ν0:180, SEQ ID ΝΟ:182, SEQ ID Ν0:184, SEQ ID NO: 186, SEQ ID ΝΟ:188, SEQ ID Ν0:190, SEQ ID Ν0:192, SEQ ID ΝΟ:194, SEQ ID Ν0:196, SEQ ID Ν0:198, SEQ ID Ν0:200, SEQ ID Ν0:202, SEQ ID Ν0:204, SEQ ID Ν0:206, SEQ ID Ν0:208, SEQ ID Ν0:210, SEQ ID ΝΟ:212, SEQ ID ΝΟ:214, SEQ ID ΝΟ:216, SEQ ID ΝΟ:218, SEQ ID Ν0:220, SEQ ID ΝΟ:222, SEQ ID ΝΟ:224, SEQ ID ΝΟ:226, SEQ ID ΝΟ:228, SEQ ID Ν0:230, SEQ ID ΝΟ:232, SEQ ID ΝΟ:234, SEQ ID ΝΟ:236, SEQ ID ΝΟ:238, SEQ ID Ν0:240, SEQ ID ΝΟ:242, SEQ ID ΝΟ:244, SEQ ID ΝΟ:246, SEQ ID ΝΟ:248, SEQ ID Ν0:250, SEQ ID ΝΟ:252, SEQ ID ΝΟ:254, SEQ ID ΝΟ:256, SEQ ID ΝΟ:258, SEQ ID Ν0:260, SEQ ID ΝΟ:262, SEQ ID ΝΟ:264, SEQ ID ΝΟ:266, SEQ ID ΝΟ:268, SEQ ID Ν0:270, SEQ ID ΝΟ:272, SEQ ID ΝΟ:274, SEQ ID ΝΟ:276, SEQ ID ΝΟ:278, SEQ ID Ν0:280, SEQ ID ΝΟ:282, SEQ ID ΝΟ:284, SEQ ID ΝΟ:286, SEQ ID ΝΟ:288, SEQ IDΝ0:290, SEQ ID ΝΟ:292, SEQ ID ΝΟ:294, SEQ ID ΝΟ:296, SEQ IDΝΟ:298, SEQ ID Ν0:300, SEQ ID Ν0:302, SEQ ID Ν0:304, SEQ IDΝ0:306, SEQ ID Ν0:308, SEQ ID Ν0:310, SEQ ID ΝΟ:312, SEQ IDΝΟ:314, SEQ ID ΝΟ:316, SEQ ID ΝΟ:318, SEQ ID Ν0:320, SEQ IDΝΟ:322, SEQ ID ΝΟ:324, SEQ ID ΝΟ:326, SEQ ID ΝΟ:328, SEQ IDΝ0:330, SEQ ID ΝΟ:332 ou SEQ ID ΝΟ:334 ou fragmentos ou subseqüên-cias dos mesmos que possuem atividade de aldolase.
Em uma modalidade, um ou mais polipeptídeos com atividadede HMG aldolase de qualquer uma das SEQ ID NO:2, SEQ ID NO:4, SEQ IDNO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ ID NO:12, SEQ ID NO:14, SEQ IDNO: 16, SEQ ID NO:18, SEQ ID N0:20, SEQ ID NO:22, SEQ ID NO:24, SEQID NO:26, SEQ ID NO:28, SEQ ID N0:30, SEQ ID NO:32, SEQ ID NO:34,SEQ ID NO:36, SEQ ID NO:38, SEQ ID N0:40, SEQ ID NO:42, SEQ IDNO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID N0:50, SEQ ID NO:52, SEQID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID N0:60, SEQ ID NO:62,SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID N0:70, SEQ IDNO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID N0:80, SEQID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID N0:90,SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID N0:100, SEQ ID N0:102, SEQ ID N0:104, SEQ ID N0:106, SEQ IDNO: 108, SEQ ID N0:110, SEQ ID NO:112, SEQ ID NO:114, SEQ IDNO:116, SEQ ID NO:118, SEQ ID N0:120, SEQ ID NO:122, SEQ IDNO: 124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID N0:130, SEQ IDNO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ IDNO: 140, SEQ ID NO:142, SEQ ID NO:144, SEQ ID NO:146, SEQ IDNO: 148, SEQ ID N0:150, SEQ ID NO:152, SEQ ID NO:154, SEQ IDNO: 156, SEQ ID NO:158, SEQ ID N0:160, SEQ ID NO:162, SEQ IDNO: 164, SEQ ID NO:166, SEQ ID NO:168, SEQ ID N0:170, SEQ IDNO: 172, SEQ ID NO:174, SEQ ID NO:176, SEQ ID NO:178, SEQ IDN0:180, SEQ ID NO:182, SEQ ID NO:184, SEQ ID NO:186, SEQ IDNO: 188, SEQ ID N0:190, SEQ ID NO:192, SEQ ID NO:194, SEQ IDNO: 196, SEQ ID NO:198, SEQ ID N0:200, SEQ ID N0:202, SEQ IDN0:204, SEQ ID N0:206, SEQ ID N0:208, SEQ ID N0:210, SEQ IDNO:212, SEQ ID NO:214, SEQ ID NO:216, SEQ ID NO:218, SEQ IDN0:220, SEQ ID NO:222, SEQ ID NO:224, SEQ ID NO:226, SEQ IDNO:228, SEQ ID N0:230, SEQ ID NO:232, SEQ ID NO:234, SEQ IDNO:236, SEQ ID NO:238, SEQ ID N0:240, SEQ ID NO:242, SEQ IDNO:244, SEQ ID NO:246, SEQ ID NO:248, SEQ ID N0:250, SEQ IDNO:252, SEQ ID NO:254, SEQ ID NO:256, SEQ ID NO:258, SEQ IDN0:260, SEQ ID NO:262, SEQ ID NO:264, SEQ ID NO:266, SEQ IDNO:268, SEQ ID N0:270, SEQ ID NO:272, SEQ ID NO:274, SEQ IDNO:276, SEQ ID NO:278, SEQ ID N0:280, SEQ ID NO:282, SEQ IDNO:284, SEQ ID NO:286, SEQ ID NO:288, SEQ ID N0:290, SEQ IDNQ:292, SEQ ID NO:294, SEQ ID NO:296, SEQ ID NO:298, SEQ ID
Ν0:300, SEQ ID Ν0:302, SEQ ID Ν0:304 ou fragmentos ou subseqüênciasdos mesmos que possuem atividade de aldolase atividade podem ser úteisna facilitação de uma reação entre um indol-3-piruvato substituído e umafonte de carbono C3.
Em uma outra modalidade, um ou mais polipeptídeos com ativi-dade de KHG aldolase de qualquer uma das SEQ ID N0:306, SEQ IDN0:308, SEQ ID N0:310, SEQ ID NO:312, SEQ ID NO:314, SEQ IDNO:316, SEQ ID NO:318, SEQ ID N0:320, SEQ ID NO:322, SEQ IDNO:324, SEQ ID NO:326, SEQ ID NO:328, SEQ ID N0:330, SEQ ID NO:332ou SEQ ID NO:334 ou fragmentos ou subseqüências dos mesmos que pos-suem atividade de aldolase podem ser úteis na facilitação de uma reaçãoentre um indol-3-piruvato substituído e uma fonte de carbono C3.
Alternativamente, um ou mais polipeptídeos com atividade dealdolase codificados por uma seqüência de ácidos nucléicos que possui pelomenos aproximadamente 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%,58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%,71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%,84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%,97%, 98%, 99% ou mais ou identidade de seqüência completa (100%) a umácido nucléico de acordo com a invenção, incluindo as SEQ ID NO: 1, SEQID Ν0:3, SEQ ID Ν0:5, SEQ ID Ν0:7, SEQ ID Ν0:9, SEQ ID Ν0:11, SEQID Ν0:13, SEQ ID Ν0:15, SEQ ID Ν0:17, SEQ ID Ν0:19, SEQ ID Ν0:21,SEQ ID ΝΟ:23, SEQ ID ΝΟ:25, SEQ ID ΝΟ:27, SEQ ID ΝΟ:29, SEQ IDΝ0:31, SEQ ID ΝΟ:33, SEQ ID ΝΟ:35, SEQ ID ΝΟ:37, SEQ ID ΝΟ:39, SEQID Ν0:41, SEQ ID ΝΟ:43, SEQ ID ΝΟ:45, SEQ ID ΝΟ:47, SEQ ID ΝΟ:49,SEQ ID Ν0:51, SEQ ID ΝΟ:53, SEQ ID ΝΟ:55, SEQ ID ΝΟ:57, SEQ IDΝΟ:59, SEQ ID Ν0:61, SEQ ID ΝΟ:63, SEQ ID ΝΟ:65, SEQ ID ΝΟ:67, SEQID ΝΟ:69, SEQ ID Ν0:71, SEQ ID ΝΟ:73, SEQ ID ΝΟ:75, SEQ ID ΝΟ:77,SEQ ID ΝΟ:79, SEQ ID Ν0:81, SEQ ID ΝΟ:83, SEQ ID ΝΟ:85, SEQ IDΝΟ:87, SEQ ID ΝΟ:89, SEQ ID ΝΟ:91, SEQ ID ΝΟ:93, SEQ ID ΝΟ:95, SEQID ΝΟ:97, SEQ ID ΝΟ:99, SEQ ID Ν0:101, SEQ ID Ν0:103, SEQ IDΝ0:105, SEQ ID Ν0:107, SEQ ID Ν0:109, SEQ ID Ν0:111, SEQ IDΝΟ:113, SEQ ID Ν0:115, SEQ ID Ν0:117, SEQ ID Ν0:119, SEQ IDΝΟ:121, SEQ ID ΝΟ:123, SEQ ID ΝΟ:125, SEQ ID ΝΟ:127, SEQ IDΝΟ:129, SEQ ID Ν0:131, SEQ ID ΝΟ:133, SEQ ID ΝΟ:135, SEQ IDNO: 137, SEQ ID Ν0:139, SEQ ID Ν0:141, SEQ ID ΝΟ:143, SEQ IDNO: 145, SEQ ID Ν0:147, SEQ ID Ν0:149, SEQ ID Ν0:151, SEQ IDΝ0:153, SEQ ID ΝΟ:155, SEQ ID Ν0:157, SEQ ID ΝΟ:159, SEQ IDΝ0:161, SEQ ID NO: 163, SEQ ID Ν0:165, SEQ ID Ν0:167, SEQ IDΝ0:169, SEQ ID Ν0:171, SEQ ID NO: 173, SEQ ID ΝΟ:175, SEQ IDΝ0:177, SEQ ID Ν0:179, SEQ ID Ν0:181, SEQ ID ΝΟ:183, SEQ IDΝΟ:185, SEQ ID Ν0:187, SEQ ID Ν0:189, SEQ ID Ν0:191, SEQ IDΝ0:193, SEQ ID Ν0:195, SEQ ID ΝΟ:197, SEQ ID ΝΟ:199, SEQ IDΝ0:201, SEQ ID Ν0:203, SEQ ID Ν0:205, SEQ ID Ν0:207, SEQ IDΝ0:209, SEQ ID Ν0:211, SEQ ID ΝΟ:213, SEQ ID ΝΟ:215, SEQ IDΝΟ:217, SEQ ID ΝΟ:219, SEQ ID ΝΟ:221, SEQ ID ΝΟ:223, SEQ IDΝΟ:225, SEQ ID ΝΟ:227, SEQ ID ΝΟ:229, SEQ ID ΝΟ:231, SEQ IDΝΟ:233, SEQ ID ΝΟ:235, SEQ ID ΝΟ:237, SEQ ID ΝΟ:239, SEQ IDΝΟ:241, SEQ ID ΝΟ:243, SEQ ID ΝΟ:245, SEQ ID ΝΟ:247, SEQ IDΝΟ:249, SEQ ID ΝΟ:251, SEQ ID ΝΟ:253, SEQ ID ΝΟ:255, SEQ IDΝΟ:257, SEQ ID ΝΟ:259, SEQ ID ΝΟ:261, SEQ ID ΝΟ:263, SEQ IDΝΟ:265, SEQ ID ΝΟ:267, SEQ ID ΝΟ:269, SEQ ID ΝΟ:271, SEQ IDNO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ IDNO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ IDNO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ IDNO:297, SEQ ID NO:299, SEQ ID N0:301, SEQ ID N0:303, SEQ IDN0:305, SEQ ID N0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ IDNO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ IDNO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ IDNO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ IDNO:336, SEQ ID NO:337 e SEQ ID NO:338 ao longo de uma região de pelo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150,200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900,950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500,1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100,2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos podem ser úteisna facilitação de uma reação entre um indol-3-piruvato substituído e umafonte de carbono C3.
Em uma modalidade da invenção, um ou mais polipeptídeoscom atividade de HMG aldolase codificados por uma seqüência de ácidosnucléicos que possui pelo menos aproximadamente 50%, 51%, 52%, 53%,54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%,67%, 68%, 69%, 70%, 71%, 72%, 7.3%, 74%, 75%, 76%, 77%, 78%, 79%,80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%,93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de seqüênciacompleta (100%) a um ácido nucléico de acordo com a invenção, incluindoas SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ IDNO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37,SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ IDNO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65,SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ IDΝΟ:75, SEQ ID ΝΟ:77, SEQ ID ΝΟ:79, SEQ ID Ν0:81, SEQ ID ΝΟ:83, SEQID ΝΟ:85, SEQ ID ΝΟ:87, SEQ ID ΝΟ:89, SEQ ID Ν0:91, SEQ ID ΝΟ:93,SEQ ID ΝΟ:95, SEQ ID ΝΟ:97, SEQ ID ΝΟ:99, SEQ ID Ν0:101, SEQ ID
NO: 103, SEQ ID NO: 105, SEQ ID N0:107, SEQ ID NO: 109, SEQ ID NO:111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO:117, SEQ ID NO: 119, SEQ ID NO:121, SEQ ID NO: 123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO: 129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO: 135, SEQ ID NO:137, SEQ ID NO: 139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO: 145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO:171, SEQ ID NO:173, SEQ ID NO:175, SEQ ID NO:177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO:183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO:191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO:197, SEQ ID NO:199, SEQ ID N0:201, SEQ ID N0:203, SEQ ID N0:205, SEQ ID N0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ ID NO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ ID NO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ ID NO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ ID NO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ ID NO:247, SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ ID NO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ ID NO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ ID NO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ ID NO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ ID NO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ ID NO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NQ:301, SEQ ID
Ν0:303, SEQ ID Ν0:305 ao longo de uma região de pelo menos aproxima-damente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350,400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050,1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650,1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300,2350, 2400, 2450, 2500 ou mais resíduos podem ser úteis na facilitação deuma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
Em uma outra modalidade da invenção, um ou mais polipeptí-deos com atividade de KHG aldolase codificados por uma seqüência de áci-dos nucléicos que possui pelo menos aproximadamente 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais ou identidade de se-qüência completa (100%) a um ácido nucléico de acordo com a invenção,incluindo as SEQ ID N0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ IDNO:313; SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ IDNO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ IDNO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ IDNO:336, SEQ ID NO:337 e SEQ ID NO:338 ao longo de uma região de pelomenos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150,200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900,950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500,1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100,2200, 2250, 2300, 2350, 2400, 2450, 2500 ou mais resíduos podem ser úteisna facilitação de uma reação entre um indol-3-piruvato substituído e umafonte de carbono C3.
Um ou mais polipeptídeos com atividade de aldolase codificadospor uma seqüência de ácidos nucléicos que se hibridiza sob condições rigo-rosas com um ácido nucléico das SEQ ID NO:1, SEQ ID NO:3, SEQ IDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ IDNO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33,SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ IDNO:43, SEQ ÍD NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQID ΝΟ:53, SEQ ID ΝΟ:55, SEQ ID ΝΟ:57, SEQ ID ΝΟ:59, SEQ ID Ν0:61,SEQ ID ΝΟ:63, SEQ ID ΝΟ:65, SEQ ID ΝΟ:67, SEQ ID ΝΟ:69, SEQ IDΝ0:71, SEQ ID ΝΟ:73, SEQ ID ΝΟ:75, SEQ ID ΝΟ:77, SEQ ID ΝΟ:79, SEQID Ν0:81, SEQ ID ΝΟ:83, SEQ ID ΝΟ:85, SEQ ID ΝΟ:87, SEQ ID ΝΟ:89,SEQ ID Ν0:91, SEQ ID ΝΟ:93, SEQ ID ΝΟ:95, SEQ ID ΝΟ:97, SEQ IDΝΟ:99, SEQ ID Ν0:101, SEQ ID Ν0:103, SEQ ID Ν0:105, SEQ ID Ν0:107,SEQ ID NQ:109, SEQ ID Ν0:111, SEQ ID Ν0:113, SEQ ID Ν0:115, SEQ ID
ΝΟ:117, SEQ ID Ν0:119, SEQ ID Ν0:121, SEQ ID Ν0:123, SEQ ID NO: 125, SEQ ID Ν0:127, SEQ ID NO: 129, SEQ ID Ν0:131, SEQ ID NO: 133, SEQ ID ΝΟ:135, SEQ ID Ν0:137, SEQ ID Ν0:139, SEQ ID ΝΟ:141, SEQ ID ΝΟ:143, SEQ ID ΝΟ:145, SEQ ID Ν0:147, SEQ ID NO: 149, SEQ ID Ν0:151, SEQ ID Ν0:153, SEQ ID ΝΟ:155, SEQ ID NO: 157, SEQ ID Ν0:159, SEQ ID Ν0:161, SEQ ID ΝΟ:163, SEQ ID NO: 165, SEQ ID Ν0:167, SEQ ID ΝΟ:169, SEQ ID Ν0:171, SEQ ID Ν0:173, SEQ ID Ν0:175, SEQ ID Ν0:177, SEQ ID ΝΟ:179, SEQ ID Ν0:181, SEQ ID ΝΟ:183, SEQ ID ΝΟ:185, SEQ ID Ν0:187, SEQ ID Ν0:189, SEQ ID Ν0:191, SEQ ID Ν0:193, SEQ ID ΝΟ:195, SEQ ID Ν0:197, SEQ ID Ν0:199, SEQ ID Ν0:201, SEQ ID Ν0:203, SEQ ID Ν0:205, SEQ ID Ν0:207, SEQ ID Ν0:209, SEQ ID Ν0:211, SEQ ID ΝΟ:213, SEQ ID ΝΟ:215, SEQ ID ΝΟ:217, SEQ ID ΝΟ:219, SEQ ID ΝΟ:221, SEQ ID ΝΟ:223, SEQ ID ΝΟ:225, SEQ ID ΝΟ:227, SEQ ID ΝΟ:229, SEQ ID ΝΟ:231, SEQ ID ΝΟ:233, SEQ ID ΝΟ:235, SEQ ID ΝΟ:237, SEQ ID ΝΟ:239, SEQ ID ΝΟ:241, SEQ ID ΝΟ:243, SEQ ID ΝΟ:245, SEQ ID ΝΟ:247, SEQ ID ΝΟ:249, SEQ ID ΝΟ:251, SEQ ID ΝΟ:253, SEQ ID ΝΟ:255, SEQ ID ΝΟ:257, SEQ ID ΝΟ:259, SEQ ID ΝΟ:261, SEQ ID ΝΟ:263, SEQ ID ΝΟ:265, SEQ ID ΝΟ:267, SEQ ID ΝΟ:269, SEQ ID ΝΟ:271, SEQ ID ΝΟ:273, SEQ ID ΝΟ:275, SEQ ID ΝΟ:277, SEQ ID ΝΟ:279, SEQ ID ΝΟ:281, SEQ ID ΝΟ:283, SEQ ID ΝΟ:285, SEQ ID ΝΟ:287, SEQ ID ΝΟ:289, SEQ ID ΝΟ:291, SEQ ID ΝΟ:293, SEQ ID ΝΟ:295, SEQ ID ΝΟ:297, SEQ ID ΝΟ:299, SEQ ID Ν0:301, SEQ ID Ν0:303, SEQ ID Ν0:305, SEQ ID Ν0:307, SEQ ID Ν0:309, SEQ ID Ν0:311, SEQ ID ΝΟ:313, SEQ ID ΝΟ:315, SEQ IDΝΟ:317, SEQ ID ΝΟ:319, SEQ ID ΝΟ:321, SEQ ID ΝΟ:323, SEQ IDΝΟ:325, SEQ ID ΝΟ:327, SEQ ID ΝΟ:329, SEQ ID ΝΟ:331, SEQ IDΝΟ:333, SEQ ID ΝΟ:335, SEQ ID ΝΟ:336, SEQ ID ΝΟ:337 e SEQ IDΝΟ:338 podem ser úteis na facilitação de uma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
Em uma modalidade da invenção, um ou mais polipeptídeoscom atividade de HMG aldolase codificados por uma seqüência de ácidosnucléicos que se hibridiza sob condições rigorosas com um ácido nucléicodas SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ IDNO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27,SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ IDNO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55,SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ IDNO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83,SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ IDNO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID N0:101,SEQ ID NO: 103, SEQ ID N0:105, SEQ ID N0:107, SEQ ID N0:109, SEQ IDNO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ IDNO:119, SEQ ID NO: 121, SEQ ID NO:123, SEQ ID NO:125, SEQ IDNO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO: 133, SEQ IDNO:135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO:141, SEQ IDNO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ IDNO:151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO:157, SEQ IDNO:159, SEQ ID NO:161, SEQ ID NO: 163, SEQ ID NO:165, SEQ IDNO:167, SEQ ID NO:169, SEQ ID NO:171, SEQ ID NO: 173, SEQ IDNO:175, SEQ ID NO:177, SEQ ID NO:179, SEQ ID NO:181, SEQ IDNO: 183, SEQ ID NO:185, SEQ ID NO: 187, SEQ ID NO:189, SEQ IDNO:191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ IDNO:199, SEQ ID N0:201, SEQ ID N0:203, SEQ ID N0:205, SEQ IDN0:207, SEQ ID N0:209, SEQ ID NO:211, SEQ ID NO:213, SEQ IDNO:215, SEQ ID NO:217, SEQ ID NO:219, SEQ ID NO:221, SEQ IDNO:223, SEQ ID NO:225, SEQ ID NO:227, SEQ ID NO:229, SEQ IDNO:231, SEQ ID NO:233, SEQ ID NO:235, SEQ ID NO:237, SEQ IDNO:239, SEQ ID NO:241, SEQ ID NO:243, SEQ ID NO:245, SEQ IDNO:247, λ SEQ ID NO:249, SEQ ID NO:251, SEQ ID NO:253, SEQ IDNO:255, SEQ ID NO:257, SEQ ID NO:259, SEQ ID NO:261, SEQ IDNO:263, SEQ ID NO:265, SEQ ID NO:267, SEQ ID NO:269, SEQ IDNO:271, SEQ ID NO:273, SEQ ID NO:275, SEQ ID NO:277, SEQ IDNO:279, SEQ ID NO:281, SEQ ID NO:283, SEQ ID NO:285, SEQ IDNO:287, SEQ ID NO:289, SEQ ID NO:291, SEQ ID NO:293, SEQ IDNO:295, SEQ ID NO:297, SEQ ID NO:299, SEQ ID NQ:301, SEQ IDNQ:303, SEQ I ID NQ:305 podem ser úteis na facilitação da reação entre o indol-3-piruvato substituído e a fonte de carbono C3.
Em uma outra modalidade da invenção, um ou mais polipeptí-deos com atividade de KHG aldolase codificados por uma seqüência de áci-dos nucléicos que se hibridiza sob condições rigorosas com um ácido nu-cléico das SEQ ID N0:307, SEQ ID N0:309, SEQ ID NO:311, SEQ IDNO:313, SEQ ID NO:315, SEQ ID NO:317, SEQ ID NO:319, SEQ IDNO:321, SEQ ID NO:323, SEQ ID NO:325, SEQ ID NO:327, SEQ IDNO:329, SEQ ID NO:331, SEQ ID NO:333, SEQ ID NO:335, SEQ IDNO:336, SEQ ID NO:337 e SEQ ID NO:338 podem ser úteis na facilitação deuma reação entre um indol-3-piruvato substituído e uma fonte de carbono C3.
Em uma modalidade, o grupo substituinte do indol-3-piruvatosubstituído é um átomo de halogênio ligado a qualquer átomo de carbono doanel indol. Em uma outra modalidade, o grupo substituinte é um átomo decloro ligado a qualquer carbono do anel indol. Ainda em uma outra modali-dade, o derivado de monatina é o ácido 4-hidróxi-4-(6-metilindol-3-ilmetil)glutâmico.
Os polipeptídeos que possuem atividade de aldolase e de acor-do com algumas modalidades da invenção podem ser utilizados em umavide de várias etapas em que uma ou mais etapas é uma reação de síntesequímica. Por exemplo, em algumas modalidades, um ou mais polipeptídeosque possuem atividade de aldolase podem facilitar uma reação entre piruva-to e indol-3-piruvato para produzir um precursor de monatina. O precursor de
monatina pode ser então purificado. Uma reação de aminação redutora doprecursor de monatina pode então ser utilizada para produzir monatina.
Os polipeptídeos que possuem atividade de aldolase e de acor-do com algumas modalidades da invenção, assim como as outras enzimasutilizadas no processo para a produção de monatina e derivados de monati-10 na podem ser utilizadas na forma pura, bruta, isolada ou em suspensão emsulfato de amônio.
Os polipeptídeos que possuem atividade de aldolase e de acor-do com algumas modalidades da invenção, podem ser otimizados utilizandoagentes estabilizantes, incluindo ditiotreitol ("DTT") e β-mercaptoetanol.15 A monatina ou o derivado de monatina que é produzido utilizan-
do um ou mais dos polipeptídeos divulgados aqui, tem geralmente pelo me-nos aproximadamente 50 até aproximadamente 99% de R,R-monatina ou dederivado de R,R-monatina, em peso da monatina ou do derivado de monati-na total produzido. Em outras modalidades, a monatina ou o derivado de20 monatina produzido utilizando um ou mais dos polipeptídeos divulgados a-qui, tem mais de 60% de R,R-monatina ou de derivado de R,R-monatina, empeso da monatina total produzida; por exemplo, a R,R-monatina ou o deriva-do de R,R-monatina constitui 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%,94%, 95%, 96%, 97%, 98% ou 99% da monatina ou do derivado de monati-25 na total produzido. Alternativamente, várias quantidades de duas ou maispreparações de monatina ou de derivado de monatina podem ser combina-das de forma a resultar em uma preparação que tem uma porcentagem de-sejada de R,R-monatina ou de derivado de R,R-monatina. Por exemplo, umapreparação de monatina que tem 60% de R,R-monatina pode ser combinada30 com uma preparação de monatina que tem 90% de R,R-monatina; se quan-tidades equivalentes de €0% e 90% de preparações de R,R-monatina foremcombinadas, a preparação de monatina resultante teria 75% de R1R-monatina.
A monatina ou o derivado de monatina ou um intermediário (in-cluindo precursor de monatina), produzido utilizando um ou mais dos poli-peptídeos divulgados aqui, pode ser purificado partindo dos componentes dareação. Em uma modalidade, a monatina, o derivado de monatina ou o in-termediário, tal como o precursor de monatina, pode ser simplesmente puri-ficado através da remoção da substância que será purificada partindo dapreparação enzimática em que foi sintetizado.
Em outras modalidades, o intermediário, o precursor de monati-na, a monatina ou o derivado de monatina é purificado partindo de uma pre-paração em que foi sintetizado de forma que a composição ou a preparação"purificada" resultante tem pelo menos aproximadamente 5-60% de monati-na em peso dos compostos orgânicos totais. Em uma outra modalidade, amonatina, o derivado de monatina ou o intermediário, tal como o precursorde monatina, pode ser purificado até um grau de pureza de pelo menos a -proximadamente 70%, 80%, 90%, 95% ou 99% em peso dos compostos or-gânicos totais. A monatina, o derivado de monatina ou o intermediário (inclu-indo o precursor de monatina), produzido utilizando um ou mais dos polipep-tídeos divulgados aqui, pode ser. purificado dos componentes da reação a-través de qualquer método conhecido por um perito comum na técnica. Deforma ótima, a monatina ou o intermediário purificado pode ser recristalizadorepetidamente até que o grau desejado de pureza seja atingido.
Os exemplos a seguir são oferecidos para ilustrar, mas não paralimitar a invenção reivindicada.
EXEMPLOS
Exemplo 1
Detecção de Monatina, Precursor de Monatina, Triptofano, Alanina, Asparta-to e Glutamato
Este exemplo descreve métodos utilizados para detectar a pre-sença de monatina, precursor de monatina ("MP"), triptofano, aspartato, ala-nina e glutamato. Descreve também um método para a separação e para adetecção dos quatro estereoisômeros de monatina.Análise de Monitoramento de Reação Múltiplo ("MRM") com LC/MS/MS deMonatina e Triptofano
As análises de misturas em relação à monatina e ao triptofanoderivados de reações bioquímicas in vitro ou in vivo foram realizadas utili-5 zando um instrumento de espectrometria de massa em tandem com croma-tografia líquida (LC/MS/MS) Waters/Micromass incluindo um cromatógrafolíquido Waters 2795 com um monitor de absorbância Waters 996 Photo-Diode Array (PDA) colocado em série entre o cromatógrafo e um espectrô-metro de massa de quadrupolo triplo Micromass Quattro Ultima. As separa-10 ções por LC foram feitas utilizando uma coluna de cromatografia em faseinversa Xterra MS C8, 2,1 mm χ 250 mm a 40 °C. A fase móvel da LC consis-tia de A) água contendo (i) 0,05% (v/v) de ácido trifluoroacético ou (ii) 0,3%de ácido fórmico e 10 mM de formato de amônio e B) metanol contendo (i)0,05% (v/v) de ácido trifluoroacético ou (ii) 0,3% de ácido fórmico e 10 mM15 de formato de amônio.
Se a fase móvel da LC consistisse de A) água contendo 0,05%(v/v) de ácido trifluoroacético e B) metanol contendo 0,05% (v/v) de ácidotrifluoroacético, a eluição do gradiente era linear de 5% de B até 35% de B,0-4 minutos, linear de 35% de B até 60% de B, 4-6,5 minutos, linear de 60%20 de B até 90% de B, 6,5-7 minutos, isocrática a 90% de B 7-11 minutos, linearde 90% de B até 95% de B, 11-12 minutos, linear de 95% de B até 5% de B,12-13 minutos, com um período de reequilíbrio de 2 minutos entre as corri-das. A vazão era de 0,25 mL/min e a absorbância de PDA foi monitorada de200 nm até 400 nm. Todos os parâmetros da ESI-MS foram otimizados e25 selecionados com base na produção de íons moleculares protonados ([M +H]+) dos analitos de interesse e na produção de íons de fragmentos caracte-rísticos. Os parâmetros instrumentais a seguir foram utilizados para a análisede Monitoramento de Reação Múltiplo (MRM) com LC/MS/MS de monatina ede triptofano: Capilar: 3,5 kV; Cone: 40 V; Hex 1: 20 V; Abertura: 0 V; Hex 2:30 0 V; Temperatura da fonte: 100 °C; Temperatura de dessolvatação: 350 °C;Gás de dessolvatação: 500 L/h; Gás do cone: 50 L/h; Resolução baixa demassa (Q1): 12,0; Resolução alta de massa (Q1): 12,0; Energia iônica: 0,2;Entrada: -5 V; Energia de colisão: 8; Saída: 1V; Resolução baixa de massa(Q2): 15; Resolução alta de massa (Q2): 15; Energia iônica (Q2): 3,5; Multi-plicador: 650. Cinco transições de MRM de parental para filha específicas àmonatina são utilizadas para detectar especificamente a monatina em rea-5 ções in vitro e in vivo. As transições monitoradas são de 293,1 para 158,3,293,1 para 168,2, 293,1 para 211,2, 293,1 para 230,2 e 293,1 para 257,2. Otriptofano é monitorado com a transição de MRM de 204,7 para 146,4. Paraa quantificação do padrão interno de monatina e de triptofano, quatro pa-drões de calibração contendo quatro proporções diferentes de cada analito10 para d5-triptofano e para d5-monatina, são analisados. Estes dados sãosubmetidos a uma análise de mínimos quadrados linear para formar umacurva de calibração para monatina e triptofano. A cada amostra é adicionadauma quantidade fixa de d5-triptofano e de d5-monatina (a d5-monatina foisintetizada partindo de d5-triptofano de acordo com os métodos da15 W003/091396 A2) e as proporções de resposta (monatina/d5-monatina; trip-tofano/d5-triptofano) são utilizadas em associação com as curvas de calibra-ção descritas anteriormente para calcular a quantidade de cada analito nasmisturas.
Se a fase móvel da LC fosse A) água contendo 0,3% de ácido20 fórmico e 10 mM de formato de amônio e B) metanol contendo 0,3% de áci-do fórmico e 10 mM de formato de amônio, a eluição do gradiente era linearde 5% de B até 45% de B, 0-8,5 minutos, linear de 45% de B até 90% de B,8,5-9 minutos, isocrática de 90% de B até 90% de B, 9-12,5 minutos, linearde 95% de B até 5% de B, 12,5-13 minutos, com um período de reequilíbrio25 de 4 minutos entre as corridas. A vazão era de 0,27 mL/min e a absorbânciade PDA era monitorada de 210 nm até 400 nm. Todos os parâmetros daESI-MS foram otimizados e selecionados com base na produção de íonsmoleculares protonados ([M + H]+) dos analitos de interesse e na produçãode íons de fragmentos característicos. Os parâmetros instrumentais utiliza-30 dos para esta fase móvel secundária são os mesmos que os anteriores.Quatro transições de MRM de parental para filha específicas à monatina euma transição de parental para filha específica ao triptofano são utilizadaspara detectar especificamente a monatina e o triptofano em reações in vitroe in vivo. As transições monitoradas são de 293,1 para 158,0, 293,1 para168,0, 293,1 para 211,5 e 293,1 para 257,0. O triptofano é monitorado com atransição de MRM de 205,2 para 146,1. Para a quantificação do padrão in-5 terno de monatina e de triptofano, quatro padrões de calibração contendoquatro proporções diferentes de cada analito para d5-triptofano e d5-monatina, são analisados. Estes dados são submetidos a uma análise demínimos quadrados linear para formar uma curva de calibração para a mo-natina e o triptofano. A cada amostra é adicionada uma quantidade fixa de10 d5-triptofano e de d5-monatina (a d5-monatina foi sintetizada partindo de d5-triptofano de acordo com os métodos da W003/091396 A2) e as proporçõesde resposta (monatina/d5-monatina; triptofano/d5-triptofano) em associaçãocom as curvas de calibração descritas anteriormente são utilizadas para cal-cular a quantidade de cada analito nas misturas. As transições de massa15 parental para filha monitoradas para d5-triptofano e d5-monatina são de210,2 para 151,1 e 298,1 para 172,0, respectivamente.Medida de Massa Acurada de Monatina
A análise de MS de alta resolução foi realizada utilizando umespectrômetro de massa quadrupolo/tempo de vôo híbrido Applied Biosys-20 tems-Perkin Elmer Q-Star. A massa medida para a monatina protonada utili-zou o triptofano como um padrão de calibração de massa interna. A massacalculada da monatina protonada, baseada na composição elementarC14H17N205 é de 293.1137. A monatina produzida utilizando o processobiocatalítico descrito nos Exemplos 2 e 3 exibia uma massa medida de25 293,1144. Este é um erro de medida de massa menor que 2 partes por mi-lhão ("ppm"), fornecendo evidência conclusiva da composição elementar damonatina produzida enzimaticamente.Medida da Monatina por LC/MS/MS ("MRM") Quiral
A determinação da distribuição de estereoisômeros de monatina30 em reações in vitro e in vivo foi realizada através da derivatização com 1-fluoro-2-4-dinitrofenil-5-L-alanina amida ("FDAA"), seguida pela medida porLC/MS/MS MRM em fase inversa.Derivatização da Monatina com FDAA
A 50 μΙ_ de amostra ou de padrão e 10 μΙ_ de padrão interno fo-ram adicionados 100 μΙ_ ou 200 μΙ_ de uma solução a 1% de FDAA em ace-tona. Vinte ou quarenta μΙ_, respectivamente, de 1,0 M de bicarbonato desódio foram adicionados e a mistura foi incubada durante 1 h a 40 0C commistura ocasional. A amostra foi removida e resfriada e neutralizada com 20μΙ_ de 2,0 M de HCI (mais HCI pode ser requerido para realizar a neutraliza-ção de uma mistura biológica tamponada). Após a degaseificação ser com-pletada, as amostras estavam prontas para a análise através de LC/MS/MS.
Monitoramento de Reação Múltiplo com LC/MS/MS para a Determinação daDistribuição de Estereoisômeros de Monatina em Reações in vitro e in vivo
As análises foram realizadas utilizando o instrumento deLC/MS/MS descrito anteriormente. As separações por LC capazes de sepa-rar todos os quatro estereoisômeros de monatina (especificamente FDAA-monatina) foram realizadas em uma coluna de cromatografia em fase inver-sa Phenomenex Luna 2,0 χ 250 mm (3 μπι) C18 (2) a 40 0C. A fase móvel deLC consistia de A) água contendo 0,05% (massa/volume) de acetato de a-mônio e B) acetonitrila. A eluição era isocrática a 13% de B, 0-2 minutos,linear de 13% de B até 30% de B, 2-15 minutos, linear de 30% de B até 80%de B, 15-16 minutos, isocrática a 80% de B 16-21 minutos e linear de 80%de B até 13% de B, 21-22 minutos, com um período de reequilíbrio de 8 mi-nutos entre as corridas. A vazão era de 0,23 mL/min e a absorbância dePDA foi monitorada de 200 nm até 400 nm. Todos os parâmetros da ESI-MSforam otimizados e selecionados com base na produção de íons molecularesdesprotonados ([M - H]-) de FDAA-monatina e na produção de íons de frag-mentos característicos.
Os parâmetros instrumentais a seguir foram utilizados para aanálise de LC/MS de monatina no modo ESI/MS de íon negativo: Capilar:2,0 kV; Cone: 25 V; Hex 1: 10 V; Abertura: 0 V; Hex 2: 0 V; Temperatura dafonte: 100°C; Temperatura de dessolvatação: 350 °C; Gás de dessolvata-ção: 500 L/h; Gás do cone: 50 L/h; Resolução baixa de massa (Q1): 12,0;Resolução alta de massa (Q1): 12,0; Energia iônica: 0,2; Entrada: -5V; Ener-gia de colisão: 20; Saída: 1V; Resolução baixa de massa (Q2): 12; Resolu-ção alta de massa (Q2): 12; Energia iônica (Q2): 3.0; Multiplicador: 650. Trêstransições de parental para filha específicas a FDAA-monatina são utilizadaspara detectar especificamente FDAA-monatina em reações in vitro e in vivo.
5 As transições monitoradas para monatina são de 543,2 para 268,1, 543,2para 499,3 e 543,2 para 525,3. A transição de massa derivada do padrãointerno de monatina era de 548,2 para 530,3. A identificação de estereoisô-meros de FDAA-monatina se baseia no tempo de retenção cromatográficoquando comparado com o dos estereoisômeros de monatina sintéticos puri-10 ficados e dados de espectro de massa. Um padrão interno é utilizado paramonitorar o progresso da reação e para a confirmação do tempo de retençãodo estereoisômero S,S.
Detecção por Cromatoqrafia Líquida Pós-Fluorescência de Coluna de Ami-noácidos Incluindo Glutamato e Alanina15 A detecção por cromatografia líquida com pós-fluorescência de
coluna (LC/OPA) para a determinação de glutamato e alanina em reações invitro e in vivo foi realizada em um sistema Waters 2690 LC ou equivalentecombinado com um detector de fluorescência por varredura Waters 474 eum módulo de reação pós-coluna Waters. As análises semiquantitativas de20 monatina e triptofano foram também realizadas utilizando este método. Asseparações por LC foram realizadas em uma coluna de troca iônica carrega-da com Sódio de Interação a 60°C. A fase móvel A era tampão Pickering Na328 (Pickering Laboratories, Inc.; Mountain View, CA). A fase móvel B eratampão Pickering Na 740. A eluição do gradiente era de 0% de B até 100%25 de B, 0-20 minutos, isocrática a 100% de B, 20-36 minutos e linear de 100%de B até 0% de B, 36-37 minutos, com pelo menos um período de reequilí-brio de 5 minutos entre as corridas, dependendo da matriz da amostra. Avazão para a fase móvel era de 0,5 mL/min. A vazão para a solução de deri-vatização pós-coluna OPA era de 0,5 mL/min. Os ajustes do detector de flu-30 orescência eram EX 338-340 nm e Em 420-425 nm. A norleucina foi empre-gada como um padrão interno para a análise. A identificação de aminoácidosse baseava nos dados de tempo de retenção cromatográfico para padrõespurificados.
Detecção de L- e D-Aminoácidos por LC/MS/MS
As amostras contendo uma mistura de L- e D-aminoácidos taiscomo lisina, alanina, metionina, tirosina, leucina, fenilalanina, triptofano, glu-tamato e aspartato provenientes de experimentos de reação bioquímica fo-ram primeiramente tratadas com ácido fórmico para desnaturar a proteína. Aamostra foi então centrifugada e filtrada através de um filtro em seringa denáilon de 0,45 pm antes da análise de LC/MS/MS. A identificação de L- e D-aminoácidos se baseava no tempo de retenção e na detecção seletiva demassa. A separação por LC foi realizada utilizando o sistema de cromatogra-fia líquida Waters 2690 e uma coluna cromatográfica ASTEC 2,1 mm χ 250mm Chirobiotic TAG com a temperatura de coluna ajustada a 45°C. As fasesmóveis A e B de LC eram 0,25% de ácido acético e 0,25% de ácido acéticoem metanol, respectivamente. A eluição isocrática foi utilizada para todos osmétodos para separar os isômeros L e D. A lisina foi eluída utilizando 80%da fase móvel A e 20% da Β. O glutamato, a alanina e a metionina foramseparados com eluição de 60% da fase móvel A e 40% da B e uma vazão de0,25 mL/min. O aspartato, o triptofano, a tirosina, a leucina e a fenilalaninaforam separados de forma isomérica com 30% da fase móvel A e 70% da Bcom uma vazão de 0,3 mL/min para todos menos para a fenilalanina, que foicorrida a uma vazão de 0,25 mL/min.
O sistema de detecção para análise de L- e D-aminoácidos in-cluía um detector Waters 996 Photo-Diode Array (PDA) e um espectrômetrode massa quadrupolo triplo Micromass Quattro Ultima. O PDA, verificandode 195 até 350 nm, foi colocado em série entre o sistema de cromatografia eo espectrômetro de massa. Os parâmetros para o espectrômetro de massaquadrupolo triplo Micromass Quattro Ultima operando no modo de ionizaçãopor eletrospray positivo (+ESI) foram ajustados como a seguir: Capilar: 3,0kV; Cone: 20 V; Hex 1: 15 V; Abertura: 1 V; Hex 2: 0 V; Temperatura da fon-te: 100 °C; Temperatura de dessolvatação: 350 °C; Gás de dessolvatação:530 L/h; Gás do cone: 30 Uh; Resolução baixa de massa Q1: 12,5; Resolu-ção alta de massa Q1: 12,5; Energia iônica 1: 0,2; Entrada: -5; Colisão: 8;Saída 1:10; Resolução baixa de massa Q2: 12,5; Resolução alta de massaQ2: 12,5; Energia iônica 2: 0,5; Multiplicador: 650 V. Os experimentos deMS/MS com o modo de Monitoramento de Reação Múltiplo (MRM) foramajustados para monitorar seletivamente as transições de reação de 147,85 para 84,2 e 147,8 para 102,1 para o glutamato, 134,00 para 74,30 e 134,00para 88,2 para o aspartato, 147,3 para 85,0 para a lisina, 150,3 para 104,8para a metionina, 182,3 para 137,0 para a tirosina, 132,3 para 87,0 para aIeucina e 166,3 para 121,0 para a fenilalanina. N0 caso em que duas transi-ções são listadas, as últimas transições foram utilizadas para quantificação.10 Para o triptofano, os experimentos com MS/MS com modo de Monitoramen-to de Reação Múltiplo (MRM) foram ajustados para monitorar seletivamenteas transições de reação de 205,2 para 118,2, 205,2 para 146,1 e 205,2 para188,2 e a transição de 212,1 para 151,1 para d8-DL triptofano. A quantifica-ção do triptofano foi realizada através da determinação da proporção de res-15 posta de transição do analito de 205,2 para 146,1 em relação à do padrãointerno, d8-D,L triptofano. Alternativamente, a quantificação de triptofano,glutamato e ácido aspártico se baseavam nas respostas de sinal dem/z=146,5, m/z=102,1 e m/z=88,2, respectivamente.Produção de Monatina e de Precursor de Monatina ("MP") para Padrões e20 para Ensaios
Produção de Monatina
Uma mistura racêmica de R1R e S,S monatinas foi produzidasinteticamente como descrito na Patente U.S. N0 5.128.482.
As R,R e S,S monatinas foram separadas através de uma etapa25 de derivatização e hidrólise. Sucintamente, a mistura racêmica de monatinafoi esterificada, o grupo amino livre foi bloqueado com Cbz, uma Iactona foiformada e a S,S Iactona foi hidrolisada seletivamente utilizando uma enzimaprotease imobilizada. A monatina também pode ser separada como descritoem Bassoli, A. e outros, Eur. J. Org. Chem., 8:1652-1658, (2005).30 Produção de MP
O R-MP foi produzido através da transaminação de R,R monati-na utilizando a D-aminotransferase de faixa ampla AT-103 (BioCatalytics,Pasadena, CA) em 0,1 M de tampão de fosfato de potássio, utilizando piru-vato de sódio como o receptor de amino. O S-MP foi produzido através datransaminação de S1S monatina utilizando a L-aminotransferase AT-102 (Bi-oCatalytics, Pasadena, CA) em 0,1 M de tampão de fosfato de potássio, uti-lizando piruvato de sódio como o receptor de amino. Ambas as reações fo-ram realizadas a 30°C e em um pH de aproximadamente 8,0-8,3, duranteaproximadamente 20 horas. Ambos os compostos foram purificados utilizan-do HPLC em escala preparatória com uma resina hidrofóbica Rohm e Haas(Filadélfia, PA) (XADTM1600), eluindo em água. As amostras contendo maisde 90% de pureza de precursor de monatina foram coletadas e secas porcongelamento.
Exemplo 2
Detecção de Precursor de Monatina
Este exemplo descreve métodos utilizados para a separação epara a detecção dos dois enanciômeros de precursor de monatina.Método Não Quiral para a Detecção de Precursor de Monatina
As amostras de reação de placas de 96 cavidades foram injeta-das em uma coluna Agilent Zorbax RX-C18,3,5 pm, 3,0 χ 150 mm utilizandoum aparato de autoamostragem CTCPaI (LEAP Technologies, Carrboro,N.C.). Os produtos foram separados utilizando um gradiente de H20/ACN(0,1 % de Ácido fórmico):
Tempo: 0,00 min 5% de B
Tempo: 4,00 min 100% de B
Tempo: 5,00 min 100% de B
Tempo: 5,10 min 5% de B
Tempo: 6,50 min 5% de B
O gradiente foi forencido por bombas LC-1 OADvp (Shimadzu,Kyoto, Japão) a 0,8 mL/min. Os produtos foram detectados utilizando o es-pectrômetro de massa triplo-quad API4000 Turbolon-Spray (Applied Biosys-tems, Foster City, CA). O monitoramento por spray de íons e por vários íonsfoi realizado para os analitos de interesse no modo de íon negativo e cadaanálise durou 6,5 minutos.Piruvato = 87,1 [Μ - H+] -lndol-3-piruvato = 202,1 [Μ - H+] -Produto = 290,0 [Μ - H+] -
Análise Quiral CE de R & S Precursores de Monatina
Um instrumento de eletroforese capilar P/ACE® MDQ (BeckmanCoulter, Fullerton, CA) foi utilizado. O kit de Desenvolvimento Quiral foi utili-zado e inclui pequenas quantidades de vários seletores quirais, tampõesnecessários e 2 capilares (Beckman Coulter, Fullerton, CA). Alternativamen-te, apenas para o ensaio de MP, os reagentes a seguir e outros suprimentospodem ser obtidos separadamente na Beckman Coulter (Fullerton, CA) ouem outro fornecedor:
Capilar revestido N-CHO; 50 um IP. 65 cm de comprimento total ou capilarde sílica fundida.
25 mM de tampão de fosfato, pH 525 mg de hidroxipropil-p-ciclodextrina
Solução de condicionamento de capilar, 10 mL (alternativamen-te, pode utilizar solução de oxido de polietileno a 0,5%, Mw 600,000 ou300,000 Daltons)
Análise Por Eletroforese Capilar ("CE")
Um capilar revestido neutro, 50 um ID1 60 cm (50 cm para de-tecção) ou 30 (20) cm foi utilizado ao longo da detecção DAD (ou UV sim-ples) a 214 nm. O capilar de separação foi submetido a um termostato a15°C, as amostras a 4°C. O tampão de separação era 20 mM de hidroxipro-ρίΙ-β-ciclodextrina, 25 mM de fosfato, pH 5. A injeção da amostra era tipica-mente a 0,003 MPa (0,5 psi), 5 s. A separação era a 500 V/cm, polaridadeinvertida (15 kV para capilar de 30 cm, 30 kV para 60 cm). A corrente típicautilizada durante a separação era de -28 μΑ. Os tempos de migração típicospara os picos de MP eram em torno de 3,5 minutos (comprimento efetivo de20 cm) ou 8 minutos (50 cm).
Uma etapa de limpeza/lavagem/condicionamento de capilar op-cional, antes das corridas da amostra utilizava H2O 4 minutos, 0,1 M de HCI1 minuto, H2O 1,5 minuto, solução de condicionamento de capilar 4 minutos,H2O, 1 minuto, tampão de separação 4 minutos.
Um resumo do método de corrida era: lavagem com tampão deseparação 1-2 minutos, injeção da amostra 5 s a 0,003 MPa (0,5 psi), sepa-ração 5-10 minutos em polaridade com voltagem invertida 15 ou 30 kV, de-pendendo do comprimento do capilar.
Exemplo 3
Ensaio Geral para Piruvato Aldolases
Um exemplo de método para medir a atividade de piruvato aldo-Iases diferentes utiliza um substrato geral, 4-Carbóxi-4-hidróxi-2-oxoadipato(CHA). O ensaio de CHA foi adaptado partindo de ensaios na literatura (porexemplo, vide E.E. Dekker & R.P. Kitson, J. Biol. Chem. 267, 10507-10514,1992). Um ensaio típico compreendia 50 mM de fosfato de sódio pH 7,5, 1mM de MgCI2, 1 mM de CHA, 10 pg/mL de D-Iactato desidrogenase (LDH)de Lactobacillus Ieichmanii (Sigma-AIdrich, St. Louis, MO), 0,5 mM de NA-DH. O ensaio foi iniciado adicionando enzima (tipicamente entre 1 até 5 μΙ_).
A liberação de piruvato, acoplada com a formação de NAD+ foi monitoradacontinuamente em um espectrofotômetro a 340nm.
O CHA foi sintetizado de acordo com o procedimento descritoem Tack, B.F. Chapman, P.J. e S. Dagley. J. Biol. Chem. 247 6438-6443(1972).
Uma unidade de atividade enzimática, tal como de enzima piru-vato aldolase, tal como HMG e/ou KHG aldolase, é definida como a quanti-dade que libera piruvato suficiente para diminuir a absorbância a 340nm em1 DO por minuto.
Exemplo 4
Descoberta de Novas Ceto-hidróxi-glutarato (KHG) e Hidróxi-metil-ceto-alutarato (HMG) aldolases partindo de bibliotecas ambientais Diversa
Mais de 150 HMG aldolases e de 15 KHG aldolases exclusivasforam descobertas através da verificação de bibliotecas de DNA Diversa.
Estes genes de aldolase foram seqüenciados e subclonados em um vetor deexpressão adequado. Este vetor foi então transformado em um hospedeirode expressão adequado para a produção de quantidades suficientes da al-dolase para caracterização das enzimas. Um conjunto selecionado de aldo-Iases foi testado em relação à atividade sobre CHA e também em relação àformação de precursor de monatina (MP). Todas as enzimas descobertas edescritas nesta patente possuem o potencial para uso em outras reações deformação de ligações carbono-carbono entre um receptor alfa-ceto ácido epiruvato ou doador de derivado de piruvato como exemplificado no esquemade reação geral abaixo.
A-ceto ácido,receptor decetona ou dealdeído
piruvato ouderivado depiruvato
R = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída
10 R2 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída
R3 = H, alquila, alquila substituída, arila, arila substituída, benzila, benzilasubstituída, ácido carboxílico.Exemplo 5
15 Caracterização de Aldolases Selecionadas
As aldolases selecionadas foram caracterizadas em relação asua capacidade de catalisar a conversão de indol-3-piruvato e piruvato noprecursor de monatina (MP) como mostrado no esquema a seguir:
—OH
AldoIase
COOH
Λ °'A
HOOC
Piruvato
R-MP
S-MP
20 As figuras 13 e 14 mostram as atividades de 58 aldolases dife-
rentes na formação de MP que é medida por LC/MS/MS.
As reações de aldol foram realizadas com 20 mM de indol-3-piruvato ("I3P"), 50 mM de piruvato, 100 mM de fosfato de sódio pH 7, 1 mMde MgCfe1 100 pg/mL de aldolase. As reações foram incubadas à temperatu-ra ambiente na escuridão. As alíquotas (30 μ!_) foram removidas em váriostempos e as reações foram interrompidas armazenando as amostras emgelo. Uma parte de cada alíquota foi submetida à análise de CE, enquanto aparte restante foi diluída 1:1000 em 50% de acetonitrila e submetida à análi-se de LC/MS.
Tabela 2: Enanciosseletividade de aldolases diferentes para a formação deMP partindo de I3P e piruvato como determinado por CE quiral
<table>table see original document page 335</column></row><table><table>table see original document page 336</column></row><table><table>table see original document page 337</column></row><table><table>table see original document page 338</column></row><table>
Observar que as seletividades para R-MP de 98+% indicam quenenhum S-MP foi detectado. Dada a sensibilidade do ensaio de CE, os re-sultados indicam que pelo menos 98% de MP formados é o R-enanciômero.Assim, as enzimas que são listadas como 98+% são pelo menos 98% seleti-vas em direção a R-MP e podem ser até 100% seletivas.
A Tabela 2 mostra ainda a atividade das enzimas sobre umsubstrato de aldolase geral, CHA, assim como a expressão relativa de cadaenzima, como determinado por SDS-PAGE. Observar que várias enzimasnão exibiam atividade detectável sobre CHA e ainda exibiam atividade naprodução de MP.
Em resumo, as aldolases exibem uma faixa ampla de atividades,expressão e seletividades. Além disso, há várias aldolases que exibem sele-tividades extraordinariamente altas (98% ou mais) em relação a R-MP.
Exemplo 6
Descoberta de piruvato aldolases vegetais
Os iniciadores da PCR degenerados (vide abaixo) foram plane-jados e utilizados para extrair genes da aldolase de cDNA preparado partin-do de Sclerochiton ilicifolius. As extremidades a 5' e a 3' dos genes foramrecuperadas e os genes de comprimento completo foram então amplificadospela PCR.
SEQ ID NO: Nome do Iniciador Iniciador
335 F1 AARGTBTWYGARGACAATG (SEQIDNO:335)
336 F2 GCDCAGAWCAAYGGRTGG (SEQ IDNO:336)<table>table see original document page 339</column></row><table>
Exemplo 7
Clonagem da D-aminoácido aminotransferase de Bacillus sphaericus
A D-aminoácido aminotransferase (EC 2,6.1.21, também conhe-cida como D-alanina aminotransferase ou D-aspartato aminotransferase) deB. sphaericus foi produzida de forma recombinante para uso em ensaios a -copiados com as várias aldolases. Esta enzima é homóloga às D-aminotransferases descritas anteriormente para a produção de monatina(Publicação U.S. N0 20040063175 e Publicação U.S. N0 20050282260).Cepas
B. sphaericus (ATCC número 10208) foi cultivado em Nutrient Ágar a 30°Cdurante a noite. Os grupos de colônias foram colocados em 100 μΙ_ de águaesterilizada e aquecidos durante 5 minutos a 95°C, para romper as células.Três μΙ_ foram utilizados nas amplificações subseqüentes através da Reaçãoem Cadeia da Polimerase (PCR).
Protocolo da Reação em Cadeia da Polimerase
Os iniciadores foram planejados para a clonagem em vetorespET 28b e pET 30a (Novagen, Madison1 Wl), utilizando os sítios Ncol e Ba-mHI. A constructo pET 30 contém His-tag e S-tag N-terminal, enquanto queo constructo pET 28 não é marcada.
Iniciadores para dat de Bacillus Sphaericus:
N term: 5'-GATATACCATGGCATACTCATTATGGAATG-3' (SEQ ID NO:383)e C term: Sl-GTTATCGGATCCTTAGGCAirTAATTGAAATTG-Sl (SEQ IDNO:384).
A região codificadora foi amplificada utilizando o protocolo dePCR a seguir. Em uma reação de 50 μΙ_, 3 μΙ_ de molde, 1,6 μΜ de cada ini-ciador, 0,25 mM de cada dNTP, 3,5 U de Expand High Fidelity Polymerase(Roche, Indianapolis, IN) e tampão 1X Expand® com Mg foram utilizados. Oprograma do termociclador utilizado incluía um início a quente a 94°C duran-te 3 minutos, seguidos por 8 repetições das etapas a seguir: 94°C durante30 segundos, 52°C durante 30 segundos e 72°C durante 2 minutos. Vinte edois ciclos subseqüentes foram feitos com uma temperatura de anelamentode 58°C. Após 30 ciclos, a amostra foi mantida a 72°C durante 7 minutos eentão armazenada a 4°C. Foram obtidos produtos da PCR limpos do tama-nho correto (aproximadamente 850 pb para o gene daf).
Clonagem
Os produtos da PCR foram purificados utilizando o kit de purifi-cação Qiagen QIAquick PCR (Qiagen, Valencia, CA) e digeridos com BamHIe Ncol em tampão de BamHI (New England Biolabs, Ipswich, MA).
O vetor e os insertos digeridos foram purificados utilizando o Qi-agen QIAquick Gel Extraction Kit (Qiagen, Valencia, CA). As ligações foramfeitas utilizando o Roche Rapid DNA Ligation Kit (Roche, Indianapolis1 IN) epurificadas utilizando o kit de purificação QIAquick PCR (Qiagen, Valencia,CA). As ligações foram transformadas em Escherichia coli DH10B utilizandouma cubeta de 0,2 cm e um sistema Bio-Rad Gene Pulser Il como descritono manual de eletroporação da Bio-Rad (Bio-Rad, Hercules, CA). Foi permi-tido que as células se recuperassem em 900 μΙ_ de meio SOC durante30 minutos a 37°C a 225 rpm. As células foram plaqueadas em placas deLB-ágar contendo canamicina (25 pg/mL).
O DNA plasmideal foi purificado utilizando o Qiagen spin mini-prep kit (Qiagen, Valencia, CA) e verificado em relação aos insertos corretosatravés da digestão de restrição com BamHI e Ncol. As seqüências dosplasmídeos que pareciam ter o inserto correto foram verificadas através doseqüencia de DNA com terminação de cadeia didesóxi na Agencourt BioSci-ence Corporation (Beverly, MA). O seqüenciamento verificou a seqüênciacodificadora encontrada no NCBI número de acesso AF081278 Região:134..985 (gi: 3513754), que produz uma proteína com seqüência de aminoá-cidos que é listada no número de acesso AAC33964 (gi: 3513755).
Expressão Gênica e Ensaios
O DNA plasmideal foi subclonado no hospedeiro de expressãoE. coli BL21{DE3) (Novagen, Madison, Wl). As culturas foram crescidas e osplasmídeos foram isolados utilizando o Qiagen miniprep kit (Qiagen1 Valen-cia, CA) e analisados através da digestão de restrição para confirmar a iden-tidade. A indução foi tipicamente realizada em meio LB contendo canamicina(50 pg/mL). As células foram cultivadas até uma D06oo de 0,4-0,8, induzidascom 0,1 mM de IPTG (isopropil tiogalactosídeo) e foram tiradas amostras 4horas após a indução. Os extratos celulares foram preparados de acordocom o protocolo que acompanha o reagente Novagen BugBuster® (Novagen,Madison, Wl) (com benzonase nuclease e o coquetel de inibidor de proteasecompleto da Roche adicionados (Roche, lndianapolis, IN)). Níveis muito al-tos de proteína solúvel foram obtidos no peso molecular previsto, que é jul-gado por SDS-PAGE. Para algumas reações, o produto do gene pET 30 foipurificado utilizando cartuchos de His-Bind seguindo os protocolos do fabri-cante (Novagen, Madison, Wl). As frações do eluente foram dessalinizadasem colunas PD-10 (GE Healthcare, Piscataway, NJ) e eluídas em 25-100mM de tampão de fosfato de potássio, pH 7.5.
Os extratos de células foram analisados em relação à atividadede D-aminotransferase seguindo a produção de alanina partindo de piruvatoe D-triptofano utilizando o protocolo a seguir. Reações de um ml_ foram tipi-camente realizadas em 100 mM de tampão de fosfato de potássio (pH 7,5),50 μΜ de fosfato piridoxal, 25 mM de piruvato de sódio e 50 mM de D-triptofano. As reações foram iniciadas através da adição de extratos isentosde células ou enzima purificada e incubadas 15 minutos durante a noite a30°C, com agitação suave. O ácido fórmico foi adicionado em uma concen-tração final de dois por cento para interromper a reação e a proteína precipi-tada foi removida por centrifugação. Reações de controle sem proteína adi-cionada foram também realizadas. Pontos no tempo zero também foram uti-lizados como controles negativos. A alanina foi detectada utilizando a deriva-tização OPA que é descrita no Exemplo 1.
Exemplo 8
Comparação da produção de monatina total e distribuição de isômeros paraos polipeptídeos com atividade de aldolase das SEQ ID NO:8, SEQ ID NO:4.
SEQ ID NO:12 e SEQ ID NO:28 e ProA de C. testosteroniA AT-103 transaminase (uma D-aminotransferase de especifici-dade ampla) foi obtida na BioCataIytics (Pasadena, CA) esta enzima ou aenzima recombinante produzida no Exemplo 7 foi utilizada nas reações aco-pladas com HMG aldolases para produzir monatina partindo de D-triptofanoe piruvato como descrito no Pedido de Patente U.S. Publicado N020050282260. A ProA aldolase de C. testosteroni foi utilizada como uma al-dolase de referência com a finalidade de comparação e foi preparada descri-to no Pedido de Patente U.S. Publicado N0 20040063175 e na WO03091396 A2. As aldolases testadas foram isoladas e transformadas comodescrito anteriormente no Exemplo 4.
Para produzir quantidades de teste de cada aldolase, culturas de50 mL foram crescidas em meio LB contendo ampicilina (100 pg/mL), atéuma DO600 de aproximadamente 0,5. As cepas contendo os constructos dasSEQ ID NO:7, SEQ ID NO:3 e SEQ ID NO:11 foram iduzidas com 100 μΜ de15 IPTG. A cepa contendo o constructo de SEQ ID NO:27 foi induzida com 200pg/L de anhidrotetraciclina. As células foram cultivadas 5 horas após a indu-ção e os extratos celulares foram preparados de acordo com os protocolosdo fabricante (Novagen, Madison, Wl, reagente Bugbuster). A benzonuclea-seeo inibidor de protease também foram adicionados. As proteínas solúveis20 nos extratos celulares foram separadas em uma Bio-Rad Laboratories Expe-rion Automated Electrophoresis Station (Bio-Rad, Hercules, CA) e analisadasem relação à concentração e à expressão percentual utilizando o ExperionSoftware versão 1.1.98.0.
Os seguintes foram adicionados por 1 mL de mistura de reação:25 aproximadamente 50 pg de aldolase (fornecida em extratos celulares a nãoser que seja citado de outra maneira), 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase purificada de B. sphaericus, 200mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e0,05 mM de PLP. Os experimentos foram realizados em duplicata, com con-30 troles negativos em que não era adicionada aldolase. As amostras foramincubadas 1 h, 2 h e durante a noite (17-20 horas) a 30°C com agitação sua-ve. Pequenas quantidades de monatina (< 0,5 ppm) são produzidas semaldolase em reações durante a noite, devido às reações não enzimáticascatalisadas por magnésio e fosfato. Tais valores foram subtraídos dos núme-ros mostrados abaixo e os resultados médios são mostrados. Os únicos es-tereoisômeros detectados quando a monatina era produzida utilizando estesmétodos são R,R e S,R. A porcentagem de R1R é listada abaixo e foi deter-minada através da área do pico de LC em fase inversa.
Tabela 3: Monatina total produzida partindo de D-triptofano e % de R,R
<table>table see original document page 343</column></row><table>
A amostra de SEQ ID NO: 28 de 18 horas também foi analisadaem relação à distribuição estereoisomérica através do método de derivatiza-ção com FDAA listado no Exemplo 1, que forneceu um resultado de 94,9%de R,R e 5,1% de S1R monatina.
Os mesmos experimentos foram feitos, lado a lado, utilizando L-triptofano como o substrato de partida e acoplando as aldolases com a L-aminotransferase de especificidade ampla HexAspC produzida como descri-to no Pedido de Patente U.S. Publicado N0 20050282260 e purificada. Estasreações forneceriam primariamente S,S monatina e R,S monatina. As rea-ções também foram suplementadas com 10 mM de alfa-cetoglutarato comoo receptor de amino para a transaminação de L-triptofano. Novamente, foicalculada abaixo a média dos resultados em duplicata para a monatina total(subtraído os níveis de fundo sem aldolase presente) e a porcentagem deS,S monatina é mostrada com base na área do pico de LC em fase inversa.Em alguns casos, devido ao fato de que as aldolases são bastante específi-cas a R e produzem pouca monatina total, as estimativas em fase inversa dadistribuição estereoisomérica são menos acuradas por causa de algum resí-5 duo do pico de triptofano que pode ser co-eluído com o pico de S,S/R,R mo-natina. As tendências são ainda informativas na comparação da especifici-dade a R das aldolases. Os resultados da análise adicional utilizando o mé-todo de derivatização com FDAA são mostrados entre parênteses para vá-rias amostras e são mais acurados. Os números de monatina total acima de10 aproximadamente 400 ppm são maiores que a faixa linear da escala dospadrões utilizados para quantificar os resultados, assim são resultados quali-tativos. A ProA aldolase de C. testosteroni produz tipicamente 95-100% deS,S monatina, como mostrado no Pedido de Patente U.S. Publicado N020050282260.
Tabela 4: Monatina total produzida partindo de L-triptofano e % de S,S
<table>table see original document page 344</column></row><table>
Pode ser observado que a especificidade a R do polipeptídeocom atividade de aldolase da SEQ ID NO: 28 é bastante alta comparadacom a enzima ProA de referência, isto é também refletido na baixa % de S,Smonatina produzida, apesar do alto grau de especificidade da HexAspC a-minotransferase por S-MP nestas reações. Os números de monatina total,quando comparados com a produção de S,S monatina versus a produção deR,R monatina, não são indicativos da atividade de aldolase. A D-aminotransferase é menos ativa que HexAspC, particularmente nas concen-trações de MP que estão presentes nestas reações.
Para a comparação adicional do polipeptídeo com atividade dealdolase da SEQ ID NO: 28 com a enzima ProA de C. testosteroni, propor-ções variáveis de D-aminotransferase em relação à aldolase foram utilizadasem reações partindo de D-triptofano (sem amostras em duplicata para estesexperimentos). As reações foram realizadas como anteriormente. Para asreações em que a concentração de aldolase foi mantida constante, foramutilizados aproximadamente 50 pg. Para as reações em que a D-aminotransferase foi mantida constante, foi utilizado 0,5 mg. Para as concen-trações de 2 e 10 mg/mL de D-aminotransferase, foi utilizada a enzima Iiofili-zada. Para as 2 concentrações mais altas de D-aminotransferase, foram cor-ridas duplicatas.
Tabela 5: Efeito da concentração de D-aminotransferase sobre a produçãode R1R monatina
<table>table see original document page 345</column></row><table><table>table see original document page 346</column></row><table>
Para os níveis de monatina acima de 400 ppm, os resultadosnão estão na faixa linear da curva padrão e são apenas valores aproxima-dos. A quantidade máxima de R1R monatina produzida, quando diluída apro-priadamente, era de 1100 ppm. A análise estereoisomérica com FDAA foifeita para o polipeptídeo com atividade de aldolase da SEQ ID NO: 28 comamostras a 10 mg/mL de D-aminotransferase. Em duas horas, a amostracontinha 98,5% de R,R monatina. Em 17 horas, a amostra continha 95,9%de R,R monatina. O polipeptídeo com atividade de aldolase da SEQ ID NO:28 produziu altas porcentagens de R,R monatina, mesmo após tempos deincubação longos e utilizando grandes quantidades de aminotransferase. Sea D-aminotransferase adequada for fornecida, o polipeptídeo com atividadede aldolase da SEQ ID NO: 28 produz tanta monatina total quanto a ProAaldolase de C. testosteroni, indicando uma atividade específica similar.Tabela 6: Efeito da concentração de aldolase sobre a produção de R,R mo-natina
<table>table see original document page 347</column></row><table><table>table see original document page 348</column></row><table>
Quando a concentração de aldolase é variada, não ocorre muitoaumento na monatina total. A porcentagem de R1R diminui com o tempo etambém com a concentração de aldolase, particularmente quando a D-aminotransferase é limitante.
Para verificar adicionalmente a especificidade a R das aldolasestestadas, os experimentos foram feitos partindo de L-triptofano e HexAspCaminotransferase, que foi produzida e purificada como descrito no Pedido dePatente U.S. Publicado N0 20050282260. A HexAspC exibe uma forte seleti-vidade para a transaminação de S-MP versus R-MP, assim as porcentagensacima de 50% de R,S monatina indicam uma aldolase altamente estereoes-pecífica. Dez mM de alfa-cetoglutarato foram fornecidos como um receptorde amino; entretanto, em altas concentrações, o piruvato também é utilizadopela L-aminotransferase. Nestas reações, tipicamente apenas S,S e R,Smonatinas são produzidas dentro dos limites de detecção do protocolo dederivatização com FDAA.Tabela 7: Efeito da concentração de L-aminotransferase sobre a produçãode S,S monatina
<table>table see original document page 349</column></row><table>Tabela 8: Efeito da concentração de aldolase sobre a produção de S1S mo·natina
<table>table see original document page 350</column></row><table>
Para as aldolases que são altamente específicas a R, tal como opolipeptídeo com atividade de aldolase da SEQ ID NO: 28, menos monatinatotal é produzida e o aumento da quantidade de aldolase aumenta a monati-na total (assim como a % de S1S). Estas aldolases produzem menos subs-trato de S-MP, o substrato preferido para a L-aminotransferase utilizado. Pa-ra as enzimas que são menos específicas a R1 tal como ProA1 o aumento dealdolase não aumenta significativamente a produção de monatina total ou a% de S,S monatina. O aumento da quantidade de L-aminotransferase adi-cionada diminui as porcentagens de S,S monatina produzida. Com base naanálise acima, o polipeptídeo com atividade de aldolase da SEQ ID NO: 8fica entre ProA e o polipeptídeo com atividade de aldolase da SEQ ID NO:28 em termos de especificidade a R1 o que concorda com os dados anterio-res em que a % de R-MP é medida apenas para a etapa de aldol.Subclonaaem da SEQ ID NO: 27
Os iniciadores a seguir foram utilizados para amplificar atravésda PCR o gene da aldolase: 5'-gaggagctcgagtcagacgtatttcagtcctttttc-3' (SEQID NO: 385) e 5'-agaagacatatgatttatcagccggggac-3' (SEQ ID NO: 386). Ogene da aldolase da SEQ ID NO: 27 codifica o polipeptídeo com atividade dealdolase da SEQ ID NO: 28. O produto da PCR resultante foi digerido comXho\ e NdeI para cortar nos sítios que foram engenheirados dentro dos inici-adores. O fragmento foi purificado em gel (QIAquick Gel extraction Kit (Qia-gen, Valencia, CA)) e ligado (utilizando T4 DNA ligase) com pET28b que foidigerido com Xho\ e NdeI e purificado em gel. A ligação foi transformada emcélulas quimicamente competentes de TOPIOF'. As colônias cultivadas nasplacas foram verificadas em relação aos insertos e vários isolados com in-sertos foram submetidos à análise de seqüência de DNA (Agencourt, Bever-ly, MA).
Purificação do Polipeptídeo com Atividade de Aldolase da SEQ ID NO: 28
Os clones de aldolase confirmados foram transformados emBL21 DE3 ou BL21 DE3 pLysS. As culturas crescidas durante a noite com oantibiótico apropriado foram diluídas em meio fresco (tipicamente 1:100) ecrescidas até uma D06oo -0,6 com aeração a 37°C. As culturas foram entãoinduzidas com 1 mM de IPTG e transferidas para 30°C (com aeração) e aincubação foi mantida durante a noite. As células foram coletadas por centri-fugação. O pélete de células foi submetido tipicamente a um ciclo de conge-lamento descongelamento para ajudar na Iise celular. O pélete de células foiIisado em BugBuster e Benzonase (Novagen, Madison1 Wl) (de acordo como protocolo do fabricante). Os restos celulares foram removidos por centrifu-gação. O extrato de proteína bruto foi aplicado em uma coluna HisBind (No-vagen, Madison, Wl) que foi preparada de acordo com o protocolo do fabri-cante. A coluna foi lavada e a proteína foi eluída de acordo com o protocolodo fabricante. A proteína purificada foi dessalinizada com colunas PD-10(GE Healthcare, Piscataway1 NJ). O tampão utilizado para a troca foi 50 mMde fosfato de potássio pH 7,5, 100 mM de NaCI, 4 mM de MgCfe. A proteínapurificada foi concentrada com agentes de concentração por centrifugaçãoAmicon (Millipore, Billerica, MA).Exemplo 9
Comparação da produção de monatina total e da distribuição deisômeros para polipeptídeos com atividade de aldolase das SEQ ID N0:40,SEQ ID NO:298, SEQ ID NO:36, SEQ ID NO:62, SEQ ID NO:64, SEQ IDNO:96, SEQ ID NO:54, SEQ ID NO:122, SEQ ID NO:142, SEQ ID NO:42,SEQ ID NO: 130, SEQ ID NO:112, SEQ ID N0:108, SEQ ID NO:94, SEQ IDN0:80 e SEQ ID NO:28
A transaminase AT-103 (uma D-aminotransferase de especifici-dade ampla) foi obtida na BioCataIytics (Pasadena, CA) e esta enzima ou aenzima recombinante produzida no Exemplo 7 foi utilizada nas reações aco-pladas com HMG aldolases para produzir monatina partindo de D-triptofanoe piruvato como descrito no Pedido de Patente U.S. Publicado N020050282260. O polipeptídeo com atividade de aldolase da SEQ ID NO: 28(marcado com his (his-tagged)) foi utilizado como uma aldolase de referênciacom finalidades de comparação e foi produzido e purificado como descritono final do Exemplo 8. As outras aldolases testadas foram isoladas e trans-formadas como descrito anteriormente no Exemplo 4.
Para produzir quantidades de teste de cada aldolase, culturas de25 mL foram crescidas em meio LB contendo ampicilina (100 pg/mL), atéuma DO6OO de aproximadamente 0,4. As cepas foram induzidas com 100 μΜde IPTG. As células foram cultivadas 4 horas após a indução e os extratoscelulares foram preparados de acordo com os protocolos do fabricante (No-vagen, Madison, Wl1 reagente Bugbuster) com benzonuclease. As proteínassolúveis nos extratos celulares foram separadas em uma Bio-Rad Laborato-ries Experion Automated Electrophoresis Station (Bio-Rad, Hercules, CA) eanalisadas em relação à concentração e à porcentagem de expressão utili-zando o Experion Software versão 1.1.98.0.
Os seguintes foram adicionados por 1 mL de mistura de reação:aproximadamente 50 pg de aldolase (fornecida nos extratos celulares a nãoser que seja citado de outra maneira), 4 mM de MgCfe, 50 mg/mL de D-triptofano, 2 mg de AT-103 (BioCatalytics, Pasadena, CA), 200 mM de piru-vato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e 0,05 mMde PLP. O D-triptofano não é solúvel a esta concentração maior, mas foi uti-lizado para garantir que as reações eram mantidas nas quantidades de satu-ração de D-triptofano. Os experimentos foram rodados em duplicata, comcontroles negativos em que não foi adicionada aldolase. As amostras foramincubadas 2 h e durante a noite (17-20 horas) a 30°C com agitação suave.Pequenas quantidades de monatina são produzidas durante a noite sem al-dolase (-0,5 ppm), devido às reações não enzimáticas catalisadas por mag-nésio e fosfato. Os valores típicos para a % de R1R monatina são de 50%para estas amostras. Os valores de controle negativo foram subtraídos dosnúmeros mostrados abaixo e são mostrados os resultados médios. Os úni-cos estereoisômeros detectados quando a monatina é produzida utilizandoestes métodos são R1R e S,R. A porcentagem de R,R é listada abaixo e foideterminada através da área do pico de LC em fase inversa. O mesmo expe-rimento foi realizado após o aramazenamento dos extratos celulares e dopolipeptídeo purificado com atividade de aldolase da SEQ ID NO: 28 durante2 meses a -20°C, neste momento 50 mM de D-triptofano foram utilizadoscomo no Exemplo 8. O dobro da quantidade de aldolase foi adicionada coma exceção do polipeptídeo com atividade de aldolase da SEQ ID NO: 28,'para o qual foram utilizados novamente aproximadamente 50 pg. Estes re-sultados são mostrados à direita da Tabela 9. Os resultados da derivatizaçãocom FDAA para a distribuição dos isômeros são mostrados entre parênte-ses.
Tabela 9: Monatina total produzida partindo de D-triptofano e % de R1R
<table>table see original document page 354</column></row><table><table>table see original document page 355</column></row><table>
Pode ser observado que certas enzimas são mais estáveis aoarmazenamento que outras aldolases, com base nas proporções de ativida-de. Um produto secundário, mais provavelmente glutamato de 4-hidróxi-4-metila também pode ser formado durante estas reações. As enzimas anterio-res foram classificadas em relação a sua especificidade para a produção demonatina através da comparação das áreas de pico destas versus do sub-produto. Os resultados eram o polipeptídeo com atividade de aldolase dasSEQ ID NO: 122 > SEQ ID NO:42 > SEQ ID N0:80 > SEQ ID N0:108 > SEQID NO:96 > SEQ ID NO:112 > SEQ ID N0:130 > SEQ ID NO:36 > SEQ IDNO:94 > SEQ ID NO:298 > SEQ ID N0:40 > SEQ ID NO:142 > SEQ IDNO:54 > SEQ ID NO:64 > SEQ ID NO:28 > SEQ ID NO:62.
Com base nos experimentos iniciais, os polipeptídeos com ativi-dade de aldolase das SEQ ID NO:298, SEQ ID NO:54 e SEQ ID NO:42 pa-reciam os mais promissores em termos de nível de atividade e da % de R1Rmonatina produzida. Estas enzimas foram subclonadas em vetores de ex-pressão pET com e sem marcações de his.
Clonagem das SEQ ID NO:297, SEQ ID NO:53 e SEQ ID N0:41.
Iniciadores utilizados para a clonagem:
Tabela 10
<table>table see original document page 356</column></row><table>
As SEQ ID NO:297, SEQ ID NO:53 e SEQ ID NO:41 foram am-plificadas através da PCR e digeridas com enzimas apropriadas (Λ/del eSamHI para os produtos da PCR contendo a SEQ ID NO:297 e a SEQ IDNO:53, /Vcol e BamHl para os produtos da PCR contendo a SEQ ID N0:41)e purificadas em gel (QIAquick Gel extraction Kit (Qiagen, Valencia, CA)). ASEQ ID NO:297 e a SEQ ID NO:53 foram ligadas individualmente em pET28que foi digerido com NdeI e BamHl e purificado em gel. A SEQ ID N0:41 foiligada em pET30 que foi digerido com Ncol e BamHl e purificado em gel. Aligação foi transformada em TOPIO. As colônias foram verificadas em rela-ção aos insertos. Os isolados com um inserto foram submetidos à análise deseqüência de DNA (Agencourt, Beverly, MA).
Purificação de Aldolases
Os clones de aldolase confirmados foram transformados emBL21 DE3 ou BL21 DE3 pLysS. As culturas crescidas durante a noite com oantibiótico apropriado foram diluídas em meio fresco (tipicamente 1:100) ecrescidas até uma DOeoo -0,6 com aeração a 37°C. As culturas foram entãoincubadas com 1 mM de IPTG e transferidas para 30°C (com aeração) e aincubação foi continuada durante a noite. As células foram coletadas porcentrifugação. O pélete de células foi submetido tipicamente a um ciclo decongelamento descongelamento para ajudar na Iise celular. O pélete de cé-lulas foi Iisado em BugBuster e Benzonase (Novagen, Madison, Wl) (de a-cordo com o protocolo do fabricante). Os restos celulares foram removidospor centrifugação. O extrato de proteína bruto foi aplicado em uma colunaHisBind (Novagen, Madison, Wl) que foi preparado de acordo com o proto-colo do fabricante. A coluna foi lavada e a proteína foi eluída de acordo como protocolo do fabricante. A proteína purificada foi dessalinizada com colu-nas PD-10 (GE Healthcare, Piscataway, NJ). O tampão utilizado para a trocaera 50 mM de fosfato de potássio pH 7,5, 100 mM de NaCI, 4 mM de MgCI2.
A proteína purificada foi concentrada com agentes de concentração por cen-trifugação Amicon (Millipore, Billerica1 MA).
Teste de Aldolases Purificadas
As aldolases purificadas foram testadas em relação a sua capa-cidade de produzir R1R monatina partindo de D-triptofano. Os seguintes fo-ram adicionados por 1 mL de mistura de reação: aproximadamente 50 pg depurificada aldolase, 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase de B. sphaericus purificada, 200 mM de piruvato de sódio,100 mM de tampão de fosfato de potássio pH 7,5 e 0,05 mM de PLP. Asamostras foram tiradas em 2 horas e durante a noite. Os resultados sãomostrados na Tabela 11 abaixo.Tabela 11: Monatina total produzida partindo de D-triptofano e % de R1R
<table>table see original document page 358</column></row><table>
Os mesmos experimentos foram feitos utilizando o L-triptofanocomo o substrato de partida e acoplando as aldolases com L-aminotransferase de especificidade ampla HexAspC e purificada como des-crito no Pedido de Patente U.S. Publicado N0 20050282260 (0,5 mg de pro-teína purificada). Os resultados são mostrados abaixo na Tabela 12 para aprodução de monatina total (subtraindo os níveis de fundo sem aldolase pre-sente) e a porcentagem de S,S monatina é mostrada com base na área dopico de LC em fase inversa. Os números acima de 400 ppm estão fora dafaixa linear da curva padrão e são aproximados.Tabela 12: Monatina total produzida partindo de L-triptofano e % de S,S
<table>table see original document page 359</column></row><table>
Estes dados e os dados da R,R monatina anteriores ilustram quepara a especificidade em relação a R-MP, os polipeptídeos com atividade dealdolase possuem a ordem a seguir: SEQ ID NO:28 > SEQ ID NO:54 > SEQID NO:298 > SEQ ID NO:42.
Exemplo 10
Comparação da produção de monatina total e a distribuição deisômeros para os polipeptídeos com atividade de aldolase das SEQ IDNO:116, SEQ ID NO:76, SEQ ID NO:44, SEQ ID NO:148, SEQ ID NO:46,SEQ ID NO: 134, SEQ ID NO:74, SEQ ID NO:126, SEQ ID N0:102, SEQ IDNO:58, SEQ ID NO:88, SEQ ID N0:50, SEQ ID N0:106, SEQ ID N0:304,SEQ ID N0:300 e SEQ ID NO:28.
A enzima recombinante produzida no Exemplo 7 foi utilizada emreações de acoplamento com HMG aldolases para produzir monatina partin-do de D-triptofano e piruvato como descrito no Pedido de Patente U.S. Pu-blicado N0 20050282260. O polipeptídeo com atividade de aldolase da SEQID NO:28 foi utilizado como uma referência nestes ensaios e foi purificadocomo descrito no Exemplo 8.
Para produzir quantidades de teste de cada aldolase, culturas de25 mL foram crescidas em meio LB contendo ampicilina (100 pg/mL), atéuma DOeoo de aproximadamente 0,5. As culturas foram induzidas com 1 mMde IPTG. As células foram transferidas para 30°C e foram cultivadas durantea noite. Os extratos celulares foram preparados de acordo com os protocolosdo fabricante (Novagen, Madison, Wl, reagente Bugbuster). A benzonuclea-se também foi adicionada. As proteínas solúveis nos extratos celulares fo-ram separadas em uma Bio-Rad Laboratories Experion Automated Electro-phoresis Station (Bio-Rad, Hercules, CA) e analisadas em relação à concen-tração e à porcentagem de expressão utilizando o Experion Software versão1.1.98.0.
Os seguintes foram adicionados por 1 mL de mistura de reação:aproximadamente 50 pg de aldolase (fornecida em extratos celulares a nãoser que seja citado de outra maneira), 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase purificada de B. sphaericus, 200mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e0,05 mM de PLP. O ditiotreitol ("DTT") foi adicionado (concentração final de2 mM) às amostras citadas abaixo. Os experimentos foram corridos em du-plicata. As amostras foram incubadas 2 h e durante a noite (20 horas) a30°C com agitação suave. A média dos resultados é mostrada abaixo. Osúnicos estereoisômeros detectados quando a monatina é produzida utilizan-do estes métodos são R,R e S,R. A porcentagem de R,R é listada abaixo efoi determinada através da área do pico de LC em fase inversa.
Tabela 13: Monatina total produzida partindo de D-triptofano e % de R,R
<table>table see original document page 360</column></row><table><table>table see original document page 361</column></row><table><table>table see original document page 362</column></row><table>
Os números de produção de monatina total variavam de 1 ppmaté mais de 200 ppm e a % de R,R variava de 0% até 99%. Devido ao fatode que a aminotransferase era a mesma para todas as aldolases, a altera-ção da aldolase pode ter um impacto significativo tanto sobre a quantidadede monatina produzida quanto a distribuição dos estereoisômeros da mona-tina produzida. O DTT (como nas amostras abaixo) parecia aumentar aquantidade de monatina total produzida.
Os mesmos experimentos que os anteriores foram feitos utili-zando o L-triptofano como o substrato de partida e acoplando as aldolases(fornecidas na forma de extrato celular) com L-aminotransferase de especifi-cidade ampla HexAspC parcialmente purificada (0,5 mg de HexAspC). Amédia dos resultados (de duplicatas) é mostrada abaixo na Tabela 14 para aprodução de monatina total (subtraindo os níveis de fundo sem aldolase pre-sente) e a porcentagem de S1S monatina é mostrada com base na área dopico de LC em fase inversa. Os números acima de 400 ppm estão fora dafaixa linear da curva padrão e são aproximações. O polipeptídeo purificadocom atividade de aldolase da SEQ ID NO: 28 foi utilizado como um referên-cia. Os polipeptídeos com atividade de aldolase das SEQ ID NO: 304 e SEQID NO: 300 (derivados de plantas) foram utilizados com e sem 2 mM deDTT. Shannon e Marcus (The Journal of Biological Chemistry 237: 3342-3347, 1962) utilizaram mercaptoetanol como um agente redutor na purifica-ção original de uma HMG aldolase de amendoim.
Tabela 14: Monatina total produzida partindo de L-triptofano e % de S,S
<table>table see original document page 362</column></row><table><table>table see original document page 363</column></row><table><table>table see original document page 364</column></row><table>
Exemplo 11
Efeito do Ditiotreitol (DTT) sobre a produção de monatina
Várias das enzimas no Exemplo 10 foram escolhidas para estu-do adicional. As aldolases derivadas de plantas exibiam melhoria após a a-dição de DTT como um agente redutor. É observado que as aldolases deri-vadas de microorganismos provenientes de várias amostras ambientaistambém contêm uma alta porcentagem de resíduos de cisteína. Portanto,experimentos adicionais foram realizados para observar se o DTT aumenta-va a produção de monatina para as aldolases sem ser vegetais também.
Os seguintes foram adicionados por 1 mL de mistura de reação:aproximadamente 50 pg de aldolase (fornecida em extratos celulares a nãoser que seja citado de outra maneira), 4 mM de MgCI2, 50 mM de D-triptofano, 2 mg de AT-103, 200 mM de piruvato de sódio, 100 mM de tam-pão de fosfato de potássio pH 7,5 e 0,05 mM de PLP. O ditiotreitol foi adicio-nado (concentração final de 2 mM) às amostras citadas abaixo. Os experi-mentos foram corridos em duplicata. As amostras foram incubadas 2 h a30°C com agitação suave. A média dos resultados é mostrada abaixo para amonatina total que é determinada por LC/MS/MS, com a produção de mona-tina de fundo (controle sem aldolase) subtraída.
Tabela 15: Monatina total produzida partindo de D-triptofano
<table>table see original document page 364</column></row><table>Aldolase Monatina total (ppm)SEQ ID N0:50 + DTT 170SEQ ID NO:28 proteína purificada 174SEQ ID NO:28 + DTT proteína purificada 196
O controle sem aldolase produziu 10 ppm de monatina total come sem DTT, indicando que o DTT não estava afetando a reação geral atra-vés da redução de subprodutos e não estava afetando a atividade da D-aminotransferase. Todos os polipeptídeos com atividade de aldolase dasSEQ ID NO: 46, SEQ ID NO: 58 e SEQ ID NO: 28 exibiam um benefício pro-veniente da adição de DTT. O polipeptídeo com atividade de aldolase daSEQ ID NO: 46 exibia o melhor benefício, atividade aproximadamente 1,8vez maior com 2 mM de DTT. Dois polipeptídeos com atividade de aldolaseparecem ter sido inibidos pelo DTT (SEQ ID NO: 116 e SEQ ID NO: 50) en-quanto não foi observado qualquer efeito, dentro do erro experimental, parao polipeptídeo com atividade de aldolase da SEQ ID NO: 44. Entretanto, épossível que para cada aldolase utilizada haja uma concentração ótima deDTT com a finalidade de detectar um benefício de fornecer o agente redutor.
O polipeptídeo com atividade de aldolase da SEQ ID NO: 88 foiescolhido para estudar o efeito da concentração de DTT sobre a produçãode monatina. As reações acopladas foram realizadas como anteriormente.Os resultados são representados graficamente na figura 15. A concentraçãoótima de DTT neste ensaio ficava entre 2,5 e 5 mM, para a quantidade dealdolase adicionada. De forma interessante, se não fosse adicionado DTT, aquantidade de monatina produzida era quase tão alta quanto com 2,5 mM deDTT, mas a adição de quantidades subótimas de DTT (0,5-1 mM) realmenteparece ser inibidora, assim como a adição de muito DTT (20 mM).Exemplo 12
Comparação da produção de monatina total e a distribuição deisômeros para os polipeptídeos com atividade de aldolase das SEQ IDNO:278, SEQ ID NO:162, SEQ ID NO:276, SEQ ID NO:178, SEQ IDN0:202, SEQ ID NO:166, SEQ ID NO:218, SEQ ID NO:224, SEQ IDNO:226, SEQ ID NO:244, SEQ ID N0:250, SEQ ID NO:252, SEQ IDNO:264, SEQ ID NO:268, SEQ ID NO:272, SEQ ID NO:184, SEQ IDNO:282, SEQ ID NO: 186, SEQ ID NO: 192, SEQ ID N0:200, SEQ IDN0:280, SEQ ID NO:284, SEQ ID NO: 172, SEQ ID NO: 180, SEQ IDNO:168, SEQ ID NO:228, SEQ ID NO:236, SEQ ID NO:238, SEQ IDΝ0:240, SEQ ID Ν0:270, SEQ ID Ν0:156 e SEQ ID ΝΟ:28
A enzima recombinante produzida no Exemplo 7 foi utilizada emreações acopladas com HMG aldolases para produzir monatina partindo deD-triptofano e piruvato como descrito no Pedido de Patente U.S. PublicadoN0 20050282260. O polipeptídeo com atividade de aldolase da SEQ ID NO:28 foi utilizado como uma referência nestes ensaios e foi purificado comodescrito no Exemplo 8.
Para produzir quantidades de teste de cada aldolase, culturas de25 mL foram crescidas em meio LB contendo ampicilina (100 pg/mL), atéuma DO600 de aproximadamente 0,5. As culturas foram induzidas com 1 mMde IPTG. As células foram transferidas para 30°C e foram cultivadas durantea noite. Os extratos celulares foram preparados utilizando o reagente Bug-buster de acordo com os protocolos do fabricante (Novagen, Madison, Wl). Abenzonuclease também foi adicionada. As proteínas solúveis nos extratoscelulares foram separadas em uma Bio-Rad Laboratories Experion Automa-ted Electrophoresis Station (Bio-Rad, Hercules, CA) e analisadas em relaçãoà concentração e à porcentagem de expressão utilizando o Experion Softwa-re versão 1.1.98.0.
Os seguintes foram adicionados por 1 mL de mistura de reação:aproximadamente 200 pg dos polipeptídeos com atividade de aldolase dasSEQ ID NO: 278, SEQ ID NO: 162, SEQ ID NO: 276, SEQ ID NO: 178, SEQID NO: 202, SEQ ID NO: 166, SEQ ID NO: 218, SEQ ID NO: 224, SEQ IDNO: 226, SEQ ID NO: 244, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO:264, SEQ ID NO: 268, SEQ ID NO: 272, SEQ ID NO: 184, SEQ ID NO: 282,SEQ ID NO: 186, SEQ ID NO: 192 e SEQ ID NO: 200 ou 50 pg do polipeptí-deo com atividade de aldolase das SEQ ID NO: 280, SEQ ID NO: 284, SEQID NO: 172, SEQ ID NO: 180, SEQ ID NO: 168, SEQ ID NO: 228, SEQ IDNO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 270 e SEQ ID NO:156 (fornecidos em extratos celulares a não ser que seja citado de outramaneira), 4 mM de MgCI2, 50 mM de D-triptofano, 0,5 mg de D-aminotransferase purificada de B. sphaericus, 200 mM de piruvato de sódio,100 mM de tampão de fosfato de potássio pH 7,5 e 0,05 mM de PLP. Os5 experimentos foram corridos em duplicata. As amostras foram incubadas 2 he durante a noite (20 horas) a 30°C com agitação suave. A média dos resul-tados é mostrada abaixo. Os únicos estereoisômeros detectados quando amonatina é produzida utilizando estes métodos são R,R e S,R. A porcenta-gem de R1R é listada abaixo e foi determinada através da área de pico de LC10 em fase inversa.
Tabela 16: Monatina total produzida partindo de D-triptofano e % de R,R
Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatinaSEQ ID NO:278 (1 h) 11,35 100SEQ ID NO:278 (18 h) 282,15 96SEQ ID NO:162 (1 h) 19,35 100SEQ ID NO: 162 (18 h) 277,9 98SEQ ID NO:276 (1 h) 27,2 100SEQ ID NO:276 (18 h) 421 98SEQ ID NO:178 (1 h) 24,8 98SEQ ID NO:178 (18 h) 394,25 94SEQ ID N0:202 (1 h) 0 0SEQ ID N0:202 (18 h) 19,2 91SEQ ID NO:166 (1 h) 42,8 89SEQ ID NO:166 (18 h) 601,25 71SEQ ID NO:218 (1 h) 15,6 99SEQ ID NO:218 (18 h) 456,05 96SEQ ID NO:224 (1 h) 19,7 98SEQ ID NO:224 (18 h) 406,55 93SEQ ID NO:226 (1 h) 41,3 95SEQ ID NO:226 (18 h) 460,15 84SEQ ID NO:244 (1 h) 11,6 99SEQ ID NO:244 (18 h) 168,3 98Aldolase (ponto de tempo) Monatina total (ppm) % de R,R monatinaSEQ ID N0:250 (1 h) 20,25 95SEQ ID N0:250 (18 h) 289,25 89SEQ ID NO:252 (1 h) 48,4 81SEQ ID NO:252 (18 h) 335,8 73SEQ ID NO:264 (1 h) 31,65 82SEQ ID NO:264 (18 h) 252,35 77SEQ ID NO:268 (1 h) 12,95 98SEQ ID NO:268(18h) 252,55 95SEQ ID NO:272 (1 h) 13,8 98SEQID NO:272 (18 h) 165,8 98SEQ ID NO:184 (1 h) 19,55 96SEQ ID NO:184 (18 h) 221,85 94SEQ ID NO:282 (1 h) 29,75 95SEQ ID NO:282 (18 h) 399,05 91SEQ ID NO:186 (1 h) 14,4 94SEQ ID NO:186 (18 h) 116,15 93SEQ ID NO:192 (1 h) 17,1 97SEQ ID NO:192 (18 h) 131,25 97SEQ ID N0:200 (1 h) 32,1 97SEQID N0:200 (18 h) 331,05 94SEQ ID NO:28 (1 h) (200μς) 32,1 100SEQ ID NO:28 (18 h) (200pg) 111,45 99SEQ ID N0:280 (1 h) 0 n/aSEQ ID N0:280 (18 h) 3,25 61SEQ ID NO:284 (1 h) 2,3 100SEQ ID NO:284 (18 h) 55,35 98SEQ ID NO:172 (1 h) 12,75 99SEQ ID NO:172 (18 h) 205,9 96SEQ ID N0:180 (1 h) 38,7 93SEQ ID N0:180 (18 h) 310,9 75SEQ ID NO:168 (1 h) 28 98SEQ ID NO:168 (18 h) 301,1 90<table>table see original document page 369</column></row><table>
Os números de produção de monatina total variavam de não de-
tectáveis até mais de 600 ppm e a % de R1R variava de 61% até 100%. De-vido ao fato de que a aminotransferase era a mesma para todas as aldola-ses, a alteração da aldolase pode ter um impacto significativo tanto sobre a5 quantidade de monatina produzida quanto sobre a distribuição de estereoi-sômeros da produzida.
Os mesmos experimentos que os anteriores foram feitos utili-zando o L-triptofano como o substrato de partida e acoplando as aldolases(fornecidas na forma de extrato celular) com L-aminotransferase de especifi-10 cidade ampla HexAspC produzida e purificada como descrito no Pedido dePatente U.S. Publicado N0 20050282260 (0,5 mg de proteína purificada). Osresultados são mostrados abaixo na Tabela 17 para a produção de monatinatotal (subtraindo os níveis de fundo sem aldolase presente) e a porcentagemde S1S monatina é mostrada com base na área do pico de LC em fase inver-15 sa. Os números acima de 400 ppm estão fora da faixa linear da curva pa-drão e são aproximações. A Tabela 12 mostra os resultados para a enzimaespecífica a R de referência, o polipeptídeo com atividade de aldolase daSEQ ID NO: 28, que foi analisado ao mesmo tempo.Tabela 17: Monatina total produzida partindo de L-triptofano e % de S,S
<table>table see original document page 370</column></row><table><table>table see original document page 371</column></row><table>
Exemplo 13
Produção de monatina partindo de indol-3-piruvato utilizandouma D-aminotransferase
A transaminase AT-103 fazia parte de uma biblioteca de transa-5 minases obtida na BioCataIytics (Pasadena, CA) e a enzima foi testada emrelação à produção de monatina em reações acopladas utilizando a aldolaseProA de C. testosteroni. A aldolase foi preparada como descrito na WO03/091396 A2. A AT-103 é uma D-transaminase de especificidade ampla(E.C. 2,6.1.21) proveniente de uma espécie de Bacillus que requer um Ρ-ΙΟ aminoácido (tal como D-glutamato, D-aspartato ou D-alanina) como o doadorde aminoácido. As enzimas e os componentes/substratos adicinais foramadicionados diretamente no tampão de reação fornecido no kit, que continha100 mM de tampão de fosfato de potássio pH 7,5, 100 mM de doador deamino e 0,1 mM de PLP. A um mL de tampão de reação foram adicionados:15 4 mg de indol-3-piruvato, 20 mg de piruvato, aproximadamente 50 pg deProA fornecidos em um extrato celular, 1 μΙ_ de 2 M de MgCI2 e 2 mg de en-zima aminotransferase. As reações foram realizadas em duplicata. As rea-ções foram incubadas durante a noite a 30°C com agitação suave (100 rpm).As amostras foram filtradas e submetidas à análise de LC/MS/MS em fase20 inversa como descrito no Exemplo 1. Os resultados indicavam que aproxi-madamente 370 pg/mL de monatina eram produzidos utilizando a enzimaAT-103. Os resultados foram adicionalmente analisados para determinar asproporções de S,R/R,S versus R,R/S,S monatina, com base nas áreas depico dos dois conjuntos de estereoisômeros que são resolvidos durante a25 separação cromatográfica. Da monatina total produzida por AT-103, 69%eram R,R/S,S monatina em comparação com os isômeros misturados. Estaenzima é homóloga à enzima DAT de Bacillus subtilis descrita na WO03/091396 A2, que é conhecida como possuindo uma especificidade amplapor D-aminoácidos. A análise quiral foi realizada utilizando a metodologia deFDAA descrita no Exemplo 1, que verificava se a D-aminotransferase estavaproduzindo predominantemente R,R monatina e alguma S,R monatina comoesperado. Experimentos de transaminação adicionais com S,S monatina oucom R1R monatina e α-cetoglutarato como substratos verificaram que a en-zima da BioCatalytics era altamente seletiva para a configuração D no car-bono 4, como esperado. Nestes experimentos, não foi detectado glutamatona reação com S1S monatina e α-cetoglutarato como substratos.
Para aumentar a quantidade de S,S monatina ou de R,S monati-na produzida como subprodutos em reações acopladas com AT-103 (a D-transaminase de faixa ampla) e a aldolase ProA, a aldolase foi purificadautilizando cartuchos His-Bind1 seguindo os protocolos do fabricante (Nova-gen, Madison1 Wl). A enzima purificada preferencialmente não deve conteratividades de L-aminotransferase do tipo selvagem que podem estar presen-tes em extratos celulares (tais como as atividades de AspC ou de TyrB nati-vas de E. coli). O eluente de His-Bind foi dessalinizado para remover imida-zol utilizando colunas PD-10 (G25 Sephadex, GE Healthcare, Piscataway,NJ) e foi eluído em 50 mM de Tris-CI, pH 7. Os experimentos foram realiza-dos em duplicata em um volume de 1 mLe continham 100 mM de tampãoTris-CI, pH 7,8, 50 pg de aldolase ProA1 4 mg de indol-3-piruvato, 1 ou 2 mgde D-aminotransferase, 200 mM de piruvato de sódio, 2 mM de MgCI2, 3 mMde fosfato de potássio, 0,1 mM de PLP e 14,7 mg de D-glutamato. Os tubosforam incubados a 30°C com agitação suave. Pontos de tempo de duas ho-ras foram tirados e congelados imediatamente a -20°C. O pH foi ajustado emduas horas de 5 até entre 7-8 utilizando NaOH e os ensaios foram incubadosdurante a noite. As amostras foram filtradas e analisadas em relação à mo-natina como descrito no Exemplo 1. As amostras de duas horas não tinhamquantidades detectáveis de monatina, provavelmente por causa do pH baixo.As amostras durante a noite continham aproximadamente 190 ng/ml_ demonatina quando 1 mg de D-aminotransferase era utilizado e aproximada-mente 84% eram R1R monatina e 16% eram S,R monatina. Quando 2 mg deD-aminotránsferase foram utilizados, 540 ng/mL de monatina foram produzi-dos, aproximadamente 71% eram R1R monatina.
Experimentos similares foram realizados utilizando o tampãoBioCataIytics Aminotransferase (BioCatalytics, Pasadena1 CA), que continha100 mM de fosfato de potássio pH 7,5, 0,1 mM de PLP e 100 mM de D-glutamato. O indol-3-piruvato sólido e a D-aminotransferase foram adiciona-dos como anteriormente. A aldolase ProA (50 pg), MgCI2 e 50 mM de piruva-10 to foram adicionados partindo de soluções estoque. Os ensaios foram trata-dos como anteriormente, embora nenhum ajuste de pH fosse necessárioneste caso. Um controle negativo foi feito apenas com a enzima e o tampãofornecidos pela BioCatalytics, que não continham monatina. Os resultadosexperimentais são mostrados na Tabela 18.15 Tabela 18: Produção de Monatina partindo de lndol-3-Piruvato em Tampãode Fosfato
Mg D- aminotransferase Tempo (h) Monatina total (ng/mL) % de R,R0 2 0 n/a1 2 6780 não-determinada2 2 13170 55%0 16 0 n/a1 16 15000 não-determinada2 16 28930 51%
A produção de monatina em tampão de fosfato é claramentemaior que em sistemas tamponados com Tris.
Para comparar as atividades da DAT de B. subtilis clonada do20 WO 03/091396 A2 com a enzima da BioCatalytics (AT-103) (BioCatalytics,Pasadena, CA), ensaios adicionais foram realizados. O gene daí de B. subti-lis foi também subclonado em pET30a para remover His-6 tag. A enzimasem marcação e com marcação foi produzida em BL21(DE3), como descritona WO 03/091396 A2. Os extratos celulares foram produzidos e os ensaiosde proteína total foram realizados para estimar a concentração de proteínacomo descrito anteriormente. Foram realizadas reações de um mL em dupli-cata que continham: 500 pg de D-aminotransferase, 50 pg de aldolase ProA1100 mM de fosfato de potássio pH 7,5, 3 mM de MgCI2, 4 mg de indol-3-piruvato, 200 mM de piruvato de sódio, 7,35 mg (50 mM) de D-glutamato e0,1 mM de PLP. As amostras foram incubadas a 30°C durante 1 h, 2 h e du-rante a noite e foram filtradas para a análise de LC/MS/MS. As amostrascontinha apenas os estereoisômeros S,R e R1R de monatina, como determi-nado através do protocolo de derivatização com FDAA descrito no Exemplo1. Os resultados estão resumidos na Tabela 19 abaixo. A % de R,R foi de-terminada através das áreas de pico que foram separadas por cromatografiaem fase inversa.
Tabela 19: Comparação de enzimas D-aminotransferases
<table>table see original document page 374</column></row><table>
A remoção da HIS-6 tag parece ter aumentado a atividade da D-aminotransferase de B. subtilis; entretanto, o homólogo da D-aminotransferase da BioCataIytics claramente possuía a maior atividade. Ohomólogo da D-aminotransferase da BioCataIytics também exibia maior es-pecificidade pelo substrato para o precursor de monatina R. Tempos de in-cubação maiores parecem reduzir o excesso enanciomérico de R,R monati-na que é produzido.
Devido ao fato de que as enzimas D-aminotransferases de Bacil-lus possuem uma preferência por piruvato como um receptor de amino e D-alanina como um doador de amino, era esperado que a D-alanina pudesseser utilizada como o doador de amino para a conversão de MP em monatinacom resultados similares ou melhores. Foram realizadas reações de um mLem duplicata que continham: 500 pg de D-aminotransferase, 50 pg de aldo-lase ProA purificada, 100 mM de fosfato de potássio pH 7,5, 3 mM de MgCI2l4 mg de indol-3-piruvato, 100 mM de piruvato de sódio, 25 mM de D-glutamato ou D-alanina e 0,1 mM de.PLP.-As amostras foram incubadas du-rante 2 horas e tratadas como anteriormente antes da análise. Quando a D-alanina foi utilizada como o doador de amino, níveis ligeiramente maiores demonatina foram produzidos (23 versus 21 ppm) como esperado. Adicional-mente, é esperado que concentrações altas de piruvato possam inibir a es-tapa de transaminação, assim a dosagem em quantidades menores de piru-vato ao longo do tempo pode aumentar a taxa geral de produção de monati-na. Pode ser observado partindo dos dados anteriores que muito embora ametade do piruvato tenha sido utilizada neste caso comparado com a tabelaanterior, significativamente mais monatina foi produzida. A AT-103 é um e-xemplo de uma enzima com atividade limitada para S-MP. Muito embora aaldolase ProA utilizada neste estudo produza mais de 90-95% de S-MP, aAT-103 produz até 92% de R,R monatina.
Exemplo 14
Produção de R,R monatina partindo de D-triptofano
Os seguintes foram adicionados por 1 mL de mistura de reação:aproximadamente 60 pg de aldolase ProA de C. testosteroni (fornecida emextratos celulares, como descrito na WO 03/091396 A2), 4 mM de MgCI2, 50mM de D-triptofano, 0,5 mg de D-aminotransferase da BioCataIytics (AT-103) (BioCatalytics, Pasadena, CA), 100 mM de piruvato de sódio, 100 mMde tampão de fosfato de potássio pH 7,5 ou 100 mM de tamão de acetato desódio pH 8, 0,05 mM de PLP, 3 mM de fosfato de potássio (apenas nas rea-ções com acetato) e 10 mM de α-cetoglutarato. Os experimentos foram cor-ridos em duplicata, com controles negativos em que não era adicionada al-dolase. As amostras foram incubadas durante a noite (20 horas) a 30°C comagitação suave. O pH real das amostras com acetato de sódio era de apro-ximadamente 5, enquanto que o pH final para as amostras com tampão defosfato era de aproximadamente 7. Nenhuma das aldolases parecia ter ativi-dade significativa em pH 5, a amostra contendo aldolase ProA estava ligei-ramente acima do controle negativo, mas provavelmente não estava acimado erro experimental. Em fosfato de potássio, a aldolase ProA produziu 73,4ppm de monatina com uma proporção de R,R:S,R de 1,7:1 (-63% de R,Rpartindo de D-triptofano).
Devido ao fato de que as enzimas D-aminotransferases de Bacil-Ius possuem uma preferência por piruvato como um receptor de amino e D-alanina como um doador de amino, era esperado que a adição de alfa-cetoglutarato era desnecessária quando R,R ou S1R monatina era produzidapartindo de D-triptofano. O experimento acima foi repetido (em 100 mM detampão de fosfato de potássio) utilizando aldolase ProA purificada (50-60pg) e um tempo de incubação de 2,5 horas. Foram corridos experimentosem duplicata, com e sem alfa-cetoglutarato. Com 10 mM de alfa-cetoglutarato adicionados, 56,1 ppm de monatina foram formados partindode D-triptofano (79,5 % de R,R, 20,5% de S,R). Sem alfa-cetoglutarato,102,5 ppm de monatina foram formados (79% de R,R, 21% de S,R).
Exemplo 15
Triptofano racemase
A R,R-monatina foi produzida utilizando D-aminotransferase euma aldolase quando o D-triptofano foi utilizado como o material de partida(Exemplo 14). Entretanto, o L-triptofano pode ser um material de partida pre-ferido por várias razões. Por exemplo, o L-triptofano pode ser menos dis-pendioso e mais facilmente disponível que o D-triptofano. Esta descriçãodescreve vários métodos para a obtenção de uma triptofano racemase ativa.
Os rendimentos de R,R monatina são maiores através da utilização de umaaldolase específica a R, isto é, uma aldolase que produz preferencial ou se-letivamente R-MP. A figura 3 ilustra um método para a produção de R1R mo-natina enriquecida de forma estereoisomérica partindo de L-triptofano utili-zando um triptofano racemase, uma D-aminotransferase e uma aldolase es-pecífica a R.
Uma seleção de uma triptofano racemase é criada através daconstrução de uma cepa que requeriria uma racemase ativa para crescer.Um organismo auxotrófico em relação ao triptofano precisa de uma fonte deL-triptofano quando cultivado em meio mínimo. A suplementação do meiocom D-triptofano é uma maneira de selecionar uma racemase que converteo D-triptofano em L-triptofano. Os organismos auxotróficos em relação aotriptofano foram testados em relação ao crescimento em meio mínimo su-plementado com D-triptofano. As cepas, CAG18455 e CAG18579 do ColiGenetic Stock Center e NRRL12264 (Também IipA', ADE3 Iisogenizada ecurada de seu plasmídeo), não crescerem quando suplementadas com D-triptofano, mas cresceram quando suplementadas com L-triptofano. E. colipode ser utilizado como um organismo hospedeiro, mas outros organismoshospedeiros também podem ser utilizados, tal como levedura, outras bacté-rias ou outros organismos eucarióticos. Um organismo auxotrófico em rela-ção ao triptofano (especificamente NRRL12264 (também IipA', ADE3 Iisoge-nizada e curada de seu plasmídeo)) crescerá em D-triptofano quando tiversido transformado com uma D-aminotransferase. Isto confirma a capacidadede E. colide transportar D-triptofano para dentro da célula.
Salcher e Lingens descreveram a presença de uma triptofanoracemase em Pseudomonas aurereofaciens (ATCC15926). A triptofano ra-cemase também foi descrita em várias plantas incluindo tabaco, beterraba,tomate e trigo e a enzima parece ser induzida por condições de estresseosmótico ou seca. A triptofano racemase pode desempenhar uma função emSclerochiton ilicifolius na vide de produção de monatina nativa. Para isolaresta atividade de racemase, uma biblioteca de expressão é construída par-tindo de ATCC15926 (ou um outro organismo com atividade de triptofanoracemase) a biblioteca é transformada no organismo auxotrófico em relaçãoao triptofano. É selecionada uma cepa que crescerá utilizando D-triptofanocomo a fonte de triptofano. Um método similar é também utilizado para veri-ficar muitas cepas com racemases conhecidas para procurar uma racemasecom atividade sobre o D-triptofano. Os exemplos incluem: alanina, serina eglutamato racemases (T. Yoshimura e N. Esaki, "Amino Acid Racemases:Functions and Mechanisms". Journal of Bioscience e Bioengineering, Vol.96, No. 2, 103-109, 2003). A alanina racemase é dependente de PLP e foiclonada partindo de Salmonella typhimuríum (gene dadB). Outras fontes sãoEscherichia coli, Bacillus subtilis, Pseudomonas aeruginosa, Vibrio eholerae,Schizosaccaroyces pombe e Bacillus eereus. Um cogumelo basidiomiceto,Lentinus edodes, também codifica uma alanina racemase de atividade am-pla. A serina racemase também é dependente de PLP e é encontrada emeucariotos (tal como cDNA do bicho-da-seda, cérebro de rato e cérebro decamundongo) assim como em bactérias (Enteroeoeeus gallinarum). A gluta-mato racemase é idependente de PLP e foi clonada partindo de Pedioeoceuspentosaeeus, Bacillus pumilus, Lactobacillus fermenti, Lactobacillus brevis,E. coli, Aquifex pyrophilus e Bacillus subtilis. A glutamato racemase é muitoespecífica e, conseqüentemente, mesmo os aminoácidos estruturalmentesimilares aspartato, asparagina e glutamina não são substratos para a enzi-ma. As aspartato racemases também existem e são independentes de PLP.Estas enzimas são encontradas em cepas de Lactobacillil Streptoeoeeus ealgumas Archaea tais como cepas de Desulfuroeoceus e Thermocoeeus. Omolusco bivalve Seapharea brouhtonii também contém uma aspartato race-mase. Outras racemases encontradas na literatura incluem aminoácido ra-cemase (EC 5.1.1.10) de Anabaena sp. e Pseudomonas striata, prolina ra-cemase, fenilalanina racemase multifuncional. As epimerases ou racemasesrelacionadas também estão sendo testadas. As racemases potenciais sãotestadas para ter certeza que não são D-triptofano aminotransferases. Estaverificação é feita através da análise de seqüência e/ou de ensaio enzimáti-co.As enzimas que passam no teste como uma racemase são veri-ficadas em relação à atividade sobre a monatina como descrito no Exemplo17. De forma ideal, pode-se obter uma enzima que é muito específica emrelação ao triptofano e possui pouca ou nenhuma atividade de racemasesobre a monatina.
Uma triptofano racemase também pode ser desenvolvida e/oumelhorada (através de mutagênese. ou engenharia recombinante) partindode uma racemase, uma transaminase ou uma epimerase existente. Adicio-nalmente, devido ao fato de que são conhecidas as estruturas em cristal dasalanina aminotransferases, estas podem ser utilizadas como uma base paraa mutagênese racional baseada na estrutura. O processo descrito acima éutilizado como uma seleção inicial em relação à atividade de triptofano ra-cemase e como uma verificação em relação à maior atividade.Bibliotecas de triptofano racemasesConstructo de Bibliotecas:
Burkholderia pyrrocina (ATCC15958) e Pseudomonas chlorora-phis (ATCC15926) foram obtidas na American Type Culture Collection. Fo-ram cultivadas como recomendado pela ATCC e o DNA genômico foi prepa-rado de acordo com o método de Mekalanos JJ. (Duplication and amplificati-on of toxin genes in Vibrio cholerae. Cell. 1983. 35:253-63). O DNA genômi-co foi digerido parcialmente com a enzima de restrição Sau3AI. Os fragmen-tos de 1-3 Kpb foram purificados em gel utilizando um Qiagen QIAquick GelExtraction Kit (Qiagen, Valencia, CA). O DNA purificado foi ligado em p-Trc99a (Amersham, Piscataway, NJ) que foi digerido com SamHI e purifica-do como anteriormente. A ligação foi feita à temperatura ambiente com incu-bação durante a noite utilizando uma proporção molar de 3:1 de inserto emrelação ao vetor. A biblioteca ligada foi transformada em células competen-tes quimicamente TOPIOF (Invitrogen, Carlsbad, CA) e plaqueada em meioLB com 100 pg/mL de ampicilina. Após uma incubação durante a noite dasplacas de transformação, as colônias foram raspadas das placas lavadascom meio LB líquido e um pélete de células de tamanho apropriado foi sub-metida a uma mini-prep utilizando um Qiagen QIAquick mini-prep kit (Qia-gen, Valencia, CA). Aproximadamente 30.000 colônias foram agrupadas esubmetidas à mini-prep.
O plasmídeo agrupado foi tranformado em CAG18455(trpC83::Tn10, rph-1) ou CAG18579 (trpC::Tn IOkan, rph-1). Ambas as cepassão auxotróficas em relação ao triptofano de forma que não crescerão emmeio mínimo M9 (Difco) a não ser que o meio seja suplementado com tripto-fano. Os transformantes foram plaqueados em meio mínimo M9 suplemen-tado com D-triptofano. Este seleciona uma cepa que pode converter D-triptofano em L-triptofano.
Antes da transformação da biblioteca, as cepas foram testadasem relação ao crescimento em meio mínimo com L- ou D-triptofano. As ce-pas foram testadas em relação ao crescimento em meio mínimo suplemen-tado com D-triptofano e não foi observado qualquer crescimento. Ambas ascepas cresciam em meio idêntico suplementado com L-triptofano ao invés deD-triptofano. Adicionalmente, um derivado de NRRL12264 (a cepa utilizadatinha sido curada com o plasmídeo com operon de triptofano, Iisogenizadacom ADE3 e deletada para IipA, em adição a outras mutações codificadaspelo cromossomo (serB, AtrpED, tnaA2, aroP) (esta cepa não podia crescerem meio mínimo suplementado com D-triptofano, mas crescia em meio idên-tico suplementado com L-triptofano ao invés de D-triptofano) foi transforma-do com uma aminotransferase específica a D de Bacillus subtilis (WO03/091396). A expressão da D-aminotransferase foi controlada pelo promo-tor T7. A cepa transformada era capaz de crescer em meio mínimo M9 su-plementado com D-triptofano.
As colônias que crescem no meio com D-triptofano são verifica-das. O plasmídeo é isolado e transformado novamente não cepa original(CAG18455 ou CAG18579) para confirmar que o crescimento em meio comD-triptofano é dependente do plasmídeo e na de uma mutação do hospedei-ro. As seqüências de nucleotídeos dos plasmídeos que complementam aauxotrofia em relação ao triptofano são analisadas. Os clones que são de-terminados como contendo um gene de triptofano racemase são adicionalmenteanalisados.
A triptofano racemase de outras fontes de tecido é isolada deuma maneira similar. Há relatos na literatura de atividade de triptofano race-mase tanto em células de cultura de tecido de tabaco (Nicotiana tabacum L.var. Wisconsin 38) (Miura, G.A. e Mills, S.E. The convertion of D-tryptophanto L-tryptophan in cell cultures of tobacco. Plant Physiol. 1971. 47:483-487)quanto em extratos de proteína bruta de trigo (Triticum aestivum) (Rekos-lavskaya, N.I., Yur'eve, O.V., Shibanova, L.A. e Salyaev, R.K. Synthesis andphysiological function of D-tryptophan during wheat germination. Russian J.Plant Physiol. 1997. 44:196-203). Uma biblioteca de expressão de cDNA éproduzida partindo de tecido, como descrito na literatura e a biblioteca deexpressão é utilizada para transformar um organismo auxotrófico em relaçãoao triptofano como descrito anteriormente.
Ensaio da Triptofano Racemase
Os clones que são identificados como potencialmente possuindouma triptofano racemase são transformados em uma cepa de E. coli comu-mente utilizada para a expressão de proteínas recombinantes, tal comoBL21. As células são cultivadas em caldo LB até uma densidade ótica a 600nm de 0,4-0,6. O promotor que controla a expressão da racemase é induzidocom IPTG (concentração final de 0,1 mM). Após a indução, é permitido queas células expressem a proteína durante 1-3 horas a 37°C (com aeração).
As células são coletadas e Iisadas através de uma prensa de French, ultra-som ou através de meios químicos (tal como BugBuster (Novagen, Madison,Wl)). As células Iisadas são centrifugadas para remover os restos celulares.O extrato clarificado é utilizado diretamente nos ensaios.
Quantidades variáveis do extrato são adicionadas em uma solu-ção de forma que a concentração final seja de 50 mM de fosfato de potássio(pH 7,0) e 2 mM de L-triptofano. O piridoxal-5'-fosfato é adicionado a umaconcentração final de 10 μΜ. As amostras são incubadas e então analisadaspor LC/MS. A presença de um pico de D-triptofano quando apenas o L-triptofano é utilizado como um substrato indica um resultado positivo. A con-centração de D-triptofano deve aumentar à medida que o tempo avança atéque o equilíbrio seja atingido e a taxa deve também aumentar com a concen-tração de proteína até que a concentração de enzima seja alta o suficienteque não seja mais saturada com o substrato. O D-triptofano também podeser convertido em L-triptofano como acima.Um gene de complementação pode codificar uma D-aminotransferase. Um "gene de complementação" é um gene que, quandoexpresso, anula uma mutação em um organismo. Por exemplo, se um orga-nismo tiver uma mutação nula em um dos genes necessários para a síntesede triptofano pela célula, um gene de complementação poderia ser um que,quando expresso, permite que a cepa cresça em meio mínimo (isto é, semtriptofano). Esta reação requer um alfa-ceto ácido tal como a-cetoglutarato,oxaloacetato ou piruvato como um receptor de amino. Estes compostos pro-vavelmente estarão presentes em um extrato de células (em pequenasquantidades). Estes compostos podem ser removidos utilizando uma colunade dessalinização PD-10 (GE Healthcare, Piscataway, NJ) e o ensaio podeainda ser realizado em extrato bruto. A atividade da triptofano racemase épurificada utilizando cromatografia em coluna convencional. Finalmente, oquadro aberto de leitura identificado como uma triptofano racemase potenci-al é clonado em um vetor de expressão com uma marcação de afinidade. Atriptofano racemase potencial é então purificada através de cromatografiapor afinidade. Em qualquer um dos casos a proteína purificada é utilizadaem ensaios enzimáticos essencialmente como descrito anteriormente.Engenharia Genética Inversa de Triptofano Racemase
A triptofano racemase pode ser purificada de fontes vegetais oumicrobianas através de técnicas de purificação de proteínas convencionaisincluindo o fracionamento em sulfato de amônio e a cromatografia em colunaconvencional. Uma vez que a proteína foi purificada de forma que um pontopossa ser isolado em um gel de 2-D, técnicas de microsseqüenciamento depeptídeos ou o seqüenciamento de aminoácidos do tipo Edman convencio-nal é utilizado (vide golgi.harvard.edu/microchem/ para descrições dos pro-tocolos e equipamento utilizados para este tipo de trabalho). Em alguns ca-sos, entretanto, a seqüência genômica do organismo não pode ser utilizadacomo uma fonte da proteína para a purificação de proteína porque tal se-qüência ainda não foi determinada. Em tal situação, o primeiro conjunto deiniciadores degenerados pode ser planejado com base na seqüência dispo-nível do relativo conhecido mais próximo da fonte de proteína. A PCR dege-nerada e o "walking" genômico são então realizados de acordo com protoco-los estabelecidos para isolar a seqüência codificadora da triptofano racemase.
Produção de Monatina por Triptofano Racemase
Os seguintes são adicionados por 1 mL de mistura de reação:aproximadamente 60 pg de aldolase ProA de C. testosteroni (fornecida emextratos celulares, como descrito na WO 03/091396 A2), 100 pL/mL de ex-trato celular de triptofano racemase ou 1 mg/mL de triptofano racemase puri-ficada, 4 mM de MgCI2, 50 mM de L-triptofano, 0,5 mg de D-aminotransferase da BioCataIytics (AT-103) (BioCatalytics, Pasadena, CA),100 mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH7,5, 0,05 mM de PLP e 10 mM α-cetoglutarato. Devido ao fato de que o piru-vato é um receptor de amino aceitável para a D-aminotransferase de especi-ficidade ampla, o α-cetoglutarato é opcional. Os experimentos são corridosem duplicata, com controles negativos em que não foi adicionada aldolaseou não foi adicionada triptofano racemase. As amostras são incubadas ~ 1hora ou durante a noite (20 horas) a 30°C com agitação suave.
A triptofano racemase é testada em relação à atividade sobre amonatina. Um ensaio similar ao do Exemplo 17 é utilizado com a monatinacomo um substrato e comparado com a atividade da enzima sobre o tripto-fano. A enzima ideal possui atividade sobre o triptofano, mas pouca ou ne-nhuma sobre outros aminoácidos particularmente glutamato e monatina. Sea enzima tiver atividade significativa sobre a monatina, a enzima pode sofrermutagênese para diminuir a atividade sobre monatina e/ou o glutamato en-quanto a atividade sobre o triptofano é inalterada ou mantida em um nívelalto o suficiente para que a enzima seja útil na produção de monatina. Astécnicas que podem ser utilizadas para a mutagênese incluem, mas não es-tão limitadas à PCR propensa a erros, à mutagênese direcionada ao sítio, àmodelagem para identificar alvos de mutagênese direcionada ao sítio (sítiosque podem estar envolvidos na ligação ao substrato), à passagem atravésde cepas mutagênicas e ao embaralhamento de DNA.
As racemases que sofreram mutagênese podem ser verificadasem relação à atividade sobre o triptofano utilizando um ensaio de placas co-mo descrito anteriormente. Os clones que mantêm a atividade sobre o tripto-fano são então verificados em relação a uma perda da atividade sobre amonatina.
Exemplo 16
Mutaaênese Direcionada ao Sítio de HEXAspCResumo Experimental
Foi observado que um hexamutante de AspC de E. coli (HE-XaspC) possui melhor atividade quando comparado com a AspC durante aprodução de S1S monatina como descrito no Exemplo 6 da WO 03/091396A2. O HEX (número de acesso:/AHFA gi:127190) contém as mutações aseguir partindo de AspC (numeração de E. coli): V35L, K37Y, T43I, N64L,T104S e N285S. Com base na análise estrutural e nos relatos da literatura(S. Rothman e J. Kirsch1 J. Mol. Biol. (2003), 327, 593-608; S. Rothman eoutros, Protein Science (2004), 13: 763-772), foram criados 5 mais mutantesque eram esperados que aumentassem a atividade cinética em direção aossubstratos utilizados na vide de produção de monatina: L-triptofano, S-MP ouambos. Dois dos mutantes aumentaram as taxas de transaminação tanto emrelação ao triptofano quanto à S,S monatina. Dois dos mutantes exibiamuma maior estereosseletividade para a formação de S,S monatina enquantoum era menos estereosseletivo. Com base nisso, é esperado que a D-aminotransferase com especificidade ampla proveniente de Bacillus sp. quepossui mutações similares seja útil como a D-aminotransferase nas vias deR,R monatina mostradas na figura 3 e descritas no Exemplo 15. Um dos mu-tantes (HEXaspCP9T/R122G) tinha maior atividade em relação à transami-nação de L-triptofano, a atividade na produção de S,S monatina ou de tran-saminação de S,S monatina era diminuída significativamente. Assim, é espe-rado que esta enzima seja útil na primeira etapa das vias de produção deR,R monatina mostradas nas figuras 1, 2, 4, 5, 6, 7 e 8 e descritas nos E-xemplos 18 e 19. Em geral, uma aminotransferase que possui atividade simi-lar à de AspC sobre L-triptofano e atividade limitada sobre R-MP e S-MPseria útil para os processos representados nas figuras 1, 2, 4, 5, 6, 7 e 8.Métodos e Materiais
O gene HEX clonado em pl)C19 foi fornecido pelo Professor J.F. Kirsch (Department of Molecular and Cell Biology, University of Califórnia,Berkeley, Berkeley1 CA 94720-3206) e utilizado como o molde para a clona-5 gem do gene em pET23a. Vide James J. Onuffer e Jack F. Kirsch, Redesignof the substrate specificity of Escherichia coli aspartate aminotransferase tothat of Escherichia coli tyrosine aminotransferase by homology modeling andsite-directed mutagenesis, Protein Science, 4: 1750-1757 (1995). Vide tam-bém NCBI número de acesso 1AHF_A Gl:1127190 (seqüência de aminoáci-10 dos de HEX). Os iniciadores a seguir foram planejados para a clonagem dogene HEX no vetor pET23a (Novagen, Madison, Wl):Iniciadores para HEXaspC.
N term: 5'-GCGGAACATATGTTTGAGAACATTACCGCC-3'(SEQ ID NO:
393);
15 C term: 5W\TAACCGGATCCTTACAGCACTGCCACAATCG-3' (SEQ ID NO:
394)
O protocolo de PCR a seguir foi utilizado para a amplificaçãogênica: Em uma reação de 100 μΙ_, 50 ng de molde de DNA, 1,0 μΜ de cadainiciador, 0,2 mM de cada dNTP, 1 U de Pfu Turbo Polymerase (Stratagene,20 La Joila, CA) e 1X tampão Cloned Pfu foram adicionados. O programa dotermociclador utilizava um início a quente de 94°C durante 5 minutos; segui-dos por 25 ciclos de uma etapa de desnaturação a 94°C (30 s), uma etapade anelamento a 55°C (1 min) e uma etapa de extensão a 72°C (2 min) efinalmente uma etapa de término a 72°C (7 min). Técnicas de biologia mole-25 cular padronizadas foram utilizadas para clonar o produto da PCR empET23a utilizando os sítios de restrição Ndel e BamHI.
Acredita-se que o resíduo de triptofano na posição 130 é impor-tante para acumular interações como o anel de piridoxila, mas também pare-ce ser uma fonte de impedimento estérico com o substrato do precursor S de30 monatina (MP), com base nas observações de modelagem de proteínas.Portanto, um aminoácido com cadeia hidrofóbica menor (fenilalanina) foi uti-lizado para substituir o triptofano. O resto das mutações se baseava nos da-dos de cinética na literatura, embora novas combinações de mutações dese-jáveis fossem criadas. Todas as mutações em HEXaspC, com a exceção deW130F, foram produzidas utilizando o Stratagene Multi-Change kit (Strata-gene, La Jolla, CA) seguindo as instruções do fabricante. A mutação W130F5 foi produzida utilizando o Stratagene QuikChange kit (Stratagene, La Jolla,CA) de acordo com as instruções do fabricante com a única exceção sendoque a temperatura de extensão para a reação de PCR foi diminuída para66°C. Os iniciadores para o multi-change kit foram planejados utilizando aferramenta de planejamento de iniciadores QuikChange multi-kit em10 www.stratagene.com. exceto para os iniciadores de mutação isolada deW130F.
As seqüências de iniciadores estão listadas abaixo na Tabela 20.Tabela 20
Iniciador Seqüência (51 a 3')aspCW130F_para trás CGCTCtTATGGTTCGGTTTGCTTGGGTTGCT- CACCC (SEQ ID NO:395)aspCW130F_para frente GGGTGAGCAACCCAAGCTTTCCGAACCATAA- GAGCG (SEQ ID NO:396)R122G-1* CAAAAAATACCAGCGTTAAGGGAGTGTGGGT- GAGCAACC (SEQ ID NO:397)P9T_4a CATTACCGCCGCTACTGCCGACCCGATTC (SEQ ID NO:398)I68V-13 CACCAAAAATTACCTCGGCGTAGACGGCATCCCT- GAATT (SEQ ID NO:399)T156Aa TGATGCGGAAAATCACGCTCTTGACTTCGATGCAC (SEQ ID N0:400)
a Significa um iniciador que foi modificado através da fosforilação a 5'
15 Expressão de Genes Mutantes HEXaspC e Análise da Atividade EnzimáticaCulturas líquidas (5 mL) de Novagen Overnight Express® Auto-induction System 2 (N9 de Catálogo 71366-3; soluções 1-6) (Novagen, Madi-son, Wl) foram inoculadas partindo de placas frescas ou estoques em glice-rol congelados das cepas a seguir:E coli BL21(DE3)::HEXaspCpET23aE coli BL21 (DE3)::HEXaspCW 130FpET23aE coli BL21 (DE3)::HEXaspCT156ApET23aE coli BL21(DE3)::HEXaspCP9T/T156ApET23aE. coli BL21 (DE3)::HEXaspCP9T/R122GpET23aE coli BL21(DE3)::HEXaspCR122G/T156ApET23a.
As culturas foram incubadas a 37°C a 230 rpm durante 6 - 8 h. ADC>6oo de cada cultura foi determinada e o volume de cultura necessário paraa obtenção de uma DOeoo de 0,03-0,05 em 25 mL foi calculado. Os volumescalculados de cada cultura líquida foram transferidos para frascos contendo25 mL do mesmo meio. O Overnight Express® Autoinduction System 2 é ummeio definido quimicamente completo para expressão em altos níveis comsistemas de expressão que podem ser induzidos com IPTG que utiliza Iacto-se como o agente indutor e não requer monitoramento do crescimento celu-lar. As culturas em Overnight Express foram incubadas a 30°C com agitaçãoa 230 rpm durante 18 h. As células foram coletadas por centrifugação e la-vadas uma vez com 50 mM de MOPS gelado, pH 7,0. As células foram en-tão Iisadas utilizando Bugbuster® (isento de amina primária) Extraction Rea-gent (Novagen Ns de Catálogo 70923-3) (Novagen, Madison, Wl) contendo 1pL/mL de benzonase nuclease (Novagen Ns de Catálogo 70746-3) (Nova-gen, Madison, Wl), 5 pL/mL de Protease Inhibitor Cocktail Set Il (Novagen Nsde Catálogo 539132) (Novagen, Madison, Wl) e 0,33 pL/10 mL de r-Lysozyme (Novagen Ns de Catálogo 71110-3) (Novagen, Madison, Wl) se-guindo o protocolo recomendado pela Novagen. Após a incubação a 25°Cdurante 15 minutos com agitação suave, os restos celulares de cada sus-pensão foram peletizados por centrifugação a 21.000 g durante 15 minutos a4°C. O sobrenadante foi cuidadosamente decantado e analisado como oextrato isento de células. As frações de corpos de inclusão foram isoladasatravés da suspensão das frações de restos celulares em 30% de Bugbus-ter® (isento de amina primária) Extraction Reagent, centrifugando a 21 .OOOxgdurante 10 min; suspendendo as péletes centrifugados em 10% de Bugbus-ter® (isento de amina primária) Extraction Reagent, centrifugando novamentepara isolar as péletes lavados. Os extratos isentos de células e as frações decorpos de inclusão foram analisados em relação à expressão de proteína5 através de SDS-PAGE em géis com gradiente de 4-15% (BioRad Ns 161-1104, Hercules, CA). Para as amostras de extrato celular, vinte microgramasde proteína solúvel foram carregados em cada faixa de gel (pré-misturadoscom tampão de carregamento de proteína 1X e aquecidos a 95°C durante 5min). As frações de corpos de inclusão foram dissolvidas em tampão de car-10 regamento de proteína 1X (0,2 ml_), aquecidas durante 10 minutos a 95°C e5 pL de cada solução foram carregados por faixa de gel. A quantidade decada mutante HEX em comparação com a proteína solúvel total carregadaem cada faixa foi calculada através da análise de intensidade das bandasutilizando a ferramenta Labworks Biolmaging 1D-gel (UVP, Inc. Upland, CA)15 e é relatada abaixo:
Tabela 21
Amostra Proteína HE- XaspC/proteína solúvel totalE. coli BL21 (DE3)::HEXaspCP9T/T156ApET23a CFE 0,310E. coli BL21(DE3)::HEXaspCP9T/R122ApET23a CFE 0,145E coli BL21 (DE3)::HEXaspCpET23a CFE 0,172E. coli BL21 (DE3)::HEXaspCR122A/T156ApET23a CFE 0,174E. coli BL21(DE3)::HEXaspCW130FpET23a CFE 0,114E. coli BL21(DE3)::HEXaspCT156ApET23a CFE 0,120
A análise dos géis mostrou que o mutante HEXasp-
CR122A/T156A era a única proteína que era encontrada em quantidadessubstanciais na forma de corpos de inclusão. A proteína HE-20 XaspCP9T/T156A forneceu o nível mais alto de expressão, aproximadamen-te 90% melhor que a proteína HEXaspC. Em contraste, as proteínas W130F,Τ156Α e P9T/R122G foram expressas em concentrações mais baixas queHEXaspC.
A atividade das proteínas mutantes HEXaspC em relação à pro-dução de S,S-monatina foi medida utilizando as condições de reação a se-5 guir: Cada reação de 1 mL continha 50 mM de TAPS, pH 8,2, 4 mM de Mg-Cl2, 3 mM de fosfato de sódio, pH 8,0, 200 mM de piruvato de sódio (pH a-justado em 8), 5 mM de α-cetoglutarato (pH ajustado em 8), 50 mM de tripto-fano, 0,05 mM de 3-fosfato piridoxal, 50 pg/mL de aldolase ProA (adiciona-dos na forma de um extrato isento de células) e concentrações variáveis (a-10 proximadamente 50 e 500 pg/mL) de aminotransferase (adicionadas na for-ma de um extrato isento de células). Água desaerada foi utilizada para pre-parar as soluções estoque e para ajustar o volume das misturas de reaçãoem 1,0 mL. O fosfato piridoxal foi ajustado logo antes da adição das enzi-mas. Os tubos de reação foram incubados a 30°C com agitação suave du-15 rante 4 h. As amostras (0,01 mL) foram retiradas em 1, 2 e 4 h após a adiçãodas enzimas, filtradas e analisadas por LC/MS/MS, como descrito no Exem-plo 1. A produção de monatina foi normalizada com base na quantidade deaminotransferase presente nas reações. Sob as condições destes ensaios, aHEXaspC e a HEXaspCTI 56A produziram a maior parte da monatina total20 por mg de aminotransferase enquanto a proteína P9T/R122G produziu amenor, seguida pela HEXaspCWI30F. As enzimas HEXaspCWI30F eP9T/R122G exibiam a maior estereosseletividade por S-MP (maior que 98%de S,S-monatina), mesmo quando altas concentrações de enzima foram uti-lizadas (mais que 300 pg/mL). A porcentagem de produto de S,S-monatina25 diminui para menos que 90% nas reações enzimáticas contendo a enzimaP9T/T156A em alta concentração. Os outros mutantes exibiam uma estere-osseletividade para o produto muito similar à do mutante HEXaspC original(aproximadamente 95% de S,S-monatina). A análise do produto da reaçãocontendo a enzima HEXaspC utilizando o reagente de derivatização com30 FDAA descrito no Exemplo 1 mostrou que o segundo estereoisômero forma-do é R,S-monatina.
Análise da atividade de aminotransferase em relação ao triptofano e à mona-tina
Os mutantes foram testados em relação à atividade de transa-minação utilizando S1S monatina e L-triptofano como substratos. A atividadede aminotransferase foi medida seguindo a formação do co-produto da rea-5 ção, glutamato, por HPLC com derivatização pós-coluna com OPA comodescrito no Exemplo 1. A mistura de reação continha, em 1,0 mL, 100 mMde tampão HEPPS, pH 8,0, 20 mM de alfa-cetoglutarato, 0,08 mM de fosfatopiridoxal, 25 mM de triptofano ou S,S monatina e enzima (fornecida como2,5 mg de proteína em extratos celulares). Todos os componentes exceto a10 enzima foram misturados juntos, a enzima foi adicionada no início da reaçãoe a solução de reação foi incubada a 30°C (agitação suave) durante 90 mi-nutos. As reações foram feitas em duplicata, com controles negativos emque não foi adicionada enzima. A reação foi interrompida pela adição de10% de ácido fórmico (concentração final), a mistura foi centrifugada a15 21.000 rpm e o sobrenadante foi removido cuidadosamente e filtrado. Osdados foram corrigidos em relação aos níveis de fundo de glutamato e emrelação à diluição partindo da adição de ácido para precipitar as proteínas,então normalizados por quantidade de aminotransferase mutante adiciona-da. Quando o triptofano foi utilizado como um substrato, a HEXaspC produ-20 ziu 13,0 mM de glutamato por mg de aminotransferase por hora. A atividaderelativa, expressa na forma de uma porcentagem, dos mutantes é como aseguir: HEXaspCWI 30F (156%), HEXaspCTI 56A (151%), HE-XaspCP9T/T156A (63,7%), H EXaspC P9T/R122G (116%) e HEXasp-CR122G/T156A (107%). Quando a S,S monatina foi utilizada como um subs-25 trato, a HEXaspC produziu 7,43 mM de glutamato por mg de aminotransfe-rase por hora. A atividade relativa, expressa na forma de uma porcentagem,dos mutantes é como a seguir: HEXaspCWI 30F (113%), HEXaspCTI56A(87,7%), HEXaspCP9T/T156A (67,3%), HEXaspCP9T/R122G (11,2%) eHEXaspCRI22G/T156A (114%).30 O mutante HEXaspCP9T/R122G aumentou a atividade em rela-
ção ao triptofano para a conversão de indol-3-piruvato, mas diminuiu a ativi-dade em relação à transaminação da S,S monatina. A proporção de ativida-de de triptofano em relação à monatina era de 18,2 em comparação com1,75 em relação à HEXaspC1 tornando um candidato desejável para a pro-dução de R,R monatina utilizando vias que requerem uma L-aminotransferase tal como as descritas nos Exemplos 18 e 19. Como tal, aHEXaspCP9T/R122G é um exemplo de uma aminotransferase com ativida-de limitada sobre a S1S monatina (e MP).
A maioria das mutações aumentou a atividade de L-triptofano,mas apenas dois mutantes aumentaram a atividade em direção tanto ao L-triptofano quanto à S1S monatina (HEXaspCW130F e HEXasp-CR122G/T156A). Devido ao fato de que 25 mM de substrato foram utilizadosnestes ensaios, as enzimas estavam mais provavelmente saturadas e a ati-vidade é um reflexo do kcat das enzimas. Entretanto, sob as condições emque os ensaios para a produção de S1S monatina foram realizados (acima) éimprovável que a concentração de S-MP seja suficiente para saturar a enzi-ma, assim o aumento no kcat não é refletido. Foi relatado, para substratossimilares, que algumas das mutações produziram aumento no kcat. mas tam-bém aumentaram o Km aparente para o substrato de aminoácido. Se con-centrações crescentes de substratos fossem utilizadas, é esperado que es-tes dois mutantes forneceriam um benefício nas taxas de produção de S1Smonatina em comparação com HEXaspC. A mutação HEXaspCTI56A pare-ce ter aumentando as taxas de transaminação do triptofano sem ter um efei-to significativo sobre a taxa de transaminação de MP sob as condições ante-riores para a produção de S,S monatina.
Comparando as estruturas de HEXaspC e uma das enzimas D-aminotransferase de Bacillus sp. (vide, por exemplo, S. Sugio, G.A. Petsko,J.M. Manning, K. Soda e D. Ringe, Biochemistry 34 (1995) pp. 9661-9669),as mutações W130F, R122G, T156A e HEX de AspC podiam ser mapeadasem resíduos correspondentes na estrutura da D-aminotransferase. É espe-rado que mutações similares na D-aminotransferase de especificidade amplaaumentaria a produção geral de R,R monatina como descrito no Exemplo14. Por exemplo, a funcionalidade fornecida pelo triptofano 130 na AspC ésubstituída nas D-aminotransferases de Bacillus pela ligação de hidrogênioentre as cadeias laterais das serinas 179-181 e glutamato 166 (esquema denumeração YM-1). Para diminuir o impedimento estérico, o glutamato pode-ria sofrer mutação em um resíduo de aspartato. Algumas D-aminotransferases possuem um resíduo de treonina na posição 179, que5 aumentaria o impedimento estérico e devem ser evitadas. A enzima de B.sphearicus possui uma alanina no lugar de serina na posição 181, que podetambém reduzir o impedimento estérico.
Informação adicional proveniente de estudos de aspartato ami-notransferase pode ser aplicada à D-aminotransferase também. Embora a10 enzima AspC possua uma arginina no sítio ativo que interage com a cadeialateral de substratos dicarboxilados, a D-aminotransferase possui uma alçade Ser240 até Ser243. As cadeias laterais de Ser240, Thr242 e Ser243 fi-cam voltadas para a mesma direção e formam uma bolsa com o grupo hi-droxila da Ser180 que fornece uma superfície para que substratos tanto não-15 polares quanto polares possam interagir. A Ser180 está envolvida na ligaçãode PLP; entretanto, para aumentar a atividade de uma D-aminotransferasecom R-MP, podem ser modificados os resíduos de Ser240, Thr242 ouSer243 para aceitarem substratos maiores ou para favorecer substratos car-regados negativamente. Por exemplo, a Thr242 pode sofrer mutação para20 Ser para reduzir o comprimento da cadeia lateral. Um dos resíduos pode sermutado para Iisina ou arginina, tal como Ser243. Os resíduos (numeraçãoYM-1) Val30-Val36 ficam localizados em um filamento beta ao longo do sítioativo da D-aminotransferase e também são importantes para a atividade.Acredita-se que Tyr31, Val33, Glu32 e Lys35 ficam voltados para o sítio ati-25 vo. Tyr31, Glu32 e Val33 são invariáveis em todos os homólogos de Bacillus.Ro e outros (FEBS Lett 398 (1996) pp. 141-145) mutaram Val33 em Ala eobservaram uma eficiência catalítica ligeiramente maior em relação à tran-saminação de alfa-cetoglutarato e uma eficiência catalítica significativamentemaior em relação a substratos mais volumosos (menor impedimento estéri-30 co). Em alguns homólogos a Lys35 é substituída por Arg, mas se o impedi-mento estérico for uma preocupação o resíduo Lys é preferível. As valinas34 e 36 são também preferíveis em relação às substituições conservativastal como isoleucina, novamente devido ao menor impedimento estérico paramoléculas grandes tal como MP.Exemplo 17
Clonagem. Expressão e Teste de Glutamato e Aspartato Racemases
Este exemplo descreve métodos utilizados para clonar e testarenzimas aminoácido racemases, que podem ser utilizadas para a intercon-versão entre L-glutamato e D-glutamato (ou L- e D-aspartato ou L- e D-alanina). As glutamato, aspartato ou alanina racemases são úteis em umavide biossintética para produzir R,R monatina quando uma etapa em que avide produz um L-aminoácido (tal como L-glutamato, L-aspartato ou L-alanina) e uma outra etapa na vide consome um D-aminoácido (tal como D-glutamato, D-aspartato ou D-alanina). A figura 4 ilustra uma vide biossintéti-ca para a produção de R1R monatina partindo de L-triptofano utilizando umaaminotransferase específica ao L-triptofano, uma aldolase específica a R,uma D-aminotransferase e uma glutamato (ou aspartato ou alanina) racema-se.
Os genes foram clonados nos vetores pET28 e pET30 para ge-rar tanto proteínas não marcadas quanto proteínas de fusão com HIS6-Tag/T7-Tags N-terminais que podem ser clivadas. As proteínas resultantesforam purificadas utilizando cromatografia por afinidade com metal imobiliza-do.
Resumo Experimental
Os genes que codificam as glutamato racemases (EC 5.1.1.3)de Lactobacillus brevis (N° de Acesso do Genbank D29627, seqüência deácido nucléico) e de Pediococcus pentosaeeus (gene murl) (N° de Acessodo Genbank L22789) foram clonados e expressos em E. eoli. Os extratosforam testados em relação à atividade na conversão de L-glutamato em D-glutamato e de D-glutamato em L-glutamato. A enzima aspartato racemaseda BioCataIytics (EC 5.1.1.13) (BioCatalytics, Pasadena, CA) também foitestada em relação à interconversão entre L- e D-aspartato.Isolamento de DNA Genômico para Clonagem
O DNA genômico de L. brevis (ATCC 8287D) foi obtido na Ame-rican Type Culture Collection. Ρ. pentosaceus (ATCC 25745) foi cultivado a37°C em caldo MRS de Iactobacillie 2 mL foram utilizados para o isolamentodo DNA genômico utilizando o método de Mekalanos JJ. Duplication andamplification of toxin genes in Vibrio cholerae. Cell. 1983. 35:253-63.5 Protocolo da Reação em Cadeia da Polimerase
Os iniciadores foram planejados com sítios de restrição a 5' epontas coesivas para clonagem nos vetores pET 28 e pET30 (Novagen, Ma-dison, Wl).
Iniciadores para a glutamato racemase de L. brevis:10 N term: 5'-GCGGCGCCATGGAAAATGATCCGATTGGTCTAATG -3' (SEQID NO: 401) e
C term: Õ^GCGGCGGTCGACGCAATTACAATTGTGTTTGTC-S' (SEQ IDNO: 402).
P. pentosaceus glutamato racemase iniciadores:15 N term: 5'- GCGGCGCCATGGATGTATGTATAATTTTATTTAG -3' (SEQ IDNO: 403) e
C term: 5'-GCGGCGGTCGACAAATTTCATTATTCATTCTAATTT -3' (SEQID NO: 404).
O gene derivado de L. brevis foi amplificado utilizando o protoco-20 Io de PCR a seguir. Em uma reação de 50 μ!_ 0,150 pg de molde, 1,6 μΜ decada iniciador, 0,4 mM de cada dNTP, 2,8 U de Expand High Fidelity® Poly-merase (Roche, Indianapolis, IN), 0,5 U de Pfu polymerase (Stratagene, LaJolla, CA) e 1X tampão Expand® com Mg foram utilizados. O programa dotermociclador utilizado incluía um início a quente a 96°C durante 3 minutos,25 8 repetições das etapas a seguir: 94°C durante 30 segundos, 52°C durante45 segundos e 72°C durante 2 minutos, seguidos por 22 repetições das eta-pas a seguir: 94°C durante 30 segundos, 60°C durante 45 segundos e 72°Cdurante 2 minutos. Após as 22 repetições a amostra foi mantida a 72°C du-rante 7 minutos e então armazenada a 4°C. Este protocolo de PCR obteve30 um produto de -830 pb, que é julgado através da comparação com marca-dores de tamanho de DNA.
O gene derivado de P. pentosaceus foi amplificado utilizando oprotocolo de PCR a seguir. Em uma reação de 50 μΙ_, 0,15 μς de molde, 1,6μΜ de cada iniciador, 0,4 mM de cada dNTP, 2,8 U de Expand High Fidelity®Polymerase, 0,5 U de Pfu polymerase e 1X tampão Expand® com Mg foramadicionados. O programa do termociclador utilizado incluía um início a quen-5 te a 96°C durante 3 minutos, seguidos por 8 repetições das etapas a seguir:94°C durante 30 segundos, 37°C durante 45 segundos e 72°C durante 2 mi-nutos, seguidos por 8 repetições das etapas a seguir: 94°C durante 30 se-gundos, 45°C durante 45 segundos e 72°C durante 2 minutos, seguidos por14 repetições das etapas a seguir: 94°C durante 30 segundos, 55°C durante10 45 segundos e 72°C durante 2 minutos. Após as 14 repetições a amostra foimantida a 72°C durante 7 minutos e então armazenada a 4°C. Este protoco-lo de PCR obteve um produto de -840 pb, que é julgado através da compa-ração com marcadores de tamanho de DNA.Clonagem
15 Os produtos da PCR foram purificados em gel partindo de géis
de TAE-agarose a 0,8% utilizando o kit de extração do gel da Qiagen (Qia-gen, Valencia, CA). Os produtos da PCR foram quantificados utilizando umespectrofotômetro SmartSpec 3000®. Os produtos foram digeridos com asenzimas de restrição Ncol e Sall seguindo os protocolos recomendandos20 pelo fabricante (New England Biolabs, Beverly, MA) e purificados em gel par-tindo de géis de TAE-agarose a 0,8% utilizando o kit de extração do gel daQiagen (Qiagen, Valencia, CA). Os vetores pET28 e pET30 foram prepara-dos através da digestão com enzimas de restrição Ncol e Sall seguidos pelotratamento com fosfatase alcalina de camarão e pela purificação partindo de25 géis de TAE-agarose a 0,8% utilizando o kit de extração do gel da Qiagen(Qiagen, Valencia, CA).
Os vetores e os insertos digeridos foram ligados utilizando o Ra-pid ® DNA Ligation Kit (Roche, Indianapolis, IN). Aproximadamente 50 ng deinserto tratado, 100 ng de vetor tratado (proporção molar de 3 para 1 de in-30 serto em relação ao vetor), 5 U de T4 DNA Iigase e 1X tampão de ligaçãoforam incubados durante 5 minutos à temperatura ambiente. As reações deligação foram purificadas utilizando o High Pure PCR Product Purification Kit(Roche, Indianapolis, IN) e utilizadas para transformar células eletrocompe-tentes de E. coli DH10B (Invitrogen1 Carlsbad, CA). Dez pL de cada reaçãode ligação foram adicionados em 40 pL de células DH10B e foram transfor-mados por eletroporação utilizando o Bio-Rad Gene Pulser Il (Bio-Rad, Her-5 cules, CA) sob as condições a seguir: 2,5 kV, 25 pF, 200 ohm em uma cube-ta de 0,2 cm. Foi permitido que as células se recuperassem em 1 mL deSOC à temperatura ambiente durante 1 hora a 37°C com agitação a 225rpm. As células foram plaqueadas em placas de LB contendo canamicina(50 pg/mL).
10 O DNA plasmideal foi purificado dos transformantes resultantes
utilizando o Qiagen spin miniprep kit (Qiagen, Valencia, CA) e verificados emrelação aos insertos corretos por digestão de restrição com Nco\ e Sa/I. Asseqüências de plasmídeos que pareciam possuir o inserto correto foram veri-ficadas através do seqüenciamento de DNA com terminação de cadeia dide-15 sóxi.
Expressão Gênica e Ensaios
O DNA plasmideal, verificado através da análise de seqüência,foi subclonado no hospedeiro de expressão de E. coli BL21(DE3) (Novagen,Madison, Wl). As culturas foram crescidas. Os plasmídeos foram isolados20 utilizando um Qiagen miniprep kit (Qiagen, Valencia, CA) e analisados atra-vés da digestão de restrição para confirmar a identidade.
A indução em BL21(DE3) foi realizada inicialmente com as glu-tamato racemases de L. brevis e P. pentosaceus tanto em vetores pET28(não marcado) quanto pET 30 (com marcação de histidina). Um estudo du-25 rante o curso de tempo foi realizado com culturas crescidas em 250 mL deLB contendo canamicina (50 mg/L) até uma D06oo de 0,5 - 0,6, induzidascom 100 mM de IPTG (isopropil tiogalacatosídeo) e foram tiradas amostrasem 0 e 3 horas após a indução. As células de 600 pL (0 hora) e 275 pL (3horas) foram ressuspensas em 40 pL de tampão dodecil sulfato de sódio30 contendo 2-mercaptoetanol, aquecidas a 95°C durante 10 minutos e resfria-das. As alíquotas destas amostras de proteína celular total foram analisadaspor SDS-PAGE utilizando um gel de gradiente de 4-15%.Os extratos de células também foram preparados partindo dasculturas de 3 horas através da ressuspensão dos péletes de células de 5 mLde cultura em 0,625 mL de reagente Novagen BugBuster® (Novagen, Madi-son, Wl) contendo 0,625 pL de benzonase nuclease e 3 pL do conjunto # 35 de coquetel de inibidor de protease (Calbiochem-Novabiochem Corp., SanDiego, CA) à temperatura ambiente durante 20 minutos com agitação suavee centrifugação a 16.000 χ g para remover os restos celulares. Os sobrena-dantes (extratos de células) foram carregados em géis com gradiente de 4-15% para a análise das proteínas solúveis celulares.10 As amostras de 3 horas da glutamato racemase de L. brevis e
da glutamato racemase de P. pentosaceus clonadas exibiam proteína tantototal quanto solúvel que correspondia ao tamanho correto (aproximadamente31 kDa). O produto gênico de pET30 de L. brevis (com marcação de histidi-na) foi superexpresso em um nível maior e era também mais solúvel (>20%15 de proteína solúvel) que o produto gênico de pET 28 de L. brevis (não mar-cado), assim como os produtos gênicos de P. pentosaceus em ambos osvetores. O produto gênico de P. pentosaceus exibia superexpressão e solu-bilidade equivalentes nos vetores pET28 e pET30, que eram significativa-mente menores que os observados para o produto gênico de pET30 de L20 brevis.
As células das culturas induzidas (250 mL) foram centrifugadase lavadas uma vez com 0,85% de NaCI. Os péletes de células foram ressus-pensos em 5 mL/g de peso úmido de célula de reagente BugBuster® (Nova-gen, Madison, Wl) contendo 5 pL/mL do conjunto # 3 de coquetel de inibidor25 de protease (Calbiochem-Novabiochem Corp., San Diego, CA) e 1 pL/mL debenzonase nuclease. As amostras foram incubadas à temperatura ambientedurante 20 minutos em um agitador orbital. Os restos celulares insolúveisforam removidos por centrifugação a 16.000 X g durante 20 minutos a 4°C.
Os extratos de células foram analisados em relação à atividade30 de glutamato racemase utilizando o protocolo a seguir. Reações de 400 pLforam realizadas em 10 mM de fosfato de potássio (pH 8,0), 0,2 mM de DTTe 10 mM de L-glutamato ou D-glutamato. As reações foram iniciadas atravésda adição de 20-100 μΙ_ de extratos isentos de células e foram incubadas àtemperatura ambiente. Alíquotas de amostras foram tiradas ao longo de umcurso de tempo de 1 minuto, 5 minutos, 10 minutos, 20 minutos e 1 hora (asamostras em zero minuto serviam como reações de controle). 2 M de ácidofórmico (25 μΙ_) foram adicionados em cada alíquota de amostra de 40 pLpara interromper a reação e a proteína precipitada foi removida por centrifu-gação. Os sobrenadantes foram removidos e congelados a -80°C até seremanalisados por LC/MS/MS.
Os resultados dos ensaios de extratos de células provenientesda indução de pET30 com 100 mM de IPTG (3 horas) demonstram que asenzimas de L brevis (N- de Acesso do Genbank BAA06106.1 Gl:468450) ede P. pentosaceus (N2 de Acesso do Genbank AAA16761,1 Gl:349029) pos-suem níveis significativos de atividade de racemase sobre ambos os isôme-ros de glutamato. A racemase de P. pentosaceus (20 μΐ_ de extratos celula-res) atingiu o equilíbrio entre L- e D-glutamato em 10-20 minutos partindo dequalquer um dos substratos. A enzima de L. brevis (20 μΙ_ de extratos celula-res) também atingiu o equilíbrio em aproximadamente 20 minutos.
Uma enzima aspartato racemase parcialmente purificada (# deCatálogo ASPR-101) obtida na BioCataIytics, Inc. (Pasadena, CA) foi anali-sada em relação à atividade sobre L-aspartato e D-aspartato utilizando umprotocolo similar ao anterior. A enzima comercial exibia atividade de race-mase sobre ambos os isômeros. Utilizando 0,5-1 mg de enzima, o equilíbriofoi alcançado em 20-60 minutos.
Todas as três racemases (glutamato racemase de L. brevis, glu-tamato racemase de P. pentosaceus e aspartato racemase da BioCataIytics)também foram analisadas em relação à atividade sobre S,S monatina utili-zando o protocolo a seguir. Reações de 400 μί foram realizadas em 10 mMde fosfato de potássio (pH 8,0), 0,2 mM de DTT e 10 mM de S,S monatina.As reações foram iniciadas através da adição de extratos isentos de células(L. brevis e P. pentosaceus) ou da enzima purificada (aspartato racemase daBioCataIytics) e foram incubadas à temperatura ambiente. Alíquotas dasamostras foram tiradas ao longo de um curso de tempo de 1 minuto, 5 minu-tos, 10 minutos, 20 minutos e 1 hora (as amostras em zero minuto serviamcomo reações de controle assim como as amostras sem enzima). 2 M deácido fórmico (25 μL) foram adicionados em cada alíquota de amostra de 40μLpara interromper a reação e a proteína precipitada foi removida por cen-trifugação. Os sobrenadantes foram removidos e congelados a -80°C atéserem analisados por LC/MS/MS (Exemplo 1). Nenhum decréscimo na con-centração de S,S monatina foi observado ao longo do tempo, nem haviaqualquer aumento na S,R monatina (presente inicialmente como <5% desubproduto contaminante, mesmo no controle sem enzima). Portanto, ne-nhuma das racemases analisadas exibia atividade em direção à monatina.
Exemplo 18
Produção de R1R Monatina partindo de L-triptofano Utilizando Glutamato ouAspartato Racemases
Este exemplo descreve métodos de produção de R,R monatinaenriquecida de forma estereoisomérica partindo de L-triptofano utilizandouma L-triptofano (L-tirosina ou aromática) aminotransferase, aldolase ProA,glutamato ou aspartato racemase e uma D-aminoácido aminotransferase deespecificidade ampla. A figura 5 é um diagrama que ilustra a vide. Esta a-bordagem para a produção de R,R monatina enriquecida de forma estereoi-somérica requer uma enzima para a etapa 1 que possui baixa atividade naprodução de monatina partindo do precursor de monatina (MP). Com basenos resultados anteriores, foram utilizados os produtos do gene tata de Sino-rhizobium meliloti e Rhodobacter sphaeroides descritos no Exemplo 1 daWO 03/091396 A2.
Materiais e Métodos
As glutamato racemases de L brevis e P. pentosaceus foramproduzidas em E. coli como descrito no Exemplo 17. Em alguns casos a ver-são Hise-tagged destas enzimas foi purificada utilizando cartuchos His-Bind900 de acordo com os protocolos do fabricante (Novagen, Madison, Wl) e foidessalinizada para remover imidazol utilizando colunas PD-10 (G25 Sepha-dex, GE Healthcare, Piscataway, NJ). As enzimas foram eluídas em 25 mMde fosfato de potássio pH 8,0. A aspartato racemase (ASPR-101) e a D-aminotransferase (AT-103) foram obtidas na BioCataIytics, Inc. (Pasadena,CA). As tirosina (aromática) aminotransferases de S. meliloti e R. sphaeroi-des foram preparadas como descrito no Exemplo 1 da WO 03/091396 A2. Aaldolase ProA de Comamonas testosteroni foi preparada como descrito noExemplo 4 da WO 03/091396 A2. Os ensaios de proteínas totais foram feitosutilizando o Ensaio de Proteínas da Bio-Rad de acordo com os protocolos dofabricante (Hercules, CA).
Redução na quantidade de S.S monatina produzida utilizando racemases
As misturas de reação (1 mL de volume, corridas em duplicata)continham 100 mM de tampão de fosfato de potássio (pH 8), 2 mM de Mg-Cl2, 0,05 mM de 5'-fosfato piridoxal (PLP), 200 mM de piruvato de sódio, 5mM de α-cetoglutarato ou oxaloacetato de sódio, aproximadamente 280pg/mL de TatA de S. meliloti fornecidos em um extrato celular, 1 mg/mL deD-aminotransferase da BioCataIytics (AT-103) (BioCatalytics, Pasadena,CA), 100 pL/mL de extrato celular de glutamato racemase ou 1 mg/mL deaspartato racemase e aproximadamente 100 pg/mL de aldolase ProA forne-cida na forma de um extrato celular. O triptofano sólido foi adicionado a umaconcentração de 10,2 mg/mL. Os controles negativos não continham race-mase. As amostras foram incubadas a 30°C (agitando a 250 rpm) durante 1hora, 2 horas ou durante a noite. As amostras foram centrifugadas para re-mover precipitado, filtradas em seringa e armazenadas a -80°C antes da a-nálise em relação à monatina utilizando o método de LC/MS/MS descrito noExemplo 1. A maior parte das amostras continha >95% de S1S monatina,devido às quatidades de L-aminotransferase nativa presente nos extratoscelulares. Entretanto, as amostras que continham racemase tinham umaquantidade reduzida de monatina total como um resultado das enzimas ra-cemases tornando o L-glutamato menos disponível para a transaminação deMP. Sem racemase, 1545-2355 ppm de monatina (predominantemente S,S)foram produzidas durante o curso de tempo. Com as racemases presentes,apenas 340-879 ppm (enzima de L. brevis), 444-531 ppm (enzima de P. pen-tosaceus) e 506-1460 ppm de monatina (aspartato racemase) foram produ-zidas. Estes dados indicam que as racemases são ativas nas condições dereação requeridas para produzir monatina. Para minimizar a formação deS1S monatina partindo de enzimas do extrato celular tais como aspartatoaminotransferases, foram realizados experimentos adicionais com enzimaspurificadas e uma proporção maior de enzimas D-aminotransferases em re-lação à L-aminotransferases.
Conversão de L-triptofano em 4-R contendo isômeros de Monatina
Os experimentos anteriores foram repetidos utilizando aproxi-madamente 54 pg de L-aminotransferase purificada (TatA de S. meliloti oude R. sphaeroides), 1 mg de aspartato aminotransferase (BioCatalytics, Pa-sadena, CA), 1 mg de D-aminotransferase, oxaloacetato como o receptor deamino e 75 pg de aldolase purificada. As reações foram corridas em duplica-ta com um tempo de amostragem de 2 horas e um tempo de incubação du-rante a noite. Os controles negativos foram feitos com L-aminotransferase deS. meliloti, mas sem racemase. Em adição à quantificação do pico deR,R/S,S e S,R/R,S monatina com base na cromatografia em fase inversa, aporcentagem de cada estereoisômero foi determinada utilizando a técnica dederivatização com FDAA descrita no Exemplo 1. Os resultados são como aseguir:
Tabela 22
<table>table see original document page 401</column></row><table><table>table see original document page 402</column></row><table>Claramente a presença da racemase aumentava a quantidadetotal de monatina produzida quando TatA de S. meliloti era utilizada como aenzima para a transaminação de L-triptofano. Os níveis de monatina aumen-taram de uma média de 6,4 para 16,5 ppm no ensaio de duas horas e de 41-73 ppm no ensaio durante a noite. Adicionalmente, a porcentagem de R,Rformada aumentava de aproximadamente 1% até tanto quanto 58% atravésda utilização da enzima racemase. O estereoisômero S,R de monatina, umoutro adoçante potente, era o outro componente mais abundante, aumen-tando de aproximadamente 0 nos controles negativos para 31%. A TatA deR. sphaeroides claramente tinha mais atividade sobre S-MP que a L-transaminase de S. meliloti, demonstrando a importância de ter uma enzimaque possui uma alta especificidade pelo substrato em relação ao L-triptofanoquando comparado com MP quando os isômeros 4-R de monatina são osprodutos desejados. Com aproximadamente 10% da monatina total sendo4S no ponto de tempo de duas horas, a TatA de S. meliloti poderia ser con-siderada como tendo atividade limitada sobre MP.
Os experimentos foram repetidos com a TatA de S. meliloti (54pg) e a glutamato racemase de L. brevis purificadas. Quando a glutamatoracemase purificada foi utilizada, aproximadamente 64 pg foram utilizadospor reação de 1 mL. Os extratos celulares contendo a glutamato racemasetambém foram testados e 1,4 mg de proteína solúvel foi utilizado. Um contro-le negativo sem racemase foi utilizado novamente e todas as amostras fo-ram corridas em duplicata. Os resultados são como a seguir:
Tabela 23
<table>table see original document page 403</column></row><table>
Novamente, é evidente que a adição da racemase aumenta amonatina total produzida partindo do L-triptofano, assim como aumenta asquantidades relativas de isômeros contendo 4R de monatina quando compa-radas com as de S1S monatina. O uso de aldolase, racemase e L-aminotransferase purificadas aumenta enormemente a capacidade de con-trolar a formação do estereoisômero desejado. A proporção de L em relaçãoà D aminotransferase também é uma forma de manipular a estereoquímicado produto final.
Quando os resultados mostrados nas Tabelas 18 e 19 no Exem-pio 13 são comparados com os resultados com condições de reação simila-res às condições acima, pode ser observado que aproximadamente 7-29ppm de monatina foram formadas partindo de indol-3-piruvato e as porcen-tagens de R,R monatina formadas eram aproximadamente 51-90%. A utili-zação da aspartato racemase aumentou a quantidade total de monatina pro-duzida para 16-78 ppm de monatina com uma % de R1R de aproximadamen-te 40-58%. Adicionalmente, um material bruto mais estável e menos dispen-dioso, o L-triptofano, foi utilizado. N0 Exemplo 14, aproximadamente 73 ppmde monatina foram produzidas partindo do D-triptofano em uma proporçãode R,R:S,R de aproximadamente 1,7:1. A quantidade total de isômeros 4Rera >80% da monatina total. Devido ao fato de que tanto a R,R-monatinaquanto a S.R-monatina são adoçantes potentes (>1000 vezes mais docesque a sacarose) a capacidade de enriquecer estes isômeros sem a necessi-dade de substratos de D-aminoácidos caros é crítica.
Como descrito nos Exemplos 13 e 14, a D-alanina pode servircomo o doador de amino para a transaminação de MP em monatina. MuitasL-aminotransferases possuem a capacidade de utilizar piruvato como umreceptor de amino até alguma extensão e produzir L-alanina. Devido ao fatode que as reações mencionadas anteriormente utilizarem altas concentra-ções de piruvato, é provável que parte do piruvato seja convertida em L-alanina. Por exemplo, durante a transaminação do L-triptofano, foi descober-to que a enzima HexAspC descrita no Exemplo 16 converte 10-18% de piru-vato (50-200 mM de concentrações iniciais) em L-alanina em 2 horas se oalfa-cetoglutarato estiver ausente. A enzima exibiu uma preferência de 10vezes pelo alfa-cetoglutarato quando ambos os receptores de amino esta-vam presentes em concentrações altas (>50 mM). A AspC (descrita na WO03/091396 A2) também produzia alguma L-alanina partindo do piruvato. Por-tanto, é esperado que se possa omitir a adição de alfa-cetoglutarato ou deoxaloacetato nas reações anteriores e utilizar uma alanina racemase (EC5.1.1.1) no lugar da glutamato ou aspartato racemase. As enzimas alaninaracemases foram primeiramente identificadas em Brucella abortus e Strepto-coccus faecalis (Marr, A.G. e Wilson, P.W. Arch. Biochem. Biophys., 49(1954) 424-433 e Wood1 W.A. e Gunsalus1 I.C. J. Biol. Chem., 190 (1951)403-416). O gene dadB em Salmonella typhimurium foi identificado como afonte de atividade de alanina racemase e várias centenas de homólogos po-dem ser encontradas em bancos de dados genômicos. Outras fontes conhe-cidas de atividade de alanina racemase são Escherichia coli, Bacillus subti-lis, Pseudomonas aeruginosa, Vibrio eholerae, Schizosaccaroyces pombe eBacillus eereus. Um cogumelo basidiomiceto, Lentinus edodes, também con-tém uma alanina racemase de atividade ampla. Um homólogo termoestávelde Bacillus stearothermophilus está disponível para compra na Sigma-Aldrich (# de Catálogo A8936) (Sigma-AIdrich, St. Louis1 MO) e foi imobiliza-do para aplicações comerciais (lnagaki, K., Biochemistry, 25: 3268 1986).Uma alanina racemase é convertida em uma glutamato ou aspartato race-mase através de métodos aleatórios tal como PCR mutagênica, passagematravés de cepas mutagênicas ou outros métodos conhecidos pelos versa-dos na técnica. Uma evolução mais focalizada da alanina racemase estácentralizada nos resíduos de sítios ativos, incluindo Lys129, Met134 e osresíduos incluindo e entre Gly283 e Trp288 (numeração de Bacillus stearo-thermophilus).
Exemplo 19
D-fenilglicina aminotransferase (D-4-hidroxifenilglicina aminotransferase)Como mostrado na figura 3, a D-fenilglicina aminotransferase éútil em uma vide biossintética para a produção de monatina. Por exemplo, aD-fenilglicina aminotransferase produz R1R monatina partindo de R-MP comL-glutamato como o doador de amino.
Síntese através da PCR de 4 D-hidroxifenilglicina aminotransferase de P.stutzeri partindo de iniciadores de oligonucleotídeo
Este exemplo descreve métodos que foram utilizados para sinte-tizar 4 D-hidroxifenilglicina aminotransferase, uma enzima de estereoinver-são que pode ser utilizada para converter o precursor R de monatina em R1Rmonatina utilizando L-glutamato como o doador de amino.Planejamento dos Iniciadores
A seqüência publicada (N2 de Acesso do Genbank AY319935,seqüência de ácido nucléico; N0 de Acesso do Genbank AAQ8290, seqüên-cia de proteína) para 4 D-hidroxifenilglicina aminotransferase de Pseudomo-nas stutzeri (4 D-HPG AT) foi utilizada como um molde para o planejamentode iniciadores da PCR. Alternativamente, a 4-D-hidroxifenilglicina amino-transferase de Pseudomonas putida, (CAD42450 (proteína), AX467211 (nu-cleotídeo)) é utilizada como um molde de seqüência. Foi planejado um totalde 34 iniciadores para frente e 35 iniciadores inversos; os iniciadores parafrente e inversos eram 40-mers compartilhando 20 pares de bases sobrepos-tos. Em adição, 2 iniciadores externos foram planejados com sítios de restri-ção a 5' e pontas coesivas para clonagem nos vetores pET 28 e pET30 (No-vagen, Madison, Wl).
Iniciadores externos de 4 D-HPG AT de P. stutzerr. N term (com o sítio Nde I):
5'-GGCCGGCATATGTCGATCCTTAACGACTACAAACGT -3' (SEQ ID NO:405) e C term (com o sítio Xho\)\
5'-GGAAGGCTCGAGTCATGATTGGTTTCCAGACAAATT -3' (SEQ ID NO:406).
Protocolo da Reação em Cadeia da Polimerase
A seqüência gênica de P. stutzeri foi amplificada utilizando osprotocolos a seguir. A reação de PCR primária de 100 μΙ_ incluía 0,05 μΜ decada um dos 69 iniciadores internos, 0,4 mM de cada dNTP, 10 U de xTthPolymerase XL (Roche, Indianapolis, IN), 0,625 U de Pfu polymerase (Stra-tagene, La Jolla, CA), 1X tampão XL e 1 mM de Mg(OAc)2. O programa dotermociclador utilizado incluía um início a quente a 94°C durante 3 minutos,repetições das etapas a seguir: 94°C durante 30 segundos, 42°C durante30 segundos e 68°C durante 15 segundos, seguidos por 10 repetições dasetapas a seguir: 94°C durante 30 segundos, 52°C durante 30 segundos e68°C durante 30 segundos, seguidos por 10 repetições das etapas a seguir:94°C durante 30 segundos, 60°C durante 30 segundos e 68°C durante 1 mi-nuto e 15 segundos. Após os 10 ciclos finais a amostra foi mantida a 68°Cdurante 7 minutos e então armazenada a 4°C. Este protocolo de PCR pro-duziu um esfregaço de produto em -0,5 kb em um gel de TAE-agarose a0,8%.
A reação de PCR secundária foi ajustada utilizando a reação dePCR primária como molde. A reação de PCR secundária de 100 pL incluía2,5 pL da reação de PCR primária, 0,5 pM de cada dos 2 iniciadores exter-nos (com sítios de restrição de NdeI e Xho\), 0,4 mM de cada dNTP, 10 U derTth Polymerase XL, 0,625 U de Pfu polymerase, 1X tampão XL e 1 mM deMg(OAc)2- O programa do termociclador utilizado incluía um início a quentea 94°C durante 3 minutos, 10 repetições das etapas a seguir: 94°C durante30 segundos, 52°C durante 30 segundos e 68°C durante 1 minuto e 30 se-gundos, seguidos por 15 repetições das etapas a seguir: 94°C durante 30segundos, 60°C durante 30 segundos e 68°C durante 1 minuto e 30 segun-dos. Após as 15 repetições, a amostra foi mantida a 68°C durante 7 minutose então armazenada a 4°C. Este protocolo de PCR produziu uma banda deproduto distinta em ~1,4 kb em um gel de TAE- agarose a 0,8%.
O produto da PCR foi purificado em gel partindo do gel de TAE-agarose a 0,8% utilizando o kit de extração do gel da Qiagen (Qiagen, Va-lencia, CA). O produto foi clonado em TOPO e transformado em células TOPde acordo com o protocolo do fabricante (Invitrogen, Carlsbad, CA). ODNA plasmideal foi purificado dos transformantes resultantes utilizando oQiagen spin miniprep kit (Qiagen, Valencia, CA) e verificado em relação aosinsertos corretos través da digestão de restrição com NdeI e Xhol As se-qüências de plasmídeos que pareciam ter o iserto correto foram verificadasatravés do seqüenciamento de DNA com terminação de cadeia didesóxi cominiciadores universais M13 para frente e M13 inversos. Dos 10 clones se-qüenciados, todos tinham pelo menos uma mutação partindo da seqüênciadesejada. O melhor clone tinha uma mutação de um único par de bases queresultou em uma alteração de aminoácido. A seqüência deste clone foi corri-gida utilizando o protocolo QuickChange Mutagenesis de acordo com as re-comendações do fabricante (Stratagene, La Jolla, CA).
O clone TOPO corrigido foi digerido com as enzimas de restriçãoNdel e Xho\ seguindo os protocolos recomendandos pelo fabricante (NewEngland Biolabs, Beverly, MA) e purificado em gel partindo de géis de TAE-agarose a 0,8% utilizando o kit de extração do gel da Qiagen (Qiagen, Va-lencia, CA). Os vetores pET 28 e pET 30 foram preparados através da diges-tão com as enzimas de restrição Ndel e Xhol seguida pelo tratamento comfosfatase alcalina de camarão e a purificação de géis de TAE-agarose a0,8% utilizando o kit de extração do gel da Qiagen (Qiagen, Valencia, CA).
Os vetores e o inserto digeridos foram ligados utilizando o NEBQuick Ligation Kit (Beverly, MA). Aproximadamente 50 ng de inserto tratado,100 ng de vetor tratado (proporção molar de 3 para 1 de inserto em relaçãoao vetor), 5 U de T4 DNA ligase e 1X tampão de ligação foram incubadosdurante 5 minutos à temperatura ambiente. A mistura de ligação foi trans-formada em células quimicamente competentes TOPIOF' (Invitrogen, Carls-bad, CA). Foi permitido que as células se recuperassem em 0,25 mL deSOC à temperatura ambiente durante 1 hora a 37°C com agitação a 225rpm. As células foram plaqueadas em placas de LB contendo canamicina(50 pg/mL). O DNA plasmideal é purificado dos transformantes resultantesutilizando o Qiagen spin miniprep kit (Qiagen, Valencia, CA) e verificado emrelação aos insertos corretos através da digestão de restrição com NdeI eXhol.
Expressão Gênica e Ensaios
O DNA plasmideal foi transformado no hospedeiro de expressãode E. coli BL21(DE3) (Novagen, Madison1 Wl). As culturas foram crescidas eos plasmídeos foram isolados utilizando o Qiagen miniprep kit (Qiagen, Va-lencia, CA) e analisados através da digestão de restrição para confirmar aidentidade.
A indução em BL21(DE3) é inicialmente realizada com 4 D -HPG de P. stutzerí em ambos os vetores pET 28 (com marcação de histidi-na) e pET 30 (não marcado). Um estudo ao longo do tempo é realizado comculturas crescidas em 250 mL de LB contendo canamicina (50 mg/L) atéuma DOeoo de 0,5 - 0,6, induzidas com 100 mM de IPTG (isopropil tiogalaca-tosídeo) e foram tiradas amostras em 0 e 3 horas após a indução. Um volu-me apropriado de células de 0 hora e 3 horas é ressuspenso em 40 pL detampão dodecil sulfato de sódio contendo 2-mercaptoetanol e aquecido a95°C durante 10 minutos e resfriado. As alíquotas destas amostras de prote-ínas celulares totais são analisadas por SDS-PAGE utilizando um gel degradiente de 4-15%.
Os extratos de células também são preparados partindo de cul-turas de 3 horas através da suspensão dos péletes de células de 5 mL decultura em 0,625 mL de reagente Novagen BugBuster® (Novagen, Madison1Wl) contendo 0,625 μΙ_ de benzonase nuclease e 3 pL de conjunto # 3 decoquetel de inibidor de protease (Calbiochem-Novabiochem Corp., San Die-go, CA) à temperatura ambiente durante 20 minutos com agitação suave ecentrifugação a 16.000 χ g para remover restos celulares. Os sobrenadantes(extratos de células) são carregados em géis com gradiente de 4-15% para aanálise das proteínas solúveis celulares. Quando necessário, a proteína épurificada utilizando cartuchos His-Bind 900 de acordo com os protocolos dofabricante (Novagen, Madison, Wl) e é dessalinizada para remover imidazolutilizando colunas PD-10 (G25 Sephadex, GE Healthcare, Piscataway, NJ).Organismos com D-fenilglicina aminotransferase (DPGAT)
Os organismos do gênero Pseudomonas e gêneros similares,com uma D-fenilglicina aminotransferase de estereoinversão (também cha-mada de D-4-hidroxifenilglicina aminotransferase) são isolados da maneira aseguir. Amostras de solo são incubadas em placas de Petri com o meio aseguir: (por litro) 15 g de Ágar, 3,4 g de KH2PO4, 3,55 g de Na2HPO4, 0,2 gde MgS04-7H20, 8 mg de CaCI2-2H20, 10 mg de extrato de levedura, 1 mLde solução 1000x de elementos traços, 1 g de D-fenilglicina (D-4-hidroxifenilglicina).
Os isolados são testados por PCR em relação à presença deuma aminotransferase de estereoinversão (iniciadores planejados partindode D-fenilglicina aminotransferases conhecidas) ou são adicionalmente enri-quecidos em relação à presença de uma aminotransferase de estereoinver-são como a seguir: os isolados das placas poderiam ser cultivados em meiolíquido como anteriormente menos o ágar a 30°C com agitação até umaϋΟβοο de aproximadamente 1,0. As células são coletadas por centrifugaçãoe lavadas duas vezes com 0,85% de NaCI. Uma amostra de 10 mg (pesoúmido) é suspensa em 1 mL de tampão de fosfato de potássio (pH 7,0) e 5mM de D-fenilglicina (ou D-4-hidroxifenilglicina). 15 mM de ácido (aminoó-xi)acético neutralizado são adicionados em amostras em duplicata prepara-das como descrito anteriormente. O consumo de D-fenilglicina (ou D-4-hidroxiglicina) é medido por HPLC. Os isolados capazes de degradar D-fenilglicina (ou D-4-hidroxifenilglicina), mas o fazem a uma taxa mais lentana presença do ácido (aminoóxi)acético são selecionados para análise adi-cional. Os isolados são testados, por PCR, em relação à presença de umaaminotransferase de estereoinversão (iniciadores planejados partindo de D-fenilglicina aminotransferases conhecidas).
A presença da aminotransferase de estereoinversão é confirma-da através do crescimento de uma cultura em meio líquido como descritoanteriormente, coletando as células e produzindo um extrato bruto isento decélulas (CFE) e testando em relação à atividade enzimática de D-fenilglicinaaminotransferase (ou D-4-hidroxifenilglicina aminotransferase). O CFE é adi-cionado a uma mistura de reação com as concentrações finais a seguir: 0,1M de CAPS (pH 9,5), 60 mM de L-glutamato (sal de sódio), 5 mM de benzoil-formiato (ou 4-hidroxibenzoato) e 50 μΜ de PLP. A reação inversa é medidaatravés da adição de CFE em uma mistura de reação com as concentraçõesa seguir: 50 mM de fosfato de potássio (pH 7,0), 60 mM de D-fenilglicina (ouD-4-hidroxifenilglicina), 5 mM de a-cetoglutarato, 50 μΜ de PLP. Os ensaiossão incubados a 35°C e as alíquotas são tiradas em pontos de tempo e inter-rompidas através de fervura durante 2 minutos. O produto será quantificadoatravés do método de HLPC de Gil-Av1 E., Tishbee, A., Hare, P.E., Resoluti-on of underivatized amino acids by reversed phase chromatography. J. Am.Chem. Soc., 102: 5115-5117 (1980) ou através dos métodos descritos noExemplo 1 (medida da formação de glutamato).
Como uma alternativa para os métodos baseados na PCR, a D-fenilglicina aminotransferase de estereoinversão é purificada partindo dasbactérias isoladas através de técnicas de purificação de proteínas tradicio-nais incluindo o fracionamento em sulfato de amônio e a cromatografia emcoluna convencional. Uma vez que a proteína foi purificada até um grau ra-zoável, técnicas de microsseqüenciamento de peptídeos ou o seqüencia-mento de aminoácidos do tipo Edman convencional é utilizado (vide gol-gi.harvard.edu/microchem/ para descrições dos protocolos e equipamentoutilizados para este tipo de trabalho). Os iniciadores degenerados são plane-jados com base na seqüência disponível do relativo conhecido mais próximoda fonte de proteína. A PCR degenerada e o "walking" genômico são entãorealizados de acordo com protocolos estabelecidos para isolar a seqüênciacodificadora da D-fenilglicina aminotransferase de estereoinversão.Produção de monatina por DPGAT
As D-hidroxifenilglicina aminotransferases, como descrito em (1)e (2) acima, são utilizadas em extratos de proteínas brutos isentos de célulasou purificadas como descrito em (1) acima. As tirosina (aromática) amino-transferases de S. meliloti e de R. sphaeroides são preparadas como descri-to no Exemplo 1 da WO 03/091396 A2. A aldolase ProA de Comamonas tes-tosteronié preparada como descrito no Exemplo 4 da WO 03/091396 A2. Osensaios de proteínas totais são feitos utilizando o Ensaio de Proteínas daBio-Rad de acordo com os protocolos do fabricante (Hercules, CA).
As misturas de reação (volume de 1 ml_, corrido em duplicata)contêm 100 mM de tampão de fosfato de potássio (pH 8), 2 mM de MgCI2,0,05 mM de 5'-fosfato piridoxal (PLP), 200 mM de piruvato de sódio, 5 mMde α-cetoglutarato de sódio, aproximadamente 280 pg/mL de TatA de S. me-Iiloti fornecidos em um extrato celular, 100 pL/mL de extrato celular com D-hidroxifenilglicina aminotransferase ou 1 mg/mL de D-hidroxifenilglicina ami-notransferase purificada e aproximadamente 100 pg/mL de aldolase ProAfornecidos como um extrato celular. O triptofano sólido é adicionado a umaconcentração de 10,2 mg/mL. Os controles negativos são ajustados sem D-hidroxifenilglicina aminotransferase. As amostras são incubadas a 30°C comagitação suave durante ~1 hora ou durante a noite. As amostras são centri-fugadas para remover o precipitado, filtradas com seringa e armazenadas a -80°C antes da análise em relação à monatina utilizando o método deLC/MS/MS descrito no Exemplo 1.
As D-hidroxifenilglicina aminotransferases com maior atividadeem relação à produção de monatina são produzidas através de técnicas demutagênese conhecidas pelos versados na técnica, incluindo: PCR mutagê-nica, passagem através de cepas mutagênicas ou mutagênese direcionadaao sítio. As D-hidroxifenilglicina aminotransferases melhoradas são selecio-nadas através do cultivo em meio mínimo com R.R-monatina como a fontede nitrogênio. Inicialmente a seleção se baseia no crescimento, mas as ami-notransferases melhoradas são selecionadas com verificação baseada nataxa de crescimento. Ou seja, as células com versões mutadas do gene sãocultivadas e o gene é expresso em meio mínimo com R,R-monatina como afonte de nitrogênio. As taxas de crescimento das células com as versõesmutadas do gene são comparadas com a da versão não mutada. Tais célu-las com uma taxa de crescimento mais rápida são selecionadas e a amino-transferase é analisada adicionalmente. A D-hidroxifenilglicina aminotransfe-rase é submetida à mutagênese através de técnicas disponíveis tais como aPCR propensa a erros e passagem através de cepas mutagênicas ou atra-vés de métodos para os quais uma licença foi obtida tais como o embara-lhamento de DNA e outras tecnologias de evolução direcionada.
Ensaio de DPGAT
As células com a D-hidroxifenilglicina aminotransferase recombi-nante foram cultivadas, a proteína expressa e as células Iisadas como des-crito no Exemplo 17 ou através de protocolos padronizados. A proteína éexpressa em seu hospedeiro nativo utilizando métodos descritos (Wiyakrut-ta, W., Meevootisom, V. A stereoinverting D-phenylglycine aminotransferasefrom Pseudomonas stutzeri ST-201: purification, characterization and appli-cation for D-phenylglycine synthesis. J. Biotechnol., 55: 193-203 (1997)).
O extrato isento de células foi adicionado em uma mistura dereação com as concentrações finais a seguir: 10O mM de fosfato de potássio(pH 7,0-8,5), 60 mM de D-fenilglicina (ou D-4-hidroxifenilglicina), 5 mM de a-cetoglutarato, 50 μΜ de PLP. Os ensaios foram incubados à temperaturaambiente e alíquotas foram tiradas em pontos de tempo e interrompidas a-través da adição de um volume equivalente de ácido fórmico. O produto (L-glutamato) é quantificado através dos métodos descritos no Exemplo 1.Exemplo 20
Descoberta de um gene de D-metionina aminotransferaseFundamento
Acredita-se que a D-metionina-piruvato aminotransferase (EC2.6.1.41) é um outro exemplo, embora raro, de uma transaminase de estere-oinversão. Esta enzima catalisa a conversão reversível de D-metionina epiruvato em L-alanina e 4-metiltio-2-oxobutanoato. O oxaloacetato, o fenilpi-ruvato, o 2-oxobutirato, o 2-oxovalerato, o 2-oxoheptanoato, o glioxilato e ooxoglutarato também podem servir como receptores de amino.
Acredita-se que a transaminação de D ou L metionina faz partede uma vide para produção de etileno em plantas superiores (couve-flor, to-mate, maçã, caule de ervilha, banana, amendoim) assim como em microor-ganismos do solo (Escherichia coli, Pseudomonas pisi, Pseudomonas aeru-ginosa, Bacillus myeoides, Acinetobaeter ealeoaceticus, Aeromonas hydro-phila B12E, Rhizobium trifolii N2P7, Penieillium digitatum, Saccharomyeeseerevisiae, Corynebaeterium D7F). D.C. Billington, B.T. Golding e S.B. Pri-mrose Bioehem J. (1979) 182, 827-836. Em bactérias, a L-metionina é tipi-camente utilizada como o substrato nos estudos de produção de etileno eacredita-se que enzimas de especificidade ampla tal como TyrB ou AspC deE. coli são responsáveis pela transaminação. Entretanto, S.B. Primrose J.Gen. MierobioL (1976), 95(1), 159-65 e S.B. Primrose J. Gen. Mierobiol.(1977), 98, 519-528, mostraram que a cepa SPA O de E. coli (University ofWarwick culture collection) produzia quase tanto etileno partindo de D-metionina quanto de L-metionina em culturas em batelada. Devido ao fato deque foi identificada D-aminotransferase sem especificidade ampla em E. coli,uma explicação possível poderia ser que a D-aminoácido desidrogenase deE. coli (codificada pelo gene dadA) converte a D-metionina em 4-metiltio-2-oxobutanoato. É também possível que haja uma metionina racemase em E.colr, entretanto, nenhuma tal enzima foi descrita na literatura.
Em contraste a E. coli, em flósculos de couve-flor (preparaçõesde extrato mitocondrial) e sementes de amendoim em germinação, a produ-ção de etileno era maior quando a D-metionina e o piruvato foram fornecidosao extrato de enzima quando comparada com L-metionina e piruvato (L.W.Mapson, J.F. March e D.A. Wardale Biochem J. (1969) 115, 653-661; J.l.Durham1 P.W. Morgan, J.M. Prescott e C.M. Lyman Phytochemistry (1973)12, 2123-2126). Portanto, a possibilidade de uma combinação de metioninaracemase e uma L-aminotransferase não é sustentada pelos dados. A ativi-dade de desidrogenase foi eliminada através da diálise de extratos celularesde couve-flor, não havia NAD presente nas misturas de ensaio. A atividadede oxidase foi descartada uma vez que nenhum consumo de oxigênio foiobservado e não havia requerimento de FAD. A D-metionina aminotransfe-rase de tecidos de amendoim foi purificada, foi mostrado que era dependen-te de PLP e foi mostrado que era independente da atividade de L-metioninaaminotransferase. Há uma possibilidade de que estas D-metionina-piruvatoaminotransferases realmente produzem D-alanina como um subproduto (si-milar às enzimas de Bacillus descritas nos Exemplos 13 e 14) e que as célu-Ias contêm alanina racemase para reciclar a D-alanina de volta em L-alanina(ou um doador de amino análogo). Em qualquer um dos casos, a descobertada D-aminotransferase de especificidade de plantas superiores é vantajosapara o desenvolvimento de processos que produzem R,R monatina ou S,Rmonatina.
Resumo Experimental
A D-metionina aminotransferase é parcialmente purificada par-tindo de flósculos de couve-flor e embriões de amendoim em germinaçãoutilizando protocolos de cromatografia padronizados e um sistema Pharma-cia AKTA Explorer. As seqüências de proteínas de proteínas homólogas sãodeterminadas por técnicas de "fingerprinting" por LC/MS/MS e buscas embancos de dados realizadas pela Harvard Microchemistry Facility. As regiõescodificadoras dos genes vegetais são clonadas partindo de uma bibliotecade cDNA utilizando protocolos de PCR padronizados ou através da síntesedo gene como descrito no Exemplo 19.
Alternativamente, as bibliotecas de expressão de cDNA sãoconstruídas (Stratagene, La Jolla, CA) partindo de tecido de couve-flor ou desementes de amendoim cultivadas na presença de D-metionina (e produzin-do etileno). As bibliotecas são transformadas em E. coli auxotrófica em rela-ção à metionina do E. coli Genetic Stock Center (YaIe) tais como as cepasRC519 ou AB1931. Os plasmídeos de cepas capazes de crescer em meiosmínimos contendo D-metionina contêm a região codificadora de interesse(vide o Exemplo 15, uma técnica de seleção de análogos).
Uma vez que as regiões codificadoras de interesse são obtidas esão expressas em uma cepa de laboratório padronizada de E. coli, os produ-tos gênicos resultantes podem ser utilizados em ensaios para produzir R,Rmonatina como descrito no Exemplo 19 no lugar da D-hidroxifenilglicina ami-notransferase, com a exceção do pH sendo de 7,5 (o pH ótimo para a ami-notransferase). Se a D-metionina aminotransferase tiver um requerimentoestrito por substratos doadores de D-aminoácidos, a enzima pode ser utili-zada para produzir R1R monatina como descrito nos Exemplos 13 e 14. Ogene pode sofrer mutagênese e ser verificado em relação à maior atividadecomo descrito no Exemplo 19.
Métodos
Isolamento partindo de couve-flor
Quatrocentos gramas de flósculos de couve-flor recém-picadossão extraídos com 400 mL de uma solução de sacarose/tampão a 4°C (0,4M de sacarose e 0,1 M de tampão de fosfato de sódio pH 7,4) alternando oencharcamento e a mistura utilizando uma misturadora. Os restos celularessão removidos por filtração com tecido de algodão e a solução resultante écentrifugada a 40.000Xg durante 30 minutos a 4°C. O material sólido (con-tendo organelas mitocondriais) é ressuspenso em 20 mL de 10 mM de tam-pão de fosfato de sódio pH 7,4 e as enzimas são extraídas com 200 mL deacetona gelada (-30°C). A suspensão é centrifugada novamente e o precipi-tado é seco utilizando um Savant Speed Vac. O material sólido é dissolvidoem 10 mM de tampão de fosfato de sódio pH 7,4 e a acetona residual é re-movida utilizando uma coluna PD-10 (GE Healthcare, Piscataway, NJ).
A atividade de aminotransferase é analisada através da incuba-ção da preparação de enzima com 5 mM de D-metionina, 1 mM de piruvato,0,05 mM de PLP e 2 mM de EDTA em 0,1 M de tampão de fosfato de sódiopH 7,4. Os ensaios são realizados a 25°C durante 16 horas. O 4-Metiltio-2-oxobutanoato é medido através da formação do derivado de 2,4-dinitrofenilhidrazona, utilizando LC/MS (m/z de 328) e a metodologia similardescrita no Exemplo 1. Uma solução a 0,4% (p/v) de 2,4-dinitrofenilhidrazinaem ácido sulfúrico a 2 M é preparada e a metade do volume é adicionada namistura de ensaio após a incubação. A mistura é misturada com agitaçãosuave a 30°C durante 30 minutos e o precipitado é coletado por centrifuga-ção e analisado por LC/MS. As frações de proteína separadas por técnicascromatográficas padronizadas são analisadas em relação à atividade deuma maneira similar, mas o co-produto alanina é medido através de técnicade derivatização pós-coluna de OPA descrita no Exemplo 1.
Isolamento partindo de amendoim (Arachia hypogea L. cv. Starr)
A enzima D-metionina aminotransferase proveniente do homo-genado de embrião de amendoim em germinação (menos os cotilédones) épurificada de acordo com the método de J.l. Durham, P.W. Morgan, J.M.Prescott e C.M. Lyman Phytochemistry (1973) 12, 2123-2126. Agentes redu-tores são utilizados durante a preparação de extratos brutos para estabilizaras enzimas e os restos celulares são removidos por centrifugação a33.000Xg. Uma fração de sulfato de amônio a 35-50% é adicionalmente puri-ficada através da incubação à temperatura baixa e através da remoção dasproteínas no precipitado. O sobrenadante é adicionalmente fracionado utili-zando acetona. Os conjuntos ativos são então adicionalmente purificadosatravés da cromatografia por filtração em gel (Sephadex 200, GE Healthca-re, Piscataway, NJ).
À medida que as frações de proteína ficam enriquecidas com aproteína transaminase, a eletroforese em 2D-gel é utilizada para separar aenzima de interesse para microsseqüenciamento. Após a elucidação de re-giões codificadoras homólogas nas seqüências vegetais depositadas noNCBI, a proteína D-aminotransferase é produzida de forma recombinante emEscherichia coli utilizando técnicas de biologia molecular padronizadas. Éesperado que os extratos celulares de flósculos de couve-flor ou de semen-tes de amendoim ou enzimas homólogas produzidas de forma recombinantepossam ser utilizadas na produção de R1R monatina como descrito no E-xemplo 19 (se for uma transaminase de estereoinversão) ou nos Exemplos13 e 14 (se for uma D-aminotransferase de especificidade ampla).
Exemplo 21
L-alanina aminotransferase/alanina racemase/D-alanina aminotransferase
As figuras 4, 6 e 8 ilustram vias biossintéticas para a produçãode R,R monatina enriquecida de forma estereoisomérica partindo do L-triptofano utilizando uma L-aminoácido aminotransferase (tal como L-alanina-aminotransferase e/ou L-triptofano-aminotransferase), uma aldolaseespecífica a R, uma alanina racemase e uma D-alanina aminotransferase.
Uma aminotransferase específica ao triptofano é descrita no E-xemplo 16. Alternativamente, as tirosina (aromática) aminotransferases de S.meliloti e R. sphaeroides são preparadas como descrito no Exemplo 1 daWO 03/091396 A2. A aldolase ProA de Comamonas testosteroni é prepara-da como descrito no Exemplo 4 da WO 03/091396 A2. Os ensaios de proteí-na total são feitos utilizando o Ensaio de Proteína da Bio-Rad de acordo comos protocolos do fabricante (Bio-Rad, Hercules, CA). A alanina racemase éobtida na Sigma-Aldrich (St. Louis, MO) (número de catálogo A8936). A D-alanina aminotransferase é obtida na BioCataIytics (número de catálogo AT-103) (BioCatalytics, Pasadena, CA).
As L-alanina aminotransferases são amplamente distribuídas emeucariotos, bactérias e archaea. Os organismos a seguir foram identificados(com base na homologia de seqüência) como contendo uma L-alanina ami-notransferase (E.C. 2.6.1.2): Arabidopsis thaliana, Ashbya gossypii, Azoto-bacter vinelandii, Bifidobacterium longum, Caenorhabditis elegans, Candidaalbicans, Candida glabrata, Chlamydomonas reinhardtii, Cryptococcus neo-formans, Debaryomyees hansenii, Homo sapiens, Hordeum vulgare, Kluyve-romyees laetis, Magnaporthe grisea, Medieago truneatula, Mus museulus,Neurospora crassa, Oryza sativa, Phaneroehaete ehrysosporium, Pinus tae-da, Pseudomonas putida, Pyroeoceus abyssi, Pyroeoeeus furiosus, Pyrocoe-eus horikoshii, Rattus norvegicus, Saccharomyces cerevisiae, Schizosaccha-romyces pombe, Takifugu rubripes, Trypanosoma cruzi, Vibrio cholerae, Vi-brio parahaemolyticus, Vibrio vulnificus, Yarrowia Iipolytica e Zea mays. Adi-cionalmente, muitas aminotransferases possuem atividade de alanina amino-transferase em baixo nível e, fornecidos altos níveis de L-glutamato e piruva-to podem convertê-los em L-alanina e α-cetoglutarato. Uma enzima com bai-xa atividade é melhorada com técnicas de mutagênese padronizadas taiscomo PCR propensa a erros e passagem através de cepas mutagênicas ouatravés de técnicas de evolução direcionada. O gene para uma L-alaninaaminotransferase é clonado utilizando iniciadores disponíveis publicamentepara serem planejados e utilizando técnicas padronizadas para amplificar,clonar, expressar e purificar o gene/enzima.
As misturas de reação (volume de 1 mL, corridas em duplicata)contêm 100 mM de tampão de fosfato de potássio (pH 8), 2 mM de MgCI2,0,05 mM de 5'-fosfato piridoxal (PLP), 200 mM de piruvato de sódio, 5 mMde α-cetoglutarato de sódio, aproximadamente 280 pg/mL de TatA de S. me-liloti fornecidos em um extrato celular (ou outra aminotransferase específicaao L-triptofano), 100 pL/mL de extrato celular de alanina racemase ou 1mg/mL de alanina racemase purificada, aproximadamente 280 pg/mL de D-alanina aminotransferase fornecidos em um extrato celular e aproximada-mente 100 pg/mL de aldolase ProA fornecida como um extrato celular. Otriptofano sólido é adicionado a uma concentração de 10,2 mg/mL. Os con-troles negativos são ajustados sem alanina racemase. As amostras são in-cubadas a 30°C com agitação suave durante ~1 hora ou durante a noite. Asamostras são centrifugadas para remover o precipitado, filtradas com serin-ga e armazenadas a -80°C antes da análise em relação à monatina utilizan-do o método de LC/MS/MS descrito no Exemplo 1. Nestas misturas de rea-ção, se a L-triptofano aminotransferase puder utilizar α-cetoglutarato, masnão piruvato, como um receptor de amino, pode ser adicionada uma L-alanina aminotransferase, que converte L-glutamato e piruvato em L-alaninae α-cetoglutarato, como mostrado na figura 6.
Exemplo 22
Subclonagem de genes que codificam as aldolases das SEQ ID NO: 276,244, 218, 228, 162, 50, 74, 44 e 116 . -Os genes que codificam aldolases que possuem as seqüênciasde aminoácidos das SEQ ID NO: 276, 244, 218, 228, 162, 50, 74, 44 e 116foram subclonados no vetor de expressão pET28b (Novagen, Madison, Wl)com His-tags N-terminais para permitir a purificação. A SEQ ID NO: 275 é aseqüência do gene que codifica a aldolase que possui a seqüência de ami-noácidos da SEQ ID NO: 276. A SEQ ID NO: 243 é a seqüência do geneque codifica a aldolase que possui a seqüência de aminoácidos da SEQ IDNO: 244. A SEQ ID NO: 217 é a seqüência do gene que codifica a aldolaseque possui a seqüência de aminoácidos da SEQ ID NO: 218. A SEQ ID NO:227 é a seqüência do gene que codifica a aldolase que possui a seqüênciade aminoácidos da SEQ ID NO: 228. A SEQ ID NO: 161 é a seqüência dogene que codifica a aldolase que possui a seqüência de aminoácidos daSEQ ID NO: 162. A SEQ ID NO: 49 é a seqüência do gene que codifica aaldolase que possui a seqüência de aminoácidos da SEQ ID NO: 50. A SEQID NO: 73 é a seqüência do gene que codifica a aldolase que possui a se-qüência de aminoácidos da SEQ ID NO: 74. A SEQ ID NO: 43 é a seqüênciado gene que codifica a aldolase que possui a seqüência de aminoácidos daSEQ ID NO: 44. A SEQ ID NO: 115 é a seqüência do gene que codifica aaldolase que possui a seqüência de aminoácidos da SEQ ID NO: 116.
Os iniciadores utilizados para clonagem são mostrados na Tabe-la 24.Tabela 24
<table>table see original document page 419</column></row><table><table>table see original document page 420</column></row><table><table>table see original document page 421</column></row><table>
Os genes que codificam as aldolases anteriores foram amplifica-dos através da PCR e digeridos com enzimas apropriadas (Nde I e BamH I)e purificados em gel (QIAquick® Gel extration Kit (Qiagen, Valencia, CA)). Osprodutos da digestão foram ligados individualmente em pET28 que foi dige-rido com Nde I e BamH I e purificado em gel. A ligação foi transformada emcélulas TQP10 (Invitrogen, Carlsbad, CA). O DNA da miniprep de colôniasindividuais foi analisado em relação à presença de insertos através da análi-se de tamanho utilizando eletroforese em gel de agarose. Os isolados comum inserto foram submetidos à análise de seqüência de DNA (Agencourt,Beverly1 MA).
Purificação de Aldolases
Os clones de aldolases confirmados foram transformados emBL21(DE3) ou BL21(DE3) pLysS. A indução foi realizada durante a noite emTerrific Broth a 30°C. As culturas crescidas durante a noite com o antibióticoapropriado foram diluídas em meio fresco (tipicamente 1:100) e crescidasaté uma ϋΟβοο -0,6 com aeração a 37°C. As culturas foram então induzidascom 1 mM de IPTG e transferidas para 30°C (com aeração) e a incubaçãofoi continuada durante a noite. As células foram coletadas por centrifugação.O pélete de células foi submetido tipicamente a um ciclo de congelamentodescongelamento para ajudar na Iise celular. O pélete de células foi Iisadaem BugBuster e Benzonase Nuclease (Novagen, Madison, Wl) (de acordocom o protocolo do fabricante). Os restos celulares foram removidos porcentrifugação. O extrato de proteína bruto foi aplicado em uma coluna HIS-Bind com capacidade de 10 mg (Novagen, Madison, Wl) que foi preparadade acordo com o protocolo do fabricante. A coluna foi lavada e a proteína foieluída de acordo com o protocolo do fabricante. A proteína purificada foidessalinizada com colunas PD-10 (GE Healthcare, Piscataway, NJ) e eluídaem 50 mM de tampão de fosfato de potássio, pH 7,5, contendo 4 mM deMgCI2, 200 mM de NaCI. A proteína purificada foi concentrada com agentesde concentração por centrifugação Amicon (faixa de 5000 MW) (Millipore,Billerica, MA). Após a concentração, foi observado que as aldolases dasSEQ ID NO: 44, SEQ ID NO: 28 e SEQ ID NO: 276 exibiam algum nível deprecipitação, embora a atividade ainda fosse bastante alta. As proteínas fo-ram armazenadas a -80°C até serem analisadas.
Os ensaios de proteína foram realizados utilizando o kit PierceBCA (Pierce, Rockford, IL) e o protocolo de microtitulação em placas comAlbumina de Soro Bovino ("BSA") como o padrão de proteína. O sistema deeletroforese Experion Pro260 (Bio-Rad, Hercules, CA) ou a SDS-PAGE foiutilizada para estimar a porcentagem de aldolase na amostra purificada epara avaliar os níveis de expressão no extrato de células solúvel e na proteí-na total.
Teste de Aldolases Purificadas
As aldolases purificadas foram testadas em relação a sua capa-cidade de produzir R1R monatina partindo de D-triptofano e foram compara-das com as aldolases das SEQ ID NO: 28 e SEQ ID NO: 54 preparadas damesma maneira. Os ensaios foram corridos em tubos de microcentrífuga(em duplicata) com a proteína purificada, utilizando a mesma concentraçãode enzima por ensaio (50 pg/mL) com a exceção da SEQ ID NO: 244, para aqual foram utilizados 25 pg/mL. A SEQ ID NO: 243 não expressava bem eproduzia quantidades menores de proteína purificada. Dois mg/mL de AT-103 da BioCataIytics (BioCatalytics, Pasadena, CA) foram utilizados como aD-aminotransferase. Os seguintes foram adicionados por 1 mL de mistura dereação: aldolase, 4 mM de MgCI2, 50 mM de D-triptofano, D-aminotransferase, 200 mM de piruvato de sódio, 100 mM de tampão de fos-fato de potássio pH 7,5 e 0,05 mM de PLP. As amostras foram incubadas a30°C. Foram tiradas amostras em trinta minutos, 1 hora, 3 horas e durante anoite (19 horas). A Tabela 25 mostra os resultados médios de monatina totalproduzida em cada ponto de tempo e a % de R1R monatina produzida, que édeterminada pelas áreas dos picos em fase inversa. Na coluna 3 da Tabela25, a análise de LC/MS/MS de derivatização com FDAA adicional como des-crito no Exemplo 1 foi realizada para algumas das reações e tais resultadossão mostrados entre parênteses.
Tabela 25: Monatina total produzida partindo de D-triptofano e % de R1R
<table>table see original document page 423</column></row><table><table>table see original document page 424</column></row><table>
A aldolase da SEQ ID NO: 276 manteve um alto nível de ativida-de, assim como a estereoespecificidade mais alta para a produção de R,Rmonatina. O armazenamento desta enzima em um tampão omitindo o clore-to de sódio parece reduzir o nível de precipitação observado anteriormente.
A concentração de magnésio no tampão de armazenamento não parece terum impacto sobre o nível de precipitação.
Todas as aldolases das SEQ ID NO: 276, SEQ ID NO: 28 e SEQID NO: 244 demonstraram alta atividade e alta estereosseletividade em rela-ção à produção de R,R monatina. Estas três enzimas foram preparadas co-mo descrito no Exemplo 23 e analisadas de forma anaeróbica, como descritono Exemplo 24, utilizando frascos de soro de 10 mL. Ensaios de sete mLforam realizados utilizando 0,05 mg/mL de cada aldolase (purificada) e 2mg/mL de D-aminotransferase de purificada de B. sphaerícus preparada co-mo descrito no Exemplo 24. A atividade de cada aldolase na produção demonatina partindo de D-triptofano foi comparada com a da HMG aldolase deS. meliloti preparada como descrito no Exemplo 27. A monatina total foi es-timada utilizando o método de LC-OPA descrito no Exemplo 1. A porcenta-gem de R1R monatina formada foi determinada utilizando o método de deri-vatização com FDAA descrito no Exemplo 1. Os resultados são mostradosabaixo na Tabela 26.
Tabela 26
<table>table see original document page 425</column></row><table>
Estes resultados demonstram que a aldolase da SEQ ID NO:276 produz altos níveis de R,R monatina também em reações anaeróbicasde volume maior.
Exemplo 23
Expressão e Purificação da aldolase da SEQ ID NO: 276
A clonagem do hospedeiro E. coli BL21(DE3)pLysS que carregao gene da aldolase listado como a SEQ ID NO: 275 no plasmídeo pET28b édescrita anteriormente no Exemplo 22.
A aldolase da SEQ ID NO: 276 com uma marcação de purifica-ção HIS6 amino-terminal foi produzida utilizando o EMD Biosciences Overni-ght Express System Il (Novagen, Madison, Wl) (soluções 1-6) contendo 50pg/mL de canamicina em frascos de agitação. Este sistema de expressãoinduz a expressão de sistemas que podem ser induzidos por IPTG sem anecessidade de monitorar o crescimento celular. Após a inoculação de alí-quotas de 200 mL do meio (em frascos de 1 L) de culturas líquidas ou deplacas do constructo de aldolase, as culturas foram incubadas a 30°C duran-te a noite com agitação a 225 rpm. Quando a DOeoonm atingiu um mínimo de6, as células foram coletadas por centrifugação e lavadas uma vez com tam-pão.
Para preparar o extrato isento de células contendo a aldolase, ascélulas foram suspensas em 3-4 volumes de 100 mM de fosfato de potássio,pH 7,8 e então rompidas utilizando um homogeneizador da Microfluidics (Mi-crofluidics, Newton, MA) (3 passagens a 124,10 MPa (18.000 psi)), manten-do a temperatura da suspensão em menos de 15°C. Alternativamente, o ex-trato isento de células foi preparado utilizando EMD Biosciences BugBuster®(isento de amina primária) Extration Reagent (Novagen, Madison, Wl) con-tendo 1 pL/mL de Benzonase® Nuclease, 5 pL/mL de Protease InhibitorCocktail Set Il e 0,033 pL/mL de rLysozyme® seguindo o protocolo do fabri-cante. Todas as etapas de purificação subseqüentes foram realizadas a 4°C.A suspensão de células foi centrifugada durante 20-30 minutos a 15.000-20.000 χ g para remover os restos celulares. Uma alíquota de 20-25 mL doextrato isento de células foi aplicada em uma coluna de 45 mL de resina GEHealthcare Chelating Sepharose® Fast Flow (forma de níquel (II)) (GE Heal-thcare, Piscataway, NJ) que foi previamente equilibrada com 100 mM de fos-fato de potássio contendo 200 mM de cloreto de sódio. Para produzir a for-ma de níquel da resina, a resina foi lavada com 150 mL de 200 mM de sulfa-to de níquel (II) hexahidratado e então com 150 mL de água destilada. Apóscarregar a amostra, a coluna foi lavada/eluída com 150 mL do tampão deequilíbrio contendo 25 mM de imidazol, 150 mL do tampão de equilíbrio con-tendo 50 mM de imidazol e 150 mL do tampão de equilíbrio contendo 500mM de imidazol. A proteína marcada com The HIS6 foi eluída na última lava-gem. A lavagem com 500 mM de imidazol foi concentrada com dispositivosde filtro por centrifugação Millipore/Amicon Centricon Plus-70 (MWCO 10kDa) (Millipore, Billerica, MA) em 15-20 mL de acordo com as instruções dofabricante. O imidazol e o cloreto de sódio foram removidos através da pas-sagem ao longo de colunas GE Healthcare PD10 descartáveis (GE Health-care, Piscataway, NJ) (2,5 mL de amostra por coluna) equilibradas previa-mente com 100 mM de fosfato de potássio, pH 7,8. A aldolase purificada foieluída com 3,5 mL por coluna do mesmo tampão.
A concentração de proteína de cada fração foi determinada utili-zando o kit de ensaio Pierce BCA (Pierce, Rockford, IL) utilizando BSA comoo padrão de proteína. A pureza de cada fração e o nível de expressão noextrato isento de células foram determinados utilizando um Bio-Rad Experionmicrocapillary chip system (Bio-Rad, Hercules, CA) ou utilizando géis comgradiente de 4-15% de SDS-poliacrilamida da Bio-Rad corridos em um apa-rato de células Mini PROTEAN® 3 (Bio-Rad, Hercules, CA). A proteína foivisualizada nos géis de poliacrilamida utilizando a coloração Bio-Rad Bio-Safe G-250 Coomassie (Bio-Rad, Hercules, CA) e descorados com água.Tipicamente, este procedimento produz - 50 mg de enzima partindo de 400mL de cultura durante a noite que é 85-95% pura como é julgado pelo Expe-rion software. Alíquotas (1-5 mL) da enzima purificada foram armazenadas a-80°C até o uso. A preparação da enzima desta maneira reduziu o nível deprecipitação da enzima observado anteriormente. A presença de magnésiono tampão de armazenamento não tinha efeito sobre o nível de precipitação.
Exemplo 24
Produção de R.R-monatina Utilizando a Aldolase da SEQ ID NO: 276: Otimi-zação das Condições de Reação
A D-alanina aminotransferase de Bacillus sphaerícus (ATCC ce-pa 10208) clonada no Exemplo 7 foi purificada na forma da proteína marca-da com HIS6 como descrito abaixo utilizando o EMD Biosciences OvernightExpress System Il (Novagen, Madison, Wl) para cultivo e indução. O EMDBiosciences Overnight Express System Il (soluções 1-6) (Novagen, Madison,Wl) continha 50 pg/mL de canamicina em frascos de agitação. Este sistemade expressão induz a expressão de sistemas que podem ser induzidos comIPTG sem a necessidade de monitorar o crescimento celular. Após a inocu-lação de alíquotas de 200 mL do meio (em frascos de 1 L) de culturas líqui-das ou de placas do constructo de aminotransferase, as culturas foram incu-badas a 30°C durante a noite com agitação a 225 rpm. Quando a DOeoonmatingiu um mínimo de 6, as células foram coletadas por centrifugação e Ia-vadas uma vez com tampão.
Para preparar o extrato isento de células contendo a D-alaninaaminotransferase, as células foram suspensas em 3-4 volumes de 100 mMde fosfato de potássio, pH 7,8, contendo 50 μΜ de fosfato piridoxal (PLP) eentão rompidas utilizando um homogeneizador da Microfluidics (Microflui-dics, Newton, MA) (3 passagens a 124,10 MPa (18.000 psi)), mantendo atemperatura da suspensão em menos de 15°C. Alternativamente, o extratoisento de células foi preparado utilizando o EMD Biosciences BugBuster®(isento de amina primária) Extration Reagent (Novagen, Madison, Wl) con-tendo 1 pLymL de Benzonase® Nuclease, 5 pL/mL de Protease InhibitorCocktail Set Il e 0,033 pL/mL de rLysozyme® seguindo o protocolo do fabri-cante. Todas as etapas de purificação subseqüentes foram realizadas a A°C.
O extrato de células foi centrifugado durante 20-30 minutos a 15.000 χ g pa-ra remover os restos celulares. Uma alíquota de 20-25 mL do extrato isentode células foi aplicada em uma coluna de 45 mL de resina GE HealthcareChelating Sepharose® Fast Flow (forma de níquel (II)) (GE Healthcare, Pis-cataway, NJ) que foi previamente equilibrada com 100 mM de fosfato de po-tássio contendo 200 mM de cloreto de sódio e 50 μΜ de PLP. Para gerar aforma de níquel da resina, a resina foi lavada com 150 mL de 200 mM desulfato de níquel (II) hexahidratado e então com 150 mL de água destilada.
Após carregar a amostra, a coluna foi lavada/eluída com 150 mL do tampãode equilíbrio contendo 25 mM de imidazol, 150 mL do tampão de equilíbriocontendo 50 mM de imidazol e 150 mL do tampão de equilíbrio contendo500 mM de imidazol. A proteína marcada com HIS6 foi eluída na última lava-gem. A lavagem com 500 mM de imidazol foi concentrada com dispositivosde filtro por centrifugação Millipore/Amicon Centricon Plus-70 (MWCO 10kDa) (Millipore, Billerica, MA) em 15-20 mL de acordo com as instruções dofabricante. O imidazol e o cloreto de sódio foram removidos através da pas-sagem ao longo de colunas GE Healthcare PD10 descartáveis (GE Health-care, Piscataway, NJ) (2,5 mL de amostra por coluna) previamente equili-bradas com 100 mM de fosfato de potássio, pH 7,8 contendo 0,5 μΜ dePLP. A aminotransferase purificada foi eluída com 3,5 mL por coluna domesmo tampão.
A concentração de proteína de cada fração foi determinada utili-zando o kit de ensaio Pierce BCA (Pierce, Rockford, IL) com BSA como opadrão de proteína. A pureza de cada fração e o nível de expressão na fra-ção do extrato isento de células foram determinados utilizando um Bio-RadExperion microcapillary chip system (Bio-Rad, Hercules, CA) ou utilizandogéis com gradiente de 4-15% de SDS-poliacrilamida da Bio-Rad (Bio-Rad,Hercules, CA) corridos em um aparato de células Mini PROTEAN® 3. A pro-teína foi visualizada nos géis de poliacrilamida utilizando a coloração Bio-Rad Bio-Safe G-250 Coomassie (Bio-Rad, Hercules, CA) e descorados comágua. Tipicamente, este procedimento produz ~ 50 mg de enzima partindode 200 mL de cultura durante a noite que é 85-90% pura como é julgado pe-lo Experion software ou partindo da análise dos géis de SDS-PAGE. Alíquo-tas (1-5 mL) da enzima purificada foram armazenadas a -80°C até o uso.
A aldolase da SEQ ID NO: 276 (clonada no Exemplo 22) foi puri-ficada na forma da proteína marcada com HISô como descrito no Exemplo 23.
O co-fator metálico preferido para a aldolase da SEQ ID NO: 276foi determinado através da verificação de uma variedade de metais divalen-tes. As reações foram ajustadas anaerobicamente em garrafas de soro de10 mL com volumes finais de 7 mL. Uma solução de massa consistindo de100 mM de fosfato de potássio (pH 7,8), 200 mM de piruvato de sódio, 0,05mM de PLP e 0,01% (v/v) de Tween 80 foi preparada em um volume final de48,8 mL e purgada com nitrogênio durante 30 minutos. O D-Triptofano (143mg; concentração final de 100 mM) foi distribuído em sete frascos de soro de10 mL. A cada um dos frascos foi adicionado 0,014 mL de uma solução es-toque a 2 M de um cátion metálico divalente, preparada partindo do sal decloreto (concentração final de 4 mM). Para o controle negativo, 0,014 mL dedH2Ü foi adicionado. Os frascos de soro foram tampados com membrana deborracha e purgados com nitrogênio através de agulhas de calibre 16-18.Sob condições anaeróbicas, 5,625 mL da solução de massa anaeróbica fo-ram adicionados em cada garrafa de soro anaeróbica. Subseqüentemente, aD-alanina aminotransferase de B. sphaerícus e a aldolase da SEQ ID NO:276 foram adicionadas anaerobicamente em cada garrafa de soro em umaconcentração final de 2 mg/mL e 0,05 mg/mL, respectivamente. As soluçõesforam incubadas à temperatura ambiente com agitação suave durante 18horas. A monatina final foi analisada de acordo com os métodos descritos noExemplo 1 utilizando o método de Detecção de Aminoácidos Por Fluores-cência Pós-Coluna por Cromatografia Líquida. (Tabela 27).
Tabela 27
<table>table see original document page 430</column></row><table>
As condições de reação para a aldolase da SEQ ID NO: 276 fo-ram adicionalmente investigadas com um experimento fatorial em dois níveisplanejado utilizando o software de estatística Design Expert 7.0.0 (Stat-Ease,Inc.; Minneapolis, MN). O planejamento da verificação consistia de um únicobloco de cinco fatores em dois níveis com pontos centrais (total de 20 corri-das). Os cinco fatores que seriam otimizados eram a concentração do co-fator metálico, o pH da reação, a concentração de Tween® 80, a proporçãode piruvato em relação ao triptofano e a concentração de aldolase (Tabela 28).
Tubos de polipropileno cônicos (14 mL) contendo 143 mg de D-triptofano foram desoxigenados em uma câmara anaeróbica com luvas (CoyLaboratory Products, lnc; Grass Lake, Ml) durante a noite. Soluções estoquede 2 M de MgCI2; 1 M de fosfato de potássio em pH 7,0, 7,75 e 8,5; 10%(v/v) de Tween® 80; 2 M de piruvato de sódio e 10 mM de PLP (5-fosfato pi-ridoxal) foram preparadas em água degaseificada e equilibradas na câmaraanaeróbica com luvas durante a noite. As soluções estoque de D-alaninaaminotransferase purificada de B. sphaericus e da aldolase da SEQ ID NO:276 foram descongeladas em gelo e utilizadas na câmara anaeróbica comluvas imediatamente. As soluções estoque foram adicionadas nos tubos cô-nicos de 14 mL contendo o D-triptofano para a obtenção das concentraçõesdeterminadas pelo planejamento estatístico (Tabela 28). A água degaseifi-cada foi adicionada em cada tubo para levar o volume final, junto com asadições de enzima, para 7,0 mL. Os tubos foram incubados à temperaturaambiente na câmara anaeróbica com luvas com agitação suave durante até24 horas. A concentração de monatina e a pureza isomérica foram analisa-das de acordo com os métodos descritos no Exemplo 1 utilizando o métodode Detecção de Aminoácidos por Fluorescência Pós-Coluna por Cromato-grafia Líquida e método de Monitoramento de Reação Múltiplo porLC/MS/MS para a Determinação da Distribuição de Estereoisômeros de Mo-natina em Reações in vitro e in vivo (método de derivatização com FDAA).
Tabela 28
<table>table see original document page 431</column></row><table><table>table see original document page 432</column></row><table>
A análise estatística dos dados indicou que o pH da reação, aproporção de piruvato:triptofano e a concentração de aldolase eram os fato-res significativos que afetavam o título da monatina, a pureza isomérica e orendimento de carbono. Um gráfico de qualidade de aproveitamento foi ge-rado utilizando o Design Expert software em que os fatores eram variadoscom a finalidade de maximizar os objetivos de título mais alto de monatina epureza isomérica mais alta sob condições de piruvato em excesso. As con-dições de reação indicaram como ótimo sendo 1 mM de MgCI2, pH >8,0,0,01% (v/v) de Tween® 80 e 0,01 mg/mL da aldolase da SEQ ID NO: 276.Esta é uma redução de 5 vezes na quantidade típica de aldolase utilizada,assim como uma redução de 4 vezes na quantidade de metal divalente utili-zada tipicamente.
Experimentos adicionais foram realizados para determinar a fai-xa ótima de pH para o processo de reação. Soluções estoque de 1 M detampão EPPS foram preparadas em incrementos de 0,2 unidade de pH entrepH 7,0 e 9,0. Estas soluções foram degaseificadas e equilibradas na câmaraanaeróbica com luvas durante a noite. Os tubos de polipropileno (14 mL)contendo 143 mg de D-triptofano foram desoxigenados em uma câmara a-naeróbica com luvas durante a noite. Soluções estoque de 2 M de MgCI2,10% (v/v) de Tween® 80, 2 M de piruvato de sódio e 10 mM de PLP forampreparadas em água degaseificada e equilibradas na câmara anaeróbicacom luvas. As preparações de D-alanina aminotransferase purificada de B.sphaerícus e aldolase da SEQ ID NO: 276 foram descongeladas em gelo eutilizadas imediatamente na câmara anaeróbica com luvas. As soluções es-toque foram adicionadas nos tubos cônicos de 14 mL para fornecer umaconcentração final de 100 mM de EPPS, 200 mM de piruvato, 100 mM detriptofano, 1 mM de MgCI2, 0,01% (v/v) de Tween® 80, 0,05 mM de PLP, 2mg/mL de D-alanina aminotransferase de B. sphaerícus e 0,01 mg/mL dealdolase da SEQ ID NO: 276 em um volume total de 7 ml_ por tubo. As rea-ções foram incubadas à temperatura ambiente na câmara anaeróbica comluvas com agitação suave durante 22 horas. As amostras foram removidas eanalisadas em relação à monatina como descrito no Exemplo 1 utilizando ométodo de monitoramento de reação múltiplo por LC/MS/MS (Tabela 29).
Tabela 29
<table>table see original document page 433</column></row><table>
Os resultados indicaram que a formação de monatina aumentoucom o aumento do pH entre 7,0 - 8,0. A formação de monatina atingiu ummáximo na faixa de pH 8,0 - 8,2 e diminuiu acima de pH 8,4. Adicionalmente,a pureza isomérica da monatina diminui acima de pH 8,4.
A otimização adicional da reação foi feita utilizando a aldolase daSEQ ID NO: 276 (0,01 mg/mL), 2 mg/mL da T243N 4978 DAT (não marcada,do Exemplo 26), 1 mM de MgCI2, 200 mM de piruvato de sódio, 0,05 mM dePLP, 0,01% Tween-80 e 100 mM de D-triptofano em pH 8,5. As células utili-zadas para produzir a aldolase e a D-aminotransferase foram rompidas em50 mM de EPPS, pH 8,4 utilizando um homogeneizador da Microfluidics (Mi-crofluidics, Newton, MA) (3 passagens em 137,89 MPa (20.000 psi)). Os res-tos celulares foram removidos por centrifugação (20.000 χ g durante 30 mi-nutos) e os extratos de células clarificados foram utilizados nas reações en-zimáticas. Não foi utilizado tampão adicional, mas as misturas de reaçãoforam ajustadas em pH 8,5 utilizando hidróxido de sódio e purgadas comnitrogênio antes da adição de enzima. Reações de duzentos e cinqüenta mLforam realizadas em fermentadores agitados Sixfor de 0,7 L (lnfors AG,Bottmingen, Suíça) a 30°C utilizando nitrogênio na câmara principal. O fosfa-to de potássio foi adicionado em uma concentração final de 0, 5, 10, 20 e 50mM. Foi observado que a adição de 5-10 mM de fosfato era ótima, produzin-do 3,5 g/L de monatina (quantificada por LC/MS/MS como descrito no Exemplo 1).
Exemplo 25
Clonagem de uma Nova D-Aminoácido Aminotransferase de Bacillus
Uma D-aminoácido aminotransferase de Bacillus ("DAAT" ou"DAT") (EC 2.6.1.21, também conhecida como D-alanina aminotransferaseou D-aspartato aminotransferase) foi produzida de forma recombinante. Estaaminotransferase foi utilizada em ensaios acoplados com aldolases para aprodução de R,R monatina. Esta enzima aminotransferase é homóloga às D-aminotransferases descritas anteriormente para a produção de monatina(Pedido de Patente U.S. Publicado N0 20040063175 e Pedido de PatenteU.S. Publicado N0 20050282260). O organismo ATCC 4978-Bacillus sphae-rieus depositado originalmente como Bacillus rotans-foi encomendando naATCC e utilizado para preparar DNA genômico. Iniciadores degeneradosforam planejados nas regiões de conservação de seqüência de proteína deD-aminotransferases conhecidas de Bacillus e utilizados para a amplificaçãopela reação em cadeia da polimerase ("PCR") da seqüência do gene DAATinterna da cepa da ATCC mencionada anteriormente. "Walking" genômico foirealizado utilizando o BD GenomeWalker® Universal Kit (Clontech, MountainView1 CA). As análises das seqüências (Agencourt BioScience Corporation,Beverly, MA) verificaram uma seqüência codificadora de comprimento com-pleto para o gene DAAT da ATCC 4978. A seqüência de DNA do gene DA-AT da ATCC 4978 é a SEQ ID NO: 357 e é mostrada abaixo. O gene daSEQ ID NO: 357 pode ser amplificado através de protocolos de PCR padro-nizados e clonado utilizando técnicas do DNA recombinante padronizadas. Ogene da SEQ ID NO: 357 pode ainda ser reconstruído através de qualquermétodo conhecido por um perito comum na técnica, tal como métodos dePCR de montagem conhecidos por um versado na técnica.
A seqüência de DNA de DAAT da ATCC 4978 é:atgagttata gcttatggaa tgaccaaatt gtgaatgatg aagaagtagt agttgataag gag-gaccgtg gctatcaatt tggcgatggt gtttatgaag ttgtaaaagt atataacggt gaattatttacagcggagga gcatgtcgat cgtttttacg cgagtgctga aaaaattcgc gttacgatcc cttataca-aa agacaaattg catcaattat tgcatcagtt agttgaaatg aataaagttc aaacaggaca tatt-tatttc caaattacgc gtggtgcagg ccctcgtaat catattttcc ctggtgatga agtgaagcca gtat-taacag gtaataccaa ggaaaatcca cgtcccgtag caaactttga aaaaggtgtg aaagcaa-cat ttgtagaaga cattcgttgg ttacgctgtg acattaaatc attaaattta cttggtgcgg tacttgc-taa acaagaagca catgaaaaag gatgctatga agcggtttta catcgtgatg aaatcgtaacagaaggctct tcttcaaata tttatggaat taaagatggc gtattataca cacatccagc gaataacttcatcttaaatg gtattacacg tcaagtaatc attaaatgtg ctgctgaaat tggcttacca gtgaaggaagaagcaatgac aaaaactcag cttcttgcaa tggatgaagt gattgtttca tcaacgactt cagaag-taac gccaattatc gacatagatg gaacagtaat tggtgcgggt aaaccgggtg actggacacgtaaattacaa gcacaatttg atacgaaaat cccaaaaggt attcgcgcat aa(SEQ ID NO: 357)
A seqüência de aminoácidos do gene DAAT da ATCC 4978 queé codificada pela seqüência de DNA anterior é a SEQ ID NO: 358 e é mos-trada abaixo:
Met Ser Tyr Ser Leu Trp Asn Asp Gln Ile Val Asn Asp Glu Glu Val Val ValAsp Lys Glu Asp Arg Gly Tyr Gln Phe Gly Asp Gly Val Tyr Glu Val Val LysVal Tyr Asn Gly Glu Leu Phe Thr Ala Glu Glu His Val Asp Arg Phe Tyr AlaSer Ala Glu Lys Ile Arg Val Thr Ile Pro Tyr Thr Lys Asp Lys Leu His Gln LeuLeu His Gln Leu Val Glu Met Asn Lys Val Gln Thr Gly His Ile Tyr Phe Gln IleThr Arg Gly Ala Gly Pro Arg Asn His Ile Phe Pro Gly Asp Glu Val Lys Pro ValLeu Thr Gly Asn Thr Lys Glu Asn Pro Arg Pro Val Ala Asn Phe Glu Lys GlyVal Lys Ala Thr Phe Val Glu Asp Ile Arg Trp Leu Arg Cys Asp Ile Lys Ser LeuAsn Leu Leu Gly Ala Val Leu Ala Lys Gln Glu Ala His Glu Lys Gly Cys TyrGlu Ala Val Leu His Arg Asp Glu Ile Val Thr Glu Gly Ser Ser Ser Asn Ile TyrGly Ile Lys Asp Gly Val Leu Tyr Thr His Pro Ala Asn Asn Phe Ile Leu Asn GlyIle Thr Arg Gln Val Ile Ile Lys Cys Ala Ala Glu Ile Gly Leu Pro Val Lys Glu GluAla Met Thr Lys Thr Gln Leu Leu Ala Met Asp Glu Val Ile Val Ser Ser Thr ThrSer Glu Val Thr Pro Ile Ile Asp Ile Asp Gly Thr Val Ile Gly Ala Gly Lys Pro GlyAsp Trp Thr Arg Lys Leu Gln Ala Gln Phe Asp Thr Lys Ile Pro Lys Gly Ile ArgAla
(SEQ ID NO: 358)
A nova D-aminotransferase obtida da cepa ATCC 4978 tem umaseqüência de proteína que possui alterações de resíduos de aminoácidosdistintos quando comparada com a seqüência de D-aminotransferase publi-cada para B. sphaericus ATCC 10208. A DAAT da ATCC 4978 possui ape-nas 72% de identidade com a DAAT de B. sphaericus (ATCC 10208). Embo-ra esta cepa esteja atualmente listada como B. sphaericus na ATCC, foi de-positada como B. rotans. Com base nos alinhamentos de seqüências e nasdiferenças destacadas entre esta nova DAAT e a DAAT de B. sphaericus, éidentificado um número de resíduos candidatos que pode ser avaliado emrelação a sua função (individualmente ou em combinação) no aumento daatividade de DAAT para a biossíntese de R,R monatina, nestas, assim comoem outras seqüências de DAAT.
Exemplo 26
Caracterização de mutantes de D-aminotransferase da ATCC 4978
Resumo Experimental
O novo gene de D-aminotransferase (descrito no Exemplo 25)de Bacillus cepa ATCC 4978 foi submetido à mutagênese utilizando métodosdirecionados ao sítio. Os genes mutantes foram expressos e analisados emrelação às atividades de interesse para as vias de produção de monatina,especialmente quando acoplados com uma ou mais aldolases.
Em adição às idéias listadas no Exemplo 16 para a mutagênesedirecionada ao sítio, outras idéias foram desenvolvidas através do acopla-mento real do R-MP no sítio ativo da estrutura em cristal YM-1 e os alinha-mentos de seqüências de aminoácidos primárias foram utilizados para de-terminar se a proteína aminotransferase 4978 provavelmente tinha caracte-rísticas estruturais similares em tal região. Era esperado que as mutaçõesadicionais a seguir fossem benéficas (utilizando a numeração de aminoáci-dos da aminotransferase 4978). Acreditava-se que a mutagênese da alanina153 em arginina estabilizaria o segundo grupo carboxila do substrato (R-MP). É provável que esta alteração aumente o impedimento estérico, deforma a compensar os resíduos de serina nas posições 181 e 182 que foramalterados para alanina ou glicina. Também foi levantada a hipótese de quepoderia ser introduzida uma arginina na posição 180, 181 ou 182 e converterum ou mais dos outros resíduos de serina em alanina ou glicina para obterespaço para a cadeia lateral mais volumosa da arginina. A fenilalanina noaminoácido 200 fica espacialmente próxima ao local onde é previsto que oR-MP se acopla no sítio ativo e há uma grande quantidade de variabilidadeneste resíduo entre as D-aminotransferases que catalisam a transaminaçãoda monatina razoavelmente bem. Acreditava-se que modificações de amino-ácidos nesta posição poderiam ser úteis. Foi previsto que a mutação da Ieu-cina 151 em fenilalanina aumenta potencialmente as interações com o anelindol do substrato.
Com base na literatura, foi levantada a hipótese de que a muta-ção da treonina 243 em asparagina pode aumentar a seletividade do R-MPem relação às reações de transaminação. Similarmente, acreditava-se que amutagênese da asparagina 100 em alanina poderia aumentar a atividadeespecífica da enzima em relação às reações de transaminação da monatina(Ro e outros, FEBS Lett 350:141-145, (1996); Sugio, S e outros, Biochemis-try 34:9661 -9669, (1995); EP1580268).
Lee e outros caracterizaram mutantes da região 141-144 (alça) edescobriram que as D-aminotransferases com o EYcY ao invés de com oLRcD (que é nativo da proteína dos presentes inventores) tendem a ter umKm menor em relação a substratos de ácido dicarboxílico. (Lee SG, HongSP, Song JJ, Kim SJ, Kwak MS, Sung MH. Functional and structural charac-terization of thermostable D-amino acid aminotransferases from Geobacillusspp. Appl Environ Microbiol. Fevereiro de 2006; 72(2): 1588-94). Devido aofato de que o MP é um substrato de ácido dicarboxílico, similar ao alfa-cetoglutarato e das concentrações de MP serem razoavelmente baixas em umamistura de reação para produção de monatina típica, um Km menor poderiapotencialmente ajudar na atividade de um DAT mutante em relação à produ-ção de monatina.
Abaixo, estão descritos métodos para a criação de mutantes daD-aminotransferase 4978, assim como resultados de ensaios utilizando es-tes mutantes.
Mutaaênese
Os iniciadores para mutagênese foram planejados seguindo assugestões listadas no kit Stratagene Multi-Change (Stratagene, La Jolla,CA). Os iniciadores foram fosforilados a 5'. A mutagênese foi realizada utili-zando o kit Stratagene Multi-Change (Stratagene, La Jolla, CA) seguindo asinstruções do fabricante. Os moldes utilizados para mutagênese eram osconstructos de DAT 4978 em pET30 (não marcado) ou em pET28 (marcado)descritas no Exemplo 25. Os iniciadores estão listados abaixo na Tabela 30:Tabela 30
Nome do
<table>table see original document page 438</column></row><table>
Células E. coli XL10-Gold (Stratagene, La Jolla, CA) foram trans-formadas e as preparações de plasmídeos purificados resultantes foram se-qüenciadas para verificar que as mutações corretas foram incorporadas.Expressão e Ensaio
As preparações de DNA plasmideal contendo os mutantes corre-
Alteração deaminoacido
T243N GTGATTGTTTCATCAACGAATTCAGAAGTA-ACGCC (SEQ ID NO:359)
T243R GTG ATTGTTTC ATC AACG CGTTC AG AAGTA-ACGCC (SEQ ID N0:360)
T243S GTGATTGTTTCATCAACGAGTTCAGAAGTA-ACGCC (SEQ ID NO:361)
T243A GTGATTGTTTCATCAACGGCTTCAGAAGTA-ACGCC (SEQ ID NO:362)
N1OOA GTGCAGGCCCTCGTGCTCATATTTTCCCTGG(SEQ ID NO:363)
T243Q GAAGTGATTGTTTCATCAACGCAGTCAGAAGTAACGCCAATTATC (SEQ ID NO:364)
T243N/N100 iniciadores anteriores utilizados juntostos ou o DAT 4978 do tipo selvagem foram transformadas no hospedeiro deexpressão de E. coli BL21(DE3) (Novagen, Madison, Wl). As culturas foramcrescidas utilizando os protocolos descritos anteriormente, os plasmídeosforam isolados utilizando o Qiagen miniprep kit (Qiagen, Valencia1 CA) eanalisados através da digestão de restrição, como descrito anteriormente,para confirmar a presença de um inserto.
A indução dò gene DAAT foi tipicamente realizada em meio LBcontendo canamicina (50 pg/mL). As células foram cultivadas até umaDO600nm de 0,4-0,8 a 37°C, induzidas com 0,1 mM de IPTG (isopropil tioga-lactosídeo) e foram tiradas amostras 3-4 horas após a indução.
Extratos celulares foram preparados com o Reagente BugBustere Benzonase Nuclease (Novagen, Madison, Wl). Ensaios de um mL foramrealizados a 30°C com agitação suave e continham 10,2 mg de D-triptofano,0,05 mM de PLP, 4 mM de MgCI2, 100 mM de tampão de fosfato de potássiopH 7,5, aproximadamente 50 pg de aldolase, 200 mM de piruvato e 0,150-0,5 mg/mL de D-aminotransferase fornecidos na forma de extratos celulares.Os ensaios de proteína total foram feitos utilizando o kit de proteína total daBio-Rad (Coomassie) (Bio-Rad, Hercules, CA) ou o kit Pierce BCA (Pierce,Rockford, IL) e a porcentagem de expressão da D-aminotransferase foi esti-mada através de SDS-PAGE ou do Bio-Rad Experion Automated Electro-phoresis System (Bio-Rad, Hercules, CA). Foram tiradas amostras em 3 ho-ras e durante a noite.
A aldolase específica a R da SEQ ID NO: 28 foi utilizada em en-saios com aproximadamente 0,150 mg/mL de D-aminotransferase.
Os primeiros ensaios mostraram que os mutantes a seguir (nãomarcados) tinham atividade de transaminação (na ordem da mais alta para amais baixa): T243N, T243S, T243N/N100A, N100A. Foi também observadoque o T243N parecia aumentar a estéreo pureza da R1R monatina produzi-da. Os ensaios foram repetidos utilizando aldolase ProA purificada de Co-mamonas testosteroni (100 pg/mL) e 0,50 mg/mL de D-aminotransferasesmutantes (não marcadas, fornecidas na forma de extrato celular). As amos-tras foram tiradas em 2 horas e durante a noite. Os resultados para as prote-ínas ativas são mostrados abaixo, foi tirada a média de resultados em dupli-cata. A % de R1R monatina foi determinada através da área do pico em H-PLC em fase inversa e então medida utilizando o método de derivatizaçãocom FDAA descrito no Exemplo 1. Na coluna 3 da Tabela 31, uma análisede LC/MS/MS com derivatização com FDAA adicional, como descrito no E-xemplo 1, foi realizada para as mesmas reações e os resultados são mos-trados entre parênteses. Apenas R,R e S,R monatinas são produzidas par-tindo de D-triptofano. O mutante T243R não parecia produzir monatina sobas condições testadas e o mutante T243A produzia níveis muito baixos demonatina.
Tabela 31
<table>table see original document page 440</column></row><table>
Embora os ensaios tenham sido realizados estimando a porcen-tagem de D-aminotransferase utilizando o Bio-Rad Experion software, é evi-dente que os mutantes T243S e T243N tinham maior atividade comparadacom a da enzima do tipo selvagem. O mutante T243N também forneceu umbenefício adicional de aumentar drasticamente a % de R,R monatina forma-da. Esta enzima possui uma maior preferência por R-MP quando comparadocom S-MP em reações de transaminação. O mutante N100A não aumentoua atividade isoladamente ou em combinação com T243N ao contrário do quefoi sugerido na literatura. Um mutante direcionado ao sítio V34A da DAT4978 não marcada também foi criado utilizando métodos similares, comodescrito anteriormente. Foi observado que o mutante direcionado ao sítioV34A tem atividade significativamente menor que a enzima do tipo selvagemsob as condições testadas.Um outro ponto de interesse nos ensaios iniciais era que a en-
zima do tipo selvagem parecia ter mais atividade quando produzida comuma marcação de His N-terminal. A mutagênese subseqüente foi realizadana versão marcada do gene. Adicionalmente, os mutantes anteriores maispromissores foram subclonados em pET28b que tinha uma marcação de HisN-terminal. Estes foram purificados utilizando colunas Novagen HIS-bind e oprotocolo do fabricante com os tampões recomendados (Novagen, Madison,Wl). O tampão das frações do eluente foi trocado, utilizando colunas GE He-althcare PD10 (GE Healthcare, Piscataway, NJ), pelo tampão utilizado nosensaios.
Ensaios de um mL com D-aminotransferase purificada (0,5mg/mL) e aldolase específica a R purificada SEQ ID NO: 276 (50 pg/mL)foram realizados a 30°C com agitação suave e continham 10,2 mg de D-triptofano, 0,05 mM de PLP, 200 mM de piruvato, 4 mM de MgCI2 e 100 mMde tampão de fosfato de potássio pH 7,5. Amostras em duplicata foram incu-badas durante 2 horas e durante a noite. Como um controle positivo, o DATde Bacillus sphaericus (clonado no Exemplo 7) foi utilizado nos mesmos en-saios. Os resultados são apresentados na Tabela 32:
Tabela 32
<table>table see original document page 441</column></row><table><table>table see original document page 442</column></row><table>
Os dados anteriores mostram que o mutante T243N produz cla-ramente a maior quantidade de monatina em 2 horas. À medida que o tempopassa, a proporção de mutante T243N mutante em relação ao controle posi-tivo de DAT de B. sphaericus é reduzida. Este resultado sugere que o mu-tante T243N não é tão estável durante a reação de monatina quanto o DATde B. sphaericus. Quando analisada sob condições similares, a enzimaT243S (marcada purificada) tinha níveis similares de atividade aos do mu-tante T243N; entretanto, a porcentagem de R,R monatina produzida era me-nor (97,2% tanto em 2 h quanto durante a noite). O mutante T243N/N100Atinha atividade menor que o mutante T243N. Entretanto, tanto T243S quantoT243N/N100A tinham atividade maior que o DAT 4978 do tipo selvagem.
Ensaios de transaminação foram realizados para determinarquais taxas de reação eram aumentadas quando se utilizava o mutanteT243N no lugar do DAT de B. sphaericus. Ensaios com meio mL foram reali-zados a 30°C tirando pontos de tempo em 1 hora, 2 horas e 5 horas. Os en-saios continham 25 mM de monatina ou de D-triptofano, 25 mM de piruvato,100 mM de fosfato de potássio pH 7,5, 50 μΜ de PLP e 0,1 mg de D-aminotransferase (marcada, purificada). N0 caso em que menos de 100 pgde DAT eram utilizados, a quantidade de alanina era normalizada para 100pg de D-aminotransferase. As amostras foram tratadas com ácido fórmico eanalisadas por LC-OPA em relação à presença do co-produto, alanina. Osresultados são mostrados nas Tabelas 33 e 34.
Tabela 33: Atividade de transaminação com R1R monatina como substrato
<table>table see original document page 442</column></row><table><table>table see original document page 443</column></row><table>
Tabela 34: Atividade de transaminação com D-triptofano como substrato
<table>table see original document page 443</column></row><table>
Para as reações com D-triptofano, os resultados mostram queparte das enzimas atingiu o equilíbrio em 2 horas. As reações com R1R mo-natina claramente são Iimitantes da taxa e aumentos nesta atividade possu-em mais impacto sobre as taxas de produção de monatina partindo de D-triptofano.
Ensaios adicionais foram realizados para verificar a estabilidadedo mutante DAT 4978 T243N. A enzima do tipo selvagem também perde aatividade ao longo do tempo. O Exemplo 27 descreve métodos para aumen-tar a estabilidade do mutante de D-aminotransferase T243N. Quando ver-sões não marcadas e marcadas recém-preparadas do mutante T243N sãopreparadas e comparadas em relação à atividade, é observado que a versãonão marcada possui uma estabilidade temporal melhor, tornando-a de formageral uma versão melhor da enzima para uso em reações de produção demonatina.Mutantes adicionais de DAT 4978 foram produzidos através demétodos comumente conhecidos pelos versados na técnica. Entretanto, to-das estas mutações resultaram em proteína que era insolúvel sob as condi-ções que foram preparadas e assim não podiam ser analisadas em relação àatividade. As mutações que resultaram em proteína insolúvel eram:
S180A/S181A/S182R;L151F;V34GS181RA153R/S181A/S182A;A153R/S182A;A153R/S182G;S180R/S181A/S182G;S180R/S181A/S182A;S180R/S181G/S182G;S180G/S181R/S182G; eS180 A/S 181 R/S 182 A.
Mutaqênese Adicional
Para criar o mutante DAT 4978 F200M, o quadro aberto de leitu-ra do DAT 4978 do tipo selvagem do Exemplo 25 (marcado) foi amplificadocom os iniciadores 73 e 80 (abaixo) e PfuTurbo DNA Polymerase (Stratage-ne, La Jolla, CA) e clonado em pCRIl-Blunt (Invitrogen, Carlsbad, CA). Suaseqüência foi verificada (Agencourt, Beverly, MA). As regiões a 5' e a 3' fo-ram amplificadas utilizando os iniciadores 80 e 96 e 99 e 103, respectiva-mente. O DNA amplificado foi então purificado em gel utilizando o QiagenQIAquick Gel Extraction Kit (Qiagen, Valencia, CA). O DNA amplificado foisubmetido à PCR utilizando os iniciadores 80 e 99. O DNA amplificado foipurificado em gel como descrito anteriormente e clonado em pCRII Blunt esua seqüência foi verificada. O quadro aberto de leitura de DAT foi subclo-nado na forma de um fragmento de digestão de restrição com Ndel/Xhol em pET28b.Tabela 35
N,úmer°d0 Seqüência
Iniciador
73 CATATGAGTTATAGCTTATGGAATGACCAAATTGTGAATG(SEQ ID NO:365)
80 CTCGAGTGCGGCCGCAAGCTTGTCGACGGAGCTC (SEQ IDNO:366)
96 AATATTT ATGGAATTAAAGATGGCGTATTATACACACATCCA
GCGAATAACATGATCTTAAATGGTATTACACGTCAAGTAATCATTAAATGTGC (SEQ ID NO:367)
99 GGCCAGTGAATTGTAATACGACTCACTATAGGGC (SEQ IDNO:368)
103 CGCCATCTTTAATTCCATAAATATTTGAAGAAGAGCCTTCTG(SEQ ID NO:369)
Os iniciadores a seguir foram planejados para mutagênese dire-cionada ao sítio adicional utilizando o QuikChange® Multi Site-Directed Mu-tagenesis Kit (Stratagene, La Jolla, CA). A mutagênese foi realizada utilizan-do o kit Stratagene Multi-Change (Stratagene, La Jolla, CA) seguindo as ins-truções do fabricante. O molde utilizado para a mutagênese era o constructode DAT 4978 pET28 (marcada) descrito no Exemplo 25. Um mutante duplotambém foi criado utilizando o mutante F200Y como molde e fazendo umarodada adicional de mutagênese com o iniciador T243N (listado anteriormente).
Tabela 36
Mutante Oligo
141 -LRcD-144 GCAACATTTGTAGAAGACATTCGTTGGGAATACTGEYcY TTACATTAAATCATTAAATTTACTTGGTGCG (SEQ IDN0:370)
F200Y GTATTATACACACATCCAGCGAATAACTACATCTTA
AATGGTATTACACGTCAAG (SEQ ID NO:371)
S244K GCAATG G ATG AAGTG ATTGTTTCATCAACG ACTAAA
GAAGTAACGCCAATTATCGACATAGATG (SEQ IDNO:372)
243-TS-244 NK GCAATGGATGAAGTGATTGTTTCATCAACGAATAAA
GAAGTAACGCCAATTATCGACATAGATG (SEQ IDNO:373)Mutante Oligo
243-TS-244 -» NR GCAATGGATGAAGTGATTGTTTCATCAACGAATCG
TGAAGTAACGCCAATTATCGACATAGATG (SEQ IDNO:374)
As regiões codificadoras dos mutantes foram verificadas atravésdo seqüenciamento de DNA (Agencourt). Os plasmídeos com a seqüênciaverificada foram transformados em células BL21(DE3) (Novagen, Madison, WI).
Expressão e Ensaio
Culturas contendo 10O mL de LB com 50 pg/mL de canamicinaem um frasco com aletas de 500 mL foram inoculadas com um mL de umacultura crescida durante a noite e crescidas a 37°C até uma densidade ótica(a 600 nm) de aproximadamente 0,6. A produção da proteína foi induzida porIPTG em uma concentração final de 1 mM. As células foram incubadas a30°C durante 4,5 horas após a adição do IPTG. As células foram centrifuga-das e congeladas a -80°C. As células foram rompidas (preparadas utilizandoo reagente Novagen BugBuster (Novagen, Madison, Wl) contendo 1 pL/mLde benzonase nuclease, 5 pL/mL de coquetel Il de inibidor de protease e0,033 pL/mL de rLysozyme seguindo o protocolo recomendado pela Nova-gen) e analsiadas por SDS-PAGE. Os mutantes (141-LRcD-144 -> EYcY) e(243-TS-244 -> NR) resultaram em proteínas insolúveis sob as condiçõesem que foram preparados. O mutante 243-TS-244--> NK não tinha atividadeque pudesse ser quantificada sob as condições testadas e provavelmente éuma atividade fraca em comparação com a do tipo selvagem assim como éa do mutante S244K.
As proteínas marcadas com His foram purificadas como a se-guir. Colunas HIS-bind (Novagen, Madison, Wl) foram equilibradas com 10mL de 100 mM de fosfato de potássio, pH 7,8, contendo 200 mM de NaCI e50 μΜ de PLP. Os extratos isentos de células foram carregados na coluna.As colunas foram lavadas com 10 mL de tampão de equilíbrio, 10 mL detampão de equilíbrio contendo 25 mM de imidazol e 10 mL de tampão deequilíbrio contendo 50 mM de imidazol. As proteínas foram eluídas com 5mL de tampão de equilíbrio contendo 500 mM de imidazol. As proteínas fo-ram dessalinizadas utilizando colunas PD10 que foram equilibradas em 100mM de fosfato de potássio, pH 7,8 contendo 50 μΜ DE PLP. As proteínaspurificadas foram concentradas e quantificadas utilizando o Ensaio de Brad-ford (Bio-Rad, Hercules, CA).
Os mutantes de D-aminotransferase foram analisados utilizando500 pg/mL da D-aminotransferase, 50 pg/mL da aldolase da SEQ ID NO:276, 4 mM de MgCI2,50 mM de fosfato de potássio pH 8, 200 mM de piruva-to de sódio, 0,05 mM de PLP e 20,4 mg/mL de D-triptofano para as condi-ções de ensaio. O volume final era de 1,25 mL. Foram tiradas amostras (200pL) após 0,5, 1, 2 e 14 horas e congeladas até o experimento ser completa-do. As amostras foram filtradas, diluídas 1 para 10 e analisadas porLC/MS/MS como descrito no Exemplo 1.
A D-aminotransferase 4978 do tipo selvagem do Exemplo 25 foiutilizada como uma referência para a atividade relativa percentual. A Tabela37 mostra a atividade relativa de cada mutante em cada ponto de tempo.
Tabela 37
<table>table see original document page 447</column></row><table>O Τ243Ν era o melhor mutante de todos os testados em relaçãoà atividade na produção de R1R monatina.
Exemplo 27
Estabilização do Mutante T243N da D-aminotransferase da cepa ATCC 4978
Como mostrado no Exemplo 25, a atividade inicial da DAT mu-tante T243N é significativamente maior que a dá DAT de B. sphaerícus, masa atividade diminui mais rapidamente. Experimentos adicionais, utilizando oprotocolo anaeróbico descrito abaixo, indicaram que a atividade inicial daDAT mutante T243N era até 8 vezes maior que a da DAT de B. sphaerícus,entretanto a atividade diminuiu rapidamente mesmo sob as condições anae-róbicas. Os estudos a seguir foram realizados para tentar manter a maioratividade durante um período de tempo estendido.
O mutante T243N da D-aminotransferase da cepa 4978 (descritano Exemplo 25) e a HMG aldolase de S. meliloti foram purificadas na formadas proteínas marcadas com HIS6 como descrito abaixo. A aldolase da SEQID NO: 276 foi purificada como descrito no Exemplo 23.Purificação de DAT da ATCC 4978 (mutante T243N)
O mutante T243N da D-aminotransferase da cepa ATCC 4978com uma marcação para purificação de HiS6 amino-terminal (descrita no E-xemplo 26) foi produzido utilizando o EMD Biosciences Overnight ExpressSystem Il (soluções 1-6) (Novagen, Madison, Wl) contendo 50 pg/mL de ca-namicina em frascos de agitação. Este sistema de expressão induz a ex-pressão de sistemas que podem ser induzidos por IPTG sem a necessidadede monitorar o crescimento celular. Após a inoculação de alíquotas de 200mL do meio (em frascos de 1 L) de culturas líquidas ou de placas do hospe-deiro de E. coli BL21(DE3) carregando o gene para a D-aminotransferasemutante T243N da cepa ATCC 4978 no plasmídeo pET28b, as culturas fo-ram incubadas a 30°C durante a noite com agitação a 225 rpm. Quando aD0600 atingiu um mínimo de 6, as células foram coletadas por centrifugaçãoe lavadas uma vez com tampão.
O extrato isento de células foi preparado utilizando EMD Biosci-ences BugBuster® (isento de amina primária) Extraction Reagent (Novagen,Madison1 Wl) contendo 1 pUniL de Benzonase® Nuclease (Novagen, Madi-son, Wl), 5 μl_/mL de Protease Inhibitor Cocktail Set Il (Calbiochem - Nova-biochem Corp., San Diego, CA) e 0,033 pL/mL de rLysozyme® (Novagen,Madison, Wl) seguindo o protocolo do fabricante. Todas as etapas de purifi-cação subseqüentes foram realizadas a 4°C. O extrato de células foi centri-fugado durante 20-30 minutos a 15.000 χ g para remover os restos celulares.
Uma alíquota de 20-25 mL do extrato isento de células foi aplicada em umacoluna de 45 mL de resina GE Healthcare Chelating Sepharose® Fast Flow(forma de níquel (II)) (GE Healthcare, Piscataway, NJ) que foi previamenteequilibrada com 100 mM de fosfato de potássio contendo 200 mM de cloretode sódio e 50 μΜ de PLP. Para gerar a forma de níquel da resina, a resinafoi lavada com 150 mL de 200 mM de sulfato de níquel (II) hexahidratado eentão com 150 mL de água destilada. Após carregar a amostra, a coluna foilavada/eluída com 150 mL do tampão de equilíbrio contendo 25 mM de imi-dazol, 150 mL do tampão de equilíbrio contendo 50 mM de imidazol e 150mL do tampão de equilíbrio contendo 500 mM de imidazol. A proteína mar-cada com HIS6 foi eluída na última lavagem. A lavagem com 500 mM de imi-dazol foi concentrada com dispositivos de filtro por centrifugação Millipo-re/Amicon Centricon Plus-70 (MWCO 10 kDa) (Millipore, Billerica, MA) em15-20 mL de acordo com as instruções do fabricante. O imidazol e cloreto desódio foram removidos através da passagem ao longo de colunas PD10 GEHealthcare descartáveis (GE Healthcare, Piscataway, NJ) (2,5 mL de amos-tra por coluna) previamente equilibradas com 100 mM de fosfato de potás-sio, pH 7,8 contendo 0,5 μΜ de PLP. A aminotransferase purificada foi eluí-da com 3,5 mL por coluna do mesmo tampão. A concentração de proteínade cada fração foi determinada utilizando o kit de ensaio Pierce BCA (Pierce,Rockford, IL) com BSA como o padrão de proteína.
A pureza de cada fração e o nível de expressão na fração deextrato isento de células foram determinados utilizando um Bio-Rad Experionmicrocapillary chip system (Bio-Rad, Hercules, CA) ou utilizando géis degradiente de 4-15% de SDS-poliacrilamida da Bio-Rad (Bio-Rad, Hercules,CA) corridos em um aparato de células Mini PROTEAN® 3. A proteína foivisualizada nos géis de poliacrilamida utilizando a coloração Bio-Rad Bio-Safe G-250 Coomassie (Bio-Rad, Hercules, CA) e descorados com água.Tipicamente, este procedimento produz ~ 20 mg de enzima partindo de 200mL de cultura crescida durante a noite que é 85-90% pura como é julgadopelo Experion software ou partindo da análise dos géis de SDS-PAGE. Alí-quotas (1-5 mL) da enzima purificada foram armazenadas a -80°C até o uso.
A purificação da aldolase da SEQ ID NO: 276 é como descritono Exemplo 23.
Purificação da HMG Aldolase de S. meliloti
A HMG aldolase de S. meliloti com uma marcação de purificaçãode HISô amino-terminal (clonagem descrita no Pedido de Patente U.S. Publi-cado N0 20040063175 e na WO 03091396 A2) foi produzida através da in-dução de culturas crescidas em caldo Luria-Bertani contendo 50 mg/L decanamicina com 0,2 mM de IPTG. Após a inoculação de alíquotas de 800mL do meio de culturas líquidas ou de placas do hospedeiro de E. coliBL21(DE3) carregando o gene para a HMG aldolase de S. meliloti empET30(Xa/LIC), as culturas foram incubadas a 37°C com agitação a 225rpm. Quando a densidade ótica atingiu uma DO6OOnm de 0,5-0,75, o IPTG foiadicionado e as culturas foram incubadas a 30°C com agitação a 225 rpmdurante 4 horas. As células foram coletadas por centrifugação e lavadasuma vez com tampão.
Para preparar o extrato isento de células contendo a aldolase deS. meliloti, as células foram ressuspensas em 3-4 volumes de 50 mM deEPPS (N-(2-hidroxietil)piperazina-N'-(ácido 3-propanossulfônico), pH 8,2contendo 100 mM de NaCI e então rompidas utilizando um homogeneizadorda Microfluidics (Microfluidics, Newton, MA) (3 passagens a 124,10 MPa(18.000 psi)), mantendo a temperatura da suspensão em menos de 15°C. Asuspensão de células foi centrifugada durante 20-30 minutos a 15.000-20.000 χ g para remover os restos celulares. A proteína marcada com HIS6foi purificada utilizando colunas EMD Biosciences HIS-Bind® (Novagen, Ma-dison, Wl) seguindo o protocolo recomendado pelo fabricante com uma ex-ceção: as colunas foram lavadas com uma solução 1:1 de tampão de Liga-ção:tampão de Lavagem ao invés do tampão de Lavagem isoladamente. Afração de eluição foi concentrada com dispositivos de filtro por centrifugaçãode 15 mL Millipore/Amicon (MWCO 5 kDa) (Millipore, Billerica, MA) em 7-10mL de acordo com as instruções do fabricante. O imidazol e o cloreto de só-dio foram removidos através da passagem ao longo de colunas PD10 GEHealthcare descartáveis (GE Healthcare, Piscataway, NJ) (2,5 mL de amos-tra por coluna) previamente equilibradas com 50 mM de EPPS, pH 8,2 con-tendo 100 mM de NaCI. A aldolase purificada foi eluída com 3,5 mL por co-luna do mesmo tampão. A concentração de proteína de cada fração foi de-terminada utilizando o kit de ensaio Pierce BCA (Pierce, Rockford, IL) utili-zando BSA como o padrão de proteína.
A pureza de cada fração e o nível de expressão na fração deextrato isento de células foram determinados utilizando géis de gradiente de4-15% de SDS-poliacrilamida da Bio-Rad (Bio-Rad, Hercules, CA) corridosem um aparato de células Mini PROTEAN® 3. A proteína foi visualizada nosgéis de poliacrilamida utilizando a coloração Bio-Rad Bio-Safe G-250 Coo-massie (Bio-Rad, Hercules, CA) e descorados com água. Tipicamente, esteprocedimento produz -15-20 mg de enzima partindo de 800 mL de cultura eé 85-95% pura. Alíquotas (1-5 mL) da enzima purificada foram armazenadasa -80°C até o uso.
Ensaios de Produção de Monatina
Tubos cônicos de polipropileno (14 mL) contendo 143_mg de D-triptofano foram desoxigenados em uma câmara anaeróbica com luvas du-rante a noite. As soluções estoque de 1 M de tampão EPPS (pH 8,2), 2 M deMgCI2, 2 M de piruvato de sódio e 10 mM de PLP foram preparadas em á-gua degaseificada e equilibradas em uma câmara anaeróbica com luvas du-rante a noite. Soluções estoque de 10% (v/v) de Tween 80, 1% (v/v) deTween 20, 1% (v/v) de Triton X-100, 100% de acetona, 100% de etanol e50% (p/v) de glicerol foram equilibradas na câmara anaeróbica com luvasjunto com 0,7 g de cada de trealose, inositol, sorbitol e eritritol em tubos demicrocentrífuga de 2 mL. As preparações das enzimas purificadas foramdescongeladas em gelo e utilizadas imediatamente na câmara anaeróbicacom luvas. As soluções estoque foram adicionadas nos tubos cônicos de 14mL para fornecer uma concentração final de 100 mM de EPPS, 200 mM depiruvato, 100 mM de triptofano, 1 mM de MgCI2, 0,05 mM de PLP, 0,5mg/mL de D-aminotransferase e 0,01 mg/mL de aldolase da SEQ ID NO:276 ou 0,05 mg/mL de HMG aldolase de S. meliloti. Os compostos de estabi-lização de enzima propostos foram adicionados em várias concentraçõesfinais (Tabelas 38 e 39) para levar o volume de reação final a 7 mL por tubo.
As reações foram incubadas à temperatura ambiente na câmara anaeróbicacom luvas com agitação suave durante até 24 horas. Amostras foram remo-vidas periodicamente e analisadas em relação à monatina como descrito noExemplo 1 utilizando o método de monitoramento de reação múltiplo porLC/MS/MS. As taxas iniciais foram calculadas partindo das amostras tiradas0 e 3 h após a adição da enzima.
Tabela 38
<table>table see original document page 452</column></row><table><table>table see original document page 453</column></row><table>
Tabela 39 (aldolase da SEQ ID NO: 276)
<table>table see original document page 453</column></row><table>
A adição de 0,01% - 0,1% (v/v) de detergente, tal como Triton X-100, Tween 20 ou Tween 80 ou 1% - 10% (p/v) de poliol, tal como glicerol,trealose, inositol ou sorbitol, aumentou a estabilidade da D-aminotransferaseT243N ao longo do tempo do experimento.
Exemplo 28A: Clonagem de Aminoácido Racemase de Especificidade Ampla (Broad-specificity Amino Acid Racemase - BAR) de Pseudomonas putida KT2440
Uma BAR foi identificada em P. putida KT2440 utilizando infor-mação proveniente da literatura (Roise, D., Soda, K., Yagi, T., Walsch, C.T.,Biochemistry 23, 5195-5201, (1984)). O sítio ativo de uma enzima BAR de P.striata foi seqüenciada e relatada - LTAVLKADAYGXGIGL (SEQ ID NO:375). Esta seqüência foi utilizada para submeter ao BLAST a seqüência ge-nômica de P. putida KT2440 disponível no NCBI. Foi identificada uma prote-ína com uma seqüência consenso quase idêntica. Os iniciadores foram pla-nejados para clonar o gene do DNA genômico obtido na American Type Cul-ture Collection (ATCC, Manassas, VA)
(5'-AGAAGACATATGCCCTTTCGCCGTAGGG-3' (SEQ ID NO: 376 e5'-AGAAGAGGATCCTCAGTCGACGAGTATCTTCG-3') (SEQ ID NO: 377)).
A PCR foi realizada sob condições padronizadas e o produto daPCR foi purificado (QIAquick PCR purification kit, Qiagen, Valencia, CA). Oproduto da PCR purificado foi digerido com Nde I e SamH I. O produto daPCR digerido foi purificado em gel (QIAquick Gel Extraction Kit, Qiagen, Va-lencia, CA) e ligado em pET30 e pET28 que foram digeridos e purificadosem gel de uma maneira similar. Os clones com insertos foram seqüenciados(Agencourt, Beverly, MA) e os isolados com a seqüência correta foram iden-tificados (pET30 KT2440 BAR e pET28 KT2440BAR) e utilizados em estu-dos posteriores.
A seqüência de DNA de BAR de KT2440 é:atgccctttcgccgtacccttctggctgcatccctggcacttctgatcaccggacaggcccccctgtatgcggcaccaccgttgtcgatggacaacggcaccaacaccctgaccgtgcaaaacagcaatgcctgggtcgaagtcagcgccagcgccctgcagcacaacatccgcacgctgcaggccgagctggccggcaagtccaagctgtgcgccgtgctcaaggccgatgcctatggccacggtatcggcctggtaatgccatcgatcatcgcccaaggcgtgccctgcgtggcggtggccagcaacgaggaggcccgcgtggtccgcgccagtggcttcaccgggcaactggtgcgggtacgcctggccagcctcagcgagctggaagatggcttgcagtacgacatggaagagctggtgggcagcgcggaatttgcccgccaggccgatgccatcgccgcgcgccatggcaagaccttgcgcattcacatggcgctcaactccagcggcatgagccgcaacggggtggagatggccacctggtccggccgtggcgaagcgctgcagatcaccgaccagaagcacctcaagctggtcgcgctgatgacccacttcgccgtggaagacaaggacgatgtacgcaagggcctggcggcattcaacgagcagaccgactggttgatcaa
gcacgccaggctggaccgcagcaagctcaccctgcacgccgccaactcgttcgctacgctggaagtgc
cggaagcgcgcctggacatggtacgaacgggtggcgcgctgttcggcgacaccgtgccggcgcgcac
cgagtacaaacgtgcgatgcagttcaaatcgcacgtggcggcggtgcacagctatccggccggcaaca
ccgtgggctatgaccgcaccttcaccctggcccgtgattcgcggctggccaacattacggtcgggtactcc
gatggctaccgccgggtattcaccaacaagggccatgtgctgatcaacggccaccgtgtgccggtcgtgg
gcaaggtgtcgatgaacacgctgatggtcgatgtcaccgacttccctgatgtgaaggggggtaacgaagt
ggtgctgttcggcaagcaggccgggggcgaaatcacccaggccgagatggaagaaatcaacggcgc
gttgctcgccgatttgtacaccgtatggggcaattccaacccgaagatactcgtcgactga
(SEQ ID NO: 378).
A seqüência de aminoácidos de BAR de KT2440 é:Mpfrrtllaaslallitgqaplyaapplsmdngtntltvqnsnawvevsasalqhnirtlqaelagksklcavlkadayghgiglvmpsiiaqgvpcvavasneearvvrasgftgqlvrvrlaslseledglqydmeelvgsaefarqadaiaarhgktlrihmalnssgmsrngvematwsgrgealqitdqkhlklvalmthfavedkddvrkglaafneqtdwlikharldrskltlhaansfatlevpearldmvrtggalfgdtvparteykramqfkshvaavhsypagntvgydrtftlardsrlanitvgysdgyrrvftnkghvlinghrvpvvgkvsmntlmvdvtdfpdvkggnevvlfgkqaggeitqaemeeingalladlytvwgnsnpkilvd(SEQ ID NO: 379)
B) Purificação de BAR de P. putida KT2440.
O plasmídeo pET30 KT2440 BAR descrito anteriormente foitransformado em BL21 DE3 pLysS (Invitrogen, Carlsbad, CA). A cepa resul-tante foi cultivada em LB ou Terrific Broth a 37°C com aeração até umaDO600nm de 0,4-0,6 e induzida com 1 mM de IPTG. A incubação foi continua-da 3-4 horas a 37°C com aeração. As células foram coletadas por centrifu-gação e a pélete de células foi armazenada a -80°C até o uso. O pélete decélulas foi descongelada em gelo. As células foram lisadas com BugBuster(Novagen, Madison, Wl) e Benzonase (Novagen, Madison, Wl). Os restoscelulares foram removidos por centrifugação e o extrato isento de células foiutilizado imediatamente ou armazenado a -80°C. O gene BAR de KT2440também foi clonado nos sítios Nde\-BamH\ de pET28 e transformado emBL21 DE3 pLysS. Esto constructo não parecia expressar proteína solúvelmuito eficientemente de forma que a versão não marcada (pET30 KT2440BAR) foi utilizada em estudos futuros.
o extrato foi aplicado em uma coluna UnoQ (Bio-Rad, Hercules,CA) que foi equilibrada com pelo menos 5 volumes da coluna de tampão A(25 mM de fosfato de potássio pH 8,0, 10 μΜ de piridoxal-5'-fosfato (PLP)). Acoluna foi lavada com 2 volumes da coluna de tampão A. A proteína foi eluí-da com um um gradiente linear de tampão B (tampão A + 1 M de NaCI) par-tindo de 0-100% de tampão B ao longo de 20 volumes da coluna e fraçõesde 5 mL foram coletadas no momento em que o gradiente foi iniciado. Asfrações foram analisadas utilizando o método Amplex Red descrito no E-xemplo 4 - parte 7. Sucintamente, 100 pg de D-aminoácido oxidase (Sigma-Aldrich, St. Louis, MO), 0,05 mM de FAD, 25 mM de L-trp e um volume pe-queno da fração que seria analisada foram combinados em 50 μΙ_ de H2O eadicionados em 50 μι. de tampão de reação de Amplex Red preparado comoindicado no protocolo do fabricante. As frações com atividade foram dessali-nizadas com uma coluna PD-10 (GE Healthcare, Piscataway, NJ) e concen-tradas com agentes de concentração por centrifugação Amicon (Millipore,Billercia, MA). A proteína purificada foi armazenada a -80°C.C) Produção e ensaio de um mutante Y354A de alanina racemase de Geo-bacillus stearothermophilus com atividade de triptofano racemase
A alanina racemase de Geobacillus stearothermophilus do tiposelvagem (SEQ ID NO: 380, mostrada abaixo) foi clonada em pET30 comoum molde para a mutagênese direcionada ao sítio para produzir uma altera-ção Y354A. O gene da SEQ ID NO: 380 pode ser amplificado através deprotocolos de PCR padronizados e clonados utilizando técnicas de DNA re-combinante padronizadas. O gene da SEQ ID NO: 380 também pode serreconstruído através de qualquer método conhecido por um perito comum natécnica, tal como métodos de PCR de montagem conhecidos por um versa-do na técnica.
As seqüências de DNA e de aminoácidos da alanina racemasede Geobacillus stearothermophilus do tipo selvagem são mostradas abaixocomo a SEQ ID NO: 380:
atggacgagt ttcaccgcga tacgtgggcg gaagtggatt tggacgccat ttacgacaat gtgga-gaatt tgcgccgttt gctgccggac gacacgcaca ttatggcggt cgtgaaggcg aacgcctatggacatgggga tgtgcaggtg gcaaggacag cgctcgaagc gggggcctcc cgcctggcggttgccttttt ggatgaggcg ctcgctttaa gggaaaaagg aatcgaagcg ccgattctagttctcggggc ttcccgtcca gctgatgcgg cgctggccgc ccagcagcgc attgccctgaccgtgttccg ctccgactgg ttggaagaag cgtccgccct ttacagcggc ccttttccta ttcatttccatttgaaaatg gacaccggca tgggacggct tggagtgaaa gacgaggaag agacgaaacg a-atcgtagcg ctgattgagc gccatccgca ttttgtgctt gaaggggtgt acacgcattt tgcgactgcggatgaggtga acaccgatta tttttcctat cagtataccc gttttttgca catgctcgaa tggctgccgtcgcgcccgcc gctcgtccat tgcgccaaca gcgcagcgtc gctccgtttc cctgaccgga cgtt-caatat ggtccgcttc ggcattgcca tgtatgggct tgccccgtcg cccggcatca agccgctgctgccgtatcca ttaaaagaag cattttcgct ccatagccgc ctcgtacacg tcaaaaaact gcaac-caggc gaaaaggtga gctatggtgc gacgtacact gcgcagacgg aggagtggat cgggac-gatt ccgatcggct atgcggacgg ctggctccgc cgcctgcagc actttcatgt ccttgttgac gga-caaaagg cgccgattgt cggccgcatt tgcatggacc agtgcatgat ccgcctgcct ggtccgctgccggtcggcac gaaggtgaca ctgattggtc gccaagggga cgaggtaatt tccattgatgatgtcgctcg ccatttggaa acgatcaact acgaagtgcc ttgcacgatc agttatcgag tgccccg-tat ttttttccgc cataagcgta taatggaagt gagaaacgcc gttggccgcg ga(SEQ ID NO: 380).
A seqüência de aminoácidos codificada da Alanina Racemase(Geobacillus stearothermophilus) é mostrada abaixo como a SEQ ID NO: 381:
Met Asp Glu Phe His Arg Asp Thr Trp Ala Glu Val Asp Leu Asp Ala Ile TyrAsp Asn Val Glu Asn Leu Arg Arg Leu Leu Pro Asp Asp Thr His Ile Met AlaVal Val Lys Ala Asn Ala Tyr Gly His Gly Asp Val Gln Val Ala Arg Thr Ala LeuGlu Ala Gly Ala Ser Arg Leu Ala Val Ala Phe Leu Asp Glu Ala Leu Ala LeuArg Glu Lys Gly Ile Glu Ala Pro Ile Leu Val Leu Gly Ala Ser Arg Pro Ala AspAla Ala Leu Ala Ala Gln Gln Arg Ile Ala Leu Thr Val Phe Arg Ser Asp Trp LeuGlu Glu Ala Ser Ala Leu Tyr Ser Gly Pro Phe Pro Ile His Phe His Leu Lys MetAsp Thr Gly Met Gly Arg Leu Gly Val Lys Asp Glu Glu Glu Thr Lys Arg Ile ValAla Leu Ile Glu Arg His Pro His Phe Val Leu Glu Gly Val Tyr Thr His Phe AlaThr Ala Asp Glu Val Asn Thr Asp Tyr Phe Ser Tyr Gln Tyr Thr Arg Phe LeuHis Met Leu Glu Trp Leu Pro .Ser Arg Pro Pro Leu Val His Cys Ala Asn SerAla Ala Ser Leu Arg Phe Pro Asp Arg Thr Phe Asn Met Val Arg Phe Gly IleAla Met Tyr Gly Leu Ala Pro Ser Pro Gly Ile Lys Pro Leu Leu Pro Tyr Pro LeuLys Glu Ala Phe Ser Leu His Ser Arg Leu Val His Val Lys Lys Leu Gln ProGly Glu Lys Val Ser Tyr Gly Ala Thr Tyr Thr Ala Gln Thr Glu Glu Trp Ile GlyThr Ile Pro Ile Gly Tyr Ala Asp Gly Trp Leu Arg Arg Leu Gln His Phe His ValLeu Val Asp Gly Gln Lys Ala Pro Ile Val Gly Arg Ile Cys Met Asp Gln Cys MetIle Arg Leu Pro Gly Pro Leu Pro Val Gly Thr Lys Val Thr Leu Ile Gly Arg GlnGly Asp Glu Val Ile Ser Ile Asp Asp Val Ala Arg His Leu Glu Thr Ile Asn TyrGlu Val Pro Cys Thr Ile Ser Tyr Arg Val Pro Arg Ile Phe Phe Arg His Lys ArgIle Met Glu Val Arg Asn Ala Val Gly Arg Gly(SEQ ID NO: 381)
A mutagênese foi realizada utilizando o QuickChange-MuIti site-Directed Mutagenesis Kit (Stratagene, La Jolla1 CA). O iniciador mutagênicoa seguir foi utilizado para produzir a alteração Y354A, 5'-gccatttggaaacgatcaacgcggaagtgccttgcacgatcag-31 (SEQ ID NO: 382). A mu-tagênese direcionada ao sítio foi realizada como descrito no protocolo dofabricante. Vários isolados foram seqüenciados (Agencourt, Beverly1 MA) eum isolado com a seqüência correta foi selecionado e utilizado para análiseadicional.
O mutante isolado pET30Y354A foi transformado em E. coliBL21(DE3)pLysS. A proteína purificada foi preparada da maneira a seguir. Acepa foi cultivada em LB ou Terrific Broth (a 37°C com aeração) até umaDOeoonm de 0,4-0,6 e induzida com 1 mM de IPTG. A incubação foi continua-da a 37°C com aeração durante ~3 horas. As células foram coletadas porcentrifugação e a pélete de células foi armazenada a -80°C.
O pélete de células foi descongelado em gelo e então ressus-penso em um volume apropriado de BugBuster (Novagen, Madison, Wl)mais Benzonase nuclease (Novagen, Madison, Wl). Os restos celulares fo-ram removidos por centrifugação e o extrato isento de células foi aplicadoem uma coluna HIS-Bind (Novagen, Madison, Wl) que foi equilibrada comtampão de Ligação. A coluna foi lavada com tampão de ligação e tampão deLavagem e a proteína foi eluída com o tampão de Eluição (como indicado noprotocolo do fabricante). A proteína purificada foi dessalinizada utilizandouma coluna PD-10 (GE Healthcare, Piscataway1 NJ). A proteína foi dessali-nizada em 50 mM .de fosfato de potássio pH 8,0 e 10 μΜ de piridoxal-5'-fosfato de acordo com o protocolo do fabricante. A proteína foi concentradautilizando um agente de concentração por centrifugação Amicon (Millipore,Billercia, MA). A proteína purificada e concentrada foi dividida em pequenasalíquotas e armazenada a -80°C até o uso.
A Y354A purificada foi comparada com a alanina racemase dotipo selvagem (preparada da maneira descrita anteriormente) tanto nos en-saios com alanina quanto com triptofano. Os ensaios foram realizados a37°C em 50 mM de tampão de fosfato de potássio, pH 8 e 10 μΜ de PLPutilizando 400 μΙ_ de proteína purificada concentrada (>1 mg/mL) e 50 mMde substrato. A detecção de D-alanina e de D-triptofano foi realizada utili-zando a metodologia de aminoácido quiral descrita no Exemplo 1.
Tabela 40
<table>table see original document page 459</column></row><table><table>table see original document page 460</column></row><table>
*nd = nenhum detectado
Estes dados foram analisados sem o uso de um padrão interno;assim, estes dados são semiquantitativos e devem ser utilizados para finali-dades de comparação. Entretanto, estes resultados mostram que a mutaçãoisolada Y354A é suficiente para ampliar a especificidade da alanina racema-se de forma que possa catalisar a racemização de aminoácidos utilizandosubstratos alternativos.
D) Ensaio da enzima BAR.
A enzima BAR foi analisada como a seguir. Os ensaios de Am-plex Red foram ajustados como descrito neste exemplo. A BAR de P. putidaKT2440 foi utilizada a 200 pg (purificada como descrito neste exemplo). Aalanina racemase de G. stearothermophilus do tipo selvagem e a Y354A fo-ram purificadas como descrito neste exemplo e utilizadas a 200 pg/mL ou a1000 pg/mL. CE é o extrato isento de células que foi preparado como descri-to neste exemplo. Os resultados para o ponto de tempo de 60 minutos sãomostrados na Tabela 41 abaixo.
Tabela 41
<table>table see original document page 460</column></row><table><table>table see original document page 461</column></row><table>
A proteína purificada também foi analisada em relação à ativida-de de triptofano racemase em 50 mM de fosfato de potássio pH 8, 10 μΜ dePLP e 30 mM de L-triptofano como descrito anteriormente. 200 pg/mL ou1000 pg/mL de enzima purificada foram utilizados nos ensaios (indicado en-tre parênteses). O D-triptofano foi analisado utilizando o método de aminoá-cido quiral descrito no Exemplo 1 para detecção.
Tabela 42
<table>table see original document page 461</column></row><table><table>table see original document page 462</column></row><table>
Os ensaios indicam que a enzima BAR de P. putida KT2440 émuito mais ativa sobre o triptofano que a eznima derivada de G. stearother-mophilus e o mutante Y354A da mesma.
E) Produção de monatina com BAR de P. putida KT2440.
Um ensaio de produção de monatina foi realizado com a BAR deP. putida KT2440 purificada (como purificada anteriormente) (100 pg) ouY354A purificada (como purificada anteriormente) (500 pg), a D-aminotransferase (BioCataIytics AT-103 (Pasadena, CA)) (500 pg) e a aldo-lase da SEQ ID NO: 276) (como purificada no Exemplo 23) (50 pg). O expe-rimento de produção de monatina partindo de L-triptofano foi realizado comoa seguir. Em adição às enzimas anteriores, os seguintes foram adicionadospor 1 mL de mistura de reação: 4 mM de MgCfe, 50 mM de L-triptofano, 100mM de piruvato de sódio, 100 mM de tampão de fosfato de potássio pH 7,5 e0,05 mM de PLP.
Como um controle, o experimento foi realizado como descritoanteriormente sem racemase e partindo de D-triptofano ao invés de L-triptofano. Um resumo dos resultados é apresentado na Tabela 43 abaixo.
Tabela 43
<table>table see original document page 462</column></row><table><table>table see original document page 463</column></row><table>
Não foi detectada monatina utilizando Y354A neste experimento.
Esta racemase foi utilizada no passado (dados não mostrados) para produzirmonatina, mas um nível muito mais alto de enzima foi utilizado (pelo menos2 mg e até 10 mg para observar níveis mais altos de monatina). A BAR de P.putida KT2440 foi utilizada para produzir monatina partindo de L-triptofano.
Os 100 pg utilizados neste experimento não eram suficientes para observara produção de monatina após duas horas, mas eram suficientes para obser-var a produção de monatina após 18 horas. A distribuição de estereoisôme-ros indicava que a maior parte da monatina produzida era o isômero R,R.Não era produzido o isômero R,S. Este resultado indica que a BAR deKT2440 não é capaz de racemizar de forma detectável o isômero R,R demonatina (a racemização do isômero R,R produziria o isômero R,S). Eraproduzida uma quantidade significativa do isômero S,S neste experimento.Isto é provavelmente por causa do fato de que a AT-103 utilizada neste ex-perimento não era altamente purificada e podia conter L-aminotransferasesdo extrato celular e que havia uma grande quantidade de L-triptofano pre-sente para servir como um doador de amino para a transaminação de S-MP.
Exemplo 29
Clonagem e Expressão de Arginina Racemase de Pseudomonas taetrolensResumo Experimental
A arginina racemase de Pseudomonas taetrolens (também co-nhecida como Ρ. graveolens) (N2 de Acesso do Genbank AB096176, se-qüência de ácido nucléico) e um mutante I384M da mesma, foram clonadas,expressas e testadas em relação à atividade na conversão de L-triptofanoem D-triptofano. Este gene é 72% idêntico ao gene BAR de P. putida deKT2440 e 73% idêntico ao gene BAR de P. putida BAR de NBRC 12996descritos anteriormente. A seqüência de aminoácidos é 72% idêntica a am-bas as proteínas BAR de P. putida.
Protocolo da Reação em Cadeia da Polimerase
Pseudomonas taetrolens (ATCC 4683) foi cultivada em caldonutricional a 28°C com agitação a 225 rpm. A reação em cadeia da polime-rase foi realizada em células inteiras utilizando os iniciadores planejadoscom sítios de restrição a 5' e pontas coesivas para clonagem nos vetorespET 28 e pET30 (Novagen, Madison, Wl).
As seqüências dos iniciadores eram:N term: 5'-ATAATACATATGCCCTTCTCCCGTACCC -3' (SEQ ID NO: 408) eC term: 5'-GCGGCGGGATCCTTACTGATCTTTCAGGATT-3' (SEQ ID NO:409).
O gene derivado de P. taetrolens foi amplificado utilizando o pro-tocolo de PCR a seguir. Vinte e cinco pL de células cultivadas foram Iisadosa 96°C durante 10 minutos. Os restos celulares foram removidos por centri-fugação e o sobrenadante foi utilizado como molde para a PCR. Uma reaçãode 100 pL continha 5 pL de molde (sobrenadante de células lisadas), 1,6 μΜde cada iniciador, 0,3 mM de cada dNTP, 10 U de rT,h Polymerase XL (Ap-plied Biosystems, Foster City, CA), 1X tampão XL e 1 mM de Mg(OAc)2. Oprograma do termociclador utilizado incluía um início a quente a 94°C duran-te 3 minutos, 8 repetições das etapas a seguir: 94°C durante 30 segundos,52°C durante 30 segundos e 68°C durante 2 minutos, seguidos por 22 repe-tições das etapas a seguir: 94°C durante 30 segundos, 58°C durante 30 se-gundos e 68°C durante 2 minutos. Após as 22 repetições, a amostra foi man-tida a 68°C durante 7 minutos e então armazenada a 4°C. Este protocolo daPCR obteve um produto de 1230 pb.
ClonagemO produto da PCR foi purificado em gel partindo de gel de TAE-agarose a 0,8% utilizando o Qiagen gel extraction kit (Qiagen, Valencia, CA).O produto foi clonado em TOPO e transformado em células TOP 10 de a-cordo com o protocolo do fabricante (Invitrogen, Carlsbad, CA). O DNAplasmideal foi purificado partindo dos transformantes resultantes utilizando oQiagen spin miniprep kit (Qiagen, Valencia, CA) e verificados em relação aosinsertos corretos através da digestão de restrição com Nde I e BamH I. Asseqüências dos plasmídeos que pareciam ter o inserto correto foram verifi-cadas através do seqüenciamento de DNA com terminação de cadeia dide-sóxi com os iniciadores universais M13 para frente e M13 Inverso.
O clone TOPO correto foi digerido com as enzimas de restriçãoNde I e BamH I seguindo os protocolos recomendados pelo fabricante (NewEngland Biolabs, Beverly1 MA) e purificado em gel partindo de géis de TAE-agarose a 0,8% utilizando o Qiagen gel extraction kit (Qiagen, Valencia, CA).Os vetores pET 28 e pET 30 foram preparados através da digestão com asenzimas de restrição Nde I e BamH I seguida pelo tratamento com fosfatasealcalina de camarão (Roche, Indianapolis, IN) e pela purificação partindo degéis de TAE-agarose a 0,8% utilizando o Qiagen gel extraction kit (Qiagen,Valencia, CA). Os vetores e o inserto digeridos foram ligados utilizando oRapid ® DNA Ligation Kit (Roche, Indianapolis, IN). Aproximadamente 50 ngde inserto tratado, 100 ng de vetor tratado (proporção molar de 3 para 1 deinserto em relação ao vetor), 5 U de T4 DNA Iigase e 1X tampão de ligaçãoforam incubados durante 5 minutos à temperatura ambiente. A reação deligação foi dessalinizada utilizando o High Pure PCR Product Purification Kit(Roche, Indianapolis, IN) e utilizada para transformar células e Ietrocompe-tentes E. coli DH10B (Invitrogen, Carlsbad, CA). Dez pL de cada reação deligação foram adicionados em 40 pL de células DH10B, que foram transfor-madas por eletroporação utilizando o BioRad Gene Pulsar Il sob as condi-ções a seguir: 2,5 kV, 25 pF, 200 ohm em uma cubeta de 0,2 cm. Foi permi-tido que as células se recuperassem em 1 ml_ de SOC à temperatura ambi-ente durante 1 hora a 37°C com agitação a 225 rpm. As células foram pla-queadas em placas de LB contendo canamicina (50 pg/mL). O DNA plasmi-deal foi purificado partindo dos transformantes resultantes utilizando o Qia-gen spin miniprep kit (Qiagen, Valencia1 CA) e verificados em relação aosinsertos corretos através da digestão de restrição com Nde I e BamH I.
Expressão Gênica e Ensaios
O DNA plasmideal foi transformado no hospedeiro de expressãode E. coli BL21(DE3) pLysS (Novagen, Madison, Wl). As culturas foramcrescidas e os plasmídeos foram isolados utilizando o Qiagen miniprep kit(Qiagen, Valencia, CA) e analisados através da digestão de restrição paraconfirmar a identidade.
A indução em BL21DE3 pLysS foi inicialmente realizada em am-bos os vetores pET 28 (marcado com histidina) e pET 30 (não marcado). Umestudo de curso de tempo foi realizado com culturas crescidas a 37°C em100 mL de LB contendo canamicina (50 mg/L) até uma D06oo de 0,5 e indu-zidas com 100 μΜ de IPTG (isopropil tiogalacatosídeo) e foram tiradas a-mostras em 0 e 3 horas após a indução. As células dos pontos de tempo de0 hora e 3 horas foram ressuspensas em 1X tampão dodecil sulfato de sódiocontendo 2-mercaptoetanol e aquecidas a 95°C durante 10 minutos e resfri-adas. Alíquotas destas amostras de proteína celular total foram analisadasatravés de SDS-PAGE utilizando um gel com gradiente de 4-15%.
Os extratos de células também foram preparados partindo dasculturas de 3 horas através da suspensão dos péletes de células de 5 mL decultura em reagente Novagen BugBuster® contendo benzonase nuclease e oconjunto # 3 de coquetel de inibidor de protease (Calbiochem-NovabiochemCorp., San Diego, CA) à temperatura ambiente durante 20 minutos com agi-tação suave e centrifugados a 16.000 χ g para remover restos celulares. Ossobrenadantes (extratos de células) foram carregados em géis com gradien-te de 4-15% para a análise das proteínas solúveis celulares.
A amostra de 3 horas da arginina racemase de P. taetrolens clo-nada exibia uma banda de proteína total que correspondia ao tamanho cor-reto (aproximadamente 45 kDa) no vetor pET 30 (não marcado). O produtogênico de pET 30 de P. taetrolens era superexpresso em um nível mais altoque o produto gênico de pET 28 de P. taetrolens (não marcado com histidi-na), mas nenhum dos vetores forneceu uma banda de proteína solúvel visível.
As células das culturas induzidas (100 mL) foram centrifugadase lavadas uma vez com 0,85% de NaCI. Os péletes de células foram ressus-pensos em 5 mL/g de peso úmido de células do reagente BugBuster® (No-vagen, Madison, Wl) contendo 5 pL/mL do conjunto # 3 de coquetel de inibi-dor de protease (Calbiochem-Novabiochem Corp., San Diego, CA) e 1pL/mL de benzonase nuclease. As amostras foram incubadas à temperaturaambiente durante 20 minutos em um agitador orbital. Os restos celularesinsolúveis foram removidos por centrifugação a 16.000 X g durante 20 minu-tos a 4°C.
Os extratos de células foram analisados em relação à atividadede triptofano racemase utilizando o protocolo a seguir. Reações de um mLforam realizadas em 50 mM de fosfato de potássio (pH 8,0), 0,05 mM dePLP e 30 mM de L triptofano. As reações foram iniciadas através da adiçãode extratos isentos de células e foram incubadas a 30°C durante a noite.Foram tiradas alíquotas de amostras após a incubação durante a noite (asamostras em zero minuto serviam como a reação de controle). O ácido fór-mico concentrado (5 pL) foi adicionado em cada alíquota de amostra de 250pL para interromper a reação e a proteína precipitada foi removida por cen-trifugação. Os sobrenadantes foram removidos e congelados a -80°C atéserem analisados em relação ao D-triptofano através do método de aminoá-cido quiral descrito no Exemplo 1.
Os resultados dos ensaios dos extratos de células provenientesda indução de pET28 e pET30 com 100 μΜ de IPTG (3 horas) demonstramque os clones de P. taetrolens exibem atividade de racemase sobre o L-triptofano. Novamente, a versão marcada da BAR parece ser menos ativa epode precipitar ou ser menos solúvel que a não marcada (pET28). A Tabela44, abaixo, mostra os resultados iniciais, embora não quantitativos uma vezque foi obtida uma proteína muito fracamente solúvel.Tabela 44
<table>table see original document page 468</column></row><table>
A indução do constructo de pET30 (não marcada) foi repetidautilizando as mesmas condições que as mencionadas anteriormente e umabanda de proteína solúvel visível foi observada na SDS-PAGE. O ensaio foirepetido utilizando as mesmas condições descritas anteriormente e foramobtidos os resultados, que são mostrados na Tabela 45 abaixo.
Tabela 45
<table>table see original document page 468</column></row><table>
Novamente, foi observado que a duplicação dos volumes nãoaumentava mais a atividade. Para um trabalho futuro, foi determinado remo-ver a proteína do Bugbuster o mais rápido possível após a preparação dosextratos de células e armazenar a proteína em 50 mM de tampão de fosfatopH 8 contendo 0,01 mM de PLP. O detergente no Bugbuster pode inibir areação ou pode causar uma perda de atividade após o armazenamento.
A indução do constructo pET30 foi realizada novamente e o ex-trato de células foi processado com cromatografia de troca aniônica (comono Exemplo 28) para fornecer um extrato mais puro. O ensaio foi repetidocom esta preparação parcialmente purificada. Os números entre parêntesesna coluna de Extrato de-Racemase da Tabela 46 abaixo-indicam a quantida-de aproximada de enzima racemase parcialmente purificada utilizada no en-saio. Os resultados do ensaio são mostrados na Tabela 46 abaixo.
Tabela 46
<table>table see original document page 469</column></row><table>
A não linearidade da amostra cultivada durante a noite nestecaso é provavelmente devida ao fato de que as reações estão atingindo oequilíbrio. Evidentemente, a BAR de P. taetrolens possui atividade significa-tiva em relação à racemização de triptofano, assim como a BAR de 12996 ea BAR de KT2440. Parece que a BAR de KT2440 e a BAR de P. taetrolenspossuem atividade similar, que é ligeiramente maior que a da BAR de 12996.
A seqüência de DNA da arginina racemase de P. taetrolens émostrada abaixo como a SEQ ID NO: 410. A seqüência da PCR forneceuduas alterações quando comparada com a seqüência do NCBI publicada.
Especificamente, a seqüência da PCR continha uma adenosina ao invés deuma guanina na posição 902 e uma citosina ao invés de uma guanina naposição 921. Estas alterações no DNA resultaram em uma mutação silencio-sa assim como em uma alteração de glicina em aspartato na posição de a -minoácido 301.
ATGCCCTTCTCCCGTACCCTGCTCGCCCTTTCCCTTGGCATGGCATTGC
TGCAAAACCCGGCCTTTGCTGCGCCACCCCTGTCGATGACCGACGGCG
TAGCTCAAGTGAATACCCAGGACAGCAATGCCTGGGTCGAAATCAATAA
AGCCGCGTTCGAGCACAACATACGGACTCTGCAAACCGCCCTCGCCGG
CAAGTCGCAGATCTGCGCCGTACTCAAGGCGGATGCCTATGGCCACGG
TATCGGCTTGTTGATGCCCTCGGTGATCGCCATGGGTGTTCCCTGTGTC
GGTGTCGCCAGCAACGAAGAAGCCCGCGTCGTGCGCGAGAGCGGTTT
CAAGGGTCAACTGATACGCGTGCGCACCGCTGCCCTGAGCGAACTGGA
AGCTGCACTGCCGTACAACATGGAAGAGCTGGTGGGCAACCTGGACTT
CGCGGTCAAGGCCAGCCTGATTGCCGAGGATCACGGTCGCCCGCTGG
TGGTGCACCTGGGTCTGAATTCCAGCGGCATGAGCCGTAACGGAGTGG
ACATGACCACCGCTCAGGGCCGTCGTGATGCGGTAGCTATCACCAAGG
TGCCAAACCTGGAAGTGCGGGCGATCATGACCCACTTCGCGGTCGAAG
ATGCTGCCGACGTGCGTGCCGGGCTCAAGGCCTTCAATCAGCAAGCCC
AATGGCTGATGAACGTGGCCCAGCTTGATCGCAGCAAGATCACCCTGC
ACGCGGCCAACTCGTTCGCCACACTGGAGGTGCCCGAATCGCATCTGG
ACATGGTCCGCCCCGGCGGCGCGCTGTTCGGCGACACCGTACCGTCC
CACACCGAGTACAAGCGGGTCATGCAGTTCAAGTCCCACGTGGCGTCG
GTCAACAGCTACCCCAAGGGCAACACCGTCGGTTATGACCGCACGTAC
ACCCTGGGCCGCGACTCGCGGCTGGCCAACATCACCGTCGGCTACTCT
GACGGCTACCGCCGCGCGTTTACCAATAAAGGGATTGTGCTGATCAAC
GGCCATCGCGTGCCAGTGGTGGGCAAAGTCTCGATGAACACCCTGATG
GTGGACGTCACTGACGCGCCGGATGTGAAAAGCGGCGATGAAGTGGT
GCTGTTCGGGCACCAGGGCAAGGCCGAGATTACCCAGGCTGAGATCGA
AGACATCAACGGTGCACTGCTTGCGGATCTGTATACCGTGTGGGGCAA
TTCCAACCCTAAAATCCTGAAAGATCAGTAA(SEQ ID NO: 410).
A proteína codificada pelo gene da SEQ ID NO: 410 foi analisa-da através do programa de previsão de-peptídeo sinal Signal P 3.0(www.cbs.dtu.dk/services/SiQnalP/) e foi prevista uma seqüência líder de 23aminoácidos.
Mutaaênese I384M de BAR de P. taetrolens
A mutagênese foi realizada utilizando o QuickChange-MuIti site-Directed Mutagenesis Kit (Stratagene, La Jolla, CA), utilizando o gene BARde P. taetrolens em pET30 que resulta em uma proteína não marcada. Oiniciador mutagênico a seguir foi utilizado para produzir a alteração I384M:5'-TACCCAGGCTGAGATGGAAGACATCAACG-3' (SEQ ID NO: 411).
A mutagênese direcionada ao sítio foi realizada como descritono protocolo do fabricante. Vários isolados foram seqüenciados (Agencourt,Beverly, MA) e um isolado com a seqüência correta foi selecionado e utiliza-do para análises adicionais.
O plasmídeo foi transformado em células BL21(DE3) (Novagen,Madison, Wl). A proteína recombinante foi produzida em meio Overnight Ex-press Il (Novagen, Madison, Wl) contendo 50 pg/mL de canamicina de acor-do com os protocolos do fabricante. Os extratos isentos de células forampreparados utilizando BugBuster (Novagen, Madison, Wl) de acordo com osprotocolos do fabricante, dessalinizados e analisado em relação à porcenta-gem de expressão da proteína alvo utilizando o método Experion descritoanteriormente.
Os ensaios de proteína total foram realizados utilizando um kitPierce BCA (Pierce, Rockford, IL). Os ensaios de triptofano racemase com aenzima mutante foram realizados utilizando a enzima do tipo selvagem pre-parada da mesma maneira que um controle positivo. Os ensaios continhampor mL: 30 mM de L-triptofano, 50 mM de fosfato de potássio pH 8, 10 μΜde PLP e aproximadamente 100 pg de proteína racemase em um extratoisento de células. N0 caso em que 100 pg não foram utilizados (com base na% de expressão por Experion e números de proteína total da Pierce), os re-sultados foram normalizados. Foram coletadas amostras em zero, 30 minu-to, 2 horas e durante a noite amostras, tratadas com 2% de ácido fórmico,filtradas e diluídas 1:10 para análise utilizando o método de aminoácido qui-ral método descrito no Exemplo 1.
A enzima do tipo selvagem parecia produzir 49,1 ppm de D-triptofano em 30 minutos, enquanto que o mutante I384M produzia 108 ppm.
O ponto de tempo de 2 horas era similar - 229,4 ppm de D-triptofano foramproduzidas pela enzima do tipo selvagem versus 541,7 para o mutanteI384M. A mutação I384M parecia ter aproximadamente dobrado a atividadeda BAR de P. taetrolens. O ponto de tempo durante a noite para o mutantetambém é maior, mas à medida que as reações se aproximavam do equilí-brio a diferença entre as atividades era reduzida. Quando foram realizadosensaios para a produção de monatina como no Exemplo 28, a I384M nãoparecia fornecer qualquer benefício em relação à enzima de P. taetrolens dotipo selvagem.
Exemplo 30
Ensaio do Extrato de A. caviae
Aeromonas caviae ATCC 14486 foi cultivada em caldo nutricio-nal a 37°C. As células da cultura (200 mL) foram centrifugadas e lavadasuma vez com 0,85% de NaCI. Os péletes de células foram ressuspensos em5 mL/g de peso de células úmido de reagente BugBuster® (Novagen, Madi-son, Wl) contendo 5 pUmL do conjunto # 3 de coquetel de inibidor de prote-ase (Calbiochem-Novabiochem Corp., San Diego, CA) e 1 pUmL de benzo-nase nuclease. As amostras foram incubadas à temperatura ambiente du-rante 20 minutos em um agitador orbital. Os restos celulares insolúveis fo-ram removidos por centrifugação a 16.000 X g durante 20 minutos a 4°C. Oextrato isento de células foi dessalinizado em uma coluna PD-10 (GE Heal-thcare, Piscataway, NJ).
O extrato isento de células foi analisado em relação à atividadede triptofano racemase utilizando o protocolo a seguir. Reações de um mLforam realizadas em 50 mM de fosfato de potássio (pH 8,0), 0,05 mM dePLP e 30 mM de L triptofano. As reações foram iniciadas através da adiçãodé extratõ isento dé céTülãs (100 pL ou 500 pL) e foram incubadas a 30°Cdurante a noite. Alíquotas de amostras foram tiradas em 2 horas e após aincubação durante a noite (as amostras de zero minuto serviam como rea-ções de controle). O ácido fórmico concentrado (5 μL) foi adicionado em ca-da alíquota de amostra de 250 μL para interromper a reação e a proteínaprecipitada foi removida por centrifugação. Os sobrenadantes foram removi-dos e congelados a -80°C até serem analisados em relação ao D-triptofanoatravés do método de aminoácido quiral descrito no Exemplo 1.
Os resultados do ensaio partindo dos extratos de células de A.caviae demonstraram atividade de racemase sobre L-triptofano, como mos-trado na Tabela 47.
Tabela 47
<table>table see original document page 473</column></row><table>
Após observar a atividade nos extratos de células de A. caviae,foram planejados iniciadores degenerados (com base nas regiões conserva-das de homólogos de BAR conhecidos) para a obtenção do gene BAR destaespécie. As seqüências dos iniciadores degenerados são mostradas abaixo:
Aer deg F2: 5'-GCCAGCAACGARGARGCMCGCGT-3' (SEQ ID NO: 412); e
Aer deg R1: 5'-TGGCCSTKGATCAGCACA-3' (SEQ ID NO: 413)em que K indica G ou T, R indica A ou G, S indica C ou G e M de indica A ou C.
Os iniciadores anteriores foram utilizados para amplificar atravésda PCR um fragmento de DNA de 715 pb partindo do DNA genômico de A.caviae (ATCC 14486). Foi utilizado o protocolo da PCR a seguir: Uma rea-ção de 50 μί continha 0,5 pL de molde (-100 ng de DNA genômico de A.caviae), 1,6 μΜ de cada iniciador, 0,3 mM de cada dNTP, 10 U de rTth Poly-merase XL (Applied Biosystems, Foster City, CA), 1X tampão XL1 1 mM deMg(OAc)2 e 2,5 μι. de dimetil sulfóxido. O programa do termociclador utiliza-do incluía um início a quente a 94°C durante 3 minutos e 30 repetições dasetapas a seguir: 94°C durante 30 segundos, 53°C durante 30 segundos e68°C durante 2 minutos. Após as 30 repetições, a amostra foi mantida a68°C durante 7 minutos e então armazenada a 4°C. Este protocolo da PCRobteve um produto de 715 pb.
Clonagem
O produto da PCR foi purificado em gel partindo de gel de TAE-agarose a 0,8% utilizando o Qiagen gel extraction kit (Qiagen, Valencia, CA).
O produto foi clonado em TOPO e transformado em células TOP 10 de a-cordo com o protocolo do fabricante (Invitrogen, Carlsbad, CA). O DNAplasmideal foi purificado partindo dos transformantes resultantes utilizando oQiagen spin miniprep kit (Qiagen, Valencia, CA) e verificado em relação aosinsertos corretos através da digestão de restrição com EcoR I. As seqüên-cias dos plasmídeos que pareciam ter o inserto correto foram verificadasatravés do seqüenciamento de DNA com terminação de cadeia didesóxi comos iniciadores M13 universais para frente.
A seqüência de DNA do produto da PCR de A. caviae é mostra-da abaixo como a SEQ ID NO: 414, com as regiões das seqüências dos ini-ciadores degenerados sublinhadas:
GCCAGCAACGARGARGCMCGCGTTGCCCGCGAGAAGGGCTTCGAAGGTCGCCTGATGCGGGTACGTGCCGCCACCCCGGATGAAGTGGAGCAGGCCCTGCCCTACAAGCTGGAGGAGCTCATCGGCAGCCTGGAGAGCGCCAAGGGGATCGCCGACATCGCCCAGCGCCATCACACCAACATCCCGGTGCACATCGGCCTGAACTCCGCCGGCATGAGCCGCAACGGCATCGATCTGCGCCAGGACGATGCCAAGGCCGATGCCCTGGCCATGCTCAAGCTCAAGGGGATCACCCCGGTCGGCATCATGACCCACTTCCCGGTGGAGGAGAAAGAGGACGTCAAGCTGGGGCTGGCCCAGTTCAAGCTGGACTACCAGTGGCTCATCGACGCCGGCAAGCTGGATCGCAGCAAGCTCACCATCCACGCCGCCAACTCCTTCGCCACCCTGGAAGTACCGGAAGCCTACTTTGACATGGTGCGCCCGGGCGGCATCATCTATGGCGACACCATTCCCTCCTACACCGAGTACAAGAAGGTGATGGCGTTCAAGACCCAGGTCGCCTCCGTCAACCACTACCCGGCGGGCAACACCGTCGGCTATGACCGCACCTTCACCCTCAAGCGCGACTCCCTGCTGGCCAACCTGCCGATGGGCTACTCCGACGGCTACCGCCGCGCCATGAGCAACAAGGCCTATGTGCTGATCMASGGCCA(SEQ ID NO: 414), em que R indica A ou G, S indica C ou G e M de indica A ou C.
A seqüência de aminoácidos da enzima BAR parcial de A. cavi-ae é mostrada como a SEQ ID NO: 415 abaixo.
ASNEEARVAREKGFEGRLMRVRAATPDEVEQALPYKLEELIGSLESAKGIADIAQRHHTNIPVHIGLNSAGMSRNGIDLRQDDAKADALAMLKLKGITPVGIMTHFPVEEKEDVKLGLAQFKLDYQWLIDAGKLDRSKLTIHAANSFATLEVPEAYFDMVRPGGIIYGDTIPSYTEYKKVMAFKTQVASVNHYPAGNTVGYDRTFTLKRDSLLANLPMGYSDGYRRAMSNKAYVLIXGem que X é H, Q, N ou K (SEQ ID NO: 415).
O fragmento da seqüência de proteína consenso da SEQ ID NO:415 acima é 89% homólogo no nível de aminoácidos à seqüência TIGR pu-blicada para A. hydrophila. Era esperado que devido ao fato de que a proteí-na altamente relacionada de Aeromonas hydrophila exibir atividade de ra-cemase de especificidade ampla, assim como os extratos celulares de A.caviae, a região codificadora de comprimento completo para A. caviae, umavez obtida, produziria uma racemase que também teria uma especificidadeampla com atividade sobre o triptofano. Os métodos de Genome Walker fo-ram utilizados para a obtenção da seqüência gênica de comprimento com-pleto do gene BAR de A. caviae mostrada abaixo como a SEQ ID NO: 416.atgcacaaga aaacactgct cgcgaccctg atctttggcc tgctggccgg ccaggcagtcgccgccccct atctgccgct cgccgacgac caccgcaacg gtcaggaaca gaccgccgcc a-acgcctggc tggaagtgga tctcggcgcc ttcgagcaca acatccagac cctgaagaatcgcctcggtg acaagggccc gcagatctgc gccatcatga aggcggacgc ctacggtcac gg-catcgacc tgctggtccc ttccgtggtc aaggcaggca tcccctgcat cggcatcgcc agcaacga-ag aagcacgtgt tgcccgcgag aagggcttcg aaggtcgcct gatgcgggta cgtgccgccaccccggatga agtggagcag gccctgccct acaagctgga ggagctcatc ggcagcctgg a-gagcgccaa ggggatcgcc gacatcgccc àgcgccatca caccaacatc ccggtgcacatcggcctgaa ctccgccggc atgagccgca acggcatcga tctgcgccag gacgatgccaaggccgatgc cctggccatg ctcaagctca aggggatcac cccggtcggc atcatgacccacttcccggt ggaggagaaa gaggacgtca agctggggct ggcccagttc aagctggact ac-cagtggct catcgacgcc ggcaagctgg atcgcagcaa gctcaccatc cacgccgccaactccttcgc caccctggaa gtaccggaag cctactttga catggtgcgc ccgggcggca tcatc-tatgg cgacaccatt ccctcctaca ccgagtacaa gaaggtgatg gcgttcaaga cccaggtcgcctccgtcaac cactacccgg cgggcaacac cgtcggctat gaccgcacct tcaccctcaa gcgc-gactcc ctgctggcca acctgccgat gggctactcc gacggctacc gccgcgccat gagcaaca-ag gcctatgtgc tgatccatgg ccagaaggcc cccgtcgtgg gcaagacttc catgaacacc ac-catggtgg acgtcaccga catcaagggg atcaaacccg gtgacgaggt ggtcctgttc ggacgc-cagg gtgatgccga ggtgaaacaa tctgatctgg aggagtacaa cggtgccctc ttggcggacatgtacaccgt ctggggctat accaacccca agaagatcaa gcgctaa(SEQ ID NO: 416).
A seqüência de aminoácidos correspondente para a BAR nativade A. caviae é mostrada abaixo como a SEQ ID NO: 417:
1 mhkktllatl ifgllagqav aapylpladd hrngqeqtaa41 nawlevdlga fehniqtlkn rlgdkgpqic aimkadaygh81 gidllvpsvv kagipcigia sneearvare kgfegrlmrv121 raatpdeveq alpykleeli gslesakgia diaqrhhtni161 pvhiglnsag msmgidlrq ddakadalam Iklkgitpvg201 imthfpveek edvklglaqf kldyqwlida gkldrsklti241 haansfatle vpeayfdmvr pggiiygdti psyteykkvm281 afktqvasvn hypagntvgy drtftlkrds Ilanlpmgys321 dgyrramsnk ayvlihgqka pwgktsmnt tmvdvtdikg361 ikpgdewlf grqgdaevkq sdleeyngal Iadmytvwgy401 tnpkkikr(SEQ ID NO: 417).
Os primeiros 21 resíduos de aminoácidos N-terminais da SEQ IDNO: 417 são previstos como sendo um peptídeo sinal utilizando o programaSignal P 3.0 (www.cbs.dtu.dk/services/SiqnalP/). Evidências experimentaisconfirmaram que o produto de expressão era secretado no periplasma de E.coli e o peptídeo sinal era clivado comò previsto. Foi observado que o genede comprimento completo, quando clonado e expresso utilizando os méto-dos descritos anteriormente, tinha atividade comparável a, mas maior que àda BAR de P. taetrolens.
Exemplo 31
Produção da aldolase da SEQ ID NO: 276 em um hospedeiro de expressãoalternativo
O gene da SEQ ID NO: 275 foi subclonado utilizando procedi-mentos de biologia molecular padronizados em um derivado do vetorpET23d (Novagen, Madison, Wl) contendo o gene metE de E. coli e o pro-motor inseridos no sítio de restrição de NgoMW/ e um segundo sítio de restri-ção de psil que foi adicionado para a remoção fácil do gene da beta Iacta-mase (bla). A constructo deste vetor contendo um inserto para um gene demyo-inositol oxigenase é descrita no PCT W02006066072 nos Exemplos 2 e20. O inserto de aldolase foi confirmado através do seqüenciamento de DNA(Agencourt Bioscience Corporation; Beverly, MA) e o plasmídeo com a se-qüência de inserto correta foi transformado no hospedeiro de expressão deE. coli BW30384(DE3)AompTAmetE. A constructo deste hospedeiro de ex-pressão e o protocolo de transformação também são descritos no PCTW02006066072 (Exemplos 21 e 22). O gene da aldolase foi expresso utili-zando o Novagen Overnight Express® Autoinduction System Il (Novagen,Madison, Wl) contendo 100 mg/L de ampicilina. Este sistema foi descrito noExemplo 24 para a expressão de D-alanina aminotransferase de Bacillussphaericus (ATCC cepa 10208). Os extratos isentos de células contendo aaldolase foram produzidos utilizando o Novagen BugBuster® Extraction Rea-gent (isento de amina primária) (Novagen, Madison, Wl) contendo 1 pL/mLde benzonase nuclease, 0,033 de pL/mL r-Lysozyme e 5 pL/mL de ProteaseInhibitor Cocktail Set II seguindo o protocolo recomendado pelo fabricantepara a lise das células. As proteínas solúveis nos extratos isentos de célulasforam separadas em uma Bio-Rad Laboratories Experion® Automated Elec-trophoresis Station (Bio-Rad, Hercules, CA) e analisadas em relação à por-centagem de expressão de proteína solúvel utilizando o Experion Softwareversão 1.1.98.0 como descrito no Exemplo 12.Para tentar aumentar a expressão da aldolase em E. coli, os có-dons dois até sete da seqüência codificadora de DNA foram mutados nasalterações sugeridas partindo^da análise da seqüência do tipo selvagem uti-lizando o algoritmo Roche ProteoExpert RTS E. coli HY. As alterações foramfeitas utilizando um QuikChange® Multi Site-Directed Mutagenesis Kit ou umQuikChange® Il XL Site-Directed Mutagenesis Kit (Stratagene, La Jolla1 CA)seguindo o protocolo sugerido pelo fabricante com 0,75 μί de Quik Solutionpor 25 pL de mistura de reação e a transformação em células XL10-Gold®ultracompetentes. As mutações foram geradas utilizando os iniciadores (ca-da um com 45 nucleotídeos de comprimento) planejados com o Stratagene1Sweb-based QuikChange® Primer Design Program diponível online em www.stratagene.com.qciniciadordesign.
Tabela 48
<table>table see original document page 478</column></row><table>
As seqüências gênicas da aldolase com as alterações de códonsacima foram transformadas no hospedeiro de expressão de E. coliBW30384(DE3)AompTAmetE e então expressas utilizando o Novagen O-vernight Express® Autoinduction System II (Novagen, Madison1 Wl). Nenhu-ma destas mutações resultou em níveis mais altos de expressão gênicaquando comparadas com a seqüência do tipo selvagem. Os resultados típi-cos partindo dos extratos isentos de células analisados pelo Bio-Rad Experi-on Pro260 software 1.1.98.0 são mostrados na Tabela 49 abaixo, em que acoluna intitulada Expressão de Proteína mostra os valores para a % de pro-teína solúvel total.
Os extratos isentos de células (0,025 mg/mL de proteína solúvelporensaio) foram analisados em relação a sua capacidade de produzir R1R-monatina partindo de 200 mM de piruvato de sódio e 100 mM de D-triptofanoutilizando o protocolo descrito no Exemplo 7. As reações (volume total de 7mL) foram realizadas em tubos de polipropileno de 14 mL em uma câmaraanaeróbica com luvas utilizando a D-aminotransferase purificada de B. s-phaericus (ATCC 10208) na concentração final de 2 mg/mL. As concentra-ções de monatina produzida em 1, 4 e 20 h após a adição das enzimas sãomostradas na Tabela 49 abaixo. A Tabela 49 mostra que o extrato isento decélulas gerado partindo do constructo contendo a seqüência de aldolase dotipo selvagem produzia uma concentração ligeiramente maior de monatinaem 20 horas que a dos extratos isentos de células partindo dos constructosque carregavam mutações ProteoExpert. As concentrações de monatinaforam determinadas através do método de LC/MS/MS descrito no Exemplo 1.
Tabela 49
<table>table see original document page 479</column></row><table>
Estes dados demonstram que a aldolase da SEQ ID NO: 276pode ser produzida em um hospedeiro de expressão alternativo sem a indu-ção por IPTG.
O gene bla foi removido do vetor e fermentações subseqüentespara produzir aldolase foram realizadas sem o uso de antibiótico como des-crito no PCT W02006066072 para uma outra enzima. Os níveis de expres-são em fermentações alimentadas em batelada a 30°C atingiram um máximoem 6^8 hórãs após a indução, produzindo a aldolase da SEQ ID NO: 276 em25-30% da proteína solúvel, de acordo com os dados de Experion. Estudosde estabilidade não mostraram perda evidente de atividade de aldolasequando o produto da fermentação era deixado durante 6 horas a 15 ou 30°C(sob condições Iimitantes de oxigênio assim como condições aeradas) antesda concentração e do rompimento das células. Foi observado que a aldolaseera igualmente estável armazenada na forma de um extrato isento de célulasou na forma de um pélete de células quando armazenada durante 5 dias a -80°C. A lavagem do pélete de células em tampão antes do armazenamentoa -80°C não era necessária e causava na verdade uma ligeira diminuição naatividade. Foi observado que as células ressuspensas em água destilada, nosobrenadante de fermentação ou em 100 mM de tampão de fosfato de po-tássio (pH 7,8) não tinham perda na atividade ou na concentração de proteí-na (julgada por SDS-PAGE) quando armazenadas durante 11 dias à tempe-ratura ambiente ou a 4°G. O extrato isento de células produzido em tampãode fosfato de potássio não exibia perda de atividade de aldolase quando ar-mazenado a 4°C ou à temperatura ambiente durante 5 dias. As células po-dem ser rompidas em tampão de fosfato, até 25% de sobrenadante de cultu-ra ou água com recuperação comparável de atividade de aldolase; entretan-to, foi observado que a adição de 1 mM de MgCI2 em água aumentava Iigei-ramente a atividade de aldolase. Estes dados mostram que a proteína aldo-lase é suficientemente estável para ser útil comercialmente.
Foi descrito um número de modalidades da invenção. As moda-lidades da invenção incluem um ou mais dos aspectos descritos anterior-mente. Será entendido que várias modificações podem ser feitas sem sair doespírito e do âmbito de acordo com a invenção. Conseqüentemente, outrasmodalidades estão dentro do âmbito das reivindicações a seguir.LISTAGEM DE SEQÜÊNCIA
<110> Burke, Ellen
Hicks, Paula M.Luginbuhl, PeterRichardson, Toby
Weiner, DavidZhao, Lishan
I <120> Aldolases, ácidos nucléicos codificando estes e métodos para produção e usodestes<130> D1710-6WC)
<140> PCT/US07/63 515<141> 2007-03-07<150> 60/780,515<151> 2006-03-07
<160> 417
<170> PatentIn 3.1<210> 1<211> 699<212> DNA
<220>
<223> DNA bacteriano<400> 1
atgcagccgc tgaaggaatt cgccgagctc tccaccccgc tgatcgccga cgcctgcgtg 60
cggctcgggg aacccctgcg cgtcgcgccc gccggcatcc tgcccgtcgt cgcgggccgg 120
cgcgtcgccg gccgggccct gcccgtacgg cactacggca gcgtcgacgt cttcctggag 180
gcgttcggcg aggccgagcc cggtgacgtc ctcgtcatcg acaacgcggg ccgcgtcgac 240
gaggcctgca tcggcgacct cgccgtcctg gaggcggcgg cggccggcat cgccggggtc 300
gtcgtgtggg gcctgcaccg ggacaccccc gacctcgtcg agatcgggct gcccgtcttc 360
tcctacggac gccacgcgcc cggccccgtg cgcgtcgacc cccgggaccc ggacgcgctg 420
acgaccgcgc ggttcggcga gcacgaggtg accgccgccg acgtcgtgtt cggcgacgac 480
gacggcgtgg tcttcgtcgc cgccgcccgg gccggcgccg tcctggaggc ggcccgggcc 540ctgttccgta cggagcgcga gcaggcgcgg cggatcaggg cgggggagac gctgcgcgcc 600cagacccggt_ tcgacgçgta cctggcgggc cgggccgagg acccçtcgta caccttccgg 660cagcacctgc gccggatcgg cggcgcgatc gaggagtga 699
<210> 2<211> 232
<212> PRT
<213> desconhecido<220>
<223> Proteína Bacteriana<220>
<221> DOMÍNIO<222> (8)...(165)
<223> Demetilmenaguinone metiltransferase<400> 2
Met Gln Pro Leu Lys Glu Phe Ala Glu Leu Ser Thr Pro Leu Ile Ala1 5 10 15
Asp Ala Cys Val Arg Leu Gly Glu Pro Leu Arg Val Ala Pro Ala Gly
20 25 30
Ile Leu Pro Val Val Ala Gly Arg Arg Val Ala Gly Arg Ala Leu Pro35 40 45
Val Arg His Tyr Gly Ser Val Asp Val Phe Leu Glu Ala Phe Gly Glu
50 55 60
Ala Glu Pro Gly Asp Val Leu Val Ile Asp Asn Ala Gly Arg Val Asp65 70 75 80
Glu Ala Cys Ile Gly Asp Leu Ala Val Leu Glu Ala Ala Ala Ala Gly
85 90 95
Ile Ala Gly Val Val Val Trp Gly Leu His Arg Asp Thr Pro Asp Leu
100 105 110
Val Glu Ile Gly Leu Pro Val Phe Ser Tyr Gly Arg His Ala Pro Gly
115 120 125
Pro Val Arg Val Asp Pro Arg Asp Pro Asp Ala Leu Thr Thr Ala Arg130 135 140Phe Gly Glu His Glu Val Thr Ala Ala Asp Val Val Phe Gly Asp Asp
Asp Gly Val Val Phe Val Ala Ala Ala Arg Ala Gly Ala Val Leu Glu
Arg Ala Gly Glu Thr Leu Arg Ala Gln Thr Arg Phe Asp Ala Tyr Leu
Ala Gly Arg Ala Glu Asp Pro Ser Tyr Thr Phe Arg Gln His Leu Arg
Arg Ile Gly Gly Ala Ile Glu Glu
<210> 3<211> 693
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 3
gtgaccggcc acgtcatcgt ccgcgagatc gaccgcgccg acgcgaacgc cctcgacggc 60
ctcgccgcgc tcggcgtctc gacggtgcac gaggccgacg gccgccgcgg cgcgctcgcc 120
accgccattc gaccgatcca cagtggattc acgatcgccg gttcggcggt gacggtctcc 180
tcccagccgg gcgacaacgt catgatccac gccgccattg aggtgtgccg gcccggcgac 240
atcctcgtgg tcaccaccac ctcgccgtcc accgacggga tgatcggcga actgctggcg 300
acgtcgctgc gcgcgcacgg ggtgcggggt gtcgtcaccg atgccggcgt acgcgacgtc 360
gcccagctcc gggcgatgaa cttcccggtg tggacgcgcg ccatcagtcc' acaggggacg 420
gtcaaggcga gcccgggctc ggtgaacata ccggtcgtct gcgccggcca ggtcgtccac 480
cccggcgatg ccatcgtcgc cgacgacgac ggcgttgtcg tcgtcccgcg cgaccgggtg 540
ccggcggtgc tggcggccgg ccgggcgcgg gccgagagcg aggacgacaa acgcgtccgg 600
ctcgccggtg gcgaactctc ggtcgacatg tacgggctgc gcgagctgct cacccgactc 660
ggagtggagt acgtcgaccg gcggccggcg tga 693<210> 4 -<211> 230<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (28) ... (174)
<223> Demetilmenaquinone metiltransferase<400> 4
Met Thr Gly His Val Ile Val Arg Glu Ile Asp Arg Ala Asp Ala Asn1 5 10 15
Ala Leu Asp Gly Leu Ala Ala Leu Gly Val Ser Thr Val His Glu Ala
20 25 30
Asp Gly Arg Arg Gly Ala Leu Ala Thr Ala Ile Arg Pro Ile His Ser
35 40 45
Gly Phe Thr Ile Ala Gly Ser Ala Val Thr Val Ser Ser Gln Pro Gly
50 55 60
Asp Asn Val Met Ile His Ala Ala Ile Glu Val Cys Arg Pro Gly Asp65 70 75 80
Ile Leu Val Val Thr Thr Thr Ser Pro Ser Thr Asp Gly Met Ile Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Val Val
100 105 110
Thr Asp Ala Gly Val Arg Asp Val Ala Gln Leu Arg Ala Met Asn Phe
115 120 125
Pro Val Trp Thr Arg Ala Ile Ser Pro Gln Gly Thr Val Lys Ala Ser
130 135 140
Pro Gly Ser Val Asn Ile Pro Val Val Cys Ala Gly Gln Val Val His145 150 155 160
Pro Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Pro165 170 175Arg Asp Arg Val Pro Ala Val Leu Ala Ala Gly Arg Ala Arg Ala Glu
180 185 190
Ser Glu Asp Asp Lys Arg Val Arg Leu Ala Gly Gly Glu Leu Ser Val195 200 205
Asp Met Tyr Gly Leu Arg Glu Leu Leu Thr Arg Leu Gly Val Glu Tyr210 215 220
Val Asp Arg Arg Pro Ala225 230
<210> 5
<211> 762
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<400> 5
atggcgttga ataccggttc cgacattatt cgcccgtcca aggagctcgt tgccgggctc 60
aaagctcttg gcagtgcgac catcgcgggc acgctcggcc acatggggtt caagaacccg 120
cacatgacgg gcatcctgcc acagacggcg ggcaaggtca tggccggccc ggcgctgacg 180
ctgcagtgca tgccgcagcg accggacctg ttcagcgaag gcgaatacgc cgatcctgaa 240
acgcagctcc accgccatgt gctctatcac gtgcaggagg gcgacgtggt cgtcgtcgat 300
gcgcgcggcg atatgaagtc gggcatcttc ggcgacatga tgtcgaccta cttcaagggc 360
cgcggcggcg ccggcatcgt catcgacggc tgcatgcgcg atcgtcccaa tgtcgaaaag 420
ctcgacctgt cgctctggct caagggctgg acgccgaact accacgtcca gaccgacatc 480
tttccctacg cggtgaacgt tccagtcgca tgtggcggcg ttcttgtgct ccccggcgac 540
atcatcgttg ccgatgacga cggcgctgtc gtcgtgccgg tgaagatggc gcagcacatc 600
gtcgaggacg gcaagaagca cgccgagtgg gaagtgttct cgcgcgagaa gctgatggcc 660
ggcgagtcgc tccgccgtta ctacccgctg caccccgatg ccgaggacga ataccaggcc 720
tggcggaagg cgaaggggct gccgccgtcg ccctcgcgct aa 762<210> 6<211> 253
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (21)...(191)
<223> Demetilmenaguinone metiltransferase<400> 6
Met Ala Leu Asn Thr Gly Ser Asp Ile Ile Arg Pro Ser Lys Glu Leu1 5 10 15
Val Ala Gly Leu Lys Ala Leu Gly Ser Ala Thr Ile Ala Gly Thr Leu
20 25 30
Gly His Met Gly Phe Lys Asn Pro His Met Thr Gly Ile Leu Pro Gln
35 40 45
Thr Ala Gly Lys Val Met Ala Gly Pro Ala Leu Thr Leu Gln Cys Met
50 55 60
Pro Gln Arg Pro Asp Leu Phe Ser Glu Gly Glu Tyr Ala Asp Pro Glu65 70 75 80
Thr Gln Leu His Arg His Val Leu Tyr His Val Gln Glu Gly Asp Val
85 90 95
Val Val Val Asp Ala Arg Gly Asp Met Lys Ser Gly Ile Phe Gly Asp
100 105 110
Met Met Ser Thr Tyr Phe Lys Gly Arg Gly Gly Ala Gly Ile Val Ile
115 120 125
Asp Gly Cys Met Arg Asp Arg Pro Asn Val Glu Lys Leu Asp Leu Ser
130 135 140
Leu Trp Leu Lys Gly Trp Thr Pro Asn Tyr His Val Gln Thr Asp Ile145 150 155 160
Phe Pro Tyr Ala Val Asn Val Pro Val Ala Cys Gly Gly Val Leu Val
165 170 175
Leu Pro Gly Asp Ile Ile Val Ala Asp Asp Asp Gly Ala Val Val Val
180 185 190
Pro Val Lys Met Ala Gln His Ile Val Glu Asp Gly Lys Lys His Ala195 200 205
Glu Trp Glu Val Phe Ser Arg Glu Lys Leu Met Ala Gly Glu Ser Leu
210 215 220
Arg Arg Tyr Tyr Pro Leu His Pro Asp Ala Glu Asp Glu Tyr Gln Ala225 230 235 240
Trp Arg Lys Ala Lys Gly Leu Pro Pro Ser Pro Ser Arg245 250
<210> 7<211> 672<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 7
atgagtgtag tggtgcaaaa tatcgagcgg gcagatcagg caattatcaa ggcgcttgct 60gaatgcggtg tagcaactgt gcatgaggcc caaggccgca cggggttgct ggcttcttat 120atgcggccaa tttatagcgg tgcttgcatt ggtgcatcag cggtaaccat tctggctccg 180ccttgcgata actggatggt ccatgtggcc attgagcaga taaagccggg tgatgctctg 240gttatggcaa caacatcgtc atctgatgcc ggatattttg gtgacctgct ggcgacctcg 300atgcaggcgc gtggcggggt tggcatgatt atcgatgccg gggtgcgcga tattaaagac 3 60ctgaccgaga tgaaatgtcc tgtctggtca aaagcgatct gcgctgaagg gacggtgaaa 420gaaacacttg gctctgtaaa tattccggtg gtttgcgccg gccagttggt caaccccggc 480gatattgtca tcgctgatga tgatggggtc tgtgtcgttg agcgcgaaag ggctggcgaa 540gttctggaaa aagcgcaagc ccgcatggct ttggaagaag acaaacgtaa acgtttggcc 600tccggtgaac ttgggctgga tatgtataat atgcgcgagc gtctggctga aaaaggtctc 660aaatatgttt aa 672
<210> 8<211> 223<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 8
Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Gln Ala Ile Ile1 5 10 15
Lys Ala Leu Ala Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
Cys Ile Gly Ala Ser Ala Val Thr Ile Leu Ala Pro Pro Cys Asp Asn
50 55 60
Trp Met Val His Val Ala Ile Glu Gln Ile Lys Pro Gly Asp Ala Leu65 70 75 80
Val Met Ala Thr Thr Ser Ser Ser Asp Ala Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Met Gln Ala Arg Gly Gly Val Gly Met Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Ile Lys Asp Leu Thr Glu Met Lys Cys Pro Val
115 120 125
Trp Ser Lys Ala Ile Cys Ala Glu Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Ile Pro Val Val Cys Ala Gly Gln Leu Val Asn Pro Gly145 150 155 160
Asp Ile Val Ile Ala Asp Asp Asp Gly Val Cys Val Val Glu Arg Glu
165 170 175
Arg Ala Gly Glu Val Leu Glu Lys Ala Gln Ala Arg Met Ala Leu Glu
180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp Met
195 200 205
Tyr Asn Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val210 215 220
<210> 9<211> 552<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 9
atgaacggga ccgtcgtgcg caacatccat cgcgccgagg cgggggccat cgcggcgctc 60
gggcgcatcg gcgtctcgac cgtccacgag gcgcaggggc gcaccgggct catgcaggcc 120tacatgcggc ccgtatggcg gggcgcgcgc atcgccggca gcgccgtgac cgtcctgtgc 180catcccaacg acaactggat gatccacgtc gcgatggagg tggcaaggcc cggcgacgtg 240ctcgtggtgg cttgctcgag cgagaacacg aacggcgcga tcggcgacct gatcgccacc 300tcgctcatgg cgcgcggcgt gaaaggcgcg atcctcgaca tgggctgccg cgacgtgctg 360gagctcgagc agatgaggtt tccgctctgg tcgcgggcca tctcggcgca gggaaccatc 420aagggcacgc tcggctcggt caacttcccg gtcacctgcg ccggcgccca cgtcaggccg 480ggcgacatcg tggtcgcgga cgacgacggc gtggtggtcg tgccccgcca ggacgcggcg 540aaagtgatcc aa 552
<210> 10<211> 184
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (21)... (173)
<223> Demetilmenaquinone metiltransferase<220><221> SITE
<222> (2) ... (5)
<223> N-glycosylation site. Prosite id = PS00001<400> 10
Met Asn Gly Thr Val Val Arg Asn Ile His Arg Ala Glu Ala Gly Ala1 5 10 15
Ile Ala Ala Leu Gly Arg Ile Gly Val Ser Thr Val His Glu Ala Gln
20 25 30
Gly Arg Thr Gly Leu Met Gln Ala Tyr Met Arg Pro Val Trp Arg Gly
35 40 45
Ala Arg Ile Ala Gly Ser Ala Val Thr Val Leu Cys His Pro Asn Asp
50 55 60
Asn Trp Met Ile His Val Ala Met Glu Val Ala Arg Pro Gly Asp Val65 70 75 80
Leu Val Val Ala Cys Ser Ser Glu Asn Thr Asn Gly Ala Ile Gly Asp
85 90 95
Leu Ile Ala Thr Ser Leu Met Ala Arg Gly Val Lys Gly Ala Ile Leu
100 105 110
Asp Met Gly Cys Arg Asp Val Leu Glu Leu Glu Gln Met Arg Phe Pro
115 120 125
Leu Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Ile Lys Gly Thr Leu
130 135 140
Gly Ser Val Asn Phe Pro Val Thr Cys Ala Gly Ala His Val Arg Pro145 150 155 160
Gly Asp Ile Val Val Ala Asp Asp Asp Gly Val Val Val Val Pro Arg
165 170 175
Gln Asp Ala Ala Lys Val Ile Gln180
<210> 11
<211> 645
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 11atggatccag gggtcatcag gcgtctgggg gagctgggcg ttgcgaccgt tcacgaggcg 60
ctcggccgcc agggccttct cgatcccgtc gtgcgcccga tctaccccgg cgcgcgggcg 120
gccggaaccg ccgtaacggt gtgctgtccg gccggggaca acctgatgat ccatgcggcg 180
ctccaggtcg tggcgcgcgg cgacgtgctc gtcgtcacga ccgagccgcc gtcgacgtac 240
ggcatgttcg gcgacgtgct ggggacgtcg tgccaggcgc tcggggtcgc ggggctcgtc 300
atcgacgccg gcatccgtga cacggaggag ctcgagcgga tggcgtttcc cgcctgggcg 3 60
cgcgcgacgt cggcgcaggg cacggtgaaa gtggctccgg gcatcgtcaa cgcgccgatt 420
gtgtgcgcgg gcgcggacgt tcgtccgggc gacgttgtcg tggcggatcg cgacggcgtc 480
gtcatcgtcc cgcgcgagcg ggctgccgaa gcggcggagc ttggtgagca gcggcgcgat 540
cgcgagatcg aataccgccg gcggctggca ggtggagagc tgaccctgga cgtgctcgac '600
ctccggcgca ccctgcggga gatcgggatg gacaggctgg actga 645<210> 12<211> 214<212> PRT
Ala Arg Gly Asp Val Leu Val Val Thr Thr Glu Pro Pro Ser Thr Tyr
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (10)... (162)
<223> Demetilmenaquinone metiltransferase<400> 12
Met Asp Pro Gly Val Ile Arg Arg Leu Gly Glu Leu Gly Val Ala Thr1 5 10 15
Val His Glu Ala Leu Gly Arg Gln Gly Leu Leu Asp Pro Val Val Arg20 25 30
Pro Ile Tyr Pro Gly Ala Arg Ala Ala Gly Thr Ala Val Thr Val Cys
35 40 45
Cys Pro Ala Gly Asp Asn Leu Met Ile His Ala Ala Leu Gln Val ValGly Met Phe Gly Asp Val Leu Gly Thr Ser Cys Gln Ala Leu Gly Val
85 90 95
Ala Gly Leu Val Ile Asp Ala Gly Ile Arg Asp Thr Glu Glu Leu Glu100 105 110
Arg Met Ala Phe Pro Ala Trp Ala Arg Ala Thr Ser Ala Gln Gly Thr115 120 125
Val Lys Val Ala Pro Gly Ile Val Asn Ala Pro Ile Val Cys Ala Gly
130 135 140
Ala Asp Val Arg Pro Gly Asp Val Val Val Ala Asp Arg Asp Gly Val145 150 155 160
Val Ile Val Pro Arg Glu Arg Ala Ala Glu Ala Ala Glu Leu Gly Glu
165 170 175
Gln Arg Arg Asp Arg Glu Ile Glu Tyr Arg Arg Arg Leu Ala Gly Gly180 185 190
Glu Leu Thr Leu Asp Val Leu Asp Leu Arg Arg Thr Leu Arg Glu Ile195 200 205
Gly Met Asp Arg Leu Asp210<210> 13
<211> 498
<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<400> 13
atggcgaccg gggagtacga cgcatgggcc ggctcctggt actcgaagct ctcgccggag 60
ccgttcatgg atctcattcg tcccggcact gccctggtga tcgacgatgc gcccgcagcg 120
gatgtcggct ccatcgggtc gaacaacatc ctccaatgga agacgcgtgg gatggtggcg 180
gtcgtgacga acgcgacggc gcgggacacc gacgaaatcg ttgtcgagcg cgtgccgctc 240
tatttccggc agcctggccg cggcatccgt ccgggccgca atgagatcga atcggtcaac 300
cgtcccgtgg tcgtgggcgg ggtgctcgtg atgcccggcg acgtcatcgt cggagacggc 3 60
gacggcgtgg ttgtcgtccc acgcgcgcag gccgaggccg tggcgcgata tgctcacacg 420atcctcgaga aggacacgga aggacgtcgg cggctctacc agcagctgaa gcttccaacc
gattcgacgg tccggtag
<210> 14
<211> 165
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 14
Met Ala Thr Gly Glu Tyr Asp Ala Trp Ala Gly Ser Trp Tyr Ser Lys1 5 10 15
Leu Ser Pro Glu Pro Phe Met Asp Leu Ile Arg Pro Gly Thr Ala Leu
20 25 30
Val Ile Asp Asp Ala Pro Ala Ala Asp Val Gly Ser Ile Gly Ser Asn
35 40 45
Asn Ile Leu Gln Trp Lys Thr Arg Gly Met Val Ala Val Val Thr Asn
50 55 60
Ala Thr Ala Arg Asp Thr Asp Glu Ile Val Val Glu Arg Val Pro Leu65 70 75 80
Tyr Phe Arg Gln Pro Gly Arg Gly Ile Arg Pro Gly Arg Asn Glu Ile
85 90 95
Glu Ser Val Asn Arg Pro Val Val Val Gly Gly Val Leu Val Met Pro
100 105 110
Gly Asp Val Ile Val Gly Asp Gly Asp Gly Val Val Val Val Pro Arg
115 120 125
Ala Gln Ala Glu Ala Val Ala Arg Tyr Ala His Thr Ile Leu Glu Lys
130 135 140
Asp Thr Glu Gly Arg Arg Arg Leu Tyr Gln Gln Leu Lys Leu Pro Thr145 150 155 160
Asp Ser Thr Val Arg165
<210> 15<211> 723
<212> DNA
<213> desconhecido
<220>
<400> 15
atgacaacaa gcactaaaaa tatgcaggta agtcagaaag ttattgacga tcttcgtcgc 60
gtgtcaacag caactctgca cactgcgctg ttcaaaagag gtttacgcaa cacctacatc 120
cagggtgtca gcctcatcaa caaccaaaaa ctgaagatgg tcggccaggc gttcaccctg 180
cgctacatcc cggctcgtga agacgttgac accgttgcgg cattcaaaag ccctgagcac 240
cctcagcgcc tggccgttga atccgtcccg gaaggcatgg tgctggtttc agactgtcgt 300
caggacgcaa cagctgcttc tgccgggagc atccttctta ctcgattgga agttcgcaag 3 60
tgtgcgggtt ttgtttccga tgcgggcatc agagatttca acgatgcatc tgaaatgaac 420
atgccgattt tttgcgccaa gccaagcgct ccaaccaacc tgaccaagca ccacgccgta 480
gacatacaag taccgatcgg ctgcggcggt gtgatggtta atccaggcga tgtgttagtc 540
ggcgatggtg acggcatcat cgttatccct gtggaaattg cacaggaggt ttcagaagaa 600
gcacttgcaa tggaactctt cgaagatttt gtgctggata aagttcgggc gggaagcaaa 660
gtcattgggc tgtaccctcc taacgcagaa actctggagg agtacaacaa ccaaaaggca 720
tag 723<210> 16<211> 240<212> PRT
<213> desconhecido<220>
<220>
<221> DOMÍNIO<222> (19)...(188)
<223> Demetilmenaquinone metiltransferase
<220>
<221> SITE
<222> (155)...(158)<223> Sítio de N-glicosilação prosítio id = PS00001<400> 16
Met Thr Thr Ser Thr Lys Asn Met Gln Val Ser Gln Lys Val Ile Asp1 5 10 15
Asp Leu Arg Arg Val Ser Thr Ala Thr Leu His Thr Ala Leu Phe Lys
20 25 30
Arg Gly Leu Arg Asn Thr Tyr Ile Gln Gly Val Ser Leu Ile Asn Asn
35 40 45
Gln Lys Leu Lys Met Val Gly Gln Ala Phe Thr Leu Arg Tyr Ile Pro
50 55 60
Ala Arg Glu Asp Val Asp Thr Val Ala Ala Phe Lys Ser Pro Glu His65 70 75 80
Pro Gln Arg Leu Ala Val Glu Ser Val Pro Glu Gly Met Val Leu Val
85 90 95
Ser Asp Cys Arg Gln Asp Ala Thr Ala Ala Ser Ala Gly Ser Ile Leu
100 105 110
Leu Thr Arg Leu Glu Val Arg Lys Cys Ala Gly Phe Val Ser Asp Ala
115 120 125
Gly Ile Arg Asp Phe Asn Asp Ala Ser Glu Met Asn Met Pro Ile Phe
130 135 140
Cys Ala Lys Pro Ser Ala Pro Thr Asn Leu Thr Lys His His Ala Val145 150 155 160
Asp Ile Gln Val Pro Ile Gly Cys Gly Gly Val Met Val Asn Pro Gly
165 170 175
Asp Val Leu Val Gly Asp Gly Asp Gly Ile Ile Val Ile Pro Val Glu
180 185 190
Ile Ala Gln Glu Val Ser Glu Glu Ala Leu Ala Met Glu Leu Phe Glu
195 200 205
Asp Phe Val Leu Asp Lys Val Arg Ala Gly Ser Lys Val Ile Gly Leu
210 215 220
Tyr Pro Pro Asn Ala Glu Thr Leu Glu Glu Tyr Asn Asn Gln Lys Ala225 230 235 240<210> 17<211> 792<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 17
atgattcggt tgaccaacct gaaccccttt gagcggtttg acgatggccg ccccaaggtg 60cccgatgacc tgctggagcg gatgaagctg gtcaccaccg aggaggcctg gggcacgctc 120tatcacgccg gctacctgcg ccagttcgaa ggcaagtggc acgagaccca cccgggcgtc 180atcactgtcg gccgcgccgt caccgcccag ttcctgcccc atcgccccga ctaccacgcc 240gtggtgcaag aaaccggcgt cggcgaaggc cgcggcagcg ccggtggtca gaactcgtgg 300atcatcgaga gcctgcagcg caacgacgtc atggtggtcg acatcttcgg caaggtcaaa 360gacggcacgg tcgtcggcga caacctgggc accgccgtgc gcacccgcac ccgcgccggg 420gccgtcatcg acggcggcgt gcgcgactac cagggcctga cccagctcac cgacgtcaac 480ttctacatcc gcggtatgga cccgaccggc atcgccgacg tcaccctggc cggcctgaac 540atccccatcc gcatcggtgg ctgcacagtc ctgcccggcg acgtggtcct cggcacgccc 600agcggcgtcc tgttcatccc gccgcacctg gtgtcgaagg tggtcgagga gagcgaggac 660gtccgcgtcc gcgacgagtt tggcaagagc cgcctggccg aaggcatttg gacctccggc 720cagatcgact cggcctggag cgacgagatc aaggccgact tcgagaactg gaaggccaac 780cgccccaagt ag 792
<210> 18<211> 263<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (39)... (205)
<223> Demetilmenaquinone metiltransferase<400> 18Met Ile Arg Leu Thr Asn Leu Asn Pro Phe Glu Arg Phe Asp Asp Gly1 5 10 15
Arg Pro Lys Val Pro Asp Asp Leu Leu Glu Arg Met Lys Leu Val Thr
20 25 30
Thr Glu Glu Ala Trp Gly Thr Leu Tyr His Ala Gly Tyr Leu Arg Gln
35 40 45
Phe Glu Gly Lys Trp His Glu Thr His Pro Gly Val Ile Thr Val Gly
50 55 60
Arg Ala Val Thr Ala Gln Phe Leu Pro His Arg Pro Asp Tyr His Ala65 70 75 80
Val Val Gln Glu Thr Gly Val Gly Glu Gly Arg Gly Ser Ala Gly Gly
85 90 95
Gln Asn Ser Trp Ile Ile Glu Ser Leu Gln Arg Asn Asp Val Met Val
100 105 110
Val Asp Ile Phe Gly Lys Val Lys Asp Gly Thr Val Val Gly Asp Asn
115 120 125
Leu Gly Thr Ala Val Arg Thr Arg Thr Arg Ala Gly Ala Val Ile Asp
130 135 140
Gly Gly Val Arg Asp Tyr Gln Gly Leu Thr Gln Leu Thr Asp Val Asn145 150 155 160
Phe Tyr Ile Arg Gly Met Asp Pro Thr Gly Ile Ala Asp Val Thr Leu
165 170 175
Ala Gly Leu Asn Ile Pro Ile Arg Ile Gly Gly Cys Thr Val Leu Pro
180 185 190
Gly Asp Val Val Leu Gly Thr Pro Ser Gly Val Leu Phe Ile Pro Pro
195 200 205
His Leu Val Ser Lys Val Val Glu Glu Ser Glu Asp Val Arg Val Arg
210 215 220
Asp Glu Phe Gly Lys Ser Arg Leu Ala Glu Gly Ile Trp Thr Ser Gly225 230 235 240
Gln Ile Asp Ser Ala Trp Ser Asp Glu Ile Lys Ala Asp Phe Glu Asn245 250 255Trp Lys Ala Asn Arg Pro Lys260
<210> 19<211> 723<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 19
atgagcgatt ataccaacga gattaccggc gaaccgccaggagcaggaaa tcttggattt tgtacggcag aagctgcatgttggatgatt tgggctaccg caatcaagcc atgcaccagcgatattcgga actgtggttt tgtcgggcga gcgcgtacgttatattgtcg aggaagatcc ctatgggctg gagatcgactggtgatgtca ttgttcattc caccgaccct ggcggcaccaatgaccacca tcgccaagtt gcgcggcgca gttggctgcggacacggtgc agatcatcga catgggcttc cccgtctactgattccaaag ggcgggcgcg cgtgatgggt ttggatctgcttggtgcatc ctggcgatct catcttcgcc gaccatgacggcgcaggtgc agcaggtact caagctggcc caagaaaagacgcaatgacc tgctcgcggg caagacactg cgcgaggtcttag<210> 20<211> 240<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (30)...(197)
<223> Demetilmenaguinone metiltransferase
ctgctgaacc tttgccggac 60
tcgccgcggt ttgcgatatt 120
gattgcgccc gctcctaccc 180
tgcgctggat ggagaccgat 240
ttatggatag tctgggcgcg 300
atgccccgtg gggcgaactc 360
tctgcgacag ccagatacgc 420
acacgggaat tcgtccgttg 480
ccgtacgctg tggtgatgtg 540
gcatcgtggt cattccgcaa 600
tggagaagga gaaccacacg 660
atgatacgta tggggtgttg 720<220>
<221> SITE
<222> (221) . .. (224)
<223> Sítio de N-glicosilação prositio id = PS00001<400> 20
Met Ser Asp Tyr Thr Asn Glu Ile Thr Gly Glu Pro Pro Ala Ala Glu1 5 10 15
Pro Leu Pro Asp Glu Gln Glu Ile Leu Asp Phe Val Arg Gln Lys Leu
20 25 30
His Val Ala Ala Val Cys Asp Ile Leu Asp Asp Leu Gly Tyr Arg Asn
35 40 45
Gln Ala Met His Gln Arg Leu Arg Pro Leu Leu Pro Asp Ile Arg Asn
50 55 60
Cys Gly Phe Val Gly Arg Ala Arg Thr Leu Arg Trp Met Glu Thr Asp65 70 75 80
Tyr Ile Val Glu Glu Asp Pro Tyr Gly Leu Glu Ile Asp Phe Met Asp
85 90 95
Ser Leu Gly Ala Gly Asp Val Ile Val His Ser Thr Asp Pro Gly Gly
100 105 110
Thr Asn Ala Pro Trp Gly Glu Leu Met Thr Thr Ile Ala Lys Leu Arg
115 120 125
Gly Ala Val Gly Cys Val Cys Asp Ser Gln Ile Arg Asp Thr Val Gln
130 135 140
Ile Ile Asp Met Gly Phe Pro Val Tyr Tyr Thr Gly Ile Arg Pro Leu145 150 155 160
Asp Ser Lys Gly Arg Ala Arg Val Met Gly Leu Asp Leu Pro Val Arg
165 170 175
Cys Gly Asp Val Leu Val His Pro Gly Asp Leu Ile Phe Ala Asp His
180 185 190
Asp Gly Ile Val Val Ile Pro Gln Ala Gln Val Gln Gln Val Leu Lys
195 200 205
Leu Ala Gln Glu Lys Met Glu Lys Glu Asn His Thr Arg Asn Asp Leu210 215 220
Leu Ala Gly Lys Thr Leu Arg Glu Val Tyr Asp Thr Tyr Gly Val Leu225 230 235 240
<210> 21<211> 444<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<400> 21
atgaccaagc cgctgagtga agccgcgcgc gccaagctcgctgacgacgc aactgttcaa gcgcgggctg cgcaacacctctcaatcccg acgcgccgcc gatggtcggc ccggcctacacgcgaggaca tcgacacgct cgatgtgttc aatgaccgcagtggaggaca tcccgccggg cagcgtgctg gtgatggactgcgtcggccg gcagcatcct ggtgacccgc atgatgatgcagcgacggcg gcctgcgcga ttcccccgag atcgcgaagccagggcgggt cggcgcccac caac<210> 22<211> 148
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<400> 22
Met Thr Lys Pro Leu Ser Glu Ala Ala Arg Ala Lys Leu Ala Thr Val1 5 10 15
Ser Thr Ala Thr Leu Thr Thr Gln Leu Phe Lys Arg Gly Leu Arg Asn20 25 30
Thr Phe Ile Gln Gly Ala Arg Pro Leu Asn Pro Asp Ala Pro Pro Met35 40 45
Val Gly Pro Ala Tyr Thr Leu Arg Tyr Ile Pro Ala Arg Glu Asp Ile
ccaccgtcag taccgccacg 60
tcatccaggg cgcacgcccg 120
cgctgcgcta tatcccggca 180
cccacccgca acgcaaggcc 240
gccgcggcga cgcgagcgtc 300
gcggcgcagc cggcgtggtc 360
tccccttccc cacctactgc 420
44450 55 60
Asp Thr Leu Asp Val Phe Asn Asp Arg Thr His Pro Gln Arg Lys Ala65 70 75 80
Val Glu Asp Ile Pro Pro Gly Ser Val Leu Val Met Asp Cys Arg Gly85 90 95
Asp Ala Ser Val Ala Ser Ala Gly Ser Ile Leu Val Thr Arg Met Met100 105 110
Met Arg Gly Ala Ala Gly Val Val Ser Asp Gly Gly Leu Arg Asp Ser115 120 125
Pro Glu Ile Ala Lys Leu Pro Phe Pro Thr Tyr Cys Gln Gly Gly Ser130 135 140
Ala Pro Thr Asn145
<210> 23
<211> 801
<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 23
atgatcaatt gcctcgcggc taaaccacag cggccttccc aattatccaa tccctatcag 60
gagcctgcca tgccagccat ctccctcgaa gtgcttgaga aactgcgcgc atacgatacg 120
cccaccattt gcaacgtgat cgagctgttc gacgtgcggc cgcgcaccag cggctacatg 180
gatgcccgca tccgcgcctg cttccccgag atgccgccgg tggtgggctt tgcctccacc 240
gccaccttcc gcgcttctga agcgccgctc tccggcccgg atatctacgg ctcgctgaac 3 00
ctgcaagtgg agagctttgg cacgctctcc ggcccggcca tcgtggtctt tcaagacctg 360
gacgacccgg cggtggcggc aacctttggc gaggtgatgt gcaccaccta ccagacgtac 420
ggatcggtcg ggctgatcac ctctggcgcg gggcgcgacc tggaccaggt acgcaagatt 480
ggttactcgg tcttcaccaa cggcgcgatt tgctcgcacg gctactgcca cattccggat 540
gtcaacgtgc cggtgcgggt gggcggctta atcgtgcgcc cggatgatct gctgcacatg 600
gacgtgaacg gcgtgaccaa catccccaag gagatcgcgg cggaggtggc ggaggcctgc 660
gaggcctacg tggcggcgga gatggcgacg ctgaacgggc tgcatgcgta taggcaagat 720ggggatgccg ggaagctgca agaggcgaag aaggagagta aaaggctgat gcaggcgctg
aaggaacggg tgaggaggta a
<210> 24
<211> 266
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (36)...(207)
<223> Demetilmenaquinone metiltransferase<400> 24
Met Ile Asn Cys Leu Ala Ala Lys Pro Gln Arg Pro Ser Gln Leu Ser1 5 10 15
Asn Pro Tyr Gln Glu Pro Ala Met Pro Ala Ile Ser Leu Glu Val Leu
20 25 30
Glu Lys Leu Arg Ala Tyr Asp Thr Pro Thr Ile Cys Asn Val Ile Glu
35 40 45
Leu Phe Asp Val Arg Pro Arg Thr Ser Gly Tyr Met Asp Ala Arg Ile
50 55 60
Arg Ala Cys Phe Pro Glu Met Pro Pro Val Val Gly Phe Ala Ser Thr65 70 75 80
Ala Thr Phe Arg Ala Ser Glu Ala Pro Leu Ser Gly Pro Asp Ile Tyr
85 90 95
Gly Ser Leu Asn Leu Gln Val Glu Ser Phe Gly Thr Leu Ser Gly Pro
100 105 110
Ala Ile Val Val Phe Gln Asp Leu Asp Asp Pro Ala Val Ala Ala Thr
115 120 125
Phe Gly Glu Val Met Cys Thr Thr Tyr Gln Thr Tyr Gly Ser Val Gly
130 135 140
Leu Ile Thr Ser Gly Ala Gly Arg Asp Leu Asp Gln Val Arg Lys Ile145 150 155 160
Gly Tyr Ser
His Ile Pro
Arg Pro Asp195
Pro Lys Glu210
Ala Ala Glu225
Gly Asp AlaMet Gln Ala
<210> 25<211> 741<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 25
atggctgaga agaaactgac cgggcggatt gcgcgggaga aaatcaggtt gatggaggtg 60ccgcggccgc cgcaaggcgt cgtcgagcgg ttcaagtcgc tcggcgattg caccggcatc 120atttccgaca ccatggatga actgggcatc ccgaacggcg tgatcggcgc gtcagtgctg 180cgaccaacca tccccggcac cgtcatcgcc gggccggcgt tgacgctgcg caacattctc 240cagcgcatcg atccactcgc cggcgcgcgc gagcacgtca acaagatggc cgagttcgaa 300tgtcacaacc tcgcgacccc gggcgacgtg ctggtgatcc agggggtgcc gaacgtctcc 360agtatgggag gcatctcggc gctgaccggc aagcgcgccg gtgaagtcgg cgccatcgtc 420gaaggcggca tccgcgacat tgcacattcg cgtgaggttg gctttccact gtggtcgagc 480cagatcacgc cggtcaccgg caagtggcgg ctggaggcgg ccgagatcaa cggcaccatc 540gaaatcggcg gcgtgcaggt gcaccccggc gatctggtgg tggccgacga caccggcgtc 600
Val Phe Thr Asn Gly Ala Ile165 170
Asp Val Asn Val Pro Val Arg180 185
Asp Leu Leu His Met Asp Val200
Ile Ala Ala Glu Val Ala Glu215
Met Ala Thr Leu Asn Gly Leu230
Gly Lys Leu Gln Glu Ala Lys245 250
Leu Lys Glu Arg Val Arg Arg260 265
Cys Ser His Gly Tyr Cys175
Val Gly Gly Leu Ile Val190
Asn Gly Val Thr Asn Ile205
Ala Cys Glu Ala Tyr Val220
His Ala Tyr Arg Gln Asp235 240
Lys Glu Ser Lys Arg Leu255tgcttcatcc cgcgcgacaa cattctggaa gtgctcgccg agtgcgagaa gaaagcgaag 660gccgaggacc tgcgctgcaa ggcgatcgat ggcggcgtcc cggtgccgga tatctcgaaa 720tcgacgtatg gagagacgtg a 741
<210> 26<211> 246
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (38)...(202)
<223> Demetilmenaquinone metiltransferase<220><221> SITE
<222> (119)...(122)
<223> Sítio de N-glicosilação prosítio id = PS00001<220>
<221> SITE
<222> (179)...(182)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 26
Met Ala Glu Lys Lys Leu Thr Gly Arg Ile Ala Arg Glu Lys Ile Arg1 5 10 15
Leu Met Glu Val Pro Arg Pro Pro Gln Gly Val Val Glu Arg Phe Lys20 25 30
Ser Leu Gly Asp Cys Thr Gly Ile Ile Ser Asp Thr Met Asp Glu Leu
35 40 45
Gly Ile Pro Asn Gly Val Ile Gly Ala Ser Val Leu Arg Pro Thr Ile
50 55 60
Pro Gly Thr Val Ile Ala Gly Pro Ala Leu Thr Leu Arg Asn Ile Leu65 70 75 80Gln Arg Ile Asp Pro Leu Ala Gly Ala Arg Glu His Val Asn Lys Met
85 90 95
Ala Glu Phe Glu Cys His Asn Leu Ala Thr Pro Gly Asp Val Leu Val
100 105 110
Ile Gln Gly Val Pro Asn Val Ser Ser Met Gly Gly Ile Ser Ala Leu
115 120 125
Thr Gly Lys Arg Ala Gly Glu Val Gly Ala Ile Val Glu Gly Gly Ile
130 135 140
Arg Asp Ile Ala His Ser Arg Glu Val Gly Phe Pro Leu Trp Ser Ser145 150 155 160
Gln Ile Thr Pro Val Thr Gly Lys Trp Arg Leu Glu Ala Ala Glu Ile
165 170 175
Asn Gly Thr Ile Glu Ile Gly Gly Val Gln Val His Pro Gly Asp Leu
180 185 190
Val Val Ala Asp Asp Thr Gly Val Cys Phe Ile Pro Arg Asp Asn Ile
195 200 205
Leu Glu Val Leu Ala Glu Cys Glu Lys Lys Ala Lys Ala Glu Asp Leu
210 215 220
Arg Cys Lys Ala Ile Asp Gly Gly Val Pro Val Pro Asp Ile Ser Lys225 230 235 240
Ser Thr Tyr Gly Glu Thr245
<210> 27<211> 693<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 27
atgatttatc agccggggac aacaggcatc gtcgtgcagg atattgcacg cgctgatcaagccattatcg atggcctagc agaatgtggt gtggcgacgg tgcatgaggc acaggggcgcaagggcctgt tggcggatta tatgacgccg atttactcgg gcgcgcgcat cgctggatctgcggtgacca ttctggcacc gccgtgtgac aattggatga tccatgtggc ggtagaacag 240ttgcaaaagg gcgatgtgtt gctgctgggc acgatcacac cgtccaatgc tggctatttc 300ggtgacttgc tggccacgtc agccatggcg cacggttgtc gcggattgat cattgatggc 360ggtgtgcgcg atgtgcaaga gctgacggat atgggctttc cggtttggtc caaggccgta 420catgcccaag gcacaatcaa agaaacgctg ggatcggtca acgtgccagt tgtctgcggc 480caagagttgg taaaccccgg tgatattgtg gtggccgacg atgacggggt gtgcgttgtg 540cgccgcgaag aagctgctga tgtgctggct aaggcgcggg cgcgcgagag caatgaagcg 600gccaagcgcg cgcgttttga ggccggtgag ctggggctgg atatctatga catgcgcgcg 660cggctggccg aaaaaggact gaaatacgtc tga 693
<210> 28<211> 230<212> PRT<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO<222> (27)... (179)<223> Demetilmenaquinone metiltransferase<400> 28
Met Ile Tyr Gln Pro Gly Thr Thr Gly Ile Val Val Gln Asp Ile Ala15 10 15
Arg Ala Asp Gln Ala Ile Ile Asp Gly Leu Ala Glu Cys Gly Val Ala20 25 30
25 Thr Val His Glu Ala Gln Gly Arg Lys Gly Leu Leu Ala Asp Tyr Met35 40 45
Thr Pro Ile Tyr Ser Gly Ala Arg Ile Ala Gly Ser Ala Val Thr Ile
50 55 60
Leu Ala Pro Pro Cys Asp Asn Trp Met Ile His Val Ala Val Glu Gln
30 65 70 75 80
Leu Gln Lys Gly Asp Val Leu Leu Leu Gly Thr Ile Thr Pro Ser Asn85 90 95Ala Gly Tyr Phe Gly Asp Leu Leu Ala Thr Ser Ala Met Ala His Gly
100 105 110
Cys Arg Gly Leu Ile Ile Asp Gly Gly Val Arg Asp Val Gln Glu Leu
115 120 125
Thr Asp Met Gly Phe Pro Val Trp Ser Lys Ala Val His Ala Gln Gly
130 135 140
Thr Ile Lys Glu Thr Leu Gly Ser Val Asn Val Pro Val Val Cys Gly145 150 155 160
Gln Glu Leu Val Asn Pro Gly Asp Ile Val Val Ala Asp Asp Asp Gly
165 170 175
Val Cys Val Val Arg Arg Glu Glu Ala Ala Asp Val Leu Ala Lys Ala
180 185 190
Arg Ala Arg Glu Ser Asn Glu Ala Ala Lys Arg Ala Arg Phe Glu Ala195 200 205
Gly Glu Leu Gly Leu Asp Ile Tyr Asp Met Arg Ala Arg Leu Ala Glu210 215 220
Lys Gly Leu Lys Tyr Val225 230
<210> 29
<211> 756
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<400> 29
ttgcagcgac agctttccac actgcagcgg cgatggaagg cttatacgtc gggcatggaa 60
cagaagattg cggaacggct gtcggccttg tcggtggcgc atctggccga tggctgcctg 120
cgtgccggaa cggcgatgcg ggtggtggcc aatctacccc cgatcgtagc tggtcagcga 180
acgtccggcc ggacacggcc ggtgcggcat tacggcagcg tcgacgtctt ccttgaagcg 240
ctggccgacc ccagggcggg cgatgtgctg gtcgtcgaca atggcgaccg ggacgatgaa 300
ggctgcatcg gcgacctgac ggcgctggaa gtcgctcagg ccgggctggc cgggatcatc 360
atctcgggcc ggcaccgcga cacggcgatc ctccgctcca ttccaatcgc cttgttcagc 420cgcggtgcct gcgcgcgtgg gccggtccgg ctcgacgtcc gcgcgccgga gacattcgtc 480agcgcccgca ttggcgacga ggtcgtaacc gcagcagatt gggtagcggc cgatgacgac 540ggcgccatct tcatcggcga caaccatatt gcggcggtgg tcgcggcggc ggagtcgatc 600cgcgacaccg agctccggca gaccgggctg atgaaggccg ggacaagctt gcgcgagcag 660cttgaggtcg cggcttatct ggacgcgcgg gcggcggatc cggcgctgga cttccgcgcc 720catttgcgcg cgctcaacgc ggcgatcgag gaatga 756
<210> 30<211> 251<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (28) . . . (184)
<223> Demetilmenaguinone metiltransferase<400> 30
Met Gln Arg Gln Leu Ser Thr Leu Gln Arg Arg Trp Lys Ala Tyr Thr1 5 10 15
Ser Gly Met Glu Gln Lys Ile Ala Glu Arg Leu Ser Ala Leu Ser Val20 25 30
Ala His Leu Ala Asp Gly Cys Leu Arg Ala Gly Thr Ala Met Arg Val
35 40 45
Val Ala Asn Leu Pro Pro Ile Val Ala Gly Gln Arg Thr Ser Gly Arg
50 55 60
Thr Arg Pro Val Arg His Tyr Gly Ser Val Asp Val Phe Leu Glu Ala
65 70 75 80
Leu Ala Asp Pro Arg Ala Gly Asp Val Leu Val Val Asp Asn Gly Asp85 90 95
Arg Asp Asp Glu Gly Cys Ile Gly Asp Leu Thr Ala Leu Glu Val Ala100 105 110
Gln Ala Gly Leu Ala Gly Ile Ile Ile Ser Gly Arg His Arg Asp Thr115 120 125
Ala Ile Leu Arg Ser Ile Pro Ile Ala Leu Phe Ser Arg Gly Ala Cys
130 135 140
Ala Arg Gly Pro Val Arg Leu Asp Val Arg Ala Pro Glu Thr Phe Val145 150 155 160
Ser Ala Arg Ile Gly Asp Glu Val Val Thr Ala Ala Asp Trp Val Ala
165 170 175
Ala Asp Asp Asp Gly Ala Ile Phe Ile Gly Asp Asn His Ile Ala Ala180 185 190
Val Val Ala Ala Ala Glu Ser Ile Arg Asp Thr Glu Leu Arg Gln Thr195 200 205
Gly Leu Met Lys Ala Gly Thr Ser Leu Arg Glu Gln Leu Glu Val Ala
210 215 220
Ala Tyr Leu Asp Ala Arg Ala Ala Asp Pro Ala Leu Asp Phe Arg Ala225 230 235 240
His Leu Arg Ala Leu Asn Ala Ala Ile Glu Glu245 250
<210> 31<211> 327<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 31
gtgagacagg gaatgcgact tgctcacacg cgtgtggcgc ccgaacttgt atcggccttc 60tcggctgttc agaccgccac gattcacgag gcacaaggtg gtatcggtgc ggtcgcggcg 120gatattcgcc ctctcgaccg ggcaatgtcc atctgcggcc ctgccctgac gatcaaaact 180ccgcccgcgg acaacctggc gcttcaccag gcgctttatc tcgcggaacc gggtgacgtg 240ctggtggtcg attgcgcaag ccacaccgag gccgggcaat ggggcggcat tctcatggaa 300gcagccaagg tgcgcggcat agccggg 327
<210> 32<211> 109<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 32
Met Arg Gln Gly Met Arg Leu Ala His Thr Arg Val Ala Pro Glu Leu1 5 10 15
Val Ser Ala Phe Ser Ala Val Gln Thr Ala Thr Ile His Glu Ala Gln20 25 30
Gly Gly Ile Gly Ala Val Ala Ala Asp Ile Arg Pro Leu Asp Arg Ala35 40 45
Met Ser Ile Cys Gly Pro Ala Leu Thr Ile Lys Thr Pro Pro Ala Asp
50 55 60
Asn Leu Ala Leu His Gln Ala Leu Tyr Leu Ala Glu Pro Gly Asp Val
65 70 75 80
Leu Val Val Asp Cys Ala Ser His Thr Glu Ala Gly Gln Trp Gly Gly85 90 95
Ile Leu Met Glu Ala Ala Lys Val Arg Gly Ile Ala Gly
100 105
<210> 33<211> 681<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 33
gcgctcgaga gcgtcacgac cgcgacgctg accaccgtgc tgctgaagca gggcctgcgc 60aacgtctgga tgcgcggcac ccggccgctg gcgagcggtc agccgcgcaa ggtcgggcgc 120gcgttcacgc tccgcttcgt gccggcgcgc gaggacctcg cgaccccggc ttcatggggc 180gcgccgatct cgacccgcgc cgcgatcgag gcgatgccgg aaggcgtgat cgcggtcgcc 240gatgcgatgg gcgtgactga cgccggcatc ttcggcgaca tcctgtgcgc ccggatgcgc 300cggcgcaacg tggccgcgct cgtgaccgac ggcgtgatcc gcgacctggc cggcgtgctg 360agcaccggcc tgccggtctg gtgccagggt accgcagcgc cttcgtcggt caccggcctg 420accttcgtcg cctggcagca gccggtcggc tgcggtgggg tggcggtgtt cccgaacgac 480gtggtcgtca tcgacgccga cggcgcggtc gtcatcccgg ctgcgctgct cgatggcgtc 540atcgcggagg cgatcgagca ggagacccag gagggctgga tcatgcggga ggtggagggc 600ggtgcggcgc tgccgggcct ctatccgatg aacgaggcga cgaaggcgcg ctacgaagcc 660tggaagaagg cgagcgactg a 681
<210> 34<211> 226<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (3) . . . (171)
<223> Demetilmenaquinone metiltransferase<400> 34
Ala Leu Glu Ser Val Thr Thr Ala Thr Leu Thr Thr Val Leu Leu Lys1 5 10 15
Gln Gly Leu Arg Asn Val Trp Met Arg Gly Thr Arg Pro Leu Ala Ser20 25 30
Gly Gln Pro Arg Lys Val Gly Arg Ala Phe Thr Leu Arg Phe Val Pro
35 40 45
Ala Arg Glu Asp Leu Ala Thr Pro Ala Ser Trp Gly Ala Pro Ile Ser
50 55 60
Thr Arg Ala Ala Ile Glu Ala Met Pro Glu Gly Val Ile Ala Val Ala
65 70 75 80
Asp Ala Met Gly Val Thr Asp Ala Gly Ile Phe Gly Asp Ile Leu Cys
85 90 95
Ala Arg Met Arg Arg Arg Asn Val Ala Ala Leu Val Thr Asp Gly Val
100 105 110
Ile Arg Asp Leu Ala Gly Val Leu Ser Thr Gly Leu Pro Val Trp Cys115 120 125
Gln Gly Thr Ala Ala Pro Ser Ser Val Thr Gly Leu Thr Phe Val Ala
130 135 140
Trp Gln Gln Pro Val Gly Cys Gly Gly Val Ala Val Phe Pro Asn Asp145 150 155 160
Val Val Val Ile Asp Ala Asp Gly Ala Val Val Ile Pro Ala Ala Leu165 170 175
Leu Asp Gly Val Ile Ala Glu Ala Ile Glu Gln Glu Thr Gln Glu Gly180 185 190
Trp Ile Met Arg Glu Val Glu Gly Gly Ala Ala Leu Pro Gly Leu Tyr195 200 205
Pro Met Asn Glu Ala Thr Lys Ala Arg Tyr Glu Ala Trp Lys Lys Ala
210 215 220
Ser Asp
225
<210> 35<211> 681<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 35
gtgaccgatc cggttgtcgt tcgacagatc gacaggccgt ccgcgaatct ggtcgctgat 60ctgcagcgct acggcgtctc caccgtgcac gaggcgcaag ggcgtcgcgg cctgctcgcg 120tcgtacatgc ggccgatcta tgccggcgcg ctcatcgccg gtcccgcgat cacggtcctg 180gtgccgcctg gcgacaactt gatgatccac gtcgccgtgg aagtgtgcca gcccggcgac 240gttctcatcg tcgccaccac ctcgccgtgc accgacggct atttcggcga gctgctggcg 300acgtcgctgc gggcccgcgg cgtggcgggg ctcgtgatcg atgcgggctg ccgggatgtt 360cgcgcgctga cagaaatgcg atttcccgtc tggagccgcg cgatcagcgc gcagggaacc 420gtcaaagcga cgctgggctc ggtgaacgcg gcggtggtgt gcgccggggc gtcggtgaga 480gccggggatc tcatcgtggc cgacgatgac ggggtggtgg cggtgcggcg ggaggaagtc 540gtcgccgtga cgcaggcagc cgaacagcgc gttcgcaagg aagagggcac gcgcgcacgg 600ctcgcgcagg gcgagctcgg cctggacatt tacggcttgc gccagaagct gtcggatctc 660ggcttgaagt catcgtcgtg a 681
<210> 36<211> 226<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 36
Met Thr Asp Pro Val Val Val Arg Gln Ile Asp Arg Pro Ser Ala Asn
1 5 10 15
Leu Val Ala Asp Leu Gln Arg Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala Leu Ile Ala Gly Pro Ala Ile Thr Val Leu Val Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp65 70 75 80
Val Leu Ile Val Ala Thr Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser Val Asn Ala Ala Val Val Cys Ala Gly Ala Ser Val ArgAla Gly Asp Leu Ile Val Ala Asp Asp Asp Gly Val Val Ala Val Arg
Arg Glu Glu Val Val Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg
Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu
Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly Leu Lys Ser
225
<210> 37<211> 675<212> DNA
<220>
<223> Proteína obtida por amostra do ambiente<400> 37
atggccggcg tcgtggttca acagatcgag cgcgccggtc tcgacactgc cgctgccctc 60
ggggaatgcg gcgtcgccac agtgcacgag gcgcagggcc ggacagggct gatgcgctcc 120
tacatgcggc cgatttattc aggcgcccgc gttgcgggcc ccgcggtaac ggtgtctatc 180
ccgccgggcg acaactggat gattcacgtc gctgtggaac agtgccggga aggcgacgtc 240
ctcgtcgtgg cgccgacgag tccttgcgag gacggctatt tcggcgagct gctcgcctgc 300
tcgctgcaga cccgccgagt gagcggtctc atcatagagg ccggggtgcg cgacgtccgc 3 60
gagctgaccg agatgcggtt cccggtttgg tccaaggcga ttctcgcaca agggactgtg 420
aaggaaacca tcggctcggt gaacgtcgca atcgtctgcg ccggtgcggc ggtcagtccc 480
ggcgacgtga tcgtcgccga tgacgacggc gtctgcattg tgccgcgcgg acaggcggag 540
acggtgcttc aggcgagccg cgcccgcgag gcgaaggagg ccgaaacgcg gcggcggctc 600
cggtcgggcg aactcggcct cgatatctac agcatgcgcg aaaagctggc ggccaggggc 660
ctgaaatatg tctga 675<210> 38<211> 224<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (21)... (173)
<223> Demetilmenaquinone metiltransferase<400> 38
Met Ala Gly Val Val Val Gln Gln Ile Glu Arg Ala Gly Leu Asp Thr1 5 10 15
Ala Ala Ala Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln
20 25 30
Gly Arg Thr Gly Leu Met Arg Ser Tyr Met Arg Pro Ile Tyr Ser Gly
35 40 45
Ala Arg Val Ala Gly Pro Ala Val Thr Val Ser Ile Pro Pro Gly Asp
50 55 60
Asn Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Val65 70 75 80
Leu Val Val Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Cys Ser Leu Gln Thr Arg Arg Val Ser Gly Leu Ile Ile
100 105 110
Glu Ala Gly Val Arg Asp Val Arg Glu Leu Thr Glu Met Arg Phe Pro
115 120 125
Val Trp Ser Lys Ala Ile Leu Ala Gln Gly Thr Val Lys Glu Thr Ile
130 135 140
Gly Ser Val Asn Val Ala Ile Val Cys Ala Gly Ala Ala Val Ser Pro145 150 155 160
Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Ile Val Pro Arg
165 170 175
Gly Gln Ala Glu Thr Val Leu Gln Ala Ser Arg Ala Arg Glu Ala Lys180 185 190
Glu Ala Glu Thr Arg Arg Arg Leu Arg Ser Gly Glu Leu Gly Leu Asp
195 200 205
Ile Tyr Ser Met Arg Glu Lys Leu Ala Ala Arg Gly Leu Lys Tyr Val
210 215 220
<210> 39<211> 672<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 39
atggccaaag ttgttcaaaa tatcgaacgc gcagcccaaa aggtgattga tgcgcttggg 60
gcctgcggtg ttgccacggt gcatgaggcg caggggcgca aaggcctgct cgcttcctat 120atgcggccga tttattccgg tgcgcggctt gcggcatcgg cggtgaccat atcggctgca 180cccggtgata actggatggt gcatgtggcg attgagcaag tgaaagaggg cgacattttg 240gtgcttgccc cgacctcgcc ttgtgaagac ggctattttg gcgatctgct ggcgacatcg 300atgcaggcgc gtggcgggcg tgggctgatt atcgatgccg gggttcgcga tattcgcgat 360ctgacggaaa tgggttttcc ggtgtggtca aaggcgattt atgcccaagg cacggtcaag 420aaaacgctgg ggtcggttaa tattcctatc gtctgcgccg gtgcgcttat caatgctggc 480gacattattg ttgccgatga tgacggtgtg tgtgttgtgg cccgagaaga ggccgaagcg 540gtgctggcca aggcgcaggc gcgcgaggcc aatgaggaag acaagcgcaa gcggttggct 600gccggtgagt tggggcttga tatgtataac atgcgcgcac ggctggcgga aaagggcctg 660aaatatgttt ag 672
<210> 40
<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<400> 40
Met Ala Lys Val Val Gln Asn Ile Glu Arg Ala Ala Gln Lys Val Ile1 5 10 15
Asp Ala Leu Gly Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Ala Pro Gly Asp Asn50 55 60
Trp Met Val His Val Ala Ile Glu Gln Val Lys Glu Gly Asp Ile Leu65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Met Gln Ala Arg Gly Gly Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Ile Arg Asp Leu Thr Glu Met Gly Phe Pro Val115 120 125
Trp Ser Lys Ala Ile Tyr Ala Gln Gly Thr Val Lys Lys Thr Leu Gly130 135 140
Ser Val Asn Ile Pro Ile Val Cys Ala Gly Ala Leu Ile Asn Ala Gly145 150 155 160
Asp Ile Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Ala Arg Glu165 170 175
Glu Ala Glu Ala Val Leu Ala Lys Ala Gln Ala Arg Glu Ala Asn Glu
180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Met195 200 205
Tyr Asn Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val210 215 220
<210> 41<211> 672<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 41
atgggtgtcg tggtccagaa cattgcccgc gcagcctccg atgtcatcga tcggctcgca 60gcctgcggtg tcgcaacggt acatgaggcg cagggtcgca cggggctgct tgccagccat 120atgcggccga tctatccggg cgcgcggctc gcggcaagcg cggtgaccat ctctgcgccg 180ccaggtgaca actggatgat ccatgtggcg atcgagcagt tgaaggatgg cgacgtgctg 240ctgctcgcgc cgacgagccc ctgcgaggat ggctatttcg gcgacctcct ggcgacgtcg 300gccagggcga ggggctgccg gggcctgatc atcgatgccg gcgtgcgcga cgttgccgat 360ctgaccgaga tgaagtttcc cgtctggtcg aaggcgatct ttgcgcaggg aaccgtcaag 420gagactgtcg gatcggtgaa tgtaccggtc gtttgcgccg gtgctttcgt caatccgggc 480gatgtgatcg tcgccgacga tgacggcgcc tgcgtcgtgc cccggcaaga cgcggccgat 540gtggccgaca aggcggaggc acgtgtcgct gccgaggagg ccaagcgcaa gcggctggca 600tcgggcgagc ttgggctcga catctacgac atgcgcgggc ggctggcgca gaggggcctg 660aaatatgtct ga 672
<210> 42
<211> 223
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<400> 42
Met Gly Val Val Val Gln Asn Ile Ala Arg Ala Ala Ser Asp Val Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Ile Glu Gln Leu Lys Asp Gly Asp Val Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Arg Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Glu Met Lys Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Val Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Phe Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Ala Cys Val Val Pro Arg Gln
165 170 175
Asp Ala Ala Asp Val Ala Asp Lys Ala Glu Ala Arg Val Ala Ala Glu
180 185 190
Glu Ala Lys Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Gln Arg Gly Leu Lys Tyr Val
210 215 220
<210> 43<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 43atgagcgtcg tcgttcagaa catcgcgcgc gccgatcaat ccatcgtcga taggctcggg 60gcctgcggcg tcgccaccgt gcacgaagcg cagggccgca aaggattgct cgcgagccac 120atgcggccga tctattccgg cgcgcggctc gcggcgagcg ccgtgaccat ctcggcgccg 180ccgggtgaca attggatggt ccatgtcgcg atcgagcaat tgcgagccgg cgacattatg 240gtgctcgcgc cgaccagccc gtgcgaggat ggctatttcg gtgatctgct cgcgacctcg 300gcgaaagcgc ggggctgccg cggtctcatc atcgatgccg gcgtgcgcga tgtcgccgat 360ctcaccgcga tgcagtttcc cgtctggtcc aaggccgtct tcgcccaggg aaccgtgaag 420gaaacgctcg gctcggtaaa catccccgtg gtctgcgccg gtgcgctggt caatccgggc 480gatgtcatcg tcgccgatga cgatggtgtc tgcgtcgtgc gccgcgaaga ggcggaggcg 540gtggcgcaga aggccgaggc ccgcgtcgcc gccgaggagg ataagcgcaa gcgcctcgcc 600gccggcgaac tcggcctcga catctacaag atgcgcgagc ggctcgccga gaaggggctc 660aaatatgtct ga 672
<210> 44<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<400> 44
Met Ser Val Val Val Gln Asn Ile Ala Arg Ala Asp Gln Ser Ile Val
1 5 10 15
Asp Arg Leu Gly Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Ser Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met Val His Val Ala Ile Glu Gln Leu Arg Ala Gly Asp Ile Met65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro Val
115 120 125
Trp Ser Lys Ala Val Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly130 135 140
Ser Val Asn Ile Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly
145 150 155 160 !
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Ala Glu Ala Val Ala Gln Lys Ala Glu Ala Arg Val Ala Ala Glu
180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val210 215 220
<210> 45
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 45
atgaacgttg tcgtccagaa ctttgaacgg gctgatcctg cggttgttaa ggccttgggc 60gaatgtggtg tggccacggt gcatgaagca cagggccgca aggggctttt agcctcttat 120atacgcccga tttatagcgg aacttctatc ggggcttcgg ctgttaccat acttgcggct 180ccatgcgaca actggatgct gcatgtggcg atcgaacaag tgcaagcggg cgatgtattg 240gtactggcgg ttacgtcacc atcagacgca ggttactttg gcgatttgtt agcaacatct 300gcgcaagcgc ggggttgcgc aggtttgatc actgatgcgg gcgtacgcga tgtgcgcgat 360ttgcaggcga tgaattttcc ggtttggtcg aaagcgatct gtgcgcaagg cacggtgaaa 420gaaaccctgg gttcggtcaa cgttcccgtt gtctgtgcag gagcgaagat taatcccggt 480gatgtgattg tggcggatga tgatggggtt tgcgctgtga agtgcgaaga ggcggcagag 540gttttgaaaa aagcgcaagc gcgtttggcc aatgaagagc agaaacgtac gcgattggct 600gatggtgagt tagggctgga catgtatgat atgcgcgggc gcctagctga aaaaggtctg 660aaatatgtct aa 672
<210> 46<211> 223<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20) . . . (172)
<223> Demetilmenaquinone metiltransferase<400> 46
Met Asn Val Val Val Gln Asn Phe Glu Arg Ala Asp Pro Ala Val Val1 5 10 15
Lys Ala Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Ser Gly Thr
35 40 45
Ser Ile Gly Ala Ser Ala Val Thr Ile Leu Ala Ala Pro Cys Asp Asn
50 55 60
Trp Met Leu His Val Ala Ile Glu Gln Val Gln Ala Gly Asp Val Leu
65 70 75 80
Val Leu Ala Val Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Ala Gly Leu Ile Thr Asp
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Gln Ala Met Asn Phe Pro Val115
Trp Ser Lys
130Ser Val Asn
145
Asp Val IleGlu Ala Ala
Glu Gln Lys195
Tyr Asp Met210<210> 47
<211> 672
<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 47
atgggtattg ttgttcagaa catcaagcgg gcggaccccg ggatcatagc aggtcttggc 60
aaatgcggcg ttgccactgt gcatgaagcg caggggtgca aggggctcct ggcggcctat 120
atgcggccca tttattctgg cgcgcgcctt gccgcctccg ctgtcaccat ttccgcgccg 180
ccgggagaca actggatggt gcatgtcgcc attgagcagg tgaggcaagg tgatattctg 240
gttcttgccc caacatcgcc ctgtgaagac ggctatttcg gtgatttgct cgccacctcc 300
atgctgcagc gcggcggcag ggggctgatt attgacgccg gtgtccgcga tatccgtgat 360
ctgactcaaa tgaaatttcc ggtgtggtcg aaaaccgttt ttgcgcaggg caccgttaag 420
gaaacccttg gctctgtgaa cgtcccgata gtttgcgccg gtgaagtggt caatcctggc 480
gacatcatga ttgccgatga tgatggtgtg tgcgtggtcc ggcgcgacga cgctgaaagc 540
gtgcttgaaa aagcattggc gcgtgaggca aaggaagaag atacacgcaa acgccttgcg 600
gcaggcgagc tgggtcttga tatttacggc atgcgcgcac gtctggccga aaagggccta 660
aaatatgtct ga 672
120 125
Ala Ile Cys Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
135 140
Val Pro Val Val Cys Ala Gly Ala Lys Ile Asn Pro Gly150 155 160
Val Ala Asp Asp Asp Gly Val Cys Ala Val Lys Cys Glu
165 170 175
Glu Val Leu Lys Lys Ala Gln Ala Arg Leu Ala Asn Glu180 185 190
Arg Thr Arg Leu Ala Asp Gly Glu Leu Gly Leu Asp Met
200 205
Arg Gly Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val215 220<210> 48<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<400> 48
Met Gly Ile Val Val Gln Asn Ile Lys Arg Ala Asp Pro Gly Ile Ile1 5 10 15
Ala Gly Leu Gly Lys Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Cys Lys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Val His Val Ala Ile Glu Gln Val Arg Gln Gly Asp Ile Leu65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Met Leu Gln Arg Gly Gly Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Ile Arg Asp Leu Thr Gln Met Lys Phe Pro Val
115 120 125
Trp Ser Lys Thr Val Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Ile Val Cys Ala Gly Glu Val Val Asn Pro Gly145 150 155 160
Asp Ile Met Ile Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Asp165 170 175
Asp Ala Glu Ser Val Leu Glu Lys Ala Leu Ala Arg Glu Ala Lys Glu
180 185 190
Glu Asp Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205
Tyr Gly Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val210 215 220
<210> 49
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 49
atgagcatcg tcgtccagaa catcgagcgc gccgacaagg atgcggttgt ggcactcggc 60gaatgcggcg ttgcgacggt gcatgaggcg caggcccgca aagggctcat gcggccttac 120atgcggccaa tctatgccgg cgcccgcatc gccggcccag ccgtgacggt ctcgatcgcg 180ccgggcgaca actggatgat ccatgtggca gtggagcagt gccgcgacgg cgatatcctc 240gtggtggcac cgaccagccc gagtgaagac ggctatttcg gcgaactgct ggcgcgctcg 300ctcatggcgc gcggtgtgaa ggggctgatc atcgaagccg gggtgcgcga cgtgcgcgac 360ctcaccgaga tcaatttccc ggtctggtcg aaagcgatct ccgcgcaagg gacggtgaag 420gaaacgctcg gctcggtgaa tgtgccggtc gtctgcgccg gcgcgctggt caatccgggc 480gacgtcatca ttgccgatga cgacggcgtc tgtgtcgtgg cgcgcgctgc ggcaagtgac 540gttgcgaagg cgtcccgaac ccgcgaagcc aaggaagccg aaacccgcaa gcgcctgatg 600gcgggtgaac tcggactcga catctacggg atgcgcgaca agcttgcggc caagggcctg 660aaatatgtct ga 672
<210> 50<211> 223<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO<222> (20)... (172)<223> Demetilmenaquinone metiltransferase<400> 50
Met Ser Ile Val Val Gln Asn Ile Glu Arg Ala Asp Lys Asp Ala Val15 10 15
Val Ala Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Ala
20 25 30
Arg Lys Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Ile Ala Gly Pro Ala Val Thr Val Ser Ile Ala Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Arg Asp Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Arg Ser Leu Met Ala Arg Gly Val Lys Gly Leu Ile Ile Glu
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Ile Asn Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Val Ile Ile Ala Asp Asp Asp Gly Val Cys Val Val Ala Arg Ala
165 170 175
Ala Ala Ser Asp Val Ala Lys Ala Ser Arg Thr Arg Glu Ala Lys Glu
180 185 190
Ala Glu Thr Arg Lys Arg Leu Met Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Asp Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val210 215 220
<210> 51<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 51
atgggcgtcg tggtccagaa tatcgcccgg gccgagcagt ccgtcgtcga caggctggct 60gcgtgcggtg ttgccacggt gcacgaggcg cagggccgca aggggctgct cgcgagttct 120gtgcggccga tctatccggg cgcgcgggtg gcggccagcg cggtcacgat ctcagcgccg 180ccgggtgaca actggatggt ccatgtagcg atcgaacagt tgaaggaggg cgacatcctg 240ctgttggcgc cgaccagtcc ctgcgaggat ggctatttcg gtgatctgct cgccacttcg 300gccatggcgc ggggctgccg cggactgatc atagatgcgg gggtgcgcga cgtcgcggac 360ctgacggcga tgcagtttcc agtctggtcc aaggcgatct tcgcccaagg caccgtcaag 420gaaacgctgg gttcggtgaa tattcctgtg gtctgcgccg gcgcgctggt caatcccggt 480gacgtgatcg tggccgatga cgacggcgtc tgcgtcgtcc gccgcgaaga ggcggccgcc 540gtcgccgaaa aggcggaggc acgggtggcg atcgaggaag gcaaacgcaa gcggctcgcg 600gcgggcgaac tcgggctcga tatttacgac atgcgcagtc gccttgccga gaaggggctg 660aaatatgtct ga 672
<210> 52<211> 223<212> PRT<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaguinone metiltransferase<400> 52
Met Gly Val Val Val Gln Asn Ile Ala Arg Ala Glu Gln Ser Val Val1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Ser Val Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Val Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Val His Val Ala Ile Glu Gln Leu Lys Glu Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Ile Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Ala Ala Ala Val Ala Glu Lys Ala Glu Ala Arg Val Ala Ile Glu
180 185 190
Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Ser Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val
210 215 220
<210> 53<211> 675<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 53
atgaagccgg tggtggtgca gactatcgag cgggccgacc gagcgatcat cgagggtctg 60
gccgcgtgtg gcgttgccac cgtccatgag gcgcaggggc gccgggggct gcttgcgtcc 120
tacatgcgcc cgatctattc gggcgctgcg gttgcggcct cggccgtcac catcctctct 180
ccaccctgcg acaactggat gctgcacgtc gccatcgagc agatccagcc gggcgacatt 240
ctcgttctcg gcacgacctc tccgtccgat gccggctatt tcggtgatct gctggcgact 300
tcggccaagg cgcgcggttg cgtcgggttg gtcatcgatg ccggcgtacg cgatatccgc 3 60
gacctgacag cgatgcagtt tccggtctgg tccaaggccg tttcggccca gggcacgatc 420
aaggagacgc tgggttcggt caacgtcccc gtcgtctgcg ccggtgctct ggtcaatccc 480
ggcgacgtcg tcgtggccga tgacgacggt gtctgcgtgg tgcgccgcga ggaagccgcg 540
gaaacgctgg aaaaggcccg ggcgcggatc gccaatgagg aggaaaagcg ccagcgcttt 600
gccgctggcg aactcgggct cgacatctac aagatgcgcg aacgcctcgc tgccctgggg 660
ctcacctatg tctga 675
<210> 54
<211> 224<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (21)... (173)
<223> Demetilmenaguinone metiltransferase<400> 54
Met Lys Pro Val Val Val Gln Thr Ile Glu Arg Ala Asp Arg Ala Ile1 5 10 15
Ile Glu Gly Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln20 25 30
Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly35 40 45
Ala Ala Val Ala Ala Ser Ala Val Thr Ile Leu Ser Pro Pro Cys Asp50 55 60
Asn Trp Met Leu His Val Ala Ile Glu Gln Ile Gln Pro Gly Asp Ile65 70 75 80
Leu Val Leu Gly Thr Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp85 90 95
Leu Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys Val Gly Leu Val Ile100 105 110
Asp Ala Gly Val Arg Asp Ile Arg Asp Leu Thr Ala Met Gln Phe Pro115 120 125
Val Trp Ser Lys Ala Val Ser Ala Gln Gly Thr Ile Lys Glu Thr Leu130 135 140
Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro145 150 155 160
Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg165 170 175
Glu Glu Ala Ala Glu Thr Leu Glu Lys Ala Arg Ala Arg Ile Ala Asn
180 185 190
Glu Glu Glu Lys Arg Gln Arg Phe Ala Ala Gly Glu Leu Gly Leu Asp195 200 205
Ile Tyr Lys Met Arg Glu Arg Leu Ala Ala Leu Gly Leu Thr Tyr Val210 215 220
<210> 55<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 55
atgaatgatc cggtggtggt ccggcaagtg gagcagccgc cagccgacgc cgttgtcgca 60ttggagaagt gtggtgtgac gaccgtgcat gaagctcagg gacgttgtgg tctccttgcc 120tcctacatgc gtccgattta ctcgggagca agcatcgccg gttccgctgt gactgtctct 180ctgcctcctg gcgacaacct catgatccac gtcgccgtcg aggtttgcgg tccgggaaac 240atcctggtcg tttcaccaac gtcgccttgc accgatggct acttcggaga gctgttggcg 300
acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggctg ccgcgacgtc 360
cggtcgttaa ccgagatgaa atttcctgtc tggagccgcg gcatcagctc gcaagggaca 420
gtcaaagcca cgctcggatc tgtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480
gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540
caagaggtcg ccgccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600
cttgctcgtg gagaactcgg actggatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggcctaaagt atctgtga 678
<210> 56
<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaguinone metiltransferase<400> 56
20 Met Asn Asp Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Val Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser25 35 40 45
Gly Ala Ser Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Gly Ile Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser Val Asn Val Ala Val Thr Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys165 170 175
Arg Ala Gln Ala Gln Glu Val Ala Ala Ala Ala Gln Gln Arg Val Arg180 185 190
Lys Glu Asp Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr
210 215 220
Leu225
<210> 57<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 57
atgaatgatc cggtggtagt ccgagaggtg gagcagccac cagcggatgc ggttgtcaca 60tSggagaagt gcggagtgac aactgtgcat gaggcgcagg gacgttgtgg ccttctcgcc 120cactacatgc gtccgattta tcctggagcc accatcgccg gttccgctgt cactgtctct 180ttgccgcctg gcgacaacct catgatccac gttgcggtcg aggtttgtcg tccgggaaac 240atcctggtcg tttcaccgac gtcgccttgc accgatggct acttcggaga gctgttggcg 300acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggctg ccgcgacgtc 360cggtcgttga ccgagatgaa atttcctgtc tggagccgcg gcatcagctc gcaagggacg 420gtcaaagcca cgctcggatc tgtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540
caagaggtcg ccgccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600
cttgctcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggcctaaagt atctgtga 678
<210> 58
<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaguinone metiltransferase
<400> 58
Met Asn Asp Pro Val Val Val Arg Glu Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Val Thr Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Thr Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asn
65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Gly Ile Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser Val Asn Val Ala Val Thr Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys165 170 175
Arg Ala Gln Ala Gln Glu Val Ala Ala Ala Ala Gln Gln Arg Val Arg
180 185 190
Lys Glu Asp Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225<210> 59<211> 678<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 59
atgaatgatc cggtggtagt ccgagaggtg gagcagccac cagcggatgc ggttgtcaca 60
ttggagaagt gtggagtgac aaccgtgcat gaggcacagg gacgttgtgg ccttctcgcg 120
cactàcatgc gtccgattta cccgggggca accatcgccg gttccgctgt cactgtctct 180
ttgccgcctg gcgacaacct catgatccac gtcgccgtcg aggtttgcgg tccgggaaac 240
atcctggtcg tttcaccgac gtcgccttgc accgatggct acttcggaga gctgttggcg 300
acatctctcc gtgcccacgg tgtaagaggg ctggtgatcg acgccggatg ccgtgatgtc 360
cggtcgttga ccgagatgaa atttcctgtc tggagccgcg cgatcagctc gcaagggaca 420
gtcaaagcca cgctcgggtc ggtgaacgtg gcggtcactt gcgcgggtgc actggtcgaa 480
gctggcgatg taatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgcgcgggcg 540
caagaggtcg cggccgcggc gcaacaacgg gttcgcaaag aagacgtaac tcgagagcga 600
cttgctcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggcctaaagt atctgtga · 678<210> 60<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 60
Met Asn Asp Pro Val Val Val Arg Glu Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Val Thr Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Thr Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Ala Val Thr Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val LysArg Ala Arg Ala Gln Glu Val Ala Ala Ala Ala Gln Gln Arg Val Arg
Lys Glu Asp Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr
Leu225
<210> 61<211> 675<212> DNA<213> desconhecido<220>
<400> 61
atgagcggcg tggttgtgcg ggaggtcgcc cgcccggcgc ccgatctcgt ggcctcgctc 60
gaagaggcgg gtgtctcaac cgtccacgaa gcacagggac gccggggact gctcgccacc 120
tacatgcgtc cgatctacgc cggagccacg ctcgcgggac cggcagtcac cgtcctcgtc 180
ccccccggcg acaacctgat gattcacgta gccgtggagg tgtgccgccc gggtgacgtg 240
ctggtcgtcg ccgtcacgtc gccgtgcacc gacggttact tcggcgagct gctggcgacg 300
tcggttcgcg cgcgcggcgt caaggggctc gtcatcgatg caggctgccg ggacgtgcgg 3 60
gcgctcaccg agatgcggtt tccggtgtgg agccgggcgg tcagcgcgca gggcaccgtc 420
aaggccacgc tgggctccgt gagcgttccg gtcgtttgcg ccggcgcgct gatcgaggcc 480
ggcgacgtcg tcgtgggcga cgacgacgga gtggttgtcg tgaaacggag cgaggccgat 540
gcggtcgtga gtgcttcgcg ccagcggctc ctcaaggaag aggggacgcg tcagcgcctg 600
gcaagcggtg aactcggtct ggacatctac tcgctgcgca aaacgctttc cgacctgggg 660
ctgaagtacc ggtaa 675<210> 62<211> 224
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (21)... (173)
<223> Demetilmenaguinone metiltransferase<400> 62
Met Ser Gly Val Val Val Arg Glu Val Ala Arg Pro Ala Pro Asp Leu1 5 10 15
Val Ala Ser Leu Glu Glu Ala Gly Val Ser Thr Val His Glu Ala Gln20 25 30
Gly Arg Arg Gly Leu Leu Ala Thr Tyr Met Arg Pro Ile Tyr Ala Gly
35 40 45
Ala Thr Leu Ala Gly Pro Ala Val Thr Val Leu Val Pro Pro Gly Asp
50 55 60
Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp Val65 70 75 80
Leu Val Val Ala Val Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly Glu85 90 95
Leu Leu Ala Thr Ser Val Arg Ala Arg Gly Val Lys Gly Leu Val Ile
100 105 110
Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe Pro
115 120 125
Val Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Ala Thr Leu
130 135 140
Gly Ser Val Ser Val Pro Val Val Cys Ala Gly Ala Leu Ile Glu Ala145 150 155 160
Gly Asp Val Val Val Gly Asp Asp Asp Gly Val Val Val Val Lys Arg165 170 175
Ser Glu Ala Asp Ala Val Val Ser Ala Ser Arg Gln Arg Leu Leu Lys180 185 190
Glu Glu Gly Thr Arg Gln Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp195 200 205
Ile Tyr Ser Leu Arg Lys Thr Leu Ser Asp Leu Gly Leu Lys Tyr Arg
210 215 220
<210> 63<211> 693
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 63
atgaccggca tcgtcgtcca gtggttcgag cgcacgccgc ttgccgatgt cgcggcgctt 60gccgagttcg gcgtggctac catccacgag gcgcaaggcc gcaaggggct gctcgcgtcc 120tacatgcggc cgatctatgc gggtgctgcc gcggcgggca atgccgtcac agtatcggtg 180cctcccggtg acaactggat gatccatgtg gcggtcgagg tgtgccgcga gggcgacgtg 240ctggtggtcg ccccgacctc gccctgcgac aacggctatt tcggtgagct gctggcctgc 3 00tcgctcaagg cgcgcggcgt gcgcgggctc gtcatcgagg ccggctgccg cgacgtgaag 360ccactctccg acatgaagtt tcccgtgtgg tcgcgcgccg tttccgccca gggcaccgtc 420aaggagagcc tgggcgacgt caacctgccg ctcgtgatcg ccagccagac cgtgcatcct 480ggcgacgtgg tggtcgccga tgacgacggt gtcgtcatcg tcgctcgcgg cgaggtgcgc 540gccgtcaccg ccaagtcgcg cgagcgcgag gacaaggagg ccgcaagccg cgagaagctg 600agcaaggggg aggtgggcct cgacatctac ggcatgcggg ccaagctgaa ggagaagggc 660attcgctacg tcgcgaatcc cgacaaactc tga 693
<210> 64<211> 230<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (21)... (173)
<223> Demetilmenaquinone metiltransferase<400> 64
Met Thr Gly Ile Val Val Gln Trp Phe Glu Arg Thr Pro Leu Ala Asp1 5 10 15
Val Ala Ala Leu Ala Glu Phe Gly Val Ala Thr Ile His Glu Ala Gln
20 25 30
Gly Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly
35 40 45
Ala Ala Ala Ala Gly Asn Ala Val Thr Val Ser Val Pro Pro Gly Asp
50 55 60
Asn Trp Met Ile His Val Ala Val Glu Val Cys Arg Glu Gly Asp Val65 70 75 80
Leu Val Val Ala Pro Thr Ser Pro Cys Asp Asn Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Cys Ser Leu Lys Ala Arg Gly Val Arg Gly Leu Val Ile
100 105 110
Glu Ala Gly Cys Arg Asp Val Lys Pro Leu Ser Asp Met Lys Phe Pro
115 120 125
Val Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Ser Leu
130 135 140
Gly Asp Val Asn Leu Pro Leu Val Ile Ala Ser Gln Thr Val His Pro145 150 155 160
Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Ile Val Ala Arg
165 170 175
Gly Glu Val Arg Ala Val Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys
180 185 190
Glu Ala Ala Ser Arg Glu Lys Leu Ser Lys Gly Glu Val Gly Leu Asp
195 200 205
Ile Tyr Gly Met Arg Ala Lys Leu Lys Glu Lys Gly Ile Arg Tyr Val
210 215 220
Ala Asn Pro Asp Lys Leu225 230
<210> 65<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 65
atgagcatcg tcgtcacgaa gatcgagcgc gccggcgcgg cggccgtcgc cgcgctgcgc 60acaagtggcg ttgccacagt gcacgaggcg caagggcgca cgggcttgat gcgtccctac 120atgcggccga tctacccggg cgcgcgcatc gccggcacgg cgatcaccgt ctccctgcct 180ccgggcgaca actggatgat ccacgtcgcg gtcgagcagt gccgcgaggg cgatatcctc 240gtggtggcgc cgaccagccc gagcgacgac ggctatttcg gcgacctgct tggcaattcg 300ctcgtcgcac gcggcgtcag gggcctggtg atcgaggccg gtgtgcgtga cgtgcgcgac 3 60ctcacggaga tgcgctttcc ggtctggtcg aagacgattt cggcgcaagg cacggtcaag 420gagacgttgg gctcggtcaa cgtgccgatc gtctgcgcgg gtgctgccgt gaaccccgga 480gacgtgatcg tggccgacga cgacggcgtc tgcgtcgtgc cgcgccagac ggtcacagag 540gtcgtcgagg cggcccacgc ccgcgaggcc aaggaggccg aggtccggca gcggctcatc 600gcgggcgagc ttggcctcga cgtctacggc atgcgcgaga agctggcggc caagggcctc 660aaatatgtct ga 672
<210> 66<211> 223
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> SINAL<222> (1)...(27)<220>
<221> DOMÍNIO
<222> (20)... (172)
<223> Demetilmenacpiinone metiltransferase<400> 66Met Ser Ile Val Val Thr Lys Ile Glu Arg Ala Gly Ala Ala Ala Val1 5 10 15
Ala Ala Leu Arg Thr Ser Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Ile Ala Gly Thr Ala Ile Thr Val Ser Leu Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Gly Asn Ser Leu Val Ala Arg Gly Val Arg Gly Leu Val Ile Glu
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Arg Phe Pro Val
115 120 125
Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Ala Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Gln
165 170 175
Thr Val Thr Glu Val Val Glu Ala Ala His Ala Arg Glu Ala Lys Glu
180 185 190
Ala Glu Val Arg Gln Arg Leu Ile Ala Gly Glu Leu Gly Leu Asp Val
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val
210 215 220
<210> 67<211> 672<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<400> 67
atgagcgttg tcgtcacgaa gatcgagcgc gccggcgccg aagctgttgt agcgctggcc 60gaaagtggtg tgtcgaccgt gcacgaggcg cagggccgga ccgggctgat gcggccttat 120atgcggccga tctacgcggg cgcgcggatc gccgggacgg cgatcaccgt gtcgctgcag 180ccgggcgaca actggatgat ccatgtggcg gtcgagcaat gccggcaggg cgacatcctc 240gtcgtggcgc cgaccagccc gagcgacgac gggtatttcg gcgacctgct cggcaattcg 300cttgtcgcgc ggggcgtcag ggggctggtg atcgaggccg gcgtgcgcga cgtgcgcgat 360ctgaccgcga tgggttttcc ggtatggtcg aagacagtct cggcgcaagg caccgtgaag 420gagacgctcg gctcggtgaa cgtgcccgtc gtctgcgcgg gggcgaccgc aaaccccggt 480gacgtgatcg tggccgatga cgacggcgtc tgcgtggtgc cgcgcgagac ggccgcggca 540gtggtcgagg cggcccatgc gcgggaggtg aaggaggcag aggtacggcg gcggctgatc 600tccggcgagc tcggcctaga catctacggc atgcgcgaca agctcgctgc caagggcctc 660aaatatgtct ga 672
<210> 68<211> 223<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 68
Met Ser Val Val Val Thr Lys Ile Glu Arg Ala Gly Ala Glu Ala Val1 5 10 15
Val Ala Leu Ala Glu Ser Gly Val Ser Thr Val His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala35 40 45Arg Ile Ala Gly Thr Ala Ile Thr Val Ser Leu Gln Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Arg Gln Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Gly Asn Ser Leu Val Ala Arg Gly Val Arg Gly Leu Val Ile Glu
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Ala Met Gly Phe Pro Val
115 120 125
Trp Ser Lys Thr Val Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Thr Ala Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Glu
165 170 175
Thr Ala Ala Ala Val Val Glu Ala Ala His Ala Arg Glu Val Lys Glu
180 185 190
Ala Glu Val Arg Arg Arg Leu Ile Ser Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Asp Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val
210 215 220
<210> 69<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 69
atgggcaccg tggttcaaaa cattgcgcgc gctgaccact ccgtcatcga ccgccttgctgcctgcggtg tcgccaccgt tcacgaggcc cagggccgca ccggattgct cgccagttacatgcggccga tctatgcggg cgcgcggctg gccgctagcg ccgtcaccat ctccgccccaccgggcgaca actggatgat ccacgtcgcc atcgagcaac tcaaggcagg cgacatcatg , 240
gtgctggccc cgaccagccc ctgcgaggac ggttatttcg gcgacctgct cgccacttcc 300
gcccaagcgc gagggtgcaa gggcctaatc atcgacgccg gcgtgcgcga cgttgcagac 360
ctgaccgcga tgggatttcc cgtgtggtcc aaggccatct tcgcgcaggg tacggtcaag 420
gcgagtttgg gttcagtcaa tgtgtcggtg gtctgtgcta gtgccttgat caatccgggc 480
gacattgtcg tggccgacga tgatggtgtg tgtgtcgtac ggcgcgagga cgcggtctcc 540
gtggcggcga aggccgaagc gcgggtggca gccgaagagg acaagcgccg gcgcctcgca 600
gggggcgaac tgggacttga tatttatggg atgcgcgaca cgctcgcggc caaggggcta 660
aaatatgtct ga 672
<210> 70
<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<220>
<221> SITE
<222> (149)...(152)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 70
Met Gly Thr Val Val Gln Asn Ile Ala Arg Ala Asp His Ser Val Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60Trp Met Ile His Val Ala Ile Glu Gln Leu Lys Ala Gly Asp Ile Met65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gly Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Ala Ser Leu Gly130 135 140
Ser Val Asn Val Ser Val Val Cys Ala Ser Ala Leu Ile Asn Pro Gly145 150 155 160
Asp Ile Val Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu165 170 175
Asp Ala Val Ser Val Ala Ala Lys Ala Glu Ala Arg Val Ala Ala Glu180 185 190
Glu Asp Lys Arg Arg Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Asp Thr Leu Ala Ala Lys Gly Leu Lys Tyr Val
210 215 220
<210> 71
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 71
atgagcgtcg tcgtccagac catcgcgcgc gccgatcaga cggtcatcga ccgcctcggc 60
gcctgcggcg tcgccaccgt acatgaggcg cagggccgca aggggctact cgcgagctac 120
atgcggccca tctattccgg cgcgcggctg gctgcgagcg cggtgacaat ttcggcgccg 180
cccggcgaca actggatgat ccacgtcgcc atcgagcagc tcaaggccgg cgacatcatg 240
- gtgctcgctc ccaccagccc ctgcgaagac ggctatttcg gcgacctgct cgcgacgtcg 300gctgtggcgc gcggctgccg cgggctcgtc atcgaggccg gcgtgcgcga tgtggccgat 360ctcaccgcga tgaaattccc ggtatggtcg aaagccatct ccgctcaggg caccgtcaag 420gagacgctgg gctcggtgaa cgtgccgatc gtatgcgccg gcacgctggt cgagccgggc 480gacgtcatcg tcgccgacga tgacggcgtc tgcgtcgtgc gccgcgaaga ggcggaggcc 540gtggcgcaga aggccgaggc ccgcatcgcc accgaagagg acaagcgcaa acgcctggcg 600ggcggcgagc tcggtctcga catctacaag atgcgcgagc ggctggccga aaaaggactc 660aaatatgtct ag 672
<210> 72<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<400> 72
Met Ser Val Val Val Gln Thr Ile Ala Arg Ala Asp Gln Thr Val Ile
1 5 10 15
Asp Arg Leu Gly Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met Ile His Val Ala Ile Glu Gln Leu Lys Ala Gly Asp Ile Met65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Val Ala Arg Gly Cys Arg Gly Leu Val Ile Glu100 105 110Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Lys Phe Pro Val
Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
Glu Ala Glu Ala Val Ala Gln Lys Ala Glu Ala Arg Ile Ala Thr Glu
Glu Asp Lys Arg Lys Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp Ile
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val
<210> 73
<211> 690<212> DNA
<213> desconhecido<220>
<400> 73
atgagcgtgg tcatcaccaa tatccagcgc cccgatcccg agcacaccaa agcgctcgcc 60
gccttcggcg ttgcgactat tcacgaggcg cagggccgca ccggactgat gcagtccttc 120
atgcgaccga tctatgccgg cgcgcgcgcc gccggcaccg ccgtcaccgt gtcgctgccc 180
cccgccgaca actggatgat ccacgtcgcg gtggagcaat gccaggcagg cgacattctc 240
gtcgtcgcgc cgacctcgcc ctccgatgtc ggatatttcg gcgagctcct cgccacctcg 300
ctcgccgcac ggggcgtggt cggcctcatc atcgaaggcg gctgccgcga cgtcgcggca 360
ttgaccgaga tgggtttccc ggtctggtcg cgcgccgtat cggcgcaggg caccgtgaag 420
gagacgctcg gctccgtgaa cataccgatc gtctgcgccg gcgcgcatat tcatcccggc 480
gacttcgtcg ccgccgacga tgacggcgtg gtcgtcgtgc cccgcgccca cgtggcggaa 540
atcgccgccg cctccctcgc gcgcgaggac aaggaggccg ccgttcgcga gcgcctgaaa 600
tccggtgagc tcggcctcga tatttacggc atgcgcccgc gcctcaagga gaaaggcctc 660gtctggcgcg aaacgccgga gaagaaatag<210> 74<211> 229<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 74
Met Ser Val Val Ile Thr Asn Ile Gln Arg Pro Asp Pro Glu His Thr1 5 10 15
Lys Ala Leu Ala Ala Phe Gly Val Ala Thr Ile His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Met Gln Ser Phe Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Ala Ala Gly Thr Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Gln Ala Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Val Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Ala Ala Arg Gly Val Val Gly Leu Ile Ile Glu
100 105 110
Gly Gly Cys Arg Asp Val Ala Ala Leu Thr Glu Met Gly Phe Pro Val
115 120 125
Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Ile Pro Ile Val Cys Ala Gly Ala His Ile His Pro Gly145 150 155 160Asp Phe Val Ala Ala Asp Asp Asp Gly Val Val Val Val Pro Arg Ala165 170 175
His Val Ala Glu Ile Ala Ala Ala Ser Leu Ala Arg Glu Asp Lys Glu180 185 190
Ala Ala Val Arg Glu Arg Leu Lys Ser Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Gly Met Arg Pro Arg Leu Lys Glu Lys Gly Leu Val Trp Arg Glu210 215 220
Thr Pro Glu Lys Lys225
<210> 75
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<400> 75
atgggagtcg tcgttcagaa tatcgcgcgg gccgagcagg agatcatcga ccggctggcc 60
gcctgcggcg ttgccaccgt tcacgaagcg caagggcgca aagggctgct ggcaagctat 120
atgcggccga tctatcaggg tgcgcggctc gccgcgagcg ccgtcacaat ctcggcgccg 180
ccgggcgaca actggatggt tcatgtcgcc atcgaacaga taagggccgg cgacatcctg 240
ctgcttgcgc ccacaagccc gtgcgaggac ggctattttg gcgatctcct cgcaacgtcc 300
gcgcaggcaa gggggtgccg cgggctggtc atcgacgctg gtgtgcgcga catcgccgat 360
ctgaaggcga tgaattttcc ggtctggtcg aaggccgtgt tcgcgcaggg aacgatcaag 420
gagacactcg gatcggtcaa tgtgcccgtg gtctgtgccg gagcgctggt caatccggga 480
gacgtgattg tggcggacga cgacggcgtc tgcgtcgtgc gccgggagga ggccgaaaac 540
gtagtccaga aagccgaggc gcgggtcagc gcggaagtgg ccaagcgcgc caggctcgca 600
gccggcgaac tcggcctcga catctacagg atgcgcgaaa ggctggcgga gaaggggctg 660
aaatatgtct ga 672
<210> 76<211> 223<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<400> 76
Met Gly Val Val Val Gln Asn Ile Ala Arg Ala Glu Gln Glu Ile Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 . 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gln Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Val His Val Ala Ile Glu Gln Ile Arg Ala Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Arg Gly Leu Val Ile Asp
100 105 110
Ala Gly Val Arg Asp Ile Ala Asp Leu Lys Ala Met Asn Phe Pro Val
115 120 125
Trp Ser Lys Ala Val Phe Ala Gln Gly Thr Ile Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Ala Glu Asn Val Val Gln Lys Ala Glu Ala Arg Val Ser Ala Glu
180
185
190Val Ala Lys Arg Ala Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Arg Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val210 215 220
<210> 77<211> 681<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 77
gtgaccgatc cggttgtcgc tcgacagatc gacaggccgc ccgcgaatct ggtcgccgat 60ctgcagcgct acggcgtctc caccgtccac gaggcgcaag ggcgtcgcgg cctgctcgcg 120tcgtacatgc ggccgatcta tgccggcgcg ctcattgccg gtcccgcgat cacggtcctg 180gtaccgcctg gcgacaactt gatgatccac gtcgccgtgg aagtgtgcca gcctggcgac 240gttctcgtcg tcgccacgac gtcgccgtgc accgacggct atttcggcga gctgctggcg 300acgtcgctgc gggcccgcgg cgtggcgggg ctcgtgatcg atgcgggctg ccgggatgtt 360cgcgcgctga cggaaatgcg atttcccgtc tggagccgcg cgatcagcgc gcagggaacc 420gtcaaagcca cgctgggctc ggtgaacgcg gcggtggtgt gcgccgggac gtcggtgaga 480gccggggatc tcatcgtggc cgacgatgac ggggtggtgg cggtgcggcg ggaggaagtc 540gtcgccgtga cgcaggcggc cgaacagcgc gttcgcaagg aagagggcac gcgcgcacgg 600ctcgcgcagg gcgagctcgg cctggacatt tacggcttgc gccagaagct gtcggatcta 660ggcttgaagt catcgtcgtg a 681
<210> 78
<211> 226
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22) . . . (174)<223> Demetilmenaguinone metiltransferase<400> 78
Met Thr Asp Pro Val Val Ala Arg Gln Ile Asp Arg Pro Pro Ala Asn1 5 10 15
Leu Val Ala Asp Leu Gln Arg Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Leu Ile Ala Gly Pro Ala Ile Thr Val Leu Val Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Thr Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Ala Ala Val Val Cys Ala Gly Thr Ser Val Arg145 150 155 160
Ala Gly Asp Leu Ile Val Ala Asp Asp Asp Gly Val Val Ala Val Arg
165 170 175
Arg Glu Glu Val Val Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly Leu Lys Ser
210 215 220
Ser Ser225<210> 79
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 79
atgagcgagc cggtcgtcgt tcggcagatc gagaggccct cttcggccgc gatcgccgat 60ctccggcggt acggcgtctc gacggttcac gaagcgcagg gccgccgcgg actgctcgcg 120tccggcctgc ggccgatcta tgcgaccgcg ctcatggcgg gccctgcgat cacggtgctg 180gtcgcaccgg gcgacaacct gatgatccac gtcgccgtcg aggtctgcca gcccggggat 240gtgctcgtgg tcacgccgac gtcaccgtgc acggacggct atttcggcga gctgctggcc 300acgtcgctgc gggcgcgagg cgttgcgggc ctcgtcatcg acgccggctg ccgcgacatt 360cgcgcgctga cggagatgcg gtttcccgta tggagtcgcg cgatcagcgc gcagggcacg 420gtcaaagcca cgctcggctc cgtgaatgtc cccgtcgtct gcgccggcgc gcttgtcgaa 480gcgggcgacg tcatcgtcgc cgacgatgac ggggtcgtgg tggtgaagcg gggcgaagtc 540gacgtcgtca tccaggcggc ggagcagcgc gtgcgcaagg aagaagtcac gcgggcccgg 600ctggcgcagg gcgagctcgg tctggacatc tacggcctgc gcaagaagat tgcggacctg 660ggcttgaagt cgtcgtga 678
<210> 80<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaguinone metiltransferase
<400> 80
Met Ser Glu Pro Val Val Val Arg Gln Ile Glu Arg Pro Ser Ser Ala1 5 10 15Ala Ile Ala Asp Leu Arg Arg Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Gly Leu Arg Pro Ile Tyr Ala
35 40 45
Thr Ala Leu Met Ala Gly Pro Ala Ile Thr Val Leu Val Ala Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp65 70 75 80
Val Leu Val Val Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Ile Arg Ala Leu Thr Glu Met Arg Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Gly Glu Val Asp Val Val Ile Gln Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Glu Val Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Ile Ala Asp Leu Gly Leu Lys Ser210 215 220
Ser
225
<210> 81
<211> 678
<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 81
atgaacgagc cgaccgttgt tcgagcgatc gacaggccgc cggcggatgt ggtcgcggcg 60ctccagcgct acggcgtgtc gaccgtgcat gaagcacaag ggagacgcgg cctcgtagcg 120tcctgcatgc ggccgatcta caccggcgct ttggtcgccg gtcctgccgt aaccgtctcg 180ctcccgccgg gcgacaacct catgattcac gtcgctgtcg aagcctgcca ggcgggcgac 240gtgcttgtcg tggtgccgac ctccccgtgc acggacgggt atttcggtga gttactggcg 300acgtcgctgc acgcacgcgg agtcgtggct ctcgtcatcg atgccggctg ccgcgacgtg 360cgcgctctgt cggagatgcg atttcctgtc tggagccgcg cgatcagcgc tcagggcacg 420gtcaaagcca cgttgggatc ggtgaacgtt cccgtggtgt gcgcgggagc gcccgtggag 480cccggcgatg tgatcgtcgc cgacgacgat ggggtggtgg ttgtgaagcg cagcgaggtg 540gagggggtgg cgcaggcgtc ggagcagcga gtcctgaagg aggaggcgac gcgcgagcgg 600ttggcgcgcg gcgagctggg cctcgacatc tacgggctgc ggaaaaaggt gtcggacctc 660ggcctgaaat attcgtga 678
<210> 82<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)<223> Demetilmenaquinone metiltransferase<400> 82
Met Asn Glu Pro Thr Val Val Arg Ala Ile Asp Arg Pro Pro Ala Asp1 5 10 15
Val Val Ala Ala Leu Gln Arg Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Arg Gly Leu Val Ala Ser Cys Met Arg Pro Ile Tyr Thr35 40 45Gly Ala Leu Val Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Ala Cys Gln Ala Gly Asp65 70 75 80
Val Leu Val Val Val Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu His Ala Arg Gly Val Val Ala Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ser Glu Met Arg Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Pro Val Glu145 150 155 160
Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ser Glu Val Glu Gly Val Ala Gln Ala Ser Glu Gln Arg Val Leu
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Val Ser Asp Leu Gly Leu Lys Tyr210 215 220
Ser225
<210> 83
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 83
atgagcgagc cggtcgtcgt tcggcagatc gagaggccct cttcggccgc gatcgccgatctccggcggt acggcgtctc gacggttcac gaagcgcagg gccgccgcgg actgctcgcg 120
tccggcctgc ggccgatcta tgcgagcgcg ctcatggtgg gccctgcgat cacggtgctg 180
gtcgcaccgg gcgacaacct gatgatccac gtcgccgtcg aggtctgcca gcccggggat 240
gtgctcgtgg tcacgccgac gtcaccgtgc acggacggct atttcggcga gctgctggcc 300
acgtcgctgc gggcgcgagg cgttgcgggc ctcgtcatcg acgccggctg ccgcgacatt 360
cgcgcgctga cggagatgcg gtttcccgta tggagtcgcg cgatcagcgc gcagggcacg 420
gtcaaagcca cgctcggctc cgtgaatgtc cccgtcgtct gcgccggcgc gctcgtcgaa 480
gcgggcgacg tcatcgtcgc cgacgatgac ggggtcgtgg tggtgaagcg gggcgaagtc 540
gacgtcgtca tccaggcggc ggagcagcgc gtgcgcaagg aagaagtcac gcgggcgcgg 600
ctggcgcagg gcgagctcgg tctggacatc tacggcctgc gcaagaagat tgcggacctg 660
ggcttgaagt cgttgtga 678<210> 84<211> 225<212> PRT
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 84
Met Ser Glu Pro Val Val Val Arg Gln Ile Glu Arg Pro Ser Ser Ala1 5 10 15
Ala Ile Ala Asp Leu Arg Arg Tyr Gly Val Ser Thr Val His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Gly Leu Arg Pro Ile Tyr Ala
35 40 45
Ser Ala Leu Met Val Gly Pro Ala Ile Thr Val Leu Val Ala Pro GlyVal Leu Val Val Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp Ile Arg Ala Leu Thr Glu Met Arg Phe115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Gly Glu Val Asp Val Val Ile Gln Ala Ala Glu Gln Arg Val Arg180 185 190
Lys Glu Glu Val Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Ile Ala Asp Leu Gly Leu Lys Ser210 215 220
Leu
225
<210> 85
<211> 699
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 85
atgaccggca ttgtcgtcga gaccatcgag cgcgcgtcgc tcgccgacat cgccgcgttg 60
gccgaattcg gcgtcgccac catccacgag gcgcagggcc gcatcggcct gcttgcctcc 120
accatgcgcc cgatctacgc aggcgcggcg gccgccggca atgccgtcac cgtgtcggtg 180
ccgcccggcg acaactggat gatccacgtc gccgtcgagc agtgccgcga aggcgatatt 240
ctcgtcgtcg cccccaccag cccgaacgac aacggctact ttggcgaact gctggcctgc 300tcgctcaagt cgcgcggcgt gcgcggcctc atcatcgagg ccggctgccg cgacgtgaaa 360ccgctcaccg agatgaagtt ccccgtctgg tcccgcgccg tctcctccca gggcacggtg 420aaggaaagcc tcggcgacgt gaacctgccg ctctcgatcg ccggccagct cgtcaacccc 480ggcgatgtca tcgtcgccga tgacgacggc gtggtcgtgg tctcccgcaa tgaagtcagg 540agcgtcaccg ccaagtcccg cgagcgcgaa gacaaggagg ccaagaaccg cgtgcagctc 600caagccggcc agctcggcat cgacatctac ggcatgcgcg acaagctcaa ggccaagggc 660ctccgctacg tcaaatccgc ggcggagttg aagaagtag 699
<210> 86<211> 232<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO
<222> (21)...(173)
<223> Demetilmenaquinone metiltransferase<400» 86
Met Thr Gly Ile Val Val Glu Thr Ile Glu Arg Ala Ser Leu Ala Asp
1 5 10 15
Ile Ala Ala Leu Ala Glu Phe Gly Val Ala Thr Ile His Glu Ala Gln
20 25 30
Gly Arg Ile Gly Leu Leu Ala Ser Thr Met Arg Pro Ile Tyr Ala Gly35 40 45
Ala Ala Ala Ala Gly Asn Ala Val Thr Val Ser Val Pro Pro Gly Asp
50 55 60
Asn Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile
65 70 75 80
Leu Val Val Ala Pro Thr Ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Cys Ser Leu Lys Ser Arg Gly Val Arg Gly Leu Ile Ile100 105 110Glu Ala Gly Cys Arg Asp Val Lys Pro Leu Thr Glu Met Lys Phe Pro
Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Glu Ser Leu
Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Ser Arg
Asn Glu Val Arg Ser Val Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys
Glu Ala Lys Asn Arg Val Gln Leu Gln Ala Gly Gln Leu Gly Ile Asp
Ile Tyr Gly Met Arg Asp Lys Leu Lys Ala Lys Gly Leu Arg Tyr Val
<210> 87<211si 672<212> DNA
<220>
<223> Proteína obtida por amostra do ambiente<400> 87
atgggcattg tcgttcagaa cattcagcgg gcggagcagt ccgtcatcga tcgtctcgct 60
gcttgcggag ttgcgaccgt acatgaagcg cagggccgca aggggctgct cgccagctac 120
atgcggccga tttatccggg cgcgcggatc gcggcgagtg ccgtgacaat ttccgcgcct 180
ccgggcgata actggatgct gcatgtggcg atcgagcaga tcaaggcggg cgatatccta 240
ctgcttgcgc cgaccagtcc ctgcgaggac ggttatttcg gcgatctctt ggcgacgtct 300
gccatggcac gcggctgccg cgggttggtg atcgatgccg gcgtgcgcga tgtcgccgat 360
ctcaaggcga tgaattttcc cgtttggtcg aagacgatct ctgcacaggg gacggtcaag 420
gagacggtgg gctcggtcaa tattcccgtc gtctgcgcca gtgcgctcgt caatcctggc 480
gatgtgatcg ttgccgatga tgatggcgtc tgcgtcgtac ggcgggagga agctgccgag 540gtcgcggata aggccgagca gcgggtcgcg gcagaagagg acaagcgccg gcgactggcc 600gcgggtgaac tcgggctcga tatctacaag atgcgcgagc ggctggcgga gaaggggctg 660aaatatgtct ag 672
<210> 88<211> 223
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<400> 88
Met Gly Ile Val Val Gln Asn Ile Gln Arg Ala Glu Gln Ser Val Ile15 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Leu His Val Ala Ile Glu Gln Ile Lys Ala Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Val Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Lys Ala Met Asn Phe Pro Val
115 120 125
Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Val Gly130 135 140Ser Val Asn145
Asp Val Ile
Glu Ala Ala
Glu Asp Lys195
Tyr Lys Met210<210> 89<211> 696<212> DNA<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 89
atgaagcgcg gcgtggtggt gacccatatc gcgcgggcgg atgcggcgaa cgtggccgtg 60
ctgcgggagg caggcgttgc gaccgtccac gaggcgcaga gccggcttgg tcttctagcg 120
tgctacatgc ggccgatcta tccgggcgcg gccattgccg gaccggccgt cacggtgctc 180
gtgccgccgt cggacaactg gatgctgcat gtggcggtcg aacagtgccg cgcaggcgac 240
gtgctggtgg tggcgcccac gtctgcctgc gaggacgggt atttcgggga actgcttgcc 300
acgtcgctcg cgaagcgcgg cgtacagggc ctgatcatcg atgcgggctg ccgggatgtg 360
tgcgcgctca aggcaatgga ttttcccgtg tggtcgaagg ccgtctccgc gcagggcacg 420
gtcaaggaga cgctcggctc ggtcaatgtg ccggtcgtat gcgcgcagca gatcgtgcat 480
ccgggagacg tgatcgtggc cgatgacgac ggcatcgtcg tggcgccgct cgccaccgtc 540
gaggcggtag cgaaggccgc gcaggcgcgc ctggagaagg aagagaagac gcgtgcggtg 600
ctcgcaagcg gcacgctcgg cctcgactac tacgcgatgc gtgacaggct cgcggaaaga 660
ggcttgcgct acgtcgattc ggcctctgaa ctttga 696
<210> 90
<211> 231
<212> PRT
Ile Pro Val Val Cys Ala Ser Ala Leu Val Asn Pro Gly150 155 160
Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Val Ala Asp Lys Ala Glu Gln Arg Val Ala Ala Glu180 185 190
Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
200 205
Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val215 220<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 90
Met Lys Arg Gly Val Val Val Thr His Ile Ala Arg Ala Asp Ala Ala1 5 10 15
Asn Val Ala Val Leu Arg Glu Ala Gly Val Ala Thr Val His Glu Ala
20 25 30
Gln Ser Arg Leu Gly Leu Leu Ala Cys Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Leu Val Pro Pro Ser
50 55 60
Asp Asn Trp Met Leu His Val Ala Val Glu Gln Cys Arg Ala Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Ala Cys Glu Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Lys Arg Gly Val Gln Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Cys Ala Leu Lys Ala Met Asp Phe
115 120 125
Pro Val Trp Ser Lys Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gln Gln Ile Val His145 150 155 160
Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Ile Val Val Ala Pro
165 170 175
Leu Ala Thr Val Glu Ala Val Ala Lys Ala Ala Gln Ala Arg Leu Glu180 185 190Lys Glu Glu Lys Thr Arg Ala Val195 200
Asp Tyr Tyr Ala Met Arg Asp Arg210 215
Val Asp Ser Ala Ser Glu Leu225 230
<210> 91<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 91
atgaacaaac cggtggtggt ccggaaggtc gaacagccgc cacaagatgc ggtggcggct 60ctggagaaat atggcgtgtc cacggtgcac gaagcgcaag gccgttgcgg gctgctcgcc 120ccttacatgc gcccgatcta tgccggcgct tccatggccg ggcccgccgt caccgtctcc 180cttccgcccg gtgacaacct catgatccat gtcgcggtcg aagtgtgcca gcccggaaac 240attcfeggtcg tcgcccccac ttcaccttgt accgacgggt atttcggcga gttgctggct 300acttccttgc gcgcccacgg cgtgaaggca ctcataatcg atgccggatg ccgtgacgtg 360cgctccctca ccgaaatgaa gtttcccgtg tggagccgcg ccgtcagttc gcagggaaca 420gtgaagtcca cgctcggatc agtgaacgtg ggcgtagtgt gtgcgggcgc tttcatcgaa 480gcgggcgaca tcgtcgtcgc tgatgatgac ggagttgtcg tcgtgaagcg gactttcgcg 540cgcgacgtgg ttgaagcctg tgaacagagg gttcgcaagg aagaggcgac gcgggcacgg 600ctggcgcggg gcgaacttgg gctggacatc tacggattgc gctccaaggt ggcggaactc 660ggtctcaagt acatataa 678
<210> 92<211> 225<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
Leu Ala Ser Gly Thr Leu Gly Leu205
Leu Ala Glu Arg Gly Leu Arg Tyr220<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaguinone metiltransferase<400> 92
Met Asn Lys Pro Val Val Val Arg Lys Val Glu Gln Pro Pro Gln Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ser Met Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asn65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Ala Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr
130 135 140
Leu Gly Ser Val Asn Val Gly Val Val Cys Ala Gly Ala Phe Ile Glu145 150 155 160
Ala Gly Asp Ile Val Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Thr Phe Ala Arg Asp Val Val Glu Ala Cys Glu Gln Arg Val Arg
180 185 190
Lys Glu Glu Ala Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205 ,
Asp Ile Tyr Gly Leu Arg Ser Lys Val Ala Glu Leu Gly Leu Lys Tyr210 215 220<210> 93<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 93
atgaataaac cggtggtagt ccggcaagtg gagcagccac cagcggacgc ggttgcggcg 60ctggagaagt atggcgtcac caccgtgcat gaggctcagg gacgttgtgg cctgctcgcg 120cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgctgt caccgtagcc 180ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240atcctggtgg ttgcgccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300acctctctgc gtgctcgcgg tgtgaaagga cttgtgattg atgccggatg ccgtgacgtt 360cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaaca 420gtcaaggcca ccctcggatc ggtgaatgtg ccggtcatgt gcgcgggcgc gctcgtcgaa 480gctggcjgatg tcatcgtcgc cgatgatgat ggaattgtgg ttgtcaagcg cgcgcatgcg 540cacgaggtgg ccgcggcggc agaacaaagg gtgcgcaaag agaatataac ccgcgaacgg 600cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaaaat cgcgcaactg 660ggcctcaaat acctgtga 678
<210> 94<211> 225<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 94Met Asn Lys Pro Val VaX Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ala Ile Ser Gly Ser Ala Val Thr Val Ala Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr
1;30 135 140
Leu Gly Ser Val Asn Val Pro Val Met Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Ile Val Val Val Lys
165 170 175
Arg Ala His Ala His Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Ile Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 95<211> 639<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<400> 95
gtgagcgatc cgatcgccga cctgcgcggg tatggagtct cgacggttca cgaggcccag 60ggccggcgcg gtctgctggc gccttacatg cgtccgatct atgccggcgc ccttgtcgcc 120ggaccagccg tgacggttct ggtcccgccc ggcgacaacc tgatgatcca cgtcgccgtc 180gagcggtgct cgccgggcga catcctcgtc gtcgcgccga cgtcgccgtg cacggacggc 240tatttcggcg agctgctggc gacgtcgctg cgggcacgcg gtgtcgccgc actgatcatc 300gacgccggct gcagggacgt gcgagcgctc accgagatgc gcttcccggt gtggagccgc 360gccatcagcg cccaaggaac ggtgaaggcg acgctcggct cggtgaatgt gccagtggtc 420tgcgccggag ccatcgtcgg tcctggcgac gtcatggttg cggacgatga cggcgtggtc 480gtggtgagga aggacgaagt cgccgcggtg acgcaggcgg cggcgcagcg ggtccgcaaa 540gaagagggca cgcgggcgcg gctggccgcg ggcgagctcg gcctggacat ctacggcctc 600cggcagaagc tgtcggatct cggcctgaag tcgtcgtga 639
<210> 96<211è, 212<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (9)... (161)
<223> Demetilmenaquinone metiltransferase<400> 96
Met Ser Asp Pro Ile Ala Asp Leu Arg Gly Tyr Gly Val Ser Thr Val1 5 10 15
His Glu Ala Gln Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro20 25 30
Ile Tyr Ala Gly Ala Leu Val Ala Gly Pro Ala Val Thr Val Leu Val35 40 45
Pro Pro Gly Asp Asn Leu Met Ile His Val Ala Val Glu Arg Cys Ser
50 55 60
Pro Gly Asp Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly65 70 75 80
Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala
85 90 95
Ala Leu Ile Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu
100 105 110
Met Arg Phe Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val
115 120 125
Lys Ala Thr Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala
130 135 140
Ile Val Gly Pro Gly Asp Val Met Val Ala Asp Asp Asp Gly Val Val145 150 155 160
Val Val Arg Lys Asp Glu Val Ala Ala Val Thr Gln Ala Ala Ala Gln
165 170 175
Arg Val Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu
180 185 190
Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly
195 200 205
Leu Lys Ser Ser210<210> 97<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 97
atgagcggcc ccacggtcgt tcgcgagatc gaccggccgg aaggcgacct cgtgaccgcacttgagcacg cgggcgtgtc gacggtccac gaagcacagg gacggcgggg actgctcgccacctacatgc ggccgattta cgccggagcc gtgatcgccg gaccggcggt caccgtcctc 180
gtgccgcccg gcgacaacct gatgattcac gtggcggtcg aagtgtgccg cccgggtgac 240
gtgctggtcg tcgccgtcac gtcgccgtgt accgacggct acttcggtga gctgctggcg 300
acgtcggttc gcgcgcgcgg cgtcaaaggg ctcgtcatcg atgcagggtg ccgggacgtg 360
cgggcgctca ccgagatgcg gtttccggtg tggagccggg cggtcagtgc gcagggcacc 420
gtcaaggcca cgctcggctc cgtgaacgtt ccagtcgtgt gtgccggcgc gctcatcaca 480
ggtggagacg tcgtcatcgc cgacgacgat ggggtggtcg tggtgaagcg cgaggaagtg 540
gacgcggtcg ttcaggactc gcgccagcgg ctgctcaagg aagacgggac gcgagagcgt 600
ctcgcgacag gcgagctggg gctggacatc tactcgctgc gcaagatgct gtccgatctg 660
ggactgaagt accgatag 678<210> 98<211> 225<212> PRT<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221j> DOMÍNIO<222> (22)...(174)<223> Demetilmenaguinone metiltransferase<400> 98
Met Ser Gly Pro Thr Val Val Arg Glu Ile Asp Arg Pro Glu Gly Asp1 5 10 15
Leu Val Thr Ala Leu Glu His Ala Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Thr Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Val Ile Ala Gly Pro Ala Val Thr Val Leu Val Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Val Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Val Arg Ala Arg Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe 115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Ile Thr145 150 155 160
Gly Gly Asp Val Val Ile Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Glu Glu Val Asp Ala Val Val Gln Asp Ser Arg Gln Arg Leu Leu
180 185 190
Lys Glu Asp Gly Thr Arg Glu Arg Leu Ala Thr Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Ser Leu Arg Lys Met Leu Ser Asp Leu Gly Leu Lys Tyr
210 215 220
Arg „225
<210> 99
<211> 639
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 99
gtgagcgatc cgatcgccga cctgcgaggg tatggtgtct ccacggttca cgaggcgcag 60ggccggcgcg gcctgctggc gccttacatg cgtccgatct atgccggcgc gctcgtcgcc 120ggaccagccg tgacggtcct ggtcccgccc ggcgacaacc tgatgatcca cgtcgctgtc 180gagcggtgct cgccaggcga catcctcgtc gtcgcgccga cgtcgccgtg cacggacggc 240tatttcggcg agctgctggc gacgtcgctg cgggcacgcg gtgtcgccgc actgatcatc 300gacgctggct gcagggacgt gcgagcgctc accgagatgc gcttcccggt gtggagccgc 360gccatcagcg cccaaggaac ggtgaaagcg acgctcggct cggtgaatgt gccactggtc 420tgcgccggag ccatcgtcgg tcctggcgac gtcatggttg cggacgatga cggcgtggtc 480gtggtgagga aggacgaagt cgccgcggtg acgcaggcgg cggcgcagcg ggtccgcaaa 540gaagaaggca cgcgggcgcg gctggccgcg ggcgagctcg gcctggacat ctacggcctc 600cggcagaagc tgtcggatct cggcctgaag tcgtcgtga 639
<210> 100<211> 212<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (9)...(161)<223> Demetilmenaquinone metiltransferase<400> 100
Met Ser Asp Pro Ile Ala Asp Leu Arg Gly Tyr Gly Val Ser Thr Val1 5 10 15
HisvGlu Ala Gln Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro
20 25 30
Ile Tyr Ala Gly Ala Leu Val Ala Gly Pro Ala Val Thr Val Leu Val
35 40 45
Pro Pro Gly Asp Asn Leu Met Ile His Val Ala Val Glu Arg Cys Ser
50 55 60
Pro Gly Asp Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly
65 70 75 80
Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala
85 90 95
Ala Leu Ile Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu
100 105 110
Met Arg Phe Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val115 120 125Lys Ala Thr Leu Gly Ser Val Asn Val Pro Leu Val Cys Ala Gly Ala130 135 140
Ile Val Gly Pro Gly Asp Val Met Val Ala Asp Asp Asp Gly Val Val145 150 155 160
Val Val Arg Lys Asp Glu Val Ala Ala Val Thr Gln Ala Ala Ala Gln165 170 175
Arg Val Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu180 185 190
Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly10 195 200 205
Leu Lys Ser Ser210<210> 101<211> 678<212> DNA<213> desconhecido<220><22-3£ Proteína obtida por amostra do ambiente<400> 101
atg&àcacac cggtggtagc aagacaagtg gagcagccac cagcggatgc aattgccgca 60ttggagaagt gtggagtgac aaccgtccat gaggctcagg gacgttgtgg cctccttgcg 120tcctacattc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360cgctctctga cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcgagggaca 420gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc aatggtcgag 480gctggtgatg gcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540caggagatcg ctgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctcaaat atctctga 678
<210> 102<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (28)...(174)
<223> Demetilmenaquinone metiltransferase<400> 102
Met Asn Thr Pro Val Val Ala Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Ile Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly
£50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Ile Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Cys Ser Arg Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Met Val Glu145 150 155 160
Ala Gly Asp Gly Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys165 170 175Arg Ala Leu Ala Gln Glu Ile Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 103
<211> 678
<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 103
atgaatcgac cggtggtagt ccggcaagtg gagcaggcac cagcggatgc ggtcgccgca 60ctggagaagt gcggagtgac caccgtgcat gaggctcagg gacggggtgg cctgcttgcc 120tcctacatgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgtct 180ttgccccctg gcgataacct catgatccac gtcgcagtgg aggtctgcgg tccgggaaac 240attctggtgg tttcaccgat ctcgccttgt acggatggtt acttcggcga gctgttggca 300acatccctcc gtgcccgcgg tgggagaggg cttgtgatcg atgccggatg ccgggacgtg 360cgctctttaa cagaaatgaa atttccagtc tggagccgcg ccgtcagttc gcaggggaca 420gtcaaggcca cactgggatc ggtgaatgtg cccgtcgtgt gtgcgggcgc actggtcgag 480gcgggtgatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540caggaggtcg ccgccgcagc ggaacaaagg gttcgcaaag agaacctgac ccgcgaacga 600cttgcgcgtg gagaactcgg actcgatatt tacgacatgc gccaaaagat cgcgcaaatg 660ggccttaaat atctctaa 678
<210> 104<211> 225<212> PRT
<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 104
Met Asn Arg Pro Val Val Val Arg Gln Val Glu Gln Ala Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Gly Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Leu Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Met Gly Leu Lys Tyr210 215 220
Leu225
<210> 105<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 105
atgaatacac cggtggtagt ccggcaagtg gagcagccac ctgcggaggc ggttgccgca 60ctggaaaagc gtggggtgac aaccgtgcat gaggctcagg gacgttgtgg cctccttgcc 120tcctacatgc gcccgattta cacgggagca gcgatcgcag gatccgctat cacagtgtcc 180ttgccgcccg gcgacaacct catgatccac gttgccgtgg aggtatgtgg ttcaggaaac 240atcctggtag tttcaccaac ctcgccttgt gcggatggct acttcggtga gctgttggca 300acatctctcc gtgcccatgg tgtcagaggg ctggtgatcg atgcgggatg ccgtgatgtg 360cgctçcctaa cagagatgaa atttccggtc tggagccgcg ccgtcagctc acaggggaca 420gtcaaggcca cacttggatc ggtgaacgtg cccatcgttt gcgcgggtgc actggtcgac 480gctggtgatg tcatcgtcgc agatgacgat ggcgttgtgg tggtgaagcg cgcgatggcg 540caagaggtcg ccgcggcggc ggaacaaagg gttcgcaaag agaatctgac ccgcgaacga 600cttgcgcgtg gtgaacttgg tctcgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggacttaagt atctgtaa 678
<210> 106<211> 225
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (22)...(174)<223> Demetilmenaguinone metiltransferase<400> 106
Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Glu1 5 10 15
Ala Val Ala Ala Leu Glu Lys Arg Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Thr
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Ser Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Ala Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Asp145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Met Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225<210> 107<211> 636<212> DNA<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 107
gtgagcgatc cgatcgccgc cctgcgcggagggcggcgcg gcctgctggc gccttacatggggcccgcgg tgacggtcct ggttcctcctgagaaatgct cgcctggaga cgtcctcgtctacttcggag aattgcttgc gacgtcgttggatgccggct gccgggatgt gcgcgcgctcttcgtctgcg ctcagggcac ggtgaaggcctgcgccggcg ccctcatcgc tcccgctgatgtggtgaaga gggacgagat cgccatggtggaggaaggca cgcgcgcgcg gctcgccgcgcggcagaagc tgtcggacct cggcctcaag<210> 108<211> 211<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (9)...(161)
<223> Demetilmenaquinone metiltransferase<400> 108
Met Ser Asp Pro Ile Ala Ala Leu Arg Gly Tyr Gly Val Ser Thr Val1 5 10 15
His Glu Ala Gln Gly Arg Arg Gly Leu Leu Ala Pro Tyr Met Arg Pro
tatggcgttt cgacggtgcacgcccgatct atgccggtgcggcgacaacc tgatgatccagtcgccccgg cgtctccgtgcgggcccgcg gcgttgccggacggagatgc ggtttccggtacgctcggct cgctgaatgtgtcatcgttg cagacgatgaacgcaggcgg cggagcagcgggcgagctcg gcctggacattcgtga
cgaggcgcag 60
gctcctcgcc 120
cgtggcggtc 180
cacggacggc 240
cttgatcatc 300
gtggagccgc 360
gccgctggtc 420
cggggtggtg 480
ggttcgcaaa 540
ctacggcttg 60063620 25 30
Ile Tyr Ala Gly Ala Leu Leu Ala Gly Pro Ala Val Thr Val Leu Val
35 40 45
Pro Pro Gly Asp Asn Leu Met Ile His Val Ala Val Glu Lys Cys Ser
50 55 60
Pro Gly Asp Val Leu Val Val Ala Pro Ala Ser Pro Cys Thr Asp Gly65 70 75 80
Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala
85 90 95
Gly Leu Ile Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu
100 105 110
Met Arg Phe Pro Val Trp Ser Arg Phe Val Cys Ala Gln Gly Thr Val
115 120 125
Lys Ala Thr Leu Gly Ser Leu Asn Val Pro Leu Val Cys Ala Gly Ala
130 135 140
Leu Ile Ala Pro Ala Asp Val Ile Val Ala Asp Asp Asp Gly Val Val145 150 155 160
Val.Val Lys Arg Asp Glu Ile Ala Met Val Thr Gln Ala Ala Glu Gln
165 170 175
Arg Val Arg Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Ala Gly Glu
180 185 190
Leu Gly Leu Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ser Asp Leu Gly
195 200 205
Leu Lys Ser210
<210> 109<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 109atgaatacac cggtggtagt aagacaagtg gagcagccac cagcggatgc aattgccgca 60ttaaagaagt gtggagtgac aaccgtccat gaggctcagg gacgtggtgg cctccttgcg 120tcctacatgc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 3 60cgctccctga cagaaatgaa gttcccggtc tggagccgcg ccatctgttc gcaagggaca 420gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc attggtcgag 480gctggtgatg tcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540caagagatcg ccgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctgaaat atctctga 678
<210> 110<211> 22515 <212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 110
Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp
1 5 10 15
Ala Ile Ala Ala Leu Lys Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Ile Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Cys Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Glu
145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Leu Ala Gln Glu Ile Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu
225<210> 111<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 111
atgaaagagg cggtggtggt caggaatatt gagcgcccgc cggccgatgt gatcgcggcg 60ctggaaaagt ttggtgtttc aacggtacac gaagcgcaag gccgccgcgg acttctggcc 120gcttatatga ggccgattta tgggggcgcg gccattgccg ggcctgcggt gactgtctcg 180ttggctccgg gtgacaatct aatgattcac gtggccgtgg aagtttgccg gtcaggtgac 240attctcgtgg tcgctccgac gtcgccgtgc acggatgggt attttggcga gttgctggcg 300
acttccttgc gcgcgcacgg ggtaaaagga ctcgtgatcg aggcaggatg ccgcgatgtc 360
cgggcgctta cggagatgaa atttcccgtg tggagccgcg cggtgagttc gcagggaacg 420
gtgaaggcta gtttgggctc ggtgaacgtg ggaattgtgt gcgctgccgc ggcgatcgaa 480
gccggcgacg cgatcgttgc cgatgatgac ggcgttgtgg tggtgaaacg cggcgacgcc 540
gccagtgttg tcgccgcgtc gcagcaacgc gtccgcaagg aagaggctgc gcgaggacgc 600
ctggcgcgcg gcgaactggg cctggacatt tacggcctgc gcgccaaggt cgcggagctt 660
ggcttgaaat atttgtga 678<210> 112<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 112
Met Lys Glu Ala Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp1 5 10 15
Val Ile Ala Ala Leu Glu Lys Phe Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Gly
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Ala Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Ser Gly Asp
65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Ser130 135 140
Leu Gly Ser Val Asn Val Gly Ile Val Cys Ala Ala Ala Ala Ile Glu145 150 155 160
Ala Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys165 170 175
Arg Gly Asp Ala Ala Ser Val Val Ala Ala Ser Gln Gln Arg Val Arg180 185 190
Lys Glu Glu Ala Ala Arg Gly Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Val Ala Glu Leu Gly Leu Lys Tyr
210 215 220
Leu225
<210> 113<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 113
atgaaagggg cggtggtggt caggaatatc gagcgcccgc cggccgaggt ggtcgcggcg 60ctggaaaagt ttggtgtttc gacggtgcac gaagcgcaag gacgccgcgg acttctggcc 120gcttatatga ggccgattta tgggggcgcg gccattgccg ggcctgcggt gactgtctcg 180ttggctccgg gcgacaattt aatgattcac gtggcggtgg aagtttgccg gtcaggcgac 240attctcgtgg tcgctccgac gtcgccgtgc acggatgggt attttggcga gttgctggcg 300acttccttgc gcgcgcacgg ggtaaaagga ctggtgatcg aggcaggatg ccgcgatgtc 360cgggcgctta cggagatgaa atttcccgtg tggagccgcg cggtgagttc gcagggaacg 420gtgaaggcta ctttgggctc ggtgaacgtg gaaattgtgt gcgctgccgc ggcgatcgaa 480gccggtgacg tgatcgttgc cgatgatgac ggcgttgtgg tggtgaaacg gggcgacgcc 540
gccgctgtgg tcgccgcgtc gcagcaacgc gtccgcaaag aagaagctac gcgagaacgc 600
ctggcgcgcg gcgaactggg cctggacatt tacggcctgc gcgccaaggt cgcggagctt 660
ggcttgaaat atttgtga 678
<210> 114
<211> 225<212> PRT
<213> desconhecido<220>
10 <223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 114
Met Lys Gly Ala Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Glu1 5 10 15
Val Val Ala Ala Leu Glu Lys Phe Gly Val Ser Thr Val His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Gly35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Ala Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Ser Gly Asp 65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser Val Asn Val Glu Ile Val Cys Ala Ala Ala Ala Ile Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys165 170 175
Arg Gly Asp Ala Ala Ala Val Val Ala Ala Ser Gln Gln Arg Val Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Val Ala Glu Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 115
<211> 672
<212> DNA
<213> desconhecido
<22C>
<223> Proteína obtida por amostra do ambiente
<400> 115
atgtcggttg tcgttcagaa catcgagcgt gctgatcagt cggtcatcga ccggctggcc 60
gcctgcggcg ttgccacggt gcatgaagcg cagggccgca agggcctgct cgccagctat 120
atgcggccga tctttccggg tgcacgcctc gcggcgagtg ccgtcactat ctccgcacct 180
ccgggcgaca actggatgct gcatgtggcg atcgaacagt tgaaggccgg cgacattctg 240
ctgctcgccc cgaccagccc ctgcgaggac ggctatttcg gtgatctcct cgccacgtct 300
gcgcaggcgc gcggttgcga gggattgatc atcgatgcgg gtgttcggga tgtggctgat 360
ctgacggaga tgaaatttcc tgtctggtcg aaggcgatct tcgcccaggg cacagtcaag 420
gagaccctcg gttctgtgaa cgtaccggtc gtatgcgctg gcgcctatgt tcgcccgggt 480
gatgtgatcg ttgccgatga tgatggcgtt tgtgttgtgc tgcgcgagga agctgaagtg 540
gtcgcaaaga aggcggaagc ccgtgttgcg gccgaagatg gtaaacgcaa gcggctcgcg 600
gccggcgaac tcggcctcga tatctacgac atgcgcggcc ggctggctga aaagggcctg 660
aagtatatct ga 672<210> 116<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 116
Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Gln Ser Val Ile15 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Pro Gly Ala
35 40 45
Arg .Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Leu His Val Ala Ile Glu Gln Leu Lys Ala Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Glu Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Glu Met Lys Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Tyr Val Arg Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Leu Arg Glu165 170 175
Glu Ala Glu Val Val Ala Lys Lys Ala Glu Ala Arg Val Ala Ala Glu
180 185 190
Asp Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile 195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Glu Lys Gly Leu Lys Tyr Xle
210 215 220
<210> 117<211> 672<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 117
atgggtgtcg tcgtccagaa cattgaccgc gccgagcaag ccgtcatcga ccggctcgcc 60gcctgcggcg tcgcgaccgt gcatgaggcg caggggcgca aggggctgct ggcgagctat 120atgcggccga tctatcccgg cgcgcggatc gcggcgagtg cggtgacgat ctcggcgccg 180cctggtgaca actggatggt gcatgtggcg atcgagcagg tgaaggatgg cgacatcctg 240ctgctggcac cgaccagccc ctgcgaggac ggctatttcg gcgatctttt ggcgacctcg 300gccttggcgc ggggctgccg cgggctggtc atcgatgccg gcgtgcgcga cgtcgctgac 360cttgcggcga tgaagtttcc ggtctggtcg aaagcgatct tcgcccaggg cacggtcaag 420gaaacgctgg gttcggtgaa tgtgccggtc gtctgcgccg gcgcgctggt caaccccggc 480gacgtgatcg tcgccgacga tgacggcgtt tgtgtcgttc gccgcgaaga ggcggcggag 540gttgcagaca aggctgaggc ccacgtcgcg gcagaggagg gcaagcgcaa gcggctggcg 600gccggcgagc ttggtctcga catctacgac atgcgcaagc ggctcgccga gaaagggctg 660aaatatgtct ga 672
<210> 118<211> 223<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 118
Met Gly Val Val Val Gln Asn Ile Asp Arg Ala Glu Gln Ala Val Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Val His Val Ala Ile Glu Gln Val Lys Asp Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu-Ala Thr Ser Ala Leu Ala Arg Gly Cys Arg Gly Leu Val Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Ala Ala Met Lys Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Ala Ala Glu Val Ala Asp Lys Ala Glu Ala His Val Ala Ala Glu
180 185 190
Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Lys Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val10
210 215 220
<210> 119<211> 672<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 119
atgggtattg ttgttcagaa catcaagcgg gcggaccccg ggatcatagc aggtcttggc 60
aaatgcggcg ttgccactgt gcatgaagcg caggggtgca aggggctcct ggcggcctat 120atgcggccca tttattctgg cgcgcgcctt gccgcctccg ctgtcaccat ttccgcgccg 180ccgggagaca actggatggt gcatgtcgcc attgagcagg tgaggcaagg tgatattctg 240gttcttgccc caacatcgcc ctgtgaagac ggctatttcg gtgatttgct cgccacctcc 300atgctgcagc gcggcggcag ggggctgatt attgacgccg gtgtccgcga tatccgtgat 3 60ctgactcaaa tgaaatttcc ggtgtggtcg aaaaccgttt ttgcgcaggg caccgttaag 420gaaacccttg gctctgtgaa cgtcccgata gtttgcgccg gtgaagtggt caatcctggc 480gacatcatga ttgccgatga tgatggtgtg tgcgtggtcc ggcgcgacga cgctgaaagc 540gtgettgaaa aagcattggc gcgtgaggca aaggaagaag atacacgcaa acgccttgcg 600gcaggcgagc tgggtcttga tatttacggc atgcgcgcac gtctggccga aaagggccta 660aaatatgtct ga 672
<210> 120<211> 223<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaquinone metiltransferase<400> 120
Met Gly Ile Val Val Gln Asn Ile Lys Arg Ala Asp Pro Gly Ile Ile1 5 10 15
Ala Gly Leu Gly Lys Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Cys Lys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala 35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Val His Val Ala Ile Glu Gln Val Arg Gln Gly Asp Ile Leu65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Met Leu Gln Arg Gly Gly Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Ile Arg Asp Leu Thr Gln Met Lys Phe Pro Val
115 120 125
Trp Ser Lys Thr Val Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser.Val Asn Val Pro Ile Val Cys Ala Gly Glu Val Val Asn Pro Gly
145 150 155 160
Asp Ile Met Ile Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Asp
165 170 175
Asp Ala Glu Ser Val Leu Glu Lys Ala Leu Ala Arg Glu Ala Lys Glu
180 185 190
Glu Asp Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Ala Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val
210 215 220
<210> 121<211> 696<212> DNA
<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 121
atgaagcgcg gtgtcgtcgt cacccatatc gagcgcgcca acccgcgtga cgtggccgtg 60
cttcagcagg cgggcgctgc gaccgttcat gaagcgcaga gccgtctggg cctgctcgcg 120
tcgtacatgc ggcccatcta tgcgggcgcg tcaatcgcgg gatcggcggt gacggtgctc 180
gtgccgccgt cggacaactg gatgttgcac gttgccgccg aacagtgccg cgaaggcgac 240
gtgctcgtgg tcgcgccgac ttcgccgtgc gaagacggct acttcggcga actgctcgcg 300
acgtcgcttg ccgcgcgcgg tgtgcgcggg ctcatcatcg atgcgggctg tcgcgatgtg 3 60
cgcgcgctca aggacatgaa cttcccggtc tggtcgaaag cggtctctgc gcaaggcacg 420
gtgaaggaga cgctgggctc ggtcaatgtg cctgttgtgt gcgcacagca gatcgtgcat 480
gcgggcgacg tgatcgtcgc cgacgatgac ggcgtcgtgg tcgtgccgtt cgccacggtg 540
tcgcgcgtgg ccgaagcagc gcaggcgcgt ctcgcgaagg aagagaagac gcgttccgtg 600
ctcgcgacgg gcgtgctggg cctcgactac tacagcatgc gtgacaagct cgcggaaaag 660
ggcctgcgtt acgtcgggtc gatcgaggaa gcgtga 696
<210> 122
<211> 231<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaguinone metiltransferase
<400> 122
Met Lys Arg Gly Val Val Val Thr His Ile Glu Arg Ala Asn Pro Arg1 5 10 15
Asp Val Ala Val Leu Gln Gln Ala Gly Ala Ala Thr Val His Glu Ala20 25 30
Gln Ser Arg Leu Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala Ser Ile Ala Gly Ser Ala Val Thr Val Leu Val Pro Pro Ser50 55 60
Asp Asn Trp Met Leu His Val Ala Ala Glu Gln Cys Arg Glu Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala Arg Gly Val Arg Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Lys Asp Met Asn Phe
115 120 125
Pro Val Trp Ser Lys Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gln Gln Ile Val His145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Pro
165 170 175
Phe Ala Thr Val Ser Arg Val Ala Glu Ala Ala Gln Ala Arg Leu Ala
180 185 190
LyS" Glu Glu Lys Thr Arg Ser Val Leu Ala Thr Gly Val Leu Gly Leu
195 200 205
Asp Tyr Tyr Ser Met Arg Asp Lys Leu Ala Glu Lys Gly Leu Arg Tyr
210 215 220
Val Gly Ser Ile Glu Glu Ala225 230
<210> 123<211> 678<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 123
atgaacaaac ccgtggtagt gcggcaactg gagcagccac ccgccgatgc ggttgcggccctggagaagt atggcgtgac taccgtccac gaggctcagg gacgttgtgg cctgctggctccttatatgc gaccgatttt tgcgggagcc tgcatcgccg gttccgccgt caccgtgtct 180
ttgccgcccg gcgataactt catgatccac gttgccgtcg aggtctgcag tccgggcagc 240
attctcgtag tcgcccccac ctcaccttgc acggacggtt atttcggcga actcttggca 300
acttccctcc gcgctcacgg tgtcaaagga ctggtcattg atgccggctg ccgggatgtt 360
cgctcgttaa cggaaatgaa attccccgtt tggagccgtg cggtgagttc gcaaggaacg 420
gtgaaggcta cgctcggatc tgtgaatgtg ccggtcattt gcgcgggcgc cgaggtggaa 480
gccggtgacg tcatcatcgc cgatgacgat ggtgtggtag tggtgaagcg tgcgactgcc 540
cacgaggtag cagcggcggc ggaacaacga gttcgcaagg agaatgccac tcgcgaacga 600
ctggcacgag gagaactcgg cctcgacatc tacgacatgc ggcaaaaaat cgcgcaactt 660
ggtctcaaat atctgtga 678<210> 124<211> 225<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)<223> Demetilmenaquinone metiltransferase<400> 124
Met Asn Lys Pro Val Val Val Arg Gln Leu Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Phe Ala
35 40 45
Gly Ala Cys Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Phe Met Ile His Val Ala Val Glu Val Cys Ser Pro Gly Ser65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe 115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Val Ile Cys Ala Gly Ala Glu Val Glu145 150 155 160
Ala Gly Asp Val Ile Ile Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Thr Ala His Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu.225
<210> 125
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<400> 125
atgaacgatc ccgtcgtcgt ccgagagatc gagaggccgt cggcgacgtc gatcgacgat 60ctgcggcgtt tcggcgtctc gacggtgcac gaagcgcagg ggcgccgcgg gctgctcgca 120tcgtacatgc ggccgatcta tgccggcgcg ctggtcgccg ggcctgcgat taccgtcctg 180gtgacgccgg gcgacaacct gatgatccat gtcgcggtcg agatctgcca gccaggcgat 240gtcctcgtcg tcgccccgac gtcgccgtgc accgacggat acttcggcga gctgctggcg 300acgtcgttgc gagcgcatgg cgtcgcgggt ctgatcatcg atgccggctg ccgggatgtt 360cgctcgttga gcgagatgcg atttcccgtg tggagccgcg cgatcagcgc ccaggggacc 420gtcaaggcga cgctgggttc ggtgaacgtg ccgctggtgt gcgccggagc gctggtcgag 480ccgggcgatg cgatcgtcgc cgacgacgac ggtgtcgtcg tcgtcaggcg ggaacaggtc 540gacactgtgt gccaggcggc gggacagcgc gtgcgcaagg aagaggacac gcgcgcgcgg 600ctggcgcaag gcgagcttgg cctcgacatc tacggcttgc gcaaaaagct gtcggacctc 660gggttgaagt cgtcgtga 678
<210> 126<211> 225<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 126
Met, Asn Asp Pro Val Val Val Arg Glu Ile Glu Arg Pro Ser Ala Thr1 5 10 15
Ser Ile Asp Asp Leu Arg Arg Phe Gly Val Ser Thr Val His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Leu Val Ala Gly Pro Ala Ile Thr Val Leu Val Thr Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Ile Cys Gln Pro Gly Asp
65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Ala Gly Leu Ile100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Ser Glu Met Arg Phe115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Leu Val Cys Ala Gly Ala Leu Val Glu145 150 155 160
Pro Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Arg
165 170 175
Arg Glu Gln Val Asp Thr Val Cys Gln Ala Ala Gly Gln Arg Val Arg180 185 190
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser210 215 220
Ser
225
<210> 127<211> 678<2U> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 127
atgaacgatc cggtcgtcgt tcgcgagatc gacaggccgg cgggtaccgc catcgacgat 60ctccggcgct tcggcgtgtc gaccgtccac gaagcgcagg ggcgttgcgg cttgctcgct 120tcgtacatac ggccgattta ttcaggcgcc ctgctcgccg gcccggcgat caccgtccag 180gttacgcctg gcgacaacct gatgatccac gtcgctgtcg aagtgtgccg gccaggagac 240gtgctcgtcg tcgccccgac gtcgccgtgc acggatggct atttcggcga gctgctcgcg 300acatcgctgc gtgcccacgg cgtcgtcggg ctgatcatcg acgccggttg ccgggacgtt 360cgcgccttga gcgagatgcg atttcctgtg tggagtcgcg cgatcagcgc gcagggcacc 420gtcaaagcca cgctgggctc ggtgaacgtg ccgctgttgt gtgccgggat gctggtcgag 480gccggcgacg cgatcgtggc cgacgacgac ggagtggtgg tggtcaggcg gagccaggtc 540gatgctgtcc gcgaggcggc cgaacgacgc gtgcgcaagg aagaggacac gcgggcccgg 600ctcgcccgag gcgagcttgg cctcgacatc tacggcctgc gcaggaaact gtcagaccccggtttgaagt cgtcgtga
<210> 128
<211> 225
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaguinone metiltransferase<400> 128
Met Asn Asp Pro Val Val Val Arg Glu Ile Asp Arg Pro Ala Gly Thr1 5 10 15
Ala Ile Asp Asp Leu Arg Arg Phe Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Ser
35 40 45
Gly Ala Leu Leu Ala Gly Pro Ala Ile Thr Val Gln Val Thr Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Val Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ser Glu Met Arg Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Leu Leu Cys Ala Gly Met Leu Val GluAla Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Arg
Arg Ser Gln Val Asp Ala Val Arg Glu Ala Ala Glu Arg Arg Val Arg
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu
Asp Ile Tyr Gly Leu Arg Arg Lys Leu Ser Asp Pro Gly Leu Lys Ser
Ser225
<210> 129<211> 678<212> DNA
<220>
<223> Proteína obtida por amostra do ambiente<400> 129
atgaacaaac cggtggtggt ccggaaggtc gaacagccgc cacaagatgc ggtggcggct 60
ctggagaaat atggcgtctc cacggtgcac gaagcgcaag gccgttgcgg gctgctcgcc 120
gcttacatgc gcccgatcta tgccggagct tccatggccg gacccgccgt gaccgtttcc 180
cttccgcccg gtgacaacct catgatccac gtcgcggtcg aagtgtgcca ccccggaaac 240
attctggtcg tcgcccccac ttcaccttgt accgacgggt atttcggcga gttgctggct 300
acttccttgc gcgcccacgg cgtgaaggca ctcataatcg atgccggatg ccgtgacgtg 360
cgctccctca ccgaaatgaa gtttcccgtg tggagccgcg ccgtcagttc gcagggaaca 420
gtgaagtcca cgctcggatc agtgaacgtg ggcgtagtgt gtgcgggcgc tttcatcgaa 480
gcgggcgaca tcgtcgtcgc tgatgatgac ggagtcgtcg tcgtgaagag ggctttcgcg 540
cgcgacgtgg ttgaagcctg tgaacagagg gtccgcaagg aagaagcgac gcgggcacgc 600
ctggcgcagg gcgagcttgg tctggacatc tacggattgc gcgccaaagt ggcggagctc 660
ggtctcaagt acatataa 678<210> 130
<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaguinone metiltransferase<400> 130
Met Asn Lys Pro Val Val Val Arg Lys Val Glu Gln Pro Pro Gln Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ser Met Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
' 50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys His Pro Gly Asn65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Ala Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr
130 135 140
Leu Gly Ser Val Asn Val Gly Val Val Cys Ala Gly Ala Phe Ile Glu145 150 155 160
Ala Gly Asp Ile Val Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Phe Ala Arg Asp Val Val Glu Ala Cys Glu Gln Arg Val Arg180 185 190
Lys Glu Glu Ala Thr Arg Ala Arg Leu Ala Gln Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Val Ala Glu Leu Gly Leu Lys Tyr
210 215 220
Ile225
<210> 131<211> 672<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 131
atgagcatcg tcgtgcagaa catcgagcga gcggacctgg aggcggttac gacgcttggc 60gaatgcggtg tggcgaccgt gcacgaggca caaggccgca cgggcctcat gctcccctat 120aCgcggccga tctggccggg cgcacggatc gcaggcccgg ctgtgaccgt ctccctgccg 180ccgggcgaca actggatgat ccatgtcgcg gtggagcaat gccgggaggg cgacatcctg 240atcgtggcgc cgaccagccc cagcgaggac ggctatttcg gcgagcttct ggcgcgctcg 300ctcgtggcgc gcagcgtcaa gggcttcgtg atcgaggctg gggtgcgcga tgtgcgcgac 360cttaccgaga tacgtttccc ggtctggtcg cgggcagtct ccgcccaggg cacggtcaag 420gaaacgatcg gctcggtgaa cgtgccgatc gtctgcgcag gtgctgcggt gaatccgggc 480gacgtggtcg tggctgacga tgacggcata tgtgtcgtgg ctcgcgacaa agctggtgag 540gtggccaagg ctgcgcgagc gcgcgaggcg aaggaagctg aaacgcgccg ccggctgatc 600aatggcgagc tcgggctcga catctatgga atgcgggaga agcttgcggc gaagggcctg 660aaatatgtct ga 672
<210> 132<211> 223<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 132
Met Ser Ile Val Val Gln Asn Ile Glu Arg Ala Asp Leu Glu Ala Val1 5 10 15
Thr Thr Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Met Leu Pro Tyr Met Arg Pro Ile Trp Pro Gly Ala
35 40 45
Arg Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu65 70 75 80
Ile Val Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Arg Ser Leu Val Ala Arg Ser Val Lys Gly Phe Val Ile Glu
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Ile Arg Phe Pro Val
115 120 125
Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr Ile Gly
130 135 140
Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Ala Val Asn Pro Gly145 150 155 160
Asp Val Val Val Ala Asp Asp Asp Gly Ile Cys Val Val Ala Arg Asp
165 170 175
Lys Ala Gly Glu Val Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu
180 185 190
Ala Glu Thr Arg Arg Arg Leu Ile Asn Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val210 215 220
<210> 133<211> 672<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 133
atgaacatcg tcgtccagaa catcgagcgc gccgatccgg cggtgatcgc cggcctcgcc 60gagtgcggcg tcgccacagt ccacgaagcg caggggcgca tcgggctgat gtcatcgaag 120atgcggccga tctacgccgg cgcccgcatc gcggcctcgg cggtgaccgt gtcgctgccg ' 180ccggccgaca actggatgat ccatgtcgcc gtggagcaga tcaaagcggg cgacgtcatg 240gtcgtggcgc cgacctcgcc ctcggacgcg ggctattttg gcgacctgct cgccaattcg 300ctgcaggccc ggggctgcgc cggcctcgtg atcgatgccg gggtgcgcga cgtgcgtgac 360cttaccgaaa tgcggttccc cgtctggtcg acggcgatct cggcgcaggg aaccgtcaag 420gaaacgcttg gttcggtgaa cgtcccgatc gtctgcgccg gtgcacatgt cgaacccggc 480gácgtgatcg tcgccgacga cgacggcgtc tgcatcgtca agcgcaccga cgcggctgcg 540gtgctcgaaa aggcgcgggc ccggctcgcg aacgaaaccg acaagcgcga gaaactcgcg 600aacggcacgc tgggcctcga tctctacaag atgcgcgagg cgctggagaa gaagggcctc 660aggtatgcct ga 672
<210> 134<211> 223<212> PRT<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaguinone metiltransferase<220><221> SITE<222> (193)...(196)
<223> Sítio de N-glicosilação prosítio id = PS00001<220>
<221> SITE
<222> (204)...(207)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 134
Met Asn Ile Val Val Gln Asn Ile Glu Arg Ala Asp Pro Ala Val Ile1 5 10 15
Ala Gly Leu Ala Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Ile Gly Leu Met Ser Ser Lys Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Ile Ala Ala Ser Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Ile Lys Ala Gly Asp Val Met65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Asn Ser Leu Gln Ala Arg Gly Cys Ala Gly Leu Val Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Arg Phe Pro Val
115 120 125
Trp Ser Thr Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala His Val Glu Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Ile Val Lys Arg Thr
165 170 175
Asp Ala Ala Ala Val Leu Glu Lys Ala Arg Ala Arg Leu Ala Asn Glu
180 185 190
Thr Asp Lys Arg Glu Lys Leu Ala Asn Gly Thr Leu Gly Leu Asp Leu195 200 205
Tyr Lys Met Arg Glu Ala Leu Glu Lys Lys Gly Leu Arg Tyr Ala
210 215 220
<210> 135
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 135
atgagcgtcg tcgtccagaa catcgcgcgc gccgatcaag cgatcgtcga tcggctcgcg 60
gcctgcggtg ttgccactgt gcatgaagcg cagggccgca agggactgct cgcgagccat 120atgcggccga tctatcccgg tacccggctc gcggcgagcg ctgtgaccat ctcggcgccg 180ccgggcgaca actggatggt ccacgtcgcg atcgagcaat tgcgagcggg cgacatcatg 240gtgctcgccc cgaccagccc ctgcgaggat ggttatttcg gcgatctgct tgccacatcg 300gcgaaagcac ggggctgccg cggtctcatc atcgatgccg gcgtccgcga tgtcgccgat 360ctcacggcga tgcagtttcc tgtctggtcc aaggccatct tcgcgcaagg caccgtcaag 420gaaacgctcg gctcggtgaa catcccggtg gtgtgcgcgg gtgcgctggt caatcccggc 480gatgtcatcg tcgccgatga cgatggcgtc tgcgttgtgc gccgcgaaga ggcggaggcg 540gtggcgcaga aggccgaagc ccgcgtcgcc gccgaggacg acaagcgcaa gcgcctcgcc 600gccggcgaac tcggtctcga catctacaag atgcgcgagc ggctggccga gaaggggctc 660aaatatgtct ga 672
<210> 136<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)... (172)
<223> Demetilmenaguinone metiltransferase<400> 136
Met Ser Val Val Val Gln Asn Ile Ala Arg Ala Asp Gln Ala Ile Val1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Pro Gly Thr
35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Val His Val Ala Ile Glu Gln Leu Arg Ala Gly Asp Ile Met65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Lys Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Ile Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Ala Glu Ala Val Ala Gln Lys Ala Glu Ala Arg Val Ala Ala Glu
180 185 190
Asp Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val
210 215 220
<210> 137<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 137
atggctgtcg tggtccagaa tattgcccgt gccgaccagg cggtcattga ccggctggcc 60gcctgtgatg tcgccacggt tcatgaggcg cagggccgca agggcctgct cgccggctac 120atgcggccga tttatcccgg tgcccggatt gctgccagtg ccgtaacgat ctctgcgccg 180cccggcgaca actggatggt ccatgtggcg atcgaacagc tcaaggcggg cgatatcctg 240ttgcttgcgc cgacaagccc ctgcgaggac ggctatttcg gcgatcttct cgcgacgtcg 300gccgttgcgc gcggctgccg cgggcttatc atcgatgccg gcgtgcgtga cgttgccgat 3 60ctcacggaaa tgaagtttcc ggtctggtcc aaggcggtct tcgcccaggg cacggtcaag 420gagacgctcg gctcggtcaa tgtgaccgtg gtctgtgccg gtgccctggt caatgccggc 480gacgtgatcg tggccgacga cgatggcgtc tgcgtggtcc ggcgcgagga agcggctgac 540gtggctgcca aagccgaggc gcgtgtcgct gccgaggagg gcaagcgcaa gcggctcgcg 600gccggcgaac tcgggctcga catttacgac atgcgcgggc gattggcgga gaagggactg 660agatatgtct ga 672
<210> 138<211> 223<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)... (172)
<223> Demetilmenaquinone metiltransferase<220>
<221> SITE<222> (149)...(152)<223> Sítio de N-glicosilação prosítio id = PS00001<400> 138
Met Ala Val Val Val Gln Asn Ile Ala Arg Ala Asp Gln Ala Val Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Asp Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Gly Tyr Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Val His Val Ala Ile Glu Gln Leu Lys Ala Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Val Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Glu Met Lys Phe Pro Val
115 120 125
Trp Ser Lys Ala Val Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Thr Val Val Cys Ala Gly Ala Leu Val Asn Ala Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Ala Ala Asp Val Ala Ala Lys Ala Glu Ala Arg Val Ala Ala Glu
180 185 190
Glu Gly Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Gly Arg Leu Ala Glu Lys Gly Leu Arg Tyr Val
210 215 220
<210> 139<211> 693<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 139
atgaattatc agccggggac aacaggcatc gtcgtgcagg atattgcgcg cgctgatcaa 60
gccattatcg atggcctagc agaatgtggt gtggcgacgg tgcatgaggc acaagggcgc 120
aaggggctgt tggcggacta tatgacgccg attttttcag gcgcgggcat cgctggatct 180
gcggtgacca ttctggcgcc accttgtgac aattggatga ttcatgtggc ggtagaacag 240
ttgcaaaagg gcgatgtgtt gctgctgggc acgatcacac cgtccaatgc tggctatttc 300
ggtgacttgc tggccacgtc agccatggcg cacggttgtc gcggattgat cattgatggc 360
ggtgtgcgcg atgtgcaaga gctgacggat atgggctttc cggtttggtc caaggccgta 420
catgcccaag gcacaatcaa agaaacgctg ggatcggtca acgtgccagt tgtctgcggc 4 80
caagagttgg taaatcccgg tgatattgtg gtggccgatg atgacggggt gtgcgttgtg 540
cgccgcgaag aagctgctga tgtgctggct aaggcgcggg cgcgcgagag taatgaagcc 600
gccaagcgcg cgcgttttga ggacggtgag ctggggctgg atatctatga catgcgcgcg 660
cggctggccg aaaagggact gaaatacgtc tga 693
<210> 140
<211> 230<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (27)...(179)
<223> Demetilmenaguinone metiltransferase <400> 140
Met Asn Tyr Gln Pro Gly Thr Thr Gly Ile Val Val Gln Asp Ile Ala1 5 10 15
Arg Ala Asp Gln Ala Ile Ile Asp Gly Leu Ala Glu Cys Gly Val Ala20 25 30
Thr Val His Glu Ala Gln Gly Arg Lys Gly Leu Leu Ala Asp Tyr Met35 40 45
Thr Pro Ile Phe Ser Gly Ala Gly Ile Ala Gly Ser Ala Val Thr Ile50 55 60
Leu Ala Pro Pro Cys Asp Asn Trp Met Ile His Val Ala Val Glu Gln65 70 75 80
Leu Gln Lys Gly Asp Val Leu Leu Leu Gly Thr Ile Thr Pro Ser Asn
85 90 95
Ala Gly Tyr Phe Gly Asp Leu Leu Ala Thr Ser Ala Met Ala His Gly
100 105 110
Cys Arg Gly Leu Ile Ile Asp Gly Gly Val Arg Asp Val Gln Glu Leu
115 120 125
Thr Asp Met Gly Phe Pro Val Trp Ser Lys Ala Val His Ala Gln Gly
130 135 140
Thr Ile Lys Glu Thr Leu Gly Ser Val Asn Val Pro Val Val Cys Gly145 150 155 160
Gln Glu Leu Val Asn Pro Gly Asp Ile Val Val Ala Asp Asp Asp Gly
165 170 175
Val Cys Val Val Arg Arg Glu Glu Ala Ala Asp Val Leu Ala Lys Ala
180 185 190
Arg Ala Arg Glu Ser Asn Glu Ala Ala Lys Arg Ala Arg Phe Glu Asp
195 200 205
Gly Glu Leu Gly Leu Asp Ile Tyr Asp Met Arg Ala Arg Leu Ala Glu
210 215 220
Lys Gly Leu Lys Tyr Val225 230
<210> 141<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 141
atgagcgtcg tcgtccagaa catcgaacgc gccgacccgg actccgtcgc cgtgctcggcgcgagcggcg tcgccaccgt gcacgaagcg caaggccgga cgggactcat gcggccctatatgcggccga tctattcggg cgtgcgcatt gccggaccga ccgtcacggt ctccatcccg 180
ccgggcgaca actggatgat tcatgtcgcg gtcgagcagt gccgcgaagg cgacattctc 240
gttgtggctc cgaccagccc gagcgatgac ggctatttcg gcgacctgct tgccgggtcg 300
cttatggcac gaggcgtcaa ggctctcatc atcgaggccg gtgtgcgcga cgttcgcgat 360
ctgaccgaaa tgcgctttcc ggtctggtcg aagaccattt ccgcgcaggg aaccgtcaag 420
gaaacgcttg gctccgtgaa tgtgccgatc gtctgcgccg gtgcggcggt caatcccggc 480
gacgcggtcg tggccgatga cgacggcgta tgcgtcgtgc cgcgagagcg agcggccgag 540
gtggccaagg cgtcgcaggc ccgcgaggca aaggaagccg ggacgcgccg gcggctgatg 600
gccggtgaac tggggctcga catctacggc atgcgcgaga aactcgctgc caagggtttg 660
aaatatgtct ga 672<210> 142<211> 223<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaquinone metiltransferase<400> 142
Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Pro Asp Ser Val1 5 10 15
Ala Val Leu Gly Ala Ser Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ser Gly Val
35 40 45
Arg Ile Ala Gly Pro Thr Val Thr Val Ser Ile Pro Pro Gly Asp Asn50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Gly Ser Leu Met Ala Arg Gly Val Lys Ala Leu Ile Ile Glu
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Arg Phe Pro Val115 120 125
Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Ala Val Asn Pro Gly145 150 155 160
Asp Ala Val Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Glu
165 170 175
Arg Ala Ala Glu Val Ala Lys Ala Ser Gln Ala Arg Glu Ala Lys Glu
180 185 190
Ala Gly Thr Arg Arg Arg Leu Met Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val
210 215 220
<210> 143<211> 672<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 143
atgagcgtcg tcgtccagaa catcgaacgc gccgacccgg actccgtcac cgtgctcggc 60gcgagcggcg tcgccaccgt gcacgaagcg caaggccgga cgggactcat gcggccctac 120atgcggccga tctattcggg cgtgcgcatt gccggaccgg ccgtcacggt ctccatcccg 180ccgggcgaca actggatgat tcatgtcgcg gtcgagcagt gccgcgaagg cgacattctc 240gttgtggctc cgaccagccc gagcgatgat ggctatttcg gcgacctgct tgccgggtcg 300cttgtggcac gaggcgtcaa ggctctcatc atcgaggccg gtgtgcgcga cgttcgcgat 360ctgaccgaaa tgcgctttcc ggtctggtcg aagaccattt ccgcgcaggg aaccgtcaag 420gaaacgcttg gctccgtgaa tgtgccgatc gtctgcgccg gtgcggcggt caatcccggc 480gacgcggtcg tggccgatga cgacggcgta tgcgtcgtgc cgcgagagcg agcggctgag
gtggccaagg cgtcgcaggc ccgcgaggca aaggaggccg ggacgcgccg gcggctgatg
gccggtgaac tggggctcga catctacggc atgcgcgaga aactcgctgc caagggtttg
aaatatgtct ga
<210> 144
<211> 223
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<220>
<221> SITE<222> (1)...(21)<223> Assinatura de<400> 144
Met Ser Val Val Val1 5
Thr Val Leu Gly Ala20
Arg Thr Gly Leu Met35
Arg Ile Ala Gly Pro50
Trp Met Ile His Val65
Val Val Ala Pro Thr85
Leu Ala Gly Ser Leu
proteína do receptor TonB-dependente e prosítio id
Gln Asn Ile Glu Arg Ala Asp Pro Asp Ser Val
10 15
Ser Gly Val Ala Thr Val His Glu Ala Gln Gly
25 30
Arg Pro Tyr Met Arg Pro Ile Tyr Ser Gly Val
40 45
Ala Val Thr Val Ser Ile Pro Pro Gly Asp Asn
55 60
Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu70 75 80
Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu
90 95
Val Ala Arg Gly Val Lys Ala Leu Ile Ile Glu100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Arg Phe Pro Val
115 120 125
Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly130 135 140
Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Ala Val Asn Pro Gly145 150 155 160
Asp Ala Val Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Glu165 170 175
Arg Ala Ala Glu Val Ala Lys Ala Ser Gln Ala Arg Glu Ala Lys Glu180 185 190
Ala Gly Thr Arg Arg Arg Leu Met Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val
210 215 220
<210> 145<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 145
atgaccatcg tcgtcaccgg catcgagcgc gcgggagcgg acactgtcgc cgcgctgggc 60acaagcggcg tcgcgaccgt acacgaggcg cagggccgca ccggcctgat gcgtccctac 120atgcggccga tctatacggg agcgcgcatc gccgggacgg cgattaccgt gtcgctgccg 180cccggcgaca actggatgat ccacgtcgcc gtcgagcagt gccggcaagg cgatatcctc 240gtggtggcgc cgaccagccc gagcgacgac ggctatttcg gcgacctgct cgccaattct 300ctcgtcgccc gcggcgtgag gggcatggtc atcgaggccg gcgtgcgtga cgttcgcgat 360ctcaccgaga tgcgcttccc ggtctggtcg aagacgatct cggcgcaggg aacggtcaag 420gagacgctcg gctcggtcaa cgtgccggtc gtctgcgctg gcttggccgt gaacccgggc 480gacatcatcg tggccgacga cgacggcatc tgcgtggtgc cgcgccagac cgccgcgcag 540gtcgtcgagg cggctcatgc gcgcgaggcg aaggaggcgg aggtccgtcg gcggctcatc 600gccggcgaac tcggcctcga tatctacggc atgcgtgaga agctggcggc caagggcctg
aaatatgtct ga
<210> 146
<211> 223
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 146
Met Thr Ile Val Val Thr Gly Ile Glu Arg Ala Gly Ala Asp Thr Val1 5 10 15
Ala Ala Leu Gly Thr Ser Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Thr Gly Ala
35 40 45
Arg Ile Ala Gly Thr Ala Ile Thr Val Ser Leu Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Arg Gln Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Asn Ser Leu Val Ala Arg Gly Val Arg Gly Met Val Ile Glu
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Arg Phe Pro Val
115 120 125
Trp Ser Lys Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Leu Ala Val Asn Pro GlyAsp Ile Ile Val Ala Asp Asp Asp Gly Ile Cys Val Val Pro Arg Gln
Thr Ala Ala Gln Val Val Glu Ala Ala His Ala Arg Glu Ala Lys Glu
Ala Glu Val Arg Arg Arg Leu Ile Ala Gly Glu Leu Gly Leu Asp Ile
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Val
<210> 147<211> 675<212> DNA
<213> desconhecido<220>
<400> 147
gtgagcggca tcgtcgtcca gaacatcgag cgcgccgacc ccgcgatcat cacgggcctc 60
gccgaatgcg gcgtcgccac ggtgcatgag gcgcagggcc gcaagggtct gctcgcgtcc 120
tacatgcggc cgatctatgc cggcgccgct gtcggcgcat cggcggtcac catcctcgcc 180
ccgccctgcg acaactggat ggtgcatgtg gcgatcgagc aggtgcgggc aggggacatc 240
ctcgtcctcg cgaccacctc gccctccgac gccggctatt tcggcgatct gctcgccacc 300
tcgatgaagg cccgcggcgg tgtcggcctc atcatcgatg ccggcgttcg tgacattcgc 360
gacctcacgg cggtgcagtt cccggtgtgg tccaaggccg tctgcgccca gggcaccatc 420
aaggaaacgc tgggctcggt gaacgtgccg gtggtctgtg ccggcgagct ggtcaacccg 480
ggcgatgtca tcgtcgccga tgacgacggc gtctgcgtcg tgcggcgcga ggaagctgcc 540
gatgtgctga agaaggcgca ggcccgcgtg gcgaacgaag gcgacaagcg tcagcgcctc 600
gcggccggcg aactcggcct cgacatgtac aagatgcgcg acaagctgaa ggaaatgggc 660
ctcaaatatg tctga 675<210> 148
<211> 224
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (21)... (173)
<223> Demetilmenaquinone metiltransferase<400> 148
Met Ser Gly Ile Val Val Gln Asn Ile Glu Arg Ala Asp Pro Ala Ile1 5 10 15
Ile Thr Gly Leu Ala Glu Cys Gly Val Ala Thr Val His Glu Ala Gln
20 25 30
Gly Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly
35 40 45
Ala Ala Val Gly Ala Ser Ala Val Thr Ile Leu Ala Pro Pro Cys Asp
50 55 60
Asn Trp Met Val His Val Ala Ile Glu Gln Val Arg Ala Gly Asp Ile65 70 75 80
Leu Val Leu Ala Thr Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp
85 90 95
Leu Leu Ala Thr Ser Met Lys Ala Arg Gly Gly Val Gly Leu Ile Ile
100 105 110
Asp Ala Gly Val Arg Asp Ile Arg Asp Leu Thr Ala Val Gln Phe Pro
115 120 125
Val Trp Ser Lys Ala Val Cys Ala Gln Gly Thr Ile Lys Glu Thr Leu
130 135 140
Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Glu Leu Val Asn Pro145 150 155 160
Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg
165 170 175
Glu Glu Ala Ala Asp Val Leu Lys Lys Ala Gln Ala Arg Val Ala Asn
180 185 190
Glu Gly Asp Lys Arg Gln Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp195 200 205
Met Tyr Lys Met Arg Asp Lys Leu Lys Glu Met Gly Leu Lys Tyr Val210 215 220
<210> 149
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<400> 149
atgaataaac cggtggtagt tcgacaggtc gagcagccat cagccgatgc ggttgcggca 60ctagaaaagt gtggcgtaac gacggtgcat aaggctcagg gacgctgcgg cttgcttgca 120gcctacatgc gaccgatttt cccaggagct agcatcgccg gttctgcggt cactgtgtcc 180ctgccgccgg gcgacaacct gatgattcac gtcgcggtcg aggtctgcag cacaggaaac 240attctggtgg tcgctccgac ctcgccatgc acggatggtt acttcggtga actcctcgca 300acgtcgttgc gcgcgcacgg tgtaagaggc cttgtgatcg atgctggatg ccgtgacgtt 3 60cgctctttga cggaaatgaa attcccggtc tggagccgcg ccatcagctc tcaggggaca 420gtgaaagcca cactcggatc agtcaatgtg ccgatcacat gcgcggggac actcgttgaa 480tccggtgacg tcatcgtcgc cgacgatgat ggtgtcgtag tcgtgaagcg tacggccgca 540caagaagtcg ccgcagccgc tgaacaaagg gtgcgcaaag agaatgcgac ccgtgaacga 600ctcgcacggg gcgaactcgg tctcgatatc tacgagatgc gccagaaaat cgcgcagctc 660ggcctcaagt atctgtga 678
<210> 150<211> 225<212> PRT<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO<222> (22)...(174)<223> Demetilmenaquinone metiltransferase<400> 150Met Asn Lys Pro1
Ala Val Ala Ala20
Gln Gly Arg Cys35
Gly Ala Ser Ile50
Asp Asn Leu Met65
Ile Leu Val Val
Glu Leu Leu Ala100
Ile Asp Ala Gly115
Pro Val Trp Ser130
Leu Gly Ser Val145
Ser Gly Asp Val
Arg Thr Ala Ala180
Lys Glu Asn Ala195
Asp Ile Tyr Glu210
Leu225
<210> 151
Val Val Val Arg Gln Val5 10
Leu Glu Lys Cys Gly Val25
Gly Leu Leu Ala Ala Tyr40
Ala Gly Ser Ala Val Thr55
Ile His Val Ala Val Glu70
Ala Pro Thr Ser Pro Cys85 90
Thr Ser Leu Arg Ala His105
Cys Arg Asp Val Arg Ser120
Arg Ala Ile Ser Ser Gln135
Asn Val Pro Ile Thr Cys150
Ile Val Ala Asp Asp Asp165 170
Gln Glu Val Ala Ala Ala185
Thr Arg Glu Arg Leu Ala200
Met Arg Gln Lys Ile Ala215
Glu Gln Pro Ser Ala Asp15
Thr Thr Val His Lys Ala30
Met Arg Pro Ile Phe Pro45
Val Ser Leu Pro Pro Gly60
Val Cys Ser Thr Gly Asn75 80
Thr Asp Gly Tyr Phe Gly95
Gly Val Arg Gly Leu Val110
Leu Thr Glu Met Lys Phe125
Gly Thr Val Lys Ala Thr140
Ala Gly Thr Leu Val Glu155 160
Gly Val Val Val Val Lys175
Ala Glu Gln Arg Val Arg190
Arg Gly Glu Leu Gly Leu205
Gln Leu Gly Leu Lys Tyr220<211> 675<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 151
atgagcggaa ttgttgtcca gaatatcgag cgcgccgacg cggcggtcat cgcagccttg 60gaaagctgcg gcgtctcaac tgtgcacgag gctcaaggcc gtactggact gctggcttct 120tatatgcgtc caatctacac aggtgcacgg atagcaggaa gtgcagtgac tatctccgca 180cctcctggcg ataactggat ggtgcatgtg gctatcgagc aattgcacgc aggcgacata 240ttgataatcg caccaacctc gccgtgcgaa gacggctatt tcggcgactt gctagccacg 300tctgcgcagg cccgtgggtg caagggtctg attatcaacg ccggcgttcg cgatgtgcgc 360gatttgactg aaatgggctt tcccgtctgg tcgaaggcca tttttgccca aggcactatc 420aaagcatcgc tgggttcggt caacataccc gtcgtgtgcg caggcgcgcc catcaatccc 480ggcgatgtga ttgtggccga tgatgacggc gtttgtgtcg tgccgcgcca gaatgcggca 540gaggtcgcaa aggcggcgaa ggcacgtgag gcgaacgagg ccgcaaagcg cgaccagctt 600gcaaccggca tcttggggct tgatatgtat gacatgcgcg gaaatctcgc cgagatgggg 660ctgaaatata tatga 675
<210> 152
<211> 224
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaguinone metiltransferase<400> 152
Met Ser Gly Ile Val Val Gln Asn Ile Glu Arg Ala Asp Ala Ala Val1 5 10 15
Ile Ala Ala Leu Glu Ser Cys Gly Val Ser Thr Val His Glu Ala Gln20 25 30
Gly Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Thr Gly
35 40 45
Ala Arg Ile Ala Gly Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp
50 55 60
Asn Trp Met Val His Val Ala Ile Glu Gln Leu His Ala Gly Asp Ile65 70 75 80
Leu Ile Ile Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp
85 90 95
Leu Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Lys Gly Leu Ile Ile
100 105 110
Asn Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Gly Phe Pro
115 120 125
Val Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Ile Lys Ala Ser Leu
130 135 140
Gly Ser Val Asn Ile Pro Val Val Cys Ala Gly Ala Pro Ile Asn Pro145 150 155 160
Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg
165 170 175
Gln Asn Ala Ala Glu Val Ala Lys Ala Ala Lys Ala Arg Glu Ala Asn
180 185 190
Glu Ala Ala Lys Arg Asp Gln Leu Ala Thr Gly Ile Leu Gly Leu Asp
195 200 205
Met Tyr Asp Met Arg Gly Asn Leu Ala Glu Met Gly Leu Lys Tyr Ile
210 215 220
<210> 153<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 153atgtccgtcg tcgtccagaa catcgcgcgc gccgaccagt ccgtcatcga tcggctcggc 60
gcctgcggcg tcgccactgt gcatgaagcg cagggccgca cgggactgct agccagctac 120
atgcgcccca tctatcgggg tgcgcgtctg gccgcgagcg cggtgaccat ctcggccccg 180
cccggcgaca attggatgct ccatgtcgcc atcgagcagc tgaggcccgg cgacatcatg 240
gtgcttgccc ccaccagccc ctgcgaggat ggctatttcg gcgacctgct tgcgacatcg 300
gccctggcgc gcggctgccg tggtctcgtc atcgaggcgg gcgttcgcga tgtcgccgac 360
ctcaccgcga tgaagtttcc cgtctggtcc aaagccatct tcgcccaggg caccgtcaag 420
ggaacgctgg gttcggtgaa cgtgcccgtc gtctgtgccg gcgcgctgat caatcccggt 480
gacgtcattg tggccgatga cgatggcgtc tgcgtggtgc gccgcgagga agccgaagcg 540
gtggcgcaaa aggccgaggc gcgcgtcgcc gccgaagagg ataagcgcaa gcgcctcgcc 600
gccggcgaac tcgggctcga tatctacaag atgcgcgagc ggctcgccga aaagggactc 660
aaatatgtct ag 672<210> 154<211> 223
Trp Met Leu His Val Ala Ile Glu Gln Leu Arg Pro Gly Asp Ile Met
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 154
Met Ser Val Val Val Gln Asn Ile Ala Arg Ala Asp Gln Ser Val Ile
1 5 10 15
Asp Arg Leu Gly Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Arg Gly Ala65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Leu Ala Arg Gly Cys Arg Gly Leu Val Ile Glu
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Lys Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Gly Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Ile Asn Pro Gly
145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Ala Glu Ala Val Ala Gln Lys Ala Glu Ala Arg Val Ala Ala Glu
180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val210 215 220
<210> 155
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 155
atgaacatcg tggtgcagaa catcgagcgc gccgatccgg ccgtgatcgc cggactcgcg 60gattgcggcg tcgccaccgt gcacgaggcg caggggcgca tcggactgat gtcgtccaag 120atgcgaccga tctatccggg cgcgcgtgtc gcggcgtcgg cggtgacggt gtcgctgccg 180ccggccgaca actggatgat tcatgtggcg gtggagcaga tcaaggccgg cgacatcatg 240gtggtcgctc cgacctcgcc gtctgatgcc ggctacttcg gcgacctact ggcgacctcg 300ctcaaggcgc ggggctgcgt gggactggtg atcgacgcgg gggtgcgcga tgtgcgcgac 360ctgaccgaaa tgcagttccc ggtgtggtcg acggcgatct cggcgcaggg gaccgtgaaagaaacgctgg gctcggtgaa cgtccctgtc atctgcgccg gcgcgcatgt ggagccgggcgacgtgattg ttgccgacga cgacggggtc tgcatcgtca agcgtgccaa tgcggcggcggtgcttgaga aggcgcgagc gcgggtcgcc ggcgaagccg acaagcgcga gagattagcgaacggcacgc tcgggctcga cctctacaag atgcgcgaag ggctggagaa gaagggtctaaaatatgtct ga<210> 156<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<220>
<221> SITE
<222> (204)...(207)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 156
Met Asn Ile Val Val Gln Asn Ile Glu Arg Ala Asp Pro Ala Val Ile1 5 10 15
Ala Gly Leu Ala Asp Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Ile Gly Leu Met Ser Ser Lys Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Val Ala Ala Ser Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Ile Lys Ala Gly Asp Ile Met65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Leu Lys Ala Arg Gly Cys Val Gly Leu Val Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Gln Phe Pro Val 115 120 125
Trp Ser Thr Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Val Ile Cys Ala Gly Ala His Val Glu Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Ile Val Lys Arg Ala
165 170 175
Asn Ala Ala Ala Val Leu Glu Lys Ala Arg Ala Arg Val Ala Gly Glu
180 185 190
Ala Asp Lys Arg Glu Arg Leu Ala Asn Gly Thr Leu Gly Leu Asp Leu
195 200 205
Tyr Lys Met Arg Glu Gly Leu Glu Lys Lys Gly Leu Lys Tyr Val
210 215 220
<210> 157<211> 690<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 157
atgagcgtgg tcgtcaccgg cgtgcagcgg cccgctcccg cggacgtcgc ggcattgggc 60cgcttcggcg tagcgacaat ccacgaggcg cagggacgca ctggactaat gcacgcttac 120atgcggccga tctattccgg cgcgcatgtc tgcggtccag cggtaaccgt gtctctcccg 180ccagcggaca actggatgat ccacgttgcc atcgagcaat gtgttgcagg cgacatcctc 240gtggtggcac caacctcgcc ttccgacgcc ggctatttcg gcgagctact ggcaacctcg 300cttcaggcgc gcggcgtgaa ggggcttatc atcgaggctg gctgccgcga tgtcgcggca 360ctgactgcca tgcgcttccc ggtgtggtcg cgctcgatct ctgcgcaggg gacagtgaag 420gagacgctcg gctcggtaaa tgtgcccgtc gtctgtaccg gcgcgctggt ggcgccgggc 480gatgttatcg tcgctgacga cgatggagtt gtcgtggtcc caaaggacaa tgtggccgcc 540
atcgcctccg cctccgcggc gcgtgaggcg aaggaggaag aggtgcgggc gaagctcaag 600
gccggcgtgc tgggcctcga catctacggc gtgcgcgagc ggctgaagga gaaggggctt 660
cgctatcgtg ccgccgacga aggccactag 690
<210> 158<211> 229<212> PRT<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaguinone metiltransferase<220><221> SITE<222> (20)... (40)<223> Multicopper oxidases signature 1. Prosite id = PS00079<400> 158
Met Ser Val Val Val Thr Gly Val Gln Arg Pro Ala Pro Ala Asp Val15 10 15
Ala Ala Leu Gly Arg Phe Gly Val Ala Thr Ile His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met His Ala Tyr Met Arg Pro Ile Tyr Ser Gly Ala35 40 45
His Val Cys Gly Pro Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn50 55 60
Trp Met Ile His Val Ala Ile Glu Gln Cys Val Ala Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Thr Ser Leu Gln Ala Arg Gly Val Lys Gly Leu Ile Ile Glu100 105 110
Ala Gly Cys Arg Asp Val Ala Ala Leu Thr Ala Met Arg Phe Pro Val
115 120 125
Trp Ser Arg Ser Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly 130 135 140
Ser Val Asn Val Pro Val Val Cys Thr Gly Ala Leu Val Ala Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Pro Lys Asp165 170 175
Asn Val Ala Ala Ile Ala Ser Ala Ser Ala Ala Arg Glu Ala Lys Glu180 185 190
Glu Glu Val Arg Ala Lys Leu Lys Ala Gly Val Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Val Arg Glu Arg Leu Lys Glu Lys Gly Leu Arg Tyr Arg Ala
210 215 220
Ala Asp Glu Gly His225
<210> 159<211> 672<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 159
atggcggtag tcgtccagaa tatcgagcgg gcggacggcg cggccatcga caagctggca 60acatgcggcg tggcgaccgt gcacgaggcg caggggcgca ccggtctgct ggcatcggcc 120atgcggccga tctacgccgg cgcccagatt gccggatcgg cgatcaccat ttcggcccca 180cccggcgaca actggatggt gtacgtcgca atcgaacagc tcaagcaggg cgacgtgctg 240gtgattgccc cgacgagtcc ctgtgaagac ggatacttcg gcgacctgct tgccacttcg 300gcgatggcgc gcggctgccg cggcctgatc atcgatgcgg gcgtgcgcga cgtgcgcgat 360ctgaccgcaa tgcgcttccc ggtctggtcc aaggcgatct tcgcgcaggg aaccgtcaag 420gagacgctcg ggtcggtcaa cgtggcggtc gtgtgcgcca acgcgctggt caaccccggc 480gacgtgatta tagccgacga cgacggcgtc gtcgtggtgc cacgcgcgca ggccggcgag 540
gtcctgaaga aggcggaagc gcgcatcgca tcggaagaag ccaagcgcaa gcggctggcg 600
gccggcgaac tcggcctcga tctctacgac atgcgcggca gactggccga caagggcctg 660
aagtatgttt ga 672
<210> 160
<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase
<400> 160
Met Ala Val Val Val Gln Asn Ile Glu Arg Ala Asp Gly Ala Ala Ile1 5 10 15
Asp Lys Leu Ala Thr Cys Gly Val Ala Thr Val His Glu Ala Gln Gly20 25 30
20 Arg Thr Gly Leu Leu Ala Ser Ala Met Arg Pro Ile Tyr Ala Gly Ala35 40 45
Gln Ile Ala Gly Ser Ala Ile Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Val Tyr Val Ala Ile Glu Gln Leu Lys Gln Gly Asp Val Leu 65 70 75 80
Val Ile Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Ala Met Arg Phe Pro Val115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu GlySer Val Asn Val Ala Val Val Cys Ala Asn Ala Leu Val Asn Pro Gly
Asp Val Ile Ile Ala Asp Asp Asp Gly Val Val Val Val Pro Arg Ala
Gln Ala Gly Glu Val Leu Lys Lys Ala Glu Ala Arg Ile Ala Ser Glu
Glu Ala Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Leu
<210> 161<211> 699<212> DNA
<220>
<223> Proteína obtida por amostra do ambiente<400> 161
atgagcgtgg tcgtcaccgg catcgcgcgg cctgaccgcg ccgaggtgga aggcttcgct 60
gccatcggcg tggcgaccat ccacgaggcg cagggccgca ccggcctgat gcagtccttc 120
atgcagccga tctataccgg cgcgcacatt ggcgggcccg cggtgacggt ctcgctgccg 180
cccggcgaca actggatgat tcacgtcgcg gtagagcagt gccaggccgg cgacgttctg 240
gtcgtcgccc ccacctcacc ctcggacgtc ggctatttcg gcgagctgct ggcgacctcg 300
ctcgtcgcac gcggcatccg cggcctcgtc atcgaggccg gctgccgcga taaaacggcg 360
ctgactgcga tgcgctttcc cgtttggtcc cgcgcggtct cggcgcaggg aacggtcaag 420
gagacgctcg gctcggtgaa tgtcccactc gtctgcgccg gtgcgctggt aaatcccggt 480
gatctcgtgg tcgccgatga cgacggtgtc gtcgttgtgc cgcgcgacaa ggtcgcggcg 540
gtgcgggcgg catcgcttgc acgcgaggcg aaggaggatg gggtgcgcgc gcggctgcag 600
gccggcgagc tcggactcga cgtctacggc atgcgcgagc gcctgaagga aaaggggctg 660
gtctatcgcg cggcgaacac cgacgggaaa aacggctga 699<210> 162<211> 232<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 162
Met Ser Val Val Val Thr Gly Ile Ala Arg Pro Asp Arg Ala Glu Val1 5 10 15
Glu Gly Phe Ala Ala Ile Gly Val Ala Thr Ile His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Met Gln Ser Phe Met Gln Pro Ile Tyr Thr Gly Ala
35 40 45
His Ile Gly Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Gln Ala Gly Asp Val Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Val Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Val Ala Arg Gly Ile Arg Gly Leu Val Ile Glu
100 105 110
Ala Gly Cys Arg Asp Lys Thr Ala Leu Thr Ala Met Arg Phe Pro Val
115 120 125
Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Leu Val Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Leu Val Val Ala Asp Asp Asp Gly Val Val Val Val Pro Arg Asp
165 170 175
Lys Val Ala Ala Val Arg Ala Ala Ser Leu Ala Arg Glu Ala Lys Glu180
185
190
Asp Gly Val Arg Ala Arg Leu Gln Ala Gly Glu Leu Gly Leu Asp Val
195
200
205
Tyr Gly Met Arg Glu Arg Leu Lys Glu Lys Gly Leu Val Tyr Arg Ala
210
215
220
Ala Asn Thr Asp Gly Lys Asn Gly
225
230
<210> 163
<211> 699
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 163
atgagtgtcg tcgtcacagg aattccgcgg gcctcggcat ctgagatcga cgcgcttcgc 60cgctgcgggg tggcgacgat ccacgaggcg caagggcgta ccggccttct gcgcgcgaac 120atgcggccga tctacgctgg tgcccatgcc gtcggatcgg cggtgaccgt gtcgttgccc 180ccggccgata actggatgat ccatgtggcg gtcgagcagt gtcaggcagg agacgtcctc 240gtcgtggccc cgacttcgcc ttcggatgcc ggctactttg gcgagctgct ggcgacctct 300ctcgccgcgc ggggtgtgcg cggcctcgtt atcgaggctg ggtgccgcga cgtggcggcg 360ttgacggcaa tgcgttttcc ggtctggtca cgcgccgtct ccgcacaagg gacggtgaag 420gagacgcttg gttcggtgaa tgtgccgatc atctgcgccg gtgctctcgt gaatccggga 480gacgttgtcg ttgccgacga tgacggcgtg gtcgttgtgc cacgcatcgg agtggcggat 540gtcgctgccg cctcggccgc gcgtgaagcg aaggaggatc aggtcagggc gcgcttcaag 600gcgggcgagc tcgggctcga tatctatagg atgcgcgagc ggctgaagga aaaagggctc 660gtctaccgta ccgcgggtga tggcccaggc gggggctag 699
<210> 164<211> 232<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase
<400> 164
Met Ser Val Val Val Thr Gly Ile Pro Arg Ala Ser Ala Ser Glu Ile1 5 10 15
Asp Ala Leu Arg Arg Cys Gly Val Ala Thr Ile His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Leu Arg Ala Asn Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
His Ala Val Gly Ser Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Gln Ala Gly Asp Val Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Ala Ala Arg Gly Val Arg Gly Leu Val Ile Glu
100 105 110
Ala Gly Cys Arg Asp Val Ala Ala Leu Thr Ala Met Arg Phe Pro Val
115 120 125
Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Ile Ile Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Val Val Val Ala Asp Asp Asp Gly Val Val Val Val Pro Arg Ile
165 170 175
Gly Val Ala Asp Val Ala Ala Ala Ser Ala Ala Arg Glu Ala Lys Glu
180 185 190
Asp Gln Val Arg Ala Arg Phe Lys Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Arg Met Arg Glu Arg Leu Lys Glu Lys Gly Leu Val Tyr Arg Thr210 215 220
Ala Gly Asp Gly Pro Gly Gly Gly225 230
<210> 165<211> 672<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 165
atgggtgtgg tggtccagaa tatcgcccgc gccgcgcaat ccgtcatcga ccggctcgcg 60gcttgcggcg tcgcgacggt tcatgaagca caggggcgca aaggcctgct cgccagccgt 120atgcggccga tctatcccgg cgcccggatc gccgcgagcg cggtgacgat ctcagcgccg 180cccggtgaca actggatgat tcatgtggcg atcgagcagc tcaagacggg tgacatcctg 240cttctggcgc cgaccagtcc ttgcgaggac ggctatttcg gcgatctgct tgcgacgtcc 300gcgatggcgc ggggctgtcg gggattgatc atcgatgctg gcgtgcgcga tgtcgccgac 360ctggccgcga tgaaattccc tgtctggtcg aaggccatct tcgcgcaggg cacggtcaag 420gagacagtcg gttccgtgaa tgtgccggtc gtctgcgccg gcgcgctggt caatcccggc 480gatgtgatcg tcgccgacga tgacggcgtc tgtgtcgtca ggcgcgagga tgcggctgat 540gtggctgaca aggccgaggc gcgcgtcgcg gccgaagaga gcaagcgcaa gcggctagca 600tcaggcgagc tcggtctcga catttacgat atgcgccaac ggctcacgga gaaaggcctt 660agatatgtct ga 672
<210> 166<211> 223<212> PRT<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaguinone metiltransferase<400> 166
Met Gly Val Val Val Gln Asn Ile Ala Arg Ala Ala Gln Ser Val Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ser Arg Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Ile Glu Gln Leu Lys Thr Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Ala Ala Met Lys Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Val Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Asp Ala Ala Asp Val Ala Asp Lys Ala Glu Ala Arg Val Ala Ala Glu
180 185 190
Glu Ser Lys Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asp Met Arg Gln Arg Leu Thr Glu Lys Gly Leu Arg Tyr Val
210 215 220
<210> 167<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 167
atgggcgtcg tggtccagaa catcgcccgc gccgagcgag atgtcatcga ccggcttgcg 60atctgcggcg tcgcgaccgt gcatgaggcg caagggcgca aggggctgct ggcgagctat 120atgcggccga tctatcccgg cgcgcggatt gcggcgagcg ccgtcaccat ttcggctccc 180cccggtgaca actggatggt ccatgtggcg atcgagcagg tgagggaggg cgacatcctg 240ctgctcgctc cgacgagccc ttgcgaggac gggtattttg gcgacctgct ggcgacctcg 300gccatggcgc gcggatgccg cgggctggtc atcgatgccg gcgtgcgtga tgtcgccgat 360ctcacggcga tgcagttccc cgtctggtcg aaggcgatct tcgcacaggg cacggtcaag 420gagacgctgg gctctgtgaa tgtgccggtc gtctgcgccg gcgcgcttat caatccgggc 480gatgtcatcg tggcggatga tgacggcgtc tgcgtcgtca ggcgcgagga ggcggccgat 540gtcgccgcca aggccgaggc gcgcgttggc gccgaggagg ccaagcgcaa gcgtctcgct 600gccggcgaac tcggactcga catctacgat atgcgcaggc gtctcgccga gaagggattg 660aaatatgtct ga 672
<210> 168<211> 223<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 168
Met Gly Val Val Val Gln Asn Ile Ala Arg Ala Glu Arg Asp Val Ile1 5 10 15
Asp Arg Leu Ala Ile Cys Gly Val Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met Val His Val Ala Ile Glu Gln Val Arg Glu Gly Asp Ile Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Val Ile Asp100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro Val115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Ile Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu165 170 175
Glu Ala Ala Asp Val Ala Ala Lys Ala Glu Ala Arg Val Gly Ala Glu180 185 190
Glu Ala Lys Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Asp Met Arg Arg Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val210 215 220
<210> 169<211> 672<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 169
atgagtgtgg tcgttcagaa tatcgagcgg gccgatcccg ccatcatcgc cggccttgccgaatgcggtg tggcgaccgt ccacgaagcg cagggccgca agggcctgct ggcgtcctatatgcgtccca tctactcggg cgcgcgcctg gcagcaagtg ccgtgaccat ttcggcgccg 180
ccctgcgaca actggatgtt gcatgtcgcc attgagaaat tgcgggaggg cgacattctc 240
gtcctcgccc caacgtcgcc gtctgacgct gggtactttg gcgacctgct ggccacttcg 300
gcgcaggccc gcggctgcaa gggcctgatc attgatgccg gcgtacgcga cgtggccgac 360
ctcacgcgga tgaaattccc cgtctggtcc aaggcgatat ttgcccaggg cacgatcaag 420
gagacgctgg gctcggtcaa tgtgccgatt gtctgcgcgg gcgagctggt caatgccggc 480
gacatcatcg tggccgatga cgatggggtt tgcgttgtgc gccgcgagga ggctgctgcg 540
gtgctcgaag cctcgcagaa gcgcgtggcc aatgaagaga gcacgcgcaa gcgcctcgct 600
gccggggaac tgggactcga catctatgga atgcgccagc ggctgaccga gaaggggttg 660
aagtatgtct ga 672<210> 170<211> 223<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaguinone metiltransferase<400> 170
Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Pro Ala Ile Ile1 5 10 15
Ala Gly Leu Ala Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
25 20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Cys Asp Asn
50 55 60
Trp Met Leu His Val Ala Ile Glu Lys Leu Arg Glu Gly Asp Ile Leu
65 70 75 80
Val Leu Ala Pro Thr Ser Pro Ser Asp Ala Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Arg Met Lys Phe Pro Val 115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Ile Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Ile Val Cys Ala Gly Glu Leu Val Asn Ala Gly145 150 155 160
Asp Ile Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Ala Ala Ala Val Leu Glu Ala Ser Gln Lys Arg Val Ala Asn Glu
180 185 190
Glu Ser Thr Arg Lys Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Gln Arg Leu Thr Glu Lys Gly Leu Lys Tyr Val
210 215 220
<210> 171<211> 672<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 171
atgaccgtcg tcgtccgcaa cttcgagcgc gcgtcgcccg aagtcgtagc cgtgctgggc 60gaatgcggcg tggcgacggt gcatgaagcg caaggccgca gcggcctcat gctcgccttc 120atgcggccga tcttcgcggg cgcccgcatc gccgggccgg cggtgacagt ttccgtcccg 180ccgggcgaca actggatgat ccatgtggcg atcgagcagt gccgcgaagg cgacgtgctc 240gtcgtggcgc cgaccagccc ctccgaggac ggctatttcg gcgacctgct cgcgcactcg 300ctgatggcgc ggggcgtcaa ggggctcgtc attgaggccg gcgttcgcga tctacgcgat 360ctcaccgaga tgcgctttcc ggtctggtcc cggacgatct ccgcgcaggg aacggtcaag 420gagacgctcg gctcggtgaa cgtgccgatc gtctgcgccg gcgcggcggt cgatccgggc 480gacgtagtcg tggccgacga cgacggcgtc tgcatcgtga gacgcgcccg ggcggaagag 540
gtcgcgaaag cggcgcgcga acgcgaggcg aaggagaggg agacgcggcg gcggctggcc 600
gccggcgagc tcggtctcga catctatggc atgcgcgaga agcttgcggc caaagggctg 660
aaatatgtct ga 672
<210> 172
<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 172
Met Thr Val Val Val Arg Asn Phe Glu Arg Ala Ser Pro Glu Val Val 1 5 10 15
Ala Val Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg Ser Gly Leu Met Leu Ala Phe Met Arg Pro Ile Phe Ala Gly Ala35 40 45
Arg Ile Ala Gly Pro Ala Val Thr Val Ser Val Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Ile Glu Gln Cys Arg Glu Gly Asp Val Leu
65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala His Ser Leu Met Ala Arg Gly Val Lys Gly Leu Val Ile Glu100 105 110
Ala Gly Val Arg Asp Leu Arg Asp Leu Thr Glu Met Arg Phe Pro Val115 120 125
Trp Ser Arg Thr Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu GlySer Val Asn Val Pro Ile Val Cys Ala Gly Ala Ala Val Asp Pro Gly
Asp Val Val Val Ala Asp Asp Asp Gly Val Cys Ile Val Arg Arg Ala
Arg Ala Glu Glu Val Ala Lys Ala Ala Arg Glu Arg Glu Ala Lys Glu
Arg Glu Thr Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
<210> 173<211> 672<212> DNA
<220>
<223> Proteína obtida por amostra do ambiente<400> 173
atgggcgttg tggtccagaa tgtcggccgc gccgaacaat ccgtcatcga ccggctcgca 60
gcctgtggcg tggcgactgt gcatgaggcg cagggccgcc ggggcctcct cgcgagctac 120
atgcggccga tctattccgg tgcacggatc gccgcgagtg cagtgacgat ctcggcgccg 180
cccagtgaca actggatgct gcatgtggcg atcgagcaat tgaagcaggg cgatctgctt 240
ctgctcgcgc ccaccagccc gtgcgaagac ggctatttcg gtgacctgct cgcgacctct 300
gccgtggcgc gaggttgccg cggcctgatc atcgacgcgg gcgtacgcga tgtcgccgac 360
ctgacggcca tgtcgtttcc ggtctggtcc aaggcgatat ctgcgcaagg caccgtcaag 420
gagacattgg gctcggtgaa tgtgccggtc gtctgcgccg gtgcgctggt caacccaggc 480
gacgtgatcg tggccgacga cgatggcgtc tgcgtcgtgc gccgcgagga ggcggcggag 540
atcgccgaca aggccgaagc gcgcgtcgcg gccgaggaaa gcaagcgggc gcggctggca 600
gccggcgaac ttgggttgga tatctacgac atgcgcaagc ggctcgccga gaaagggctg 660
aagtatgtct ga 672<210> 174<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 174
Met Gly Val Val Val Gln Asn Val Gly Arg Ala Glu Gln Ser Val Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ser Gly Ala
35 40 45
Arg Ile Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Ser Asp Asn
50 55 60
Trp Met Leu His Val Ala Ile Glu Gln Leu Lys Gln Gly Asp Leu Leu65 70 75 80
Leu Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Val Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp
100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Ser Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Ala Ala Glu Ile Ala Asp Lys Ala Glu Ala Arg Val Ala Ala GluGlu Ser Lys195
Tyr Asp Met
210
<210> 175<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 175
atgggtgtcg tcgtccagaa tatcgagcgc gccgatcctt cggtcatcga acggctggcg 60gcatgcgggg ttgctactgt gcacgaagcg cagggacgca agggtctgct ggcgagccat 120atgcggccga tctatgccgg tgcgcgcctt gcagccagtg ccgtgaccat atcggcgccg 180ccgggcgata actggatgat ccatgtcgcc atcgaacagc tcagggcggg tgacataatg 240gtgcttgccc cgacaagtcc ctgcgaggat ggctatttcg gcgacttgct ggcgacgtct 300gctgcggcgc gaggctgccg ggggctgatc atcgatgcgg gcgtgcgtga cgtggcggac 360ctgacggcga tgaagtttcc ggtgtggtcg aaggccattt ttgcgcaggg cacggtcaag 420gaaacgctgg gctcggtcaa tgtgccggtg gtctgcgcgg gagcgctggt caacccgggc 480gacgtgatcg tggccgatga cgacggcgtc tgcgtcgtgc gacgcgagga agcggccgcg 540gtggccgaca aggccgaggc gcgcgtggct gcggaagagg acaagcgcag gcgcctggcg 600gccggggaac tgggcctcga catctacaag atgcgcgagc gcctggccga gaagggcctc 660aggtatgtct ga 672
<210> 176
<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
180 185 190
Arg Ala Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
200 205
Arg Lys Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val215 220<222> (20)...(172)<223> Demetilmenaquinone metiltransferase<400> 176
Met Gly Val Val Val Gln Asn Ile Glu Arg Ala Asp Pro Ser Val Ile15 10 15
Glu Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Ala Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn50 55 60
Trp Met Ile His Val Ala Ile Glu Gln Leu Arg Ala Gly Asp Ile Met65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu85 90 95
Leu Ala Thr Ser Ala Ala Ala Arg Gly Cys Arg Gly Leu Ile Ile Asp100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Lys Phe Pro Val115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu165 170 175
Glu Ala Ala Ala Val Ala Asp Lys Ala Glu Ala Arg Val Ala Ala Glu180 185 190
Glu Asp Lys Arg Arg Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Arg Tyr Val210 215 220
<210> 177<211> 675<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 177
atggggggcg tagtcgtgca gaacatcgag cgggccgacg cggaaaccat ccgccggctc 60ggcgaatgcg gtgtggcgac ggtgcacgag gcgcaggggc gcagcgggct gatggcgccc 120catatgacgc cggtctggcg cggcgcatcg gttgccggtt cggcggtgac gatctccgcc 180ccgcccggcg acaactggat gctgcacgtg gcgatcgagc aggtgcatga gggcgatatc 240ctcgtgctgg cgccgaccag tccttccacg gacggctatt tcggcgattt gcttgccacc 300tcggcgatgg cgcgggggtg tcgcgggctg gtcatcgaag caggcgtgcg cgacgtggcc 360gacctgacga agatgcggtt ccccgtctgg tcgaaggcgg tccacgcgca gggtacggtc 420aaagagacgc cgggctcagt caacgtgccg gtcgtctgcg ccggtgccca tgtgcggccg 480ggcgacgtca tcgtggccga cgatgacggc gtgtgcgtgg tcaggcgcga ggaggcggcg 540gaaatattga ggaaggccga ggcccgcatc gccaacgaag ccgacaagcg cgagcgtttc 600gccgccggcg aactcggcct cgacatctac ggcatgcgcg agaagctggc cgccaaggga 660ttgaaatata tctga 675
<210> 178
<211> 224
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinone metiltransferase<400> 178
Met Gly Gly Val Val Val Gln Asn Ile Glu Arg Ala Asp Ala Glu Thr1 5 10 15
Ile Arg Arg Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln20 25 30
Gly Arg Ser Gly Leu Met Ala Pro His Met Thr Pro Val Trp Arg Gly
35 40 45
Ala Ser Val Ala Gly Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp
50 55 60
Asn Trp Met Leu His Val Ala Ile Glu Gln Val His Glu Gly Asp Ile65 70 75 80
Leu Val Leu Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly Asp
85 90 95
Leu Leu Ala Thr Ser Ala Met Ala Arg Gly Cys Arg Gly Leu Val Ile
100 105 110
Glu Ala Gly Val Arg Asp Val Ala Asp Leu Thr Lys Met Arg Phe Pro
115 120 125
Val Trp Ser Lys Ala Val His Ala Gln Gly Thr Val Lys Glu Thr Pro
130 135 140
Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala His Val Arg Pro145 150 155 160
Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg
165 170 175
Glu Glu Ala Ala Glu Ile Leu Arg Lys Ala Glu Ala Arg Ile Ala Asn
180 185 190
Glu Ala Asp Lys Arg Glu Arg Phe Ala Ala Gly Glu Leu Gly Leu Asp
195 200 205
Ile Ty^ Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Ile
210 215 220
<210> 179<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 179atgggggtcg tggtccagaa catcgaacgc gccgatcagg ccgtcatcaa ccgccttgcc 60
gcctgcggcg tggccaccgt gcacgaggcg cagggccgca agggcctgct cgccgccaat 120
atgcgtccga tctacagcgg agaacgtctg gcggcctcgg ccgtgacgat ttccgcgccc 180
cccggtgaca actggatggt ccatgtcgcg atcgagcaat tgcaggccgg tgacatcatg 240
gttttggccc ccacctcgcc ctgcgaggac ggctatttcg gtgatcttct ggccacgtcg 300
gctatcgcac gtggctgcaa gggcctgatc atcgatgcgg gcgtgcgcga tgtgtcggat 360
ctgacggcga tgaaattccc cgtctggtcc aaggcgatct tcgcccaagg cacggtcaag 420
gaaacccttg ggtcggtgaa tattcccgtg gtctgcgccg gcgcgctgat caatcccggt 480
gatgtaattg tggccgatga cgacggcgtt tgcgtggtcc gccgcgagga agccgaagcc 540
gttgcagcca aagccgaagc ccgtgtcgca gccgaagaag gcaagcgcgt gcgtctggcc 600
gcgggtgaac tgggccttga tatctataac atgcgcgaac gtctggccga gaagggcctg 660
aaatatgtct ga 672<210> 180<211> 223
Trp Met Val His Val Ala Ile Glu Gln Leu Gln Ala Gly Asp Ile Met
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<400> 180
Met Gly Val Val Val Gln Asn Ile Glu Arg Ala Asp Gln Ala Val Ile
1 5 10 15
Asn Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Ala Asn Met Arg Pro Ile Tyr Ser Gly Glu65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Ile Ala Arg Gly Cys Lys Gly Leu Ile Ile Asp
100 105 110
- Ala Gly Val Arg Asp Val Ser Asp Leu Thr Ala Met Lys Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Ile Pro Val Val Cys Ala Gly Ala Leu Ile Asn Pro Gly
145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Ala Glu Ala Val Ala Ala Lys Ala Glu Ala Arg Val Ala Ala Glu
180 185 190
Glu Gly Lys Arg Val Arg Leu Ala Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Asn Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val
210 215 220
<210> 181<211> 687<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 181
atgagcggtc atcgcatcgt ccgcaactat ccaaaagcag actcgggcgt cgcctccgct 60ctgggcgctc tgggcagcgc gaccgtgcac gaggccatgg gccgcgtggg atacgccggc 120caccgtatcc ggccgatcca gcagggcgtg tcgatcggcg gcaccgccgt aaccgtctcg 180gtcgcaccgg gtgacaacct gatggttcac gccgcgattg ccgaggccaa cgaaggcgac 240gtgctggtcg tcgttcccgt gagcgacagc gcgttcggct ttatcggcga cctgatggcg 300actcagatgc gctctcgccg gctgcgcggt tacgtgacct ccggcggcgt gcgtgatacc 360gccgagttgg cccgcttggg ttttccggta tggacgaaat acgtctcgtc gcaagggacg 420gtgaaagata cccccggctc ggtcaatgtg cccgtcgtgc tcgaaggcgt cgtggtccat 480cctggagacg tcgtggtagc ggacgacgac ggcgtcacca tcgtgccgcg cgagatcgcc 540gccgacacgc tccaggccgc tcgggcccgc gtggagaagg aagccgcgac ccgatcgcgg 600tatgcggcgg gcgagctttc actcgacgtc aacaacctgc gcccgaccct cgcagcgctg 660ggagtggagt atgtcgattt cgggtga 687
<210> 182<211> 228<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> SINAL
<222> (1) . . . (31)<220>
<221> DOMÍNIO<222> (22),. . . (174)
<223> Demetilmenaquinone metiltransferase
<400> 182
Met Ser Gly His Arg Ile Val Arg Asn Tyr Pro Lys Ala Asp Ser Gly1 5 10 15
Val Ala Ser Ala Leu Gly Ala Leu Gly Ser Ala Thr Val His Glu Ala20 25 30
Met Gly Arg Val Gly Tyr Ala Gly His Arg Ile Arg Pro Ile Gln Gln35 40 45
Gly Val Ser Ile Gly Gly Thr Ala Val Thr Val Ser Val Ala Pro Gly
50 55 60
Asp Asn Leu Met Val His Ala Ala Ile Ala Glu Ala Asn Glu Gly Asp
65 70 75 80
Val Leu Val Val Val Pro Val Ser Asp Ser Ala Phe Gly Phe Ile Gly85 90 95Asp Leu Met Ala Thr Gln Met Arg Ser Arg Arg Leu Arg Gly Tyr Val
100 105 110
Thr Ser Gly Gly Val Arg Asp Thr Ala Glu Leu Ala Arg Leu Gly Phe115 120 125
Pro Val Trp Thr Lys Tyr Val Ser Ser Gln Gly Thr Val Lys Asp Thr 130 135 140
Pro Gly Ser Val Asn Val Pro Val Val Leu Glu Gly Val Val Val His145 150 155 160
Pro Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Thr Ile Val Pro 165 170 175
Arg Glu Ile Ala Ala Asp Thr Leu Gln Ala Ala Arg Ala Arg Val Glu
180 185 190
Lys Glu Ala Ala Thr Arg Ser Arg Tyr Ala Ala Gly Glu Leu Ser Leu195 200 205
Asp Val Asn Asn Leu Arg Pro Thr Leu Ala Ala Leu Gly Val Glu Tyr
210 215 220
Val Asp Phe Gly225
<210> 183
<211> 693
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 183
atgcgcggcg tcgtggtccg gaacattcca cgcgccgacg cgcgcgagat cgcggttctg 60catgaagcgg gcgtcgccac cgtgcacgag gcgcagagcc gcctcggtct gctcgcttcg 120tacatgcggc ccatttacga gggcgcatcg attgccggtc cggccgtgac cgtgctcgtg 180ccgccatcgg acaactggat gctgcacgtc gccgctgaac agtgccagcc cggcgatgtc 240ctcgtggtcg cgccgacgtc gccgtgcgaa gacggctact tcggcgaact gttggcgacg 300tcgctggcac agctcggcgt gcgcggactg atcatcgatg cgggctgccg cgacatccgt 360gcgctcaagg cgatgaattt ccccgtgtgg tcgaaaggga tctcggcgca agggaccgtc 420aaggaaacgc tcgggtcggt gaacatcccc gtggtgtgcg cgcagcaact ggtgcgaccg 480ggcgacgtga tcgtggccga tgacgatggc gtcgtggtcg tcgcgttcga gacggtggcg 540gccgtggcga gcgccgcacg cgcgcgcctc gagaaggaag agaagacgcg cagcgtgctt 600gcgacaggcc agctcggtct cgactactac gcgatgcgcg agaagcttgc ggcaaagggt 660ttgcgttacg tcgattccgc tgcgggtctt tga 693
<210> 184<211> 230<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (21)... (173)<223> Demetilmenaquinone metiltransferase<400> 184
Met Arg Gly Val Val Val Arg Asn Ile Pro Arg Ala Asp Ala Arg Glu1 5 10 15
Ile Ala Val Leu His Glu Ala Gly Val Ala Thr Val His Glu Ala Gln
20 25 30
Ser Arg Leu Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Glu Gly
35 40 45
Ala Ser Ile Ala Gly Pro Ala Val Thr Val Leu Val Pro Pro Ser Asp
50 55 60
Asn Trp Met Leu His Val Ala Ala Glu Gln Cys Gln Pro Gly Asp Val
65 70 75 80
Leu Val Val Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Thr Ser Leu Ala Gln Leu Gly Val Arg Gly Leu Ile Ile
100 105 110
Asp Ala Gly Cys Arg Asp Ile Arg Ala Leu Lys Ala Met Asn Phe Pro115 120 125Val Trp Ser Lys Gly Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu
Gly Ser Val Asn Ile Pro Val Val Cys Ala Gln Gln Leu Val Arg Pro
Glu Thr Val Ala Ala Val Ala Ser Ala Ala Arg Ala Arg Leu Glu Lys
Glu Glu Lys Thr Arg Ser Val Leu Ala Thr Gly Gln Leu Gly Leu Asp
Tyr Tyr Ala Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Arg Tyr Val
Asp Ser Ala Ala Gly Leu
<210> 185
<211> 678
<212> DNA
<213> desconhecido
<220>
<400> 185
atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60
ctggagaggt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120
tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180
ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240
attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300
acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360
cgctctctca cagaaatgaa atttccggcc tggagccgcg ccgtcagttc acaggggaca 420
gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcgag 480
gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540
gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600
cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660ggccttaaat atctctga<210> 186<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaguinone metiltransferase<400> 186
Met Asn Arg Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Arg Tyr Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Pro Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Val Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ala Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Ala Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Arg Val Glu145 150 155 . 160Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg180 185 190
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu
225
<210> 187<211> 678<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 187
atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60
ctggagaagt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120
tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180
ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240
attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300
acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360
cgctctctca cagaaatgaa atttccggtc tggagccgcg ccgtcagtcc acaggggaca 420
gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcgag 480
gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540
gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600
cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660
ggccttaaat atctctga 678
<210> 188
<211> 225<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 188
Met Asn Arg Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Pro Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Val Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ala Pro Ile Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Pro Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Arg Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg180 185 190Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 189<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 189
atgaacaaac cggtggtgat ccggcaactg gagcgggcgc cggctgatgc ggtggcggcg 60ctcgaaaaat atggtgtgtc caccgtgcat gaagctcagg gacgttgcgg actactcgct 120tcctacatgc gaccgattta tccgggtgcc gctattgccg ggtcggcggt cacggtgtca 180cttccgcccg gcgataacct gatgattcac gttgccgtcg aggtttgcca gtccggcgac 240atactcgtgg ttgcccccac ctcgccttgc tcggacggat acttcgggga gttgttggca 300acatctttgc gcgcccacgg cgtgaagggg cttgtcattg aggcaggatg ccgtgatgtt 360cgctcgctca ccgaaatgaa gttcccggtc tggagccgcg ccgtcagttc gcaaggcacc 420gtgaagtcta acctcggatc ggtgaatgtg ggcatagtct gtgcgggtgc acacattgac 480gctggcgatg tggtcgtggc agatgacgac ggtgtcgtgg cggtgaagcg cgcatccgcc 540caagaagtag ttggggcgtg cgaacaacgg gttcgcaagg aagaggcagc ccgtgagcgg 600ctggcgcggg gagagcttgg cctcgacatc tacggcttgc gcacacgaat cgcggaaatg 660ggtctcaagt atcaatga 678
<210> 190<211> 225<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 190
Met Asn Lys Pro Val Val Ile Arg Gln Leu Glu Arg Ala Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Asn
130 135 140
Leu Gly Ser Val Asn Val Gly Ile Val Cys Ala Gly Ala His Ile Asp145 150 155 160
Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Ala Val Lys
165 170 175
Arg Ala Ser Ala Gln Glu Val Val Gly Ala Cys Glu Gln Arg Val Arg
180 185 190
Lys Glu Glu Ala Ala Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Arg Ile Ala Glu Met Gly Leu Lys Tyr210 215 220Gln225
<210> 191<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 191
atgaacaaac cggtggtgat ccggcaactg gagcgggcgc cggctgatgc ggtggcggcg 60ctcgaaaaat atggtgtgtc caccgtgcat gaagctcagg gacgttgcgg actactcgct 120tcctacatgc gaccgattta tccgggtgcc gctattgccg ggtcggcggt cacggtgtca 180cttccgcccg gcgataacct gatgattcac gttgccgtcg aggtttgcca gtccggcgac 240atactcgtgg ttgcccccac ctcgccttgc tcggacggat acttcgggga gttgttggca 300acatctttgc gcgcccacgg cgtgaagggg cttgtcattg aggcaggatg ccgtgatgtt 360cgctcgctca ccgaaatgaa gttcccggtc tggagccgcg ccgtcagttc gcaaggcacc 420gtgaagtcta acctcggatc ggtgaatgtg ggcatagtct gtgcgggtgc acacattgac 480gctggcgatg tggtcgtggc agatgacgac ggtgtcgtgg cggtgaagcg cgcatccgcc 540caagaagtag ttggggcgtg cgaacaacgg gttcgcaagg aagaggcaac ccgtgagcgg 600ctggcgcggg gagagcttgg cctcgacatc tacggcttgc gcacacgaat cgcggaaatg 660ggtctcaagt atcaatga 678
<210> 192<211> 225<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaguinone metiltransferase<400> 192Met Asn Lys Pro Val Val Ile Arg Gln Leu Glu Arg Ala Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Asn
130 135 140
Leu Gly Ser Val Asn Val Gly Ile Val Cys Ala Gly Ala His Ile Asp145 150 155 160
Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Ala Val Lys
165 170 175
Arg Ala Ser Ala Gln Glu Val Val Gly Ala Cys Glu Gln Arg Val Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Arg Ile Ala Glu Met Gly Leu Lys Tyr210 215 220
Gln225
<210> 193<211> 678<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 193
atgaatacac cggtggtagt ccggcaggtg gagcagccgc cagcaggtgc ggttgccaca 60ctggagaagt gtggggtgac aaccgtgcat gaggctcaag gacgttgtgg cctgcttgcg 120ccctacctgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgact 180ttgcctccgg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240attctcgtag tttcaccgac ctcggcttgc accgatggct acttcggtga gctgttggcc 300acatctctcc gtgcccacgg tgtgagaggg ctggtgatcg atgccggatg ccgtgatgtg 360cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccgtcagtcc gcagggcacc 420gtcaaggcca cgctgggatc ggtgaatgtg cccatcgtgt gcgcgggcgc actggtcgaa 480gctggtgatg ttatcgtcgc cgatgacgat ggcgtggtgg tggtgaggcg cgcgctggcc 540gaagaggtcg ccgcggcggc ggaacaaagg gttcagaaag agaatgtgac ccgcgagcgg 600cttgcacgcg gagagctcgg cctcgatatt tacgacattc gccaacggat cgcgcaactg 660ggccttaaat atctgtaa 678
<210> 194<211> 225<212> PRT<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO<222> (22)...(174)<223> Demetilmenaquinone metiltransferase<400> 194
Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Gly
1 5 10 15
Ala Val Ala Thr Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala20 25 30Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Leu Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Thr Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Ala Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Pro Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Arg
165 170 175
Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln Arg Val Gln
180 185 190
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Ile Arg Gln Arg Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 195
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 195
atgaatacac cggtggtagt ccggcaggtg gagcagccgc cagcaggtgc ggttgccaca 60
ctggagaagt gtggggtgac aaccgtgcat gaggctcaag gacgttgtgg cctgcttgcg 120
ccctacatgc gcccgattta cccgggagca gccatcgccg gttccgcgat caccgtgact 180
ttgcctccgg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240
attttggtgg tttcaccgac ctcggcttgc accgatggct acttcggtga gctgttggcc 300
acctctctcc gtgctcacgg tgtgagaggg ctggtgatcg atgccggatg ccgtgatgtg 360
cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccgtcagttc gcagggcacc 420
gtcaaggcca cactgggatc ggtgaatgtg cccatcgtgt gcgcgggcgc actggtcgaa 480
gctggtgatg tcatcgtcgc cgatgacgat ggagtggtgg tggtgaggcg cgcgctggcc 540
gaagaggtcg ccgccgcggc ggaacaaagg gctcagaaag agaatgtgac ccgcgagcga 600
ctggcgcgcg gagagctcgg cctcgatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggccttaaat atccgtaa 678<210> 196
<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 196
Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Gly1 5 10 15
Ala Val Ala Thr Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Thr Leu Pro Pro Gly50 55 60Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Ala Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Arg
165 170 175
Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln Arg Ala Gln
180 185 190
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Pro225
<210> 197
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 197
atgaataaac cggtggtaat ccggcaagtg gagcagccac cagcggacgc cgttgcagcattggagaagt atggcgtcac aaccgtgcat gaggtgcagg gacgctgtgg cctcctcgcgcactacgtgc gtccgattta cgcaggagct gcaatcgcag gttccgctgt tactgtgtcgttgcctcccg gcgacaacct catgattcat gttgctgtcg aggtctgcgg tcctggaaat 240
attctggttg tttcacccac ctccccttgt acagacggct atttcggtga actgttggca 300
acgtctttgc gcgctcacgg agtgaagggg cttgtgatcg atgccggatg ccgcgacgtt 360
cgctcactga cggagatgaa attcccggtg tggagccggg ccatctgctc acaggggaca 420
gtcaaggcta cactcggatc ggtcaatgtg cccatcatgt gcgcgggcgc actcgtcgaa 480
gccggcgacg tcatcgtggc cgacgatgat ggagtggtgg ttgtgaagcg agcgatggcg 540
attgacgtcg ccgcggccgc cgagcaaagg gttcacaaag agaatacgac ccgcgaacgg 600
cttgcacgtg gagagcttgg gctcgatatt tacgagatgc gtcagaaaat cgtacaactg 660
ggccttaagt attcctga 678
<210> 198
<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<220>
<221> SITE
<222> (197) .. . (200)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 198
Met Asn Lys Pro Val Val Ile Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Val
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Val Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly50 55 60Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Cys Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Met Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Met Ala Ile Asp Val Ala Ala Ala Ala Glu Gln Arg Val His
180 185 190
Lys Glu Asn Thr Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Glu Met Arg Gln Lys Ile Val Gln Leu Gly Leu Lys Tyr210 215 220
Ser225
<210> 199
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 199
atgaacaagc ccgtggtggt gcgggacatc gagcggccgc cggcggatgc catcgcggcgctcgaacggt acggtgtgtc cacggtgcac gaggcgcagg gccgttgcgg gctgctggccccttacatgc gtccgatcta tgcgggcgca gcgatcgctg gtcccgccgt tacagtttcacttccgccgg gagacaacct gatgatccac gtcgccgtcg aagtgtgccg tcccggagac 240atcctggttg tcacgccgac ctcgccgtgc accgacggct attttggaga gttgctcgcg 300acttcgctgg ctgcgcacgg ggtgaaagga ctggtcattg atgcgggatg ccgcgatgtt 360cgagcgttga ccgagatgaa atttcccgtc tggagccgcg ccgtgagttc gcagggaacg 420gtgaaggcta cacttgggtc ggtgaatgtg acgattgcat gcgcgggggc tacggttgag 480cccggtgacg taatcgtagc ggacgatgat ggcgtcgttg tggtgaaacg ggctgaggcg 540caagacgttg tcgccgcatc tgagcagaga gtgcgaaagg aagagggaac ccgtaaacgg 600ctcgcgcagg gcgaactcgg cttggatatt tacggcttgc gcgcgaagat cgcggacctc 660ggcctcaagt acttgtag 678
<210> 200<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaguinone metiltransferase<220>
<221> SITE
<222> (151)...(154)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 200
Met Asn Lys Pro Val Val Val Arg Asp Ile Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Ile Ala Ala Leu Glu Arg Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly50 55 60Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp65 70 75 80
Ile Leu Val Val Thr Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Thr Ile Ala Cys Ala Gly Ala Thr Val Glu145 150 155 160
Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Glu Ala Gln Asp Val Val Ala Ala Ser Glu Gln Arg Val Arg
180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Gln Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr210 215 220
Leu225<210> 201<211> 633<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 201
atgagcaacg atttgcggcg cttcggcgtc tcgacgctgc acgaggcgca aggacggcgcgggttgctcg cgtcatacat gcggccgatc tatccgggcg cgctggtcgc cggtccggcggtaaccgtcc tcgtgccgcc aggcgacaac ctggtgatcc acgtcgcggt ggaagcgtgcgcgccgggcg acgtcctcgt cgtcgcgccg acgtcgccct gcacggacgg ctattttggc 240gagctgctgg cgacgtcttt acgcgctcgg aacgtggcgg gcctggtgat cgacgccggc 300tgccgggatg tccgtgcgct caccgagatg cggttcccgg tctggcgccg cgccatcagc 360gcgcagggga cggtcaaggc gacgctcggc tctctgaaca cgccgatcgt ctgtgccgga 420gcgctcgttg cccccggcga tgtcatcgtg gccgacgatg acggagtcgt cgtggtgaag 480cgggaggaaa tcgcggcggt gacgcaggcg gcggagcagc gcgtccgcaa ggaagagggt 540acgcgagcga ggctcgcaaa cggtgaactg ggtttggaca tctacggctt gcggcagaag 600ctggcggacc tgggcctgaa gtcgtcatcg tga 633
<210> 202<211> 210<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (6)...(158)
<223> Demetilmenaguinone metiltransferase<400> 202
Met Ser Asn Asp Leu Arg Arg Phe Gly Val Ser Thr Leu His Glu Ala1 5 10 15
Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
20 25 30
Gly Ala Leu Val Ala Gly Pro Ala Val Thr Val Leu Val Pro Pro Gly
35 40 45
Asp Asn Leu Val Ile His Val Ala Val Glu Ala Cys Ala Pro Gly Asp
50 55 60
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
65 70 75 80
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Asn Val Ala Gly Leu Val
85 90 95
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe100 105 110
Pro Val Trp Arg Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr
115 120 125
Leu Gly Ser Leu Asn Thr Pro Ile Val Cys Ala Gly Ala Leu Val Ala 130 135 140
Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys145 150 155 160
Arg Glu Glu Ile Ala Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg165 170 175
Lys Glu Glu Gly Thr Arg Ala Arg Leu Ala Asn Gly Glu Leu Gly Leu180 185 190
Asp Ile Tyr Gly Leu Arg Gln Lys Leu Ala Asp Leu Gly Leu Lys Ser195 200 205
Ser Ser
210
<210> 203<211> 699<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 203
atgaccggca ttgtcgtcga gaccatcgag cgcgcgtccc tcgccgacat cgccgcgctg 60gccgagttcg gcgtcgccac catccacgag gcgcagggcc gcatcggtct cctcgcctcc 120accatgcgcc cgatctacgc gggtgccgca gccgccggca atgccgtcac cgtgtcggtt 180ccgcccggcg acaactggat gatccacgtg gccgtcgagc agtgccgcga gggcgacatc 240ctggtggtgg cccccaccag cccgaacgac aacggctact tcggcgaact gctggcctgc 300tcgctcaagt cgcgcggcgt gcgcggcctc atcatcgaag ccggctgccg cgacgtgaaa 360ccgctcaccg agatgaagtt ccccgtctgg tcccgcgccg tctcctccca aggcaccgtc 420aaggaaagcc tcggcgacgt gaatctgccg ctctcgatcg cgggccagct cgtcaacccc 480ggcgatgtca tcgtcgccga tgacgacggc gtggtcgtgg tcgcccgcag cgatgtgcgc 540tcagtcaccg ccaagtcgcg cgaacgcgaa gacaaggaag ccaaaaaccg ggtgcaactc 600caggccggcc agctcggcat tgacatctat ggcatgcgcg acaagctcaa ggccaaaggc
ctgcgctacg tgaaaagcgc ggcggacctg aagggctaa
<210> 204
<211> 232
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaquinone metiltransferase<400> 204
Met Thr Gly Ile1
Ile Ala Ala Leu20
Gly Arg Ile Gly35
Ala Ala Ala Ala50
Asn Trp Met Ile65
Leu Val Val Ala
Leu Leu Ala Cys100
Glu Ala Gly Cys115
Val Trp Ser Arg130
Gly Asp Val Asn
Val Val Glu Thr Ile Glu Arg Ala Ser Leu Ala Asp5 10 15
Ala Glu Phe Gly Val Ala Thr Ile His Glu Ala Gln
25 30
Leu Leu Ala Ser Thr Met Arg Pro Ile Tyr Ala Gly
40 45
Gly Asn Ala Val Thr Val Ser Val Pro Pro Gly Asp
55 60
His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile
70 75 80
Pro Thr Ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu85 90 95
Ser Leu Lys Ser Arg Gly Val Arg Gly Leu Ile Ile
105 110
Arg Asp Val Lys Pro Leu Thr Glu Met Lys Phe Pro
120 125
Ala Val Ser Ser Gln Gly Thr Val Lys Glu Ser Leu
135 140
Leu Pro Leu Ser Ile Ala Gly Gln Leu Val'Asn ProGly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Ala Arg
Ser Asp Val Arg Ser Val Thr Ala Lys Ser Arg Glu Arg Glu Asp Lys
Glu Ala Lys Asn Arg Val Gln Leu Gln Ala Gly Gln Leu Gly Ile Asp
Ile Tyr Gly Met Arg Asp Lys Leu Lys Ala Lys Gly Leu Arg Tyr Val
<210> 205<211> 678<212> DNA
<220>
<223> Proteína obtida por amostra do ambiente<400> 205
atgaacacac cggtggtagc aagacaagtg gagcagccac cagcggatgc aattgccgca 60
ttggagaagt gtggagtgac aaccgtccat gaggctcagg gacgttgtgg cctccttgcg 120
tcctacattc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180
ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240
atcctggtag tttcaccgac gtcgccttgt acggacggct acttcggtga gttgttggca 300
acatctctcc gtgcccacgg agtgattggg cttgtgatcg atgccggatg ccgtgatgtg 360
cgctctctga cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcaagggaca 420
gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc aatggtcgag 480
gctggtgatg tcatcgtcgc cgacgatgat ggcgttgtcg ttgtgaagcg agcgctggcg 540
caggagatcg ctgcggcggc ggaacaaagg gttcgcaaag agaatgtaac ccgcgaacga 600
ctcgcacgtg gagatctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggcctcaaat atctctga 678<210> 206<211> 225<212> PRT<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<220><221> DOMÍNIO<222> (28)...(174)<223> Demetilmenaquinone metiltransferase<400> 206
Met Asn Thr Pro Val Val Ala Arg Gln Val Glu Gln Pro Pro Ala Asp15 10 15
Ala Ile Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Ile Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Ile Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Cys Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Met Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Leu Ala Gln Glu Ile Ala Ala Ala Ala Glu Gln Arg Val Arg180 185
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Asp195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly
210 215 220
Leu225
<210> 207<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 207
atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60ctcgaaaccc atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120tcctacatgc ggccgattta tcccggcgcc gcgattgccg ggtcggcggt cacggtgtcg 180cttccgcccg gcgataatct catgattcat gttgccgtgg aggtctgcca atccggcgac 240attctcgtgg ttgctcccac gtcgccttgt tcggacggtt acttcggtga actcctggca 300acctccctgc gggcgcacgg cgtcaggggg ctcgttatcg atgcaggttg ccgcgacgtt 360cgctcgctta ccgagatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggcacc 420gtgaaatcca ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480gccggcgatg tggtcgtcgc cgatgacgat ggcgtcgttg tggtggagcg agcacgcgcc 540cacgaagtag tcgctgcgtg cgaacaacgc attcgcaagg aagaggcaac tcgcgagcgg 600ctggcgcggg gagaactcgg actcgatatc tacggcttgc gcacaaaaat cgcggagatg 660ggtctcaagt atcagtga 678
<210> 208<211> 225<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
190
Leu Gly LeuLeu Lys Tyr<220>
<221> DOMÍNIO<222> (22)...(174)
<223> DemetiImenactuinone metiItransferase<220>
<221> SITE
<222> (151)...(154)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 208
Met Asn Lys Pro Val Val Ile Arg Gln Val Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Thr His Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr
130 135 140
Leu Gly Ser Val Asn Val Ser Val Val Cys Ala Gly Ala Arg Ile Glu145 150 155 160
Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Val Val Glu
165 170 175
Arg Ala Arg Ala His Glu Val Val Ala Ala Cys Glu Gln Arg Ile Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Lys Tyr
210 215 220
Gln225
<210> 209<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 209
atgaatacac cagtggtagt ccgacaggtg cagcagccac cagccgaaac ggtggccgcg 60ctggagaagt gtggggtgac aacggtgcat gaggctcagg gacgtgctgg cctgcttgcg 120tcctacatgc gcccgatcta cccgggagca gcgatcgctg gttccgctat cacggtgtct 180ttgcctcccg gcgacaacct catgatccac gttgcggtgg aggtctgcgg cccgggaaac 240atcctggtag tttcaccaac ctcgccttct acggatggct acttcggtga gctgttggca 300acatctctcc gtgcccacgg tgtgagaggg cttgtgatcg atgctggatg ccgtgatgtg 3 60cgctctttaa cagaaatgaa attccccgtc tggagccgcg ccatcaattc gcaggggaca 420gtcaagacca cacttggatc ggtgaatgtg cccatcgttt gcgcgggcgc actggtcgac 480gctggagatg tcatcgtcgc ggatgacgat ggagttgtag ttgttaagca ggcgatggcg 540cgagaggttg ccgcggcagc ggaacaaagg gttcgcaaag agaacctgac ccgcgaacga 600cttgcgcgcg gagaacttgg tctcgacatt tacgagatac gacaaaagat cgcgcaacta 660ggacttaagt atttgtaa 678
<210> 210<211> 225<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 210
Met Asn Thr Pro Val Val Val Arg Gln Val Gln Gln Pro Pro Ala Glu1 5 10 15
Thr Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Ala Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Asn Ser Gln Gly Thr Val Lys Thr Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Asp145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Gln Ala Met Ala Arg Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Leu Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Glu Ile Arg Gln Lys Ile Ala Gln Leu Gly Leu-Lys Tyr210 215 220
Leu225<210> 211<211> 702
<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<400> 211
gtgagcgccg tcatcaggaa cattccacgc tcgccgcccg agctcctcga tcgcttcaag 60
ggcctcggcg ttgcgaccgt ctcggaagcg cagggccgca agggcctttt ggccccgtat 120
atgcgcccga tctatccggg ggccgcgctg atcggcaatg cggtgacggc ctcggtcgcg 180
cccggcgaca attggacgat ccatgtcgcc gtcgaagtct gccaggaagg cgacgcgctc 240
gtcgtcgcgc ccacctcctt ctgcgaggac ggctatttcg gcgagctact cgccacgtct 300
ctgcagcagc gcggtgtgcg cgggctcatt ctcgaagcag gctgccgcga cgtgcgcgag 360
cttcaaagga tgaattttcc ggtttggtcg cgcgcaatct atgcgcaagg aactgtgaaa 420
gagacggtgg gcgacgtgaa cctgccgctc cgctgcgcag gccagatcgt caatgccggc 480
gatctcattg tcgccgacga cgacggcgtt tgcgtcgtgc cctatgccga tgtcgagaag 540
gtcttgaacg cggcccgcga acgtgcggcg aaggaagaga ggaaccgtgc cgagttcgcc 600
aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgccgc caagggcctc 660
aaatatttcg acgacatcga ggcgtataag aaggcgaagt ga 702<210> 212<211> 233<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<400> 212
Met Ser Ala Val Ile Arg Asn Ile Pro Arg Ser Pro Pro Glu Leu Leu1 5 10 15
Asp Arg Phe Lys Gly Leu Gly Val Ala Thr Val Ser Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Ala Leu Ile Gly Asn Ala Val Thr Ala Ser Val Ala Pro Gly Asp Asn
50 55 60
Trp Thr Ile His Val Ala Val Glu Val Cys Gln Glu Gly Asp Ala Leu65 70 75 80
Val Val Ala Pro Thr Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Gln Gln Arg Gly Val Arg Gly Leu Ile Leu Glu
100 105 110
Ala Gly Cys Arg Asp Val Arg Glu Leu Gln Arg Met Asn Phe Pro Val
115 120 125
Trp Ser Arg Ala Ile Tyr Ala Gln Gly Thr Val Lys Glu Thr Val Gly
130 135 140
Asp Val Asn Leu Pro Leu Arg Cys Ala Gly Gln Ile Val Asn Ala Gly145 150 155 160
Asp Leu Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Tyr Ala
165 170 175
Asp Val Glu Lys Val Leu Asn Ala Ala Arg Glu Arg Ala Ala Lys Glu
180 185 190
Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly Val Leu Gly Leu Asp Leu
195 200 205
Tyr Lys Tyr Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr Phe Asp
210 215 220
Asp Ile Glu Ala Tyr Lys Lys Ala Lys225 230
<210> 213<211> 690<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 213
atgagcgttg tcatcacgaa gattacgcgg ccggacccca aacatgtgga gatgctggct 60
gctttcggtg tcgccaccat tcatgaggcg cagggccgca ccggcctgat gcagtcctac 120atgcgccccg tctatgccgg cgcccgtgcc gccggcacag ccgtcacggt ctcgctgccc 180cccgccgaca actggatgat ccatgtcgcc gtggagcagt gccgggaagg cgacattctc 240gtcgtcgcgc ccacttcgcc ctccgatgtc gggtatttcg gcgagctgct ggcgacctcg 300ctcgtcgccc gcggcgtccg cggcctcgtc attgaaggcg gctgccgcga tgtcagggcg 360ctgaccgaga tgcgcttccc ggtctggtcg cgcgccattt ccgcgcaggg caccgtcaag 420gaaacgctcg gctcggtgaa cgtgccgatc gtttgcgccg gcgcgcatat ccatcccggc 480gatttcattg ccgccgacga cgatggcgtt gtcgtggtgc gccgcagccg cgtcgccgag 540atcgccgccg ccgcgatggc gcgcgaagac aaggaaacaa ccgtccgcga gcgcctgaaa 600gccggagagc ttggcctcga catttacgga atgcgcccgc gtctcaagga aaagggcctc 660gtctggcgcg agacgccgga gaaggagtag 690
<210> 214
<211> 229
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 214
Met Ser Val Val Ile Thr Lys Ile Thr Arg Pro Asp Pro Lys His Val1 5 10 15
Glu Met Leu Ala Ala Phe Gly Val Ala Thr Ile His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Gln Ser Tyr Met Arg Pro Val Tyr Ala Gly Ala
35 40 45
Arg Ala Ala Gly Thr Ala Val Thr Val Ser Leu Pro Pro Ala Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Asp Val Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Val Ala Arg Gly Val Arg Gly Leu Val Ile Glu
100 105 110
Gly Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Arg Phe Pro Val
115 120 125
Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala His Ile His Pro Gly145 150 155 160
Asp Phe Ile Ala Ala Asp Asp Asp Gly Val Val Val Val Arg Arg Ser
165 170 175
Arg Val Ala Glu Ile Ala Ala Ala Ala Met Ala Arg Glu Asp Lys Glu
180 185 190
Thr Thr Val Arg Glu Arg Leu Lys Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Pro Arg Leu Lys Glu Lys Gly Leu Val Trp Arg Glu
210 215 220
Thr Pro Glu Lys Glu225
<210> 215
<211> 702
<212> DNA
<213> desconhecido
<220><223> Proteína obtida por amostra do ambiente<400> 215
gtgagcgccg tcatcaggaa cattccacgc tcgccgctcg agctcctcga tcgcttcaag 60
ggcctcggcg ttgcgaccgt ctcggaagcg cagggccgca agggcctttt ggcctcgtat 120
atgcgcccga tctatccggg ggccgcgctg atcggcaatg cggtgacggc ctcggtcgcg 180
cccggcgaca attggacgat ccatgtcgcc gtcgaagtct gccaggaagg cgacgcgctc 240
gtcgtcgcgc ccacctcctt ctgcgaggac ggctatttcg gcgagctact cgccacgtct 300
ctgcagcagc gcggtgtgcg cgggctcatt ctcgaagcag gctgccgcga cgtgcgcgag 360
cttcaaagga tgaattttcc ggtttggtcg cgcgcaatct atgcgcaagg aactgtgaaa 420
gagacggtgg gcgacgtgaa cctgccgctc cgctgcgcag gccagatcgt caatgccggc 480
gatctcattg tcgccgacga cgacggcgtt tgcgtcgtgc cctatgccga tgtcgagaag 540
gtcttgaacg cggcccgcga acgtgcggcg aaggaagaga ggaaccgtgc cgagttcgcc 600
aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgccgc caagggcctc 660
aaatatttcg acgacatcga ggcgtataag aaggcgaagt ga 702
<210> 216
<211> 233
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO
<222> (20)... (172)
<223> Demetilmenaquinone metiltransferase
<400> 216
Met Ser Ala Val Ile Arg Asn Ile Pro Arg Ser Pro Leu Glu Leu Leu15 10 15
Asp Arg Phe Lys Gly Leu Gly Val Ala Thr Val Ser Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala35 40 45
Ala Leu Ile Gly Asn Ala Val Thr Ala Ser Val Ala Pro Gly Asp Asn50 55 60
Trp Thr Ile His Val Ala Val Glu Val Cys Gln Glu Gly Asp Ala Leu65 70 75 80
Val Val Ala Pro Thr Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Thr Ser Leu Gln Gln Arg Gly Val Arg Gly Leu Ile Leu Glu
100 105 110
Ala Gly Cys Arg Asp Val Arg Glu Leu Gln Arg Met Asn Phe Pro Val
115 120 125
Trp Ser Arg Ala Ile Tyr Ala Gln Gly Thr Val Lys Glu Thr Val Gly
130 135 140
Asp Val Asn Leu Pro Leu Arg Cys Ala Gly Gln Ile Val Asn Ala Gly145 150 155 160
Asp Leu Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Tyr Ala
165 170 175
Asp Val Glu Lys Val Leu Asn Ala Ala Arg Glu Arg Ala Ala Lys Glu
180 185 190
Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly Val Leu Gly Leu Asp Leu
195 200 205
Tyr Lys Tyr Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr Phe Asp
210 215 220
Asp Ile Glu Ala Tyr Lys Lys Ala Lys225 230
<210> 217<211> 702<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 217
gtgagcgtgg tcatccgaaa cattccgcgc acgccgctcg cgctgctgga cagtttcaaagggttcggcg ttgcgacgat ctcggaggcg cagggccgca agggcctcat ggcttcttatatgcgtccga tttatccggg agctgagctt gtcggcaatg cggtgacggc ctcggtcgcg 180
cccggcgaca attggacgat ccatgtcgcg atcgaagtct gccaggaagg tgatgtgctc 240
gtggtcgcgc ctgcctcgtt ttgcgaggat ggctatttcg gcgagcttct cgcgacttcg 300
cttcagcagc gcggcgtgcg cgggctcatt ctcgaagccg gctgccgcga cgtacgcgcg 360
cttcagaaga tgaattttcc ggtttggtcg cgcgcgattt tcgcacaagg aaccgtgaaa 420
gagacggtcg gcgacgtcaa cctgccgctc cactgcgcgg gccagatcgt gcatggcggc 480
gatctcatcg tcgccgatga tgacggcgtc tgcgtcgtgc cgcataccga tgtcgagaag 540
gtcttgagcg cggcgcgcga acgcgcggcg aaggaggagc gaaaccgcgc cgagtttgcc 600
aagggcgtgc tcggcctcga cctctacaaa taccgcgagc gcctcgctca aaagggcctc 660
aagtattacg acgacatcga agcctataac aaagcgaagt ga 702<210> 218<211> 233<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20) . . . (172)<223> Demetilmenaquinone metiltransferase<400> 218
Met Ser Val Val Ile Arg Asn Ile Pro Arg Thr Pro Leu Ala Leu Leu1 5 10 15
Asp Ser Phe Lys Gly Phe Gly Val Ala Thr Ile Ser Glu Ala Gln Gly
20 25 30
Arg Lys Gly Leu Met Ala Ser Tyr Met Arg Pro Ile Tyr Pro Gly Ala
35 40 45
Glu Leu Val Gly Asn Ala Val Thr Ala Ser Val Ala Pro Gly Asp Asn50 55 60
Trp Thr Ile His Val Ala Ile Glu Val Cys Gln Glu Gly Asp Val Leu65 70 75 80
Val Val Ala Pro Ala Ser Phe Cys Glu Asp Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Thr Ser Leu Gln Gln Arg Gly Val Arg Gly Leu Ile Leu Glu
100 105 110
Ala Gly Cys Arg Asp Val Arg Ala Leu Gln Lys Met Asn Phe Pro Val115 120 125
Trp Ser Arg Ala Ile Phe Ala Gln Gly Thr Val Lys Glu Thr Val Gly
130 135 140
Asp Val Asn Leu Pro Leu His Cys Ala Gly Gln Ile Val His Gly Gly145 150 155 160
Asp Leu Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro His Thr
165 170 175
Asp Val Glu Lys Val Leu Ser Ala Ala Arg Glu Arg Ala Ala Lys Glu
180 185 190
Glu Arg Asn Arg Ala Glu Phe Ala Lys Gly Val Leu Gly Leu Asp Leu
195 200 205
Tyr Lys Tyr Arg Glu Arg Leu Ala Gln Lys Gly Leu Lys Tyr Tyr Asp
210 215 220
Asp Ile Glu Ala Tyr Asn Lys Ala Lys225 230
<210> 219
<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 219
atgagcgtgg tcgtgcagaa catcgaacgc gccgacgcgt catttgtggc aacgctcggc 60gagtgcggcg tggcgaccgt gcacgaggcg caaggtcgaa ctggcttgat gcgcccttac 120atgcgaccga tctacgccgg cgcccgcatc gccggaccgg cggtgacggt gtcgatcccg 180cccggcgaca actggatgat ccacgtcgcg gtcgagcagt gccgcgaggg cgatatcctc 240gtcgtggccc cgaccagccc gagcgaggac ggctatttcg gcgagttgct ggcgcgctcg 300ctgctcgcgc gcggcgtgag gggtcttgtc atcgaggccg gcgtccgcga cgtacgcgat 360ctcaccgaga tcaagttccc cgtatggtcc aaagcgatat cggcgcaagg cacggtgaag 420gagacgatcg gctcggtgaa tgtgccggtc gtatgtgccg gcgccgccat caatcccggc 480gatgtcatag tcgctgacga cgacggtgtc tgcgtcgtgt cacgcgaacg ggcggaagac 540gtcgccaagg ccgcgcgcgc ccgcgaagcc aaggaagcgg aaacgcgcaa gcggctgata 600tcaggcgagc tcggcctcga tatctacggc atgcgcgaga agctcgcggc gaaaggcctc 660aaatatgcct ga 672
<210> 220<211> 223<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)... (172)
<223> Demetilmenaquinone metiltransferase<400> 220
Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Ala Ser Phe Val1 5 10 15
Ala Thr Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Ile Ala Gly Pro Ala Val Thr Val Ser Ile Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Arg Glu Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu85 90 95
Leu Ala Arg Ser Leu Leu Ala Arg Gly Val Arg Gly Leu Val Ile Glu100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Ile Lys Phe Pro Val115 120 125
Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Ile Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Ala Ile Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Ser Arg Glu
165 170 175
Arg Ala Glu Asp Val Ala Lys Ala Ala Arg Ala Arg Glu Ala Lys Glu180 185 190
Ala Glu Thr Arg Lys Arg Leu Ile Ser Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Gly Met Arg Glu Lys Leu Ala Ala Lys Gly Leu Lys Tyr Ala
210 215 220
<210> 221<211> 672
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<400> 221
atgagcgtgg tcgtgcagaa catcgaacgc gccgacgcgt cttttgtggc aacgctcggc 60
gagtgcggcg tggcgaccgt gcacgaggcg caaggtcgaa ccggcttgat gcgcccctac 120
atgcgaccga tctacgccgg cgcccgcatc gccgggccgg cggtgacggt gtcgatccca 180
cccggcgaca actggatgat ccacgtcgcg gtcgagcaat gccgcgacgg tgacatcctg 240
gtcgtcgcgc cgaccagccc gagcgaggac ggctatttcg gcgagttgct ggcgcgctcg 300
cttctcgcgc gtggcgtgag aggcctcgtc atcgaggccg gcgtccgcga cgtgcgcgac 360
cttaccgaaa tcggatttcc cgtctggtcg aaggcgatct ccgcacaagg caccgtcaag 420
gagacgctcg gcttggtgaa cgtgccggtt gtctgcgccg gcgctacggt caacccgggc 480
gatgtcatcg tcgcggacga cgacggtgtg tgcgtggtgc cacgcggcaa tgccgaagag 540
gtcgcgaagg ccgcccgcgc ccgcgaggca aaggaggcgg agacgagcaa gcggttgata 600
gcaggtgagc tcggcctcga catctacggc atgcgcgaga agctggcggc caagggcctc 660
aaatatgtct ga 672<210> 222<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)
<223> Demetilmenaguinone metiltransferase<400> 222
Met Ser Val Val Val Gln Asn Ile Glu Arg Ala Asp Ala Ser Phe Val1 5 10 15
Ala Thr Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Ala Gly Ala
35 40 45
Arg Ile Ala Gly Pro Ala Val Thr Val Ser Ile Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Arg Asp Gly Asp Ile Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Ser Glu Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Arg Ser Leu Leu Ala Arg Gly Val Arg Gly Leu Val Ile Glu
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Ile Gly Phe Pro Val
115 120 125
Trp Ser Lys Ala Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Leu Gly
130 135 140
Leu Val Asn Val Pro Val Val Cys Ala Gly Ala Thr Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg GlyAsn Ala GluAla Glu Thr
195
Tyr Gly Met210<210> 223<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 223
atgaacgagc cgatcgtcgt tcggacgatc gcgcggccgt cggccgaggc gatcgcggcg 60ctgcagcggt acggcgtgtc gactgtgcat gaagcgcaag gacgacgcgg actgctcggg 120tctcgcttgc gaccgatcta cagcggcgcg gcgatcgccg gtccagcggt caccgtttcg 180ctgccgcctg gtgacaacct catgattcac gtcgccgtcg aggtgtgcca gcctggcgac 240gtgctcgtcg tggccccgac ctccccctgc acggacggct atttcggtga actgttggcc 300acgtcgtttc gcgcacgcgg cgtcgtcggc ctgatcatcg atgccggctg ccgcgacgtg 360cgcgcgttgt cggagatgcg ctttcccgtc tggagccgcg cgatcagcgc gcagggtacg 420gtgaaggcct cgttgggttc ggtgaacgtt gccgtcgtgt gtgggggagc gtccgtcaat 480ccaggcgatg cgatcgtggc cgacgatgat ggggtggtgg tcgtggcgcg caacgaggtg 540gaagcggtgg tgcaggcgtc ggagcagcgc atccggaagg aacaggcgac gcgcgagcgg 600ctggcgagcg gtgaactggg cctcgatatc tacggcctca ggaaaaaggt gtcggacctc 660gggctgaaat attcgtga 678
<210> 224<211> 225<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
165 170
Glu Val Ala Lys Ala Ala Arg180 185
Ser Lys Arg Leu Ile Ala Gly200
Arg Glu Lys Leu Ala Ala Lys215
175
Ala Arg Glu Ala Lys Glu190
Glu Leu Gly Leu Asp Ile205
Gly Leu Lys Tyr Val220<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaciuinone metiltransferase<400> 224
Met Asn Glu Pro Ile Val Val Arg Thr Ile Ala Arg Pro Ser Ala Glu1 5 10 15
Ala Ile Ala Ala Leu Gln Arg Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Arg Gly Leu Leu Gly Ser Arg Leu Arg Pro Ile Tyr Ser
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Phe Arg Ala Arg Gly Val Val Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ser Glu Met Arg Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Ser
130 135 140
Leu Gly Ser Val Asn Val Ala Val Val Cys Gly Gly Ala Ser Val Asn145 150 155 160
Pro Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Ala
165 170 175
Arg Asn Glu Val Glu Ala Val Val Gln Ala Ser Glu Gln Arg Ile Arg
180 185 190
Lys Glu Gln Ala Thr Arg Glu Arg Leu Ala Ser Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Val Ser Asp Leu Gly Leu Lys Tyr210 215 220
Ser225
<210> 225<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 225
atgaacgttg tcgtccggaa tatcgagcgg gccgctgcgg atacgatcgc cgtgcttggc 60gaatgcggcg tcgcgacggt gcacgaggca cagggccgca gcggcctcat gcgtccctat 120atgcgaccga tctatacggg cgcgcgcatc gccggctcgg cggtcactgt gtcggtcccg 180ccgggcgaca actggatgat ccatgtcgcg gtcgaacaat gccacgacgg cgacgtcctc 240gtcgtggcgc cgaccagccc atgcgatgac ggctatttcg gcgagcttct ggcgcgctcg 300ctgcgggcgc acggcgtgag aggcctcgtg atcgaggcag gcgtgcgcga cgtgcgcgat 360ctcaccgaga tgcagttccc ggtctggtcg aaatcgatct ccgcgcaagg gacggtgaag 420gagacgatcg gctcggtgaa cgtgccggtc gtctgcgcgg gtgccgccgt caatccgggc 480gacgtcatcg tggccgacga cgatggcgtc tgcgttgtac cgcgaggcca ggcggcagtc 540gttgccgagg cggcacgcgc gcgcgaggcg aaggaggccg aggtccgcaa gcgcctggtt 600gccggggagc tcggtctcga catctacggc atgcgcgaac ggctggcggc gaagggcctg 660aagtatgtct ga 672
<210> 226<211> 223<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 226
Met Asn Val Val Val Arg Asn Ile Glu Arg Ala Ala Ala Asp Thr Ile15 10 15
Ala Val Leu Gly Glu Cys Gly Val Ala Thr Val His Glu Ala Gln Gly
20 25 30
Arg Ser Gly Leu Met Arg Pro Tyr Met Arg Pro Ile Tyr Thr Gly Ala
35 40 45
Arg Ile Ala Gly Ser Ala Val Thr Val Ser Val Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys His Asp Gly Asp Val Leu65 70 75 80
Val Val Ala Pro Thr Ser Pro Cys Asp Asp Gly Tyr Phe Gly Glu Leu
85 90 95
Leu Ala Arg Ser Leu Arg Ala His Gly Val Arg Gly Leu Val Ile Glu
100 105 110
Ala Gly Val Arg Asp Val Arg Asp Leu Thr Glu Met Gln Phe Pro Val
115 120 125
Trp Ser Lys Ser Ile Ser Ala Gln Gly Thr Val Lys Glu Thr Ile Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Ala Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Pro Arg Gly
165 170 175
Gln Ala Ala Val Val Ala Glu Ala Ala Arg Ala Arg Glu Ala Lys Glu
180 185 190
Ala Glu Val Arg Lys Arg Leu Val Ala Gly Glu Leu Gly Leu Asp Ile
195 200 205
Tyr Gly Met Arg Glu Arg Leu Ala Ala Lys Gly Leu Lys Tyr Val
210 215 220
<210> 227<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 227
atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgca 480cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600cttgcttcgg gggaactcgg cctggatatt tacggcctgc gaccgaagat tgcagacctc 660ggtctcaagt acttgtag 678
<210> 228<211> 225<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<220>
<221> SITE<222> (151)...(154)<223> Sítio de N-glicosilação prosítio id = PS00001<400> 228
Met Asn Lys Pro Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Thr Ile Val Cys Ala Gly Ala Ala Val Ala145 150 155 160
Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Thr Glu Ala Gln Glu Val Val Thr Ala Ser Glu Gln Arg Leu Arg
180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Pro Lys Ile Ala Asp Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 229<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 229
atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgca 480cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540caagaggccg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600
cttgcttcgg gggaactcgg cctggatatt tacggcctgc gaccgaagat tgcagacctc 660ggtctcaagt acttgtag 678
<210> 230<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22) . . . (174)
<223> Demetilmenaquinone metiltransferase<220>
<221> SITE<222> (151)...(154)<223> Sítio de N-glicosilação prosítio id = PS00001<400> 230
Met Asn Lys Pro Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Thr Ile Val Cys Ala Gly Ala Ala Val Ala145 150 155 160
Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Thr Glu Ala Gln Glu Ala Val Thr Ala Ser Glu Gln Arg Leu Arg
180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Pro Lys Ile Ala Asp Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 231<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 231
atgaatgaac cggtggtaat ccggcaggtg gagcagccac cagcagacgc agttgccgca 60ttggagaaat gtggcgtgac aaccgtccat gaagctcaag gacgttgtgg cctgcttgcg 120cactacatgc gtcccatttt cccgggagca accatcgcgg gttccgccgt caccgtgtct 180ctgcctcccg gtgacaacct catgatccac gttgcggtcg aagtctgcag gccgggaaac 240atcctggtcg tttcaccgac atcgccgtgc tcggatggct acttcggcga gctattggca 300acttctctgc gtgctcacgg tgtaagaggg cttgtgatcg acgccggatg cagggacgtc 3 60cgctcgctga ctgagatgaa atttcccgtc tggagccgcg ccatcagttc gcagggtacc 420gtcaaagcca cgctcggatc ggtgaatgtg ccgatcacgt gcgcgggcgc gttagtcgac 480gcaggtgatg tcattgtcgc tgacgatgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540caagaggtcg ctgccgcggc ggagcaaagg gttcgcaaag agaacgcgac ccgcgaacga 600cttgcacgtg gagagctagg actcgatatt tacgacatgc gccagaagat cgcgcaactg 660ggccttaagt atcggtga 678
<210> 232<211> 225<212> PRT<213> desconhecido<220>·
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 232
Met Asn Glu Pro Val Val Ile Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro35 40 45
Gly Ala Thr Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Thr Cys Ala Gly Ala Leu Val Asp145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Gln Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Arg225
<210> 233<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 233atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60ctcgaaacct atggcgtgtc caccgtgcac gaggcccagg ggcgttgcgg gctgctcgct 120tcctacatgc ggccgattta tggcggcgcc ctgattgccg ggtcggcggt cacggtgtca 180cttccgcccg gcgataatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240attctcgtgg ttgctcccac gtcgccttgt tcggacggtt acttcggtga acttctggca 300acctccctgc gggcacacgg cgtcaagggg ctcgtgattg atgcgggttg ccgcgacgtt 360cggtcgctta ccgaaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggaacc 420gtgaaatcga ctctcggatc ggtgaatgta agcgtcgttt gcgccggagc acgcatcgaa 480gccggcgatg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggcgcg ggcacgcgcc 540cacgaagtag tcgcggcgtg cgaacaacgc attcgcaagg aagaggcaac ccgcgaacgg 600ctggcgcggg gagaactcgg actcgatatc tacggcttgc gcacaaaaat cgcggagatg 660ggtctcgagt atcaatga 678
<210> 234<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<220>
<221> SITE<222> (151)...(154)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 234
Met Asn Lys Pro Val Val Ile Arg Gln Val Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Thr Tyr Gly Val Ser Thr Val His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gly35 40 45
Gly Ala Leu Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr
130 135 140
Leu Gly Ser Val Asn Val Ser Val Val Cys Ala Gly Ala Arg Ile Glu145 150 155 160
Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Val Val Ala
165 170 175
Arg Ala Arg Ala His Glu Val Val Ala Ala Cys Glu Gln Arg Ile Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Glu Tyr210 215 220
Gln225
<210> 235<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 235atgaatgaac cggtggtaat ccggcaggtg gagcagccac cagcagacgc agttgccgca 60
ttggagaaat gtggcgtgac aaccgtccat gaagctcaag gacgttgtgg cctgcttgcg 120
cactacatgc gtcccatttt cccgggagca accatcgcgg gttccgccgt caccgtgtct 180
ctgcctcccg gtgacaacct catgatccac gttgcggtcg aagtctgcag gccgggaaac 240
atcctggtcg tttcaccgac atcgccgtgc tcggatggct acttcggcga gctattggca 300
acttctctgc atgctcacgg tgtaagaggg cttgtgatcg acgccggatg cagggacgtc 360
cgctcgctga ctgagatgaa atttcccgtc tggagccgcg ccatcagttc gcagggtacc 420
gtcaaagcca cgctcggatc ggtgaatgtg ccgatcacgt gcgcgggcgc gttagtcgac 480
gcaggtgata tcattgtcgc tgacgatgat ggagttgtgg ttgtgaagcg cgcgcaggcg 540
caagaggtcg ctgccgcggc ggagcaaagg gttcgcaaag agaacgcgac ccgcgaacga 600
cttgcacgtg gagagctagg actcgatatt tacgacatgc gccagaagat cgcacaactg 660
ggccttaagt atcggtga 678<210> 236<211> 225
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asn
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 236
Met Asn Glu Pro Val Val Ile Arg Gln Val Glu Gln Pro Pro Ala Asp
1 5 10 15
Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu His Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Thr Cys Ala Gly Ala Leu Val Asp145 150 155 160
Ala Gly Asp Ile Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Gln Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Arg
225
<210> 237<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 237
atgaacaagc ccgtggtggt ccggcacgtg gagcagccac ctgctgatgc ggtagccgct 60ttggaaaagt atggcgtgtc aaccgttcat gaggcccagg gacggtcggg tcttctcgcc 120agttacctgc ggccgatctt tgccggcgcc tcaatcgcag ggccggcggt tacggtctcg 180ctgccacctg gggacaattt gatgatccac gtcgccgtcg aggtgtgcac gcctggaagc 240atccttgtcg tcgccccaac ctccccttgt acggacggct atttcggaga gctgctggcg 300
acctcgcttc gcgcacacgg cgtaaagggg ttggtcatcg atgccgggtg tcgcgacgtt 360
aggtctttaa cggaaatgaa ctttcccgtt tggagccgct cggtcagttc gcaaggaacc 420
gtcaaagcga cgttgggatc ggtgaatgta ggcgtcgtct gcgccggtgc atacgtcgag 480
ccaggcgacg tgatcgtcgc ggacgatgac ggagttgtag tcgtgaagcg ggcggctgcg 540
cccgaggctg tcgtcgcctc cgaagcgaga gttcgtaaag aagccgcgac gcgcgagcgt 600
ctctcccgcg gagagcttgg ccttgacatc tacggcctac gttcaaagat tgcggacctt 660
ggcctcgagt atctgtga 678<210> 238
<211> 225
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 238
Met Asn Lys Pro Val Val Val Arg His Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Ser Gly Leu Leu Ala Ser Tyr Leu Arg Pro Ile Phe Ala
35 40 45
Gly Ala Ser Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Thr Pro Gly Ser
65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Asn Phe
115 120 125
Pro Val Trp Ser Arg Ser Val Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser Val Asn Val Gly Val Val Cys Ala Gly Ala Tyr Val Glu145 150 155 160
Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys165 170 175
Arg Ala Ala Ala Pro Glu Ala Val Val Ala Ser Glu Ala Arg Val Arg180 185 190
Lys Glu Ala Ala Thr Arg Glu Arg Leu Ser Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ser Lys Ile Ala Asp Leu Gly Leu Glu Tyr
210 215 220
Leu225
<210> 239<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 239
atgaacaaac cggtggtgat ccggcaagcg gagcggccgc cggctgacgc ggtggcggcg 60ctcgcaacct atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120tcctacatgc ggccgattta tcacggcacc gcgattgccg ggtcggcggt cacggtgtcc 180cttccgcccg gcgacaatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240attctcgtgg tcgctcccac gtcgccctgt tccgacggtt acttcggcga actcctggcc 300acctctctgc gggcgcacgg cgtcaagggg ctcgttattg atgcgggttg ccgcgacgtt 360cgctcgctca gcgcaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaggcacc 420gtgaaatcta ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480gccggcgacg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggagcg agcatccgcc 540
cacgaagtag tcgtggcgtg cgaacaacgc cttcgcaagg aagaggcaac tcgcgagcgc 600
ctggcgcggg gagaactcgg actcgacatc tacggcttgc gcacaaaagt cgcggagatg 660
ggtctcaagt atcaatga 678
<210> 240
<211> 225<212> PRT
<213> desconhecido- <220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaguinone metiltransferase
<220>
<221> SITE
<222> (151)...(154)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 240
Met Asn Lys Pro Val Val Ile Arg Gln Ala Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Ala Thr Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr His
35 40 45
Gly Thr Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp
65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu ValIle Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Ser Ala Met Lys Phe
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr
Leu Gly Ser Val Asn Val Ser Val Val Cys Ala Gly Ala Arg Ile Glu
Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Val Val Glu
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
Asp Ile Tyr Gly Leu Arg Thr Lys Val Ala Glu Met Gly Leu Lys Tyr
Gln225
<210> 241<211> 678
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 241
atgaacaaac cggtggtgat ccggcaagtg gagcggccgc cggctgacgc ggtggcggcg 60
ctcgcaacct atggcgtgtc caccgtgcat gaggcccagg ggcgttgcgg actgctcgct 120
tcctacatgc ggccgattta tcccggcacc gcgattgccg ggtcggcggt cacggtgtcc 180
cttccgcccg gcgacaatct gatgattcac gttgccgtgg aggtctgcca atccggcgac 240
attctcgtgg tcgctcccac gtcgccttgt tcggacggtt acttcggcga actcctggcc 300
acctctctgc gggcgcacga cgtcaagggg ctcgttattg atgcgggttg ccgcgacgtt 360
cgctcgctca gcgcaatgaa gttccccgtc tggagccgcg ctgtcagttc gcaaagcacc 420
gtgaaatcta ctctcggatc ggtgaatgtg agcgtcgttt gcgccggagc acgcatcgaa 480gccggcgacg tggtcgtcgc ggatgacgat ggcgtcgtgg tggtggagcg agcatccgcc 540cacgaagtag tcgcggcgtg cgaacaacgc cttcgcaagg aagaggcaac tcgcgagcgc 600ctggcgcggg gagaactcgg actcgacatc tacggcttgc gcacaaaagt cgcggagatg 660ggtctcaagt atcaatga 678
<210> 242<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22) . . . (174)
<223> Demetilmenaquinone metiltransferase
<220>
<221> SITE
<222> (151)...(154)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 242
Met Asn Lys Pro Val Val Ile Arg Gln Val Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Ala Thr Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Thr Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Asp Val Lys Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Ser Ala Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Ser Thr Val Lys Ser Thr 130 135 140
Leu Gly Ser Val Asn Val Ser Val Val Cys Ala Gly Ala Arg Ile Glu145 150 155 160
Ala Gly Asp Val Val Val Ala Asp Asp Asp Gly Val Val Val Val Glu165 170 175
Arg Ala Ser Ala His Glu Val Val Ala Ala Cys Glu Gln Arg Leu Arg180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Thr Lys Val Ala Glu Met Gly Leu Lys Tyr
210 215 220
Gln225
<210> 243<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 243
atgaacagac ctgtggttgt ccgggaggtg gagcggccgc cggcagatgc tgtgacagcg 60ctcgagcagt acggggtatc gacggtgcat gaagctcaag ggcgttgcgg gttactcgca 120tcgtatatgc ggccgattta tgccggagcg gccatcgctg gtcccgccgt gactgtttct 180ctacctccgg gagacaactt gatgattcac gtggcggtcg aggtctgccg tccgggagac 240atcctcgttg tggcgccgac gtcgccgtgt acggatggct attttggaga gctgcttgca 300acttcactcc gagcacatgg cgtgaaagga cttgtgatcg atgcgggatg tcgcgatgtt 360cgctcgctga ctgagatgaa gtttcccgtg tggagtcgcg cggtgagttc gcagggaacg 420gtgaaggcga cgctcggatc agtaaatgtg agtatcgtgt gcgccggcgc actcgtcgaa 480gccggcgatg tcatcatcgc ggatgacgat ggagccgtag ttgtgaggag gacagccgcg 540aaagacgtgg tcgcggcgtc tgaacagaga gtgcgaaaag aagaggcgac gcgaaggcgg 600
cttgcgcaag gcgaactcgg tctggacatc tacgggttgc gcgcgaaaat cgcggacctc 660
ggtctcaagt acctgtaa 678
<210> 244
<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase
<220>
<221> SITE
<222> (151)... (154)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 244
Met Asn Arg Pro Val Val Val Arg Glu Val Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Val Thr Ala Leu Glu Gln Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser Val Asn Val Ser Ile Val Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Ile Ala Asp Asp Asp Gly Ala Val Val Val Arg165 170 175
Arg Thr Ala Ala Lys Asp Val Val Ala Ala Ser Glu Gln Arg Val Arg180 185 190
Lys Glu Glu Ala Thr Arg Arg Arg Leu Ala Gln Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr
210 215 220
Leu225
<210> 245<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 245
atgaacaagt ccgtggtggt tcgcaacgtc gagcagcctc ctgccgatgc catggccgcg 60ctcgaaaaat atggcgtttc caccgttcac gaagcgcaag gccgctgcgg cttgctcgcc 120tcttacatgc gcccaatttt cgggggtgcc tccgtcgccg gccccgcggt caccgtctcc 180gtgccgcccg gcgacaacct catgattcac gtcgctgtag aagtctgccg cccgggagac 240attctcgtcg tagcccccac atcgcgctgc accgacggct acttcggcga actactagcc 300acttcgttgc gcgcccacgg cgtcaaaggc ctcgtcatcg atgccggttg ccgcgacgtc 360cgctccttga ccgaaatgaa atttcccgtc tggagccgcg ccatcagttc gcaaggcacc 420gtcaaatcca ctgtgggctc ggtaaacgtc cccgtcgtgt gtgcgggcgc actcatcgca 480cccggcgacg tcatggtcgc ggatgacgat ggcgttgtcg tcgtgcagcg cgccgccgcc 540
cgcgacgtcg tcgccgcctc ggaacaaagg attcgcaagg aagaagccac acgtgagcgt 600
ctggtgcgcg gtgaactcag cctcgatatc tacggcctgc gcgcaaaact caccgaattg 660
ggtctcacgt acttgtag 678
<210> 246<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaguinone metiltransferase
<220>
<221> SITE<222> (2)...(5)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 246
Met Asn Lys Ser Val Val Val Arg Asn Val Glu Gln Pro Pro Ala Asp15 10 15
Ala Met Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Gly
35 40 45
Gly Ala Ser Val Ala Gly Pro Ala Val Thr Val Ser Val Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp
65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Arg Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu ValIle Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ser Thr
Val Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Ile Ala
Pro Gly Asp Val Met Val Ala Asp Asp Asp Gly Val Val Val Val Gln
Lys Glu Glu Ala Thr Arg Glu Arg Leu Val Arg Gly Glu Leu Ser Leu
Asp Ile Tyr Gly Leu Arg Ala Lys Leu Thr Glu Leu Gly Leu Thr Tyr
Leu225
<210> 247<211> 678
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 247
gtgacgggtc cgatcgtcgt tcgcaccatc gacagaccga tggccgatgt cgtcgccgcg 60
ctgcagcgcc atggcgtctc gacggttcac gaagcacaag ggcgacgggg actgctcgcg 120
tcctgcgtgc ggccgatcta tgtgggcgcc gtgattgcgg gtcctgccgt caccgtctcg 180
ctgccacctg gcgacaacct gatgattcac gtcgcggtgg agatgtgtca gcccggcgat 240
gtcctcgtcg tcgccccgac ctctccgtgc accgacggct atttcggcga actgctggcg 300
acctcattgc acgcccgcgg cgtcacggga ctcatcatcg atgccggctg ccgggacgtt 360
cgcgccttga cggacatgcg atttccggtt tggagccgcg cgatcagcgc gcagggcacc 420
gtcaagtcaa cgctcggatc agtgaacgtg ccggtggtgt gcgccggagc gttggtccac 480gcgggcgacg ccatcgtggc ggatgacgat ggcgtggtgg tggtgagacg ggaagaggcg 540
gggaccgtgt cggaggcgtg cgcggagcgg gcgcgcaagg aagaggccac gagggaacgg 600
ctcgcgcgag gcgagcttgg tctcgatatc tacggcctgc gaaaaaaact caccgacctc 660
ggcctgaagt attcgtag 678
<210> 248
<211> 225
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 248
Met Thr Gly Pro Ile Val Val Arg Thr Ile Asp Arg Pro Met Ala Asp1 5 10 15
Val Val Ala Ala Leu Gln Arg His Gly Val Ser Thr Val His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Cys Val Arg Pro Ile Tyr Val35 40 45
Gly Ala Val Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Met Cys Gln Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu His Ala Arg Gly Val Thr Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Asp Met Arg Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ser Thr130 135 140
Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val His145 150 155 160
Ala Gly Asp Ala Ile Val Ala Asp Asp Asp Gly Val Val Val Val Arg165 170 175
Arg Glu Glu Ala Gly Thr Val Ser Glu Ala Cys Ala Glu Arg Ala Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Leu Thr Asp Leu Gly Leu Lys Tyr210 215 220
Ser225
<210> 249
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 249
atgaacaagt ccgtggtggt tcgcaacgtc gagcagcctc ctgccgatgc catggccgcg 60
ctcgaaaaat atggcgtttc caccgttcac gaagcgcaag gccgctgcgg cttgctcgcc 120
tcttacatgc gcccaatttt cgggggtgcc tccgtcgccg gccccgcggt caccgtctcc 180
gtgccgcccg gcgacaacct catgattcac gtcgctgtag aagtctgccg cccgggagac 240
attctcgtcg tagcccccac atcgccctgc accgacggct acttcggcga actactagcc 300
acttcgttgc gcgcccacgg cgtcaaaggc ctcgtcatcg atgccggttg ccgcgacgtc 360
cgctccttga ccgaaatgaa atttcccgtc tggagccgcg ccatcagttc gcaaggcacc 420
gtcaaatcca ctgtgggctc ggtaaacgtc cccgtcgtgt gtgcgggcgc actcatcgca 480
cccggcgacg tcatggtcgc ggatgacgat ggcgttgtcg tcgtgcagcg cgccgccgcc 540
cgcgacgtcg tcgccgcctc ggaacaaagg attcgcaagg aagaagccac acgtgagcgt 600
ctggtgcgcg gtgaactcgg cctcgatatc tacggcctgc gcgcaaaact caccgaattg 660
ggtgtcacgt acttgtag 678<210> 250<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<220>
<221> SITE<222> (2)... (5)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 250
Met Asn Lys Ser Val Val Val Arg Asn Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Met Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Gly
35 40 45
Gly Ala Ser Val Ala Gly Pro Ala Val Thr Val Ser Val Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ser Thr130 135 140
Val Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Ile Ala145 150 155 160
Pro Gly Asp Val Met Val Ala Asp Asp Asp Gly Val Val Val Val Gln165 170 175
Arg Ala Ala Ala Arg Asp Val Val Ala Ala Ser Glu Gln Arg Ile Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Val Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Leu Thr Glu Leu Gly Val Thr Tyr210 215 220
Leu225
<210> 251
<211> 693
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 251
atgaacaagc cggcattcgt tcgccccgta gttgttcgca atgtcgagca accttctgcc 60
gacgcggtag ccgcgctcga aaaatatggc gtctcgaccg ttcatgaagc gcagggccgc 120
tgtggcttgc tcgcttcctg tatccgcccg attttcgcgg gcgccgccgt cgccggtccc 180
gtggtcaccg tttccgtgcc gccaggggac aacctgatga ttcacgtcgc agtggaagtc 240
tgccgcccgg gagatatcct cgtcgtagcc ccaacgtctc cttgcaccga cggctacttc 300
ggcgaactat tggccacttc gcttcgcgcg cacggcgtca agggcttgat tattgacgcc 360
ggctgccgtg acgtccgcgc cctcaccgaa atgaaatttc ccgtctggag ccgcgccgtc 420
agttcgcaag gcactgtcaa atccacgtta ggctcggtga atgtttcagt cgtctgtgcc 480
ggcgcactgg tcgcacccgg cgacgtcatc gtcgccgatg acgacggagt ggtcgtcgtc 540
cagcgcgctg ccgcccgcga ggtagtcgcc gccgcagaac aaaggattcg caaggaagaa 600
gccactcgcg aacgcctcgc gcgcggtgaa ctcggtctcg atatctacag cctgcgcgca 660
aaactcaccg aactcggcct cacctacttg tga 693<210> 252<211> 230<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (27)...(179)
<223> Demetilmenaquinone metiltransferase<220>
<221>. SITE
<222> (156)...(159)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 252
Met Asn Lys Pro Ala Phe Val Arg Pro Val Val Val Arg Asn Val Glu1 5 10 15
Gln Pro Ser Ala Asp Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser
20 25 30
Thr Val His Glu Ala Gln Gly Arg Cys Gly Leu Leu Ala Ser Cys Ile
35 40 45
Arg Pro Ile Phe Ala Gly Ala Ala Val Ala Gly Pro Val Val Thr Val
50 55 60
Ser Val Pro Pro Gly Asp Asn Leu Met Ile His Val Ala Val Glu Val65 70 75 80
Cys Arg Pro Gly Asp Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr
85 90 95
Asp Gly Tyr Phe Gly Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly
100 105 110
Val Lys Gly Leu Ile Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu
115 120 125
Thr Glu Met Lys Phe Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly130 135 140
Thr Val Lys Ser Thr Leu Gly Ser Val Asn Val Ser Val Val Cys Ala145 150 155 160
Gly Ala Leu Val Ala Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly165 170 175
Val Val Val Val Gln Arg Ala Ala Ala Arg Glu Val Val Ala Ala Ala
180 185 190
Glu Gln Arg Ile Arg Lys Glu Glu Ala Thr Arg Glu Arg Leu Ala Arg195 200 205
Gly Glu Leu Gly Leu Asp Ile Tyr Ser Leu Arg Ala Lys Leu Thr Glu210 215 220
Leu Gly Leu Thr Tyr Leu225 230
<210> 253
<211> 702
<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 253
atgagcggta tcgtcgtcca ggacttcgag cgcgcatcgc tcgccgacat caaggcgctc 60
gccgagttcg gcgtcgccac gatccacgag gcgcagggcc gcgttggcct gctcgcgtcg 120
tacatgcgcc cgatttatgc gggagctgca gccgccggca atgccgtcac cgtgtcggtg 180
ccgccgggcg acaactggat gatccacgtg gcggtggagg tgtgccgcga gggcgacatc 240
ctcgtggtgg cgccgacctc gccaaacgac aacggctact tcggcgagct gctggcgtct 300
tcactgaaga gccgcggtgt gcgtgggctc gtcatcgagg ccggatgccg cgacgtgaag 360
cccctcaccg acatgaaatt cccggtgtgg tcgcgcgccg tgtccgcgca agggacagtc 420
aaggagagcc tcggcgatgt gaacctcccg cttgtcattg ccgggcagac ggtgaacccc 480
ggcgacgtga tcgtggctga cgacgacggc gttgtcatcg ttggccgcag cgaggtgcgc 540
gccgtgacga ccaaatcgcg cgagcgcgag gagaaggagg ccaagaaccg cttgcagctc 600
accagcggcc agctcggcat cgacatctat ggtatgcgcg gcaagctcaa ggaaaagggg 660
ctgcgctacg tgaagaacgc gagcgagttg aaggccaaat aa 702<210> 254<211> 233<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (21)...(173)
<223> Demetilmenaguinone metiltransferase<220>
<221> SITE
<222> (229) . .. (232)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 254
Met Ser Gly Ile Val Val Gln Asp Phe Glu Arg Ala Ser Leu Ala Asp1 5 10 15
Ile Lys Ala Leu Ala Glu Phe Gly Val Ala Thr Ile His Glu Ala Gln
20 25 30
Gly Arg Val Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala Gly
35 40 45
Ala Ala Ala Ala Gly Asn Ala Val Thr Val Ser Val Pro Pro Gly Asp
50 55 60
Asn Trp Met Ile His Val Ala Val Glu Val Cys Arg Glu Gly Asp Ile65 70 75 80
Leu Val Val Ala Pro Thr Ser Pro Asn Asp Asn Gly Tyr Phe Gly Glu
85 90 95
Leu Leu Ala Ser Ser Leu Lys Ser Arg Gly Val Arg Gly Leu Val Ile
100 105 110
Glu Ala Gly Cys Arg Asp Val Lys Pro Leu Thr Asp Met Lys Phe Pro
115 120 125
Val Trp Ser Arg Ala Val Ser Ala Gln Gly Thr Val Lys Glu Ser Leu130 135 140
Gly Asp Val Asn Leu Pro Leu Val Ile Ala Gly Gln Thr Val Asn Pro145 150 155 160
Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Ile Val Gly Arg165 170 175
Ser Glu Val Arg Ala Val Thr Thr Lys Ser Arg Glu Arg Glu Glu Lys
180 185 190
Glu Ala Lys Asn Arg Leu Gln Leu Thr Ser Gly Gln Leu Gly Ile Asp195 200 205
Ile Tyr Gly Met Arg Gly Lys Leu Lys Glu Lys Gly Leu Arg Tyr Val210 215 220
Lys Asn Ala Ser Glu Leu Lys Ala Lys225 230
<210> 255
<211> 681
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 255
atgaacgatc cgatcgtcgt tcgacagatc gacagaccat caggcccttc ggtcgatagt 60
ctgcgtcgct ttggcgtctc gaccgtgcac gaggcacagg ggcgccgcgg gctgctcgcg 120
tcgcacatgc ggccgattta cgccggtgcg ctcgtcgctg gtccagcgat cactgtcctg 180
gtgccgccgg gcgacaacct gatgattcac gtcgcggtgg aggtgtgcca gccgggtgac 240
gttctcgttg ttgctccgac gtcgccgtgc accgacggct atttcggcga gctgctggcg 300
acctcgctgc gggctcgtgg cgtggcggga ctcatcatcg acgccggttg ccgggatgtt 360
cgggcgctga gcgagatgcg atttcccgtc tggagtcgcg cgatcagcgc gcagggtacc 420
gtcaaggcga cgctgggttc ggtgaacgtg cccctggtgt gcgccggggc gctggtcgag 480
gcgggagaca ttgtcgtcgc cgacgatgac ggcgtcgtga tcgtcaagaa ggatcaggtc 540
gatgcggtca ctcaggcagc cgaacagcgc gtgcgcaaag aagaggacac acgggcgcgg 600
ttggcgcgag gcgagctcgg cctggacatc tacgccttgc gcaagaagct gtcggacctc 660
gggctgaagt cgtcgtcgtg a 681<210> 256<211> 226<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaguinone metiltransferase<400> 256
Met Asn Asp Pro Ile Val Val Arg Gln Ile Asp Arg Pro Ser Gly Pro1 5 10 15
Ser Val Asp Ser Leu Arg Arg Phe Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser His Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Leu Val Ala Gly Pro Ala Ile Thr Val Leu Val Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ser Glu Met Arg Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Leu Val Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Ile Val Val Ala Asp Asp Asp Gly Val Val Ile Val LysLys Asp Gln Val Asp Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu
Asp Ile Tyr Ala Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser
Ser Ser225
<210> 257<211> 678<212> DNA<213> desconhecido<220>
<400> 257
atgaacgatc ccttcgtcgt tcgacaggtg gaccgaccgt cagctgcgtc gatcgacgat 60
ctgcggcgat tcggcgtctc gaccgtgcac gaggcccagg ggcgccgcgg gttgctcgca 120
tcgtacatgc ggccgatcta caccggtgcg ctcgtcgccg gtcctgccat cacggtcctg 180
gtggcgccgg gcgacaacct gatgatccac gtcgcggtgg aggtgtgcca gcctggtgat 240
gtcctcgtcg tcgccccgac gtcgccatgc acggacgggt atttcggcga actgctggcg 300
acctcgttgc gggctcgcgg cgtcgcaggg ctcatcatcg acgccggctg ccgcgatgtt 360
cgagcgttga gcgagatgcg gtttcccgtc tggagtcgcg cgatcagcgc gcagggcacc 420
gtcaaggcga cgctgggttc ggtgaatgtg ccgctgatgt gcgccggaac gctggtcgag 480
gccggagacg tgatcgtggc cgatgatgac ggcgtcgtgg tcgtcaagcg ggagcaggtc 540
gatgccgtaa cgcaggccgc cgaacagcgc gtgcgaaagg aagaggacac acgggcacgg 600
ctcgcgcgag gcgagctggg cctcgacatc tacggcttgc gcaagaaact gtcggacctc 660
ggtttgaagt cgtcgtga 678<210> 258
<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaguinone metiltransferase<400> 258
Met Asn Asp Pro Phe Val Val Arg Gln Val Asp Arg Pro Ser Ala Ala1 5 10 15
Ser Ile Asp Asp Leu Arg Arg Phe Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Thr
35 40 45
Gly Ala Leu Val Ala Gly Pro Ala Ile Thr Val Leu Val Ala Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Ala Gly Leu Ile
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ser Glu Met Arg Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ala Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Leu Met Cys Ala Gly Thr Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Glu Gln Val Asp Ala Val Thr Gln Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Glu Asp Thr Arg Ala Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ser Asp Leu Gly Leu Lys Ser210 215 220
Ser
225
<210> 259<211> 579<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 259
atgcggccca tctatgccgg tgcggcggcc gccggcagcg ccgtcaccgt atccgtacct 60ccgggcgaca actggatgat ccacgtggcc gtcgaagtct gccgcgaagg cgacgtgctg 120gtcgtcgccc caacctcgcc atgcgataac ggctacttcg gcgagctgct cgccagctcg 180ctcaagtccc gtggcgtgcg cgggcttgtc atcgaggcag gctgtcgcga cgtgagagca 240ctctcggata tgaaattccc ggtctggtcg cgggccgtct ccgcgcaagg cactgtgaag 300gaaagcctgg gcgacgtgaa cctgccgctc gtgatcgccg gacagctcgt caatccgggc 360gatgtcgtgg ttgccgacga cgacggcgtc gtcgtcgtgg cgcggttaga agcgcgcgcc 420gtgaccgcca agtcgcacga acgggagcag aaagaagcag ccaaccgcga gcagctgagc 480aagggtgagc tcggcatcga tacctacggc atgcgcaaga agctcgccga caaggggctg 540cgctacgtcg ccaccgccga agaactcaag gcgaagtga 579
<210> 260<211> 192<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (1)...(132)
<223> Demetilmenaguinone metiltransferase<400> 260
Met Arg Pro IXe Tyr Ala Gly Ala Ala Ala Ala Gly Ser Ala Val Thr1 5 10 15
Val Ser Val Pro Pro Gly Asp Asn Trp Met Ile His Val Ala Val Glu
20 25 30
Val Cys Arg Glu Gly Asp Val Leu Val Val Ala Pro Thr Ser Pro Cys
35 40 45
Asp Asn Gly Tyr Phe Gly Glu Leu Leu Ala Ser Ser Leu Lys Ser Arg
50 55 60
Gly Val Arg Gly Leu Val Ile Glu Ala Gly Cys Arg Asp Val Arg Ala65 70 75 80
Leu Ser Asp Met Lys Phe Pro Val Trp Ser Arg Ala Val Ser Ala Gln
85 90 95
Gly Thr Val Lys Glu Ser Leu Gly Asp Val Asn Leu Pro Leu Val Ile
100 105 110
Ala Gly Gln Leu Val Asn Pro Gly Asp Val Val Val Ala Asp Asp Asp
115 120 125
Gly Val Val Val Val Ala Arg Leu Glu Ala Arg Ala Val Thr Ala Lys
130 135 140
Ser His Glu Arg Glu Gln Lys Glu Ala Ala Asn Arg Glu Gln Leu Ser145 150 155 160
Lys Gly Glu Leu Gly Ile Asp Thr Tyr Gly Met Arg Lys Lys Leu Ala
165 170 175
Asp Lys Gly Leu Arg Tyr Val Ala Thr Ala Glu Glu Leu Lys Ala Lys180 185 190
<210> 261<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 261atgaatcaac cggcggtagt ccgccacgtg gagcagccac ccgccgacgc ggttgcggcg 60
ctggagaagt atggtgtgac gaccgtgcat gaagctcagg gacgttgtgg cctccttgcc 120gcgtacatgc gtccgatttt cccgggagcg gccatcgccg gctccgctgt caccgtgtcg 180ttgcctcccg gcgacaacct catgatccat gtcgcggtcg aggtctgcag gccgggaaac 240atcctggtcg tttcacccac ctcgccttgt accgacggat acttcggtga actgttggca 300acttctctgc gagctcacgg cgtgcaaggt cttgtgattg atgccggatg ccgcgacgtt 360cgaccgctga ctgagatgaa attcccggtc tggagccgga ccatcagctc gcaggggacg 420gtcaaggcca cactcggatc ggtcaatgtc ccgatcatgt gcgcgggcgc actcgtcgaa 480gctggcgacg tcatcatcgc cgatgacgat ggggtcgtgg ttgtcaagcg tgcagacgcg 540caccaggtcg ctgctgctgc ggaacaaagg gttcggaaag agaatgtgac ccgtgagcga 600cttgcgcgtg gagagctagg actcgatatc tacgacatgc gccagaaaat cgcgcaactg 660
ggcctcaaat acctgtaa 678
<210> 262<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 262
Met Asn Gln Pro Ala Val Val Arg His Val Glu Gln Pro Pro Ala Asp
1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Gln Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Pro Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Thr Ile Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Met Cys Ala Gly Ala Leu Val Glu
145 150 155 160
Ala Gly Asp Val Ile Ile Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Asp Ala His Gln Val Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu
225
<210> 263<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 263
atgaataaac cggtggtagt tcgtcaagtg gagcagccac caacggatgc ggttacggca 60ctagaaaagt atggcgtgac gaccgtgcat gaagcccagg gacgttgtgg cctccttgcc 120tcctacatgc gtccgatttt tccgggagcg agcatcgcgg gttctgccgt cactgtgtct 180ttgcctcctg gcgacaacct gatgatccac gtggcggtcg aggtctgtgg tccgggaaat 240atcctcgtcg tttcgccgac ttcgccttgt accgatggct acttcggtga attgttggcc 300
acttccctgc gtgcccgagg tgtccaagga ttagtcatcg atgccggatg ccgtgacgtc 360
cgctcgctga cggagatgaa attcccggtc tggagtcgtg ccatcagctc gcagggcaca 420
gtcaaagcca cccttggatc ggtgaacgtg ccgatcatgt gtgcgggtgc gtccgtggaa 480
gcgggcgatg taattgtggc cgatgatgat ggagttgttg tcgtgaagcg tgcggccgca 540
caagacgtcg ctgcggccgc ggaacaaagg gttcgcaagg aaaacgcgac ccgcgaacgt 600
cttgcacgcg gcgaactcgg actcgatatc tacgacatgc gccagaagat cgcgcagctg 660
ggcctcaaat atctgtga 678
<210> 264
<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 264
Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Thr Asp1 5 10 15
Ala Val Thr Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ser Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Gln Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser Val Asn Val Pro Ile Met Cys Ala Gly Ala Ser Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys165 170 175
Arg Ala Ala Ala Gln Asp Val Ala Ala Ala Ala Glu Gln Arg Val Arg180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr
210 215 220
Leu225<210> 265<211> 678<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 265
atgacgggtc ctatcgtcgt gcgtcacatc gaacggccac cggcagctgc cgtggcacgg 60ctgcaggagt acggcgtggc gacggtccac gaagcgcaag gacgccgcgg gttgctggcc 120gcctatatgc gaccgatcta tgcgggcgca gccattgcgg gccctgcggt cacggtgtcc 180gttccgccgg gcgacaacct gatgatccac gtcgcggtgg aggtctgcca gccgggagac 240gtgctcgtcg tcgctcccac gtcaccgtgc acggacggct acttcggcga gctgctcgcg 300acctcgctgc aggctcatgg cgtcgtcgcg ctcgtcatcg acgccggatg ccgagatgtg 360cgtgccatga cagagatgcg cttccccgtc tggagccgcg cagtcagttc gcagggcacc 420gtgaaagcga cgctggggtc ggtgaacgtg ccggtggcat gtgcgggcac gctcgtgaat 480cccggcgatg tcgtcatagc ggatgatgac ggcgttgtgg tggtgaggcg agacgaggtg 540
gaagagaccg tgagctcgtc ggaaaagcgg atccagaaag aggcgattac gcgagagcgg 600
ctcgccagcg gcgagctcgg gctggatatc tacgggctgc ggaagaaact cgccgacctc 660
ggactgaagt actcataa 678
<210> 266
<211> 225<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22) ... (174)
<223> Demetilmenaquinone metiltransferase
<400> 266
Met Thr Gly Pro Ile Val Val Arg His Ile Glu Arg Pro Pro Ala Ala1 5 10 15
Ala Val Ala Arg Leu Gln Glu Tyr Gly Val Ala Thr Val His Glu Ala20 25 30
Gln Gly Arg Arg Gly Leu Leu Ala Ala Tyr Met Arg Pro Ile Tyr Ala35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Val Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Pro Gly Asp
65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Gln Ala His Gly Val Val Ala Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Met Thr Glu Met Arg Phe115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser Val Asn Val Pro Val Ala Cys Ala Gly Thr Leu Val Asn145 150 155 160
Pro Gly Asp Val Val Ile Ala Asp Asp Asp Gly Val Val Val Val Arg165 170 175
Arg Asp Glu Val Glu Glu Thr Val Ser Ser Ser Glu Lys Arg Ile Gln
180 185 190
Lys Glu Ala Ile Thr Arg Glu Arg Leu Ala Ser Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Gly Leu Arg Lys Lys Leu Ala Asp Leu Gly Leu Lys Tyr210 215 220
Ser225
<210> 267
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 267
atgaatacac cgttggtagt ccgacaagtc gagcagccac cagcggacgc ggttgcggca 60
ttggaaaagt gcggagtcac aaccgtgcat gaggctcagg gacgtggtgg cctctttgcc 120
tcctacatgc gcccgattta cccgggagca accatcgcag gatccgccat cacagtgtct 180
gtgcctccgg gcgacaacct tatgatccat gtggctgtgg aagtctgcgg tgcgggaaac 240
atcctggtgg tttcaccaac ctccccttgt acggatggat acttcggtga gctgttggca 300
acatctcttc gcgcccacgg tgtgaggggg cttgtgatcg atgccggatg tcgtgatgtg 360
cgctctctga cggatatgaa atttccggtt tggagtcgca ccgtcagttc gcaagggaca 420
gtcaaggcca cactcggatc ggtgaatgta cccatcgttt gtgcgggcgc gatggttgag 480
gccggtgatg tgatcgtcgc cgacgacgat ggagttgtgg tggtgaagcg cgcgctggcg 540
ccagaggtcg ccgcggcggc gcaacaaagg gttcgcaaag agaatttggc ccgcgaacga 600
cttggacgcg gagaactcgg actcgacatt tatgacatgc gcgaaaagat cgcgaaactg 660
ggccttaagt atttgtaa 678<210> 268
<211> 225
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 268
Met Asn Thr Pro Leu Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Gly Gly Leu Phe Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Thr Ile Ala Gly Ser Ala Ile Thr Val Ser Val Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Ala Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Asp Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Thr Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Met Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val LysArg Ala Leu Ala Pro Glu Val Ala Ala Ala Ala Gln Gln Arg Val Arg
Lys Glu Asn Leu Ala Arg Glu Arg Leu Gly Arg Gly Glu Leu Gly Leu
Asp Ile Tyr Asp Met Arg Glu Lys Ile Ala Lys Leu Gly Leu Lys Tyr
Leu
225
<210> 269
<211> 678<212> DNA
<213> desconhecido<220>
<400> 269
atgaacacac cggtcgtagt ccggcaagtg gagcaaccat caatggatgt gattgcagcc 60
ctggagaaac atggtgtgac gaccgtacat gaggcccagg gacgttgtgg cctgctggcg 120
tgttacatgc gtccgatttt ccccggagcg agcatcgctg gttccgcggt cactgtttct 180
ttgccccccg gcgataatct tatgatccac gttgcggtcg aggtctgcag tccagggaac 240
atccttgtag ttgccccgac ctcgccttgc acggatggct atttcggaga attgttggca 300
acttccctgc gcgctcgcgg tgtgaaaggt ctcgtgattg atgccggatg ccgtgatgtt 360
cgctctttga cggaaatgaa gttcccggtc tggagccgag cgatcagctc gcagggaacg 420
gtcaaatcta cactcggctc cgtgaacgtg cctatcctgt gcgcgggcgc actcgtcgag 480
gccggcgata tcatcgccgc cgatgacgac ggcgttgtcg ttgtcaagcg cgcaatggcg 540
caggaggtcg ccacggcggc agaacaaagg gtgcgcaaag agaatgtgac ccgagagcgt 600
cttgcgcggg gagatctcgg gctcgatatc tacgacatgc ggcagaaact cgcccaactg 660
ggcctcaaat atctgtga 678<210> 270
<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 270
Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Ser Met Asp1 5 10 15
Val Ile Ala Ala Leu Glu Lys His Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Cys Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ser Ile Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Ser Pro Gly Asn65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ser Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Leu Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Ile Ile Ala Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Met Ala Gln Glu Val Ala Thr Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Leu Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu
225
<210> 271<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 271
atgaaccaag ccgtggtggt ccggaatatc gagcgcccgc ccgcggatgt agttgctgcg 60ttggagaaac ttggtgtttc cacggtgcac gaggcgcagg gacgttgcgg tctgttcgct 120acgtatatga ggccgattta tgcgggtgcg gcgattgccg ggccggcggt taccgtatcg 180ttgccgccgg gtgacaattt gatgattcac gtggccgtgg aagtgtgccg cgcgggggac 240attttggtgg tcgcgccgac ttcgccttgc acggacgggt atttcggcga attgctggcg 300acttcgttgc gcgcacatgg cgtcaagggc ctggtgatcg atgcggggtg ccgcgacgtc 360cgagcgctcg cggagatgaa atttcccgtg tggagccgcg cagtaagttc gcagggaacg 420gtgaagtcga cccttggttc ggtaaacgtc ggaattgtgt gcgcaggagc acgcgtggaa 480gccggagacg tgatcgttgc cgacgatgac ggcgtagtgg gggtgaagtg cggcgcagcg 540caggaagtgg ttgccgcggc gcagctgcgc gttcgcaagg aagaggccac gcgcgaacgc 600ttggggcgtg gcgagctcgg cctggatatc cacgggctgc gggccaaggt cgcggagctt 660ggcctgaaat atttgtga 678
<210> 272
<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22) . . . (174)
<223> Demetilmenaquinone metiltransferase<400> 272
Met Asn Gln Ala Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp1 5 10 15
Val Val Ala Ala Leu Glu Lys Leu Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Phe Ala Thr Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Ala Gly Asp65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ala Leu Ala Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr
130 135 140
Leu Gly Ser Val Asn Val Gly Ile Val Cys Ala Gly Ala Arg Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Gly Val Lys
165 170 175
Cys Gly Ala Ala Gln Glu Val Val Ala Ala Ala Gln Leu Arg Val Arg
180 185 190
Lys Glu Glu Ala Thr Arg Glu Arg Leu Gly Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile His Gly Leu Arg Ala Lys Val Ala Glu Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 273<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 273
atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg acctggggat 240gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggcga gttgcttgca 300acttcgctcg cggcgcatgg ggtgaaaggc ttgatcattg aggcgggatg tcgcgacgtc 360cgagctctga cggaaatgaa gtttccagtc tggagccgcg ccgtcagctc gcaaggaacg 420gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgcg 480cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600cttgcttcgg gggaactcgg cctggatatt tacggcctgc gagcgaagat tgcagacctc 660ggtctcaagt acttgtag 678
<210> 274<211> 225<212> PRT<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)... (174)
<223> Demetilmenaguinone metiltransferase<220>
<221> SITE<222> (151)...(154)<223> Sítio de N-glicosilação prosítio id = PS00001<400> 274
Met Asn Lys Pro Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp15 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Val Lys Gly Leu Ile
100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Thr Ile Val Cys Ala Gly Ala Ala Val Ala145 150 155 160
Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Thr Glu Ala Gln Glu Val Val Thr Ala Ser Glu Gln Arg Leu Arg
180 185 190
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 275<211> 690<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 275
atgcctatcg ttgttacgaa gatcgaccga cccagcgcgg cggacgtcga aaggatcgcc 60gcctatggtg tcgcgacctt gcatgaagcg caaggacgaa ccgggttgat ggcgtccaat 120atgcgcccaa tctatcgccc tgcgcacatt gccgggcccg cggtgacctg ccttgtggcg 180cctggcgaca attggatgat ccatgtcgcc gtcgaacagt gccagccggg agatgtcctg 240gtcgtggtac cgaccagccc ctgcgaagac ggctatttcg gcgatctgct ggcgacctcg 300ctgcggtcgc gcggggtcaa aggtctgatc atcgaggccg gcgtacgcga tatcgcgaca 360ttgaccgaga tgaaattccc ggtctggtcc aaggcggtgt tcgcgcaagg aacggtcaag 420gagaccatcg ccagcgtcaa tgtgcccctc gtctgcgcgg gcgcccgcat cgtgccgggc 480gatctgatcg ttgccgacga cgacggggtc gtcgtgattc caagacgttc cgttccggcg 540gtcctttcca gcgccgaggc ccgcgaagag aaggaagccc gcaaccgcgc ccgcttcgaa 600gctggcgagc tgggcctcga cgtctacaac atgcgccagc gcctggccga caagggcttg 660cgctatgtcg agcggctgcc cgaggaatag 690
<210> 276<211> 229<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (20)...(172)<223> Demetilmenaquinone metiltransferase<400> 276
Met Pro Ile Val Val Thr Lys Ile Asp Arg Pro Ser Ala Ala Asp Val1 5 10 15
Glu Arg Ile Ala Ala Tyr Gly Val Ala Thr Leu His Glu Ala Gln Gly
20 25 30
Arg Thr Gly Leu Met Ala Ser Asn Met Arg Pro Ile Tyr Arg Pro Ala
35 40 45
His Ile Ala Gly Pro Ala Val Thr Cys Leu Val Ala Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Val Glu Gln Cys Gln Pro Gly Asp Val Leu65 70 75 80
Val Val Val Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Leu Arg Ser Arg Gly Val Lys Gly Leu Ile Ile Glu
100 105 110
Ala Gly Val Arg Asp Ile Ala Thr Leu Thr Glu Met Lys Phe Pro Val
115 120 125
Trp Ser Lys Ala Val Phe Ala Gln Gly Thr Val Lys Glu Thr Ile Ala
130 135 140
Ser Val Asn Val Pro Leu Val Cys Ala Gly Ala Arg Ile Val Pro Gly145 150 155 160
Asp Leu Ile Val Ala Asp Asp Asp Gly Val Val Val Ile Pro Arg Arg
165 170 175
Ser Val Pro Ala Val Leu Ser Ser Ala Glu Ala Arg Glu Glu Lys Glu
180 185 190
Ala Arg Asn Arg Ala Arg Phe Glu Ala Gly Glu Leu Gly Leu Asp Val
195 200 205
Tyr Asn Met Arg Gln Arg Leu Ala Asp Lys Gly Leu Arg Tyr Val Glu
210 215 220
Arg Leu Pro Glu Glu225
<210> 277<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 277
atgaatacac cggtggtagt ccgacaagtg gagcagccac cagcggatgc ggttgccgca 60ttggagaagt gtggagtgac caccgtgcat gaggcgcagg gacgctgcgg cctccttgcg 120tcctacatgc gcccaattta cccgggagca gccatcgccg gttccgctat cactgtgtct 180ttgcctcctg gcgacaacct catgatccat gttgcggtgg aggtctgcag tccgggaaat 240atcctggtag tttcaccggc ctcgccttgt accgatggct acttcggtga gctgttggcg 300acgtctctcc gtgcccacgg cgtgagaggg cttgtgatcg aggcgggatg ccgtgacgtg 360cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccatcagttc gcaggggaca 420gtcaaggcta cacttggatc ggtaaacgtg cccatcgtgt gcgcgggcgc acgggtcgag 480gctggtgatg tcatcgtcgc cgatgacgat ggagtggtgg ttgtgaagcg ggcgcttgcg 540caagaggtcg ccgcggcggc ggaacaaagg gttcgcaaag agaatgcgac ccgcgaacga 600cttgcgcgcg gagaactcgg actcgatatt tacgacctgc gccaaaagat cgctcaactg 660ggccttaaat atctgtga 678
<210> 278<211> 225<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<400> 278
Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Cys Gly Val Thr Thr Val His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Ser Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Ala Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg Gly Leu Val
100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Arg Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala Leu Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Leu Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 279<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 279atgaataaac cggtggtagt gcggcaagtc gagcagccac ccgccgatgc ggttgcggcc 60
ctggagaagt atggcgtgac caccgtgcac gaagctcaag cgcgttgtgg cctgctggct 120
ccctatatgc gcccgatttt tgcgggagca tgcatcgccg gttccgccgt gaccgtgtct 180
ttgccgcctg gcgataatct catgatccac gttgccgtcg aggtctgcac tccgggcagc 240
attctggtag ttgcccccac ctcgccttgc acggacggtt atttcgggga actcctggca 300
acttccctgc tcgctcacgg tgtcaaagga ttggtcatcg atgctggctg tcgggatgtt 360
cgctcgttaa cggaaatgaa attccccgtc tggagccgtg ctgtcagttc tcaaggaacg 420
gtgaaggcca cgctcggatc ggtgaatgtg ccggtcattt gcgcgggcgc ggaggtggag 480
gctggcgata tcatcatcgc cgatgatgat ggtgtggtgg tggtgaagcg cacgctggcg 540
cacgaggtgg cagcggcggc ggaactacgg gttcgcaagg agaatgccac ccgcgaacga 600
ctcgcacgag gggatctcgg cctcgatatc tacgacatgc ggcaaaaaat cgcgcaactt 660
ggtctcaaat atctgtga 678<210> 280<211> 225
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Thr Pro Gly Ser
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 280
Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp
1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Ala Arg Cys Gly Leu Leu Ala Pro Tyr Met Arg Pro Ile Phe Ala65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Leu Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Val Ile Cys Ala Gly Ala Glu Val Glu
145 150 155 160
Ala Gly Asp Ile Ile Ile Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Thr Leu Ala His Glu Val Ala Ala Ala Ala Glu Leu Arg Val Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Asp Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu
225<210> 281<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 281
atgaacaagc ccgtggtcgt ccggcacgtg gaccaaccgt cagccgacgt tgtggctgcg 60ctggagaagt acggagtctc gaccgtgcac gaagcgcaag gccgttgcgg tctactggcc 120tcgtacatgc acccgattta tcccggcgat tccatcgctg ggcctgcggt cacggtttcg 180cttccgccag gtgacaattt gatgatccat gttgcggtcg aggtctgccc ggcgggaagc 240gttctggtcg tggctcccac ctcaccgtgc acagacggtt atttcggcga attgctggca 300acttctctgc gcgctcacca tgtgacgggg ttggttatcg atgccggttg ccgcgacgtt 360cgctcactca cggaaatgaa gtttccggtg tggagtcgcg ccgtcagttc acaggggacc 420gtaaagtcga cgcttggctc cgtgaacgtg ccagtagtgt gcgccggggc ccatgtcgaa 480gcgggcgata tcatcgtcgc cgatgacgat ggagtggtag ttgtaaagcg attggacgca 540cccgaggtag tcgctgcgtg cgaacaaagg gttcgcaagg aacaggtgac gcgcgaacgg 600ctggcgcgcg gcgaactggg tctggatatt tacggcctgc gaagcaaaat cgccgaactt 660ggcctcaagt acgagtag 678
<210> 282<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 282
Met Asn Lys Pro Val Val Val Arg His Val Asp Gln Pro Ser Ala Asp1 5 10 15
Val Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met His Pro Ile Tyr Pro
35 40 45
Gly Asp Ser Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Pro Ala Gly Ser
65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His His Val Thr Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val Lys Ser Thr130 135 140
Leu Gly Ser Val Asn Val Pro Val Val Cys Ala Gly Ala His Val Glu145 150 155 160
Ala Gly Asp Ile Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys165 170 175
Arg Leu Asp Ala Pro Glu Val Val Ala Ala Cys Glu Gln Arg Val Arg180 185 190
Lys Glu Gln Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Gly Leu Arg Ser Lys Ile Ala Glu Leu Gly Leu Lys Tyr
210 215 220
Glu225
<210> 283<211> 678<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 283
atgaatacac cggtggtagt ccggcaagtg gagcagccac cagcggacgc ggtggccgca 60ttggagaact gtggcgtgac caccgtgcat gaggctcagg gacgtagtgg cctgcttgcc 120tcctacatgc gcccgattta ccagggagca gccatcgcag gttccgctct caccgtgtct 180ttgcctccgg gcgacaacct catgatgcat gttgcggtag agttctgcgg cccgggaaat 240atcctggtcg ttgcaccgac ctcgccctgt acggatggct acttcggtga gctgttggca 300acatctctcc gtgcccacgg tgggagaggg cttgtgatcg atgccggatg ccgtgacctg 360cgctctctaa cagaaatgaa attccctgtc tggagccgcg ccatcagttc gcaagggacg 420gtcaaggcca cacttggatc cgtgaatgtg cccatcgtat gcgcgggcgc attggtcgag 480gccggagatg tcatcgtcgc cgatgacgat ggagttgtgg ttgtgaagcg cgccctcgcg 540
caagaggtca gggcggcggc ggagcaaagg gttcgcaaag aaaatgcgac ccgcgaaaga 600
ctcgcacgtg gagaactcgg actcgacatt tacgacatgc gccaaaagat cgcgcagctg 660
ggccttaaat atctgtga 678
<210> 284
<211> 225
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 284
Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Asn Cys Gly Val Thr Thr Val His Glu Ala20 25 30
Gln Gly Arg Ser Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Gln35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Leu Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Met His Val Ala Val Glu Phe Cys Gly Pro Gly Asn
65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Gly Arg Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Leu Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys165 170 175
Arg Ala Leu Ala Gln Glu Val Arg Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Ala Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 285
<211> 678
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 285
atgaatacac cggtggtagt aagacaagtg gagcagccac cagcggatgc aattgccgca 60
ttgaagaagt gtggcgtgac aaccgtccac gaggctcagg gacgtggtgg ccttcttgcg 120
tcctacatgc gcccgattta cccgggagca gccatcgcag gatccgctat cactgtgtct 180
ttgcctcctg gcgacaacct catgatccac gttgcggtgg aggtctgcgg tccgggaaac 240
atcctggtag tttcaccgac ctcgccttgt acggatggct acttcggtga gttgttggca 300
acatctctcc gtgcccaggg cgtgattggg cttgtgatcg atgccggatg ccgtgacgtg 360
cgctctctaa cagaaatgaa attcccggtc tggagccgcg ccatctgttc gcaagggaca 420
gtcaaggcca cacttggatc ggtgaatgtg cccatcgtat gcgcgggtgc attggtcgag 480
gctggtgatg tcatcgtcgc cgacgacgat ggcgttgtgg ttgtaaagcg agcgctggcg 540
caagaggtcg ccgctgcggc ggaacaaaag gttcgcaaag agaatgtaac ccgcgaacga 600
ctcgcacgtg gagagctcgg acttgatatt tacgacatgc gccaaaagat cgcgcaactg 660
ggcctcaaat atctgtga 678<210> 286<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 286
Met Asn Thr Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Ile Ala Ala Leu Lys Lys Cys Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Ile Ala Gly Ser Ala Ile Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ser Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Gln Gly Val Ile Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Cys Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val LysArg Ala Leu Ala Gln Glu Val Ala Ala Ala Ala Glu Gln Lys Val Arg
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr
Leu225
<210> 287
<211> 678
<212> DNA
<213> desconhecido
<220>
<400> 287
atgaacaaac cgttggtgat ccggcaagtg gagcggccgc cggctgacgc tgtggcggcg 60
ctcgaaaaat atggcgtgtc caccgtgcat gaagcccagg gacgttgcgg actgctcgct 120
tcctacatgc gaccgattta tcccggtgct gccgttgccg gttcggcggt caccgtatcc 180
cttccgcccg gcgataatct gatgattcac gttgctgtcg aggtctgcca gtccggcgat 240
attctcgtgg ttgctccgac ctcgccttgc tcggacggat acttcggtga gttgctggcg 300
acgtccttgc gcgcgcacgg cgtgaagggc ctcgtcattg acgcggggtg ccgtgacgtt 360
cgctcactta ccgaaatgag gttccccgtc tggagccgca gcgtcagctc gcaaggtacc 420
gtgaagtcta ctctcggatc tgtgaatgtg agcattgttt gtgccggcgc gcacatcgaa 480
gctggtgatg tgatcgtcgc ggatgacgac ggtgtcgtgg tggtgaagcg cgcatccgcc 540
cacgaagtag tcgcggcgtg cgaacagcgg gttcgcaagg aagaggtcac tcgggagcgg 600
ttggcgcgcg gggagcttgg gcttgacatc tacgggttgc gcacaaaaat cgcggaaatg 660
ggtctcaagt atcaatga 678<210> 288<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<220>
<221> SITE<222> (151)...(154)<223> Sítio de N-glicosilação prosítio id = PS00001<400> 288
Met Asn Lys Pro Leu Val Ile Arg Gln Val Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Pro
35 40 45
Gly Ala Ala Val Ala Gly Ser Ala Val Thr Val Ser Leu Pro Pro Gly50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gln Ser Gly Asp65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Cys Ser Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Arg Phe
115 120 125
Pro Val Trp Ser Arg Ser Val Ser Ser Gln Gly Thr Val Lys Ser Thr
130 135 140
Leu Gly Ser Val Asn Val Ser Ile Val Cys Ala Gly Ala His Ile Glu
145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val LysArg Ala Ser Ala His Glu Val Val Ala Ala Cys Glu Gln Arg Val Arg
Lys Glu Glu Val Thr Arg Glu Arg Leu Ala Arg Gly Glu Leu Gly Leu
Asp Ile Tyr Gly Leu Arg Thr Lys Ile Ala Glu Met Gly Leu Lys Tyr
Gln225
<210> 289
<211> 678
<212> DNA
<213> desconhecido
<220>
<400> 289
atgaacaagc ccgtggttgt gcggaacatc gagcgtccgc cggcggatgc tgtggccgcg 60
cttgagaaat acggcgtgtc gacggtgcac gaggcccagg gccggaacgg cctactggcc 120
tcctatatgc gcccgatcta tgcaggagcc gcgatcgctg gaccagccgt cacagtttcc 180
ctcccgccgg gagacaacct gatgattcac gtcgccgtcg aggtctgtcg gcctggggat 240
gtcctcgttg ttgcgccgac atcgccatgc accgacggct attttggaga gttgcttgca 300
acttcgctcg cggcgcatgg ggtgaaaggc ttagtcattg aggcgggatg tcgcgacgtc 360
cgagctctga tggaaatgaa gtttccagtc tggagccgcg ccgtcaactc gcaaggaacg 420
gtgaaggcaa cacttgggtc ggtaaatgta acgattgttt gtgcgggtgc tgcggttgcg 480
cccggtgatg tgatcgtggc ggacgatgat ggcgtcgttg tcgtgaaacg gacagaggcg 540
caagaggtcg ttaccgcatc tgagcagaga ttgcgaaagg aagagggaac ccgcaagcgg 600
cttgcttcgg gggaactcgg cctggatatt tacggcctgc gagcgaagat tgcagacctc 660
ggtctcaagt acttgtag 678<210> 290
<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)... (174)
<223> Demetilmenaquinone metiltransferase<220>
<221> SITE
<222> (151)...(154)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 290
Met Asn Lys Pro Val Val Val Arg Asn Ile Glu Arg Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Ser Thr Val His Glu Ala
20 25 30
Gln Gly Arg Asn Gly Leu Leu Ala Ser Tyr Met Arg Pro Ile Tyr Ala
35 40 45
Gly Ala Ala Ile Ala Gly Pro Ala Val Thr Val Ser Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Arg Pro Gly Asp65 70 75 80
Val Leu Val Val Ala Pro Thr Ser Pro Cys Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Ala Ala His Gly Val Lys Gly Leu Val
100 105 110
Ile Glu Ala Gly Cys Arg Asp Val Arg Ala Leu Met Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Val Asn Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Thr Ile Val Cys Ala Gly Ala Ala Val Ala145 150 155 160
Pro Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val LysArg Thr Glu Ala Gln Glu Val Val Thr Ala Ser Glu Gln Arg Leu Arg
Lys Glu Glu Gly Thr Arg Lys Arg Leu Ala Ser Gly Glu Leu Gly Leu
Asp Ile Tyr Gly Leu Arg Ala Lys Ile Ala Asp Leu Gly Leu Lys Tyr
Leu225
<210> 291
<211> 678<212> DNA
<213> desconhecido<220>
<400> 291
atgaataaac cggtggtagt ccggcaagtg gagcagccac ccgcggacgc ggttgcggcg 60
ctggagaagt atggcgttac caccgpgcat gaggctcagg gacgttgtgg cctgctcgcg 120
cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgctgt caccgtagct 180
ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240
atcctggttg tggcaccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300
acctctttgc gtgctcacgg tgtgaaaggg cttgtgattg atgccggatg ccgtgacgtt 360
cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaaca 420
gtcaaggcca ccctcggatc ggtgaatgtg ccggtcatgt gcgcgggcgc gctcgtcgaa 480
gctggggatg tcatcgtcgc cgatgatgat ggagttgtgg ttgtgaagcg cgcgaatgcg 540
cacgaggtgg ccgcggcggc agaacaaagg gtgcgcaagg agaatataac ccgcgaacgg 600
cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaaaat cgcgcaactg 660
ggcctcaaat acctgtga 678<210> 292
<211> 225
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 292
Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala20 25 30
Gln Gly Arg Cys Gly Leu Leu Ala His Tyr Met Arg Pro Ile Phe Pro
35 40 45
Gly Ala Ala Ile Ser Gly Ser Ala Val Thr Val Ala Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Lys Gly Leu Val100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr 130 135 140
Leu Gly Ser Val Asn Val Pro Val Met Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys165 170 175
Arg Ala Asn Ala His Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg180 185 190
Lys Glu Asn Ile Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu
225
<210> 293<211> 678<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 293
atgaatcgac cggtggtagt ccggcaagtt gaacagccac cagcggatgc ggttgccgca 60ctggagaagt atggcgtgac aaccgtccat gaggctcagg gacccggtgg cctcctagcc 120tcctacatgc gcccgattta cccgggagca gtcatcgccg gttccgcggt cactgtgtct 180ttacctcctg gcgacaacct catgatccac gtggccgtgg aggtctgtgg tccgggaaac 240attctggttg ttgcaccgat ctcgccgtgt acggatggct acttcggaga gctgttggca 300acctctctcc gcgcccacgg tgtgcgaggg cttgtgatcg atgccggatg ccgggacgtg 360cgctctctca cagaaatgaa atttccggtc tggagccgcg ccgtcagttc acaggggaca 420gtcaaggcca ccctgggatc ggtgaatgtg ccgattgtgt gcgcgggcgc gcgggtcggg 480gctggggatg tcatcgtcgc cgatgacgat ggagttgtgg tggtgaagcg cgcgctggcc 540gaagaggtcg ccgccgcggc ggaacaaagg gttcgcaaag agaatgtgac ccgggaacga 600cttgcgcgtg gagagctggg actcgatatt tacgacatgc gccaaaagat cgcacaactg 660ggccttaaat atctctga 678
<210> 294
<211> 225<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)
<223> Demetilmenaquinone metiltransferase<400> 294
Met Asn Arg Pro Val Val Val Arg Gln Val Glu Gln Pro
1 5 10
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val
20 25
Gln Gly Pro Gly Gly Leu Leu Ala Ser Tyr Met Arg Pro35 40 45
Gly Ala Val Ile Ala Gly Ser Ala Val Thr Val Ser Leu50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly65 70 75
Ile Leu Val Val Ala Pro Ile Ser Pro Cys Thr Asp Gly
85 90
Glu Leu Leu Ala Thr Ser Leu Arg Ala His Gly Val Arg
100 105
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu115 120 125
Pro Val Trp Ser Arg Ala Val Ser Ser Gln Gly Thr Val130 135 140
Leu Gly Ser Val Asn Val Pro Ile Val Cys Ala Gly Ala145 150 155
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val
165 170
Arg Ala Leu Ala Glu Glu Val Ala Ala Ala Ala Glu Gln
180 185
Lys Glu Asn Val Thr Arg Glu Arg Leu Ala Arg Gly Glu195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly210 215 220
Pro Ala Asp15
His Glu Ala30
Ile Tyr Pro
Pro Pro Gly
Pro Gly Asn80
Tyr Phe Gly95
Gly Leu Val110
Met Lys Phe
Lys Ala Thr
Arg Val Gly160
Val Val Lys
175Arg Val Arg190
Leu Gly LeuLeu Lys Tyr
Leu225<210> 295<211> 678<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 295
atgaataaac cggtggtagt ccggcaagtg gagcagccgc cagcggacgc ggttgcggcg 60ctggagaagt atggcgtcac caccgtgcat gaggctcagg gacgttgtgg cctgctcggg 120cactacatgc gtccgatttt tccgggagcg gccatctcgg gttctgcagt caccgtagct 180ttgccgccgg gcgataacct catgatccac gtcgcggtcg aggtctgcgg cccgggaaac 240atcctggtgg ttgcaccgac ctcgccttcg acggatggct acttcggtga gctgttggcg 300acctctctgc gtgctcgcga tgtgaaaggg cttgtgattg atgccggatg ccgtgacgtt 3 60cgctccctga ccgagatgaa attccccgtc tggagccgtg ccatcagctc gcagggaacg 420gtcaaggcca ccctcggatc ggtgaatgtg ccggtcacgt gcgcgggcgc gctcgtcgaa 480gccggggatg tcatcgtcgc cgatgatgat ggagttgtgg ttgtgaagcg cgcgcatgcg 540cacgaggtgg cggcggcggc agaacaaagg gtgcgcaaag agaatataac ccgcgaacgg 600cttcgacgcg gagagctcgg actcgatatt tacgacatgc gccaaaagat cgcgcaactg 660ggcctcaaat acctgtga 678
<210> 296<211> 225<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (22)...(174)<223> Demetilmenaguinone metiltransferase<400> 296
Met Asn Lys Pro Val Val Val Arg Gln Val Glu Gln Pro Pro Ala Asp1 5 10 15
Ala Val Ala Ala Leu Glu Lys Tyr Gly Val Thr Thr Val His Glu Ala
20 25 30
Gln Gly Arg Cys Gly Leu Leu Gly His Tyr Met Arg Pro Ile Phe Pro35 40 45
Gly Ala Ala Ile Ser Gly Ser Ala Val Thr Val Ala Leu Pro Pro Gly
50 55 60
Asp Asn Leu Met Ile His Val Ala Val Glu Val Cys Gly Pro Gly Asn65 70 75 80
Ile Leu Val Val Ala Pro Thr Ser Pro Ser Thr Asp Gly Tyr Phe Gly
85 90 95
Glu Leu Leu Ala Thr Ser Leu Arg Ala Arg Asp Val Lys Gly Leu Val
100 105 110
Ile Asp Ala Gly Cys Arg Asp Val Arg Ser Leu Thr Glu Met Lys Phe
115 120 125
Pro Val Trp Ser Arg Ala Ile Ser Ser Gln Gly Thr Val Lys Ala Thr
130 135 140
Leu Gly Ser Val Asn Val Pro Val Thr Cys Ala Gly Ala Leu Val Glu145 150 155 160
Ala Gly Asp Val Ile Val Ala Asp Asp Asp Gly Val Val Val Val Lys
165 170 175
Arg Ala His Ala His Glu Val Ala Ala Ala Ala Glu Gln Arg Val Arg
180 185 190
Lys Glu Asn Ile Thr Arg Glu Arg Leu Arg Arg Gly Glu Leu Gly Leu
195 200 205
Asp Ile Tyr Asp Met Arg Gln Lys Ile Ala Gln Leu Gly Leu Lys Tyr210 215 220
Leu225
<210> 297
<211> 672<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 297
atgggtgtcg tcgtccaaaa catcgagcgg gctgcgcaag ggaccatcga ccgcctcgcc 60gcctgcgggg tggctaccgt ccatgaagcg caggggcgca aggggctgct ggcgagccac 120atgcggccgg tctacagggg cgcacggctc gccgcgagcg cggtgacgat ttcggcgccg 180cccggcgaca actggatgat ccatgtcgcc atcgagcagc tccaagccgg cgacatcatg 240gtgctggcgc cgaccagccc gtgcgaggac ggatatttcg gcgacctcct ggcgacctcg 300gcgcaggcgc gcgggtgcaa ggggctggtg atcgatgccg gcgtgcgcga cgttgccgac 360cttacggcaa tgcagttccc ggtgtggtcg aaggcgatct tcgcgcaggg cacgctgaaa 420gagacgctgg gttcggtgaa cgtgccggtg gtctgcgccg gcgcgctggt caacccgggc 480gacgtcatcg tcgccgatga cgacggggtc tgcgtggtac gccgcgagga ggtcgaggca 540gtggcggaaa aggcggaagc ccgcgtcgct gccgaggagg acaagcgcaa gcgcctcgcc 600gggggagaac tggggctcga catctacaag atgcgcgagc gcttggccga gaagggcctc 660aaatatgtct ga 672
<210> 298<211> 223<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (20)...(172)
<223> Demetilmenaquinone metiltransferase<400> 298
Met Gly Val Val Val Gln Asn Ile Glu Arg Ala Ala Gln Gly Thr Ile1 5 10 15
Asp Arg Leu Ala Ala Cys Gly Val Ala Thr Val His Glu Ala Gln Gly20 25 30
Arg Lys Gly Leu Leu Ala Ser His Met Arg Pro Val Tyr Arg Gly Ala35 40 45
Arg Leu Ala Ala Ser Ala Val Thr Ile Ser Ala Pro Pro Gly Asp Asn
50 55 60
Trp Met Ile His Val Ala Ile Glu Gln Leu Gln Ala Gly Asp Ile Met65 70 75 80
Val Leu Ala Pro Thr Ser Pro Cys Glu Asp Gly Tyr Phe Gly Asp Leu
85 90 95
Leu Ala Thr Ser Ala Gln Ala Arg Gly Cys Lys Gly Leu Val Ile Asp100 105 110
Ala Gly Val Arg Asp Val Ala Asp Leu Thr Ala Met Gln Phe Pro Val115 120 125
Trp Ser Lys Ala Ile Phe Ala Gln Gly Thr Leu Lys Glu Thr Leu Gly
130 135 140
Ser Val Asn Val Pro Val Val Cys Ala Gly Ala Leu Val Asn Pro Gly145 150 155 160
Asp Val Ile Val Ala Asp Asp Asp Gly Val Cys Val Val Arg Arg Glu
165 170 175
Glu Val Glu Ala Val Ala Glu Lys Ala Glu Ala Arg Val Ala Ala Glu180 185 190
Glu Asp Lys Arg Lys Arg Leu Ala Gly Gly Glu Leu Gly Leu Asp Ile195 200 205
Tyr Lys Met Arg Glu Arg Leu Ala Glu Lys Gly Leu Lys Tyr Val
210 215 220
<210> 299
<211> 501
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 299
atgggttcct tggcaactgc cgaagcttgt gacacgaatg cagcacacct gacaagcggt 60gacatccggg tcctgccacc actcttcaag atttacgggc aaagtcgggc attctctggg 120ccaatcgtga ctgtgaaggt atttgaagac aatgtgctgg tacgggaact tcttgaaacc 180aaaggcgacg gtagagttct ggtgatagac ggcggaggga gcatgaggtg tgccttggtc 240ggaggaaacc tggggcagtt agcgcagaac atggggtggg cggggattgt tgtaaacggg 300tgcataagag acgtagatga gatcaacggg tgcgatgttg gggttagagc attggcatcc 360catccacaga agtcgaataa aaaggggcat ggggagaaac acatgccgat taatatcgcg 420ggcacgatga tccgagacgg agagtggttg tatgcagaca gtgatggcat tctcatctcc 480agaactgagc tctctatcta g 501
<210> 300<211> 166<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (2)...(159)
<223> Demetilmenaguinone metiltransferase<400> 300
Met Gly Ser Leu Ala Thr Ala Glu Ala Cys Asp Thr Asn Ala Ala His
1 5 10 15
Leu Thr Ser Gly Asp Ile Arg Val Leu Pro Pro Leu Phe Lys Ile Tyr
20 25 30
Gly Gln Ser Arg Ala Phe Ser Gly Pro Ile Val Thr Val Lys Val Phe
35 40 45
Glu Asp Asn Val Leu Val Arg Glu Leu Leu Glu Thr Lys Gly Asp Gly
50 55 60
Arg Val Leu Val Ile Asp Gly Gly Gly Ser Met Arg Cys Ala Leu Val
65 70 75 80
Gly Gly Asn Leu Gly Gln Leu Ala Gln Asn Met Gly Trp Ala Gly Ile
85 90 95
Val Val Asn Gly Cys Ile Arg Asp Val Asp Glu Ile Asn Gly Cys Asp100 105 110Val Gly Val Arg115
Gly His Gly Glu130
Arg Asp Gly Glu145
Arg Thr Glu Leu<210> 301
<211> 501
<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<400> 301
atgggttcct tggcaactgc cgaagcttgt gacacgaatg cagcacacct gacaagcggt 60gacatccggg tcctgccacc actcttcaag atttacgggc aaagtcgggc attctctggg 120ccaatcgtga ctgtgaaggt atttgaagac aatgtgctgg tacgggaact tcttgaaacc 180aaaggcgacg gtagagttct ggtgatagac ggcggaggga gcatgaggtg tgccttggtc 240ggaggaáacc tggggcagtt agctcagaac atggggtggg cagggattgt tgtaaacggg 300tgcataagag acatagatga gatcaacggg tgcgatgttg gggttagagc attggcatcc 360catccacaga agtcgaataa aaaggggcat ggggagaaac acatgccgat taatatcgcg 420ggcacgatga tccgagacgg agagtggttg tatgcagaca gtgatggcat tctcatctcc 480agaactgagc tctctatcta g 501
<210> 302<211> 166<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
Ala Leu Ala Ser His Pro Gln Lys Ser Asn Lys Lys
120 125
Lys His Met Pro Ile Asn Ile Ala Gly Thr Met Ile
135 140
Trp Leu Tyr Ala Asp Ser Asp Gly Ile Leu Ile Ser150 155 160
Ser Ile165<222> (2)...(159)
<223> Demetilmenaquinone metiltransferase<400> 302
Met Gly Ser Leu Ala Thr Ala Glu Ala Cys Asp Thr Asn Ala Ala His1 5 10 15
Leu Thr Ser Gly Asp Ile Arg Val Leu Pro Pro Leu Phe Lys Ile Tyr
20 25 30
Gly Gln Ser Arg Ala Phe Ser Gly Pro Ile Val Thr Val Lys Val Phe35 40 45
Glu Asp Asn Val Leu Val Arg Glu Leu Leu Glu Thr Lys Gly Asp Gly50 55 60
Arg Val Leu Val Ile Asp Gly Gly Gly Ser Met Arg Cys Ala Leu Val65 70 75 80
Gly Gly Asn Leu Gly Gln Leu Ala Gln Asn Met Gly Trp Ala Gly Ile
85 90 95
Val Val Asn Gly Cys Ile Arg Asp Ile Asp Glu Ile Asn Gly Cys Asp
100 105 110
Val Gly Val Arg Ala Leu Ala Ser His Pro Gln Lys Ser Asn Lys Lys115 120 125
Gly His Gly Glu Lys His Met Pro Ile Asn Ile Ala Gly Thr Met Ile130 135 140
Arg Asp Gly Glu Trp Leu Tyr Ala Asp Ser Asp Gly Ile Leu Ile Ser145 150 155 160
Arg Thr Glu Leu Ser Ile
165
<210> 303
<211> 501
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 303atggccttag taaccactgc cgaagtttgt gatgcgaacc cacagctcat tgtgagcggc 60gagcttcgcg cactccatcc aattttccaa atttacggta ggcggcaagt cttctccggg 120cccgttgtta cgctgaaggt gtttgaagat aatgtgttgg tgcgcgaatt tcttgaggag 180aggggcaatg gcagggttct tgttgtcgat ggtggtggca gcttgagatg cgcaatactc 240ggtggcaacc ccgttgtaca agctcagaac aacgggtggg ctggcattgt ggttaacggg 300tgtataaggg atgttgatga aatcaacggg tgcgacattg gagtcagagc tctggccgcg 360cacccggtga aagccaataa gaaaggcatc ggtgagaagc atgttccggt gaacattggt 420ggaacccgta tatgtgatgg agagtggctc tatgcagata ccgatggtat tttggtgtct 480aaaaccgagt tgtctgtcta a 501
<210> 304<211> 166<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (2)... (159)
<223> Demetilmenaguinone metiltransferase<400> 304
Met Ala Leu Val Thr Thr Ala Glu Val Cys Asp Ala Asn Pro Gln Leu15 10 15
Ile Val Ser Gly Glu Leu Arg Ala Leu His Pro Ile Phe Gln Ile Tyr20 25 30
25 Gly Arg Arg Gln Val Phe Ser Gly Pro Val Val Thr Leu Lys Val Phe35 40 45
Glu Asp Asn Val Leu Val Arg Glu Phe Leu Glu Glu Arg Gly Asn Gly
50 55 60
Arg Val Leu Val Val Asp Gly Gly Gly Ser Leu Arg Cys Ala Ile Leu
30 65 70 75 80
Gly Gly Asn Pro Val Val Gln Ala Gln Asn Asn Gly Trp Ala Gly Ile85 90 95Val Val Asn Gly Cys Ile Arg Asp Val Asp Glu Ile Asn Gly Cys Asp
100 105 110
Ile Gly Val Arg Ala Leu Ala Ala His Pro Val Lys Ala Asn Lys Lys115 120 125
Gly Ile Gly Glu Lys His Val Pro Val Asn Ile Gly Gly Thr Arg Ile130 135 140
Cys Asp Gly Glu Trp Leu Tyr Ala Asp Thr Asp Gly Ile Leu Val Ser145 150 155 160
Lys Thr Glu Leu Ser Val
165
<210> 305<211> 639<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 305
ttggatcaaa tccacaaatc cggcattatc cccgtcgtcg aaatcgactc ggtagaacgc 60
gccgtcccgc tggctgaggc attgcttgca ggagggctga cggtcgtgga gatcaccctc 120
cgcaccgggg cggcgctcga gtcgattcga gcaattgctc agcaggtacc agaggtcagt 180
gtcggggcag gaacagtcat tacctgggaa caggcgcagg cggcacgtga tgcaggcgcg 240
cagttcctcg tctcaccggg gatggtggag caggttgtca tctgggcgca ggagcaccag 300
cttccgatca tacctggcgc agcaactccc accgagatga tccgcggcat caacctgggg 360
ctcaacctcc tgaaattctt tcccgccgaa acgatgggtg gggtaagcgc tgttaaggcg 420
ttatctgacc cgtttccgca gttgaaattc attcccacgg gcggcatcag gttggaaaat 480
gcagcttcgt atctcgcgca tcctaaaatc catgctgtgg gcggctcgtg gatagcgaaa 540
cgagagatga tcgcggatgg cagatttgat gagatccggc gtatggcaca ggaagccaga 600
gacctggtaa agcagatcag gaggaaaacg atcccatga 639<210> 306
<211> 212
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (1)...(195)
<223> KDPG and KHG aldolase<220>
<221> SITE<222> (32)...(41)
<223> KDPG and KHG aldolases active site. Prosite id = PS00159<400> 306
Met Asp Gln Ile His Lys Ser Gly Ile Ile Pro Val Val Glu Ile Asp1 5 10 15
Ser Val Glu Arg Ala Val Pro Leu Ala Glu Ala Leu Leu Ala Gly Gly
20 25 30
Leu Thr Val Val Glu Ile Thr Leu Arg Thr Gly Ala Ala Leu Glu Ser
35 40 45
Ile Arg Ala Ile Ala Gln Gln Val Pro Glu Val Ser Val Gly Ala Gly
50 55 60
Thr Val Ile Thr Trp Glu Gln Ala Gln Ala Ala Arg Asp Ala Gly Ala
65 70 75 80
Gln Phe Leu Val Ser Pro Gly Met Val Glu Gln Val Val Ile Trp Ala
85 90 95
Gln Glu His Gln Leu Pro Ile Ile Pro Gly Ala Ala Thr Pro Thr Glu
100 105 110
Met Ile Arg Gly Ile Asn Leu Gly Leu Asn Leu Leu Lys Phe Phe Pro
115 120 125
Ala Glu Thr Met Gly Gly Val Ser Ala Val Lys Ala Leu Ser Asp Pro
130 135 140
Phe Pro Gln Leu Lys Phe Ile Pro Thr Gly Gly Ile Arg Leu Glu Asn
145 150 155 160
Ala Ala Ser Tyr Leu Ala His Pro Lys Ile His Ala Val Gly Gly SerTrp Ile Ala Lys Arg Glu Met Ile180
Arg Arg Met Ala Gln Glu Ala Arg
195 200
Lys Thr Ile Pro210<210> 307<211> 639<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 307
ttgactttga aacaaggcgt gttgcctttggctgttttaa aagctttata tgaagcgggagaagccgcat tgaaaaactt taagtcgttgatgtacctcg gtattgggac gattaaaaatggtgcagatt atttaattag tccgggtgtaaatggtttgt tatatgtgcc tggtgcaatgcaatttggat caacgctggt gaaactttttagtgctatta aagaattgtt cagcggattggaagaaaata atttgaaagg atggttcaacaaattaatta ccaaacaggt tttggaaaataaggaatctt taagactgat taaattggtc<210> 308<211> 212<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
170 175
Ala Asp Gly Arg Phe Asp Glu Ile185 190
Asp Leu Val Lys Gln Ile Arg Arg205
tattttaata aggacgaggaattcgtacag ttgaatataccgcaaggtat gtgataccgaggccagcagg cacaagctttgtggatgatg cagcaaaagtaccccaacag aaattatcagccgggtaata ttttaggcccaaatttatta ttaccggagggcaggtgccg cagctgtgggaaagactatg caaaaattacagagggtaa
ggtgagtatc 60
gaatcgtggt 120
attgaatgga 180
tgtggatgca 240
tgccgatcaa 300
ggcagagcaa 360
tggctttgtt 420
agttgaaccg 480
catgggaagt 540
agagttaact 600639<221> DOMÍNIO
<222> (2)...(199)
<223> KDPG and KHG aldolase
<400> 308
Met Thr Leu Lys Gln Gly Val Leu Pro Leu Tyr Phe1 5 10
Glu Val Ser Ile Ala Val Leu Lys Ala Leu Tyr Glu
20 25
Thr Val Glu Tyr Thr Asn Arg Gly Glu Ala Ala Leu
35 40
Ser Leu Arg Lys Val Cys Asp Thr Glu Leu Asn Gly
50 55 60
Ile Gly Thr Ile Lys Asn Gly Gln Gln Ala Gln Ala65 70 75
Gly Ala Asp Tyr Leu Ile Ser Pro Gly Val Val Asp
85 90
Val Ala Asp Gln Asn Gly Leu Leu Tyr Val Pro Gly
100 105
Thr Glu Ile Ile Arg Ala Glu Gln Gln Phe Gly Ser
115 120
Leu Phe Pro Gly Asn Ile Leu Gly Pro Gly Phe Val130 135 140
Glu Leu Phe Ser Gly Leu Lys Phe Ile Ile Thr Gly145 150 155
Glu Glu Asn Asn Leu Lys Gly Trp Phe Asn Ala Gly
165 170
Gly Met Gly Ser Lys Leu Ile Thr Lys Gln Val Leu
180 185
Tyr Ala Lys Ile Thr Glu Leu Thr Lys Glu Ser Leu
195 200
Leu Val Arg Gly
Asn Lys Asp Glu
Ala Gly Ile Arg
Lys Asn Phe Lys45
Met Tyr Leu Gly
Phe Val Asp Ala80
Asp Ala Ala Lys95
Ala Met Thr Pro110
Thr Leu Val Lys125
Ser Ala Ile Lys
Gly Val Glu Pro160
Ala Ala Ala Val175
Glu Asn Lys Asp190
Arg Leu Ile Lys205
210<210> 309
<211> 687
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 309
atgagtattg ctgcaaatac aggtgtagac aaaaaaaatg
caacaaggtg tgttgccttt gtattttaat aaagatgaag
aaagcgttat atgaggcagg cattcgcaca gttgagtata
ttaaaaaatt ttaaagtact gagaaaaatt tgtgatacgg
ggtatcggca ccattaaaaa tggagaacag gcaaaagctt
tatttaatta gtccgggtgt ggtagatgat gcagcaaaaa
ttatatgtgc ctggtgccat gacgccaact gaaattatca
acactggtaa aactttttcc cggtaatatt ttaggccctg
gaattattca gcggtttgaa atttatcatc actggtggag
ttgaaaggat ggtttaatgc aggtgctgcg gccgtaggaa
aaacaaactt tggaaaataa agactacgca aaaattacagagattgattg aactggtgcg gaaataa
<210> 310
<211> 228
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (16)...(215)
<223> KDPG and KHG aldolase
<400> 310
Met Ser Ile Ala Ala Asn Thr Gly Val Asp Lys Lys Asn Glu Ile Leu1 5 10 15
agatcctaca attaacattg 60
aagtgagtat tgctgttttg 120
ccaatcgtgg agaagccgca 180
aattgagtgg attatacctg 240
ttgttgatgc cggtgcagat 300
ttgctgatca aaatggattg 360
gggcagaaca atttggtgca 420
gtttcgttag tgccgttaag 480
tagaacctga agaaaataat 540
tgggaagtaa attgatcaca 600
agctcacgaa agagtcttta 660Gln Leu Thr Leu Gln Gln Gly Val Leu Pro Leu Tyr Phe Asn Lys Asp
20 25 30
Glu Glu Val Ser Ile Ala Val Leu Lys Ala Leu Tyr Glu Ala Gly Ile35 40 45
Arg Thr Val Glu Tyr Thr Asn Arg Gly Glu Ala Ala Leu Lys Asn Phe50 55 60
Lys Val Leu Arg Lys Ile Cys Asp Thr Glu Leu Ser Gly Leu Tyr Leu65 70 75 80
Gly Ile Gly Thr Ile Lys Asn Gly Glu Gln Ala Lys Ala Phe Val Asp85 90 95
Ala Gly Ala Asp Tyr Leu Ile Ser Pro Gly Val Val Asp Asp Ala Ala
100 105 110
Lys Ile Ala Asp Gln Asn Gly Leu Leu Tyr Val Pro Gly Ala Met Thr115 120 125
Pro Thr Glu Ile Ile Arg Ala Glu Gln Phe Gly Ala Thr Leu Val Lys130 135 140
Leu Phe Pro Gly Asn Ile Leu Gly Pro Gly Phe Val Ser Ala Val Lys145 150 155 160
Glu Leu Phe Ser Gly Leu Lys Phe Ile Ile Thr Gly Gly Val Glu Pro165 170 175
Glu Glu Asn Asn Leu Lys Gly Trp Phe Asn Ala Gly Ala Ala Ala Val
180 185 190
Gly Met Gly Ser Lys Leu Ile Thr Lys Gln Thr Leu Glu Asn Lys Asp195 200 205
Tyr Ala Lys Ile Thr Glu Leu Thr Lys Glu Ser Leu Arg Leu Ile Glu210 215 220
Leu Val Arg Lys225
<210> 311
<211> 600
<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 311
atgatattcg ccgatgccat agccgaatgc ggcctcatcg ccatcctgcg cggcattgca 60
acggctgaaa ttgaagccgt gggacaagcc ctcatcgaag ccggcattcg cgtcgctgaa 120
attccgctga actcgccgga tccatttgcc tccatcgaga aaatggccaa ggccttcaag 180
ggcgagctgg ttgtcggggc tggaaccgtt ctcagtgtgc aggatgtcaa tttactgaaa 240
gcccatggcg gccagatcag cgtttctccc gattgcaacg aggcggtggt cgcacgcacc 300
aaagaactgg gtctggagcc cgttcccggc gtcttcacgc ccactgaggc ttttgccgcg 360
atccgcgccg gggcaaccca tatcaagttg tttccggcgg aagccgcaag ccccgcaacc 420
atcagggcct ggcgcgctgt tcttccaaag catgtgaaaa tctatccggt gggcggcatc 480
acgccagcaa atatgcaggg ctgggttgat gccggcgccg caggctttgg aattggctca 540
aatatctata agcagggggc cacagccgcc aacgtggcaa aggcggccaa ggaattcttt 600<210> 312
<211> 200
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (4)...(198)<223> KDPG and KHG aldolase<400> 312
Met Ile Phe Ala Asp Ala Ile Ala Glu Cys Gly Leu Ile Ala Ile Leu15 10 15
Arg Gly Ile Ala Thr Ala Glu Ile Glu Ala Val Gly Gln Ala Leu Ile
20 25 30
Glu Ala Gly Ile Arg Val Ala Glu Ile Pro Leu Asn Ser Pro Asp Pro30 35 40 45
Phe Ala Ser Ile Glu Lys Met Ala Lys Ala Phe Lys Gly Glu Leu Val50 55 60Val Gly Ala Gly Thr Val Leu Ser Val Gln Asp Val Asn Leu Leu Lys65 70 75 80
Ala His Gly Gly Gln Ile Ser Val Ser Pro Asp Cys Asn Glu Ala Val85 90 95
Val Ala Arg Thr Lys Glu Leu Gly Leu Glu Pro Val Pro Gly Val Phe100 105 110
Thr Pro Thr Glu Ala Phe Ala Ala Ile Arg Ala Gly Ala Thr His Ile
115 120 125
Lys Leu Phe Pro Ala Glu Ala Ala Ser Pro Ala Thr Ile Arg Ala Trp130 135 140
Arg Ala Val Leu Pro Lys His Val Lys Ile Tyr Pro Val Gly Gly Ile145 150 155 160
Thr Pro Ala Asn Met Gln Gly Trp Val Asp Ala Gly Ala Ala Gly Phe165 170 175
Gly Ile Gly Ser Asn Ile Tyr Lys Gln Gly Ala Thr Ala Ala Asn Val180 185 190
Ala Lys Ala Ala Lys Glu Phe Phe195 200
<210> 313<211> 681<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<400> 313
atgagccagc ccgatagaaa cctgaaggag accgtgattg cgttaactaa ggaatgcggg 60
gttctgccct gcatcaagtt gcgcaaaaaa gatgatttta ttgcctatgc ccaggcgatg 120
tatgacggag gagctcgcgt catcgaagtg accatgacaa ctccaggcgc cctggaagcg 180
atcgaagcca tttcgtctgc ctttaaagac aaactctatg ttgcttcggg caccacattg 240
gacgcgtcca ctgcgcgcga ggtcatcact cacggcggaa gctgcattgt taatccttgt 300
gtcatccccg aagtgatcga tgtcgccaac cgctatggca ttccagttta ttccggagca 360 .
ttcactgcga ccgaggtgtt cacggcgatg cgcgccggag cgtccatggt caaaatattt 420cccgggggtc tgggcggcgc caagtacatg accaatctga aaatggtatt cccagaagtg 480aacctgattc cttcaggggg aattaacctt gataatgctc ccgaatttat tcgcgccggc 540gcctgcgctg tcagtggtgc acgaactttc atggatcacg aaatgattgc caagcatggt 600ttgaaatgga ttactcaaca gacgtcaaaa ttcattgaag tggttctgga agcgaagcgg 660aacgctccag agttgccttg a 681
<210> 314<211> 226<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (12)... (207)<223> KDPG and KHG aldolase<400> 314
Met Ser Gln Pro Asp Arg Asn Leu Lys Glu Thr Val Ile Ala Leu Thr1 5 10 15
Lys Glu Cys Gly Val Leu Pro Cys Ile Lys Leu Arg Lys Lys Asp Asp
20 25 30
Phe Ile Ala Tyr Ala Gln Ala Met Tyr Asp Gly Gly Ala Arg Val Ile
35 40 45
Glu Val Thr Met Thr Thr Pro Gly Ala Leu Glu Ala Ile Glu Ala Ile50 55 60
Ser Ser Ala Phe Lys Asp Lys Leu Tyr Val Ala Ser Gly Thr Thr Leu65 70 75 80
Asp Ala Ser Thr Ala Arg Glu Val Ile Thr His Gly Gly Ser Cys Ile
85 90 95
Val Asn Pro Cys Val Ile Pro Glu Val Ile Asp Val Ala Asn Arg Tyr
100 105 110
Gly Ile Pro Val Tyr Ser Gly Ala Phe Thr Ala Thr Glu Val Phe Thr115 120 125Ala Met Arg Ala <31y Ala Ser Met Val Lys Ile Phe Pro Gly Gly Leu
130 135 140
Gly Gly Ala Lys Tyr Met Thr Asn Leu Lys Met Val Phe Pro Glu Val145 150 155 160
Asn Leu Ile Pro Ser Gly Gly Ile Asn Leu Asp Asn Ala Pro Glu Phe165 170 175
Ile Arg Ala Gly Ala Cys Ala Val Ser Gly Ala Arg Thr Phe Met Asp
180 185 190
His Glu Met Ile Ala Lys His Gly Leu Lys Trp Ile Thr Gln Gln Thr 195 200 205
Ser Lys Phe Ile Glu Val Val Leu Glu Ala Lys Arg Asn Ala Pro Glu
210 215 220
Leu Pro225
<210> 315
<211> 576
<212> DNA
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<400> 315
atggcacaat ttacaagaat agaagttgca acagcaatga aagaaactgg gatgattcct 60ttgtttttta acaacgattt agaattaagt aaaaaagtat taaaagcttg ttacgatggt 120ggagcacgct taatggaatt tactgctcgt ggagattttg cacacgaagt ttttggtgaa 180ttaacaaaat atgcaattgc agaattacca ggaatgatta tgggtgtagg ttctgtaacc 240gatgcagctg cagcatcttt atacatggct ttaggagcaa actttattgt aactccagta 300ttaagagaag atatagcaat tgtttgtaac agacgtaaag ttttatggtc tcctggttgt 360ggaactttaa ctgaaattac taaggccgaa gaattaggat gtgaaattgt aaaattattc 420cctggtgata tttatggacc tcaatttgta aaaggaatta aaggaccaca accttggact 480agtgtaatgc caactggagg agtttctcca acaaaagaaa atttaacagg ttggtttaat 540gcaggtgtaa cttgtgttgg aatgggatct caatta 576
<210> 316<211> 192
<212> PRT
<213> desconhecido
<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (9)... (192)<223> KDPG and KHG aldolase<220>
<221> SITE
<222> (176)...(179)
<223> Sítio de N-glicosilação prosítio id = PS00001<400> 316
Met Ala Gln Phe Thr Arg Ile Glu Val Ala Thr Ala Met Lys Glu Thr1 5 10 15
Gly Met Ile Pro Leu Phe Phe Asn Asn Asp Leu Glu Leu Ser Lys Lys
20 25 30
Val Leu Lys Ala Cys Tyr Asp Gly Gly Ala Arg Leu Met Glu Phe Thr35 40 45
Ala Arg Gly Asp Phe Ala His Glu Val Phe Gly Glu Leu Thr Lys Tyr
50 55 60
Ala Ile Ala Glu Leu Pro Gly Met Ile Met Gly Val Gly Ser Val Thr65 70 75 80
Asp Ala Ala Ála Ala Ser Leu Tyr Met Ala Leu Gly Ala Asn Phe Ile
85 90 95
Val Thr Pro Val Leu Arg Glu Asp Ile Ala Ile Val Cys Asn Arg Arg
100 105 110
Lys Val Leu Trp Ser Pro Gly Cys Gly Thr Leu Thr Glu Ile Thr Lys
115 120 125
Ala Glu Glu Leu Gly Cys Glu Ile Val Lys Leu Phe Pro Gly Asp Ile130 135 140Tyr Gly Pro Gln Phe Val Lys Gly Ile Lys Gly Pro Gln Pro Trp Thr145 150 155 160
Ser Val Met Pro Thr Gly Gly Val Ser Pro Thr Lys Glu Asn Leu Thr165 170 175
Gly Trp Phe Asn Ala Gly Val Thr Cys Val Gly Met Gly Ser Gln Leu180 185 190
<210> 317<211> 612<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 317
atgagcgggc gagagatcat tgcgatcctg cggggcgtgc gcccgaatga ggtggtggcc 60attgggcacg ttctgctgga tgcaggtatc gacaagatcg aagttccgct gaattccccc 120gatgcctttg aaagcattgc gcttttggcg gatgcgtttc acgatagtgc ggtgataggt 180gctggcaccg ttctgacgcc acaagacgtg gtgaaggtgc atcaacaggg tggcgcgatg 240gtggtatcgc ctgattgcaa tccggatgtg atcaaggcaa ccaaggcgct gggcatgttg 300tcttaccccg gtgttttcac cccgaccgaa gcttttaccg ccctgcgttc tggtgcggat 360gggatcaaac tgtttcctgc ttcaggcatt ggccctgcag ggctggccgc gatgttggcc 420gttttgccca caggcatgcg cagctatgcg gtggggggcg tcgggccaga tagcttcgcg 480ccttggatcg gagttggcgt gaccggattt ggcattggaa cgggcctgtt caaaccgggg 540tttggcacgg ctgatgtggc taaacgggca gcggacattg tggcggccta tgatcggggt 600attttgaaat ga 612
<210> 318
<211> 203<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (1)...(192)
<223> KDPG and KHG aldolase
<400> 318
Met Ser Gly Arg Glu Ile Ile Ala Ile Leu Arg Gly Val Arg Pro Asn
1 5 10 15
Glu Val Val Ala Ile Gly His Val Leu Leu Asp Ala Gly Ile Asp Lys
20 25 30
Ile Glu Val Pro Leu Asn Ser Pro Asp Ala Phe Glu Ser Ile Ala Leu35 40 45
Leu Ala Asp Ala Phe His Asp Ser Ala Val Ile Gly Ala Gly Thr Val
50 55 60
Leu Thr Pro Gln Asp Val Val Lys Val His Gln Gln Gly Gly Ala Met
65 70 75 80
Val Val Ser Pro Asp CYs Asn Pro Asp Val Ile Lys Ala Thr Lys Ala
85 90 95
Leu Gly Met Leu Ser Tyr Pro Gly Val Phe Thr Pro Thr Glu Ala Phe
100 105 110
Thr Ala Leu Arg Ser Gly Ala Asp Gly Ile Lys Leu Phe Pro Ala Ser115 120 125
Gly Ile Gly Pro Ala Gly Leu Ala Ala Met Leu Ala Val Leu Pro Thr130 135 140
Gly Met Arg Ser Tyr Ala Val Gly Gly Val Gly Pro Asp Ser Phe Ala145 150 155 160
Pro Trp Ile Gly Val Gly Val Thr Gly Phe Gly Ile Gly Thr Gly Leu 165 170 175
Phe Lys Pro Gly Phe Gly Thr Ala Asp Val Ala Lys Arg Ala Ala Asp
180 185 190
Ile Val Ala Ala Tyr Asp Arg Gly Ile Leu Lys195 200
<210> 319<211> 600<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 319
gtgccggttc tggtcatcga agacgtcaat gatgccgtgc cgcttgccaa ggccttggtggccggtggtt tgcgcgtgct tgaaatcacc ctgcgcagtg ccgccgccga ggaaagcattaaacgtatta tcgccgaagt tcccgatgca attaccggtg cgggcaccgt gatcaatgccaaacagatgg aacgtatggc cgaaatcggt tgtgcttttg cggtttcgcc gggccataccgatggtttgc ttaaggccgc caaagatacc ggcgtgccgt tgctgcccgg tgccggaacgccgtctgaaa tcatgcatct gattgatcat ggctatgaca tcttgaaatt cttcccggccgaacaacagg gcggtgtttc gatgcttaaa gccctgtctg gcccgctgcc acaggtgaaattctgcccga cgggtggtgt gtcgctggca aatttggggg attatctcgc cctgccaaatatcatcaccg ttggtgggtc gtgggtctcg ccaaaaagcg cggtcaaggc cggtgactgggcaacgatca cgcgcctggc acaggaagca accgacaagg ttgccgaact tcgcggttaa
<210> 320<211> 199<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (1)...(186)<223> KDPG and KHG aldolase<220>
<221> SITE<222> (23)...(32)
<223> KDPG and KHG aldolases active site. Prosite id = PS00159<220>
<221> SITE
<222> (112)...(125)
<223> KDPG and KHG aldolases Schiff-base forming residue. Prosite<400> 320
Met Pro Val Leu Val Ile Glu Asp Val Asn Asp Ala Val Pro Leu Ala1 5 10 15
Lys Ala Leu Val Ala Gly Gly Leu Arg Val Leu Glu Ile Thr Leu Arg
20 25 30
Ser Ala Ala Ala Glu Glu Ser Ile Lys Arg Ile Ile Ala Glu Val Pro
35 40 45
Asp Ala Ile Thr Gly Ala Gly Thr Val Ile Asn Ala Lys Gln Met Glu50 55 60
Arg Met Ala Glu Ile Gly Cys Ala Phe Ala Val Ser Pro Gly His Thr65 70 75 80
Asp Gly Leu Leu Lys Ala Ala Lys Asp Thr Gly Val Pro Leu Leu Pro
85 90 95
Gly Ala Gly Thr Pro Ser Glu Ile Met His Leu Ile Asp His Gly Tyr
100 105 110
Asp Ile Leu Lys Phe Phe Pro Ala Glu Gln Gln Gly Gly Val Ser Met
115 120 125
Leu Lys Ala Leu Ser Gly Pro Leu Pro Gln Val Lys Phe Cys Pro Thr
130 135 140
Gly Gly Val Ser Leu Ala Asn Leu Gly Asp Tyr Leu Ala Leu Pro Asn145 150 155 160
Ile Ile Thr Val Gly Gly Ser Trp Val Ser Pro Lys Ser Ala Val Lys
165 170 175
Ala Gly Asp Trp Ala Thr Ile Thr Arg Leu Ala Gln Glu Ala Thr Asp
180 185 190
Lys Val Ala Glu Leu Arg Gly
195<210> 321<211> 654<212> DNA
<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 321
atgaccagcg aaacgaacca gatattagag gcgaaatttg ccgctgcgcc ggtggtgccc 60
ctgatcgaag ccagtgaccc tacggttgcg gtagcaatcg caaaagcgct gcaggcgggc 120
ggcctcgatg tgatcgaagt cgtcctccgg accgacgcgg cgctcgattg catggaagcc 180
attatcgcgg agacttcgga catcattgtt ggcgcgggaa caatcttgac cgctgacgat 240
gcgaaggcag ctgttacccg cggcgcgcag ttcattgtgt gcccgggact ggtcgacgcg 300
gtggtcaatt tctgcaaggc aaatgatctt ccggtcttcc cgggaacaat gaccccgggc 360
gaagtgcaac aggcccataa tctcggtctc ggaacggtga aattctttcc cgccaaactc 420
gctggcggtg tgccgatgct caaggcattg agctcggtct ttcgcaatat gcgtttcatg 480
ccgacgggtg gggtgtcagc agagaatctg ggcgaatttc tggccgtgcc ttccgtaatt 540
gcctgcggcg gtagctggct cacgccgaaa gcggctatcg acgcgggcga ttacgatgca 600
atcaccaagc tggcccgtga agctgtcgct ctcgcacgtg cctctagacc ataa 654<210> 322
<211> 217
<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (9)... (204)<223> KDPG and KHG aldolase<400> 322
Met Thr Ser Glu Thr Asn Gln Ile Leu Glu Ala Lys Phe Ala Ala Ala1 5 10 15
Pro Val Val Pro Leu Ile Glu Ala Ser Asp Pro Thr Val Ala Val Ala
20 25 30
Ile Ala Lys Ala Leu Gln Ala Gly Gly Leu Asp Val Ile Glu Val Val35 40 45
Leu Arg Thr Asp Ala Ala Leu Asp Cys Met Glu Ala Ile Ile Ala Glu50 55 60Thr Ser Asp Ile Ile Val Gly Ala Gly Thr Ile Leu Thr Ala Asp Asp65 70 75 80
Ala Lys Ala Ala Val Thr Arg Gly Ala Gln Phe Ile Val Cys Pro Gly85 90 95
Leu Val Asp Ala Val Val Asn Phe Cys Lys Ala Asn Asp Leu Pro Val100 105 110
Phe Pro Gly Thr Met Thr Pro Gly Glu Val Gln Gln Ala His Asn Leu
115 120 125
Gly Leu Gly Thr Val Lys Phe Phe Pro Ala Lys Leu Ala Gly Gly Val130 135 140
Pro Met Leu Lys Ala Leu Ser Ser Val Phe Arg Asn Met Arg Phe Met145 150 155 160
Pro Thr Gly Gly Val Ser Ala Glu Asn Leu Gly Glu Phe Leu Ala Val165 170 175
Pro Ser Val Ile Ala Cys Gly Gly Ser Trp Leu Thr Pro Lys Ala Ala180 185 190
Ile Asp Ala Gly Asp Tyr Asp Ala Ile Thr Lys Leu Ala Arg Glu Ala
195 200 205
Val Ala Leu Ala Arg Ala Ser Arg Pro210 215
<210> 323<211> 603<212> DNA<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<400> 323
atgacgttcc ccctgagatc actcgtggaa gccgcgacca aggcaccgat tgtacccgtt 60
ctggtcgtcg accgcattga agttgcggcc ccccttgcgc gggcgcttgt tgatggcggc 120
ctgacaattg ccgaagtcac gctgcgaaca ccttcggggc tggcggtaat cgaagagatg 180
aaatccgccg agcccggcct gaaggtcggc gcgggcaccg tgttgaccga atccgatgtc 240
gagaacgcat tggcggccgg cgcggatttc ctcgtggcac cgggcatgtc gccaaaactg 300ttggccggac tgggtggcca ccgccgcctg atgatccctg gcgttgcgac agccagcgaa 360gccatggcca ggcacgagga cgggttcgac ctgttgaaac tgtttccggc ctcgattgcc 420ggcggagtca gcgctctcaa ggcgcttggc ggtccgctgc cgcacctgcg cttcatgccg 480accggcggca tcaccgaggc ggatgtcggc aaatacctcg cccttcccaa tgttttcgcg 540gccggaggct cgtggattgc gacgggcgcc gacattgctg ccgaagactc gagccgaatt 600ctt 603
<210> 324<211> 201<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO
<222> (9) . . . (201)
<223> KDPG and KHG aldolase<220>
<221> SITE<222> (40)...(49)
<223> KDPG and KHG aldolases active site. Prosite id = PS00159<400> 324
Met Thr Phe Pro Leu Arg Ser Leu Val Glu Ala Ala Thr Lys Ala Pro1 5 10 15
Ile Val Pro Val Leu Val Val Asp Arg Ile Glu Val Ala Ala Pro Leu
20 25 30
Ala Arg Ala Leu Val Asp Gly Gly Leu Thr Ile Ala Glu Val Thr Leu
35 40 45
Arg Thr Pro Ser Gly Leu Ala Val Ile Glu Glu Met Lys Ser Ala Glu50 55 60
Pro Gly Leu Lys Val Gly Ala Gly Thr Val Leu Thr Glu Ser Asp Val65 70 75 80Glu Asn Ala Leu Ala Ala Gly Ala Asp Phe Leu Val Ala Pro Gly Met85 90 95
Ser Pro Lys Leu Leu Ala Gly Leu Gly Gly His Arg Arg Leu Met Ile
100 105 110
Pro Gly Val Ala Thr Ala Ser Glu Ala Met Ala Arg His Glu Asp Gly115 120 125
Phe Asp Leu Leu Lys Leu Phe Pro Ala Ser Ile Ala Gly Gly Val Ser
130 135 140
Ala Leu Lys Ala Leu Gly Gly Pro Leu Pro His Leu Arg Phe Met Pro145 150 155 160
Thr Gly Gly Ile Thr Glu Ala Asp Val Gly Lys Tyr Leu Ala Leu Pro
165 170 175
Asn Val Phe Ala Ala Gly Gly Ser Trp Ile Ala Thr Gly Ala Asp Ile
180 185 190
Ala Ala Glu Asp Ser Ser Arg Ile Leu
195 200
<210> 325<211> 648<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 325
atacaagaag taaaggagat tggtttattg cctttatatt atcacgacga tgcagctatt 60tgtctgaaag tagctaatac tttgtatgat gccgatgtaa aatgcataga atttacaaac 120cgtggtgaat atgcacttac aaactttaaa cacttagtga agctgagaga tgaaaagatg 180aaaggtctat tgcttgcagt gggcacaatt aaaaccggga cggatgctca gaaatttatt 240gatgccggtg ccgatttttt gatcagccca atatttgaca gcagcgtttg cgatacggcc 300tatttgaata aaacgttgtg gataccaggt tgtacaacgc caacagaaat tcatgtagca 360cagcaagcgg gttgtaagct tatcaaatta ttcccgggaa atgtactggg gccgggtttt 420gtagaagcga tcatgccatt attcagtgga attgatttta cgatcactgg tggagtagaa 480gcaacagaag caaatctggg tgcctggttt aaatcaggtg tgaaggtagt tggaatgggc 540agcaagctta taacaaaaga cattttaaag aatggtgatt atgatggatt gaaagctaaa 600acaaaagaag tgctttcaat aattcgacat attaaatcag ctaaatag 648
<210> 326<211> 215<212> PRT<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (1) . . . (200)
<223> KDPG and KHG aldolase<220>
<221> SITE<222> (104)...(107)<223> Sítio de N-glicosilação prosítio id = PS00001<400> 326
Ile Gln Glu Val Lys Glu Ile Gly Leu Leu Pro Leu Tyr Tyr His Asp1 5 10 15
Asp Ala Ala Ile Cys Leu Lys Val Ala Asn Thr Leu Tyr Asp Ala Asp
20 20 25 30
Val Lys Cys Ile Glu Phe Thr Asn Arg Gly Glu Tyr Ala Leu Thr Asn
35 40 45
Phe Lys His Leu Val Lys Leu Arg Asp Glu Lys Met Lys Gly Leu Leu
50 55 60
Leu Ala Val Gly Thr Ile Lys Thr Gly Thr Asp Ala Gln Lys Phe Ile
65 70 75 80
Asp Ala Gly Ala Asp Phe Leu Ile Ser Pro Ile Phe Asp Ser Ser Val
85 90 95
Cys Asp Thr Ala Tyr Leu Asn Lys Thr Leu Trp Ile Pro Gly Cys Thr
100 105 110
Thr Pro Thr Glu Ile His Val Ala Gln Gln Ala Gly Cys Lys Leu Ile115 120 125Lys Leu Phe Pro Gly Asn Val Leu Gly Pro Gly Phe Val Glu Ala Ile
130 135 140
Met Pro Leu Phe Ser Gly Ile Asp Phe Thr Ile Thr Gly Gly Val Glu145 150 155 160
Ala Thr Glu Ala Asn Leu Gly Ala Trp Phe Lys Ser Gly Val Lys Val165 170 175
Val Gly Met Gly Ser Lys Leu Ile Thr Lys Asp Ile Leu Lys Asn Gly
180 185 190
Asp Tyr Asp Gly Leu Lys Ala Lys Thr Lys Glu Val Leu Ser Ile Ile195 200 205
Arg His Ile Lys Ser Ala Lys210 215
<210> 327<211> 642<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 327
atggaacaat ctatctttga ttacttctac aaaatcggcg tcattcccgt actggaaatc 60gactcggcgc ttcatgccaa accgttagcc gaggcgctgc tggcaggagg tctgcctatc 120gccgagatca cactgcgcac cgaggcagcg ctcgaggcga ttcgcactat tgcgcgcgat 180gtaccggatg tcatcgtcgg ggctggaacc gtgataacct gggaacaagc cgaagcggca 240cgtgacgcgg gcgcgcaatt tctcgtctca cccgggatgg tggagcaggt tgtcatctgg 300gcacaggaaa atcaaatccc tgttctgccc ggcgctgtga cccccaccga gatgatccgc 360gccatccatc tcggtttgaa gtttctgaaa tttttcccat cggaagctgt aggcggactc 420aaagccctca aggccctctc agaccccttt ccgggattgc gatttatccc aaccggtgga 480gtgaagtttg agaatctggc ggattatcta caaatggaaa agatccacgc tgtcggcggc 540tcgtggatgg caaagcgcca gatgatcgcc gaccgaaaat tcgacgagat tacgcgattg 600gcgaatgaag ccagcgacct tgtgacaaaa atcaggaagt ag 642
<210> 328<211> 213<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente
<220>
<221> DOMÍNIO<222> (5)... (200)<223> KDPG and KHG aldolase<220><221> SITE
<222> (37)...(46)
<223> KDPG and KHG aldolases active site. Prosite id = PS00159<400> 328
Met Glu Gln Ser Ile Phe Asp Tyr Phe Tyr Lys Ile Gly Val Ile Pro
1 5 10 15
Val Leu Glu Ile Asp Ser Ala Leu His Ala Lys Pro Leu Ala Glu Ala
20 25 30
Leu Leu Ala Gly Gly Leu Pro Ile Ala Glu Ile Thr Leu Arg Thr Glu
35 40 45
Ala Ala Leu Glu Ala Ile Arg Thr Ile Ala Arg Asp Val Pro Asp Val
50 55 60
Ile Val Gly Ala Gly Thr Val Ile Thr Trp Glu Gln Ala Glu Ala Ala65 70 75 80
Arg Asp Ala Gly Ala Gln Phe Leu Val Ser Pro Gly Met Val Glu Gln
85 90 95
Val Val Ile Trp Ala Gln Glu Asn Gln Ile Pro Val Leu Pro Gly Ala
100 105 110
Val Thr Pro Thr Glu Met Ile Arg Ala Ile His Leu Gly Leu Lys Phe
115 120 125
Leu Lys Phe Phe Pro Ser Glu Ala Val Gly Gly Leu Lys Ala Leu Lys
130 135 140
Ala Leu Ser Asp Pro Phe Pro Gly Leu Arg Phe Ile Pro Thr Gly Gly145 150 155 160
Val Lys Phe Glu Asn Leu Ala Asp Tyr Leu Gln Met Glu Lys Ile His
165 170 175
Ala Val Gly Gly Ser Trp Met Ala Lys Arg Gln Met Ile Ala Asp Arg180 185 190
Lys Phe Asp Glu Ile Thr Arg Leu Ala Asn Glu Ala Ser Asp Leu Val
195 200 205
Thr Lys Ile Arg Lys210
<210> 329<211> 618<212> DNA
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 329
atgactcgct tttctgaact tatgtcaggg caaacattac tgcctataat tcaagccgac 60acaccagagc aaggcgttaa aatagctcaa gctatggcta atgctggcct tactttggtt 120gaagtagtac ttagaactga tgcatcgtta gatgcattaa aagctattaa agagcaggtg 180ccagcgctta aagtaggtgc aggcacagta ataaatactg acattttaga gcaagcactt 240gcagcaggtg ccgactttat tgttacgcca gcagtgtctc cgcaattatt agccgcgcta 300acaaaatgca atgtgccggt acttcctggt gtgtctaaca cgggtgacat tttaatggcg 360cttgagtacg gttttgaaga acaaaaatta ttccctgcat cgctcgctgg tggtgcacca 420ttcgtatcgg ctgtctcgtc agtatttaga gctgctagct tttgtcctac aggtggcgta 480agcgagcaaa ataaaatgga ttacttatct ttaaataatg tatttgctgt gggtggtact 540tggattgcaa ataaagagtg ggttgcacaa gaaaactggc aagcaattac tgactcgtgt 600attcaagcat taaagtag 618
<210> 330<211> 205<212> PRT
<213> desconhecido<220><223> Proteína obtida por amostra do ambiente<220> '<221> DOMÍNIO<222> (4)...(199)<223> KDPG and KHG aldolase<400> 330
Met Thr Arg Phe Ser Glu Leu Met Ser Gly Gln Thr Leu Leu Pro Ile1 5 10 15
Ile Gln Ala Asp Thr Pro Glu Gln Gly Val Lys Ile Ala Gln Ala Met
20 25 30
Ala Asn Ala Gly Leu Thr Leu Val Glu Val Val Leu Arg Thr Asp Ala
35 40 45
Ser Leu Asp Ala Leu Lys Ala Ile Lys Glu Gln Val Pro Ala Leu Lys50 55 60
Val Gly Ala Gly Thr Val Ile Asn Thr Asp Ile Leu Glu Gln Ala Leu65 70 75 80
Ala Ala Gly Ala Asp Phe Ile Val Thr Pro Ala Val Ser Pro Gln Leu
85 90 95
Leu Ala Ala Leu Thr Lys Cys Asn Val Pro Val Leu Pro Gly Val Ser
100 105 110
Asn Thr Gly Asp Ile Leu Met Ala Leu Glu Tyr Gly Phe Glu Glu Gln
115 120 125
Lys Leu Phe Pro Ala Ser Leu Ala Gly Gly Ala Pro Phe Val Ser Ala130 135 140
Val Ser Ser Val Phe Arg Ala Ala Ser Phe Cys Pro Thr Gly Gly Val145 150 155 160
Ser Glu Gln Asn Lys Met Asp Tyr Leu Ser Leu Asn Asn Val Phe Ala
165 170 175
Val Gly Gly Thr Trp Ile Ala Asn Lys Glu Trp Val Ala Gln Glu Asn
180 185 190
Trp Gln Ala Ile Thr Asp Ser Cys Ile Gln Ala Leu Lys195 200 205<210> 331<211> 663<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 331
atggcatatc cgaccgcggt caattcacag attaccgaca cagcaggcaa ggttttgcat 60cgcaaactga ttgctatttt acgcggagtg aagcccgatg aagcggcatc catggcgcgt 120gtgctggtcg atgccgggat cacgatgatc gaggtgccgc tgaattcccc ggaaccgctt 180aaaagcattg cgatcatgaa ggcagaagtc ggtgacgcgg ccctgatcgg ggcaggtacg 240gtcttaacgg tcgaggatgt tgtgaacgtt cgtgacgcgg gcggtgagtt tgttgtgtcg 300cccaattacg atgtcgatgt gattaaaaaa accaaggaag tcggtatggg aagttggccg 360ggggtgctga ctccgaccga atgtttcgcc gcgatcaagg ccggggcgga tgggcttaaa 420atattccctg ccagcatcat tggcgcatcg gggatttcgg cgatgcgggc ggttttgcca 480aaagatatgc cggtttatgc ggttggtggt gttgggccgg atgattttgc gacctatgcc 540aaggcggggt gcgatggttt cggccttgga tcggggattt ataaacccgg cctgacagcg 600gacgaagtat cggggcgcgc tattgccttc gtaacggcgc atgacgcggt atttgcgggc 660tag 663
<210> 332<211> 220<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (15)...(211)<223> KDPG and KHG aldolase<400> 332
Met Ala Tyr Pro Thr Ala Val Asn Ser Gln Ile Thr Asp Thr Ala Gly1 5 10 15Lys Val Leu His Arg Lys Leu Ile Ala Ile Leu Arg Gly Val Lys Pro
20 25 30
Asp Glu Ala Ala Ser Met Ala Arg Val Leu Val Asp Ala Gly Ile Thr
35 40 45
Met Ile Glu Val Pro Leu Asn Ser Pro Glu Pro Leu Lys Ser Ile Ala
50 55 60
Ile Met Lys Ala Glu Val Gly Asp Ala Ala Leu Ile Gly Ala Gly Thr65 70 75 80
Val Leu Thr Val Glu Asp Val Val Asn Val Arg Asp Ala Gly Gly Glu
85 90 95
Phe Val Val Ser Pro Asn Tyr Asp Val Asp Val Ile Lys Lys Thr Lys
100 105 110
Glu Val Gly Met Gly Ser Trp Pro Gly Val Leu Thr Pro Thr Glu Cys
115 120 125
Phe Ala Ala Ile Lys Ala Gly Ala Asp Gly Leu Lys Ile Phe Pro Ala
130 135 140
Ser Ile Ile Gly Ala Ser Gly Ile Ser Ala Met Arg Ala Val Leu Pro145 150 155 160
Lys Asp Met Pro Val Tyr Ala Val Gly Gly Val Gly Pro Asp Asp Phe
165 170 175
Ala Thr Tyr Ala Lys Ala Gly Cys Asp Gly Phe Gly Leu Gly Ser Gly
180 185 190
Ile Tyr Lys Pro Gly Leu Thr Ala Asp Glu Val Ser Gly Arg Ala Ile
195 200 205
Ala Phe Val Thr Ala His Asp Ala Val Phe Ala Gly210 215 220
<210> 333<211> 648<212> DNA<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<400> 333
atggcgattg atcccgccgc tgccagtcgg cgcatgcgcg aattggcggc gctggccccggtgatcccgg tgctggtgat cgaggatgcc gcaagggcga ggcccctggc cgaggcgctggtggcgggtg gtctgccggt gctggaggtg acgctgcgca ccccggccgc gccagaggtcattcgcgaga tgtcccgggt cccgggggcc attgtcggcg ccggcaccgt gatcacaccggccgacgtgc ggatcgcaca agcggcgggg gcccgattcg ccgtctcccc cggcgcgaccgatgcgttgc tcgatgcctg cgaagcggcg gggctgccgc tcctgcccgg cgcggccacggcgagcgagg cgatggcgct tctggcgcgc ggctacgaca tgctgaagtt ctttcccgccgaggcagtgg gcggcgcggc ggcgcttgca gcgctgggcg cgccgctgcc gcagatttccttctgcccga ccggaggggt cagcccggca aacgcgcccg actacctcgc cttgcccacggttccctgcg tcggcggcag ctgggtggcc ccgaaaccac aggtcgccgc cggcgactgggacgcgatcc gtgccctcgc cgaacacgcc cgcaccctcg cgccctga
<210> 334<211> 215<212> PRT
<213> desconhecido<220>
<223> Proteína obtida por amostra do ambiente<220>
<221> DOMÍNIO<222> (12)...(206)<223> KDPG e KHG aldolase<220>
<221> SITE<222> (44)...(53)
<223> KDPG e KHG aldolases sítio ativo. Prosítio id = PS00159<220>
<221> SITE
<222> (133)...(146)
<223> KDPG e KHG aldolases Schiff-base forming residue. Prosite id<400> 334
Met Ala Ile Asp Pro Ala Ala Ala Ser Arg Arg Met Arg Glu Leu Ala1 5 10 15
Ala Leu Ala Pro Val Ile Pro Val Leu Val Ile Glu Asp Ala Ala Arg
20 25 30
Ala Arg Pro Leu Ala Glu Ala Leu Val Ala Gly Gly Leu Pro Val Leu 35 40 45
Glu Val Thr Leu Arg Thr Pro Ala Ala Pro Glu Val Ile Arg Glu Met
50 55 60
Ser Arg Val Pro Gly Ala Ile Val Gly Ala Gly Thr Val Ile Thr Pro65 70 75 80
Ala Asp Val Arg Ile Ala Gln Ala Ala Gly Ala Arg Phe Ala Val Ser
85 90 95
Pro Gly Ala Thr Asp Ala Leu Leu Asp Ala Cys Glu Ala Ala Gly Leu
100 105 110
Pro Leu Leu Pro Gly Ala Ala Thr Ala Ser Glu Ala Met Ala Leu Leu
115 120 125
Ala Arg Gly Tyr Asp Met Leu Lys Phe Phe Pro Ala Glu Ala Val Gly
130 135 140
Gly Ala Ala Ala Leu Ala Ala Leu Gly Ala Pro Leu Pro Gln Ile Ser145 150 155 160
Phe Cys Pro Thr Gly Gly Val Ser Pro Ala Asn Ala Pro Asp Tyr Leu
165 170 175
Ala Leu Pro Thr Val Pro Cys Val Gly Gly Ser Trp Val Ala Pro Lys
180 185 190
Pro Gln Val Ala Ala Gly Asp Trp Asp Ala Ile Arg Ala Leu Ala Glu 195 200 205
His Ala Arg Thr Leu Ala Pro210 215
<210> 335<211> 19<212> DNA
<213> Artificial sequence<220><223> Iniciador<220>
<221> região de interesse biológico
<222> (1)..(19)
<223> b is c, g, or t<220>
<221> região de interesse biológico
<222> (1)..(19)
<223> y is c or t<220>
<221> região de interesse biológico
<222> (1)..(19)
<223> r is a or g<220>
<221> região de interesse biológico
<222> (1)..(19)
<223> w is a or t
<400> 335
aargtbtwyg argacaatg 19
<210> 336
<211> 18
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador<220>
<221> região de interesse biológico
<222> (1)..(18)
<223> d is a, g, or t
<220>
<221> região de interesse biológico
<222> (1)..(18)<223> y is c or t<220>
<221> região de interesse biológico
<222> (1)..(18)
<223> r is a or g<220>
<221> região de interesse biológico
<222> (1)..(18)
<223> w is a or t
<400> 336
gcdcagawca ayggrtgg 18
<210> 337
<211> 23
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador<220>
<221> região de interesse biológico
<222> (1) . . (23 )
<223> d is a, g, or t<220>
<221> região de interesse biológico
<222> (1). . (23)
<223> y is c or t<220>
<221> região de interesse biológico
<222> (1)..(23)
<223> r is a or g
<220>
<221> região de interesse biológico
<222> (1)..(23)<223> s is c or g
<400> 337
ccatcrsyat cdgcrtadag cca 23
<210> 338
<211> 20
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador <220>
<221> região de interesse biológico
<222> (1)..(20)
<223> d is a, g, or t<220>
<221> região de interesse biológico
<222> (1)..(20)
<223> y is c or t<220>
<221> região de interesse biológico
<222> (1) . . (20)
<223> r is a or g<220>
<221> região de interesse biológico 20
<222> (1)..(20)
<223> η is a, c, g, or t
<400> 338
gcrtadagcc aytcnccrtc
<210> 339
<211> 30
<212> DNA
<213> Seqüência Artificial
<220><223> Iniciador
<400> 339
ataagacata tgcctatcgt tgttacgaag 30
<210> 340
<211> 33
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 340
ataagaggat ccttattcct cgggcagccg etc 33
<210> 341
<211> 30
<212> DNA
<213> Seqüência Artificial
<220>
<223> Iniciador
<400> 341
ataagacata tgaacagacc tgtggttgtc 30
<210> 342
<211> 33
<212> DNA
<213> Seqüência Artificial
<220>
<223> Iniciador
<400> 342
ataagaggat ccttacaggt acttgagacc gag 33
<210> 343
<211> 30
<212> DNA
<213> Seqüência Artificial
<220><223> Iniciador
<400> 343
ataagacata tgagcgtggt catccgaaac 30
<210> 344
<211> 33
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 344
ataagaggat ccttacttcg ctttgttata ggc 33
<210> 345
<211> 30
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 345
ataagacata tgaacaagcc cgtggttgtg 30
<210> 346
<211> 34
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 346
ataagaggat ccttacaagt acttgagacc gagg 34
<210> 347
<211> 29
<212> DNA
<213> Seqüência Artificial<220><223> Iniciador
<400> 347
ataagacata tgagcgtggt cgtcaccgg 29
<210> 348
<211> 34
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 348
ataagaggat ccttagccgt ttttcccgtc ggtg 34
<210> 349
<211> 33
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 349
agaagacata tgatgagcat cgtcgtccag aac 33
<210> 350
<211> 34
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 350
agaagaggat cctcagacat atttcaggcc cttg 34
<210> 351
<211> 30
<212> DNA
<213> Seqüência Artificial<220><223> Iniciador
<400> 351
agaagacata tgatgagcgt ggtcatcacc 30
<210> 352
<211> 33
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 352
acaacaggat ccctatttct tctccggcgt ttc 33
<210> 353
<211> 30
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 353
ataatacata tgagcgtcgt cgttcagaac 30
<210> 354
<211> 34
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 354
ataataggat ccttagacat atttgagccc cttc 34
<210> 355
<211> 33
<212> DNA
<213> Seqüência Artificial<220><223> Iniciador<400> 355
agaagacata tgatgtcggt tgtcgttcag aac 33
<210> 356
<211> 31
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador<400> 356
agaagaggat cctcagatat acttcaggcc c 31
<210> 357<211> 852<212> DNA<213> Seqüência Artificial<220>
<223> ATCC 4978 DAAT<400> 357
atgagttata gcttatggaagaggaccgtg gctatcaattgaattattta cagcggaggagttacgatcc cttatacaaaaataaagttc aaacaggacacatattttcc ctggtgatgacgtcccgtag caaactttgattacgctgtg acattaaatccatgaaaaag gatgctatgatcttcaaata tttatggaatatcttaaatg gtattacacggtgaaggaag aagcaatgactcaacgactt cagaagtaacaaaccgggtg actggacacg
tgaccaaatt gtgaatgatg aagaagtagt agttgataag 60
tggcgatggt gtttatgaag ttgtaaaagt atataacggt 120
gcatgtcgat cgtttttacg cgagtgctga aaaaattcgc 180
agacaaattg catcaattat tgcatcagtt agttgaaatg 240
tatttatttc caaattacgc gtggtgcagg ccctcgtaat 300
agtgaagcca gtattaacag gtaataccaa ggaaaatcca 360
aaaaggtgtg aaagcaacat ttgtagaaga cattcgttgg 420
attaaattta cttggtgcgg tacttgctaa acaagaagca 480
agcggtttta catcgtgatg aaatcgtaac agaaggctct 540
taaagatggc gtattataca cacatccagc gaataacttc 600
tcaagtaatc attaaatgtg ctgctgaaat tggcttacca 660
aaaaactcag cttcttgcaa tggatgaagt gattgtttca 720
gccaattatc gacatagatg gaacagtaat tggtgcgggt 780
taaattacaa gcacaatttg atacgaaaat cccaaaaggt 840attcgcgcat aa 852
<210> 358<211> 283<212> PRT<213> Seqüência Artificial<220>
<223> ATCC 4978 DAAT<400> 358
Met Ser Tyr Ser Leu Trp Asn Asp Gln Ile Val Asn Asp Glu Glu Val
1 5 10 15
Val Val Asp Lys Glu Asp Arg Gly Tyr Gln Phe Gly Asp Gly Val Tyr
20 25 30
Glu Val Val Lys Val Tyr Asn Gly Glu Leu Phe Thr Ala Glu Glu His35 40 45
Val Asp Arg Phe Tyr Ala Ser Ala Glu Lys Ile Arg Val Thr Ile Pro50 55 60
Tyr Thr Lys Asp Lys Leu His Gln Leu Leu His Gln Leu Val Glu Met65 70 75 80
Asn Lys Val Gln Thr Gly His Ile Tyr Phe Gln Ile Thr Arg Gly Ala85 90 95
Gly Pro Arg Asn His Ile Phe Pro Gly Asp Glu Val Lys Pro Val Leu
100 105 110
Thr Gly Asn Thr Lys Glu Asn Pro Arg Pro Val Ala Asn Phe Glu Lys115 120 125
Gly Val Lys Ala Thr Phe Val Glu Asp Ile Arg Trp Leu Arg Cys Asp130 135 140
Ile Lys Ser Leu Asn Leu Leu Gly Ala Val Leu Ala Lys Gln Glu Ala145 150 155 160
His Glu Lys Gly Cys Tyr Glu Ala Val Leu His Arg Asp Glu Ile Val165 170 175
Thr Glu Gly Ser Ser Ser Asn Ile Tyr Gly Ile Lys Asp Gly Val Leu180 185 190Tyr Thr His Pro Ala Asn Asn Phe Ile Leu Asn Gly Ile Thr Arg Gln
195 200 205
Val Ile Ile Lys Cys Ala Ala Glu Ile Gly Leu Pro Val Lys Glu Glu210 215 220
Ala Met Thr Lys Thr Gln Leu Leu Ala Met Asp Glu Val Ile Val Ser225 230 235 240
Ser Thr Thr Ser Glu Val Thr Pro Ile Ile Asp Ile Asp Gly Thr Val
245 250 255
Ile Gly Ala Gly Lys Pro Gly Asp Trp Thr Arg Lys Leu Gln Ala Gln
260 265 270
Phe Asp Thr Lys Ile Pro Lys Gly Ile Arg Ala
275 280
<210> 359<211> 35<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico<400> 359
gtgattgttt catcaacgaa ttcagaagta acgcc 35
<210> 360<211> 35<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico<400> 360
gtgattgttt catcaacgcg ttcagaagta acgcc 35
<210> 361
<211> 35
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico
<400> 361
gtgattgttt catcaacgag ttcagaagta acgcc
<210> 362
<211> 35
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico
<400> 362
gtgattgttt catcaacggc ttcagaagta acgcc
<210> 363
<211> 31
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico
<400> 363
gtgcaggccc tcgtgctcat attttccctg g
<210> 364
<211> 45
<212> DNA
<213> Seqüência Artificial
<220>
<223> Iniciador Mutagênico
<400> 364
gaagtgattg tttcatcaac gcagtcagaa gtaacgccaa ttatc
<210> 365
<211> 40
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico<400> 365
catatgagtt atagcttatg gaatgaccaa attgtgaatg 40
<210> 366<211> 34<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico<400> 366
ctcgagtgcg gccgcaagct tgtcgacgga gctc 34
<210> 367<211> 95<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico<400> 367
aatatttatg gaattaaaga tggcgtatta tacacacatc cagcgaataa catgatctta 60aatggtatta cacgtcaagt aatcattaaa tgtgc 95
<210> 368<211> 34<212> DNA<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico<400> 368
ggccagtgaa ttgtaatacg actcactata gggc 34
<210> 369
<211> 42<212> DNA<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico<400> 369
cgccatcttt aattccataa atatttgaag aagagccttc tg 42
<210> 370<211> 66<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico<400> 370
gcaacatttg tagaagacat tcgttgggaa tactgttaca ttaaatcatt aaatttactt 60
ggtgcg 66
<210> 371
<211> 55
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico
<400> 371
gtattataca cacatccagc gaataactac atcttaaatg gtattacacg tcaag 55
<210> 372
<211> 64
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico
<400> 372
gcaatggatg aagtgattgt ttcatcaacg actaaagaag taacgccaat tatcgacata 60gatg 64
<210> 373<211> 64
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico
<400> 373
gcaatggatg aagtgattgt ttcatcaacg aataaagaag taacgccaat tatcgacatagatg
<210> 374
<211> 64
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico
<400> 374
gcaatggatg aagtgattgt ttcatcaacg aatcgtgaag taacgccaat tatcgacatagatg
<210> 375
<211> 16
<212> PRT
<213> P. striata
<220>
<221> região de interesse biológico
<222> (12)..(12)
<223> Xaa can be any naturally occurring amino acid
<400> 375
Leu Thr Ala Val Leu Lys Ala Asp Ala Tyr Gly Xaa Gly Ile Gly Leu1 5 10 15
<210> 376
<211> 28
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador<400> 376
agaagacata tgccctttcg ccgtaggg 28
<210> 377<211> 32<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador<400> 377
agaagaggat cctcagtcga cgagtatctt cg 32
<210> 378<211> 1230<212> DNA
<213> Seqüência Artificial<220>
<223> KT2440 BAR<400> 378
atgccctttc gccgtaccct tctggctgca tccctggcac ttctgatcac cggacaggcc 60cccctgtatg cggcaccacc gttgtcgatg gacaacggca ccaacaccct gaccgtgcaa 120aacagcaatg cctgggtcga agtcagcgcc agcgccctgc agcacaacat ccgcacgctg 180caggccgagc tggccggcaa gtccaagctg tgcgccgtgc tcaaggccga tgcctatggc 240cacggtatcg gcctggtaat gccatcgatc atcgcccaag gcgtgccctg cgtggcggtg 300gccagcaacg aggaggcccg cgtggtccgc gccagtggct tcaccgggca actggtgcgg 360gtacgcctgg ccagcctcag cgagctggaa gatggcttgc agtacgacat ggaagagctg 420gtgggcagcg cggaatttgc ccgccaggcc gatgccatcg ccgcgcgcca tggcaagacc 480ttgcgcattc acatggcgct caactccagc ggcatgagcc gcaacggggt ggagatggcc 540acctggtccg gccgtggcga agcgctgcag atcaccgacc agaagcacct caagctggtc 600gcgctgatga cccacttcgc cgtggaagac aaggacgatg tacgcaaggg cctggcggca 660ttcaacgagc agaccgactg gttgatcaag cacgccaggc tggaccgcag caagctcacc 720ctgcacgccg ccaactcgtt cgctacgctg gaagtgccgg aagcgcgcct ggacatggta 780cgaacgggtg gcgcgctgtt cggcgacacc gtgccggcgc gcaccgagta caaacgtgcg 840
atgcagttca aatcgcacgt ggcggcggtg cacagctatc cggccggcaa caccgtgggc 900
tatgaccgca ccttcaccct ggcccgtgat tcgcggctgg ccaacattac ggtcgggtac 960
tccgatggct accgccgggt attcaccaac aagggccatg tgctgatcaa cggccaccgt 1020
gtgccggtcg tgggcaaggt gtcgatgaac acgctgatgg tcgatgtcac cgacttccct 1080
gatgtgaagg ggggtaacga agtggtgctg ttcggcaagc aggccggggg cgaaatcacc 1140
caggccgaga tggaagaaat caacggcgcg ttgctcgccg atttgtacac cgtatggggc 1200
aattccaacc cgaagatact cgtcgactga 1230<210> 379
<211> 409
<212> PRT
<213> Seqüência Artificial
<220>
<223> ΚΤ2440 BAR
<400> 379
Met Pro Phe Arg Arg Thr Leu Leu Ala Ala Ser Leu Ala Leu Leu Ile15 10 15
Thr Gly Gln Ala Pro Leu Tyr Ala Ala Pro Pro Leu Ser Met Asp Asn20 25 30
20 Gly Thr Asn Thr Leu Thr Val Gln Asn Ser Asn Ala Trp Val Glu Val35 40 45
Ser Ala Ser Ala Leu Gln His Asn Ile Arg Thr Leu Gln Ala Glu Leu
50 55 60
Ala Gly Lys Ser Lys Leu Cys Ala Val Leu Lys Ala Asp Ala Tyr Gly
65 70 75 80
His Gly Ile Gly Leu Val Met Pro Ser Ile Ile Ala Gln Gly Val Pro
85 90 95
Cys Val Ala Val Ala Ser Asn Glu Glu Ala Arg Val Val Arg Ala Ser100 105 110
Gly Phe Thr Gly Gln Leu Val Arg Val Arg Leu Ala Ser Leu Ser Glu
115 120 125
Leu Glu Asp Gly Leu Gln Tyr Asp Met Glu Glu Leu Val Gly Ser Ala130 135 140
Glu Phe Ala Arg Gln Ala Asp Ala Ile Ala Ala Arg His Gly Lys Thr145 150 155 160
Leu Arg Ile His Met Ala Leu Asn Ser Ser Gly Met Ser Arg Asn Gly165 170 175
Val Glu Met Ala Thr Trp Ser Gly Arg Gly Glu Ala Leu Gln Ile Thr
180 185 190
Asp Gln Lys His Leu Lys Leu Val Ala Leu Met Thr His Phe Ala Val195 200 205
Glu Asp Lys Asp Asp Val Arg Lys Gly Leu Ala Ala Phe Asn Glu Gln210 215 220
Thr Asp Trp Leu Ile Lys His Ala Arg Leu Asp Arg Ser Lys Leu Thr225 230 235 240
Leu His Ala Ala Asn Ser Phe Ala Thr Leu Glu Val Pro Glu Ala Arg245 250 255
Leu Asp Met Val Arg Thr Gly Gly Ala Leu Phe Gly Asp Thr Val Pro
260 265 270
Ala Arg Thr Glu Tyr Lys Arg Ala Met Gln Phe Lys Ser His Val Ala275 280 285
Ala Val His Ser Tyr Pro Ala Gly Asn Thr Val Gly Tyr Asp Arg Thr290 295 300
Phe Thr Leu Ala Arg Asp Ser Arg Leu Ala Asn Ile Thr Val Gly Tyr305 310 315 320
Ser Asp Gly Tyr Arg Arg Val Phe Thr Asn Lys Gly His Val Leu Ile325 330 335
Asn Gly His Arg Val Pro Val Val Gly Lys Val Ser Met Asn Thr Leu
340 345 350
Met Val Asp Val Thr Asp Phe Pro Asp Val Lys Gly Gly Asn Glu Val355 360 365
Val Leu Phe Gly Lys Gln Ala Gly Gly Glu Ile Thr Gln Ala Glu Met370 375 380
Glu Glu Ile Asn Gly Ala Leu Leu Ala Asp Leu Tyr Thr Val Trp Gly385 390 395 400
Asn Ser Asn Pro Lys Ile Leu Val Asp405
<210> 380<211> 1152<212> DNA
<213> Geobacillus stearothermophilus<400> 380
atggacgagt ttcaccgcga tacgtgggcg gaagtggatt tggacgccat ttacgacaat 60
gtggagaatt tgcgccgttt gctgccggac gacacgcaca ttatggcggt cgtgaaggcg 120
aacgcctatg gacatgggga tgtgcaggtg gcaaggacag cgctcgaagc gggggcctcc 180
cgcctggcgg ttgccttttt ggatgaggcg ctcgctttaa gggaaaaagg aatcgaagcg 240
ccgattctag ttctcggggc ttcccgtcca gctgatgcgg cgctggccgc ccagcagcgc 300
attgccctga ccgtgttccg ctccgactgg ttggaagaag cgtccgccct ttacagcggc 360
ccttttccta ttcatttcca tttgaaaatg gacaccggca tgggacggct tggagtgaaa 420
gacgaggaag agacgaaacg aatcgtagcg ctgattgagc gccatccgca ttttgtgctt 480
gaaggggtgt acacgcattt tgcgactgcg gatgaggtga acaccgatta tttttcctat 540
cagtataccc gttttttgca catgctcgaa tggctgccgt cgcgcccgcc gctcgtccat 600
tgcgccaaca gcgcagcgtc gctccgtttc cctgaccgga cgttcaatat ggtccgcttc 660
ggcattgcca tgtatgggct tgccccgtcg cccggcatca agccgctgct gccgtatcca 720
ttaaaagaag cattttcgct ccatagccgc ctcgtacacg tcaaaaaact gcaaccaggc 780
gaaaaggtga gctatggtgc gacgtacact gcgcagacgg aggagtggat cgggacgatt 840
ccgatcggct atgcggacgg ctggctccgc cgcctgcagc actttcatgt ccttgttgac 900
ggacaaaagg cgccgattgt cggccgcatt tgcatggacc agtgcatgat ccgcctgcct 960
ggtccgctgc cggtcggcac gaaggtgaca ctgattggtc gccaagggga cgaggtaatt 1020
tccattgatg atgtcgctcg ccatttggaa acgatcaact acgaagtgcc ttgcacgatc 1080
agttatcgag tgccccgtat ttttttccgc cataagcgta taatggaagt gagaaacgcc 1140
gttggccgcg ga 1152<210> 381
<211> 384
<212> PRT
<213> Geobacillus stearothermophilus<400> 381
Met Asp Glu Phe His Arg Asp Thr Trp Ala Glu Val Asp Leu Asp Ala1 5 10 15
Ile Tyr Asp Asn Val Glu Asn Leu Arg Arg Leu Leu Pro Asp Asp Thr
20 25 30
His Ile Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly Asp Val
35 40 45
Gln Val Ala Arg Thr Ala Leu Glu Ala Gly Ala Ser Arg Leu Ala Val50 55 60
Ala Phe Leu Asp Glu Ala Leu Ala Leu Arg Glu Lys Gly Ile Glu Ala65 70 75 80
Pro Ile Leu Val Leu Gly Ala Ser Arg Pro Ala Asp Ala Ala Leu Ala
85 90 95
Ala Gln Gln Arg Ile Ala Leu Thr Val Phe Arg Ser Asp Trp Leu Glu
100 105 110
Glu Ala Ser Ala Leu Tyr Ser Gly Pro Phe Pro Ile His Phe His Leu
115 120 125
Lys Met Asp Thr Gly Met Gly Arg Leu Gly Val Lys Asp Glu Glu Glu130 135 140
Thr Lys Arg Ile Val Ala Leu Ile Glu Arg His Pro His Phe Val Leu145 150 155 160
Glu Gly Val Tyr Thr His Phe Ala Thr Ala Asp Glu Val Asn Thr Asp
165 170 175
Tyr Phe Ser Tyr Gln Tyr Thr Arg Phe Leu His Met Leu Glu Trp Leu 180 185 190
Pro Ser Arg Pro Pro Leu Val His Cys Ala Asn Ser Ala Ala Ser Leu
195 200 205
Arg Phe Pro Asp Arg Thr Phe Asn Met Val Arg Phe Gly Ile Ala Met210 215 220
Tyr Gly Leu Ala Pro Ser Pro Gly Ile Lys Pro Leu Leu Pro Tyr Pro225 230 235 240
Leu Lys Glu Ala Phe Ser Leu His Ser Arg Leu Val His Val Lys Lys245 250 255
Leu Gln Pro Gly Glu Lys Val Ser Tyr Gly Ala Thr Tyr Thr Ala Gln
260 265 270
Thr Glu Glu Trp Ile Gly Thr Ile Pro Ile Gly Tyr Ala Asp Gly Trp
275 280 285
Leu Arg Arg Leu Gln His Phe His Val Leu Val Asp Gly Gln Lys Ala
290 295 300
Pro Ile Val Gly Arg Ile Cys Met Asp Gln Cys Met Ile Arg Leu Pro305 310 315 320
Gly Pro Leu Pro Val Gly Thr Lys Val Thr Leu Ile Gly Arg Gln Gly
325 330 335
Asp Glu Val Ile Ser Ile Asp Asp Val Ala Arg His Leu Glu Thr Ile
340 345 350
Asn Tyr Glu Val Pro Cys Thr Ile Ser Tyr Arg Val Pro Arg Ile Phe
355 360 365
Phe Arg His Lys Arg Ile Met Glu Val Arg Asn Ala Val Gly Arg Gly
370 375 380
<210> 382<211> 43<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador Mutagênico<400> 382
gccatttgga aacgatcaac gcggaagtgc cttgcacgat cag<210> 383<211> 30<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador<400> 383gatataccat ggcatactca ttatggaatg 30
<210> 384
<211> 32
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 384
gttatcggat ccttaggcat taattgaaat tg 32
<210> 385
<211> 36
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 385
gaggagctcg agtcagacgt atttcagtcc tttttc 36
<210> 386
<211> 29
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 386
agaagacata tgatttatca gccggggac 29
<210> 387
<211> 30
<212> DNA
<213> Seqüência Artificial
<220>
<223> Inieiador
<400> 387agaagacata tgggtgtcgt cgtceaaaac 30
<210> 388
<211> 31
<212> DNA
<213> Seqüência Artificial
<220>
<223> Iniciador
<400> 388
ataataggat ccttagacat atttgaggcc c 31
<210> 389
<211> 28
<212> DNA
<213> Seqüência Artificial
<220>
<223> Iniciador
<400> 389
ataatacata tgaagccggt ggtggtgc 28
<210> 390
<211> 31
<212> DNA
<213> Seqüência Artificial
<220>
<223> Iniciador
<400> 390
agaagaggat ccttagacat aggtgagccc c 31
<210> 391
<211> 26
<212> DNA
<213> Seqüência Artificial
<220>
<223> Inieiador
<400> 391ataataccat gggtgtcgtg gtccag 26
<210> 392
<211> 32
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 392
agaagaggat ccttagacat atttcaggcc cc 32
<210> 393
<211> 30
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 393
gcggaacata tgtttgagaa cattaccgcc 30
<210> 394
<211> 32
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 394
ataaccggat ccttacagca ctgccacaat cg 32
<210> 395
<211> 36
<212> DNA
<213> Seqüência Artificial
<220>
<223> Iniciador
<400> 395cgctcttatg gttcggtttg cttgggttgc tcaccc 36
<210> 396
<211> 36
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 396
gggtgagcaa cccaagcttt ccgaaccata agagcg 36
<210> 397
<211> 39
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 397
caaaaaatac cagcgttaag ggagtgtggg tgagcaacc 39
<210> 398
<211> 29
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 398
cattaccgcc gctactgccg acccgattc 29
<210> 399
<211> 39
<212> DNA
<213> Seqüência Artificial
<220>
<223> Iniciador
<400> 399caccaaaaat tacctcggcg tagacggcat ccctgaatt 39
<210> 400
<211> 35
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 400
tgatgcggaa aatcacgctc ttgacttcga tgcac 35
<210> 401
<211> 35
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 401
gcggcgccat ggaaaatgat ccgattggtc taatg 35
<210> 402
<211> 33
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 402
gcggcggtcg acgcaattac aattgtgttt gtc 33
<210> 403
<211> 34
<212> DNA
<213> Seqüência Artificial
<220>
<223> Iniciador
<400> 403gcggcgccat ggatgtatgt ataattttat ttag
<210> 404
<211> 36
<212> DNA
<213> Seqüência Artificial
<220>
<223> Iniciador
<400> 404
gcggcggtcg acaaatttca ttattcattc taattt
<210> 405
<211> 36
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 405
ggccggcata tgtcgatcct taacgactac aaacgt
<210> 406
<211> 36
<212> DNA
<213> Seqüência Artificial<220>
<223> Iniciador
<400> 406
ggaaggctcg agtcatgatt ggtttccaga caaatt
<210> 407
<211> 27
<212> PRT
<213> Artificial Sequence<220>
<223> Synthetic Signal Sequence
<400> 407Met Ser Ile Val Val Thr Lys Ile Glu Arg Ala Gly Ala Ala Ala Val1 5 10 15
Ala Ala Leu Arg Thr Ser Gly Val Ala Thr Val20 25
<210> 408<211> 28<212> DNA
<213> Artificial Sequence<220>
<223> Iniciador<400> 408
ataatacata tgcccttctc ccgtaccc 28
<210> 409<211> 31<212> DNA
<213> Artificial Sequence<220>
<223> Iniciador<400> 409
gcggcgggat ccttactgat ctttcaggat t 31
<210> 410<211> 1230<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Pseudomonas taetrolens arginine racemase<400> 410
atgccettct eecgtaccct gctcgccctt tcccttggca tggeattgct gcaaaacccg 60gcctttgctg cgccacccct gtcgatgacc gacggcgtag ctcaagtgaa tacccaggac 120agcaatgcct gggtcgaaat caataaagcc gcgttcgagc acaacatacg gactctgcaa 180accgccctcg ccggcaagtc gcagatctgc gccgtactca aggcggatgc ctatggccac 240ggtatcggct tgttgatgcc ctcggtgatc gccatgggtg ttccctgtgt cggtgtcgcc 300agcaacgaag aagcccgcgt cgtgcgcgagcgcaccgctg ccctgagcga actggaagctggcaacctgg acttcgcggt caaggccagcgtggtgcacc tgggtctgaa ttccagcggcgctcagggcc gtcgtgatgc ggtagctatcatcatgaccc acttcgcggt cgaagatgctaatcagcaag cccaatggct gatgaacgtgcacgcggcca actcgttcgc cacactggagcccggcggcg cgctgttcgg cgacaccgtacagttcaagt cccacgtggc gtcggtcaacgaccgcacgt acaccctggg ccgcgactcggacggctacc gccgcgcgtt taccaataaaccagtggtgg gcaaagtctc gatgaacaccgtgaaaagcg gcgatgaagt ggtgctgttcgctgagatcg aagacatcaa cggtgcactgtccaacccta aaatcctgaa agatcagtaa<210> 411<211> 29<212> DNA<213> Artificial Seguence<220>
<223> Iniciador
agcggtttca agggtcaact gatacgcgtg 360
gcactgccgt acaacatgga agagctggtg 420
ctgattgccg aggatcacgg tcgcccgctg 480
atgagccgta acggagtgga catgaccacc S40
accaaggtgc caaacctgga agtgcgggcg 600
gccgacgtgc gtgccgggct caaggccttc 660
gcccagcttg atcgcagcaa gatcaccctg 720
gtgcccgaat cgcatctgga catggtccgc 780
ccgtcccaca ccgagtacaa gcgggtcatg 840
agctacccca agggcaacac cgtcggttat 900
cggctggcca acatcaccgt cggctactct 960
gggattgtgc tgatcaacgg ccatcgcgtg 1020
ctgatggtgg acgtcactga cgcgccggat 1080
gggcaccagg gcaaggccga gattacccag 1140
cttgcggatc tgtataccgt gtggggcaat 1200
1230
<400> 411
tacccaggct gagatggaag acatcaacg 29
<210> 412
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Iniciador
<400> 412gccagcaacg argargcmcg cgt 23
<210> 413<211> 18<212> DNA<213> Artificial Sequence<220>
<223> Iniciador<400> 413
tggccstkga tcagcaca 18
<210> 414
<211> 716<212> DNA
<213> Artificial Sequence<220>
<223> A.caviae PCR product<400> 414
gccagcaacg argargcmcg cgttgcccgc gagaagggct tcgaaggtcg cctgatgcgg 60gtacgtgccg ccaccccgga tgaagtggag caggccctgc cctacaagct ggaggagctc 120atcggcagcc tggagagcgc caaggggatc gccgacatcg cccagcgcca tcacaccaac 180atcccggtgc acatcggcct gaactccgcc ggcatgagcc gcaacggcat cgatctgcgc 240caggacgatg ccaaggccga tgccctggcc atgctcaagc tcaaggggat caccccggtc 300ggcatcatga cccacttccc ggtggaggag aaagaggacg tcaagctggg gctggcccag 360ttcaagctgg actaccagtg gctcatcgac gccggcaagc tggatcgcag caagctcacc 420atccacgccg ccaactcctt cgccaccctg gaagtaccgg aagcctactt tgacatggtg 480cgcccgggcg gcatcatcta tggcgacacc attccctcct acaccgagta caagaaggtg 540atggcgttca agacccaggt cgcctccgtc aaccactacc cggcgggcaa caccgtcggc 600tatgaccgca ccttcaccct caagcgcgac tccctgctgg ccaacctgcc gatgggctac 660tccgacggct accgccgcgc catgagcaac aaggcctatg tgctgatcma sggcca 716
<210> 415
<211> 238
<212> PRT
<213> Aeromonas caviae<220>
<221> MI SC_FEATURE<222> (237)..(237)
<223> Xaa can be Phe, Gln, Asn or Lys<400> 415
Ala Ser Asn Glu Glu Ala Arg Val Ala Arg Glu Lys Gly Phe Glu Gly1 5 10 15
Arg Leu Met Arg Val Arg Ala Ala Thr Pro Asp Glu Val Glu Gln Ala
20 25 30
Leu Pro Tyr Lys Leu Glu Glu Leu Ile Gly Ser Leu Glu Ser Ala Lys
35 40 45
Gly Ile Ala Asp Ile Ala Gln Arg His His Thr Asn Ile Pro Val His
50 55 60
Ile Gly Leu Asn Ser Ala Gly Met Ser Arg Asn Gly Ile Asp Leu Arg65 70 75 80
Gln Asp Asp Ala Lys Ala Asp Ala Leu Ala Met Leu Lys Leu Lys Gly
85 90 95
Ile Thr Pro Val Gly Ile Met Thr His Phe Pro Val Glu Glu Lys Glu
100 105 110
Asp Val Lys Leu Gly Leu Ala Gln Phe Lys Leu Asp Tyr Gln Trp Leu
115 120 125
Ile Asp Ala Gly Lys Leu Asp Arg Ser Lys Leu Thr Ile His Ala Ala
130 135 140
Asn Ser Phe Ala Thr Leu Glu Val Pro Glu Ala Tyr Phe Asp Met Val145 150 155 160
Arg Pro Gly Gly Ile Ile Tyr Gly Asp Thr Ile Pro Ser Tyr Thr Glu
165 170 175
Tyr Lys Lys Val Met Ala Phe Lys Thr Gln Val Ala Ser Val Asn His
180 185 190
Tyr Pro Ala Gly Asn Thr Val Gly Tyr Asp Arg Thr Phe Thr Leu Lys
195 200 205
Arg Asp Ser Leu Leu Ala Asn Leu Pro Met Gly Tyr Ser Asp Gly TyrArg Arg Ala Met Ser Asn Lys Ala Tyr Val Leu Ile Xaa Gly
<210> 416<211> 1227
<212> DNA
<213> Aeromonas caviae<400> 416
atgcacaaga aaacactgct cgcgaccctg atctttggcc tgctggccgg ccaggcagtc 60
gccgccccct atctgccgct cgccgacgac caccgcaacg gtcaggaaca gaccgccgcc 120
aacgcctggc tggaagtgga tctcggcgcc ttcgagcaca acatccagac cctgaagaat 180
cgcctcggtg acaagggccc gcagatctgc gccatcatga aggcggacgc ctacggtcac 240
ggcatcgacc tgctggtccc ttccgtggtc aaggcaggca tcccctgcat cggcatcgcc 300
agcaacgaag aagcacgtgt tgcccgcgag aagggcttcg aaggtcgcct gatgcgggta 360
cgtgccgcca ccccggatga agtggagcag gccctgccct acaagctgga ggagctcatc 420
ggcagcctgg agagcgccaa ggggatcgcc gacatcgccc agcgccatca caccaacatc 480
ccggtgcaca tcggcctgaa ctccgccggc atgagccgca acggcatcga tctgcgccag 540
gacgatgcca aggccgatgc cctggccatg ctcaagctca aggggatcac cccggtcggc 600
atcatgaccc acttcccggt ggaggagaaa gaggacgtca agctggggct ggcccagttc 660
aagctggact accagtggct catcgacgcc ggcaagctgg atcgcagcaa gctcaccatc 720
cacgccgcca actccttcgc caccctggaa gtaccggaag cctactttga catggtgcgc 780
ccgggcggca tcatctatgg cgacaccatt ccctcctaca ccgagtacaa gaaggtgatg 840
gcgttcaaga cccaggtcgc ctccgtcaac cactacccgg cgggcaacac cgtcggctat 900
gaccgcacct tcaccctcaa gcgcgactcc ctgctggcca acctgccgat gggctactcc 960
gacggctacc gccgcgccat gagcaacaag gcctatgtgc tgatccatgg ccagaaggcc 1020
cccgtcgtgg gcaagacttc catgaacacc accatggtgg acgtcaccga catcaagggg 1080
atcaaacccg gtgacgaggt ggtcctgttc ggacgccagg gtgatgccga ggtgaaacaa 1140
tctgatctgg aggagtacaa cggtgccctc ttggcggaca tgtacaccgt ctggggctat 1200
accaacccca agaagatcaa gcgctaa 1227
<210> 417
<211> 408<212> PRT<213> Aeromonas caviae<400> 417
Met His Lys Lys Thr Leu Leu Ala Thr Leu Ile Phe Gly Leu Leu Ala1 5 10 15
Gly Gln Ala Val Ala Ala Pro Tyr Leu Pro Leu Ala Asp Asp His Arg
20 25 30
Asn Gly Gln Glu Gln Thr Ala Ala Asn Ala Trp Leu Glu Val Asp Leu
35 40 45
Gly Ala Phe Glu His Asn Ile Gln Thr Leu Lys Asn Arg Leu Gly Asp
50 55 60
Lys Gly Pro Gln Ile Cys Ala Ile Met Lys Ala Asp Ala Tyr Gly His65 70 75 80
Gly Ile Asp Leu Leu Val Pro Ser Val Val Lys Ala Gly Ile Pro Cys
85 90 95
Ile Gly Ile Ala Ser Asn Glu Glu Ala Arg Val Ala Arg Glu Lys Gly
100 105 110
Phe Glu Gly Arg Leu Met Arg Val Arg Ala Ala Thr Pro Asp Glu Val
115 120 125
Glu Gln Ala Leu Pro Tyr Lys Leu Glu Glu Leu Ile Gly Ser Leu Glu
130 135 140
Ser Ala Lys Gly Ile Ala Asp Ile Ala Gln Arg His His Thr Asn Ile145 150 155 160
Pro Val His Ile Gly Leu Asn Ser Ala Gly Met Ser Arg Asn Gly Ile
165 170 175
Asp Leu Arg Gln Asp Asp Ala Lys Ala Asp Ala Leu Ala Met Leu Lys
180 185 190
Leu Lys Gly Ile Thr Pro Val Gly Ile Met Thr His Phe Pro Val Glu
195 200 205
Glu Lys Glu Asp Val Lys Leu Gly Leu Ala Gln Phe Lys Leu Asp Tyr
210 215 220
Gln Trp Leu Ile Asp Ala Gly Lys Leu Asp Arg Ser Lys Leu Thr Ile225 230 235 240His Ala Ala Asn Ser Phe Ala Thr Leu Glu Val Pro Glu Ala Tyr Phe
245 250 255
Asp Met Val Arg Pro Gly Gly Ile Ile Tyr Gly Asp Thr Ile Pro Ser260 265 270
Tyr Thr Glu Tyr Lys Lys Val Met Ala Phe Lys Thr Gln Val Ala Ser275 280 285
Val Asn His Tyr Pro Ala Gly Asn Thr Val Gly Tyr Asp Arg Thr Phe
290 295 300
Thr Leu Lys Arg Asp Ser Leu Leu Ala Asn Leu Pro Met Gly Tyr Ser305 310 315 320
Asp Gly Tyr Arg Arg Ala Met Ser Asn Lys Ala Tyr Val Leu Ile His
325 330 335
Gly Gln Lys Ala Pro Val Val Gly Lys Thr Ser Met Asn Thr Thr Met340 345 350
15 Val Asp Val Thr Asp Ile Lys Gly Ile Lys Pro Gly Asp Glu Val Val355 360 365
Leu Phe Gly Arg Gln Gly Asp Ala Glu Val Lys Gln Ser Asp Leu Glu
370 375 380
Glu Tyr Asn Gly Ala Leu Leu Ala Asp Met Tyr Thr Val Trp Gly Tyr385 390 395 400
Thr Asn Pro Lys Lys Ile Lys Arg405
Claims (92)
1. Ácido nucléico isolado, sintético ou recombinante compreen-dendo(a) um ácido nucléico codificando pelo menos um polipeptídio,onde o ácido nucléico compreende uma seqüência tendo pelo menos 50%,-51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,-64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%,-77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%,-90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais identidadede seqüência ou seqüência de identidade completa (100%) em relação àseqüência de SEQ ID N°: 1, SEQ ID N°: 3, SEQ ID N°: 5, SEQ ID N°: 7, SEQID N°: 9, SEQ ID N°: 11, SEQ ID N°: 13, SEQ ID N°: 15, SEQ ID N°: 17, SEQID N°: 19, SEQ ID N°: 21, SEQ ID N°: 23, SEQ ID N°: 25, SEQ ID N°: 27,SEQ ID N°: 29, SEQ ID N°: 31, SEQ ID N°: 33, SEQ ID N°: 35, SEQ ID N°:-37, SEQ ID N°: 39, SEQ ID N°: 41, SEQ ID N°: 43, SEQ ID N°: 45, SEQ IDN°: 47, SEQ ID N°: 49, SEQ ID N°: 51, SEQ ID N°: 53, SEQ ID N°: 55, SEQID N°: 57, SEQ ID N°: 59, SEQ ID N°: 61, SEQ ID N°: 63, SEQ ID N°: 65,SEQ ID N°: 67, SEQ ID N°: 69, SEQ ID N°: 71, SEQ ID N°: 73, SEQ ID N°:-75, SEQ ID N°: 77, SEQ ID N°: 79, SEQ ID N°: 81, SEQ ID N°: 83, SEQ IDN°: 85, SEQ ID N°: 87, SEQ ID N°: 89, SEQ ID N°: 91, SEQ ID N°: 93, SEQID N°: 95, SEQ ID N°: 97, SEQ ID N°: 99, SEQ ID N°: 101, SEQ ID N°: 103,SEQ ID N°: 105, SEQ ID N°: 107, SEQ ID N°: 109, SEQ ID N0: 111, SEQ IDN°: 113, SEQ ID N°: 115, SEQ ID N°: 117, SEQ ID N°: 119, SEQ ID N°: 121,SEQ ID N°: 123, SEQ ID N°: 125, SEQ ID N°: 127, SEQ ID N°: 129, SEQ IDN°: 131, SEQ ID N°: 133, SEQ ID N°: 135, SEQ ID N°: 137, SEQ ID N0: 139,SEQ ID N°: 141, SEQ ID N°: 143, SEQ ID N°: 145, SEQ ID N°: 147, SEQ IDN°: 149, SEQ ID N°: 151, SEQ ID N0: 153, SEQ ID N°: 155, SEQ ID N0: 157,SEQ ID N°: 159, SEQ ID N°: 161, SEQ ID N°: 163, SEQ ID N°: 165, SEQ IDN°: 167, SEQ ID N°: 169, SEQ ID N°: 171, SEQ ID N°: 173, SEQ ID N°: 175,SEQ ID N0: 177, SEQ ID N°: 179, SEQ ID N°: 181, SEQ ID N°: 183, SEQ IDN°: 185, SEQ ID N°: 187, SEQ ID N°: 189, SEQ ID N°: 191, SEQ ID N°: 193,SEQ ID N°: 195, SEQ ID N°: 197, SEQ ID N°: 199, SEQ ID N°: 201, SEQ IDΝ°: 203, SEQ ID Ν°: 205, SEQ ID N0: 207, SEQ ID Ν°: 209, SEQ ID Ν°: 211,SEQ ID Ν°: 213, SEQ ID Ν°: 215, SEQ ID Ν°: 217, SEQ ID Ν°: 219, SEQ IDΝ°: 221, SEQ ID Ν°: 223, SEQ ID Ν°: 225, SEQ ID Ν°: 227, SEQ ID Ν°: 229,SEQ ID Ν°: 231, SEQ ID Ν°: 233, SEQ ID Ν°: 235, SEQ ID Ν°: 237, SEQ IDΝ°: 239, SEQ ID Ν°: 241, SEQ ID Ν°: 243, SEQ ID Ν°: 245, SEQ ID Ν°: 247,SEQ ID Ν°: 249, SEQ ID Ν°: 251, SEQ ID Ν°: 253, SEQ ID Ν°: 255, SEQ IDΝ°: 257, SEQ ID Ν°: 259, SEQ ID N0: 261, SEQ ID N0: 263, SEQ ID Ν°: 265,SEQ ID Ν°: 267, SEQ ID Ν°: 269, SEQ ID Ν°: 271, SEQ ID Ν°: 273, SEQ IDΝ°: 275, SEQ ID Ν°: 277, SEQ ID Ν°: 279, SEQ ID Ν°: 281, SEQ ID Ν°: 283,SEQ ID Ν°: 285, SEQ ID Ν°: 287, SEQ ID Ν°: 289, SEQ ID Ν°: 291, SEQ IDΝ°: 293, SEQ ID Ν°: 295, SEQ ID Ν°: 297, SEQ ID Ν°: 299, SEQ ID Ν°: 301,SEQ ID Ν°: 303, SEQ ID Ν°: 305, SEQ ID Ν°: 307, SEQ ID Ν°: 309, SEQ IDΝ°: 311, SEQ ID Ν°: 313, SEQ ID Ν°: 315, SEQ ID N0: 317, SEQ ID Ν°: 319,SEQ ID Ν°: 321, SEQ ID Ν°: 323, SEQ ID Ν°: 325, SEQ ID Ν°: 327, SEQ IDΝ°: 329, SEQ ID Ν°: 331, SEQ ID Ν°: 333, SEQ ID Ν°: 335, SEQ ID Ν°: 336,SEQ ID N0: 337 e/ou SEQ ID Ν°: 338, por uma região de pelo menos cercade 20, 30, 40, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600,-650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150 ou mais resí-duos, ou o comprimento total de um cDNA, transcrito (mRNA) ou gene,onde o ácido nucléico codifica pelo menos um polipeptídio comuma atividade de aldolase ou codifica um polipeptídio ou peptídio capaz degerar um anticorpo específico para aldolase (um polipeptídio ou peptídio queage como um epítopo ou imunógeno),e opcionalmente as identidades de seqüência são determinadaspor análise com um algoritmo de comparação de seqüências ou por inspe-ção visual,e opcionalmente o algoritmo de comparação de seqüências éum algoritmo BLAST versão 2.2.2 onde uma configuração de filtragem éconfigurada em blastall -p blastp -d "nr pataa" -F F, e todas as outras opçõessão configuradas em "default";(b) um ácido nucléico codificando pelo menos um polipeptídio,onde o ácido nucléico compreende uma seqüência que hibridiza em condi-ções rigorosas para o complemento de um ácido nucléico compreendendo aseqüência de SEQ ID N°: 1, SEQ ID N0: 3, SEQ ID N°: 5, SEQ ID N°: 7, SEQID N°: 9, SEQ ID N°: 11, SEQ ID N°: 13, SEQ ID N°: 15, SEQ ID N°: 17, SEQID N°: 19, SEQ ID N°: 21, SEQ ID N°: 23, SEQ ID N°: 25, SEQ ID N°: 27,SEQ ID N0: 29, SEQ ID N°: 31, SEQ ID N°: 33, SEQ ID N°: 35, SEQ ID N°:-37, SEQ ID N°: 39, SEQ ID N0: 41, SEQ ID N°: 43, SEQ ID N°: 45, SEQ IDN°: 47, SEQ ID N°: 49, SEQ ID N°: 51, SEQ ID N°: 53, SEQ ID N°: 55, SEQID N°: 57, SEQ ID N°: 59, SEQ ID N°: 61, SEQ ID N0: 63, SEQ ID N°: 65,SEQ ID N°: 67, SEQ ID N°: 69, SEQ ID N°: 71, SEQ ID N0: 73, SEQ ID N°:-75, SEQ ID N°: 77, SEQ ID N°: 79, SEQ ID N°: 81, SEQ ID N0: 83, SEQ IDN0: 85, SEQ ID N°: 87, SEQ ID N0: 89, SEQ ID N°: 91, SEQ ID N°: 93, SEQID N°: 95, SEQ ID N°: 97, SEQ ID N°: 99, SEQ ID N°: 101, SEQ ID N°: 103,SEQ ID N°: 105, SEQ ID N°: 107, SEQ ID N°: 109, SEQ ID N0: 111, SEQ IDN°: 113, SEQ ID N°: 115, SEQ ID N°: 117, SEQ ID N°: 119, SEQ ID N°: 121,SEQ ID N°: 123, SEQ ID N°: 125, SEQ ID N0: 127, SEQ ID N°: 129, SEQ IDN0: 131, SEQ ID N°: 133, SEQ ID N°: 135, SEQ ID N°: 137, SEQ ID N°: 139,SEQ ID N°: 141, SEQ ID N°: 143, SEQ ID N°: 145, SEQ ID N°: 147, SEQ IDN°: 149, SEQ ID N°: 151, SEQ ID N°: 153, SEQ ID N°: 155, SEQ ID N0: 157,SEQ ID N°: 159, SEQ ID N°: 161, SEQ ID N°: 163, SEQ ID N°: 165, SEQ IDN0: 167, SEQ ID N°: 169, SEQ ID N0: 171, SEQ ID N°: 173, SEQ ID N°: 175,SEQ ID N°: 177, SEQ ID N°: 179, SEQ ID N°: 181, SEQ ID N°: 183, SEQ IDN°: 185, SEQ ID N°: 187, SEQ ID N°: 189, SEQ ID N°: 191, SEQ ID N°: 193,SEQ ID N°: 195, SEQ ID N°: 197, SEQ ID N°: 199, SEQ ID N0: 201, SEQ IDN°: 203, SEQ ID N°: 205, SEQ ID N°: 207, SEQ ID N°: 209, SEQ ID N°: 211,SEQ ID N°: 213, SEQ ID N0: 215, SEQ ID N°: 217, SEQ ID N°: 219, SEQ IDN°: 221, SEQ ID N°: 223, SEQ ID N°: 225, SEQ ID N°: 227, SEQ ID N°: 229,SEQ ID N°: 231, SEQ ID N°: 233, SEQ ID N0: 235, SEQ ID N°: 237, SEQ IDN°: 239, SEQ ID N°: 241, SEQ ID N°: 243, SEQ ID N°: 245, SEQ ID N°: 247,SEQ ID N°: 249, SEQ ID N°: 251, SEQ ID N0: 253, SEQ ID N°: 255, SEQ IDN°: 257, SEQ ID N°: 259, SEQ ID N°: 261, SEQ ID N°: 263, SEQ ID N°: 265,SEQ ID N°: 267, SEQ ID N°: 269, SEQ ID N°: 271, SEQ ID N°: 273, SEQ IDN°: 275, SEQ ID N°: 277, SEQ ID N°: 279, SEQ ID N°: 281, SEQ ID N°: 283,SEQ ID Ν°: 285, SEQ ID Ν°: 287, SEQ ID Ν°: 289, SEQ ID Ν°: 291, SEQ IDΝ°: 293, SEQ ID Ν°: 295, SEQ ID Ν°: 297, SEQ ID Ν°: 299, SEQ ID Ν°: 301,SEQ ID Ν°: 303, SEQ ID Ν°: 305, SEQ ID Ν°: 307, SEQ ID N0: 309, SEQ IDΝ°: 311, SEQ ID Ν°: 313, SEQ ID Ν°: 315, SEQ ID Ν°: 317, SEQ ID Ν°: 319,SEQ ID Ν°: 321, SEQ ID Ν°: 323, SEQ ID Ν°: 325, SEQ ID Ν°: 327, SEQ IDΝ°: 329, SEQ ID Ν°: 331, SEQ ID Ν°: 333, SEQ ID Ν°: 335, SEQ ID Ν°: 336,SEQ ID Ν°: 337 e/ou SEQ ID Ν°: 338,onde o ácido nucléico codifica pelo menos um polipeptídio comuma atividade de aldolase ou codifica um polipeptídio ou peptídio capaz degerar um anticorpo específico para aldolase (um polipeptídio ou peptídio queage como um epítopo ou imunógeno),e opcionalmente as condições rigorosas incluem uma etapa delavagem compreendendo uma lavagem em 0,2X SSC a uma temperatura decerca de 65°C por cerca de 15 minutos,e opcionalmente o ácido nucléico tem pelo menos cerca de 20,-30, 40, 50, 60, 75, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000 oumais resíduos de comprimento ou o comprimento total do gene ou transcrito;(c) um ácido nucléico codificando pelo menos um polipeptídiocom uma atividade de aldolase, onde o polipeptídio compreende a seqüên-cia de SEQ ID N°: 2, SEQ ID N°: 4, SEQ ID N°: 6, SEQ ID N°: 8, SEQ ID N°:-10, SEQ ID N°: 12, SEQ ID N°: 14, SEQ ID N0: 16, SEQ ID N°: 18, SEQ IDN°: 20, SEQ ID N°: 22, SEQ ID N°: 24, SEQ ID N0: 26, SEQ ID N°: 28, SEQID N°: 30, SEQ ID N°: 32, SEQ ID N°: 34, SEQ ID N0: 36, SEQ ID N0: 38,SEQ ID N°: 40, SEQ ID N°: 42, SEQ ID N°: 44, SEQ ID N°: 46, SEQ ID N°:-48, SEQ ID N°: 50, SEQ ID N0: 52, SEQ ID N°: 54, SEQ ID N°: 56, SEQ IDN0: 58, SEQ ID N°: 60, SEQ ID N°: 62, SEQ ID N°: 64, SEQ ID N0: 66, SEQID N0: 68, SEQ ID N°: 70, SEQ ID N°: 72, SEQ ID N0: 74, SEQ ID N°: 76,SEQ ID N°: 78, SEQ ID N°: 80, SEQ ID N°: 82, SEQ ID N°: 84, SEQ ID N°:-86, SEQ ID N°: 88, SEQ ID N°: 90, SEQ ID N°: 92, SEQ ID N°: 94, SEQ IDN°: 96, SEQ ID N°: 98, SEQ ID N°: 100, SEQ ID N°: 102, SEQ ID N0: 104,SEQ ID N°: 106, SEQ ID N°: 108, SEQ ID N°: 110, SEQ ID N0: 112, SEQ IDN°: 114, SEQ ID N°: 116, SEQ ID N°: 118, SEQ ID N°: 120, SEQ ID N°: 122,SEQ ID Ν°: 124, SEQ ID Ν°: 126, SEQ ID Ν°: 128, SEQ ID Ν°: 130, SEQ JDΝ°: 132, SEQ ID N0: 134, SEQ ID Ν°: 136, SEQ ID Ν°: 138, SEQ ID Ν°: 140,SEQ ID Ν°: 142, SEQ ID Ν°: 144, SEQ ID N0: 146, SEQ ID N0: 148, SEQ IDΝ°: 150, SEQ ID Ν°: 152, SEQ ID Ν°: 154, SEQ ID Ν°: 156, SEQ ID Ν°: 158,SEQ ID Ν°: 160, SEQ ID Ν°: 162, SEQ ID Ν°: 164, SEQ ID N0: 166, SEQ IDΝ°: 168, SEQ ID Ν°: 170, SEQ ID Ν°: 172, SEQ ID Ν°: 174, SEQ ID Ν°: 176,SEQ ID Ν°: 178, SEQ ID Ν°: 180, SEQ ID Ν°: 182, SEQ ID Ν°: 184, SEQ IDΝ°: 186, SEQ ID N0: 188, SEQ ID Ν°: 190, SEQ ID Ν°: 192, SEQ ID Ν°: 194,SEQ ID Ν°: 196, SEQ ID N0: 198, SEQ ID Ν°: 200, SEQ ID Ν°: 202, SEQ IDΝ°: 204, SEQ ID Ν°: 206, SEQ ID N0: 208, SEQ ID Ν°: 210, SEQ ID Ν°: 212,SEQ ID Ν°: 214, SEQ ID Ν°: 216, SEQ ID Ν°: 218, SEQ ID Ν°: 220, SEQ IDΝ°: 222, SEQ ID Ν°: 224, SEQ ID Ν°: 226, SEQ ID Ν°: 228, SEQ ID Ν°: 230,SEQ ID Ν°: 232, SEQ ID Ν°: 234, SEQ ID Ν°: 236, SEQ ID Ν°: 238, SEQ IDN0: 240, SEQ ID Ν°: 242, SEQ ID Ν°: 244, SEQ ID Ν°: 246, SEQ ID Ν°: 248,SEQ ID Ν°: 250, SEQ ID Ν°: 252, SEQ ID N0: 254, SEQ ID Ν°: 256, SEQ IDΝ°: 258, SEQ ID Ν°: 260, SEQ ID Ν°: 262, SEQ ID Ν°: 264, SEQ ID Ν°: 266,SEQ ID Ν°: 268, SEQ ID Ν°: 270, SEQ ID Ν°: 272, SEQ ID Ν°: 274, SEQ IDΝ°: 276, SEQ ID N0: 278, SEQ ID Ν°: 280, SEQ ID Ν°: 282, SEQ ID Ν°: 284,SEQ ID Ν°: 286, SEQ ID Ν°: 288, SEQ ID Ν°: 290, SEQ ID Ν°: 292, SEQ IDΝ°: 294, SEQ ID Ν°: 296, SEQ ID Ν°: 298, SEQ ID Ν°: 300, SEQ ID Ν°: 302,SEQ ID Ν°: 304, SEQ ID Ν°: 306, SEQ ID Ν°: 308, SEQ ID Ν°: 310, SEQ IDΝ°: 312, SEQ ID Ν°: 314, SEQ ID N0: 316, SEQ ID Ν°: 318, SEQ ID Ν°: 320,SEQ ID N0: 322, SEQ ID N0: 324, SEQ ID Ν°: 326, SEQ ID Ν°: 328, SEQ IDΝ°: 330, SEQ ID Ν°: 332, e/ou SEQ ID N°: 334, ou fragmentos enzimatica-mente ativos das mesmas;(d) (i) o ácido nucléico de (a), (b) ou (c) codificando um polipep-tídio com pelo menos uma substituição de aminoácido conservadora e re-tendo sua atividade de aldolase; ou, (ii) o ácido nucléico de (d){i), onde apelo menos uma substituição de aminoácido conservadora compreendesubstituir um aminoácido por um outro aminoácido de características seme-lhantes; ou uma substituição conservadora compreende: a substituição deum aminoácido alifático por um outro aminoácido alifático; a substituição deuma serina por uma treonina ou vice-versa; a substituição de um resíduoácido por um outro resíduo ácido; a substituição de um resíduo contendo umgrupo amida por um outro resíduo contendo um grupo amida; a troca de umresíduo básico por um outro resíduo básico; ou a substituição de um resíduoaromático por um outro resíduo aromático;(e) o ácido nucléico (polinucleotídeo) de (a), (b), (c) ou (d) codifi-cando um polipeptídio com uma atividade de aldolase porém faltando umaseqüência de sinal,(f) o ácido nucléico (polinucleotídeo) de (a), (b), (c), (d) ou (e)codificando um polipeptídio com uma atividade de aldolase compreendendoainda uma seqüência heteróloga;(g) o ácido nucléico (polinucleotídeo) de (f), onde a seqüênciaheteróloga compreende uma seqüência codificando: (i) uma seqüência desinal heteróloga; (ii) a seqüência de (ii), onde a seqüência de sinal heterólo-ga deriva de uma enzima heteróloga; ou, (iii) um traçador, um epítopo, umpeptídio vetorizador, uma seqüência de clivagem, uma porção detectável ouuma enzima; ou(h) uma seqüência de ácidos nucléicos complementar a (a), (b),(c), (d), (e), (f), ou (g).
2. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 1, onde a seqüência do ácido nucléico compreende umaseqüência como aquela apresentada na SEQ ID N°: 1, SEQ ID N°: 3, SEQID N°: 5, SEQ ID N°: 7, SEQ ID N°: 9, SEQ ID N°: 11, SEQ ID N°: 13, SEQID N°: 15, SEQ ID N°: 17, SEQ ID N°: 19, SEQ ID N°: 21, SEQ ID N°: 23,SEQ ID N°: 25, SEQ ID N°: 27, SEQ ID N°: 29, SEQ ID N°: 31, SEQ ID N°:- 33, SEQ ID N°: 35, SEQ ID N°: 37, SEQ ID N°: 39, SEQ ID N°: 41, SEQ IDN°: 43, SEQ ID N°: 45, SEQ ID N°: 47, SEQ ID N°: 49, SEQ ID N°: 51, SEQID N°: 53, SEQ ID N0: 55, SEQ ID N°: 57, SEQ ID N°: 59, SEQ ID N°: 61,SEQ ID N°: 63, SEQ ID N°: 65, SEQ ID N°: 67, SEQ ID N0: 69, SEQ ID N°:- 71, SEQ ID N°: 73, SEQ ID N°: 75, SEQ ID N0: 77, SEQ ID N°: 79, SEQ IDN°: 81, SEQ ID N°: 83, SEQ ID N°: 85, SEQ ID N°: 87, SEQ ID N°: 89, SEQID N°: 91, SEQ ID N°: 93, SEQ ID N°: 95, SEQ ID N°: 97, SEQ ID N°: 99,SEQ ID Ν°: 101, SEQ ID N0: 103, SEQ ID N0: 105, SEQ ID N0: 107, SEQ IDΝ°: 109, SEQ ID Ν°: 111, SEQ ID Ν°: 113, SEQ ID Ν°: 115, SEQ ID Ν°: 117,SEQ ID Ν°: 119, SEQ ID Ν°: 121, SEQ ID Ν°: 123, SEQ ID Ν°: 125, SEQ IDΝ°: 127, SEQ ID Ν°: 129, SEQ ID N0: 131, SEQ ID Ν°: 133, SEQ ID Ν°: 135,SEQ ID Ν°: 137, SEQ ID Ν°: 139, SEQ ID Ν°: 141, SEQ ID Ν°: 143, SEQ IDΝ°: 145, SEQ ID Ν°: 147, SEQ ID Ν°: 149, SEQ ID Ν°: 151, SEQ ID N0: 153,SEQ ID Ν°: 155, SEQ ID Ν°: 157, SEQ ID Ν°: 159, SEQ ID Ν°: 161, SEQ IDΝ°: 163, SEQ ID Ν°: 165, SEQ ID Ν°: 167, SEQ ID Ν°: 169, SEQ ID Ν°: 171,SEQ ID Ν°: 173, SEQ ID Ν°: 175, SEQ ID Ν°: 177, SEQ ID Ν°: 179, SEQ IDΝ°: 181, SEQ ID Ν°: 183, SEQ ID Ν°: 185, SEQ ID Ν°: 187, SEQ ID Ν°: 189,SEQ ID Ν°: 191, SEQ ID Ν°: 193, SEQ ID Ν°: 195, SEQ ID Ν°: 197, SEQ IDΝ°: 199, SEQ ID Ν°: 201, SEQ ID Ν°: 203, SEQ ID Ν°: 205, SEQ ID Ν°: 207,SEQ ID Ν°: 209, SEQ ID Ν°: 211, SEQ ID Ν°: 213, SEQ ID Ν°: 215, SEQ IDΝ°: 217, SEQ ID Ν°: 219, SEQ ID Ν°: 221, SEQ ID Ν°: 223, SEQ ID Ν°: 225,SEQ ID Ν°: 227, SEQ ID Ν°: 229, SEQ ID Ν°: 231, SEQ ID Ν°: 233, SEQ IDΝ°: 235, SEQ ID Ν°: 237, SEQ ID Ν°: 239, SEQ ID Ν°: 241, SEQ ID Ν°: 243,SEQ ID Ν°: 245, SEQ ID Ν°: 247, SEQ ID Ν°: 249, SEQ ID Ν°: 251, SEQ IDΝ°: 253, SEQ ID Ν°: 255, SEQ ID Ν°: 257, SEQ ID Ν°: 259, SEQ ID Ν°: 261,SEQ ID Ν°: 263, SEQ ID Ν°: 265, SEQ ID Ν°: 267, SEQ ID Ν°: 269, SEQ IDΝ°: 271, SEQ ID Ν°: 273, SEQ ID Ν°: 275, SEQ ID Ν°: 277, SEQ ID N0: 279,SEQ ID Ν°: 281, SEQ ID Ν°: 283, SEQ ID Ν°: 285, SEQ ID Ν°: 287, SEQ IDΝ°: 289, SEQ ID Ν°: 291, SEQ ID Ν°: 293, SEQ ID Ν°: 295, SEQ ID Ν°: 297,SEQ ID Ν°: 299, SEQ ID Ν°: 301, SEQ ID N0: 303, SEQ ID Ν°: 305, SEQ IDΝ°: 307, SEQ ID Ν°: 309, SEQ ID Ν°: 311, SEQ ID Ν°: 313, SEQ ID Ν°: 315,SEQ ID Ν°: 317, SEQ ID Ν°: 319, SEQ ID Ν°: 321, SEQ ID Ν°: 323, SEQ IDΝ°: 325, SEQ ID Ν°: 327, SEQ ID Ν°: 329, SEQ ID Ν°: 331, SEQ ID Ν°: 333,SEQ ID Ν°: 335, SEQ ID Ν°: 336, SEQ ID Ν°: 337 ou SEQ ID Ν°: 338.
3. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 1, onde a atividade de aldolase compreende uma ativi-dade de piruvato aldolase.
4. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 1, onde a atividade de aldolase compreende uma ativi-dade de HMG aldolase.
5. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 1, onde a atividade de aldolase compreende uma ativi-dade de KHG aldolase.
6. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 1, onde (a) a atividade de aldolase é termoestável ou (b)o polipeptídio codificado pelo ácido nucléico retém uma atividade de aldolaseem condições compreendendo uma faixa de temperatura de cerca de -100°Ca cerca de -80°C, cerca de -80°C a cerca de -40°C, cerca de -40°C a cercade -20°C, cerca de -20°C a cerca de 0°C, cerca de 0°C a cerca de 37°C,cerca de 0°C a cerca de 5°C, cerca de 5°C a cerca de 15°C, cerca de 15°C acerca de 25°C, cerca de 25°C a cerca de 37°C, cerca de 37°C a cerca de-45°C, cerca de 45°C a cerca de 55°C, cerca de 55°C a cerca de 70°C, cercade 70°C a cerca de 75°C, cerca de 75°C a cerca de 85°C, cerca de 85°C acerca de 90°C, cerca de 90°C a cerca de 95°C, cerca de 95°C a cerca de-100°C, cerca de 100°C a cerca de 105°C, cerca de 105°C a cerca de 110°C,cerca de 110°C a cerca de 120°C, ou 95°C, 96°C, 97°C, 98°C, 99°C, 100°C,-1010C1 102°C, 103°C, 104°C, 105°C, 106°C, 107°C, 108°C, 109°C, 110°C,-111 °C, 112°C, 113°C, 114°C, 115°C ou mais.
7. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 1, onde (a) a atividade de aldolase é termotolerante ou(b) o polipeptídio retém uma atividade de aldolase depois de exposição auma temperatura na faixa de cerca de -100°C a cerca de -80°C, cerca de --80°C a cerca de -40°C, cerca de -40°C a cerca de -20°C, cerca de -20°C acerca de 0°C, cerca de 0°C a cerca de 37°C, cerca de 0°C a cerca de 5°C,cerca de 5°C a cerca de 15°C, cerca de 15°C a cerca de 25°C, cerca de-250C a cerca de 37°C, cerca de 37°C a cerca de 45°C, cerca de 45°C a cer-ca de 55°C, cerca de 55°C a cerca de 70°C, cerca de 70°C a cerca de 75°C,cerca de 75°C a cerca de 85°C, cerca de 85°C a cerca de 90°C, cerca de-90°C a cerca de 95°C, cerca de 95°C a cerca de 100°C, cerca de 100°C acerca de 105°C, cerca de 105°C a cerca de 110oC, cerca de 1100C a cercade 120°C, õü 95°C, 96°C, 97°C, 98°C, 99°C, 100°C, 101 °C, 102°C, 103°C,- 104°C, 105°C, 106°C, 107°C, 108°C, 109°C, 1100C1 111°C, 112°C, 113°C,- 114°C, 115°C ou mais.
8. Ácido nucléico isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 1 a 7, onde a atividade de aldolaseretém atividade em condições ácidas compreendendo cerca de pH 6,5, pH 6,pH 5,5, pH 5, pH 4,5, pH 4,0, pH 3,5, pH 3,0 ou menos (mais ácidas), ou,retém uma atividade de aldolase depois de exposição a condições ácidascompreendendo cerca de pH 6,5, pH 6, pH 5,5, pH 5, pH 4,5, pH 4,0, pH 3,5,pH 3,0 ou menos (mais ácidas).
9. Ácido nucléico isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 1 a 7, onde a atividade de aldolaseretém atividade em condições básicas compreendendo cerca de pH 7,0, pH- 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11, pH 11,5, pH 12,0,pH 12,5 ou mais (mais básicas) ou, retém uma atividade de aldolase depoisde exposição a condições básicas compreendendo cerca de pH 7, pH 7,5 pH- 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11,0, pH 11,5, pH 12, pH 12,5ou mais (mais básicas).
10. Sonda de ácido nucléico para identificar um ácido nucléicocodificando um polipeptídio com uma atividade de aldolase, onde a sondacompreende pelo menos 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80,- 85, 90, 95, 100, 125, 150, 175, 200, 225 ou mais bases consecutivas de umaseqüência como aquela apresentada na reivindicação 1, onde a sonda iden-tifica o ácido nucléico por ligação ou hibridização.
11. Par de iniciadores de amplificação para amplificar um ácidonucléico codificando um polipeptídio com uma atividade de aldolase, onde opar de iniciadores de amplificação(a) é capaz de amplificar um ácido nucléico compreendendouma seqüência como aquela apresentada em qualquer uma das reivindica-ções 1 a 10, ou uma subsequência da mesma, ou (b) o par de iniciadores de(a), onde um membro do par de seqüências iniciadoras de amplificaçãocompreende um oligonucleotídeo compreendendo pelo menos cerca de 10 a 50 bases consecutivas da seqüência, ou, cerca de 10, 11, 12, 13, 14, 15, 16,-17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 oumais bases consecutivas da seqüência.
12. Par de iniciadores de amplificação, onde o par de iniciadorescompreende um primeiro membro com uma seqüência como aquela repre-sentada por cerca dos (os 5') 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,-22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 ou mais dos primeirosresíduos de uma seqüência como aquela apresentada em qualquer uma dasreivindicações 1 a 10, e um segundo membro com uma seqüência como a-quela representada por cerca dos (os 5') 10, 11, 12, 13, 14, 15, 16, 17, 18,-19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 ou mais dosprimeiros resíduos do cordão complementar do primeiro membro.
13. Ácido nucléico codificando aldolase gerado por amplificaçãode um polinucleotídeo usando um par de iniciadores de amplificação comoaquele apresentado na reivindicação 11, onde opcionalmente a amplificaçãoé por reação de cadeia de polimerase (PCR).
14. Ácido nucléico codificador de aldolase de acordo com a rei-vindicação 13, onde o ácido nucléico é gerado por amplificação de uma bi-blioteca de genes, e opcionalmente a biblioteca de genes é uma bibliotecaambiental.
15. Aldolase isolada, sintética ou recombinante codificada peloácido nucléico codificador de aldolase apresentado na reivindicação 13.
16. Método para amplificar um ácido nucléico codificando umpolipeptídio com uma atividade de aldolase compreendendo amplificação deum ácido nucléico gabarito com um par de seqüências de par de iniciadoresde amplificação capaz de amplificar uma seqüência de ácidos nucléicos co-mo aquela apresentada em qualquer uma das reivindicações 1 a 10, ou umasubsequência da mesma.
17. Cassete de expressão, vetor ou veículo de clonagem com-preendendo um ácido nucléico compreendendo uma seqüência como aquelaapresentada como definido em qualquer uma das reivindicações 1 a 10, on-de opcionalmente o veículo de clonagem compreende um vetor viral, umplasmídio, um fago, um fagomídio, um cosmídio, um fosmídio, um bacterió-fago ou um cromossoma artificial.
18. Veículo de clonagem de acordo com a reivindicação 17, on-de o vetor viral compreende um vetor de adenovírus, um vetor retroviral ouum vetor viral associado a adenovírus, ou, o cromossoma artificial compre-ende um cromossoma artificial de bactéria (BAC), um vetor derivado do bac-teriófago P1 (PAC), um cromossoma artificial de levedura (YAC), ou umcromossoma artificial de mamífero (MAC).
19. Célula transformada compreendendo um ácido nucléicocompreendendo uma seqüência como aquela apresentada como definidoem qualquer uma das reivindicações 1 a 10, ou compreendendo um cassetede expressão, um vetor ou um veículo de clonagem como definido na reivin-dicação 17, onde opcionalmente a célula é uma célula de bactéria, uma célu-la de mamífero, uma célula de fungo, uma célula de levedura, um célula deinseto ou uma célula de planta.
20. Animal inumano transgênico compreendendo uma seqüênciacomo aquela apresentada em qualquer uma das reivindicações 1 a 10, oucompreendendo um cassete de expressão, um vetor ou um veículo de clo-nagem como definido na reivindicação 17, uma célula transformada comodefinida na reivindicação 19, onde opcionalmente o animal não-humanotransgênico é um camundongo, um rato, um carneiro, um porco, uma gali-nha, uma bode, um peixe, ou uma vaca.
21. Planta transgênica, parte de planta ou semente compreen-dendo uma seqüência como aquela apresentada em qualquer uma das rei-vindicações 1 a 10, onde opcionalmente a planta é uma planta de milho,uma planta de sorgo, uma planta de batata, uma planta de tomate, umaplanta de trigo, uma planta oleaginosa, uma planta de colza, uma planta desoja, uma planta de arroz, uma planta de cevada, uma gramínea, uma plantade algodão, uma planta de caroço de algodão, uma palmeira, uma planta degergelim, uma planta de amendoim, uma planta de girassol ou uma plantade tabaco.
22. Oligonucleotídeo anti-sentido compreendendo uma seqüên-cia de ácidos nucléicos complementar a ou capaz de hibridizar em condiçõesrigorosas para uma seqüência como aquela apresentada como definido emqualquer uma das reivindicações 1 a 10, ou uma subsequência da mesma,onde opcionalmente o oligonucleotídeo anti-sentido tem pelo menos cercade 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100,- 125, 150, 175, 200, 225 ou mais bases consecutivas de comprimento.
23. Molécula de RNA de interferência (RNAi) de cordão duplocompreendendo uma subsequência de uma seqüência como aquela apre-sentada em qualquer uma das reivindicações 1 a 10, onde opcionalmente oRNAi compreende um siRNA ou um miRNA, e opcionalmente a molécula deRNAi tem cerca de 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23,- 24, 25, 26 ou mais nucleotídeos dúplex de comprimento.
24. Método para inibir a tradução de uma mensagem de aldolaseem uma célula, ou inibir a expressão de uma aldolase em uma célula, com-preendendo administrar à célula ou expressar na célula um oligonucleotídeoanti-sentido como definido na reivindicação 22, ou uma molécula de RNAinibitória (RNAi) de cordão duplo como definida na reivindicação 23.
25. Polipeptídio ou peptídio isolado, sintético ou recombinantecom uma atividade de aldolase compreendendo(a) uma seqüência de aminoácidos tendo pelo menos 50%, 51%,- 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%,- 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%,- 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%,- 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais, ou 100% (com-pleta) de identidade de seqüência com a SEQ ID N°: 2, SEQ ID N°: 4, SEQID N°: 6, SEQ ID N0: 8, SEQ ID N°: 10, SEQ ID N°: 12, SEQ ID N°: 14, SEQID N°: 16, SEQ ID N°: 18, SEQ ID N°: 20, SEQ ID N°: 22, SEQ ID N°: 24,SEQ ID N°: 26, SEQ ID N°: 28, SEQ ID N°: 30, SEQ ID N°: 32, SEQ ID N°:- 34, SEQ ID N°: 36, SEQ ID N°: 38, SEQ ID N°: 40, SEQ ID N°: 42, SEQ IDN0: 44, SEQ ID N°: 46, SEQ ID N°: 48, SEQ ID N°: 50, SEQ ID N°: 52, SEQID N°: 54, SEQ ID N0: 56, SEQ ID N°: 58, SEQ ID N°: 60, SEQ ID N°: 62,SEQ ID N°: 64, SEQ ID N°: 66, SEQ ID N°: 68, SEQ ID N°: 70, SEQ ID N°:- 72, SEQ ID N°: 74, SEQ ID N°: 76, SEQ ID N°: 78, SEQ ID N°: 80, SEQ IDΝ°: 82, SEQ ID Ν°: 84, SEQ ID Ν°: 86, SEQ ID Ν°: 88, SEQ ID Ν°: 90, SEQID Ν°: 92, SEQ ID Ν°: 94, SEQ ID Ν°: 96, SEQ ID Ν°: 98, SEQ ID Ν°: 100,SEQ ID Ν°: 102, SEQ ID Ν°: 104, SEQ ID Ν°: 106, SEQ ID N0: 108, SEQ IDN0: 110, SEQ ID Ν°: 112, SEQ ID Ν°: 114, SEQ ID Ν°: 116, SEQ ID Ν°: 118,SEQ ID Ν°: 120, SEQ ID Ν°: 122, SEQ ID Ν°: 124, SEQ ID Ν°: 126, SEQ IDΝ°: 128, SEQ ID Ν°: 130, SEQ ID Ν°: 132, SEQ ID Ν°: 134, SEQ ID Ν°: 136,SEQ ID Ν°: 138, SEQ ID Ν°: 140, SEQ ID Ν°: 142, SEQ ID Ν°: 144, SEQ IDΝ°: 146, SEQ ID Ν°: 148, SEQ ID Ν°: 150, SEQ ID Ν°: 152, SEQ ID Ν°: 154,SEQ ID Ν°: 156, SEQ ID Ν°: 158, SEQ ID Ν°: 160, SEQ ID Ν°: 162, SEQ IDΝ°: 164, SEQ ID Ν°: 166, SEQ ID Ν°: 168, SEQ ID Ν°: 170, SEQ ID Ν°: 172,SEQ ID Ν°: 174, SEQ ID Ν°: 176, SEQ ID N0: 178, SEQ ID Ν°: 180, SEQ IDΝ°: 182, SEQ ID Ν°: 184, SEQ ID Ν°: 186, SEQ ID Ν°: 188, SEQ ID Ν°: 190,SEQ ID Ν°: 192, SEQ ID N0: 194, SEQ ID Ν°: 196, SEQ ID Ν°: 198, SEQ IDΝ°: 200, SEQ ID Ν°: 202, SEQ ID N0: 204, SEQ ID Ν°: 206, SEQ ID Ν°: 208,SEQ ID Ν°: 210, SEQ ID Ν°: 212, SEQ ID Ν°: 214, SEQ ID Ν°: 216, SEQ IDΝ°: 218, SEQ ID Ν°: 220, SEQ ID Ν°: 222, SEQ ID Ν°: 224, SEQ ID Ν°: 226,SEQ ID Ν°: 228, SEQ ID Ν°: 230, SEQ ID Ν°: 232, SEQ ID Ν°: 234, SEQ IDΝ°: 236, SEQ ID Ν°: 238, SEQ ID Ν°: 240, SEQ ID Ν°: 242, SEQ ID Ν°: 244,SEQ ID N0: 246, SEQ ID Ν°: 248, SEQ ID N0: 250, SEQ ID Ν°: 252, SEQ IDΝ°: 254, SEQ ID Ν°: 256, SEQ ID Ν°: 258, SEQ ID N0: 260, SEQ ID Ν°: 262,SEQ ID Ν°: 264, SEQ ID Ν°: 266, SEQ ID Ν°: 268, SEQ ID Ν°: 270, SEQ IDΝ°: 272, SEQ ID N0: 274, SEQ ID Ν°: 276, SEQ ID Ν°: 278, SEQ ID Ν°: 280,SEQ ID N0: 282, SEQ ID Ν°: 284, SEQ ID Ν°: 286, SEQ ID Ν°: 288, SEQ IDΝ°: 290, SEQ ID Ν°: 292, SEQ ID Ν°: 294, SEQ ID Ν°: 296, SEQ ID Ν°: 298,SEQ ID Ν°: 300, SEQ ID Ν°: 302, SEQ ID Ν°: 304, SEQ ID Ν°: 306, SEQ IDΝ°: 308, SEQ ID N0: 310, SEQ ID Ν°: 312, SEQ ID Ν°: 314, SEQ ID N0: 316,SEQ ID Ν°: 318, SEQ ID Ν°: 320, SEQ ID N0: 322, SEQ ID Ν°: 324, SEQ IDΝ°: 326, SEQ ID Ν°: 328, SEQ ID N0: 330, SEQ ID Ν°: 332, e/ou SEQ ID N°:-334, por uma região de pelo menos cerca de 20, 25, 30, 35, 40, 45, 50, 55,-60, 75, 100, 150, 200, 250, 300 ou mais resíduos, ou pelo comprimento totaldo polipeptídio ou enzima, e/ou subsequências (fragmentos) enzimaticamen-te ativas das mesmas.onde opcionalmente as identidades de seqüência são determi-nadas por análise com um algoritmo de comparação de seqüências ou porinspeção visual, e opcionalmente o algoritmo de comparação de seqüênciasé um algoritmo BLAST versão 2.2.2 onde uma configuração de filtragem éconfigurada em blastall -p blastp -d "nr pataa" -F F1 e todas as outras opçõessão configuradas em "default";(b) uma seqüência de aminoácidos codificada por um ácido nu-cléico como definido na reivindicação 1, onde o polipeptídio tem (i) uma ati-vidade de aldolase ou (ii) tem atividade imunogênica pelo fato de ser capazde gerar um anticorpo que se liga especialmente a um polipeptídio tendouma seqüência de (a), e/ou subsequências (fragmentos) enzimaticamenteativas do mesmo;(c) a seqüência de aminoácidos de (a) ou (b), ou um polipeptídiocodificado por um ácido nucléico como definida em qualquer uma das reivin-dicações 1 a 9, e compreendendo pelo menos uma substituição conservado-ra de resíduo de aminoácido, e o polipeptídio retém uma atividade de aldola-se,onde opcionalmente a substituição conservadora compreende asubstituição de um aminoácido alifático por um outro aminoácido alifático; asubstituição de uma serina por uma treonina ou vice-versa; a substituição deum resíduo ácido por um outro resíduo ácido; a substituição de um resíduocontendo um grupo amida por um outro resíduo contendo um grupo amida; atroca de um resíduo básico por um outro resíduo básico; ou, a substituiçãode um resíduo aromático por um outro resíduo aromático, ou uma combina-ção das mesmas,e opcionalmente o resíduo alifático compreende alanina, valina,leucina, isoleucina ou um equivalente sintético dos mesmos; o resíduo ácidocompreende ácido aspártico, ácido glutâmico ou um equivalente sintéticodos mesmos; o resíduo compreendendo um grupo amida compreende ácidoaspártico, ácido glutâmico ou um equivalente sintético dos mesmos; o resí-duo básico compreende lisina, arginina ou um equivalente sintético dos"mesmos; ou, o resíduo aromático compreende fenilalanina, tirosina ou umequivalente sintético dos mesmos(d) o polipeptídio de (a), (b), ou (c) com uma atividade de aldola-se porém faltando uma seqüência de sinal,(e) o polipeptídio de (a), (b), (c), ou (d) com uma atividade dealdolase compreendendo ainda uma seqüência heteróloga;(f) o polipeptídio de (e), onde a seqüência heteróloga compreen-de: (i) uma seqüência de sinal heteróloga; (ii) a seqüência de (ii), onde a se-qüência de sinal heteróloga deriva de uma enzima heteróloga; e/ou, (iii) umtraçador, um epítopo, um peptídio vetorizador, uma seqüência de clivagem,uma porção detectável ou uma enzima; ou(j) compreendendo uma seqüência de aminoácidos codificadapor um ácido nucléico como definido em qualquer uma das reivindicações 1a 9.
26. Polipeptídio isolado, sintético ou recombinante de acordocom a reivindicação 25, onde a atividade de aldolase compreende uma ativi-dade de piruvato aldolase.
27. Polipeptídio isolado, sintético ou recombinante de acordocom a reivindicação 25, onde a atividade de aldolase compreende uma ativi-dade de HMG aldolase.
28. Polipeptídio isolado, sintético ou recombinante de acordocom a reivindicação 25, onde a atividade de aldolase compreende uma ativi-dade de KHG aldolase.
29. Polipeptídio isolado, sintético ou recombinante de acordocom a reivindicação 25, onde (a) a atividade de aldolase é termoestável ou(b) o polipeptídio retém uma atividade de aldolase em condições compreen-dendo uma faixa de temperatura de cerca de -100°C a cerca de -80°C, cercade -80°C a cerca de -40°C, cerca de -40°C a cerca de -20°C, cerca de -20°Ca cerca de 0°C, cerca de 0°C a cerca de 37°C, cerca de 0°C a cerca de 5°C,cerca de 5°C a cerca de 15°C, cerca de 15°C a cerca de 25°C, cerca de-25°C a cerca de 37°C, cerca de 37°C a cerca de 45°C, cerca de 45°C a cer-ca de 55°C, cerca de 55°C a cerca de 70°C, cerca de 70°C a cerca de 75°C,cerca de 75°C a cerca de 85°C, cerca de 85°C a cerca de 90°C, cerca de-90°C a cerca de 95°C, cerca de 95°C a cerca de IOO0C1 cerca de 100°C acerca de 105°C, cerca de 105°C a cerca de 110°C, cerca de 110°C a cercade 120°C, ou 95°C, 96°C, 97°C, 98°C, 99°C, 100°C, 1010C1 102°C, 103°C,-104°C, 105°C, 106°C, 107°C, 108°C, 109°C, 110°C, 111 eC1 112°C, 113°C,-114°C, 115°C ou mais, eonde opcionalmente a atividade de aldolase compreende umaatividade específica de cerca de 1000 a cerca de 10.000 unidades por mili-grama de proteína, de cerca de 5000 a cerca de 7500 unidades por miligra-ma de proteína, de cerca de 10 a cerca de 7500 unidades por miligrama deproteína, de cerca de 5000 a cerca de 12.000 unidades por miligrama deproteína, de cerca de 10 a cerca de 5000 unidades por miligrama de proteí-na, de cerca de 7500 a cerca de 10.000 unidades por miligrama de proteína,de cerca de 10 a cerca de 2500 unidades por miligrama de proteína ou decerca de 10 a cerca de 1000 unidades por miligrama de proteína.
30. Polipeptídio isolado, sintético ou recombinante de acordocom a reivindicação 25, onde (a) a atividade de aldolase é termotolerante ou(b) o polipeptídio retém uma atividade de aldolase depois de exposição auma temperatura na faixa de cerca de -100°C a cerca de -80°C, cerca de --80°C a cerca de -40°C, cerca de -40°C a cerca de -20°C, cerca de -20°C acerca de 0°C, cerca de 0°C a cerca de 37°C, cerca de O0C a cerca de 5°C,cerca de 5°C a cerca de 15°C, cerca de 15°C a cerca de 25°C, cerca de-25°C a cerca de 37°C, cerca de 37°C a cerca de 45°C, cerca de 45°C a cer-ca de 55°C, cerca de 55°C a cerca de 70°C, cerca de 70°C a cerca de 75°C,cerca de 75°C a cerca de 85°C, cerca de 85°C a cerca de 90°C, cerca de-90°C a cerca de 95°C, cerca de 95°C a cerca de 100°C, cerca de 100°C acerca de 105°C, cerca de 105°C a cerca de 110°C, cerca de 1100C a cercade 120°C, ou 95°C, 96°C, 97°C, 98°C, 99°C, 100°C, 101 °C, 102°C, 103°C,-104°C, 105°C, 106°C, 107°C, 108°C, 109°C, 110oC, 111°C, 112°C, 113°C,-114°C, 115°C ou mais,onde opcionalmente a termotolerância compreende a retençãode pelo menos metade da atividade específica da aldolase depois de seraquecida até uma temperatura elevada, onde opcionalmente, a temperaturaelevada varia de cerca de O0C a cerca de 20°G, cerca de 20°C a cerca de37°C, cerca de 37°C a cerca de 50°C, cerca de 50°C a cerca de 70°C, cercade 70°C a cerca de 75°C, cerca de 75°C a cerca de 80°C, cerca de 80°C acerca de 85°C, cerca de 85°C a cerca de 90°C, cerca de 90°C a cerca de95°C, cerca de 95°C a cerca de 100°C, cerca de 100°C a cerca de 110°C,ou mais,e onde opcionalmente a atividade de aldolase compreende umaatividade específica de cerca de 1000 a cerca de 10.000 unidades por mili-grama de proteína, de cerca de 5000 a cerca de 7500 unidades por miligra-ma de proteína, de cerca de 10 a cerca de 7500 unidades por miligrama deproteína, de cerca de 5000 a cerca de 12.000 unidades por miligrama deproteína, de cerca de 10 a cerca de 5000 unidades por miligrama de proteí-na, de cerca de 7500 a cerca de 10.000 unidades por miligrama de proteína,de cerca de 10 a cerca de 2500 unidades por miligrama de proteína ou decerca de 10 a cerca de 1000 unidades por miligrama de proteína.
31. Polipeptídio isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 25 a 30, onde a atividade de aldolaseretém atividade em condições ácidas compreendendo cerca de pH 6,5, pH 6,pH 5,5, pH 5, pH 4,5, pH 4,0, pH 3,5, pH 3,0 ou menos (mais ácidas), ou,retém uma atividade de aldolase depois de exposição a condições ácidascompreendendo cerca de pH 6,5, pH 6, pH 5,5, pH 5, pH 4,5, pH 4,0, pH 3,5,pH 3,0 ou menos (mais ácidas)e onde opcionalmente a atividade de aldolase compreende umaatividade específica de cerca de 1000 a cerca de 10.000 unidades por mili-grama de proteína, de cerca de 5000 a cerca de 7500 unidades por miligra-ma de proteína, de cerca de 10 a cerca de 7500 unidades por miligrama deproteína, de cerca de 5000 a cerca de 12.000 unidades por miligrama deproteína, de cerca de 10 a cerca de 5000 unidades por miligrama de proteí-na, de cerca de 7500 a cerca de 10.000 unidades por miligrama de proteína,de cerca de 10 a cerca de 2500 unidades por miligrama de proteína ou decerca de 10 a cerca de 1000 unidades por miligrama de proteína.
32. Polipeptídio isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 25 a 30, onde a atividade de aldolaseretém atividade em condições básicas compreendendo cerca de pH 7,0, pH-7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11, pH 11,5, pH 12,0,pH 12,5 ou mais (mais básicas) ou, retém uma atividade de aldolase depoisde exposição a condições básicas compreendendo cerca de pH 7, pH 7,5 pH-8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11,0, pH 11,5, pH 12, pH 12,5ou mais (mais básicas),e onde opcionalmente a atividade de aldolase compreende umaatividade específica de cerca de 1000 a cerca de 10.000 unidades por mili-grama de proteína, de cerca de 5000 a cerca de 7500 unidades por miligra-ma de proteína, de cerca de 10 a cerca de 7500 unidades por miligrama deproteína, de cerca de 5000 a cerca de 12.000 unidades por miligrama deproteína, de cerca de 10 a cerca de 5000 unidades por miligrama de proteí-na, de cerca de 7500 a cerca de 10.000 unidades por miligrama de proteína,de cerca de 10 a cerca de 2500 unidades por miligrama de proteína ou decerca de 10 a cerca de 1000 unidades por miligrama de proteína.
33. Polipeptídio isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 25 a 32, onde o polipeptídio compre-ende pelo menos um sítio de glicosilação ou compreende ainda um polissa-carídeo, onde opcionalmente a glicosilação é uma glicosilação ligada a N, eopcionalmente o polipeptídio é glicosilado depois de ser expresso em um P.pastoris ou em um S. pombe.
34. Preparação de proteína compreendendo um polipeptídio co-mo definido em qualquer uma das reivindicações 25 a 33, onde a prepara-ção de proteína compreende um líquido, um sólido ou um gel.
35. Heterodímero compreendendo um polipeptídio de acordocom qualquer uma das reivindicações 25 a 33, e um segundo domínio, ondeopcionalmente o segundo domínio é um polipeptídio e o heterodímero é umaproteína de fusão, e opcionalmente o segundo domínio compreende um epí-topo, um peptídio imunogênico ou um traçador.
36. Homodímero compreendendo um polipeptídio como definidoem qualquer uma das reivindicações 25 a 32.
37. Polipeptídio imobilizado ou ácido nucléico imobilizado, ondeo polipeptídio compreende uma seqüência como aquela apresentada emqualquer uma das reivindicações 25 a 33, ou uma subsequência da mesma,ou o ácido nucléico compreende uma seqüência como aquela apresentadaem qualquer uma das reivindicações 1 a 9, ou uma subsequência da mes-ma, ou a sonda como definido na reivindicação 10, onde opcionalmente opolipeptídio ou ácido nucléico é imobilizado em uma célula, um metal, umaresina, um polímero, uma cerâmica, um vidro, um microeletrodo, uma partí-cula grafítica, uma conta, um gel, uma placa, um arranjo ou um tubo capilar.
38. Anticorpo isolado, sintético ou recombinante que se liga es-pecificamente a um polipeptídio como definida em qualquer uma das reivin-dicações 25 a 33, onde opcionalmente o anticorpo é um anticorpo monoclo-nal ou policlonal.
39. Arranjo compreendendo um polipeptídio imobilizado ou umácido nucléico imobilizado como definido na reivindicação 35 ou como defi-nido na reivindicação 36.
40. Hibridoma compreendendo um anticorpo como definido nareivindicação 36.
41. Método para isolar ou identificar um polipeptídio com umaatividade de aldolase compreendendo as etapas de:(a) fornecer um anticorpo de acordo com a reivindicação 36;(b) fornecer uma amostra compreendendo polipeptídios; e(c) contatar a amostra da etapa (b) com o anticorpo da etapa (a)em condições em que o anticorpo pode se ligar especificamente ao polipep-tídio, dessa forma isolando ou identificando um polipeptídio com uma ativi-dade de aldolase.
42. Método para produzir um anticorpo antialdolase compreendendo(a) administrar a um animal inumano um ácido nucléico comodefinido em qualquer uma das reivindicações 1 a 10, ou uma subsequênciada mesma em uma quantidade suficiente para gerar uma resposta imunehumoral, dessa forma produzindo um anticorpo antialdolase, ou(b) administrar a um animal não-humano um polipeptídio comodefinido em qualquer uma das reivindicações 25 a 33, ou uma subsequênciada mesma em uma quantidade suficiente para gerar uma resposta imunehumoral, dessa forma produzindo um anticorpo antialdolase.
43. Método para produzir um polipeptídio recombinante compre-endendo as etapas de: (a) fornecer um ácido nucléico operacionalmente li-gado a um promotor, onde o ácido nucléico compreende uma seqüênciacomo aquela apresentada em qualquer uma das reivindicações 1 a 9; e (b)expressar o ácido nucléico da etapa (a) em condições que permitem a ex-pressão do polipeptídio, dessa forma produzindo um polipeptídio recombinante,onde opcionalmente o método compreende ainda transformaruma célula hospedeira com o ácido nucléico da etapa (a) seguido de ex-pressar o ácido nucléico da etapa (a), dessa forma produzindo um polipeptí-dio recombinante em uma célula transformada.
44. Método para identificar um polipeptídio com uma atividadede aldolase compreendendo as seguintes etapas:(a) fornecer um polipeptídio como definido em qualquer uma dasreivindicações 25 a 33;(b) fornecer um substrato de aldolase; e(c) contatar o polipeptídio com o substrato da etapa (b) e detec-tar uma diminuição na quantidade de substrato ou um aumento na quantida-de de um produto reacional, onde uma diminuição na quantidade do substra-to ou um aumento na quantidade do produto reacional detecta um polipeptí-dio com uma atividade de aldolase.
45. Método para identificar um substrato de aldolase compreen-dendo as seguintes etapas:(a) fornecer um polipeptídio de acordo com qualquer uma dasreivindicações 25 a 33;(b) fornecer um substrato de teste; e(c) contatar o polipeptídio da etapa (a) com o substrato de testeda etapa (b) e detectar uma diminuição na quantidade de substrato ou umaumento na quantidade de um produto reacional, onde uma diminuição naquantidade do substrato ou um aumento na quantidade do produto reacionalidentifica o substrato de teste como um substrato de aldolase.
46. Método para determinar se um composto de teste se ligaespecificamente a um polipeptídio compreendendo as seguintes etapas:(a) expressar um ácido nucléico ou um vetor compreendendo oácido nucléico em condições permissivas para tradução do ácido nucléicoem um polipeptídio, onde o ácido nucléico tem uma seqüência como aquelaapresentada em qualquer uma das reivindicações 1 a 10;(b) fornecer um composto de teste;(c) contatar o polipeptídio com o composto de teste; e(d) determinar se o composto de teste da etapa (b) se liga espe-cificamente ao polipeptídio.
47. Método para determinar se um composto de teste se ligaespecificamente a um polipeptídio compreendendo as seguintes etapas:(a) fornecer um polipeptídio como definido em qualquer uma dasreivindicações 25 a 33;(b) fornecer um composto de teste;(c) contatar o polipeptídio com o composto de teste; e(d) determinar se o composto de teste da etapa (b) se liga espe-cificamente ao polipeptídio.
48. Método para identificar um modulador de uma atividade dealdolase compreendendo as seguintes etapas:(a) fornecer um polipeptídio como definido em qualquer uma dasreivindicações 25 a 33;(b) fornecer um composto de teste;(c) contatar o polipeptídio da etapa (a) com o composto de testeda etapa (b) e medir uma atividade da aldolase, onde uma variação na ativi-dade de aldolase medida na presença do composto de teste em relação àatividade na ausência do composto de teste fornece uma determinação deque o composto de teste modula a atividade de aldolase.
49. Método de acordo com a reivindicação 46, onde a atividadede aldolase é medida fornecendo-se um substrato de aldolase e detectando-se uma diminuição na quantidade do substrato ou um aumento na quantida-de de um produto reacional, ou, um aumento na quantidade do substrato ouuma diminuição na quantidade de um produto reacional,onde opcionalmente uma diminuição na quantidade do substratoou um aumento na quantidade do produto reacional com o composto de tes-te em relação à quantidade de substrato ou de produto reacional sem ocomposto de teste identifica o composto de teste como um ativador de umaatividade de aldolase,e opcionalmente um aumento na quantidade do substrato ouuma diminuição na quantidade do produto reacional com o composto de tes-te em relação à quantidade de substrato ou de produto reacional sem ocomposto de teste identifica o composto de teste como um inibidor de umaatividade de aldolase.
50. Sistema de computador compreendendo um processador eum dispositivo de armazenamento de dados onde o referido dispositivo dearmazenamento de dados contêm armazenada uma seqüência de polipeptí-dio ou uma seqüência de ácidos nucléicos, onde a seqüência de polipeptídiocompreende uma seqüência como definido em qualquer uma das reivindica-ções 25 a 33, um polipeptídio codificado por um ácido nucléico como defini-do em qualquer uma das reivindicações 1 a 9,onde opcionalmente o método compreende ainda um algoritmode comparação de seqüências e um dispositivo de armazenamento de da-dos tendo pelo menos uma seqüência de referência armazenada, ou com-preende ainda um identificador que identifica um ou mais aspectos na referi-da seqüênciae opcionalmente o algoritmo de comparação de seqüênciascompreende um programa de computador que indica polimorfismos.
51. Meio legível em computador tendo armazenada uma se-qüência de polipeptídio ou uma seqüência de ácidos nucléicos, onde a se-qüência de polipeptídio compreende um polipeptídio como definido em qual-quer uma das reivindicações 25 a 33, ou um polipeptídio codificado por umácido nucléico como definido em qualquer uma das reivindicações 1 a 9.
52. Método para identificar um aspecto em uma seqüência com-preendendo as etapas de: (a) ler a seqüência usando um programa de com-putador que identifica um ou mais aspectos em uma seqüência, onda se-qüência compreende uma seqüência de polipeptídio ou uma seqüência deácidos nucléicos, onde a seqüência de polipeptídio compreende um polipep-tídio como definido em qualquer uma das reivindicações 25 a 33; um poli-peptídio codificado por um ácido nucléico como definido em qualquer umadas reivindicações 1 a 9; e (b) identificar um ou mais aspectos na seqüênciacom o programa de computador.
53. Método para comparar uma primeira seqüência com umasegunda seqüência compreendendo as etapas de: (a) ler a primeira seqüên-cia e a segunda seqüência através do uso de um programa de computadorque compara seqüências, onde a primeira seqüência compreende uma se-qüência de polipeptídio ou uma seqüência de ácidos nucléicos, onde a se-qüência de polipeptídio compreende um polipeptídio como definido em qual-quer uma das reivindicações 25 a 33 ou um polipeptídio codificado por umácido nucléico como definido em qualquer uma das reivindicações 1 a 9; e(b) determinar diferenças entre a primeira seqüência e a segunda seqüênciano programa de computador.onde opcionalmente o método compreende ainda uma etapa dedeterminação das diferenças entre a primeira seqüência e a segunda se-qüência, ou opcionalmente o método compreende ainda a etapa de identifi-cação de polimorfismos, ou opcionalmente o método compreende ainda ouso de um identificador que identifica um ou mais aspectos em uma seqüên-cia,e opcionalmente o método compreende ler a primeira seqüênciausando um programa de computador e identificar um ou mais aspectos naseqüência.
54. Método para isolar ou recuperar um ácido nucléico codifi-cando um polipeptídio com uma atividade de aldolase de uma amostra am-biental compreendendo as etapas de:(a) fornecer um par de iniciadores de amplificação como definidona reivindicação 11;(b) isolar um ácido nucléico da amostra ambiental ou tratar aamostra ambiental para que o ácido nucléico na amostra fique acessível pa-ra hibridização para o par de iniciadores de amplificação; e,(c) combinar o ácido nucléico da etapa (b) com o par de iniciado-res de amplificação da etapa (a) e amplificar o ácido nucléico da amostraambiental, dessa forma isolando ou recuperando um ácido nucléico codifi-cando um polipeptídio com uma atividade de aldolase de uma amostra am-biental,onde opcionalmente, a amostra ambiental compreende uma a-mostra de água, uma amostra de líquido, uma amostra de solo, uma amostrade ar ou uma amostra biológica, e opcionalmente a amostra biológica derivade uma célula de bactéria, uma célula de protozoário, uma célula de inseto,uma célula de levedura, uma célula de planta, uma célula de fungo ou umacélula de mamífero.
55. Método para isolar ou recuperar um ácido nucléico codifi-cando um polipeptídio com uma atividade de aldolase de uma amostra am-biental compreendendo as etapas de:(a) fornecer uma sonda de polinucleotídeo compreendendo umaseqüência como aquela apresentada na reivindicação 1, ou uma subse-quência da mesma, ou uma sonda como definido na reivindicação 10;(b) isolar um ácido nucléico da amostra ambiental ou tratar aamostra ambiental para que o ácido nucléico na amostra fique acessível pa-ra hibridização para uma sonda de polinucleotídeo da etapa (a);(c) combinar o ácido nucléico isolado ou a amostra ambientaltratada da etapa (b) com a sonda de polinucleotídeo da etapa (a); e(d) isolar um ácido nucléico que hibridiza especificamente com asonda de polinucleotídeo da etapa (a), dessa forma isolando ou recuperandoum ácido nucléico codificando um polipeptídio com uma atividade de aldola-se de uma amostra ambiental,onde opcionalmente, a amostra ambiental compreende uma a-mostra de água, uma amostra de líquido, uma amostra de solo, uma amostrade ar ou uma amostra biológica, e opcionalmente a amostra biológica derivade uma célula de bactéria, uma célula de protozoário, uma célula de inseto,uma célula de levedura, uma célula de planta, uma célula de fungo ou umacélula de mamífero.
56. Método para gerar uma variante de um ácido nucléico codifi-cando um polipeptídio com uma atividade de aldolase compreendendo asetapas de:(a) fornecer um ácido nucléico gabarito compreendendo umaseqüência como aquela apresentada em qualquer uma das reivindicações 1a 9; e(b) modificar, deletar ou adicionar um ou mais nucleotídeos naseqüência gabarito, ou uma combinação dos mesmos, para gerar uma vari-ante do ácido nucléico gabaritoonde opcionalmente o método compreende ainda expressar oácido nucléico variante para gerar um polipeptídio de aldolase variante,e opcionalmente as modificações, adições ou deleções são in-troduzidas por um método compreendendo PCR propensa a erro, embara-Ihamento, mutagênese direcionada para oligonucleotídeo, PCR de reunião,mutagênese por PCR sexuada, mutagênese in vivo, mutagênese de casse-te, mutagênese de conjunto recursivo, mutagênese de conjunto exponencial,mutagênese específica para o sítio, remontagem de genes, mutagênese porsaturação do sítio gênico (GSSM), remontagem por ligação sintética (SLR),recombinação, recombinação de seqüências recursivas, mutagênese deDNA modificado com fosfotioato, mutagênese de gabarito contendo uracil,mutagênese dê dúplex fendido, mutagênese de reparo de incompatibilidadede pontos, mutagênese de cepa hospedeira deficiente em reparo, mutagê-nese química, mutagênese radiogênica, mutagênese por deleção, mutagê-nese por restrição-seleção, mutagênese por restrição-purificação, síntese degene artificial, mutagênese de conjunto, criação de multímero de ácido nu-cléico quimérico e uma combinação das mesmase opcionalmente o método é iterativamente repetido até que sejaproduzida uma aldolase tendo uma atividade alterada ou diferente ou umaestabilidade alterada ou diferente daquela de um polipeptídio codificado peloácido nucléico gabarito.
57. Método de acordo com a reivindicação 54, onde o polipeptí-dio de aldolase variante: (a) é termotolerante, e retém um pouco de atividadedepois de ser exposto a uma temperatura elevada; (b) tem maior glicosilaçãoem relação à aldolase codificada por um ácido nucléico gabarito; ou, (c) temuma atividade de aldolase a uma temperatura elevada, onde a aldolase codi-ficada pelo ácido nucléico gabarito é menos ativo à alta temperatura.
58. Método de acordo com a reivindicação 54, onde o método éiterativamente repetido até que (a) seja produzida uma seqüência codificado-ra de aldolase tendo um uso de códon alterado em relação àquele do ácidonucléico gabarito, ou, (b) seja produzido um gene de aldolase tendo um nívelmais alto ou mais baixo de expressão de mensagem ou de estabilidade emrelação àquele do ácido nucléico gabarito.
59. Método para modificar códons em um ácido nucléico codifi-cando um polipeptídio de aldolase, o método compreendendo as seguintesetapas:(a) fornecer um ácido nucléico codificando um polipeptídio comuma atividade de aldolase compreendendo uma seqüência como aquela a-presentada em qualquer uma das reivindicações 1 a 9; e,(b) identificar um códon no ácido nucléico da etapa (a) e substi-tui-lo por um códon diferente codificando o mesmo aminoácido que o códonsubstituído, dessa forma modificando códons em um ácido nucléico codifi-cando uma aldolase.
60. Método para modificar códons em um ácido nucléico codifi-cando um polipeptídio com atividade de aldolase para aumentar sua expres-são em uma célula hospedeira, o método compreendendo as seguintes eta-pas:(a) fornecer um ácido nucléico codificando um polipeptídio dealdolase compreendendo uma seqüência como definido em qualquer umadas reivindicações 1 a 9; e,(b) identificar um códon não preferido ou menos preferido no á*cido nucléico da etapa (a) e substituí-lo por um códon preferido ou usado deforma neutra codificando o mesmo aminoácido que o códon substituído, on-de um códon preferido é um códon supra-representado nas seqüências codi-ficadoras nos genes na célula hospedeira e um códon não preferido ou me-nos preferido é um códon infra-representado nas seqüências codificadorasnos genes na célula hospedeira, dessa forma modificando o ácido nucléicopara aumentar sua expressão em uma célula hospedeira,onde opcionalmente a célula hospedeira é uma célula de bacté-ria, uma célula de fungo, uma célula de inseto, uma célula de levedura, umacélula de planta ou uma célula de mamífero.
61. Método para modificar um códon em um ácido nucléico codi-ficando um polipeptídio com uma atividade de aldofase para diminuir suaexpressão em uma célula hospedeira, o método compreendendo as seguin-tes etapas:(a) fornecer um ácido nucléico codificando um polipeptídio dealdolase compreendendo uma seqüência como definido em qualquer umadas reivindicações 1 a 9; e(b) identificar pelo menos um códon preferido no ácido nucléicoda etapa (a) e substituí-lo por um códon não preferido ou menos preferidocodificando o mesmo aminoácido que o códon substituído, onde um códonpreferido é um códon supra-representado nas seqüências codificadoras nosgenes na célula hospedeira e um códon não preferido ou menos preferido éum códon infra-representado nas seqüências codificadoras nos genes nacélula hospedeira, dessa forma modificando o ácido nucléico para reduzirsua expressão em uma célula hospedeira,onde opcionalmente a célula hospedeira é uma célula de bacté-ria, uma célula de fungo, uma célula de inseto, uma célula de levedura, umacélula de planta ou uma célula de mamífero.
62. Método para produzir uma biblioteca de ácidos nucléicos co-dificando uma pluralidade de sítios ativos modificados de aldolase ou de sí-tios fixadores de substrato, onde os sítios ativos modificados ou os sítiosfixadores de substrato derivam de um primeiro ácido nucléico compreenden-do uma seqüência codificando um primeiro sítio ativo ou um primeiro sítiofixador de substrato, o método compreendendo as seguintes etapas:(a) fornecer um primeiro ácido nucléico codificando um primeirosítio ativo ou um primeiro sítio fixador de substrato, onde a seqüência doprimeiro ácido nucléico compreende uma seqüência que hibridiza em condi-ções rigorosas para uma seqüência como definido em qualquer uma dasreivindicações 1 a 9, ou uma subsequência da mesma, e o ácido nucléicocodifica um sítio ativo de aldolase ou um sítio fixador de substrato de aldolase;(b) fornecer um conjunto de oligonucleotídeos mutagênicos quecodificam variantes de aminoácidos naturais em uma pluralidade de códonsvetorizados no primeiro ácido nucléico; e,(c) usar o conjunto de oligonucleotídeos mutagênicos para gerarum conjunto de ácidos nucléicos variantes codificadores de sítio ativo oucodificadores de sítio fixador de substrato codificando uma gama de varia-ções de aminoácidos em cada códon de aminoácido que foi mutagenizado,dessa forma produzindo uma biblioteca de ácidos nucléicos codificando umapluralidade de sítios ativos modificados de aldolase ou de sítios fixadores desubstrato.onde opcionalmente um oligonucleotídeo mutagênico ou um áci-do nucléico variante é gerado por um método compreendendo um sistemade evolução direcionado e otimizado, mutagênese por saturação do sítio gê-nico (GSSM), ou uma remontagem por ligação sintética (SLR), PCR propen-sa a erro, embaralhamento, mutagênese direcionada para oligonucleotídeo,PCR de reunião, mutagênese por PCR sexuada, mutagênese in vivo, muta-gênese de cassete, mutagênese de conjunto recursivo, mutagênese de con-junto exponencial, mutagênese específica para o sítio, remontagem de ge-nes, recombinação, recombinação de seqüências recursivas, mutagênesede DNA modificado com fosfotioato, mutagênese de gabarito contendo ura-cil, mutagênese de dúplex fendido, mutagênese de reparo de incompatibili-dade de pontos, mutagênese de cepa hospedeira deficiente em reparo, mu-tagênese química, mutagênese radiogênica, mutagênese por deleção, mu·tagênese por restrição-seleção, mutagênese por restrição-purificação, sínte-se de gene artificial, mutagênese de conjunto, criação de multímero de ácidonucléico quimérico e uma combinação das mesmas.
63. Método para produzir uma molécula pequena compreenden-do as seguintes etapas:(a) fornecer uma pluralidade de enzimas biossintéticas capazesde sintetizar ou modificar uma molécula pequena, onde uma das enzimascompreende uma enzima aldolase codificada por um ácido nucléico compre-endendo uma seqüência de acordo com qualquer uma das reivindicações 1 a 9;(b) fornecer um substrato para pelo menos uma das enzimas daetapa (a); e(c) reagir o substrato da etapa (b) com as enzimas em condiçõesque facilitam uma pluralidade de reações biocatalíticas para gerar uma mo-lécula pequena por uma série de reações biocatalíticas.
64. Método para modificar uma molécula pequena compreen-dendo as seguintes etapas:(a) fornecer uma enzima aldolase, onde a enzima compreendeum polipeptídio como definido na reivindicação 28, ou um polipeptídio codifi-cado por um ácido nucléico compreendendo uma seqüência de ácidos nu-cléicos como definido em qualquer uma das reivindicações 1 a 9;(b) fornecer uma molécula pequena; e(c) reagir a enzima da etapa (a) com a molécula pequena da e-tapa (b) em condições que facilitam uma reação enzimática catalisada pelaenzima aldolase, dessa forma modificando uma molécula pequena por umareação enzimática com aldolase.onde opcionalmente a etapa (b) compreende fornecer uma plu-ralidade de substratos de molécula pequena para a enzima da etapa (a),dessa forma gerando uma biblioteca de moléculas pequenas modificadasproduzidas por pelo menos uma reação enzimática catalisada pela enzimaaldolase;e opcionalmente o método compreende ainda fornecer uma plu-ralidade de enzimas adicionais em condições que facilitam uma pluralidadede reações biocatalíticas pelas enzimas para formar uma biblioteca de molé-culas pequenas modificadas produzidas pela pluralidade de reações enzimáticas;e opcionalmente o método compreende ainda a etapa de testara biblioteca para determinar se uma molécula pequena particular que apre-senta uma atividade desejada está presente na biblioteca, onde opcional-mente a etapa de testar a biblioteca compreende ainda as etapas de eliminarsistematicamente todas exceto uma das reações biocatalíticas usadas paraproduzir uma porção da pluralidade das moléculas pequenas modificadas nabiblioteca testando a porção da molécula pequena modificada quanto à pre-sença ou ausência da molécula pequena modificada particular com uma ati-vidade desejada, e identificar pelo menos uma reação biocatalítica específi-ca que produza a molécula pequena modificada particular de atividade desejada.
65. Método para determinar um fragmento funcional de uma en-zima aldolase compreendendo as etapas de:(a) fornecer uma enzima aldolase, onde a enzima compreendeum polipeptídio como definido em qualquer uma das reivindicações 25 a 33,ou um polipeptídio codificado por um ácido nucléico como definido em qual-quer uma das reivindicações 1 a 9; e(b) deletar uma pluralidade de resíduos de aminoácido da se-qüência da etapa (a) e testar a subsequência remanescente quanto a umaatividade de aldolase, dessa forma determinando um fragmento funcional deuma enzima aldolase.onde opcionalmente a atividade de aldolase é medida fornecen-do-se um substrato aldolase e detectando-se uma diminuição na quantidadedo substrato ou um aumento na quantidade de um produto reacional.
66. Método para construir uma célula total de novos fenótipos oude fenótipos modificados usando análise de fluxo metabólico em tempo real,o método compreendendo as seguintes etapas:(a) produzir uma célula modificada modificando a composiçãogenética de uma célula, onde a composição genética é modificada pela adi-ção de um ácido nucléico compreendendo uma seqüência como definido emqualquer uma das reivindicações 1 a 9;(b) cultivar a célula modificada para gerar uma pluralidade decélulas modificadas;(c) medir pelo menos um parâmetro metabólico da célula monito-rando a cultura de células da etapa (b) em tempo real; e,(d) analisar os dados da etapa (c) para determinar se o parâme-tro medido diferente de uma medida equiparável em uma célula não modifi-cada em condições semelhantes, dessa forma identificando um fenótipoconstruído na célula usando análise de fluxo metabólico em tempo real.onde opcionalmente a composição genética da célula é modifi-cada por um método compreendendo deleção de uma seqüência ou modifi-cação de uma seqüência na célula, ou, eliminando a expressão de um gene,e opcionalmente o método compreende ainda selecionar umacélula compreendendo um fenótipo recém-construído,e opcionalmente o método compreende ainda cultivar a célulaselecionada, dessa forma gerando uma nova cepa de célula compreendendoum fenótipo recém-construído.
67. Sinal ou seqüência líder isolada, sintética ou recombinanteconsistindo em uma seqüência de aminoácidos como a apresentada nosresíduos amino-terminais 1 a 14, 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a-20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a-30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 40, 1 a-41, 1 a 42, 1 a 43 ou 1 a 44, de (a) uma seqüência de aminoácidos comodefinido em qualquer uma das reivindicações 25 a 33.
68. Polipeptídio quimérico compreendendo pelo menos um pri-meiro domínio compreendendo um peptídio de sinal (SP) ou seqüência lídertendo uma seqüência de aminoácidos como definido na reivindicação 66, epelo menos um segundo domínio compreendendo um polipeptídio ou peptí-dio heterólogo, onde o polipeptídio ou peptídio heterólogo não é naturalmen-te associado ao peptídio de sinal (SP) ou à seqüência líder,e opcionalmente o polipeptídio ou peptídio heterólogo não é umaaldolase, e opcionalmente o polipeptídio ou peptídio heterólogo é amino-terminal, carbóxi-terminal para ou em ambas as extremidades do peptídio desinal (SP) ou da seqüência líder.
69. Ácido nucléico isolado, sintético ou recombinante codificandoum polipeptídio quimérico, onde o polipeptídio quimérico compreende pelomenos um primeiro domínio compreendendo um peptídio de sinal (SP) ouseqüência líder com uma seqüência de aminoácidos de acordo com a reivin-dicação 66 e pelo menos um segundo domínio compreendendo um polipep-tídio ou peptídio heterólogo, onde o polipeptídio ou peptídio heterólogo não énaturalmente associado ao peptídio de sinal (SP) ou à seqüência líder.
70. Método para aumentar a termotolerância ou termoestabilida-de de um polipeptídio de aldolase, o método compreendendo glicosilar umaaldolase, onde o polipeptídio compreende pelo menos trinta aminoácidoscontíguos de um polipeptídio como definido em qualquer uma das reivindica-ções 25 a 33, ou um polipeptídio codificado por um ácido nucléico como de-finido em qualquer uma das reivindicações 1 a 9, dessa forma aumentando atermotolerância ou termoestabilidade da aldolase.
71. Método para superexpressar uma aldolase recombinante emuma célula compreendendo expressar um vetor compreendendo uma se-qüência de ácidos nucléicos como definido em qualquer uma das reivindica-ções 1 a 9, ou um ácido nucléico codificando um polipeptídio como definidoem qualquer uma das reivindicações 25 a 33, onde a superexpressão é efe-tuada pelo uso de um promotor de alta atividade, um vetor dicistrônico oupor amplificação genética do vetor.
72. Método para produzir uma planta transgênica compreenden-do as seguintes etapas:(a) introduzir uma seqüência de ácidos nucléicos heteróloga nacélula, onde a seqüência nucléica heteróloga compreende uma seqüênciacomo definido em qualquer uma das reivindicações 1 a 9, ou um ácido nu-cléico codificando um polipeptídio como definido em qualquer uma das rei-vindicações 25 a 33, dessa forma produzindo uma célula de planta transfor-mada;(b) produzir uma planta transgênica a partir da célula transfor-mada.onde opcionalmente a etapa (a) compreende ainda introduzir aseqüência de ácidos nucléicos heteróloga por eletroporação ou microinjeçãode protoplastos de célula de planta,e opcionalmente a etapa (a) compreende introduzir a seqüênciade ácidos nucléicos heteróloga diretamente no tecido da planta por bombar-deamento de partículas de DNA ou usando um Agrobacterium tumefacienshospedeiro.
73. Método para expressar uma seqüência de ácidos nucléicosheteróloga em uma célula de planta compreendendo as seguintes etapas:(a) transformar a célula de planta com uma seqüência de ácidosnucléicos heteróloga operacionalmente ligada a um promotor, onde a se-qüência nucléica heteróloga compreende uma seqüência como definido emqualquer uma das reivindicações 1 a 9, ou um ácido nucléico codificando umpolipeptídio como definido em qualquer uma das reivindicações 25 a 33;(b) cultivar a planta em condições em que a seqüência de ácidosnucléicos heteróloga é expressa na célula da planta.
74. Método para clivar uma ligação carbono-carbono em umacomposição compreendendo as seguintes etapas:(a) fornecer um polipeptídio com uma atividade de aldolase co-mo definido em qualquer uma das reivindicações 25 a 33, ou um polipeptídiocodificado por um ácido nucléico como definido em qualquer uma das reivin-dicações 1 a 9;(b) fornecer uma composição compreendendo uma ligação car-bono-carbono; e(c) contatar o polipeptídio da etapa (a) com a composição daetapa (b) em condições em que a aldolase cliva a ligação carbono-carbonona composição.onde opcionalmente o polipeptídio tem atividade de piruvato al-dolase, HMG aldolase e/ou KHG aldolase.
75. Método para formar uma ligação carbono-carbono compre-endendo as seguintes etapas:(a) fornecer um polipeptídio com uma atividade de aldolase co-mo definido em qualquer uma das reivindicações 25 a 33, ou um polipeptídiocodificado por um ácido nucléico como definido em qualquer uma das reivin-dicações 1 a 9;(b) fornecer um composto doador e um composto receptor; e(c) contatar o polipeptídio da etapa (a) com os compostos daetapa (b) em condições em que a aldolase forma a ligação carbono-carbono.onde opcionalmente o polipeptídio tem atividade de piruvato al-dolase, HMG aldolase e/ou KHG aldolase.
76. Massa de pão ou pão compreendendo um polipeptídio comodefinido em qualquer uma das reivindicações 25 a 33, ou um polipeptídiocodificado por um ácido nucléico como definido em qualquer uma das reivin-dicações 1 a 9, onde opcionalmente o polipeptídio tem atividade de aldolase,por exemplo, atividade de piruvato aldolase, por exemplo, atividade de HMGe/ou KHG aldolase.
77. Método para tratamento de massa de pão compreendendocontatar uma massa de pão ou um pão com pelo menos um polipeptídio co-mo definido em qualquer uma das reivindicações 25 a 33, ou um polipeptídiocodificado por um ácido nucléico como definido em qualquer uma das reivin-dicações 1 a 9, em condições suficientes para tratar a massa de pão.
78. Bebida compreendendo um polipeptídio como definido emqualquer uma das reivindicações 25 a 33, ou um polipeptídio codificado porum ácido nucléico como definido em qualquer uma das reivindicações 1 a 9,onde opcionalmente o polipeptídio tem atividade de piruvato aldolase, HMGaldolase e/ou KHG aldolase.
79. Método para produzir bebidas compreendendo a administra-ção de pelo menos um polipeptídio como definido em qualquer uma das rei-vindicações 25 a 33, ou um polipeptídio codificado por um ácido nucléicocomo definido em qualquer uma das reivindicações 1 a 9, a uma bebida ou aum precursor de bebida em condições suficientes para diminuir a viscosida-de da bebida, onde opcionalmente a bebida ou o precursor de bebida é umaerva ou uma cerveja.
80. Aditivo alimentício, aditivo alimentar, aditivo de bebida ou umsuplemento nutricional compreendendo um polipeptídio como definido emqualquer uma das reivindicações 25 a 33, ou um polipeptídio codificado porum ácido nucléico como definido em qualquer uma das reivindicações 1 a 9,onde opcionalmente o polipeptídio tem atividade de aldolase, por exemplo,piruvato aldolase, por exemplo, HMG e/ou KHG aldolase.
81. Método para utilizar uma aldolase como um suplemento nu-tricional em uma dieta animal, o método compreendendo:preparar um suplemento nutricional contendo uma enzima aldo-lase compreendendo pelo menos trinta aminoácidos contíguos de um poli-peptídio como definido em qualquer uma das reivindicações 25 a 33, ou umpolipeptídio codificado por um ácido nucléico como definido em qualqueruma das reivindicações 1 a 9; eadministrar o suplemento nutricional a um animal,onde opcionalmente o animal é um ser humano, ou o animal éum ruminante ou um animal monogástrico,e opcionalmente a enzima aldolase é preparada por expressãode um polinucleotídeo codificando a aldolase em um organismo selecionadodo grupo que consiste em uma bactéria, uma levedura, uma planta, um inse-to, um fungo e um animal, e opcionalmente o organismo é selecionado dogrupo que consiste em uma S. pombe, S. cerevisiae, Pichia pastoris, E. coli,Streptomyces sp., Bacilius sp. e Lactobacillus sp.
82. Matriz de distribuição ou péletes de enzima comestível com-preendendo uma enzima aldolase recombinante termoestável compreen-dendo um polipeptídio como definido em qualquer uma das reivindicações- 25 a 33, ou um polipeptídio codificado por um ácido nucléico como definidoem qualquer uma das reivindicações 1 a 9, onde opcionalmente o polipeptí-dio tem atividade de aldolase, por exemplo, atividade de piruvato aldolase,por exemplo, atividade de HMG e/ou KHG aldolase.
83. Método para distribuir um suplemento de aldoiase para umanimal, o método compreendendo: preparar uma matriz de distribuição oupéletes de enzima comestível compreendendo um veículo comestível granu-Iado e uma enzima aldoiase recombinante termoestável, onde as péletesdispersam facilmente a enzima aldoiase ali contida no meio aquoso, e a en-zima aldoiase recombinante compreende um polipeptídio como definido emqualquer uma das reivindicações 25 a 33, ou um polipeptídio codificado porum ácido nucléico como definido em qualquer uma das reivindicações 1 a 9;e, administrar a matriz de distribuição ou pélete de enzima comestível aoanimal.onde opcionalmente o veículo comestível granulado compreendeum veículo selecionado do grupo que consiste em germe de grão, germe degrão que é exaurido de óleo, feno, alfafa, capim-rabo-de-gato, casca de soja,farinha de semente de girassol e "midd" de trigo,e opcionalmente o veículo comestível compreende germe degrão que é exaurido de óleo,e opcionalmente a enzima aldoiase é glicosilada para proporcio-nar termoestabilidade nas condições de pelotização,e opcionalmente a matriz de distribuição é formada por pelotiza-ção de uma mistura compreendendo um germe de grão e uma aldoiase,e opcionalmente as condições de pelotização incluem aplicaçãode vapor, e opcionalmente as condições de pelotização compreendem apli-cação de uma temperatura superior a cerca de 80°C por cerca de 5 minutose a enzima retém uma atividade específica de pelo menos 350 a cerca de-900 unidades por miligrama de enzima.
84. Composição farmacêutica ou suplemento dietético compre-endendo uma aldoiase como definido em qualquer uma das reivindicações-25 a 33, ou um polipeptídio codificado por um ácido nucléico como definidoem qualquer uma das reivindicações 1 a 9,onde opcionalmente a aldoiase é formulada na forma de umcomprimido, gel, pílula, implante, líquido, spray, pó, gênero alimentício, péle-te de ração ou como uma formulação encapsuladae opcionalmente a atividade de aldoiase compreende atividadede piruvato aldoiase, HMG aldoiase e/ou KHG aldoiase.
85. Gênero alimentício ou ração compreendendo um polipeptídiocomo definido em qualquer uma das reivindicações 25 a 33, ou um polipep-tídio codificado por um ácido nucléico como definido em qualquer uma dasreivindicações 1 a 9, onde opcionalmente o polipeptídio tem atividade com-preendendo atividade de aldoiase, por exemplo, atividade de piruvato aldo-iase, por exemplo, atividade de HMG e/ou KHG aldoiase.
86. Método para fazer um gênero alimentício ou ração compre-endendo contatar uma composição compreendendo um composto contendouma ligação carbono-carbono com um polipeptídio como definido em qual-quer uma das reivindicações 25 a 33, ou um polipeptídio codificado por umácido nucléico como definido em qualquer uma das reivindicações 1 a 9,onde opcionalmente o polipeptídio tem atividade compreenden-do atividade de aldoiase, por exemplo, atividade de piruvato aldoiase, porexemplo, atividade de HMG e/ou KHG aldoiase.
87. Método para produzir um ácido D-glutâmico 4-substituídocompreendendo as seguintes etapas:(a) fornecer um polipeptídio com uma atividade de aldoiase co-mo definido em qualquer uma das reivindicações 25 a 33, ou um polipeptídiocodificado por um ácido nucléico como definido em qualquer uma das reivin-dicações 1 a 9;(b) fornecer um receptor de α-ceto ácido e um piruvato ou umdoador de piruvato; e(c) contatar o polipeptídio da etapa (a) com os compostos daetapa (b) em condições onde a aldoiase catalisa a síntese de um ácido D-glutâmico 4-substituído,onde opcionalmente o polipeptídio tem atividade de piruvato al-doiase, HMG aldoiase e/ou KHG aldoiase eonde opcionalmente o método compreende ainda o uso de umaD-am inotransfe rase.
88. Uso do ácido D-glutâmico 4-substituído como definido nareivindicação 87, como antibiótico.
89. Método para produzir um 2-ceto-gIutarato 3,4-substituídocompreendendo as seguintes etapas:(a) fornecer um polipeptídio com uma atividade de aldolase co-mo definido em qualquer uma das reivindicações 25 a 33, ou um polipeptídiocodificado por um ácido nucléico como definido em qualquer uma das reivin-dicações 1 a 9;(b) fornecer um composto doador e um composto receptor; e(c) contatar o polipeptídio da etapa (a) com os compostos daetapa (b) em condições em que a aldolase catalisa a síntese de um 2-ceto-glutarato 3,4-substituído,onde opcionalmente o polipeptídio tem atividade de piruvato al-dolase, HMG aldolase e/ou KHG aldolase eonde opcionalmente o doador e o receptor são um piruvato ouum doador de piruvato e um receptor de α-ceto ácido, uma cetona e/ou umaldeído.
90. Método para converter uma biomassa ou qualquer materiallignocelulósico em um combustível compreendendo contatar a biomassa oumaterial lignocelulósico com um polipeptídio com uma atividade de aldolase,onde o polipeptídio tem uma seqüência como aquela apresentada em qual-quer uma das reivindicações 25 a 33, ou o polipeptídio é codificado por umácido nucléico compreendendo uma seqüência como aquela apresentadaem qualquer uma das reivindicações 1 a 9, ou um fragmento enzimaticamen-te ativo da mesma,onde opcionalmente a biomassa ou o material lignocelulósicofora pré-tratado antes do contato com a aldolaseonde opcionalmente a biomassa ou o material lignocelulósicofora contatado com uma enzima degradadora de celulose e/ou hemiceluloseantes do contato com a aldolase eonde opcionalmente o combustível é etanol, metanol, propanol,butanol e/ou diesel.
91. Uso de um polipeptídio com uma atividade de aldolase, ondeo polipeptídio tem uma seqüência como aquela apresentada em qualqueruma das reivindicações 25 a 33, ou o polipeptídio é codificado por um ácidonucléico compreendendo uma seqüência como aquela apresentada emqualquer uma das reivindicações 1 a 9, ou um fragmento enzimaticamenteativo do mesmo, para converter a biomassa ou qualquer material Iignocelu-lósico em um combustível,onde opcionalmente a biomassa ou o material lignocelulósicofora pré-tratado antes do contato com a aldolaseonde opcionalmente a biomassa ou o material lignocelulósicofora contato com uma enzima degradadora de celulose e/ou hemiceluloseantes do contato com a aldolase eonde opcionalmente o combustível é etanol, metanol, propanol,butanol e/ou diesel.
92. Composição compreendendo um combustível e um polipep-tídio com uma atividade de aldolase, onde o polipeptídio tem uma seqüênciacomo aquela apresentada em qualquer uma das reivindicações 25 a 33, ou opolipeptídio é codificado por um ácido nucléico compreendendo uma se-qüência como aquela apresentada em qualquer uma das reivindicações 1 a-9, ou um fragmento enzimaticamente ativo do mesmo, onde opcionalmente ocombustível é etanol, metanol, propanol, butanol e/ou diesel.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
BR122017003017-5A BR122017003017B1 (pt) | 2006-03-07 | 2007-03-07 | Ácido nucléico, cassete de expressão, vetor, veículo de clonagem, microrganismotransgênico, polipeptídeo, peptídeo sinal, composição, e métodos para produzir um polipeptídeo recombinante, para gerar uma variante de um ácido nucléico, para clivar uma ligação carbono-carbono em uma composição, para formar uma ligação carbono-carbono,para fazer um gênero alimentício, uma ração ou bebida, e para converter uma biomassa ouqualquer material lignocelulósico em um combustível |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US78051506P | 2006-03-07 | 2006-03-07 | |
US60/780,515 | 2006-03-07 | ||
PCT/US2007/063515 WO2007103989A2 (en) | 2006-03-07 | 2007-03-07 | Aldolases, nucleic acids encoding them and methods for making and using them |
Publications (1)
Publication Number | Publication Date |
---|---|
BRPI0708614A2 true BRPI0708614A2 (pt) | 2011-06-07 |
Family
ID=38475839
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0708614-8A BRPI0708614A2 (pt) | 2006-03-07 | 2007-03-07 | aldolases, ácidos nucléicos codificando as mesmas e métodos para produzir e usar as mesmas |
BR122017003017-5A BR122017003017B1 (pt) | 2006-03-07 | 2007-03-07 | Ácido nucléico, cassete de expressão, vetor, veículo de clonagem, microrganismotransgênico, polipeptídeo, peptídeo sinal, composição, e métodos para produzir um polipeptídeo recombinante, para gerar uma variante de um ácido nucléico, para clivar uma ligação carbono-carbono em uma composição, para formar uma ligação carbono-carbono,para fazer um gênero alimentício, uma ração ou bebida, e para converter uma biomassa ouqualquer material lignocelulósico em um combustível |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR122017003017-5A BR122017003017B1 (pt) | 2006-03-07 | 2007-03-07 | Ácido nucléico, cassete de expressão, vetor, veículo de clonagem, microrganismotransgênico, polipeptídeo, peptídeo sinal, composição, e métodos para produzir um polipeptídeo recombinante, para gerar uma variante de um ácido nucléico, para clivar uma ligação carbono-carbono em uma composição, para formar uma ligação carbono-carbono,para fazer um gênero alimentício, uma ração ou bebida, e para converter uma biomassa ouqualquer material lignocelulósico em um combustível |
Country Status (13)
Country | Link |
---|---|
US (3) | US8546118B2 (pt) |
EP (4) | EP3153580A3 (pt) |
JP (3) | JP5733777B2 (pt) |
KR (4) | KR101744157B1 (pt) |
CN (3) | CN102690833B (pt) |
AT (1) | ATE548450T1 (pt) |
AU (1) | AU2007223086B2 (pt) |
BR (2) | BRPI0708614A2 (pt) |
CA (1) | CA2645225A1 (pt) |
EA (2) | EA029538B1 (pt) |
ES (1) | ES2383767T3 (pt) |
MX (1) | MX2008011442A (pt) |
WO (1) | WO2007103989A2 (pt) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006113897A2 (en) * | 2005-04-20 | 2006-10-26 | Cargill, Incorporated | Products and methods for in vivo secretion of monatin |
US8158389B2 (en) * | 2005-04-20 | 2012-04-17 | Cargill, Incorporated | Products and methods for in vivo secretion of monatin |
US8076108B2 (en) * | 2005-04-26 | 2011-12-13 | Cargill, Incorporated | Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors |
CA2643416C (en) * | 2006-03-07 | 2016-07-26 | Cargill, Incorporated | Aldolases, nucleic acids encoding them and methods for making and using them |
JPWO2012050125A1 (ja) | 2010-10-14 | 2014-02-24 | 味の素株式会社 | モナティンの製造方法 |
CN102181471B (zh) * | 2011-03-23 | 2014-07-02 | 深圳大学 | 莱茵衣藻分泌型表达载体及分泌型表达系统的构建方法 |
US10436790B2 (en) | 2011-09-28 | 2019-10-08 | Waters Technologies Corporation | Rapid fluorescence tagging of glycans and other biomolecules with enhanced MS signals |
UA116625C2 (uk) * | 2011-12-22 | 2018-04-25 | Ксілеко, Інк. | Спосіб одержання цукрів та спосіб одержання метаболічного продукту з лігноцелюлозної біомаси |
CN102559722B (zh) * | 2012-03-12 | 2017-05-17 | 杭州师范大学 | 一种高酶活、耐热醛缩酶基因、酶、载体、工程菌及应用 |
CA2868469A1 (en) | 2012-03-26 | 2013-10-03 | Pronutria, Inc. | Nutritive fragments, proteins and methods |
EP3715365A1 (en) | 2012-03-26 | 2020-09-30 | Axcella Health Inc. | Nutritive fragments, proteins and methods |
US9605040B2 (en) | 2012-03-26 | 2017-03-28 | Axcella Health Inc. | Nutritive proteins and methods |
SG10201604464SA (en) | 2012-03-26 | 2016-07-28 | Axcella Health Inc | Charged nutritive proteins and methods |
US9850512B2 (en) | 2013-03-15 | 2017-12-26 | The Research Foundation For The State University Of New York | Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield |
KR20160058940A (ko) | 2013-09-25 | 2016-05-25 | 프로뉴트리아 바이오사이언시스, 인코퍼레이티드 | 근육량, 강도 및 성능을 유지하기 위한 조성물 및 제형, 그리고 이의 생산방법 및 용도 |
US9951363B2 (en) | 2014-03-14 | 2018-04-24 | The Research Foundation for the State University of New York College of Environmental Science and Forestry | Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects |
CN107110785A (zh) | 2014-10-30 | 2017-08-29 | 沃特世科技公司 | 快速制备标记的葡糖基胺和分析生产所述标记的葡糖基胺的糖基化生物分子的方法 |
CN111796039B (zh) | 2014-11-13 | 2023-03-17 | 沃特世科技公司 | 快速标记的n-聚糖的液相色谱校准方法 |
EP4234062A3 (en) | 2016-06-21 | 2023-10-25 | Waters Technologies Corporation | Methods of electrospray ionization of glycans modified with amphipathic, strongly basic moieties |
CN114839302A (zh) * | 2016-07-01 | 2022-08-02 | 沃特世科技公司 | 使用分子量截留过滤和过滤器上去糖基化从复杂基质快速制备标记的葡基胺的方法 |
CN108079315B (zh) * | 2016-11-21 | 2021-09-24 | 厦门华绰生物医药科技有限公司 | FBP aldolase在制备激活AMPK的药物中的用途 |
EP3330380A1 (en) * | 2016-12-05 | 2018-06-06 | Evonik Degussa GmbH | Process for producing l-methionine from methional |
CN107541540B (zh) * | 2017-10-18 | 2021-07-20 | 南京财经大学 | 一种活性炭串联大孔树脂纯化菜籽肽的方法 |
WO2020013951A1 (en) * | 2018-07-12 | 2020-01-16 | Codexis, Inc. | Engineered phenylalanine ammonia lyase polypeptides |
EP3875590A4 (en) * | 2018-10-30 | 2023-02-15 | Green Earth Institute Co., Ltd. | PROCESS FOR THE PRODUCTION OF AN ORGANIC COMPOUND AND CORYNEFORM BACTERIUM |
WO2021055696A1 (en) * | 2019-09-19 | 2021-03-25 | The Regents Of The University Of California | Methods for producing d-tryptophan and substituted d-tryptophans |
CN114279952B (zh) * | 2020-09-27 | 2024-03-12 | 瑞辰星生物技术(广州)有限公司 | 用于造纸系统控制有机污染物沉积的生物酶酶活力的测定方法 |
CN112280773B (zh) * | 2020-11-06 | 2022-07-12 | 杭州濡湜生物科技有限公司 | 一种制备2-氨基-3-取代苯基-3-羟基丙酸的生物酶催化流式工艺 |
CN112301067B (zh) * | 2020-11-06 | 2022-07-05 | 杭州濡湜生物科技有限公司 | 一种制备2-氨基-3-取代苯基-3-羟基丙酸的绿色环保工艺 |
CN113151551A (zh) * | 2021-04-22 | 2021-07-23 | 山西农业大学 | Caps分子标记在鉴定谷子株高性状的用途及引物和检测试剂盒 |
CN116987601B (zh) * | 2023-09-27 | 2023-12-15 | 菏泽学院 | 一种微生物制剂及其在多环芳烃降解中的应用 |
Family Cites Families (150)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5366558A (en) | 1979-03-23 | 1994-11-22 | Brink David L | Method of treating biomass material |
US4458066A (en) | 1980-02-29 | 1984-07-03 | University Patents, Inc. | Process for preparing polynucleotides |
US5087571A (en) | 1984-06-22 | 1992-02-11 | President And Fellows Of Harvard College | Method for providing a cell culture from a transgenic non-human mammal |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
CH0229046H1 (de) | 1985-03-30 | 1998-07-15 | Stuart Alan Kauffman | Method for obtaining dna, rna, peptides, polypeptinique. des or proteins by means of a dna recombinant tech |
US5780292A (en) | 1987-04-29 | 1998-07-14 | Alko Group Ltd. | Production of phytate degrading enzymes in trichoderma |
US4962028A (en) | 1986-07-09 | 1990-10-09 | Dna Plant Technology Corporation | Plant promotors |
US4946778A (en) | 1987-09-21 | 1990-08-07 | Genex Corporation | Single polypeptide chain binding molecules |
US4987071A (en) | 1986-12-03 | 1991-01-22 | University Patents, Inc. | RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods |
US5015580A (en) | 1987-07-29 | 1991-05-14 | Agracetus | Particle-mediated transformation of soybean plants and lines |
US5573933A (en) | 1987-04-14 | 1996-11-12 | Luminis Pty, Ltd. | Transgenic pigs |
US5700637A (en) | 1988-05-03 | 1997-12-23 | Isis Innovation Limited | Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays |
US6054270A (en) | 1988-05-03 | 2000-04-25 | Oxford Gene Technology Limited | Analying polynucleotide sequences |
US5217879A (en) | 1989-01-12 | 1993-06-08 | Washington University | Infectious Sindbis virus vectors |
US5527681A (en) | 1989-06-07 | 1996-06-18 | Affymax Technologies N.V. | Immobilized molecular synthesis of systematically substituted compounds |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5744101A (en) | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
US5589583A (en) | 1990-01-11 | 1996-12-31 | Monsanto Company | Plant promoter |
ATE104961T1 (de) | 1990-01-19 | 1994-05-15 | Technology Finance Corp | Verfahren zur herstellung von 3-(1-amino-1,3dicarboxy-3-hydroxy-but-4-yl)-indol. |
EP0528881A4 (en) | 1990-04-24 | 1993-05-26 | Stratagene | Methods for phenotype creation from multiple gene populations |
JPH06507782A (ja) | 1990-06-15 | 1994-09-08 | サイオス ノバ インコーポレイテッド | アルツハイマー病のアミロイド形成開症状を示すヒト以外の組換え哺乳動物 |
CA2096843C (en) | 1990-11-23 | 2007-08-07 | Kathleen D'halluin | Process for transforming monocotyledonous plants |
AU9166691A (en) | 1990-12-20 | 1992-07-22 | Ixsys, Inc. | Optimization of binding proteins |
US6110700A (en) | 1991-03-11 | 2000-08-29 | The General Hospital Corporation | PRAD1 cyclin and its cDNA |
US5922854A (en) | 1991-06-14 | 1999-07-13 | Kumar; Ramesh | Purifying Human Hemogloblin from transgenic pig red cells and plasmids containing pig globin nucleic acids |
JP2648897B2 (ja) | 1991-07-01 | 1997-09-03 | 塩野義製薬株式会社 | ピリミジン誘導体 |
CA2075135A1 (en) | 1991-08-02 | 1993-02-03 | David E. Ellis | Particle-mediated transformation of gymnosperms |
US5632957A (en) | 1993-11-01 | 1997-05-27 | Nanogen | Molecular biological diagnostic systems including electrodes |
JPH05236997A (ja) | 1992-02-28 | 1993-09-17 | Hitachi Ltd | ポリヌクレオチド捕捉用チップ |
WO1994012014A1 (en) | 1992-11-20 | 1994-06-09 | Agracetus, Inc. | Transgenic cotton plants producing heterologous bioplastic |
AU7925094A (en) | 1993-09-30 | 1995-04-18 | Agracetus, Inc. | Transgenic cotton plants producing heterologous peroxidase |
US6045996A (en) | 1993-10-26 | 2000-04-04 | Affymetrix, Inc. | Hybridization assays on oligonucleotide arrays |
US6468742B2 (en) | 1993-11-01 | 2002-10-22 | Nanogen, Inc. | Methods for determination of single nucleic acid polymorphisms using bioelectronic microchip |
US5965452A (en) | 1996-07-09 | 1999-10-12 | Nanogen, Inc. | Multiplexed active biologic array |
US5834252A (en) | 1995-04-18 | 1998-11-10 | Glaxo Group Limited | End-complementary polymerase reaction |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US6117679A (en) | 1994-02-17 | 2000-09-12 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6335160B1 (en) | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US5639940A (en) | 1994-03-03 | 1997-06-17 | Pharmaceutical Proteins Ltd. | Production of fibrinogen in transgenic animals |
MX198456B (es) | 1994-03-09 | 2000-09-05 | Abbott Lab | Animales trangenicos que producen oligosacaridos y glucoconjugados. |
NZ279676A (en) | 1994-03-09 | 1998-04-27 | Abbott Lab | Humanized milk produced by non-human transgenic mammal transformed with a heterologous gene coding for human enzyme producing human oligosaccharides and glycoconjugates |
US5750870A (en) | 1994-06-17 | 1998-05-12 | Agritope, Inc. | Plant genetic transformation methods and transgenic plants |
US5807522A (en) | 1994-06-17 | 1998-09-15 | The Board Of Trustees Of The Leland Stanford Junior University | Methods for fabricating microarrays of biological samples |
US5959171A (en) | 1994-08-17 | 1999-09-28 | Pharming B.V. | Method for the production of biologically active polypeptides in a mammal's |
CA2198451A1 (en) | 1994-09-01 | 1996-03-07 | Gurparkash Singh | Transgenic animal expressing a familial form of human amyloid precursor protein |
US6111166A (en) | 1994-09-19 | 2000-08-29 | Medarex, Incorporated | Transgenic mice expressing human Fcα and β receptors |
US5795737A (en) | 1994-09-19 | 1998-08-18 | The General Hospital Corporation | High level expression of proteins |
US5880327A (en) | 1994-09-21 | 1999-03-09 | American National Red Cross | Transgenic mammals expressing human coagulation factor VIII |
US5556752A (en) | 1994-10-24 | 1996-09-17 | Affymetrix, Inc. | Surface-bound, unimolecular, double-stranded DNA |
US6187992B1 (en) | 1994-12-05 | 2001-02-13 | Merck & Co., Inc. | Transgenic mouse having a disrupted amyloid precursor protein gene |
US5830645A (en) | 1994-12-09 | 1998-11-03 | The Regents Of The University Of California | Comparative fluorescence hybridization to nucleic acid arrays |
US5633440A (en) | 1994-12-20 | 1997-05-27 | Dna Plant Technology Corporation | P119 promoters and their uses |
US5705369A (en) | 1994-12-27 | 1998-01-06 | Midwest Research Institute | Prehydrolysis of lignocellulose |
JP3307947B2 (ja) | 1995-01-26 | 2002-07-29 | ノボザイムス アクティーゼルスカブ | キシラナーゼを含有する動物飼料添加剤 |
US5959098A (en) | 1996-04-17 | 1999-09-28 | Affymetrix, Inc. | Substrate preparation process |
US5795749A (en) | 1995-04-05 | 1998-08-18 | The Scripps Research Institution | Use of 2-deoxyribose-5-phosphate aldolase to prepare 2-deoxyfucose, analogues and derivatives |
EP0831854A4 (en) | 1995-06-06 | 2001-01-24 | Isis Pharmaceuticals Inc | OLIGONUCLEOTIDS WITH PHOSPHOROTHIOATE BINDINGS OF HIGH CHIRAL PURITY |
US5856174A (en) | 1995-06-29 | 1999-01-05 | Affymetrix, Inc. | Integrated nucleic acid diagnostic device |
US5985662A (en) | 1995-07-13 | 1999-11-16 | Isis Pharmaceuticals Inc. | Antisense inhibition of hepatitis B virus replication |
US6057103A (en) | 1995-07-18 | 2000-05-02 | Diversa Corporation | Screening for novel bioactivities |
US5958672A (en) | 1995-07-18 | 1999-09-28 | Diversa Corporation | Protein activity screening of clones having DNA from uncultivated microorganisms |
US5962258A (en) | 1995-08-23 | 1999-10-05 | Diversa Corporation | Carboxymethyl cellulase fromthermotoga maritima |
WO1997016533A1 (en) | 1995-10-31 | 1997-05-09 | The Regents Of The University Of California | Mammalian artificial chromosomes and methods of using same |
US6740506B2 (en) | 1995-12-07 | 2004-05-25 | Diversa Corporation | End selection in directed evolution |
US20030215798A1 (en) | 1997-06-16 | 2003-11-20 | Diversa Corporation | High throughput fluorescence-based screening for novel enzymes |
US5965408A (en) | 1996-07-09 | 1999-10-12 | Diversa Corporation | Method of DNA reassembly by interrupting synthesis |
US6361974B1 (en) | 1995-12-07 | 2002-03-26 | Diversa Corporation | Exonuclease-mediated nucleic acid reassembly in directed evolution |
US6171820B1 (en) | 1995-12-07 | 2001-01-09 | Diversa Corporation | Saturation mutagenesis in directed evolution |
US5939250A (en) | 1995-12-07 | 1999-08-17 | Diversa Corporation | Production of enzymes having desired activities by mutagenesis |
US6358709B1 (en) | 1995-12-07 | 2002-03-19 | Diversa Corporation | End selection in directed evolution |
US5830696A (en) | 1996-12-05 | 1998-11-03 | Diversa Corporation | Directed evolution of thermophilic enzymes |
US6537776B1 (en) | 1999-06-14 | 2003-03-25 | Diversa Corporation | Synthetic ligation reassembly in directed evolution |
US6022963A (en) | 1995-12-15 | 2000-02-08 | Affymetrix, Inc. | Synthesis of oligonucleotide arrays using photocleavable protecting groups |
US6013440A (en) | 1996-03-11 | 2000-01-11 | Affymetrix, Inc. | Nucleic acid affinity columns |
US6096548A (en) | 1996-03-25 | 2000-08-01 | Maxygen, Inc. | Method for directing evolution of a virus |
US6025155A (en) | 1996-04-10 | 2000-02-15 | Chromos Molecular Systems, Inc. | Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes |
US5697987A (en) | 1996-05-10 | 1997-12-16 | The Trustees Of Princeton University | Alternative fuel |
WO1997046313A1 (en) | 1996-06-07 | 1997-12-11 | Eos Biotechnology, Inc. | Immobilised linear oligonucleotide arrays |
DK1717322T3 (da) | 1997-01-17 | 2012-10-22 | Codexis Mayflower Holdings Llc | Udvikling af hele celler og organismer ved rekursiv sekvensrekombination |
US6326204B1 (en) | 1997-01-17 | 2001-12-04 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
ATE399880T1 (de) | 1997-03-18 | 2008-07-15 | Novozymes As | Ein in-vitro-verfahren zur herstellung einer dna- bibliothek |
WO1998041622A1 (en) | 1997-03-18 | 1998-09-24 | Novo Nordisk A/S | Method for constructing a library using dna shuffling |
US5948653A (en) | 1997-03-21 | 1999-09-07 | Pati; Sushma | Sequence alterations using homologous recombination |
US6153410A (en) | 1997-03-25 | 2000-11-28 | California Institute Of Technology | Recombination of polynucleotide sequences using random or defined primers |
US6333181B1 (en) | 1997-04-07 | 2001-12-25 | University Of Florida Research Foundation, Inc. | Ethanol production from lignocellulose |
US5916780A (en) | 1997-06-09 | 1999-06-29 | Iogen Corporation | Pretreatment process for conversion of cellulose to fuel ethanol |
US7019827B2 (en) | 1997-06-16 | 2006-03-28 | Diversa Corporation | GigaMatrix holding tray having through-hole wells |
AUPO758297A0 (en) | 1997-06-27 | 1997-07-24 | Rowe, James Baber | Control of acidic gut syndrome |
US6826296B2 (en) | 1997-07-25 | 2004-11-30 | Affymetrix, Inc. | Method and system for providing a probe array chip design database |
AU8908198A (en) | 1997-08-15 | 1999-03-08 | Hyseq, Inc. | Methods and compositions for detection or quantification of nucleic acid species |
CN1249418C (zh) | 1997-09-11 | 2006-04-05 | 生物风险公司 | 一种生产目标物质的高密度阵列的方法及高密度阵列 |
US6465178B2 (en) | 1997-09-30 | 2002-10-15 | Surmodics, Inc. | Target molecule attachment to surfaces |
WO1999021979A1 (en) | 1997-10-28 | 1999-05-06 | Maxygen, Inc. | Human papillomavirus vectors |
AU1449499A (en) | 1997-10-31 | 1999-05-24 | Maxygen, Incorporated | Modification of virus tropism and host range by viral genome shuffling |
CA2251263A1 (en) | 1997-11-14 | 1999-05-14 | Hajime Karasuyama | Transgenic animal allergy models and methods for their use |
DK1036198T3 (da) | 1997-12-08 | 2013-01-02 | California Inst Of Techn | Fremgangsmåde til fremstilling af polynukleotid- og polypeptidsekvenser |
WO1999041369A2 (en) | 1998-02-11 | 1999-08-19 | Maxygen, Inc. | Genetic vaccine vector engineering |
EP1054973A1 (en) | 1998-02-11 | 2000-11-29 | Maxygen, Inc. | Antigen library immunization |
CA2323638A1 (en) | 1998-04-03 | 1999-10-14 | Phylos, Inc. | Addressable protein arrays |
US6156952A (en) | 1998-04-09 | 2000-12-05 | Constituent Institution Of The University Of Maryland System | HIV transgenic animals and uses therefor |
US6048695A (en) | 1998-05-04 | 2000-04-11 | Baylor College Of Medicine | Chemically modified nucleic acids and methods for coupling nucleic acids to solid support |
JP4700805B2 (ja) | 1998-06-29 | 2011-06-15 | ブリストル−マイヤーズ スクウィブ カンパニー | 多様性の高いライブラリーを製造する方法 |
FR2782323B1 (fr) | 1998-08-12 | 2002-01-11 | Proteus | Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues |
GB2340755B (en) | 1998-08-24 | 2002-09-25 | Cannon Rubber Ltd | Breast pump insert |
US6277628B1 (en) | 1998-10-02 | 2001-08-21 | Incyte Genomics, Inc. | Linear microarrays |
US6277489B1 (en) | 1998-12-04 | 2001-08-21 | The Regents Of The University Of California | Support for high performance affinity chromatography and other uses |
US6376246B1 (en) | 1999-02-05 | 2002-04-23 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6436675B1 (en) | 1999-09-28 | 2002-08-20 | Maxygen, Inc. | Use of codon-varied oligonucleotide synthesis for synthetic shuffling |
US6368861B1 (en) | 1999-01-19 | 2002-04-09 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US7024312B1 (en) | 1999-01-19 | 2006-04-04 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
DE19910464A1 (de) | 1999-03-10 | 2000-09-14 | Bayer Ag | Verfahren zur Herstellung von Cyclobutanon |
US6221653B1 (en) | 1999-04-27 | 2001-04-24 | Agilent Technologies, Inc. | Method of performing array-based hybridization assays using thermal inkjet deposition of sample fluids |
JP2002544174A (ja) | 1999-05-07 | 2002-12-24 | ジェネンテック・インコーポレーテッド | B細胞表面マーカーに結合するアンタゴニストを用いた自己免疫疾患の治療 |
US6653151B2 (en) | 1999-07-30 | 2003-11-25 | Large Scale Proteomics Corporation | Dry deposition of materials for microarrays using matrix displacement |
US6409841B1 (en) | 1999-11-02 | 2002-06-25 | Waste Energy Integrated Systems, Llc. | Process for the production of organic products from diverse biomass sources |
US20010008765A1 (en) | 1999-12-06 | 2001-07-19 | Fuji Photo Film Co., Ltd. | DNA chip and reactive solid carrier |
ES2166316B1 (es) | 2000-02-24 | 2003-02-16 | Ct Investig Energeticas Ciemat | Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante. |
JP2001328984A (ja) | 2000-05-19 | 2001-11-27 | Kuraray Co Ltd | メバロラクトンの製造方法 |
EP1294869A2 (en) | 2000-06-14 | 2003-03-26 | Diversa Corporation | Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating |
US6423145B1 (en) | 2000-08-09 | 2002-07-23 | Midwest Research Institute | Dilute acid/metal salt hydrolysis of lignocellulosics |
AU2001278945A1 (en) | 2000-08-10 | 2002-02-25 | Eli Lilly And Company | 4-substituted d-glutamic acid derivatives for use as antibiotic |
WO2002029032A2 (en) | 2000-09-30 | 2002-04-11 | Diversa Corporation | Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating |
MXPA02005717A (es) | 2000-10-10 | 2003-10-14 | Diversa Corp | Analisis de alto rendimiento o a base de capilares para bioactividad o biomoleuclas. |
US6309872B1 (en) | 2000-11-01 | 2001-10-30 | Novozymes Biotech, Inc | Polypeptides having glucoamylase activity and nucleic acids encoding same |
CA2430559A1 (en) | 2000-11-30 | 2002-06-06 | Diversa Corporation | Method of making a protein polymer and uses of the polymer |
US20060019913A1 (en) | 2001-05-18 | 2006-01-26 | Sirna Therapeutics, Inc. | RNA interference mediated inhibtion of protein tyrosine phosphatase-1B (PTP-1B) gene expression using short interfering nucleic acid (siNA) |
CA2462641A1 (en) | 2001-10-01 | 2003-04-10 | Diversa Corporation | Whole cell engineering using real-time metabolic flux analysis |
BRPI0309527B1 (pt) | 2002-04-23 | 2015-08-18 | Cargill Inc | Métodos para produção de monatina |
US7572607B2 (en) * | 2002-04-23 | 2009-08-11 | Cargill, Incorporated | Polypeptides and biosynthetic pathways for the production of monatin and its precursors |
CN103525847A (zh) * | 2002-08-26 | 2014-01-22 | 味之素株式会社 | 新型醛缩酶和取代α-酮酸的制备方法 |
WO2004027075A2 (en) * | 2002-09-20 | 2004-04-01 | Diversa Corporation | Chemoenzymatic methods for the synthesis of statins and stain intermediates |
US6776979B2 (en) | 2002-12-30 | 2004-08-17 | Marvin B. Frager | Periodontal treatment compound and method of use |
AU2004286207B2 (en) | 2003-10-21 | 2011-02-24 | Cargill, Incorporated | Production of monatin and monatin precursors |
JP4500977B2 (ja) | 2003-11-05 | 2010-07-14 | 味の素株式会社 | 新規アミノ酸誘導体及び甘味剤 |
JP4604524B2 (ja) * | 2004-03-16 | 2011-01-05 | 味の素株式会社 | 変異型アルドラーゼ、並びにこれを用いた光学活性ihog及び光学活性モナティンの製造方法 |
US20060014260A1 (en) | 2004-05-07 | 2006-01-19 | Zhiliang Fan | Lower cellulase requirements for biomass cellulose hydrolysis and fermentation |
US20060030003A1 (en) | 2004-05-12 | 2006-02-09 | Simon Michael R | Composition and method for introduction of RNA interference sequences into targeted cells and tissues |
US7338763B2 (en) | 2004-06-02 | 2008-03-04 | Eppendorf Array Technologies S.A. | Method and kit for the detection and/or quantification of homologous nucleotide sequences on arrays |
CA2506247C (en) * | 2004-06-07 | 2012-02-21 | Ajinomoto Co., Inc. | Novel aldolase, and method for producing optically active ihog and monatin |
AU2005252273B2 (en) | 2004-06-07 | 2011-04-28 | Arbutus Biopharma Corporation | Lipid encapsulated interfering RNA |
CN100519756C (zh) * | 2004-06-07 | 2009-07-29 | 味之素株式会社 | 新的醛缩酶及光学活性ihog及莫那亭的制备方法 |
US7635563B2 (en) | 2004-06-30 | 2009-12-22 | Massachusetts Institute Of Technology | High throughput methods relating to microRNA expression analysis |
US20060019258A1 (en) | 2004-07-20 | 2006-01-26 | Illumina, Inc. | Methods and compositions for detection of small interfering RNA and micro-RNA |
US7923231B2 (en) | 2004-12-17 | 2011-04-12 | Cargill, Incorporated | Production of glucuronic acid using myo-inositol oxygenase from cryptococcus neoformans |
US7582455B2 (en) * | 2005-04-26 | 2009-09-01 | Cargill, Incorporated | Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors |
US8076108B2 (en) * | 2005-04-26 | 2011-12-13 | Cargill, Incorporated | Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors |
AU2014284148B2 (en) | 2013-06-21 | 2017-02-23 | Bio-Rad Laboratories, Inc. | Microfluidic system with fluid pickups |
-
2007
- 2007-03-07 EP EP16199751.5A patent/EP3153580A3/en not_active Withdrawn
- 2007-03-07 KR KR1020167012333A patent/KR101744157B1/ko active IP Right Grant
- 2007-03-07 MX MX2008011442A patent/MX2008011442A/es active IP Right Grant
- 2007-03-07 AU AU2007223086A patent/AU2007223086B2/en not_active Ceased
- 2007-03-07 BR BRPI0708614-8A patent/BRPI0708614A2/pt not_active IP Right Cessation
- 2007-03-07 WO PCT/US2007/063515 patent/WO2007103989A2/en active Application Filing
- 2007-03-07 KR KR1020157002469A patent/KR101622894B1/ko active Application Filing
- 2007-03-07 BR BR122017003017-5A patent/BR122017003017B1/pt not_active IP Right Cessation
- 2007-03-07 EA EA201301267A patent/EA029538B1/ru not_active IP Right Cessation
- 2007-03-07 JP JP2008558521A patent/JP5733777B2/ja not_active Expired - Fee Related
- 2007-03-07 US US12/281,052 patent/US8546118B2/en not_active Expired - Fee Related
- 2007-03-07 CN CN201210175110.2A patent/CN102690833B/zh not_active Expired - Fee Related
- 2007-03-07 ES ES07758102T patent/ES2383767T3/es active Active
- 2007-03-07 AT AT07758102T patent/ATE548450T1/de active
- 2007-03-07 EP EP07758102A patent/EP1999256B1/en not_active Not-in-force
- 2007-03-07 KR KR1020087024447A patent/KR101508249B1/ko active IP Right Grant
- 2007-03-07 EA EA200870329A patent/EA019971B1/ru not_active IP Right Cessation
- 2007-03-07 EP EP11167408A patent/EP2388316A3/en not_active Withdrawn
- 2007-03-07 KR KR1020147000809A patent/KR101588539B1/ko active IP Right Grant
- 2007-03-07 CN CN2007800164086A patent/CN101443446B/zh not_active Expired - Fee Related
- 2007-03-07 EP EP11167410.7A patent/EP2385108B1/en not_active Not-in-force
- 2007-03-07 CA CA002645225A patent/CA2645225A1/en not_active Abandoned
- 2007-03-07 CN CN201510514805.2A patent/CN105063072A/zh active Pending
-
2012
- 2012-10-10 JP JP2012225071A patent/JP5793486B2/ja not_active Expired - Fee Related
- 2012-10-10 JP JP2012225075A patent/JP5793487B2/ja not_active Expired - Fee Related
-
2013
- 2013-08-14 US US13/966,880 patent/US9290755B2/en not_active Expired - Fee Related
-
2016
- 2016-01-28 US US15/009,414 patent/US9719079B2/en not_active Expired - Fee Related
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9719079B2 (en) | Aldolases, nucleic acids encoding them and methods for making and using them | |
US9518280B2 (en) | Aldolases, nucleic acids encoding them and methods for making and using them | |
AU2016201456A1 (en) | Aldolases, nucleic acids encoding them and methods for making and using them | |
AU2013251189A1 (en) | Aldolases, nucleic acids encoding them and methods for making and using them |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06H | Technical and formal requirements: requirement cancelled [chapter 6.8 patent gazette] |
Free format text: REF. A RPI NO 2154 DE 17/04/2012. ANULACAO DA EXIGENCIA 6.6 POR TER SIDO INDEVIDA. REQUERENTE NAO APRESENTOU RESPOSTA A EXIGENCIA CONFORME DISPOE A RESOLUCAO 207 DE 24/04/2009, ENTRETANTO, A RESPOSTA CONSTA NO FORMULARIO DE DEPOSITO. |
|
B25G | Requested change of headquarter approved |
Owner name: VERENIUM CORPORATION (US) |
|
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
B09B | Patent application refused [chapter 9.2 patent gazette] | ||
B12B | Appeal against refusal [chapter 12.2 patent gazette] | ||
B25D | Requested change of name of applicant approved |
Owner name: BASF ENZYMES LLC (US) |
|
B08F | Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette] |
Free format text: REFERENTE A 14A ANUIDADE. |
|
B08K | Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette] |
Free format text: REFERENTE AO DESPACHO 8.6 PUBLICADO NA RPI 2621 DE 30/03/2021. |