BRPI0710412A2 - " celulas hospedeiras microbianas recombinantes, método para produção de 2-butanol, método para produção de 2-butanona, 2-butanol e 2- butanona" - Google Patents
" celulas hospedeiras microbianas recombinantes, método para produção de 2-butanol, método para produção de 2-butanona, 2-butanol e 2- butanona" Download PDFInfo
- Publication number
- BRPI0710412A2 BRPI0710412A2 BRPI0710412-0A BRPI0710412A BRPI0710412A2 BR PI0710412 A2 BRPI0710412 A2 BR PI0710412A2 BR PI0710412 A BRPI0710412 A BR PI0710412A BR PI0710412 A2 BRPI0710412 A2 BR PI0710412A2
- Authority
- BR
- Brazil
- Prior art keywords
- seq
- amino acid
- acid sequence
- butanol
- butanone
- Prior art date
Links
- BTANRVKWQNVYAZ-UHFFFAOYSA-N Sec-butyl alcohol Natural products CCC(C)O BTANRVKWQNVYAZ-UHFFFAOYSA-N 0.000 title claims abstract description 469
- ZWEHNKRNPOVVGH-UHFFFAOYSA-N 2-Butanone Chemical compound CCC(C)=O ZWEHNKRNPOVVGH-UHFFFAOYSA-N 0.000 title claims abstract description 154
- 238000000034 method Methods 0.000 title claims abstract description 148
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 56
- BTANRVKWQNVYAZ-BYPYZUCNSA-N (2S)-butan-2-ol Chemical compound CC[C@H](C)O BTANRVKWQNVYAZ-BYPYZUCNSA-N 0.000 title claims 2
- 229910052799 carbon Inorganic materials 0.000 claims abstract description 30
- 241000894006 Bacteria Species 0.000 claims abstract description 10
- 108090000623 proteins and genes Proteins 0.000 claims description 216
- 108020004414 DNA Proteins 0.000 claims description 148
- 102000004169 proteins and genes Human genes 0.000 claims description 118
- 108010025885 Glycerol dehydratase Proteins 0.000 claims description 116
- 108010065027 Propanediol Dehydratase Proteins 0.000 claims description 114
- ROWKJAVDOGWPAT-UHFFFAOYSA-N Acetoin Chemical compound CC(O)C(C)=O ROWKJAVDOGWPAT-UHFFFAOYSA-N 0.000 claims description 113
- 238000006243 chemical reaction Methods 0.000 claims description 94
- 239000000758 substrate Substances 0.000 claims description 94
- 150000002009 diols Chemical class 0.000 claims description 77
- 150000001413 amino acids Chemical class 0.000 claims description 65
- 229920001184 polypeptide Polymers 0.000 claims description 59
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 59
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 59
- GFAZHVHNLUBROE-UHFFFAOYSA-N hydroxymethyl propionaldehyde Natural products CCC(=O)CO GFAZHVHNLUBROE-UHFFFAOYSA-N 0.000 claims description 57
- 238000000855 fermentation Methods 0.000 claims description 46
- 230000004151 fermentation Effects 0.000 claims description 46
- WTLNOANVTIKPEE-UHFFFAOYSA-N 2-acetyloxypropanoic acid Chemical compound OC(=O)C(C)OC(C)=O WTLNOANVTIKPEE-UHFFFAOYSA-N 0.000 claims description 36
- OWBTYPJTUOEWEK-UHFFFAOYSA-N butane-2,3-diol Chemical compound CC(O)C(C)O OWBTYPJTUOEWEK-UHFFFAOYSA-N 0.000 claims description 35
- 108010057307 butanol dehydrogenase Proteins 0.000 claims description 35
- 239000011159 matrix material Substances 0.000 claims description 34
- 230000000813 microbial effect Effects 0.000 claims description 34
- 108090001042 Hydro-Lyases Proteins 0.000 claims description 27
- 102000004867 Hydro-Lyases Human genes 0.000 claims description 27
- 108010000700 Acetolactate synthase Proteins 0.000 claims description 26
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 claims description 26
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 25
- 108010036467 butanediol dehydrogenase Proteins 0.000 claims description 25
- 108010084631 acetolactate decarboxylase Proteins 0.000 claims description 24
- 102000053602 DNA Human genes 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- GXOZACHRINSULB-UHFFFAOYSA-N butane-2,3-diol;3-hydroxybutan-2-one Chemical compound CC(O)C(C)O.CC(O)C(C)=O GXOZACHRINSULB-UHFFFAOYSA-N 0.000 claims description 9
- 241000194033 Enterococcus Species 0.000 claims description 7
- 241000186660 Lactobacillus Species 0.000 claims description 7
- 241000589516 Pseudomonas Species 0.000 claims description 7
- 230000036961 partial effect Effects 0.000 claims description 7
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 6
- 241000588748 Klebsiella Species 0.000 claims description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 5
- 241000192001 Pediococcus Species 0.000 claims description 5
- 241000235648 Pichia Species 0.000 claims description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 5
- 229940039696 lactobacillus Drugs 0.000 claims description 5
- 241000222120 Candida <Saccharomycetales> Species 0.000 claims description 4
- 241000193403 Clostridium Species 0.000 claims description 4
- 150000002772 monosaccharides Chemical class 0.000 claims description 4
- 229920001542 oligosaccharide Polymers 0.000 claims description 4
- 150000002482 oligosaccharides Chemical class 0.000 claims description 4
- 238000002864 sequence alignment Methods 0.000 claims description 4
- 241000588722 Escherichia Species 0.000 claims description 3
- 241000233866 Fungi Species 0.000 claims description 3
- 241000316848 Rhodococcus <scale insect> Species 0.000 claims description 3
- 241000235070 Saccharomyces Species 0.000 claims description 3
- 241000588901 Zymomonas Species 0.000 claims description 3
- 241000186063 Arthrobacter Species 0.000 claims description 2
- 241000186146 Brevibacterium Species 0.000 claims description 2
- 241000186216 Corynebacterium Species 0.000 claims description 2
- 241000607142 Salmonella Species 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 45
- 241001464430 Cyanobacterium Species 0.000 claims 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 abstract description 66
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 abstract description 41
- -1 carbon alcohols Chemical class 0.000 abstract description 17
- 244000005700 microbiome Species 0.000 abstract description 14
- 238000012262 fermentative production Methods 0.000 abstract description 3
- 230000009567 fermentative growth Effects 0.000 abstract 1
- 102000004190 Enzymes Human genes 0.000 description 116
- 108090000790 Enzymes Proteins 0.000 description 116
- 239000013598 vector Substances 0.000 description 100
- 235000018102 proteins Nutrition 0.000 description 94
- 210000004027 cell Anatomy 0.000 description 90
- 239000000047 product Substances 0.000 description 85
- 239000002609 medium Substances 0.000 description 80
- 230000014509 gene expression Effects 0.000 description 76
- 239000013615 primer Substances 0.000 description 71
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 69
- 230000000694 effects Effects 0.000 description 64
- 239000012634 fragment Substances 0.000 description 61
- 239000013612 plasmid Substances 0.000 description 60
- 241000588724 Escherichia coli Species 0.000 description 54
- 108091026890 Coding region Proteins 0.000 description 53
- 108091000080 Phosphotransferase Proteins 0.000 description 43
- 239000003999 initiator Substances 0.000 description 43
- 102000020233 phosphotransferase Human genes 0.000 description 43
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 36
- 150000007523 nucleic acids Chemical class 0.000 description 36
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 35
- 239000002773 nucleotide Chemical group 0.000 description 35
- 125000003729 nucleotide group Chemical group 0.000 description 35
- 230000037361 pathway Effects 0.000 description 33
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 31
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 30
- 239000000203 mixture Substances 0.000 description 29
- 238000010367 cloning Methods 0.000 description 28
- 230000001419 dependent effect Effects 0.000 description 28
- 230000006870 function Effects 0.000 description 28
- 241000588698 Erwinia Species 0.000 description 27
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 27
- 229940024606 amino acid Drugs 0.000 description 27
- 235000001014 amino acid Nutrition 0.000 description 26
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 24
- FERWBXLFSBWTDE-UHFFFAOYSA-N 3-aminobutan-2-ol Chemical compound CC(N)C(C)O FERWBXLFSBWTDE-UHFFFAOYSA-N 0.000 description 23
- 241000588747 Klebsiella pneumoniae Species 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 23
- 239000000284 extract Substances 0.000 description 23
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 23
- CDQSJQSWAWPGKG-UHFFFAOYSA-N butane-1,1-diol Chemical compound CCCC(O)O CDQSJQSWAWPGKG-UHFFFAOYSA-N 0.000 description 21
- 108020004705 Codon Proteins 0.000 description 20
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 20
- 229940076788 pyruvate Drugs 0.000 description 20
- 230000009466 transformation Effects 0.000 description 20
- 235000014469 Bacillus subtilis Nutrition 0.000 description 19
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 19
- 229910019142 PO4 Inorganic materials 0.000 description 18
- 239000010452 phosphate Substances 0.000 description 18
- 235000007682 pyridoxal 5'-phosphate Nutrition 0.000 description 17
- 239000011589 pyridoxal 5'-phosphate Substances 0.000 description 17
- 230000002441 reversible effect Effects 0.000 description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 description 16
- 108090000340 Transaminases Proteins 0.000 description 16
- 102000003929 Transaminases Human genes 0.000 description 16
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 16
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 15
- 150000001414 amino alcohols Chemical class 0.000 description 15
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 15
- 230000002255 enzymatic effect Effects 0.000 description 15
- 108010050848 glycylleucine Proteins 0.000 description 15
- 241000588749 Klebsiella oxytoca Species 0.000 description 14
- BAWFJGJZGIEFAR-NNYOXOHSSA-N NAD zwitterion Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-N 0.000 description 14
- 101150028410 budC gene Proteins 0.000 description 14
- 102000039446 nucleic acids Human genes 0.000 description 14
- 108020004707 nucleic acids Proteins 0.000 description 14
- 244000063299 Bacillus subtilis Species 0.000 description 13
- 108700026244 Open Reading Frames Proteins 0.000 description 13
- 101150077640 budB gene Proteins 0.000 description 13
- 238000010276 construction Methods 0.000 description 13
- 230000000069 prophylactic effect Effects 0.000 description 13
- 239000000243 solution Substances 0.000 description 13
- QWSDDBZNDKNTAL-UHFFFAOYSA-N 1-aminobutyl dihydrogen phosphate Chemical compound CCCC(N)OP(O)(O)=O QWSDDBZNDKNTAL-UHFFFAOYSA-N 0.000 description 12
- 102100035861 Cytosolic 5'-nucleotidase 1A Human genes 0.000 description 12
- 101000802744 Homo sapiens Cytosolic 5'-nucleotidase 1A Proteins 0.000 description 12
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 12
- 101150019823 chnA gene Proteins 0.000 description 12
- 230000012010 growth Effects 0.000 description 12
- 108010053725 prolylvaline Proteins 0.000 description 12
- 108010073969 valyllysine Proteins 0.000 description 12
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 11
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 11
- 239000008103 glucose Substances 0.000 description 11
- 108010078144 glutaminyl-glycine Proteins 0.000 description 11
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 11
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 10
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 10
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 10
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 10
- 241000588701 Pectobacterium carotovorum Species 0.000 description 10
- 108010047857 aspartylglycine Proteins 0.000 description 10
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 10
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 10
- 238000004128 high performance liquid chromatography Methods 0.000 description 10
- 239000001301 oxygen Substances 0.000 description 10
- 229910052760 oxygen Inorganic materials 0.000 description 10
- 230000007420 reactivation Effects 0.000 description 10
- SSDXATLWRAODNC-UHFFFAOYSA-N 1-aminopropyl dihydrogen phosphate Chemical compound CCC(N)OP(O)(O)=O SSDXATLWRAODNC-UHFFFAOYSA-N 0.000 description 9
- RTDYVACWFWSTAJ-UHFFFAOYSA-N 3-aminobutan-2-yl dihydrogen phosphate Chemical compound CC(N)C(C)OP(O)(O)=O RTDYVACWFWSTAJ-UHFFFAOYSA-N 0.000 description 9
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 9
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 9
- 101710088194 Dehydrogenase Proteins 0.000 description 9
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 9
- 241000880493 Leptailurus serval Species 0.000 description 9
- 102000004317 Lyases Human genes 0.000 description 9
- 108090000856 Lyases Proteins 0.000 description 9
- 229960003767 alanine Drugs 0.000 description 9
- 229960000723 ampicillin Drugs 0.000 description 9
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 9
- 238000003556 assay Methods 0.000 description 9
- 101150015366 budA gene Proteins 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- 108010089804 glycyl-threonine Proteins 0.000 description 9
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- JCBPETKZIGVZRE-UHFFFAOYSA-N 2-aminobutan-1-ol Chemical compound CCC(N)CO JCBPETKZIGVZRE-UHFFFAOYSA-N 0.000 description 8
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 8
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 8
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 8
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 8
- NBBJYMSMWIIQGU-UHFFFAOYSA-N Propionic aldehyde Chemical compound CCC=O NBBJYMSMWIIQGU-UHFFFAOYSA-N 0.000 description 8
- RADKZDMFGJYCBB-UHFFFAOYSA-N Pyridoxal Chemical compound CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 8
- 238000002835 absorbance Methods 0.000 description 8
- 108010092854 aspartyllysine Proteins 0.000 description 8
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 8
- 108010081551 glycylphenylalanine Proteins 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- OWBTYPJTUOEWEK-ZXZARUISSA-N meso-butane-2,3-diol Chemical compound C[C@@H](O)[C@H](C)O OWBTYPJTUOEWEK-ZXZARUISSA-N 0.000 description 8
- 108010005942 methionylglycine Proteins 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- AOWPAWLEXIYETE-UHFFFAOYSA-N 2,3-Dihydroxy-2-methylbutanoic acid Chemical compound CC(O)C(C)(O)C(O)=O AOWPAWLEXIYETE-UHFFFAOYSA-N 0.000 description 7
- RBMDHOLTICUZIY-UHFFFAOYSA-N CC(=O)C(C)OP(=O)=O Chemical compound CC(=O)C(C)OP(=O)=O RBMDHOLTICUZIY-UHFFFAOYSA-N 0.000 description 7
- 241000660147 Escherichia coli str. K-12 substr. MG1655 Species 0.000 description 7
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- 241000187563 Rhodococcus ruber Species 0.000 description 7
- 240000008042 Zea mays Species 0.000 description 7
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 7
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 7
- 230000002759 chromosomal effect Effects 0.000 description 7
- 235000005822 corn Nutrition 0.000 description 7
- 238000004520 electroporation Methods 0.000 description 7
- 238000007429 general method Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 7
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 7
- 108010087823 glycyltyrosine Proteins 0.000 description 7
- 108010037850 glycylvaline Proteins 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 239000000543 intermediate Substances 0.000 description 7
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 7
- 230000014759 maintenance of location Effects 0.000 description 7
- 239000013642 negative control Substances 0.000 description 7
- 108010070643 prolylglutamic acid Proteins 0.000 description 7
- 108010029020 prolylglycine Proteins 0.000 description 7
- 108010015796 prolylisoleucine Proteins 0.000 description 7
- 239000011541 reaction mixture Substances 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- HXKKHQJGJAFBHI-UHFFFAOYSA-N 1-aminopropan-2-ol Chemical compound CC(O)CN HXKKHQJGJAFBHI-UHFFFAOYSA-N 0.000 description 6
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 6
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 6
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 6
- 239000002028 Biomass Substances 0.000 description 6
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 6
- 241000194036 Lactococcus Species 0.000 description 6
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 6
- 101100505872 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) xcpT gene Proteins 0.000 description 6
- 101100016023 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) xcpV gene Proteins 0.000 description 6
- 241000589776 Pseudomonas putida Species 0.000 description 6
- 241000187561 Rhodococcus erythropolis Species 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 235000004279 alanine Nutrition 0.000 description 6
- 108010008355 arginyl-glutamine Proteins 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- 150000001720 carbohydrates Chemical class 0.000 description 6
- 235000014633 carbohydrates Nutrition 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- RXKJFZQQPQGTFL-UHFFFAOYSA-N dihydroxyacetone Chemical compound OCC(=O)CO RXKJFZQQPQGTFL-UHFFFAOYSA-N 0.000 description 6
- 238000004817 gas chromatography Methods 0.000 description 6
- 108010015792 glycyllysine Proteins 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 238000002887 multiple sequence alignment Methods 0.000 description 6
- 229960001327 pyridoxal phosphate Drugs 0.000 description 6
- 229940107700 pyruvic acid Drugs 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- MXZROAOUCUVNHX-UHFFFAOYSA-N 2-Aminopropanol Chemical compound CCC(N)O MXZROAOUCUVNHX-UHFFFAOYSA-N 0.000 description 5
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 5
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 5
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 5
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 5
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 5
- KTGFOCFYOZQVRJ-ZKWXMUAHSA-N Ile-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-ZKWXMUAHSA-N 0.000 description 5
- 240000006024 Lactobacillus plantarum Species 0.000 description 5
- 235000013965 Lactobacillus plantarum Nutrition 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 5
- 101100016013 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) xcpU gene Proteins 0.000 description 5
- 241000588756 Raoultella terrigena Species 0.000 description 5
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 150000001299 aldehydes Chemical class 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 239000001273 butane Substances 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 230000021615 conjugation Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000000446 fuel Substances 0.000 description 5
- 239000002816 fuel additive Substances 0.000 description 5
- 239000006481 glucose medium Substances 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 108010036413 histidylglycine Proteins 0.000 description 5
- HYYHQASRTSDPOD-UHFFFAOYSA-N hydroxylamine;phosphoric acid Chemical compound ON.OP(O)(O)=O HYYHQASRTSDPOD-UHFFFAOYSA-N 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 150000002576 ketones Chemical class 0.000 description 5
- 108010053037 kyotorphin Proteins 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 108010003700 lysyl aspartic acid Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 229950006238 nadide Drugs 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 239000008057 potassium phosphate buffer Substances 0.000 description 5
- 239000002994 raw material Substances 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 238000000527 sonication Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 235000000346 sugar Nutrition 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 229910001868 water Inorganic materials 0.000 description 5
- PHOLIFLKGONSGY-CSKARUKUSA-N (e)-(3-methyl-1,3-benzothiazol-2-ylidene)hydrazine Chemical compound C1=CC=C2S\C(=N\N)N(C)C2=C1 PHOLIFLKGONSGY-CSKARUKUSA-N 0.000 description 4
- 241000588986 Alcaligenes Species 0.000 description 4
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 4
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 4
- XTWSWDJMIKUJDQ-RYUDHWBXSA-N Arg-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XTWSWDJMIKUJDQ-RYUDHWBXSA-N 0.000 description 4
- QJMCHPGWFZZRID-BQBZGAKWSA-N Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O QJMCHPGWFZZRID-BQBZGAKWSA-N 0.000 description 4
- 241001660259 Cereus <cactus> Species 0.000 description 4
- 241000252867 Cupriavidus metallidurans Species 0.000 description 4
- 108010090461 DFG peptide Proteins 0.000 description 4
- 241000194032 Enterococcus faecalis Species 0.000 description 4
- SOIAHPSKKUYREP-CIUDSAMLSA-N Gln-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N SOIAHPSKKUYREP-CIUDSAMLSA-N 0.000 description 4
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 4
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 4
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 4
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 4
- 240000005979 Hordeum vulgare Species 0.000 description 4
- 235000007340 Hordeum vulgare Nutrition 0.000 description 4
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- 241001545494 Klebsiella michiganensis KCTC 1686 Species 0.000 description 4
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 4
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 4
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 4
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 4
- SUHOOTKUPISOBE-UHFFFAOYSA-N O-phosphoethanolamine Chemical compound NCCOP(O)(O)=O SUHOOTKUPISOBE-UHFFFAOYSA-N 0.000 description 4
- 241000205156 Pyrococcus furiosus Species 0.000 description 4
- 108010079005 RDV peptide Proteins 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 4
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 4
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 4
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 4
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 4
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 4
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 229910021529 ammonia Inorganic materials 0.000 description 4
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 4
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 4
- 235000011130 ammonium sulphate Nutrition 0.000 description 4
- 239000003242 anti bacterial agent Substances 0.000 description 4
- 229940088710 antibiotic agent Drugs 0.000 description 4
- 239000007864 aqueous solution Substances 0.000 description 4
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- ZTQSAGDEMFDKMZ-UHFFFAOYSA-N butyric aldehyde Natural products CCCC=O ZTQSAGDEMFDKMZ-UHFFFAOYSA-N 0.000 description 4
- 229910002092 carbon dioxide Inorganic materials 0.000 description 4
- 238000006555 catalytic reaction Methods 0.000 description 4
- 239000007795 chemical reaction product Substances 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- ZIHHMGTYZOSFRC-UWWAPWIJSA-M cobamamide Chemical compound C1(/[C@](C)(CCC(=O)NC[C@H](C)OP(O)(=O)OC2[C@H]([C@H](O[C@@H]2CO)N2C3=CC(C)=C(C)C=C3N=C2)O)[C@@H](CC(N)=O)[C@]2(N1[Co+]C[C@@H]1[C@H]([C@@H](O)[C@@H](O1)N1C3=NC=NC(N)=C3N=C1)O)[H])=C(C)\C([C@H](C/1(C)C)CCC(N)=O)=N\C\1=C/C([C@H]([C@@]\1(CC(N)=O)C)CCC(N)=O)=N/C/1=C(C)\C1=N[C@]2(C)[C@@](C)(CC(N)=O)[C@@H]1CCC(N)=O ZIHHMGTYZOSFRC-UWWAPWIJSA-M 0.000 description 4
- 235000006279 cobamamide Nutrition 0.000 description 4
- 239000011789 cobamamide Substances 0.000 description 4
- 238000001212 derivatisation Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000008121 dextrose Substances 0.000 description 4
- 239000007789 gas Substances 0.000 description 4
- 230000002779 inactivation Effects 0.000 description 4
- 229940072205 lactobacillus plantarum Drugs 0.000 description 4
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 229960003581 pyridoxal Drugs 0.000 description 4
- 235000008164 pyridoxal Nutrition 0.000 description 4
- 239000011674 pyridoxal Substances 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 239000007858 starting material Substances 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- FERWBXLFSBWTDE-IUYQGCFVSA-N (2r,3s)-3-aminobutan-2-ol Chemical compound C[C@H](N)[C@@H](C)O FERWBXLFSBWTDE-IUYQGCFVSA-N 0.000 description 3
- HORQAOAYAYGIBM-UHFFFAOYSA-N 2,4-dinitrophenylhydrazine Chemical compound NNC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O HORQAOAYAYGIBM-UHFFFAOYSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 102100029464 Aquaporin-9 Human genes 0.000 description 3
- XTGGTAWGUFXJSV-NAKRPEOUSA-N Arg-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N XTGGTAWGUFXJSV-NAKRPEOUSA-N 0.000 description 3
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 3
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 3
- MQLZLIYPFDIDMZ-HAFWLYHUSA-N Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O MQLZLIYPFDIDMZ-HAFWLYHUSA-N 0.000 description 3
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 3
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 3
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 3
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 3
- 239000007989 BIS-Tris Propane buffer Substances 0.000 description 3
- 241000193755 Bacillus cereus Species 0.000 description 3
- 241000194108 Bacillus licheniformis Species 0.000 description 3
- 101100098786 Bacillus subtilis (strain 168) tapA gene Proteins 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 241000193401 Clostridium acetobutylicum Species 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- 108030006766 Cyclohexanol dehydrogenases Proteins 0.000 description 3
- BIVLWXQGXJLGKG-BIIVOSGPSA-N Cys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)C(=O)O BIVLWXQGXJLGKG-BIIVOSGPSA-N 0.000 description 3
- 108020005199 Dehydrogenases Proteins 0.000 description 3
- 101100321116 Escherichia coli (strain K12) yqhD gene Proteins 0.000 description 3
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 3
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 3
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 3
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 3
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 3
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 3
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 3
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 3
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 3
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 3
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 3
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 3
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 3
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 3
- 108010015895 Glycerone kinase Proteins 0.000 description 3
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 3
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 3
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 3
- 101000771413 Homo sapiens Aquaporin-9 Proteins 0.000 description 3
- 101000921370 Homo sapiens Elongation of very long chain fatty acids protein 1 Proteins 0.000 description 3
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 3
- UCGDDTHMMVWVMV-FSPLSTOPSA-N Ile-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(O)=O UCGDDTHMMVWVMV-FSPLSTOPSA-N 0.000 description 3
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 3
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 3
- 241001055489 Klebsiella pneumoniae ATCC 25955 Species 0.000 description 3
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 3
- 241001112724 Lactobacillales Species 0.000 description 3
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 3
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 3
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 3
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 3
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 3
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 3
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 3
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 3
- YLBUMXYVQCHBPR-ULQDDVLXSA-N Met-Leu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YLBUMXYVQCHBPR-ULQDDVLXSA-N 0.000 description 3
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 3
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241000178960 Paenibacillus macerans Species 0.000 description 3
- 241001148142 Pectobacterium atrosepticum Species 0.000 description 3
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 3
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 3
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 3
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 3
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 3
- JXVXYRZQIUPYSA-NHCYSSNCSA-N Pro-Val-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JXVXYRZQIUPYSA-NHCYSSNCSA-N 0.000 description 3
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 3
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 3
- BXLYSRPHVMCOPS-ACZMJKKPSA-N Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO BXLYSRPHVMCOPS-ACZMJKKPSA-N 0.000 description 3
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 3
- 229930006000 Sucrose Natural products 0.000 description 3
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 3
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- 241000209140 Triticum Species 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 3
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 3
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 3
- JYVKKBDANPZIAW-AVGNSLFASA-N Val-Arg-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N JYVKKBDANPZIAW-AVGNSLFASA-N 0.000 description 3
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 3
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 3
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 3
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 3
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 3
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 3
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 3
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 3
- GJNDXQBALKCYSZ-RYUDHWBXSA-N Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 GJNDXQBALKCYSZ-RYUDHWBXSA-N 0.000 description 3
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 3
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 3
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 3
- 108700040099 Xylose isomerases Proteins 0.000 description 3
- WDWYJNPKBKWDBL-GSVOUGTGSA-N [(2r)-2-amino-3-hydroxypropyl] dihydrogen phosphate Chemical compound OC[C@@H](N)COP(O)(O)=O WDWYJNPKBKWDBL-GSVOUGTGSA-N 0.000 description 3
- HXVYXGXJLKOREU-VKHMYHEASA-N [(2s)-2-aminopropyl] dihydrogen phosphate Chemical compound C[C@H](N)COP(O)(O)=O HXVYXGXJLKOREU-VKHMYHEASA-N 0.000 description 3
- 150000001298 alcohols Chemical class 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 230000001851 biosynthetic effect Effects 0.000 description 3
- 229940098773 bovine serum albumin Drugs 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 229960003669 carbenicillin Drugs 0.000 description 3
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 3
- 230000010261 cell growth Effects 0.000 description 3
- 239000001913 cellulose Substances 0.000 description 3
- 229920002678 cellulose Polymers 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 239000005515 coenzyme Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 108010069495 cysteinyltyrosine Proteins 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 108010009297 diglycyl-histidine Proteins 0.000 description 3
- 229940120503 dihydroxyacetone Drugs 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 229940032049 enterococcus faecalis Drugs 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000009483 enzymatic pathway Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 125000005639 glycero group Chemical group 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 239000010903 husk Substances 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 108010091871 leucylmethionine Proteins 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- IJDNQMDRQITEOD-UHFFFAOYSA-N n-butane Chemical compound CCCC IJDNQMDRQITEOD-UHFFFAOYSA-N 0.000 description 3
- OFBQJSOFQDEBGM-UHFFFAOYSA-N n-pentane Natural products CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 3
- 238000007899 nucleic acid hybridization Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 108010073101 phenylalanylleucine Proteins 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 108010071207 serylmethionine Proteins 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 3
- 229960000268 spectinomycin Drugs 0.000 description 3
- 239000008107 starch Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 239000010902 straw Substances 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 229960002363 thiamine pyrophosphate Drugs 0.000 description 3
- 235000008170 thiamine pyrophosphate Nutrition 0.000 description 3
- 239000011678 thiamine pyrophosphate Substances 0.000 description 3
- YXVCLPJQTZXJLH-UHFFFAOYSA-N thiamine(1+) diphosphate chloride Chemical compound [Cl-].CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N YXVCLPJQTZXJLH-UHFFFAOYSA-N 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- 239000002023 wood Substances 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- 101150113187 yqhD gene Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- BKMMTJMQCTUHRP-GSVOUGTGSA-N (2r)-2-aminopropan-1-ol Chemical compound C[C@@H](N)CO BKMMTJMQCTUHRP-GSVOUGTGSA-N 0.000 description 2
- FERWBXLFSBWTDE-QWWZWVQMSA-N (2r,3r)-3-aminobutan-2-ol Chemical compound C[C@@H](N)[C@@H](C)O FERWBXLFSBWTDE-QWWZWVQMSA-N 0.000 description 2
- FERWBXLFSBWTDE-DMTCNVIQSA-N (2s,3r)-3-aminobutan-2-ol Chemical compound C[C@@H](N)[C@H](C)O FERWBXLFSBWTDE-DMTCNVIQSA-N 0.000 description 2
- ROWKJAVDOGWPAT-GSVOUGTGSA-N (R)-Acetoin Chemical compound C[C@@H](O)C(C)=O ROWKJAVDOGWPAT-GSVOUGTGSA-N 0.000 description 2
- 108010011958 1,3-propanediol dehydrogenase Proteins 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- OTEWWRBKGONZBW-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]-4-methylpentanoyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NC(CC(C)C)C(=O)NCC(=O)NCC(O)=O OTEWWRBKGONZBW-UHFFFAOYSA-N 0.000 description 2
- UZUVVWLZFKXOEE-UHFFFAOYSA-N 3-hydroxybutan-2-one;phosphoric acid Chemical compound OP(O)(O)=O.CC(O)C(C)=O UZUVVWLZFKXOEE-UHFFFAOYSA-N 0.000 description 2
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 2
- 240000005020 Acaciella glauca Species 0.000 description 2
- IKHGUXGNUITLKF-UHFFFAOYSA-N Acetaldehyde Chemical compound CC=O IKHGUXGNUITLKF-UHFFFAOYSA-N 0.000 description 2
- 241000589291 Acinetobacter Species 0.000 description 2
- 241000588625 Acinetobacter sp. Species 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 2
- OTUQSEPIIVBYEM-IHRRRGAJSA-N Arg-Asn-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OTUQSEPIIVBYEM-IHRRRGAJSA-N 0.000 description 2
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 2
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 2
- YHQGEARSFILVHL-HJGDQZAQSA-N Arg-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O YHQGEARSFILVHL-HJGDQZAQSA-N 0.000 description 2
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 2
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 2
- PRLPSDIHSRITSF-UNQGMJICSA-N Arg-Phe-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PRLPSDIHSRITSF-UNQGMJICSA-N 0.000 description 2
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 2
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 2
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 2
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 2
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 2
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 2
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 2
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 2
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 2
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 2
- RLHANKIRBONJBK-IHRRRGAJSA-N Asn-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N RLHANKIRBONJBK-IHRRRGAJSA-N 0.000 description 2
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 2
- VBKIFHUVGLOJKT-FKZODXBYSA-N Asn-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)N)O VBKIFHUVGLOJKT-FKZODXBYSA-N 0.000 description 2
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 2
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 2
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 2
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 2
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 2
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 2
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 2
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 2
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 2
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 2
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 2
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 2
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 2
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 2
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 2
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 2
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- 244000218454 Bambusa tulda Species 0.000 description 2
- 235000017491 Bambusa tulda Nutrition 0.000 description 2
- 241000995051 Brenda Species 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 241000588919 Citrobacter freundii Species 0.000 description 2
- BDWIZLQVVWQMTB-XKBZYTNZSA-N Cys-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N)O BDWIZLQVVWQMTB-XKBZYTNZSA-N 0.000 description 2
- VOBMMKMWSIVIOA-SRVKXCTJSA-N Cys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N VOBMMKMWSIVIOA-SRVKXCTJSA-N 0.000 description 2
- IDZDFWJNPOOOHE-KKUMJFAQSA-N Cys-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N IDZDFWJNPOOOHE-KKUMJFAQSA-N 0.000 description 2
- FTTZLFIEUQHLHH-BWBBJGPYSA-N Cys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O FTTZLFIEUQHLHH-BWBBJGPYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 2
- 239000003155 DNA primer Substances 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000194031 Enterococcus faecium Species 0.000 description 2
- 102100026859 FAD-AMP lyase (cyclizing) Human genes 0.000 description 2
- 241000192125 Firmicutes Species 0.000 description 2
- 229930091371 Fructose Natural products 0.000 description 2
- 239000005715 Fructose Substances 0.000 description 2
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 2
- 230000005526 G1 to G0 transition Effects 0.000 description 2
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 2
- LOJYQMFIIJVETK-WDSKDSINSA-N Gln-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LOJYQMFIIJVETK-WDSKDSINSA-N 0.000 description 2
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 2
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 2
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 2
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 2
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 2
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 2
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 2
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 2
- XFHMVFKCQSHLKW-HJGDQZAQSA-N Gln-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O XFHMVFKCQSHLKW-HJGDQZAQSA-N 0.000 description 2
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 2
- SJMJMEWQMBJYPR-DZKIICNBSA-N Gln-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N SJMJMEWQMBJYPR-DZKIICNBSA-N 0.000 description 2
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 2
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 2
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 2
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 2
- PABVKUJVLNMOJP-WHFBIAKZSA-N Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(O)=O PABVKUJVLNMOJP-WHFBIAKZSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 2
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 2
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 2
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 2
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 2
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 2
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 2
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 2
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 2
- YNIMVVJTPWCUJH-KBPBESRZSA-N Gly-His-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YNIMVVJTPWCUJH-KBPBESRZSA-N 0.000 description 2
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 2
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 2
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 2
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 2
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 2
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 2
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 2
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- FPNWKONEZAVQJF-GUBZILKMSA-N His-Asn-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N FPNWKONEZAVQJF-GUBZILKMSA-N 0.000 description 2
- ZNNNYCXPCKACHX-DCAQKATOSA-N His-Gln-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNNNYCXPCKACHX-DCAQKATOSA-N 0.000 description 2
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 2
- WEIYKCOEVBUJQC-JYJNAYRXSA-N His-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WEIYKCOEVBUJQC-JYJNAYRXSA-N 0.000 description 2
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 2
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 2
- MFQVZYSPCIZFMR-MGHWNKPDSA-N His-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N MFQVZYSPCIZFMR-MGHWNKPDSA-N 0.000 description 2
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 2
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 2
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 2
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- WRPDZHJNLYNFFT-GEVIPFJHSA-N His-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O WRPDZHJNLYNFFT-GEVIPFJHSA-N 0.000 description 2
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 2
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 2
- QLBXWYXMLHAREM-PYJNHQTQSA-N His-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N QLBXWYXMLHAREM-PYJNHQTQSA-N 0.000 description 2
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 2
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 2
- JSZMKEYEVLDPDO-ACZMJKKPSA-N Ile-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(O)=O JSZMKEYEVLDPDO-ACZMJKKPSA-N 0.000 description 2
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 2
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 2
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 2
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 2
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 2
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 2
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 2
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 2
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 2
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-UWTATZPHSA-N L-Alanine Natural products C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 2
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- 241001468197 Lactobacillus collinoides Species 0.000 description 2
- 101100510641 Lactococcus lactis subsp. lactis spaN gene Proteins 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 2
- JYOAXOMPIXKMKK-YUMQZZPRSA-N Leu-Gln Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCC(N)=O JYOAXOMPIXKMKK-YUMQZZPRSA-N 0.000 description 2
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 2
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 2
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 2
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 2
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 2
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 2
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 2
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 2
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 2
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 2
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 239000007993 MOPS buffer Substances 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- JMEWFDUAFKVAAT-WDSKDSINSA-N Met-Asn Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O JMEWFDUAFKVAAT-WDSKDSINSA-N 0.000 description 2
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 2
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 2
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 2
- MCNGIXXCMJAURZ-VEVYYDQMSA-N Met-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCSC)N)O MCNGIXXCMJAURZ-VEVYYDQMSA-N 0.000 description 2
- MUMXFARPYQTTSL-BQBZGAKWSA-N Met-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O MUMXFARPYQTTSL-BQBZGAKWSA-N 0.000 description 2
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 2
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 2
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 2
- BCRQJDMZQUHQSV-STQMWFEESA-N Met-Gly-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BCRQJDMZQUHQSV-STQMWFEESA-N 0.000 description 2
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 2
- HGCNKOLVKRAVHD-RYUDHWBXSA-N Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-RYUDHWBXSA-N 0.000 description 2
- WYNIRYZIFZGWQD-BPUTZDHNSA-N Met-Trp-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WYNIRYZIFZGWQD-BPUTZDHNSA-N 0.000 description 2
- BAVYZALUXZFZLV-UHFFFAOYSA-N Methylamine Chemical compound NC BAVYZALUXZFZLV-UHFFFAOYSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- KGTZWFSRCHZESN-UHFFFAOYSA-N O=P(=O)C(C)C(C)(O)C(O)=O Chemical compound O=P(=O)C(C)C(C)(O)C(O)=O KGTZWFSRCHZESN-UHFFFAOYSA-N 0.000 description 2
- 101150102573 PCR1 gene Proteins 0.000 description 2
- 241000179039 Paenibacillus Species 0.000 description 2
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 2
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 2
- HGNGAMWHGGANAU-WHOFXGATSA-N Phe-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HGNGAMWHGGANAU-WHOFXGATSA-N 0.000 description 2
- ZKSLXIGKRJMALF-MGHWNKPDSA-N Phe-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N ZKSLXIGKRJMALF-MGHWNKPDSA-N 0.000 description 2
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 2
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 2
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 2
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 2
- PYOHODCEOHCZBM-RYUDHWBXSA-N Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 PYOHODCEOHCZBM-RYUDHWBXSA-N 0.000 description 2
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 2
- IEHDJWSAXBGJIP-RYUDHWBXSA-N Phe-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 IEHDJWSAXBGJIP-RYUDHWBXSA-N 0.000 description 2
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 2
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 2
- DRIJZWBRGMJCDD-DCAQKATOSA-N Pro-Gln-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O DRIJZWBRGMJCDD-DCAQKATOSA-N 0.000 description 2
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 2
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 2
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- OCYROESYHWUPBP-CIUDSAMLSA-N Pro-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 OCYROESYHWUPBP-CIUDSAMLSA-N 0.000 description 2
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 2
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 2
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 2
- UEKYKRQIAQHOOZ-KBPBESRZSA-N Pro-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)[O-])C(=O)[C@@H]1CCC[NH2+]1 UEKYKRQIAQHOOZ-KBPBESRZSA-N 0.000 description 2
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 2
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 2
- 101150023114 RNA1 gene Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 101100476979 Rhodobacter capsulatus sdsA gene Proteins 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 2
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 2
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 2
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 2
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 2
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 2
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 2
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 2
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 2
- RJBFAHKSFNNHAI-XKBZYTNZSA-N Thr-Gln-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O RJBFAHKSFNNHAI-XKBZYTNZSA-N 0.000 description 2
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 2
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 2
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 2
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 2
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 2
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 2
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 2
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 2
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 2
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 2
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 2
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 2
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 2
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 2
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 2
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 2
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 2
- LAIUAVGWZYTBKN-VHWLVUOQSA-N Trp-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O LAIUAVGWZYTBKN-VHWLVUOQSA-N 0.000 description 2
- WQYPAGQDXAJNED-AAEUAGOBSA-N Trp-Cys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N WQYPAGQDXAJNED-AAEUAGOBSA-N 0.000 description 2
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 2
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 2
- UOXPLPBMEPLZBW-WDSOQIARSA-N Trp-Val-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 UOXPLPBMEPLZBW-WDSOQIARSA-N 0.000 description 2
- ARPONUQDNWLXOZ-KKUMJFAQSA-N Tyr-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ARPONUQDNWLXOZ-KKUMJFAQSA-N 0.000 description 2
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 2
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 2
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 2
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 2
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 2
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 2
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 2
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 2
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 2
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 2
- DHINLYMWMXQGMQ-IHRRRGAJSA-N Val-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 DHINLYMWMXQGMQ-IHRRRGAJSA-N 0.000 description 2
- PNVLWFYAPWAQMU-CIUDSAMLSA-N Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)C(C)C PNVLWFYAPWAQMU-CIUDSAMLSA-N 0.000 description 2
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 2
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 2
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 2
- UXODSMTVPWXHBT-ULQDDVLXSA-N Val-Phe-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N UXODSMTVPWXHBT-ULQDDVLXSA-N 0.000 description 2
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 2
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 2
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 2
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 2
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000607291 Vibrio fluvialis Species 0.000 description 2
- 229930003779 Vitamin B12 Natural products 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 125000001931 aliphatic group Chemical group 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 150000001412 amines Chemical group 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 238000005842 biochemical reaction Methods 0.000 description 2
- HHKZCCWKTZRCCL-UHFFFAOYSA-N bis-tris propane Chemical compound OCC(CO)(CO)NCCCNC(CO)(CO)CO HHKZCCWKTZRCCL-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 description 2
- 238000002485 combustion reaction Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 101150011756 ddrA gene Proteins 0.000 description 2
- 101150073964 ddrB gene Proteins 0.000 description 2
- 238000010908 decantation Methods 0.000 description 2
- 238000006114 decarboxylation reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001952 enzyme assay Methods 0.000 description 2
- 108010044215 ethanolamine kinase Proteins 0.000 description 2
- 238000002825 functional assay Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 2
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 2
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 2
- 230000009036 growth inhibition Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 239000001307 helium Substances 0.000 description 2
- 229910052734 helium Inorganic materials 0.000 description 2
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 150000002431 hydrogen Chemical class 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- SYSQUGFVNFXIIT-UHFFFAOYSA-N n-[4-(1,3-benzoxazol-2-yl)phenyl]-4-nitrobenzenesulfonamide Chemical class C1=CC([N+](=O)[O-])=CC=C1S(=O)(=O)NC1=CC=C(C=2OC3=CC=CC=C3N=2)C=C1 SYSQUGFVNFXIIT-UHFFFAOYSA-N 0.000 description 2
- 239000006225 natural substrate Substances 0.000 description 2
- 229960003966 nicotinamide Drugs 0.000 description 2
- 235000005152 nicotinamide Nutrition 0.000 description 2
- 239000011570 nicotinamide Substances 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 239000003973 paint Substances 0.000 description 2
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 2
- DTBNBXWJWCWCIK-UHFFFAOYSA-K phosphonatoenolpyruvate Chemical compound [O-]C(=O)C(=C)OP([O-])([O-])=O DTBNBXWJWCWCIK-UHFFFAOYSA-K 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 235000003499 redwood Nutrition 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 150000003333 secondary alcohols Chemical class 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229960003495 thiamine Drugs 0.000 description 2
- 235000019157 thiamine Nutrition 0.000 description 2
- 239000011721 thiamine Substances 0.000 description 2
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 239000011573 trace mineral Substances 0.000 description 2
- 235000013619 trace mineral Nutrition 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 108700004896 tripeptide FEG Proteins 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 239000011715 vitamin B12 Substances 0.000 description 2
- 235000019163 vitamin B12 Nutrition 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 108010000998 wheylin-2 peptide Proteins 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- PQXKWPLDPFFDJP-IMJSIDKUSA-N (2s,3s)-2,3-dimethyloxirane Chemical compound C[C@@H]1O[C@H]1C PQXKWPLDPFFDJP-IMJSIDKUSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 1
- DNIAPMSPPWPWGF-GSVOUGTGSA-N (R)-(-)-Propylene glycol Chemical compound C[C@@H](O)CO DNIAPMSPPWPWGF-GSVOUGTGSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 1
- BKMMTJMQCTUHRP-VKHMYHEASA-N (S)-2-aminopropan-1-ol Chemical compound C[C@H](N)CO BKMMTJMQCTUHRP-VKHMYHEASA-N 0.000 description 1
- RBACIKXCRWGCBB-UHFFFAOYSA-N 1,2-Epoxybutane Chemical compound CCC1CO1 RBACIKXCRWGCBB-UHFFFAOYSA-N 0.000 description 1
- VXNZUUAINFGPBY-UHFFFAOYSA-N 1-Butene Chemical compound CCC=C VXNZUUAINFGPBY-UHFFFAOYSA-N 0.000 description 1
- YBOLZUJJGUZUDC-UHFFFAOYSA-N 1-aminopropan-2-yl phosphate Chemical compound NCC(C)OP(O)(O)=O YBOLZUJJGUZUDC-UHFFFAOYSA-N 0.000 description 1
- PQXKWPLDPFFDJP-UHFFFAOYSA-N 2,3-dimethyloxirane Chemical class CC1OC1C PQXKWPLDPFFDJP-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- MSWZFWKMSRAUBD-IVMDWMLBSA-N 2-amino-2-deoxy-D-glucopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-IVMDWMLBSA-N 0.000 description 1
- 102100025230 2-amino-3-ketobutyrate coenzyme A ligase, mitochondrial Human genes 0.000 description 1
- IVLXQGJVBGMLRR-UHFFFAOYSA-N 2-aminoacetic acid;hydron;chloride Chemical compound Cl.NCC(O)=O IVLXQGJVBGMLRR-UHFFFAOYSA-N 0.000 description 1
- ZSOSTTWEQBUFFE-UHFFFAOYSA-N 2-fluoro-4-[7-(quinolin-6-ylmethyl)imidazo[1,2-b][1,2,4]triazin-2-yl]benzamide Chemical compound C1=C(F)C(C(=O)N)=CC=C1C1=NN2C(CC=3C=C4C=CC=NC4=CC=3)=CN=C2N=C1 ZSOSTTWEQBUFFE-UHFFFAOYSA-N 0.000 description 1
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 1
- BPPVUXSMLBXYGG-UHFFFAOYSA-N 4-[3-(4,5-dihydro-1,2-oxazol-3-yl)-2-methyl-4-methylsulfonylbenzoyl]-2-methyl-1h-pyrazol-3-one Chemical compound CC1=C(C(=O)C=2C(N(C)NC=2)=O)C=CC(S(C)(=O)=O)=C1C1=NOCC1 BPPVUXSMLBXYGG-UHFFFAOYSA-N 0.000 description 1
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 1
- 108010087522 Aeromonas hydrophilia lipase-acyltransferase Proteins 0.000 description 1
- SITWEMZOJNKJCH-WDSKDSINSA-N Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SITWEMZOJNKJCH-WDSKDSINSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 102100036826 Aldehyde oxidase Human genes 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241001230014 Amana <moth> Species 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 102100030346 Antigen peptide transporter 1 Human genes 0.000 description 1
- 108050009514 Antigen peptide transporter 1 Proteins 0.000 description 1
- 101100388296 Arabidopsis thaliana DTX51 gene Proteins 0.000 description 1
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- ZCSHHTFOZULVLN-SZMVWBNQSA-N Arg-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 ZCSHHTFOZULVLN-SZMVWBNQSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 1
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- OWUCNXMFJRFOFI-BQBZGAKWSA-N Asn-Gly-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OWUCNXMFJRFOFI-BQBZGAKWSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- IQTUDDBANZYMAR-WDSKDSINSA-N Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O IQTUDDBANZYMAR-WDSKDSINSA-N 0.000 description 1
- KNENKKKUYGEZIO-FXQIFTODSA-N Asn-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N KNENKKKUYGEZIO-FXQIFTODSA-N 0.000 description 1
- NNDSLVWAQAUPPP-GUBZILKMSA-N Asn-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N NNDSLVWAQAUPPP-GUBZILKMSA-N 0.000 description 1
- PBFXCUOEGVJTMV-QXEWZRGKSA-N Asn-Met-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O PBFXCUOEGVJTMV-QXEWZRGKSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- BIGRHVNFFJTHEB-UBHSHLNASA-N Asn-Trp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O BIGRHVNFFJTHEB-UBHSHLNASA-N 0.000 description 1
- YNQMEIJEWSHOEO-SRVKXCTJSA-N Asn-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YNQMEIJEWSHOEO-SRVKXCTJSA-N 0.000 description 1
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 1
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- DZQKLNLLWFQONU-LKXGYXEUSA-N Asp-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O DZQKLNLLWFQONU-LKXGYXEUSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 1
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- ILQCHXURSRRIRY-YUMQZZPRSA-N Asp-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N ILQCHXURSRRIRY-YUMQZZPRSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- MFTVXYMXSAQZNL-DJFWLOJKSA-N Asp-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)O)N MFTVXYMXSAQZNL-DJFWLOJKSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- FIRWLDUOFOULCA-XIRDDKMYSA-N Asp-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N FIRWLDUOFOULCA-XIRDDKMYSA-N 0.000 description 1
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- GZYDPEJSZYZWEF-MXAVVETBSA-N Asp-Val-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O GZYDPEJSZYZWEF-MXAVVETBSA-N 0.000 description 1
- 102100039341 Atrial natriuretic peptide receptor 2 Human genes 0.000 description 1
- 101710102159 Atrial natriuretic peptide receptor 2 Proteins 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- PCLCDPVEEFVAAQ-UHFFFAOYSA-N BCA 1 Chemical compound CC(CO)CCCC(C)C1=CCC(C)(O)C1CC2=C(O)C(O)CCC2=O PCLCDPVEEFVAAQ-UHFFFAOYSA-N 0.000 description 1
- 241001289141 Babr Species 0.000 description 1
- 108090000145 Bacillolysin Proteins 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 101100072559 Bacillus subtilis (strain 168) alsS gene Proteins 0.000 description 1
- 101100434663 Bacillus subtilis (strain 168) fbaA gene Proteins 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- 241000589173 Bradyrhizobium Species 0.000 description 1
- 102100025277 C-X-C motif chemokine 13 Human genes 0.000 description 1
- XRZCEBLAQCHHIE-UHFFFAOYSA-N CN.[C] Chemical compound CN.[C] XRZCEBLAQCHHIE-UHFFFAOYSA-N 0.000 description 1
- 101100148606 Caenorhabditis elegans pst-1 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 102100025570 Cancer/testis antigen 1 Human genes 0.000 description 1
- 241000222173 Candida parapsilosis Species 0.000 description 1
- 102100031065 Choline kinase alpha Human genes 0.000 description 1
- YASYEJJMZJALEJ-UHFFFAOYSA-N Citric acid monohydrate Chemical compound O.OC(=O)CC(O)(C(O)=O)CC(O)=O YASYEJJMZJALEJ-UHFFFAOYSA-N 0.000 description 1
- 241001091551 Clio Species 0.000 description 1
- 241001112696 Clostridia Species 0.000 description 1
- 241000193171 Clostridium butyricum Species 0.000 description 1
- 241000193469 Clostridium pasteurianum Species 0.000 description 1
- 229910021580 Cobalt(II) chloride Inorganic materials 0.000 description 1
- 235000019750 Crude protein Nutrition 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- NOCCABSVTRONIN-CIUDSAMLSA-N Cys-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N NOCCABSVTRONIN-CIUDSAMLSA-N 0.000 description 1
- DZIGZIIJIGGANI-FXQIFTODSA-N Cys-Glu-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DZIGZIIJIGGANI-FXQIFTODSA-N 0.000 description 1
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 1
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 1
- ZGERHCJBLPQPGV-ACZMJKKPSA-N Cys-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N ZGERHCJBLPQPGV-ACZMJKKPSA-N 0.000 description 1
- DSTWKJOBKSMVCV-UWVGGRQHSA-N Cys-Tyr Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DSTWKJOBKSMVCV-UWVGGRQHSA-N 0.000 description 1
- OELDIVRKHTYFNG-WDSKDSINSA-N Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CS OELDIVRKHTYFNG-WDSKDSINSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 102100024607 DNA topoisomerase 1 Human genes 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000480784 Ensina Species 0.000 description 1
- 230000004619 Entner-Doudoroff pathway Effects 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 102100033175 Ethanolamine kinase 1 Human genes 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 101150095274 FBA1 gene Proteins 0.000 description 1
- 108010046276 FLP recombinase Proteins 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 101150038242 GAL10 gene Proteins 0.000 description 1
- 102100028501 Galanin peptides Human genes 0.000 description 1
- 102100024637 Galectin-10 Human genes 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 1
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 1
- MFLMFRZBAJSGHK-ACZMJKKPSA-N Gln-Cys-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N MFLMFRZBAJSGHK-ACZMJKKPSA-N 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 1
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 1
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- QQAPDATZKKTBIY-YUMQZZPRSA-N Gln-Gly-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O QQAPDATZKKTBIY-YUMQZZPRSA-N 0.000 description 1
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 1
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- ARPVSMCNIDAQBO-YUMQZZPRSA-N Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ARPVSMCNIDAQBO-YUMQZZPRSA-N 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- WEAVZFWWIPIANL-SRVKXCTJSA-N Gln-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N WEAVZFWWIPIANL-SRVKXCTJSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 1
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 1
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 1
- MRVYVEQPNDSWLH-XPUUQOCRSA-N Gln-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O MRVYVEQPNDSWLH-XPUUQOCRSA-N 0.000 description 1
- QZQYITIKPAUDGN-GVXVVHGQSA-N Gln-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QZQYITIKPAUDGN-GVXVVHGQSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- MGHKSHCBDXNTHX-WDSKDSINSA-N Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MGHKSHCBDXNTHX-WDSKDSINSA-N 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 1
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- JVZLZVJTIXVIHK-SXNHZJKMSA-N Glu-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N JVZLZVJTIXVIHK-SXNHZJKMSA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 1
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- GZBZACMXFIPIDX-WHFBIAKZSA-N Gly-Cys-Asp Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)C(=O)O GZBZACMXFIPIDX-WHFBIAKZSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 1
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 1
- ZKLYPEGLWFVRGF-IUCAKERBSA-N Gly-His-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZKLYPEGLWFVRGF-IUCAKERBSA-N 0.000 description 1
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 1
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 1
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 1
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 1
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 1
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- IDNNYVGVSZMQTK-IHRRRGAJSA-N His-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N IDNNYVGVSZMQTK-IHRRRGAJSA-N 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 1
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 1
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 1
- WGHJXSONOOTTCZ-JYJNAYRXSA-N His-Glu-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WGHJXSONOOTTCZ-JYJNAYRXSA-N 0.000 description 1
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 1
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 1
- CTJHHEQNUNIYNN-SRVKXCTJSA-N His-His-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O CTJHHEQNUNIYNN-SRVKXCTJSA-N 0.000 description 1
- JBSLJUPMTYLLFH-MELADBBJSA-N His-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O JBSLJUPMTYLLFH-MELADBBJSA-N 0.000 description 1
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 1
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 1
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 1
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- LDFWDDVELNOGII-MXAVVETBSA-N His-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N LDFWDDVELNOGII-MXAVVETBSA-N 0.000 description 1
- BSVLMPMIXPQNKC-KBPBESRZSA-N His-Phe-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O BSVLMPMIXPQNKC-KBPBESRZSA-N 0.000 description 1
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 1
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 1
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 1
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 1
- SWBUZLFWGJETAO-KKUMJFAQSA-N His-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O SWBUZLFWGJETAO-KKUMJFAQSA-N 0.000 description 1
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 1
- WSXNWASHQNSMRX-GVXVVHGQSA-N His-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSXNWASHQNSMRX-GVXVVHGQSA-N 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 description 1
- 101000858064 Homo sapiens C-X-C motif chemokine 13 Proteins 0.000 description 1
- 101000856237 Homo sapiens Cancer/testis antigen 1 Proteins 0.000 description 1
- 101000830681 Homo sapiens DNA topoisomerase 1 Proteins 0.000 description 1
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 1
- 101001046426 Homo sapiens cGMP-dependent protein kinase 1 Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- UNDGQKWQNSTPPW-CYDGBPFRSA-N Ile-Arg-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N UNDGQKWQNSTPPW-CYDGBPFRSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- WTOAPTKSZJJWKK-HTFCKZLJSA-N Ile-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WTOAPTKSZJJWKK-HTFCKZLJSA-N 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- IXEFKXAGHRQFAF-HVTMNAMFSA-N Ile-Glu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IXEFKXAGHRQFAF-HVTMNAMFSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 1
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- AFERFBZLVUFWRA-HTFCKZLJSA-N Ile-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)O)N AFERFBZLVUFWRA-HTFCKZLJSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- UWBDLNOCIDGPQE-GUBZILKMSA-N Ile-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN UWBDLNOCIDGPQE-GUBZILKMSA-N 0.000 description 1
- FTUZWJVSNZMLPI-RVMXOQNASA-N Ile-Met-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N FTUZWJVSNZMLPI-RVMXOQNASA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- BBIXOODYWPFNDT-CIUDSAMLSA-N Ile-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O BBIXOODYWPFNDT-CIUDSAMLSA-N 0.000 description 1
- CZWANIQKACCEKW-CYDGBPFRSA-N Ile-Pro-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N CZWANIQKACCEKW-CYDGBPFRSA-N 0.000 description 1
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- BVRPESWOSNFUCJ-LKTVYLICSA-N Ile-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 BVRPESWOSNFUCJ-LKTVYLICSA-N 0.000 description 1
- CRYJOCSSSACEAA-VKOGCVSHSA-N Ile-Trp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N CRYJOCSSSACEAA-VKOGCVSHSA-N 0.000 description 1
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 229910021578 Iron(III) chloride Inorganic materials 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 240000001929 Lactobacillus brevis Species 0.000 description 1
- 235000013957 Lactobacillus brevis Nutrition 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- DUBAVOVZNZKEQQ-AVGNSLFASA-N Leu-Arg-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCN=C(N)N DUBAVOVZNZKEQQ-AVGNSLFASA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 1
- VFQOCUQGMUXTJR-DCAQKATOSA-N Leu-Cys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)O)N VFQOCUQGMUXTJR-DCAQKATOSA-N 0.000 description 1
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- YWFZWQKWNDOWPA-XIRDDKMYSA-N Leu-Trp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O YWFZWQKWNDOWPA-XIRDDKMYSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- QBGPXOGXCVKULO-BQBZGAKWSA-N Lys-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(O)=O QBGPXOGXCVKULO-BQBZGAKWSA-N 0.000 description 1
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 1
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 1
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 1
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 241000589195 Mesorhizobium loti Species 0.000 description 1
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 1
- ZAJNRWKGHWGPDQ-SDDRHHMPSA-N Met-Arg-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N ZAJNRWKGHWGPDQ-SDDRHHMPSA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- UAPZLLPGGOOCRO-IHRRRGAJSA-N Met-Asn-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N UAPZLLPGGOOCRO-IHRRRGAJSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- FBQMBZLJHOQAIH-GUBZILKMSA-N Met-Asp-Met Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O FBQMBZLJHOQAIH-GUBZILKMSA-N 0.000 description 1
- UOENBSHXYCHSAU-YUMQZZPRSA-N Met-Gln-Gly Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UOENBSHXYCHSAU-YUMQZZPRSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 1
- WXJXYMFUTRXRGO-UWVGGRQHSA-N Met-His-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 WXJXYMFUTRXRGO-UWVGGRQHSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- FTQOFRPGLYXRFM-CYDGBPFRSA-N Met-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCSC)N FTQOFRPGLYXRFM-CYDGBPFRSA-N 0.000 description 1
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 1
- ODFBIJXEWPWSAN-CYDGBPFRSA-N Met-Ile-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O ODFBIJXEWPWSAN-CYDGBPFRSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 1
- JOYFULUKJRJCSX-IUCAKERBSA-N Met-Met-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O JOYFULUKJRJCSX-IUCAKERBSA-N 0.000 description 1
- VWWGEKCAPBMIFE-SRVKXCTJSA-N Met-Met-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VWWGEKCAPBMIFE-SRVKXCTJSA-N 0.000 description 1
- ILKCLLLOGPDNIP-RCWTZXSCSA-N Met-Met-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ILKCLLLOGPDNIP-RCWTZXSCSA-N 0.000 description 1
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- KYXDADPHSNFWQX-VEVYYDQMSA-N Met-Thr-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O KYXDADPHSNFWQX-VEVYYDQMSA-N 0.000 description 1
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 1
- KZKVVWBOGDKHKE-QTKMDUPCSA-N Met-Thr-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 KZKVVWBOGDKHKE-QTKMDUPCSA-N 0.000 description 1
- FZDOBWIKRQORAC-ULQDDVLXSA-N Met-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N FZDOBWIKRQORAC-ULQDDVLXSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- VEKRTVRZDMUOQN-AVGNSLFASA-N Met-Val-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 VEKRTVRZDMUOQN-AVGNSLFASA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 229910017234 MnSO4 H2O Inorganic materials 0.000 description 1
- 229910017237 MnSO4-H2O Inorganic materials 0.000 description 1
- 229910017228 MnSO4—H2O Inorganic materials 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 229910004619 Na2MoO4 Inorganic materials 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 102000035092 Neutral proteases Human genes 0.000 description 1
- 108091005507 Neutral proteases Proteins 0.000 description 1
- 101100149562 Niallia circulans butB gene Proteins 0.000 description 1
- 239000005642 Oleic acid Substances 0.000 description 1
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- 241001520808 Panicum virgatum Species 0.000 description 1
- 241000191998 Pediococcus acidilactici Species 0.000 description 1
- 241000191996 Pediococcus pentosaceus Species 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- MRNRMSDVVSKPGM-AVGNSLFASA-N Phe-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRNRMSDVVSKPGM-AVGNSLFASA-N 0.000 description 1
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 1
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 1
- UEADQPLTYBWWTG-AVGNSLFASA-N Phe-Glu-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEADQPLTYBWWTG-AVGNSLFASA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 1
- JWBLQDDHSDGEGR-DRZSPHRISA-N Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWBLQDDHSDGEGR-DRZSPHRISA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- FXEKNHAJIMHRFJ-ULQDDVLXSA-N Phe-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N FXEKNHAJIMHRFJ-ULQDDVLXSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 229920000331 Polyhydroxybutyrate Polymers 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- QBFONMUYNSNKIX-AVGNSLFASA-N Pro-Arg-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QBFONMUYNSNKIX-AVGNSLFASA-N 0.000 description 1
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 1
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 1
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 1
- CMOIIANLNNYUTP-SRVKXCTJSA-N Pro-Gln-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CMOIIANLNNYUTP-SRVKXCTJSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 1
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 1
- BLJMJZOMZRCESA-GUBZILKMSA-N Pro-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BLJMJZOMZRCESA-GUBZILKMSA-N 0.000 description 1
- QGLFRQCECIWXFA-RCWTZXSCSA-N Pro-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1)O QGLFRQCECIWXFA-RCWTZXSCSA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- DYMPSOABVJIFBS-IHRRRGAJSA-N Pro-Phe-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CS)C(=O)O DYMPSOABVJIFBS-IHRRRGAJSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- RJTUIDFUUHPJMP-FHWLQOOXSA-N Pro-Trp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC4=CN=CN4)C(=O)O RJTUIDFUUHPJMP-FHWLQOOXSA-N 0.000 description 1
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 1
- SHTKRJHDMNSKRM-ULQDDVLXSA-N Pro-Tyr-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O SHTKRJHDMNSKRM-ULQDDVLXSA-N 0.000 description 1
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 1
- QMABBZHZMDXHKU-FKBYEOEOSA-N Pro-Tyr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QMABBZHZMDXHKU-FKBYEOEOSA-N 0.000 description 1
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 1
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 238000012181 QIAquick gel extraction kit Methods 0.000 description 1
- 241000232299 Ralstonia Species 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- CZMRCDWAGMRECN-UHFFFAOYSA-N Rohrzucker Natural products OCC1OC(CO)(OC2OC(CO)C(O)C(O)C2O)C(O)C1O CZMRCDWAGMRECN-UHFFFAOYSA-N 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- 101100215626 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ADP1 gene Proteins 0.000 description 1
- 101001000154 Schistosoma mansoni Phosphoglycerate kinase Proteins 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- INCNPLPRPOYTJI-JBDRJPRFSA-N Ser-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N INCNPLPRPOYTJI-JBDRJPRFSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 1
- 241000588717 Shimwellia blattae Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 244000138286 Sorghum saccharatum Species 0.000 description 1
- 241001652963 Speranza Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 241001509489 Terrisporobacter glycolicus Species 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 1
- KZUJCMPVNXOBAF-LKXGYXEUSA-N Thr-Cys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KZUJCMPVNXOBAF-LKXGYXEUSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- QFCQNHITJPRQTB-IEGACIPQSA-N Thr-Lys-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O QFCQNHITJPRQTB-IEGACIPQSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- PJCYRZVSACOYSN-ZJDVBMNYSA-N Thr-Thr-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O PJCYRZVSACOYSN-ZJDVBMNYSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 1
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 101000862137 Trichoderma koningii Glyceraldehyde-3-phosphate dehydrogenase 1 Proteins 0.000 description 1
- QNMIVTOQXUSGLN-SZMVWBNQSA-N Trp-Arg-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QNMIVTOQXUSGLN-SZMVWBNQSA-N 0.000 description 1
- DXDMNBJJEXYMLA-UBHSHLNASA-N Trp-Asn-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 DXDMNBJJEXYMLA-UBHSHLNASA-N 0.000 description 1
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 1
- YTCNLMSUXPCFBW-SXNHZJKMSA-N Trp-Ile-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O YTCNLMSUXPCFBW-SXNHZJKMSA-N 0.000 description 1
- WMBFONUKQXGLMU-WDSOQIARSA-N Trp-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WMBFONUKQXGLMU-WDSOQIARSA-N 0.000 description 1
- SLOYNOMYOAOUCX-BVSLBCMMSA-N Trp-Phe-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SLOYNOMYOAOUCX-BVSLBCMMSA-N 0.000 description 1
- ZHDQRPWESGUDST-JBACZVJFSA-N Trp-Phe-Gln Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=CC=C1 ZHDQRPWESGUDST-JBACZVJFSA-N 0.000 description 1
- RKISDJMICOREEL-QRTARXTBSA-N Trp-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RKISDJMICOREEL-QRTARXTBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- WTXQBCCKXIKKHB-JYJNAYRXSA-N Tyr-Arg-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WTXQBCCKXIKKHB-JYJNAYRXSA-N 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- TZXFLDNBYYGLKA-BZSNNMDCSA-N Tyr-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 TZXFLDNBYYGLKA-BZSNNMDCSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- GHUNBABNQPIETG-MELADBBJSA-N Tyr-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O GHUNBABNQPIETG-MELADBBJSA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 1
- AVFGBGGRZOKSFS-KJEVXHAQSA-N Tyr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O AVFGBGGRZOKSFS-KJEVXHAQSA-N 0.000 description 1
- KWKJGBHDYJOVCR-SRVKXCTJSA-N Tyr-Ser-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O KWKJGBHDYJOVCR-SRVKXCTJSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- IBIDRSSEHFLGSD-YUMQZZPRSA-N Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-YUMQZZPRSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 1
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- SDSCOOZQQGUQFC-GVXVVHGQSA-N Val-His-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SDSCOOZQQGUQFC-GVXVVHGQSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 1
- 101710082805 Vanillin aminotransferase Proteins 0.000 description 1
- 239000005862 Whey Substances 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- HXVYXGXJLKOREU-GSVOUGTGSA-N [(2r)-2-aminopropyl] dihydrogen phosphate Chemical compound C[C@@H](N)COP(O)(O)=O HXVYXGXJLKOREU-GSVOUGTGSA-N 0.000 description 1
- RTDYVACWFWSTAJ-QWWZWVQMSA-N [(2r,3r)-3-aminobutan-2-yl] dihydrogen phosphate Chemical compound C[C@@H](N)[C@@H](C)OP(O)(O)=O RTDYVACWFWSTAJ-QWWZWVQMSA-N 0.000 description 1
- RTDYVACWFWSTAJ-DMTCNVIQSA-N [(2s,3r)-3-aminobutan-2-yl] dihydrogen phosphate Chemical compound C[C@@H](N)[C@H](C)OP(O)(O)=O RTDYVACWFWSTAJ-DMTCNVIQSA-N 0.000 description 1
- FKNHDDTXBWMZIR-GEMLJDPKSA-N acetic acid;(2s)-1-[(2r)-2-amino-3-sulfanylpropanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(O)=O.SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O FKNHDDTXBWMZIR-GEMLJDPKSA-N 0.000 description 1
- CUJRVFIICFDLGR-UHFFFAOYSA-N acetylacetonate Chemical compound CC(=O)[CH-]C(C)=O CUJRVFIICFDLGR-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- IFLVGRRVGPXYON-UHFFFAOYSA-N adci Chemical compound C12=CC=CC=C2C2(C(=O)N)C3=CC=CC=C3CC1N2 IFLVGRRVGPXYON-UHFFFAOYSA-N 0.000 description 1
- 229960001570 ademetionine Drugs 0.000 description 1
- 229960001456 adenosine triphosphate Drugs 0.000 description 1
- TTWYZDPBDWHJOR-IDIVVRGQSA-L adenosine triphosphate disodium Chemical compound [Na+].[Na+].C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O TTWYZDPBDWHJOR-IDIVVRGQSA-L 0.000 description 1
- 101150066782 adhB gene Proteins 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 239000002154 agricultural waste Substances 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 230000008848 allosteric regulation Effects 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 101150050280 alsD gene Proteins 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 238000005576 amination reaction Methods 0.000 description 1
- 238000003277 amino acid sequence analysis Methods 0.000 description 1
- DQPBABKTKYNPMH-UHFFFAOYSA-M amino sulfate Chemical compound NOS([O-])(=O)=O DQPBABKTKYNPMH-UHFFFAOYSA-M 0.000 description 1
- FRHBOQMZUOWXQL-UHFFFAOYSA-L ammonium ferric citrate Chemical compound [NH4+].[Fe+3].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O FRHBOQMZUOWXQL-UHFFFAOYSA-L 0.000 description 1
- 235000011114 ammonium hydroxide Nutrition 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 101150086864 apt gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 101150036080 at gene Proteins 0.000 description 1
- 238000010533 azeotropic distillation Methods 0.000 description 1
- 239000010905 bagasse Substances 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000000035 biogenic effect Effects 0.000 description 1
- 238000007622 bioinformatic analysis Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000036983 biotransformation Effects 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- 125000004063 butyryl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 102100022422 cGMP-dependent protein kinase 1 Human genes 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 229940055022 candida parapsilosis Drugs 0.000 description 1
- 230000025938 carbohydrate utilization Effects 0.000 description 1
- 239000012159 carrier gas Substances 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 235000013351 cheese Nutrition 0.000 description 1
- 239000013064 chemical raw material Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 229960004106 citric acid Drugs 0.000 description 1
- 229960002303 citric acid monohydrate Drugs 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- ZNEWHQLOPFWXOF-UHFFFAOYSA-N coenzyme M Chemical compound OS(=O)(=O)CCS ZNEWHQLOPFWXOF-UHFFFAOYSA-N 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000012084 conversion product Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- HPXRVTGHNJAIIH-UHFFFAOYSA-N cyclohexanol Chemical compound OC1CCCCC1 HPXRVTGHNJAIIH-UHFFFAOYSA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 238000006356 dehydrogenation reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- GUJOJGAPFQRJSV-UHFFFAOYSA-N dialuminum;dioxosilane;oxygen(2-);hydrate Chemical compound O.[O-2].[O-2].[O-2].[Al+3].[Al+3].O=[Si]=O.O=[Si]=O.O=[Si]=O.O=[Si]=O GUJOJGAPFQRJSV-UHFFFAOYSA-N 0.000 description 1
- FAWBXWNCECGGED-UHFFFAOYSA-N dihydroxy hydrogen phosphate;propan-2-one Chemical compound CC(C)=O.OOP(O)(=O)OO FAWBXWNCECGGED-UHFFFAOYSA-N 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 229940071106 ethylenediaminetetraacetate Drugs 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- GDSRMADSINPKSL-HSEONFRVSA-N gamma-cyclodextrin Chemical compound OC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)CO)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1CO GDSRMADSINPKSL-HSEONFRVSA-N 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 239000010921 garden waste Substances 0.000 description 1
- 239000003502 gasoline Substances 0.000 description 1
- 229960002442 glucosamine Drugs 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- 108010081985 glycyl-cystinyl-aspartic acid Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 239000004463 hay Substances 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 108010071598 homoserine kinase Proteins 0.000 description 1
- 230000036571 hydration Effects 0.000 description 1
- 238000006703 hydration reaction Methods 0.000 description 1
- 150000004678 hydrides Chemical class 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 238000005984 hydrogenation reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 239000003317 industrial substance Substances 0.000 description 1
- 239000002440 industrial waste Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 239000004313 iron ammonium citrate Substances 0.000 description 1
- 235000000011 iron ammonium citrate Nutrition 0.000 description 1
- RBTARNINKXHZNM-UHFFFAOYSA-K iron trichloride Chemical compound Cl[Fe](Cl)Cl RBTARNINKXHZNM-UHFFFAOYSA-K 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 1
- 108010084715 isopropanol dehydrogenase (NADP) Proteins 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- DVCSNHXRZUVYAM-BQBZGAKWSA-N leu-asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- 239000002029 lignocellulosic biomass Substances 0.000 description 1
- 239000012978 lignocellulosic material Substances 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000000622 liquid--liquid extraction Methods 0.000 description 1
- 239000010871 livestock manure Substances 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- ISPYRSDWRDQNSW-UHFFFAOYSA-L manganese(II) sulfate monohydrate Chemical compound O.[Mn+2].[O-]S([O-])(=O)=O ISPYRSDWRDQNSW-UHFFFAOYSA-L 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 108010034507 methionyltryptophan Proteins 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 239000006151 minimal media Substances 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- DNIAPMSPPWPWGF-UHFFFAOYSA-N monopropylene glycol Natural products CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 1
- 238000003541 multi-stage reaction Methods 0.000 description 1
- 239000010813 municipal solid waste Substances 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 101150093139 ompT gene Proteins 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 239000010893 paper waste Substances 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 239000003415 peat Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 238000005373 pervaporation Methods 0.000 description 1
- 239000003348 petrochemical agent Substances 0.000 description 1
- 108010025593 phenylalanine (histidine) aminotransferase Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 101150009573 phoA gene Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 235000011007 phosphoric acid Nutrition 0.000 description 1
- XENHFSZRMFXQBS-UHFFFAOYSA-N phosphoric acid;pyridine-3-carboxamide Chemical compound OP(O)(O)=O.NC(=O)C1=CC=CN=C1 XENHFSZRMFXQBS-UHFFFAOYSA-N 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000010908 plant waste Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000005015 poly(hydroxybutyrate) Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- WGYKZJWCGVVSQN-UHFFFAOYSA-N propylamine Chemical compound CCCN WGYKZJWCGVVSQN-UHFFFAOYSA-N 0.000 description 1
- 235000013772 propylene glycol Nutrition 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000001448 refractive index detection Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000002390 rotary evaporation Methods 0.000 description 1
- 101150050172 rtxA gene Proteins 0.000 description 1
- 101150116497 sacm1l gene Proteins 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000010802 sludge Substances 0.000 description 1
- 239000011684 sodium molybdate Substances 0.000 description 1
- 235000015393 sodium molybdate Nutrition 0.000 description 1
- TVXXNOYZHKPKGW-UHFFFAOYSA-N sodium molybdate (anhydrous) Chemical compound [Na+].[Na+].[O-][Mo]([O-])(=O)=O TVXXNOYZHKPKGW-UHFFFAOYSA-N 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 235000011149 sulphuric acid Nutrition 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229920003051 synthetic elastomer Polymers 0.000 description 1
- 239000005061 synthetic rubber Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 229960000344 thiamine hydrochloride Drugs 0.000 description 1
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 1
- 239000011747 thiamine hydrochloride Substances 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 101150080758 tonB gene Proteins 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000005891 transamination reaction Methods 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 108010036387 trimethionine Proteins 0.000 description 1
- 101150019416 trpA gene Proteins 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000004457 water analysis Methods 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
- 101150056568 yqhC gene Proteins 0.000 description 1
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 1
- 229910000368 zinc sulfate Inorganic materials 0.000 description 1
- 239000011686 zinc sulphate Substances 0.000 description 1
- 235000009529 zinc sulphate Nutrition 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1205—Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/16—Butanols
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
- C12P7/26—Ketones
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
CéLULAS HOSPEDEIRAS MICROBIANAS RECOMBINANTES, MéTODO PARA PRODUçãO DE 2-BUTANOL, MéTODO PARA PRODUçãO DE 2-BUTANONA, 2-BUTANOL E 2-BUTANONA. A presente invenção apresenta métodos para a produção fermentativa de álcoois de quatro carbonos. Especificamente butanol, de preferência 2-butanol, é produzido pelo crescimento fermentativo de bactérias recombinantes que expressam 2-butanol por via biossintética. Os microorganismos recombinantes e os métodos da invenção podem também ser adaptados para produzir 2-butanona, um intermediário nas vias biossintéticas do 2-butanol aqui apresentadas.
Description
"CÉLULAS HOSPEDEIRAS MICROBIANAS RECOMBINANTES, MÉTODO PARA PRODUÇÃO DE 2-BUTANOL, MÉTODO PARA PRODUÇÃO DE 2- BUTANONA, 2-BUTANOL E 2-BUTANONA"
Referência Remissiva a Pedido Correlato
Este pedido reivindica a prioridade sujeita a 35 U.S.C. §119 do pedido provisório U.S. N0 de série 60/796816, depositado em 2 de maio de 2006 e pedido provisório U.S. N0 de série 60/871156, depositado em 21 de dezembro de 2006.
Campo da Invenção
A invenção refere-se ao campo de microbiologia industrial e à produção de álcoois. Mais especificamente, 2-butanol é produzido via fermentação industrial de um microorganismo recombinante. Os microorganismos recombinantes e os métodos da invenção podem também ser adaptados para produzir 2-butanona, um intermediário nas vias biossintéticas do 2-butanol aqui apresentadas.
Antecedentes da Invenção
O butanol é um importante produto químico, útil como aditivo para combustível, como matéria-prima química na indústria de plásticos, e como um extrator de grau alimentício na indústria de alimentos e de sabor e aroma. Cada ano entre 4,5 bilhões de quilogramas (10 bilhões de libras) e 5,4 bilhões de quilogramas (12 bilhões de libras) de butanol são produzidos por meios petroquímicos e a necessidade deste produto químico provavelmente irá aumentar. A 2-butanona, também chamada de metíl etil cetona (MEK)1 é um solvente usado amplamente e é a mais importante cetona produzida comercialmente depois de acetona. EIa é usada como solvente para tintas, resinas e adesivos, e como um extrator seletivo e ativador de reações oxidantes.
Métodos para a síntese química de 2-butanona são conhecidos, como a desidrogenação de 2-butanol ou em um processo onde butano líquido é oxidado cataliticamente formando 2-butanona e ácido acético (Ullmann's Encyclopedia of Industrial Chemistry, 6th edition, 2003, WiIey-VCHVerIag GmbH and Co., Weinheim, Germany, Vol. 5, pp.727-732). A 2-butanona pode também ser convertida quimicamente a 2-butanol por hidrogenação (Breen et al., J. or Catalysis 236: 270-281 (2005)). Métodos para a síntese química de 2-butanol são conhecidos, como a hidratação do n-buteno (Ullmann's Encyclopedia of Industrial Chemistry, 6th edition, 2003, WiIey-VCHVerIag GmbH and Co., Weinheim, Germany, Vol. 5, pp. 716-719). Estes processos usam matérias- primas derivadas de produtos petroquímicos e geralmente são caros, e não são ambientalmente amigáveis. A produção de 2-butanona e 2-butanol a partir de matérias-primas derivadas de plantas minimizaria as emissões de gases responsáveis pelo efeito estufa, o que representaria um avanço na técnica.
Os métodos de produção de 2-butanol por biotransformação de outros produtos químicos orgânicos também são conhecidos. Por exemplo, Stampfer et al. (WO 03/078615) descrevem a produção de álcoois secundários, como 2-butanol, pela redução de cetonas, que são catalisadas por uma enzima álcool desidrogenase obtida a partir de Rhodocoeeus ruber. Semelhantemente, Kojima et ai. (EP 0645453) descreve um método para a preparação de álcoois secundários, como 2-butanol, pela redução de cetonas, que são catalisadas por uma enzima álcool desidrogenase secundária obtida a partir de Candida parapsilosis. Adicionalmente, Kuehnle et al. (EP 1149918) descrevem um processo que produz 1-butanol e 2-butanol pela oxidação de hidrocarbonetos por diferentes cepas de Rhodocoeeus ruber. O processo favoreceu a produção de 1-butanol com uma seletividade de 93,8%.
A produção de 2-butanol por certas cepas de Lactobacilli também é conhecida (Speranza et. al. J. Agrie. Food Chem. (1997) 45:3476-3480). O 2- butanol é produzido pela transformação do meso-2,3-butanodiol. A produção de 2-butanol a partir de acetolactato e acetoína por estas cepas de Lactobacilli também foi demonstrada. No entanto, não houve relatos de um microorganismo recombinante projetado para produzir 2-butanol.
Existe uma necessidade, portanto, de processos para a produção de 2-butanol e 2-butanona ambientalmente responsáveis e de baixo custo. A presente invenção aborda esta necessidade e revela hospedeiros para produção microbiana recombinante que expressam 2-butanol e 2-butanona por vias biossintéticas.
Descrição Resumida da Invenção
A invenção apresenta um microorganismo recombinante tendo uma via biossintética do 2-butanol projetada. Também é fornecido um microorganismo recombinante tendo uma via biossintética da 2-butanona projetada, que é a mesma que a via biossintética de 2-butanol com a omissão da última etapa. Os microorganismos projetados podem ser usados para a produção comercial de 2-butanol ou 2-butanona.
Conseqüentemente, a invenção apresenta uma célula hospedeira microbiana recombinante que compreende pelo menos uma molécula de DNA que codifica um polipeptídeo que catalisa um substrato para produzir a conversão selecionada do grupo consistindo em:
i) piruvato para alfa-acetolactato;
ii) alfa-acetolactato para acetoína;
iii) acetoína para 2,3-butanodiol;
iv) 2,3-butanodiol para 2-butanona; e
v) 2-butanona para 2-butanol;
sendo que pelo menos uma molécula de DNA é heteróloga à dita célula hospedeira microbiana e sendo que a dita célula hospedeira microbiana produz 2-butanol.
Em outra realização, a invenção apresenta uma célula hospedeira microbiana recombinante que compreende pelo menos uma molécula de DNA que codifica um polipeptídeo que catalisa um substrato para produzir a conversão selecionada do grupo consistindo em:
i) piruvato para alfa-acetolactato;
ii) alfa-acetolactato para acetoína;
iii) acetoína para 2,3-butanodiol; e
iv) 2,3-butanodiol para 2-butanona:
sendo que pelo menos uma molécula de DNA é heteróloga à dita célula hospedeira microbiana e sendo que a dita célula hospedeira microbiana produz 2-butanona.
Em outra modalidade a invenção apresenta um método para a produção de 2-butanol que compreende:
1) fornecer uma célula hospedeira microbiana recombinante que compreende pelo menos uma molécula de DNA que codifica um polipeptídeo que catalisa um substrato para produzir a conversão selecionada do grupo consistindo em:
i) piruvato para alfa-acetolactato;
ii) alfa-acetolactato para acetoína;
iii) acetoína para 2,3-butanodiol;
iv) 2,3-butanodiol para 2-butanona; e
v) 2-butanona para 2-butanol;
sendo que pelo menos uma molécula de DNA é heteróloga à dita célula hospedeira microbiana;
2) colocar a célula hospedeira de (1) em contato com um substrato fermentável de carbono em um meio de fermentação nas condições em que 2-butanol é produzido.
Semelhantemente a invenção apresenta um método para a produção de 2-butanona que compreende: 1) fornecer uma célula hospedeira microbiana recombinante que compreende pelo menos uma molécula de DNA que codifica um polipeptídeo que catalisa um substrato para produzir a conversão selecionada do grupo consistindo em:
i) piruvato para alfa-acetolactato;
ii) alfa-acetolactato para acetoína;
iii) acetoína para 2,3-butanodiol; e
iv) 2,3-butanodiol para 2-butanona:
sendo que pelo menos uma molécula de DNA é heteróloga à dita célula hospedeira microbiana;
2) colocar a célula hospedeira de (1) em contato com um substrato fermentável de carbono em um meio de fermentação nas condições em que a 2-butanona é produzida.
Em outra modalidade a invenção apresenta um 2-butanol ou 2- butanona contendo um meio de fermentação de produto produzido pelo método da invenção.
Breve Descrição das Figuras, Tabelas E
Descrições de Seqüências
A invenção pode ser mais plenamente entendida a partir da seguinte descrição detalhada, figuras e descrições de seqüências anexas, que fazem parte do presente pedido.
A figura 1 mostra quatro vias diferentes para biossíntese de 2- butanona e 2-butanol.
Afigura 2 mostra uma árvore filogenética de comprimento inteiro das subunidades grandes das diol/glicerol desidratases, com >95% de seqüências idênticas removidas (exceto que todas as seqüências de funções experimentalmente verificadas foram retidas), e um código lista a identidade de cada seqüência na árvore. As seqüências com função experimentalmente determinada como diol ou glicerol desidratases são ressaltadas em cinza escuro ou claro, respectivamente.
A figura 3 mostra uma árvore filogenética de comprimento inteiro das subunidades médias das diol/glicerol desidratases, com >95% de seqüências idênticas removidas, e um código lista a identidade de cada seqüência na árvore. As seqüências com função experimentalmente determinada como diol ou glicerol desidratases são ressaltadas em cinza escuro ou claro, respectivamente.
A figura 4 mostra uma árvore filogenética de comprimento inteiro das subunidades pequenas das diol/glicerol desidratases, com >95% de seqüências idênticas removidas, e um código lista a identidade de cada seqüência na árvore. As seqüências com função experimentalmente determinada como diol ou glicerol desidratases são ressaltadas em cinza escuro ou claro, respectivamente.
A tabela 12 é uma tabela do perfil HMM da subunidade grande alfa para a enzima de diol/glicerol desidratase. A tabela 12 é submetida juntamente eletronicamente e está aqui incorporada, a título de referência.
A tabela 13 é uma tabela do perfil HMM da subunidade média beta para a enzima de diol/glicerol desidratase. A tabela 13 é submetida juntamente eletronicamente e está aqui incorporada, a título de referência.
A tabela 14 é uma tabela do perfil HMM da subunidade pequena gama para a enzima de diol/glicerol desidratase. A tabela 14 é submetida juntamente eletronicamente e está aqui incorporada, a título de referência.
As seqüências a seguir obedecem a 37 C.F.R. 1,821-1,825 ("Requirements for Patent Applications Containing Nucieotide Sequences and/or Amino Acid Sequence Disclosures - the Sequence Rules") e são consistentes com World Intellectual Property Organization (WIPO) [Organização mundial de propriedade intelectual] padrão ST.25 (1998) e os requisitos para seqüência listados pelo EPO e PCT (regras 5.2 e 49.5 (a-bis), e seção 208 e anexo C das instruções administrativas). Os símbolos e formato usados para os dados de seqüência de aminoácidos e de nucleotídeos estão de acordo com as regras estabelecidas no 37 CFR § 1,822.
Tabela 1
Sumário de Números de SEQID de ácido Nucléico ε Proteína
Descrição SEQ ID Ácido nucléico SEQ ID Proteína budA, acetolactato descarboxilase a partir de Klebsiella pneumoniae ATCC 25955 1 2 alsD, acetolactato descarboxilase a partir de Bacillus subtilis 80 81 budA, acetolactato descarboxilase a partir de Klebsiella terrigena 82 83 budB, acetolactato sintase a partir de Klebsiella pneumoniae ATCC 25955 3 4 alsS, acetolactato sintase a partir de Bacillus subtilis 76 77 budB, acetolactato sintase a partir de Klebsiella terrigena 78 79 budC butanodiol desidrogenase a partir de Klebsiella pneumoniae IAM 1063 5 6 Butanodiol desidrogenase a partir de Bacillus cereus 84 85 Butanodiol desidrogenase a partir de Bacillus cereus 86 87 butB, butanodiol desidrogenase a partir de Lactococcus Iaetis 88 89 pddA, subunidade alfa de butanodiol desidratase a partir de Klebsiella oxytoea ATCC 8724 7 8 pddB, subunidade beta de desidratase de butanodiol a partir de Klebsiella oxytoea ATCC 8724 9 10 <table>table see original document page 9</column></row><table> <table>table see original document page 10</column></row><table> <table>table see original document page 11</column></row><table>
SEQ ID n° 15 a 65 são as seqüências de nucleotídeos de oligonucleotídeo PCR, clonagem, triagem e iniciadores de seqüenciamento usados nos exemplos.
SEQ ID n° 66 é a seqüência de nucleotídeos da região apagada do gene yqhD em E. coli cepa MG1655 AyqhCD1 descrita no exemplo 11.
SEQ ID n° 67 é a seqüência de nucleotídeos de uma variante do promotor de glicose isomerase 1.6GI.
SEQ ID n° 68 é a seqüência de nucleotídeos do promotor 1.5GI.
SEQ ID n° 69 é uma seqüência de nucleotídeos do operon de diol desidratase a partir de Klebsiella oxytoca.
SEQ ID n° 70 é a seqüência de nucleotídeos do fator de reativação operon de diol desidratase a partir de Klebsiella oxytoca.
SEQ ID n° 73 é a seqüência de nucleotídeos de pDCQ2, que é descrita no exemplo 9. SEQ ID n° 127 a 132 são as seqüências de nucleotídeos de adicional oligonucleotídeo PCR e iniciadores de clonagem usados nos exemplos.
SEQ ID n° 155 é a região de codificação do códon otimizado para a aminoálcool quinase de Erwinia carotovora subespécie atroseptica.
SEQ ID n° 156 é a região de codificação do códon otimizado para a aminoálcool O-fosfato liase de Eiwinia carotovora subespécie atroseptica.
SEQ ID n° 157 a 163 são as seqüências de nucleotídeos de adicional oligonucleotídeo PCR e iniciadores de clonagem usados nos exemplos.
SEQ ID n° 275 é a seqüência de nucleotídeos de um operon de Erwinia carotovora subespécie atroseptica.
Tabela 2.
Grandes (L), Médias (M) E Pequenas (S) Subunidades Adicionais de Glicerol E Diol Desidratase
<table>table see original document page 12</column></row><table> <table>table see original document page 13</column></row><table> <table>table see original document page 14</column></row><table> <table>table see original document page 15</column></row><table> <table>table see original document page 16</column></row><table> <table>table see original document page 17</column></row><table> <table>table see original document page 18</column></row><table> <table>table see original document page 19</column></row><table> <table>table see original document page 20</column></row><table> a Descrição: da anotação Genbank da seqüência e pode não ser correto incluir a designação do glicerol ou diol, ou pode não incluir informação da subunidade.
b Subunidade: identificados por homologia de seqüência com a grande, média ou pequena subunidade da enzima Klebsiella oxytoca.
c Subunidades que são do mesmo organismo são mencionadas juntas e são consideradas a mesma enzima, ou têm números Genbank próximos indicando proximidade no genoma.
Descrição Detalhada da Invenção
A presente invenção refere-se aos métodos para a produção de 2- butanol usando microorganismos recombinantes. A presente invenção atende inúmeras necessidades comerciais e industriais. Butanol é um importante produto químico industrial com uma variedade de aplicações, onde o seu potencial como combustível ou aditivo de combustível é particularmente significativo. Embora apenas um álcool de quatro carbonos, o butanoi tem um conteúdo energético semelhante ao da gasolina e pode ser misturado com qualquer combustível fóssil. Butanol é favorecido como combustível ou aditivo de combustível, uma vez que só produz CO2 e pouco ou nenhum SOx ou NOx quando queimado no motor padrão de combustão interna. Adicionalmente butanol é menos corrosivo que etanol, o aditivo preferencial de combustível até agora.
Em adição a seu uso como biocombustível ou aditivo para combustível, butanol tem o potencial de impactar problemas de distribuição de hidrogênio na emergente indústria de células de combustível. As células de combustível hoje são atormentadas pelas questões de segurança associadas ao transporte e distribuição de hidrogênio. Butanol pode ter seu conteúdo de hidrogênio facilmente mudado e pode ser distribuído através de estações de gás já existentes, na pureza exigida para os motores de combustão ou células de combustível em veículos. Finalmente, a presente invenção produz 2-butano! a partir de fontes de carbono derivadas de plantas, evitando o impacto ambiental negativo associado aos processos petroquímicos padrão para produção de butanol.
A presente invenção também fornece os microorganismos recombinantes e os métodos para produzir 2-butanona, um intermediário nas vias biossintéticas do 2-butanol aqui apresentadas. 2-butanona, também conhecido como metil etil cetona (MEK), é útil como um solvente em tintas e outros revestimentos. Ele é também usado na indústria de borracha sintética e na produção de cera de parafina.
As seguintes definições e abreviações são para ser usadas para a interpretação das reivindicações e no relatório descritivo.
O termo "invenção" ou "presente invenção" para uso na presente invenção é um termo não-limitador e não pretende se referir a uma única modalidade da invenção particular, mas abrange todas as possíveis modalidades conforme descrito no relatório descritivo e nas reivindicações.
O termo "via biossintética de 2-butanol" refere-se a vias enzimáticas para produzir 2-butanol a partir de piruvato.
O termo "via biossintética de 2-butanona" refere -se a vias da enzima para produzir 2-butanona a partir de piruvato.
O termo "acetolactato sintase", também conhecido como "ácido acetohidróxi sintase", refere-se a um polipeptídeo (ou polipeptídeos), com uma atividade enzimática que catalisa a conversão de duas moléculas de ácido pirúvico em uma molécula de alfa-acetolactato. Acetolactato sintase, conhecida como EC 2.2.1.6 [anteriormente 4.1.3.18] (Enzyme Nomenclature 1992, Academic Press, San Diego) pode ser dependente do cofator tiamina pirofosfato para sua atividade. As enzimas adequadas de acetolactato sintase estão disponíveis junto à inúmeras fontes, por exemplo, Bacillus subtilis [GenBank N0: AAA22222 NCBI (National Centerfor Biotechnology Information) seqüência de aminoácidos (SEQ ID n° 77), L04470 NCBI seqüência de nucleotídeo (SEQ ID n° 76)], Klebsiella terrígena [GenBank N0: AAA25055 (SEQ ID n° 79), L04507 (SEQ ID n° 78)], e Klebsiella pneumoniae [GenBank N0: AAA25079 (SEQ ID n° 4), M73842 (SEQ ID n° 3)].
O termo "acetolactato descarboxilase" refere-se a um polipeptídeo (ou polipeptídeos) tendo uma atividade enzimática que catalisa a conversão de aIfa-acetoIactato em acetoína. As acetolactato descarboxilases são conhecidas como EC 4.1.1.5 e estão disponíveis, por exemplo, a partir de Bacillus subtilis [GenBank N0: AAA22223 (SEQ ID n° 81), L04470 (SEQ ID n° 80)], Klebsiella terrigena [GenBank N0: AAA25054 (SEQ ID n° 83), L04507 (SEQ ID n° 82)] e Klebsiella pneumoniae [GenBank N0: AAU43774 (SEQ ID n° 2), AY722056 (SEQ IDn0I)].
O termo "acetoína aminase" refere-se a um polipeptídeo (ou polipeptídeos), tendo uma atividade enzimática que catalisa a conversão de acetoína em 3-amino-2-butanol. Acetoína aminase pode utilizar o cofator piridoxal 5'-fosfato ou NADH (nicotinamida adenina dinucleotide reduzida) ou NADPH (nicotinamida adenina dinucleotide fosfato reduzida). O produto resultante pode ter (R) ou (SJ estereoquímica na posição 3. As enzimas dependentes do fosfato piridoxal podem utilizar um aminoácido como alanina ou glutamato como doador de amino. As enzimas dependentes de NADH e NADPH podem utilizar amônia como um segundo substrato. Um exemplo de uma adequada aminase acetoína dependente de NADH, também conhecida como amino álcool desidrogenase, é descrito por Ito et al. (Patente U.S. N0 6.432.688). Um exemplo de uma aminase acetoína dependente de piridoxal é a amina:piruvato aminotransferase (também chamada amina:piruvato transaminase) e descrita por Shin Kim {J. Org. Chem. 67:2848-2853 (2002)).
O termo "butanol desidrogenase" refere-se a um polipeptídeo (ou polipeptídeos) tendo uma atividade enzimática que catalisa a interconversão de 2-butanona e 2-butanol. Butanol desidrogenases são um subconjunto de uma vasta família de álcool desidrogenases. Butanol desidrogenase pode ser dependente de NAD ou NADP. As enzimas dependentes de NAD são conhecidas como EC 1.1.1.1 e estão disponíveis, por exemplo, a partir de Rhodococcus ruber [GenBank N0: CAD36475 (SEQ ID n° 14), AJ491307 (SEQ ID n° 13)]. As enzimas dependentes de NADP são conhecidas como EC 1.1.1.2 e estão disponíveis, por exemplo, a partir de Pyrococcus furiosus [GenBank N0: AAC25556 (SEQ ID n° 91), AF013169 (SEQ ID n° 90)]. Adicionalmente, uma ^butanol desidrogenase está disponível a partir de Escheriehia coli [GenBank N°:NP_417484 (SEQ ID n° 75), NC_000913 (SEQ ID n° 74)] e uma cicloexanol desidrogenase está disponível a partir de Aeinetobaeter sp. [GenBank N0: AAG10026 (SEQ ID n° 72), AF282240 (SEQ ID n° 71)].
O termo "acetoína quinase" refere-se a um polipeptídeo (ou polipeptídeos), tendo uma atividade enzimática que catalisa a conversão de acetoína em fosfato acetoina. Acetoína quinase pode usar ATP (adenosina trifosfato) ou fosfoenolpiruvato como o doador de fosfato na reação. Apesar de não haver relatos de enzimas catalisando essa reação em acetoína, existem enzimas que catalisam a reação análoga no substrato semelhante dihidroxiacetona, por exemplo, enzimas conhecida como CE 2.7.1.29 (Garcia- Alies et al. (2004) Bioehemistry 43: 13037-13046).
O termo "acetoína fosfato aminase" refere-se a um polipeptídeo (ou polipeptídeos) com uma atividade enzimática que catalisa a conversão de fosfoacetoína em 3-amino-2-butanol O-fosfato. Acetoína fosfato aminase pode utilizar o cofator piridoxal 5'-fosfato, NADH ou NADPH. O produto resultante pode ter (R) ou (SJ estereoquímica na posição 3. As enzimas dependente do fosfato piridoxal podem utilizar um aminoácido como alanina ou glutamato. As enzimas dependentes de NADH e NADPH podem utilizar amônia como um segundo substrato. Apesar de não haver relatos de enzimas catalisando essa reação em fosfoacetoína, existe uma enzima dependente de piridoxal fosfato que se propõe para realizar a reação análoga no substrato semelhante serinol fosfato (Yasuta et al. (2001) Appf. Environ. MicrobioL 67:4999-5009).
O termo "aminobutanol fosfato fosfo-liase", também chamado de "álcool amino O -fosfato liase", refere-se a um polipeptídeo (ou polipeptídeos), tendo uma atividade enzimática que catalisa a conversão de 3-amino-2-butanol O-fosfato em 2 - butanona. Aminobutanol fosfato fosfo-liase pode utilizar o cofator piridoxal 5'-fosfato. Não existem relatos anteriores de enzimas catalisando essa reação em aminobutanol fosfato, embora existam relatos de enzimas que catalisam a reação análoga semelhante sobre o substrato 1- amino-2-propanol fosfato (Jones et al. (1973) Biochem J. 134:167-182). A presente invenção descreve um recentemente identificado aminobutanol fosfato fosfo-liase (SEQ ID n° 126) a partir do organismo Erwinia carotovora, com a atividade demonstrada em exemplo da presente invenção.
O termo "aminobutanol quinase" refere-se a um polipeptídeo (ou polipeptídeos) tendo uma atividade enzimática que catalisa a conversão de 3- amino-2-butanol em 3-amino-2-butanol O-fosfato Aminobutanol quinase pode usar ATP como o doador de fosfato. Apesar de não haver relatos de enzimas catalisarem essa reação em 3-amino-2-butanol, há relatos de enzimas que catalisam a reação análoga nos substratos semelhantes etanolamina e 1- amino-2-propanol (Jones et al., acima). A presente invenção descreve, no exemplo 14, um amino álcool quinase de Erwinia carotovora subespécie atroseptica (SEQ ID n° 124). O termo "Butanodiol desidrogenase" também conhecido como "acetoína redutase" refere-se a um polipeptídeo (ou polipeptídeos), tendo uma atividade das enzimas que catalisa a conversão de acetoína em 2,3-Butanodiol. Butanodiol desidrogenases são um subconjunto de uma vasta família de álcoois desidrogenases. Enzimas butanodiol desidrogenase podem ser específicas para a produção da estereoquímica (R) - ou (S)- no álcool produto. (S)-butanodiol desidrogenases específicas são conhecidas como CE 1.1.1.76 e estão disponíveis, por exemplo, a partir de Klebsiella pneumoniae (GenBank η 0 s: BBA13085 (SEQ ID n° 6), D86412 (SEQ ID n° 5)). Butanodiol desidrogenase (R)-específico são conhecidas como EC 1.1.1.4 e estão disponíveis, por exemplo, a partir de Bacillus cereus [GenBank N0 NP_830481 (SEQ ID n° 85), NC_004722 (SEQ ID n° 84); AAP07682 (SEQ ID n° 87), AE017000 (SEQ ID n° 86)], e Lactococcus Iaetis [GenBank N0 AAK04995 (SEQ ID n° 89), AE006323 (SEQ ID n° 88)].
O termo "Butanodiol desidratase", também conhecido como "diol desidratase" ou "propanodiol desidratase" refere-se a um polipeptídeo (ou polipeptídeos), com uma atividade enzimática que catalisa a conversão de 2,3- butanodiol em 2-butanona. Butanodiol desidratase pode usar o cofator adenosil cobalamina (vitamina B12). Enzimas dependente de adenosil cobalamina são conhecidas como CE 4.2.1.28 e estão disponíveis, por exemplo, a partir de Klebsiella oxytoea [GenBank η 0 s: BAA08099 (subunidade alfa) (SEQ ID n° 8), D45071 (SEQ ID n° 7); BAA08100 (subunidade beta) (SEQ ID n° 10), D45071 (SEQ ID n° 9); e BBA08101 (subunidade gama) (SEQ ID n° 12), D45071 (SEQ ID n° 11) (note que todas as três subunidades são necessárias para atividade)] e Klebsiella pneumoniae [GenBank N0: AAC98384 (subunidade alfa) (SEQ ID n° 105), AF102064 (SEQ ID n° 104); GenBank N0: AAC98385 (subunidade beta) (SEQ ID n° 107), AF102064 (SEQ ID n° 106), GenBank N0: AAC98386 (subunidade gama) SEQ ID n° 109), AF102064 (SEQ ID n° 108)]. Outros diol desidratases adequados incluem, mas não se limitam a, diol desidratases dependentes de B12 disponíveis a partir de Salmonella typhimurium [GenBank N°: AAB84102 (subunidade grande) (SEQ ID n° 93), AF026270 (SEQ ID n° 92); GenBank N0: AAB84103 (subunidade média) (SEQ ID n° 95), AF026270 (SEQ ID n° 94); GenBank N0: AAB84104 (subunidade pequena) (SEQ ID n° 97), AF026270 (SEQ ID n° 96)] e Lactobacillus eollinoides [GenBank N°: CAC82541 (subunidade grande) (SEQ ID n° 99), AJ297723 (SEQ ID n° 98); GenBank N0: CAC82542 (subunidade média) (SEQ ID n° 101); AJ297723 (SEQ ID n° 100); GenBank N0: CAD01091 (subunidade pequena) (SEQ ID n° 103), AJ297723 (SEQ ID n° 102)] e enzimas a partir de Lactobacillus brevis (particularmente cepas CNRZ 734 e CNRZ 735, Speranza et al., acima), e seqüência de nucleotídeo que codificam as enzimas correspondentes. Métodos de isolamento de gene de diol desidratase são bem conhecidos na técnica (por exemplo, patente U.S. N0 5.686.276). Diol desidratases adicionais são ^^ mencionadas na tabela 2. O termo "glicerol desidratase" refere-se a um polipeptídeo (ou
polipeptídeos) tendo uma atividade enzimática que catalisa a conversão de glicerol a 3-hidroxipropionaIdeído. Glicerol desidratases dependentes de adenosil cobalamina são conhecidas como CE 4.2.1.30. As glicerol desidratases da CE 4.2.1.30 são similares às diol desidratases na seqüência e no fato de terem três subunidades. As glicerol desidratases também podem ser usadas para converter 2,3-butanodiol em 2-butanona. Alguns exemplos de glicerol desidratases de EC 4.2.1.30 incluem as de Klebsiella pneumoniae (subunidade alfa, SEQ ID n° 145, região de codificação e SEQ ID n° 146, proteína; subunidade beta, SEQ ID n° 147, região de codificação e SEQ ID n° 148, proteína; e subunidade gama SEQ ID n° 149, região de codificação e SEQ ID n° 150, proteína); a partir de Clostridium pasteurianum [GenBank N0: 3360389 (subunidade alfa, SEQ ID n° 135), 3360390 (subunidade beta, SEQ ID n° 136), e3360391 (subunidade gama, SEQ ID n° 137)]; a partir de Escherichia blattae [G enBank N°: 60099613 (subunidade alfa, SEQ ID n° 1 38), 57340 1 91 (subunidade beta, SEQ ID n° 139), e 57340192 (subunidade gama, SEQ ID n° 140)]; e a partir de Citrobacter freundii [GenBank N°: 1169287 (subunidade alfa, SEQ ID n° 141), 1229154 (subunidade beta, SEQ ID n° 142), e 1229155 (subunidade gama, SEQ ID n° 143)]. Note que todas as três subunidades são necessárias para atividade. Glicerol desidratases adicionais estão listadas na tabela 2.
Diol e glicerol desidratases podem sofrer inativação suicida durante catálise. Uma proteína fator reativante, também aqui referida como "reativase", pode ser usada para reativar as enzimas inativas (Mori et al., J, Biol. Chem. 272:32034 (1997)). Preferencialmente, o fator de reativação é obtido a partir da mesma fonte que a diol ou glicerol desidratase usadas. Por exemplo, fatores de reativação de diol desidratase adequados estão disponíveis a partir de Klebsiella oxytoca [GenBank N0: AAC15871 (subunidade grande) (SEQ ID n° 111), AF017781 (SEQ ID n° 110); GenBank N0: AAC15872 (subunidade pequena) (SEQ ID n° 113), AF017781 (SEQ ID n° 112)]; SaImoneIIa typhimurium [GenBank N0: AAB84105 (subunidade grande) (SEQ ID n° 115), AF026270 (SEQ ID n° 114), GenBank N0: AAD39008 (subunidade pequena) (SEQ ID n° 117), AF026270 (SEQ ID n° 116)] e Lactobacillus collinoides [GenBank N0: CAD01092 (subunidade grande) (SEQ ID n° 119), AJ297723 (SEQ ID n° 118); GenBank N0: CAD01093 (pequena subunidade) (SEQ ID n° 121), AJ297723 (SEQ ID n° 120)]. Ambas as pequenas e grandes subunidades são necessárias para atividade. Por exemplo, fatores de reativação de glicerol desidratase adequados estão disponíveis junto à Klebsiella pneumoniae (subunidade grande, SEQ ID n° 151, região de codificação e SEQ ID n° 152, proteína;, e pequena subunidade, SEQ ID n° 153, região de codificação e SEQ ID n° 154, proteína).
O termo "um anaeróbico facultativo" refere-se a um microrganismo que pode crescer em ambos os ambientes aeróbico e anaeróbico.
O termo "substrato de carbono" ou "substrato de carbono fermentável" refere-se a uma fonte de carbono capaz de ser metabolizada pelos organismos hospedeiros da presente invenção e especialmente fontes de carbono selecionadas do grupo consistindo em monossacarídeos, oligossacarídeos, polissacarídeos e substratos de um-carbono ou misturas dos mesmos.
O termo "gene" refere-se a um fragmento de ácido nucléico que é capaz de ser expresso como uma proteína específica, opcionalmente, incluindo seqüências reguladoras que precedem (seqüências 5 'não codificantes) e seguem (seqüências 3' não codificantes) a seqüência de codificação. "Gene nativo" refere-se a um gene como encontrado na natureza com as suas próprias seqüências reguladoras. "Gene quimérico" refere-se a qualquer gene que não é um gene nativo, compreendendo seqüências reguladoras e de codificação que não são encontradas juntas na natureza. Conseqüentemente, um gene quimérico pode compreender seqüências reguladoras e de seqüências de codificação que são derivadas de fontes diferentes, ou seqüências reguladoras e seqüências de codificação obtidas a partir da mesma fonte, mas organizadas de uma forma diferente do que aquela encontrada na natureza. "Gene endógeno" refere-se a um gene nativo na sua natural localização no genoma de um organismo. Um gene "estrangeiro" ou "heterólogo" refere-se a um gene que normalmente não se encontra no organismo hospedeiro, mas que é introduzida no mesmo por transferência de genes. Os genes estrangeiros podem compreender os genes nativos inseridos em um organismo não-nativo, ou genes quiméricos. Um "transgene" é um gene que foi introduzido no genoma por um procedimento de transformação.
Para uso na presente invenção, um "fragmento isolado de ácido nucléico" ou "molécula isolada de ácido nucléico" ou "construção genética" serão utilizados indiferentemente e significarão um polímero de DNA ou RNA de fita simples- ou dupla, opcionalmente contendo bases de nucleotídeos alteradas, não naturais ou sintéticas. Um fragmento isolado de ácido nucléico, sob a forma de um polímero de DNA, pode compreender um ou mais segmentos do cDNA, DNA genômico ou DNA sintético. Um fragmento de ácido nucléico é "hibridizáve!" com outro fragmento de ácido nucléico, como um cDNA, DNA genômico ou molécula RNA1 quando um fragmento de ácido nucléico na forma de fita simples pode se anelar com outros fragmentos de ácido nucléico sob as condições apropriadas de temperatura e força iônica da solução. As condições de hibridização e lavagem são bem conhecidas e exemplificadas em Sambrook1 J., Fritsch1 E.F. e Maniatis1 T. Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory: Cold Spring Harbor1 NY (1989), especialmente capítulo 11 e tabela 11.1 neste (integralmente incorporadas neste documento por referência). As condições de temperatura e de força iônica determinam a "estringência" da hibridização. As condições de estringência podem ser ajustadas para testar por fragmentos moderadamente semelhantes (como seqüências homólogas de organismos aparentados de forma distante), e até por fragmentos muito semelhantes (como os genes que duplicam enzimas funcionais de organismos estreitamente aparentados). As lavagens pós-hibridização determinam as condições de estringência. Um conjunto de condições preferenciais utiliza uma série de lavagens começando com 6X SSC1 0,5% SDS1 à temperatura ambiente durante 15 min, em seguida, repetindo com 2X SSC, 0,5% SDS a 45°C por 30 min, e, em seguida, repetindo duas vezes com 0,2X CCD, 0,5% SDS, a 50°C por 30 min. Um conjunto preferencial de condições de estringência utiliza altas temperaturas nas quais as lavagens são idênticas às mostradas acima exceto que a temperatura das duas lavagens finais de 30 minutos em 0,2X CCD, 0,5% SDS, foi aumentada para 60°C. Outro conjunto preferencial de condições altamente estrigentes usa duas lavagens finais no 0,0X SSC, 0,1% SDS a 65°C. Um conjunto adicional de condições de estringência inclue hibridização a 0,1X SSC1 0,1% SDS1 65°C e lavagens com 2X SSC, 0,1% SDS 0,1X seguido pelo CCD, 0,1% SDS, por exemplo.
A hibridização exige que os dois ácidos nucléicos contêm seqüências complementares, embora dependendo da estringência da hibridização, falta de correlação entre as bases são possíveis. A estringência adequada para hibridização de ácidos nucléicos depende do comprimento dos ácidos nucléicos e do grau de complementação, variáveis bem conhecidas na técnica. Quanto maior for o grau de semelhança ou de homologia entre duas seqüências de nucleotídeos, maior o valor de Tm para híbridos de ácidos nucléicos tendo essas seqüências. A relativa estabilidade (o que corresponde à maior Tm) de hibridizações de ácido nucléico decresce na seguinte ordem: ^RNA:RNA, DNA:RNA, DNA:DNA. Para os híbridos de mais de 100 nucleotídeos de comprimento, equações para calcular Tmforam derivadas (consulte Sambrook et ai., acima, 9,50-9,51). Para hibridizações mais curtas com ácidos nucléicos, ou seja, oligonucleotídeos, a posição da falta de correlação se torna mais importante e, o comprimento do oligonucleotídeo determina a sua especificidade (ver Sambrook et al., acima, 11,7-11,8). Em uma modalidade o comprimento de um ácido nucléico hibridizável é pelo menos de cerca de 10 nucleotídeos. De preferência, um comprimento mínimo para um ácido nucléico hibridizável é de pelo menos cerca de 15 nucleotídeos; com mais preferência de pelo menos cerca de 20 nucleotídeos; e com a máxima preferência o comprimento é de pelo menos cerca de 30 nucleotídeos. Além disso, o técnico qualificado irá reconhecer que a temperatura e a concentração de sal da solução de lavagem podem ser ajustadas conforme necessário, de acordo com fatores como o comprimento da sonda.
Uma "parte substancial" de um aminoácido ou seqüência de nucleotídeos é a parte que compreende o suficiente da seqüência de aminoácidos de um polipeptídeo ou da seqüência de nucleotídeos de um gene para identificar putativamente que polipeptídeo ou gene, ou por avaliação manual da seqüência por um técnico no assunto, ou pelo comparação e identificação seqüencial automática por computador, utilizando algoritmos como BLAST (Altschul1 SF, et al., J. MoL MoL Biol., 215:403-410 (1993)). Em geral, uma seqüência de dez ou mais aminoácidos contíguos ou trinta ou mais nucleotídeos é necessária a fim de putativamente identificar uma seqüência de polipeptídeos ou de ácido nucléico como homóloga a uma proteína ou um gene conhecido. Além disso, no que diz respeito às seqüências de nucleotídeos, sondas de oligonucleotídeo de genes específicos compreendendo 20-30 nucleotídeos contíguos podem ser utilizadas nos métodos de identificação dependentes de identificação de gene da seqüência (por exemplo, "Southern ^hybridization") e de isolamento (por exemplo, hibridização "in SitWt de colônias bacterianas ou placas bacteriófagos). Adicionalmente, oligonucleotídeos curtos de 12 a15 bases podem ser utilizados como iniciadores de amplificação por PCR1 a fim de obter um determinado fragmento do ácido nucléico compreendendo os iniciadores. Conseqüentemente, uma "parte substancial" de uma seqüência de nucleotídeos compreende bastante da seqüência para identificar especificamente e/ou isolar um fragmento do ácido nucléico compreendendo a seqüência. O presente relatório descritivo ensina a completa seqüência de aminoácidos e nucleotídeos que codificam proteínas fúngicas particulares. O técnico no assunto, tendo o benefício das seqüências como aqui relatadas, pode agora usar a totalidade ou uma parte substancial das seqüências divulgadas, para fins conhecidos pelos versados na técnica. Conseqüentemente, a presente invenção compreende as seqüências completas como relatado na lista de seqüências anexa, bem como porções significativas dessas seqüências como definido acima.
O termo "complementar" é utilizado para descrever a relação entre as bases de nucleotídeos que são capazes de hibridizar uma à outra. Por exemplo, no que diz respeito ao DNA1 adenosina é complementar à timina e citosina é complementar à guanina.
Os termos "homologia" e "homólogo" são usados de maneira intercambiável neste documento. Eles se referem a fragmentos de ácidos nucléicos em que mudanças em uma ou mais bases de nucleotídeos não afetam a habilidade do fragmento de ácido nucléico de mediar expressão gênica ou produzir um determinado fenótipo. Estes termos também se referem às alterações dos fragmentos do ácido nucléico da presente invenção, como a supressão ou inserção de um ou mais nucleotídeos que não alterem substancialmente as propriedades funcionais do fragmento resultante de ácido nucléico em relação ao fragmento inicial sem modificação. É, portanto, entendido, como aqueles técnicos no assunto irão apreciar, que a invenção abrange mais do que as seqüências exemplificadoras específicas.
Além disso, o técnico no assunto reconhece que as seqüências de ácidos nucléicos homólogas abrangidas por essa invenção também são definidas pela sua capacidade de hibridizar sob moderadamente severas condições (por exemplo, 0,5 X SSC1 0,1% SDS, 60°C) com as seqüências exemplificadas aqui, ou para qualquer parte do seqüências de nucleotídeos apresentadas aqui e que são funcionalmente equivalentes a qualquer uma das seqüências de ácidos nucléicos apresentadas neste documento.
O termo "porcentagem de identidade", conforme é conhecido na técnica, é um relacionamento entre duas ou mais seqüências de polipeptídeos ou duas ou mais seqüências de polinucleotídeos, conforme determinado por comparação das seqüências. Na técnica, a "identidade" significa também o grau de parentesco entre as seqüências de polipeptídeos ou polinucleotídeos, conforme o caso, como determinado pela correspondência entre cadeias de tais seqüências. "Identidade" e "similaridade" podem ser facilmente calculados por métodos conhecidos, incluindo, mas não limitados aos descritos em: 1.) Computational Molecular Biology (Lesk, A. M., Ed.) Oxford University: NY (1988); 2.) Biocomputing: Informatics and Genome Projects (Smith, D. W., Ed.) Academic: NY (1993); 3.) Computer Analysis of Sequence Data, Part I (Griffin, Α. M., e Griffiη, Η. G., Eds.) Humania: NJ (1994); 4.) Sequence Analysis in Molecular Biology (νοη Heinje1 G., Ed.) Academic (1987); e 5.) Sequence Anaiysis Primer (Gribskov, Μ. e Devereux1 J., Eds.) Stockton: NY (1991).
Os métodos preferenciais para determinar a identidade são projetados para proporcionar a melhor comparação entre as seqüências testadas. Os métodos para determinar a identidade e a similaridade são codificados em programas de computador disponíveis publicamente. As seqüência de alinhamentos e cálculos de percentagens de identidade podem ^ ser realizados utilizando o programa MegAlign™ da LASERGENE bioinformatics computing suíte (DNASTAR Inc., Madison1 Wl). Os múltiplos alinhamentos das seqüências são realizados usando-se "método de alinhamento Clustal", que abrange várias variedades do algoritmo incluindo o "método de alinhamento Clustal V" correspondente ao método de alinhamento identificado como Clustal V (descrito por Higgins e Sharp, CABIOS. 5:151-153 (1989); Higgins, D.G. et al., Comput. Appi Biosci., 8:189-191 (1992)) e encontrado no programa MegAlign™ do LASERGENE bioinformatics computing suite (DNASTAR Inc.). Para múltiplos alinhamentos, os valores pré- estabelecidos correspondem a GAP PENALTY=10 e GAP LENGTH PENALTY=10. Os parâmetros pré-estabe!ecidos para alinhamento em pares e cálculos de porcentagem de identidade de seqüências de proteína usando o método Clustal são KTUPLE=I, GAP PENALTY=3, WINDOW=5 e DIAGONALS SAVED=5. Para ácidos nucléicos esses parâmetros são KTUPLE=2, GAP PENALTY=5, WINDOW=4 e DIAGONALS SAVED=4. Após o alinhamento das seqüências usando o programa Clustal V, é possível obter uma "porcentagem de identidade" visualizando a tabela "distância da seqüência" no mesmo programa. Adicionalmente o "método de alinhamento Clustal W" está disponível e corresponde ao método de alinhamento identificado como Clustal W (descrito por Higgins e Sharp, CABIOS. 5:151-153 (1989); Higgins, D.G. et al., Comput Appl. Biosci. 8:189-191(1992)) e encontrado no programa MegAlign™ v6.1 de LASERGENE bioinformatics computing suíte (DNASTAR Inc.)· Os parâmetros pré-estabelecidos para múltiplos alinhamentos (GAP PENALTY=10, GAP LENGTH PENALTY=0,2, Delay Divergen Seqs(%)=30, DNA Transition Weight=0,5, Protein Weight Matrix=Gonnet Series, DNA Weight Matrix=IUB). Após o alinhamento das seqüências usando o programa Clustal W, é possível obter uma "porcentagem de identidade" visualizando a tabela "distância da seqüência" no mesmo programa.
É bem entendido pelo técnico no assunto que muitos níveis de identidade de seqüência são úteis na identificação de polipeptídeos, a partir de outras espécies, onde tais polipeptídeos têm a mesma ou similar função ou atividade. Exemplos úteis de porcentagens de identidades incluem, mas não estão limitados a: 24%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95%, ou qualquer inteiro percentual de 24% a 100% podem ser úteis na descrição da presente invenção, como 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%. Os fragmentos adequados de ácido nucléico não somente tem as homologias acima, mas tipicamente codificam um polipeptídeo tendo pelo menos 50 aminoácidos, de preferência pelo menos 100 aminoácidos, com mais preferência pelo menos 150 aminoácidos, ainda com mais preferência pelo menos 200 aminoácidos e, com a máxima preferência, pelo menos 250 aminoácidos.
O termo "software de análise de seqüências" refere-se a qualquer algoritmo computadorizado ou programa de software que é útil para a análise de seqüências de nucleotídeos ou de aminoácidos. "Software de análise de seqüências" pode estar disponível comercialmente ou desenvolvido independentemente. Típicos Softwares de análise de seqüências incluem, mas não estão limitados a: 1.)0s softwares integrados de programas GCG (Wisconsin Package Version 9.0, Genetics Computer Group (GCG), Madison1 Wl); 2.) BLASTP, BLASTN, BLASTX (Altschul et al., J. Mol. Biol., 215:403-410 (1990)); 3.) DNASTAR (DNASTAR, Inc. Madison1 Wl); 4.) Sequencher (Gene Codes Corporation, Ann Arbor, Ml); e 5.) O programa FASTA incorporando o algoritmo Smith-Waterman (W. R. Pearson, Comput Methods Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(s): Suhai1 Sandor. Plenum: New York, NY). No contexto deste pedido, será entendido que onde o software de análise seqüencial é utilizado para a análise, os resultados da análise serão baseados nos "valores pré-determinados" do programa referenciado, salvo disposição em contrário. Para uso na presente invenção, "valores pré-determinados" significará qualquer conjunto de valores ou parâmetros que vem com o software quando o mesmo é inicializado pela primeira vez.
Para uso na presente invenção o termo "seqüência de codificação" ou "CDS" refere-se a uma seqüência de DNA que codifica uma específica seqüência de aminoácidos. "Seqüências reguladoras adequadas" referem-se a seqüências de nucleotídeos localizadas a montante (seqüências 5' não codificantes), no interior, ou a jusante (seqüências 3' não codificantes) de uma seqüência de codificação e que influenciam a transcrição, processamento ou estabilidade de RNA1 ou tradução da associada seqüência de codificação. As seqüências reguladoras podem incluir promotores, seqüências de iniciação de tradução, introns, seqüências de reconhecimento de poliadenilação, sítio de processamento de RNA, sítio de ligação efetore estrutura de haste e laço. O termo "promotor" refere-se a uma seqüência de DNA capaz de controlar a expressão de uma seqüência de codificação ou RNA funcional. Em geral, uma seqüência de codificação está situada a 3' de uma seqüência promotora. Os promotores poderão ser derivados na sua totalidade a partir de um gene nativo, ou seja, composto por vários elementos derivados de diferentes promotores encontrados na natureza, ou mesmo compreende segmentos de DNA sintéticos. Entende-se por aqueles versados na técnica que diferentes promotores podem dirigir a expressão de um gene em diferentes ^^ tipos de células ou tecidos, ou em diferentes fases de desenvolvimento, ou em resposta a diferentes condições ambientais ou fisiológicas. Os promotores que causam a um gene ser expresso na maioria dos tipos de células, na maioria das vezes, são comumente denominados "promotores constitutivos". É ainda reconhecido que, uma vez que na maioria dos casos os exatos limites das seqüências reguladoras não foram completamente definidos, os fragmentos de DNA de diferentes comprimentos podem ter idêntica atividade promotora.
O termo "ligada de maneira funcional" refere-se a associação das seqüências de ácido nucléico em um único fragmento de ácidos nucléicos de modo que a função de um é afetada pelo outro. Por exemplo, um promotor está ligado de maneira funcional com uma seqüência de codificação quando é capaz de viabilizar a expressão da seqüência de codificação (ou seja, a seqüência de codificação está sob o controle transcricional do promotor). As seqüências de codificação podem ser ligados de maneira funcional a seqüências reguladoras na orientação senso ou anti-senso.
O termo "expressão", conforme usado neste documento, refere-se à transcrição e acúmulo estável de RNA senso (mRNA) ou anti-senso derivados do fragmento de ácido nucléico da invenção. Expressão pode também referir-se a tradução de mRNA em um polipeptídeo.
Conforme utilizado aqui o termo "transformação" refere-se à transferência de um fragmento de ácido nucléico em um organismo hospedeiro, resultando em herança geneticamente estável. Os organismos hospedeiros que contêm os fragmentos de ácido nucléico transformados são referidos como organismos "transgênicos", "recombinantes" ou "transformados".
Os termos "plasmídeo" e "vetor" referem-se a um elemento extra cromossômico muitas vezes transportando genes que não fazem parte do metabolismo central da célula e, geralmente, sob a forma de duplas fitas circulares de fragmentos de DNA. Esses elementos podem ser seqüências livremente replicadas, seqüências integradoras de genoma, seqüências de nucleotídeos ou de fagos, circulares ou lineares, de fita d e DNA ou RNA simples ou dupla, provenientes de qualquer fonte, na qual uma série de seqüências de nucleotídeos foram unidas ou recombinadas em uma única construção que é capaz de introduzir um fragmento de promotor e seqüência de DNA para um produto de um gene selecionado juntamente com uma seqüência 3' adequada não-traduzida em uma célula. "Vetor de transformação" refere-se a um vetor específico contendo um gene estrangeiro e tendo elementos em adição ao gene estrangeiro que facilitam a transformação de uma determinada célula hospedeira.
Para uso na presente invenção o termo "degenerescência do códon" refere-se à natureza no código genético que permite a variação da seqüência de nucleotídeos sem afetar a seqüência de aminoácidos de um polipeptídeo codificado. O técnico no assunto está bem consciente da "preferência do códon (codon-bias)" exibido por uma determinada célula hospedeira no uso de códons de nucleotídeos para especificar um determinado aminoácido. Por isso, quando faz a síntese de um gene para a melhoria da expressão gênica em uma célula hospedeira, é desejável que o design do gene seja tal que a freqüência de uso do códon seja próxima da freqüência pereferencial de uso do códon da célula hospedeira.
O termo "códon otimizado" ao se referir a genes ou regiões de codificação de moléculas de ácidos nucléicos para transformação de vários hospedeiros, refere-se à alteração de códons no gene ou nas regiões de codificação das moléculas de ácido nucléico para refletir o uso típico do códon do organismo hospedeiro, sem alterar o polipeptídeo codificado pelo DNA.
O termo "meio de fermentação de produto" refere-se a um meio no qual a fermentação ocorreu de tal forma que o produto é presente no meio.
As técnicas padrão de DNA recombinante e clonagem molecular utilizadas aqui são bem conhecidas na técnica e são descritas por Sambrook, J., Fritsch1 E. F. F. e Maniatis, T. Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989) (mais adiante neste documento "Maniatis"); e por Silhavy1 T. J., Bennan1 M. L. Enquist1 Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press1 Cold Spring Harbor, N.Y. (1984) e por Ausubel, F. et al., Current Protocols in Molecular Biology, publicado por Greene Publishing Assoc. e Wiley-Interscience (1987).
A VIA BIOSSITETICA DE 2-BUTANONA E 2-BUTANOL
Os carboidratos utilizando microorganismos empregam a via Embden-Meyerhof-Parnas (EMP), a via Entner-Doudoroff e o ciclo fosfato pentose como as vias centrais metabólicas para fornecer energia e precursores celulares para o crescimento e manutenção. Estas vias têm em comum o intermediário gliceraldeído-3-fosfato e, finalmente, piruvato é formado diretamente ou em combinação com a via EMP. As reações combinados de conversão de açúcar a piruvato para produzir energia (por exemplo, adenosina 5-trifosfato, ATP) e reduzindo equivalentes (por exemplo, reduzida nicotinamida adenina dinucleotídeo, NADH [nicotinamide adenine dinucleotide], e reduzida nicotinamida adenina dinucleotídeo fosfato, NADPH [nicotinamide adenine dinucleotide phosphate]). NADH e NADPH precisam ser reciclados para suas formas oxidadas (NAD+ e NADP+, respectivamente). Na presença de elétrons inorgânicos receptores (por exemplo, O2, NO3" e SO42"), os equivalentes reduzidos podem ser usados para aumentar a concentração de energia;
A invenção permite a produção de 2-butanona ou 2-butanol a partir de fontes de carboidratos com microrganismos recombinantes, fornecendo uma via biossintética completa a partir de piruvato até 2-butanona ou 2-butanol. Três vias adicionais são descritas. Embora 2-butanol, pelo que se sabe, não é o principal produto de qualquer fermentação bacteriana, há um número de possíveis vias para a produção de 2-butanol através de conhecidos tipos de reações bioquímicas. Estas vias são mostradas na figura 1. As letras e algarismos romanos citados abaixo correspondem às letras e algarismos romanos na figura 1, que são usados para descrever as etapas de conversão e produtos, respectivamente. Conforme descrito abaixo, 2-butanona é um intermediário em todas destas vias biossintética de 2-butanol. Todas as vias iniciam-se com a reação de duas moléculas de
piruvato para produzir alfa-acetolactato (I), mostrado como o substrato para o produto da conversão (a) na figura 1. A partir de alfa-acetolactato, existem 4 possíveis vias para 2-butanona (V), aqui referidas como vias biossintética de 2-butanona:
via 1) I—>ll—>lll—>IV—>V (substrato para conversões de
produto b,c,d,e);
2) I—>ll—>VII—>IV—>V (substrato para conversões de produto
b,g,h,e)
3) |_„>||—>Vlll—>V (substrato para conversões de produto b,i,j): 25 Esta é a via da presente invenção.
4) I—>IX—>X—>V (substrato para conversões de produto k,l,m) A via biossintética de 2-butanol conclui-se com a conversão de 2-
butanona (V) em 2-butanol (VI). Uma discussão detalhada do substrato para conversões de produto em cada via é dada abaixo.
VIA 1:
(A) PIRUVATO A ALFA-ACETOLACTATO:
O primeiro passo na via 1 é a conversão de duas moléculas de piruvato para uma molécula de alfa-acetolactato (composto I na figura 1) e uma molécula de dióxido de carbono, catalisada por uma enzima dependente de tiamina pirofosfato. As enzimas catalisando este substrato para conversão do produto (genericamente chamadas de ou acetolactato sintase ou de ácido acetohidroxi sintase; EC 2.2.1.6 [comutadas de 4.1.3.18 em 2002]) são bem conhecidos, e elas participam na via biossintética para os aminoácidos proteinogênicos Ieucina e valina, bem como na via para produção fermentativa de 2,3-butanodiol e acetoína de uma série de organismos.
O versado na técnica vai apreciar o fato que os polipeptídeos tendo atividade da acetolactato sintase isolada de uma variedade de fontes serão muito úteis na presente invenção independente da homologia da seqüência. Alguns exemplos de enzimas adequadas de acetolactato sintase estão disponíveis junto a inúmeras fontes, por exemplo, Bacillus subtilis [GenBank N°: AAA22222 NCBI (National Centerfor Biotechnology Information) seqüência de aminoácidos (SEQ ID n° 77), L04470 NCBI seqüência de nucleotídeo (SEQ ID n° 76)], Klebsiella terrigena [GenBank N0: AAA25055 (SEQ ID n° 79), L04507 (SEQ ID n° 78)], e KIebsieIIa pneumoniae [GenBank N0: AAA25079 (SEQ ID n° 4), M73842 (SEQ ID n° 3)]. As enzimas preferenciais para acetolactato sintase são aquelas que têm pelo menos 80% a 85% de identidade com SEQ ID N0 4, 77 e 79, onde pelo menos 85% a 90% de identidade é mais preferível e onde pelo menos 95% de identidade baseada no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos GAP PENALTY=10, GAP LENGTH PENALTY=OfI e séries de matriz de peso de proteína Gonnet 250, é o preferencial. (β) Alfa-Acetolactato para Acetoína:
Alfa-acetolactato (I) é convertido para acetoína (II) pela ação de uma enzima como acetolactato descarboxilase (EC 4.1.1.5). Como a acetolactato sintase, esta enzima é dependente de tiamina pirofosfato e é, também, parte na produção de 2,3-butanodiol e acetoína por inúmeros organismos. As enzimas de fontes diferentes variam muito em tamanho (25 kDa a 50 kDa), oligomerização (dímero-hexâmero), localização (intracelular ou extracelular), e regulação alostérica (por exemplo, ativação ^por cadeia ramificada de aminoácidos). Para o propósito da presente invenção, uma localização intracelular é preferível a extracelular, mas outras variações são geralmente aceitáveis.
O técnico no assunto vai apreciar o fato que os polipeptídeos tendo atividade de acetolactato descarboxilase isolada de uma variedade de fontes serão muito úteis na presente invenção independente da homologia da seqüência. Alguns exemplos de enzimas adequadas de acetolactato descarboxilase estão disponíveis junto a inúmeras fontes, por exemplo, Bacillus subtilis [GenBank N0: AAA22223 (SEQ ID n° 81), L04470 (SEQ ID n° 80)], Klebsiella terrígena [GenBank N0: AAA25054 (SEQ ID n° 83), L04507 (SEQ ID n° 82)] e Ktebsiella pneumoniae [GenBank N0: AAU43774 (SEQ ID n° 2), AY722056 (SEQ ID n° 1)]. As enzimas preferenciais para acetolactato descarboxilase são
aquelas que têm pelo menos 80% a 85% de identidade com SEQ ID N0 2, 81 e 83 onde pelo menos 85% a 90% de identidade é preferível e onde pelo menos 95% de identidade baseada no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos GAP PENALTY=101 GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250, é preferencial.
íc) Acetoína a 3-Amino-2-Butanol:
Existem dois tipos de reações bioquímicas conhecidas que poderiam afetar o substrato para conversão do produto de acetoína (II) a 3- amino-2-butanol (III), especificamente, transaminação dependente de piridoxal fosfato utilizando um doador acessório de amino e aminação redutora direta com amônia. Neste último caso, os equivalentes reduzidos são oferecidos na forma de um cofator reduzido de nicotinamida (NADH ou NADPH). Um exemplo de uma enzima dependente de NADH que catalisa essa reação com acetoína como um substrato é relatado por Ito et al. (Patente US N0 6.432.688). Qualquerestereoespecificidade desta enzima não foi avaliada. Um exemplo de um piridoxal dependente de fosfato transaminase que catalisa a conversão de acetoína em 3-amino-2-butanol tem sido relatado por Shin e Kim (acima). Esta enzima foi aqui mostrada no exemplo 13 para converter tanto o isômero (R) de acetoína para o isômero (2R,3S) de 3-amino-2-butanol e o isômero (S) de acetoína para o isômero (2S,3S) de 3-amino-2-butanol. Qualquer tipo de enzima (isto é, transaminase ou aminase reduzida) é considerado para ser uma acetoína aminase e pode ser utilizado na produção de 2-butanol. Outras enzimas neste grupo podem ter diferentes estereoespecificidades.
O versado na técnica vai apreciar o fato que os polipeptídeos tendo atividade da acetoína aminase isolada de uma variedade de fontes serão muito úteis na presente invenção independente da homologia da seqüência. Um exemplo desta atividade foi aqui descrito e é identificado como SEQ ID n° 122. Conseqüentemente, as enzimas preferenciais para acetoína aminase são aquelas que têm pelo menos 80% a 85% de identidade com SEQ ID N0 2, e onde pelo menos 85% a 90% de identidade é mais preferível e onde pelo menos 95% de identidade baseada no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250, é de preferência máxima.
(d) 3-Amino-2-Butanol a 3-Amino-2-Butanol O-Fosfato:
Não existem enzimas conhecidas na técnica que catalisam o substrato para conversão do produto de 3-amino-2-butanol (III) a fosfato de 3- amino-2-butanol (IV). No entanto, foi demonstrado que algumas espécies Pseudomonas e Erwinia expressam etanolamina quinase dependente de ATP (EC 2.7.1.82) que lhes permitem utilizar etanolamina ou 1-amino-2-propanol como uma fonte de nitrogênio (Jones et al. (1973) Biochem. J. 134:167-182). É provável que esta enzima também tenha atividade para 3-amino-2-butanol ou poderia ser projetada para fazê-lo, proporcionando assim uma aminobutanol quinase. A presente invenção descreve, no exemplo 14, um gene de Erwinia carotovora subespécie atroseptica (SEQ ID n° 123) que codifica uma proteína ® (SEQ ID n° 24) que é identificada como uma animo álcool quinase. Esta enzima pode ser usada para converter 3-amino-2-butanol em 3-amino-2-butanol O- fosfato.
O versado na técnica vai apreciar o fato que os polipeptídeos tendo atividade de aminobutanol quinase isolada de uma variedade de fontes serão muito úteis na presente invenção independente da homologia da seqüência. Um exemplo desta atividade foi aqui descrito e é identificado como SEQ ID n° 124. Conseqüentemente, as enzimas preferenciais para aminobutanol quinase são aquelas que têm pelo menos 80% a 85% de identidade com SEQ ID n° 124, e onde pelo menos 85% a 90% de identidade é preferível e onde pelo menos 95% de identidade baseada no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos GAP PENALTY= 10, GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250, é de máxima preferência.
(e) Fosfato de 3-Aiviino-2-Butanol a 2-Butanona: Embora não existam enzimas conhecidas para catalisar o substrato para produzir a conversão do 3-amino-2-butanoI fosfato (IV) para 2-butanona (V), o substrato é muito semelhantes aos utilizados pela enzima piridoxal dependente de fosfato fosfoetanolamina fosfo liase, que tem sido encontrada em um pequeno número de espécies de Pseudomonas e Erwinia. Estas enzimas têm atividade dirigida a fosfoetanolamina e a ambos os enantiômeros de fosfo-1-2- aminopropano (1973) Biochem. J. 134:167-182), e pode, também ter atividade dirigida a 3-amino-2-butanol O-fosfato. A presente invenção descreve um gene de Erwinia carotovora subespécie atroseptica (SEQ ID NO:125) que codifica uma proteína (SEQ ID NO:126) com homologia para aminotransferases classe III. O exemplo 15 demonstra que esta enzima é ativa em ambos substratos de fosfato de aminopropanol e fosfato de aminobutanol. A enzima recém-identificada e caracterizada foi capaz de catalisar a conversão de uma mistura de (R)-3-amino- (S)-2-butanol e (S)-3-amino-fR)-2-butanol O-fosfato, e uma mistura de (R)-3- amino-(R)-2-butanol e (S)-3-amino-(S)-2-butanol O-fosfato a 2-butanona. A enzima recém-identificada e caracterizada foi também capaz de catalisar a conversão de ambos (R) e (S)-amino-l-propanol fosfato a propanona, com uma preferência por (S)-2-amino-1-propanol fosfato. A maior atividade foi observada com o substrato natural proposto DL-1-amino-2-propanol fosfato, que foi convertido para propionaldeído.
O técnico no assunto vai apreciar o fato que os polipeptídeos tendo atividade de aminobutanol fosfato fosfo-liase isolada de uma variedade de fontes serão muito úteis na presente invenção independente da homologia da seqüência. Um exemplo de uma enzima aminobutanol fosfato fosfo-liase adequada é descrita na presente invenção como SEQ ID n° 126. Conseqüentemente, as enzimas preferenciais para aminobutanol fosfato fosfo-liase são aquelas que têm pelo menos 80% a 85% de identidade com SEQ ID n° 126, e onde pelo menos 85% a 90% de identidade é preferível e onde pelo menos 95% de identidade baseada no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250, é de preferência máxima.
(F) 2-Butanona a 2-Butanol: A etapa final em todas as vias para produzir 2 - butanol a partir de ácido pirúvico é a redução de 2-butanona (V) a 2-butanol (VI). Este substrato para conversão do produto é catalisado por alguns membros da classe ampla de álcoois desidrogenases (formas utilizando tanto NADH ou NADPH como fonte de hidreto, dependendo da enzima) que podem ser chamadas de butanol desidrogenases. As enzimas de cada tipo que catalisam a redução de 2-butanona são bem conhecidas, como descrito acima, na definição de butanol desidrogenase.
O técnico no assuntovai apreciar o fato que os polipeptídeos tendo atividade de butano, desidrogenase isoiada de Uma variedade de fontes ser.o w muito úteis na presente invenção independente da homologia da seqüência. Alguns exemplos de enzimas adequadas de butanol desidrogenase estão disponíveis junto à inúmeras fontes, por exemplo, Rhodococcus ruber [GenBank N0: CAD36475 (SEQ ID n° 14), AJ491307 (SEQ ID n° 13)]. As enzimas dependentes de NADP são conhecidas como EC 1.1.1.2 e estão disponíveis, por exemplo, a partir de Pyrococcus furiosus [GenBank N0: AAC25556 (SEQ ID n° 91), AF013169 (SEQ ID n° 90)]. Adicionalmente, uma butanol desidrogenase está disponível a partir de Eseheriehia eoli [GenBank N°:NP_417484 (SEQ ID n° 75), NÇ_000913 (SEQ ID n° 74)] e uma cicloexanol desidrogenase está disponível a partir de Aeinetobaeter sp. [GenBank N0: AAG10026 (SEQ ID n° 72), AF282240 (SEQ ID n° 71)]. As enzimas preferenciais para butanol desidrogenase são aquelas que têm pelo menos 80% a 85% de identidade com SEQ ID N0 14, 91, 75 e 72, onde pelo menos 85% a 90% de identidade é preferível e onde pelo menos 95% de identidade baseada no método de alinhamento Clustal 72 W usando os parâmetros pré- estabelecidos GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250, é de máxima preferência.
Via 2:
(a) Pi ruvato a Alfa-Ac etol actato: Este substrato para conversão do produto é o mesmo descrito acima para via 1.
(b) Alfa-Acetolactato para Acetoína:
Este substrato para conversão do produto é o mesmo descrito acima para via 1.
(g) Acetoína a Fosfoacetoína: Embora as enzimas que catalisam o substrato à conversão do produto de acetoína (II) para fosfoacetoína (VII) não foram descritas, a estrutura do substrato acetoína é muito semelhante a da diidróxi acetona, e, portanto, acetoína pode ser um substrato aceitável para diidróxi acetona quinase (CE 2.7.1.29), uma enzima que catalisa fosforilação de diidróxi acetona. Técnicas de engenharia de proteína para a alteração de especificidade do substrato das enzimas são bem conhecidas (Antikainen e Martin (2005) Bioorg. Med. Chem. 13:2701-2716) e podem ser usadas para gerar uma enzima com a especificidade necessária. Nesta conversão, a porção de fosfato pode ser fornecida por qualquer doador de fosfato de alta energia biológica, com o substrato comum sendo fosfoenolpiruvato (como na E. coii diidroacetona quinase) e ATP (como na Citrobacter freundii diidroacetona quinase) (Garcia-Alles et al. (2004) Biochemistry 43:13037-13045).
(h) Fosfoacetoína a 3-Amino-2-Butanol O-Fosfato: Embora as enzimas que catalisam o substrato à conversão do produto de fosfoacetoína (VII) para 3-amino-2-butanol O-fosfato (IV) não foram descritas, a estrutura do substrato é muito semelhante a do fosfato de diidróxi acetona um substrato para o proposto serinol fosfato aminotransferase codificadas através da porção 5 ' do gene da rtxA em algumas espécies de Bradyrhizobium (Yasuta et al., acima). Assim, uma serinol fosfato aminotransferase pode ser funcional nesta etapa.
(e) 3-Amino-2-Butanol O-Fosfato a 2-Butanona: Este substrato para conversão do produto é o mesmo descrito acima para via 1.
(f) 2-Butanona a 2-Butanol:
Este substrato para conversão do produto é o mesmo descrito acima para via 1.
Via 3:
(a) Piruvato a Alfa-Acetolactato :
Este substrato para conversão do produto é o mesmo descrito acima para via 1.
(b) Alfa-Acetolactato para Acetoína:
Este substrato para conversão do produto é o mesmo descrito acima para via 1.
(I) Acetoína a 2,3-Butanodiol:
O substrato para conversão de produto de acetoína (II) de 2,3- butanodiol (VIII) pode ser catalisado por uma butanodiol desidrogenase, que tanto podem utilizar NADH ou NADPH como a fonte de equivalentes reduzidos durante a realização de reduções. Enzimas com atividade dirigida a acetoína participam na via para a produção de 2,3-butanodiol em organismos que produzem esse composto. As enzimas relatadas aqui (por exemplo, BudC de Klebsiella pneumoniae (Ui et al. (2004) Letters in Applied Microbiology 39:533-537) geralmente utilizam NADH. Qualquer cofator é aceitável para utilização na produção de 2-butanol por esta via.
O versado na técnica vai apreciar o fato que os polipeptídeos tendo atividade de butanodiol desidrogenase isolada de uma variedade de fontes serão muito úteis na presente invenção independente da homologia da seqüência. Alguns exemplos de enzimas adequadas de butanodiol desidrogenase estão disponíveis junto à inúmeras fontes, por exemplo, Klebsiella pneumoniae [GenBank N0: BBA13085 (SEQ ID n° 6), D86412 (SEQ ID n° 5)). As butanodiol desidrogenases (R)-específicas são conhecidas como EC 1.1.1.4 e estão disponíveis, por exemplo, a partir de Bacillus cereus [GenBank N0 NP_830481 (SEQ ID n° 85), NC_004722 (SEQ ID n° 84); AAP07682 (SEQ ID n° 87), AE017000 (SEQ ID n° 86)] e Lactococcus Iaetis [GenBank N0 AAK04995 (SEQ ID n° 89), AE006323 (SEQ ID n° 88)]. As enzimas preferenciais de butanodiol desidrogenase são aquelas que têm pelo menos 80% a 85% identidade com SEQ ID N0 6, 85, 87 e 89, onde pelo menos 85% - 90% identidade é mais preferencial e onde pelo menos 95% de identidade com base no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos de GAP ^ PENALTY=10, GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250, é de máxima preferência.
(J) 2,3-Butanodiol a 2-Butanona: O substrato para conversão de produto de 2,3-butanodiol (VIU) em 2-butanona (V) pode ser catalisada por enzimas desidratase diol (CE 4.2.1.28) e enzimas giicerol desidratase (EC 4.2.1.30). A melhor caracterizada diol desidratase é a coenzima dependente de B12 da enzima Klebsiella oxytoca, mas enzimas similares são encontradas em um número de bactérias entéricas Foi mostrado que a enzima K. oxytoca aceita /T?eso-2,3-butanodiol como um substrato (Bachovchin et ai (1977) Bioehemistry 16:1082-1092), produzindo o produto desejado 2-butanona. O exemplo 17 mostra que a giicerol desidratase Klebsiella pneumoniae foi capaz de converter /77eso-2,3-butanodiol em 2- butanona. As três subunidades da giicerol desidratase de Klebsiella pneumoniae (alfa: SEQ ID n° 145 (região de codificação) e 146 (proteína); betaSEQ ID n° SEQ ID n° 147 (região de codificação) e 148 (proteína); e gama SEQ ID n° 149 (região de codificação) e 150 (proteína)) foram expressos em conjunto com as duas subunidades da Klebsiella pneumoniae giicerol desidratase reativase, SEQ ID n° 151 (região de codificação) e 152 (proteína); e pequena subunidade, SEQ ID n° 153 (região de codificação) e 154 (proteína)) para fornecer atividade.
Existem também relatos na literatura de um independente B12 diol desidratase a partir de Clostridium glycolicum (Hartmanis et ai. (1986) Arch. Biochem. Biophys. 245:144-152). Esta enzima tem atividade para 2,3- butanodiol, embora esta atividade é inferior a 1% da atividade dirigida a etanodiol, mas a enzima pode ser projetada para melhorar essa atividade. A melhor caracterizada desidratase independente de B12 é o glicerol desidratase de Clostridium butyricum (0'Brien et al. (2004) Biochemistry 43:4635-4645), que tem uma alta atividade para 1,2-propanodiol, bem como para glicerol. Esta enzima usa S-adenosil metionina como uma fonte de radical adenosil. Não há ^^ relatos de atividade para 2,3-butanodiol, mas essa atividade, se já não estiver presente, pode eventualmente ser manipulada.
O versado na técnica vai apreciar o fato que os polipeptídeos tendo atividade de butanodiol desidrogenase isolada de uma variedade de fontes serão muito úteis na presente invenção independente da homologia da seqüência. Conforme observado acima uma variedade de diol e glicerol desidratases tem sido descrita na literatura e será adequada para utilização na presente invenção. Conseqüentemente, em um aspecto preferencial da invenção enzimas de diol e glicerol desidratase são aquelas que tem pelo menos 80% a 85% de identidade com enzimas tendo as subunidades grande, média e pequena, respectivamente, das seqüências mencionadas abaixo:
a) SEQ ID n° 8, SEQ ID n° 10 e SEQ ID n° 12; b) SEQ ID n° 93, SEQ ID n° 95 e SEQ ID n° 97; C) SEQ ID n° 99, SEQ ID n° 101, e SEQ ID n° 103; d) SEQ ID n° 105, SEQ ID n° 107 e SEQ ID n° 109; e) SEQ ID n° 135, SEQ ID n° 136 e SEQ ID n° 137; f) SEQ ID n° 138, SEQ ID n° 139 e SEQ ID n° 140; g) SEQ ID n° 146, SEQ ID n° 148 e SEQ ID n° 150; h) SEQ ID n° 141, SEQ ID n° 142 e SEQ ID n° 143; ") SEQ ID n° 164, SEQ ID n° 165 e SEQ ID n° 166. onde pelo menos 85% a 90% de identidade é mais preferível e onde pelo menos 95% de identidade baseada no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos GAP PENALTY=10, GAP LENGTH PENALTy=O,1 e séries de matriz de peso de proteína Gonnet 250, é de máxima preferência. Semelhantemente, enzimas de diol e glicerol desidratase preferenciais são aquelas que tem pelo menos 80% a 85% de identidade com enzimas tendo as subunidades grande, média e pequena, respectivamente, das seqüências mencionadas abaixo:
Subunidadegrande: SEQ ID n° 8, 99, 105, 135, 138, 141, 146 e 164;
Subunidade média: SEQ ID n° 10, 101, 107, 136, 139, 142, 148 e 165; pequena subunidade: SEQ ID n° 12, 103, 109, 137, 140, 143, 150 e 166; onde pelo menos 85% a 90% de identidade é mais preferencial e onde pelo menos 95% de identidade com base no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1, e séries de matriz de peso de proteína Gonnet 250, é da máxima preferência.
As enzimas adicionais de diol e glicerol desidratase que podem ser usadas na via biossintética 3 da presente invenção foram identificado através da estrutura bioinformática/função análise que é descrita a seguir e no exemplo 18.
(f) 2-Butanona a 2-Butanol:
Este substrato para conversão do produto é o mesmo descrito acima para via 1.
Diol E Glicerol Desidratase para Via Biossintética 3
Qualquer enzima que é uma diol ou glicerol desidratases pode ser usada na presente invenção para a conversão de 2,3-butanodiol para 2-butanona. Uma relação de estrutura/função para diol e glicerol desidratases nas classes de enzima EC 4.2.1.28 e EC 4.2.1.30, respectivamente, foi estabelecida na presente invenção no exemplo 18. A função é fornecida através de dados experimentais e a estrutura é fornecida pela análise bioinformática. Oito enzimas de diol e glicerol desidratase com atividades que têm sido experimentalmente demonstradas foram analisadas. Deste grupo (mencionados na tabela 10), foi mostrado que as enzimas diol desidratase de Klebsiella oxytoca e a glicerol desidratase de Klebsiella pneumoniae convertem 2,3-butanodiol para 2-butanona (Bachovchin et al. (1977) Biochemistry 16:1082-1092 e exemplo 17 da presente invenção, respectivamente), enquanto as atividades das seis enzimas adicionais foram demonstradas usando seus substratos naturais (referências dadas na tabela 10). ® Este conjunto de oito diol e glicerol desidratases foi analisado usando o algoritmo de hmmsearch do pacote de software HMMER (Janelia Farm Research Campus1 Ashburn, VA). O parâmetro Z do algoritmo de hmmsearch foi ajustado para 1 bilhão. A saída da análise HMMER usando um conjunto de seqüências de proteína é um perfil Hidden Markov modelo (perfil HMM). A teoria por trás dos perfis HMMs é descrita em Durbin et ai., Biological sequence analysis: probabilistic models ofproteins and nucleic acids, Cambridge University Press, 1998; Krogh et al., 1994; J. Mol. Biol 235:1501-1531, aqui incorporado, a título de referência) que caracteriza um conjunto de proteínas com base na probabilidade de que cada aminoácido ocorrer em cada posição no alinhamento das proteínas do conjunto.
Desde que cada uma das oito diol e glicerol desidratases (diol/glicerol desidratase) com função experimentalmente verificada que foi usada para a análise tem três subunidades (grande ou alfa, média ou beta e pequena ou gama), um perfil separado HMM foi preparado para cada subunidade. O perfil da subunidade grande HMM (tabela 12) foi construído usando proteínas com SEQ ID n° 8, 99, 105, 135, 138, 141, 146 e 164 que são descritas nas tabelas 1 e 2. O perfil da subunidade média HMM (tabela 13) foi construído usando proteínas com SEQ ID n° 10, 101, 107, 136, 139, 142, 148 e 165 que são descritas nas tabelas 1 e 2. O perfil da subunidade pequena HMM (tabela 13) foi construído usando proteínas com SEQ ID n° 12, 103, 109, 137, 140, 143, 150 e 166 que são descritas nas tabelas 1 e 2. As referências que fornecem os dados do ensaio funcional são apresentadas na tabela 10. O perfil HMM preparado para a subunidade grande dá uma caracterização estrutural para a subunidade grande funcional da diol/glicerol desidratases. Similarmente os perfis HMMs para as subunidades médias e pequenas dão caracterizações estruturais para as subunidades funcionais médias e pequenas, respectivamente, de diol/glicerol desidratases. Assim, qualquer proteína que tem uma compatibilidade significante quer para o perfil HMMas de uma subunidade grande, média ou pequena está diretamente ligado à função da subunidade para qual o perfil foi preparado. Para ser significante, a compatibilidade tem um E- valor de 0,01 ou menos, e maior uso de "compatibilidade" se entende que é com este critério de Ε-valor. Assim subunidades diol/glicerol desidratases que podem ser usadas na presente invenção são proteínas que são compatíveis com os perfis HMMs, que foram preparadas usando as proteínas com SEQ ID N0 mencionados acima, com um Ε-valor de 0,01 ou menos.
As proteínas que têm comprimento total e têm vínculo funcional com a subunidade grande da diol/glicerol desidratases, através de correspondência entre o Perfil HMM da subunidade grande, incluem, mas não estão limitados a, proteínas com SEQ ID N0 93, 167, 170, 173, 176, 179, 182, 185, 188, 191, 194, 197, 200, 203, 206, 209, 212, 215, 218, 221, 224, 227, 130, 243, 254, 255, 256, 257, 258 e 259. As proteínas que têm comprimento total e têm vínculo funcional com a subunidade média da diol/glicerol desidratases, através de correspondência entre o Perfil HMM da subunidade média, incluem, mas não estão limitados a, proteínas com SEQ ID N0 95,168, 171, 174, 177, 180, 183, 186, 189, 192, 195, 198, 201, 204, 207, 210, 213, 216, 219, 222, 225, 228, 231, 244, 250, 252, 260, 261, 262, 263, 364, 265, 266 e 267. As proteínas que têm comprimento total e têm vínculo funcional com a subunidade pequena da diol/glicerol desidratases, através de correspondência entre o Perfil HMM da subunidade pequena, incluem, mas não estão limitados a, proteínas com SEQ ID N0 97, 169, 172, 175, 178, 181, 184, 187, 190, 193, 196, 199, 202, 205, 208, 211, 214, 217, 220, 223, 226, 229, 232, 234, 236, 238, 240, 242, 245, 248, 249, 251, 253, 268, 270, 271, 272, 273 e 274. Além disso, as proteínas das subunidades grandes e médias unidas e que têm comprimento total e vínculo funcional com a subunidades grandes e médias da diol/glicerol desidratases, através de correspondência entre o Perfil HMM da subunidade grande e média, incluem, mas não estão limitados a, proteínas com SEQ ID N0 233, 235, 237, 239, 241, 246 e 247.
Desde que os perfis HMMs descritos acima fornecem uma relação de estrutura/função de diol/glicerol desidratases, proteínas recém-identificadas que correspondem a esses perfis podem também ser utilizadas na presente invenção. Além disso, seqüências de proteínas de subunidades de diol/glicerol desidratases que podem ser usadas na presente invenção incluem proteínas com alterações de aminoácido que têm efeitos mínimos sobre a função da subunidade, e que são substancialmente semelhantes às seqüências das SEQ ID N 0 mencionados acima. É bem conhecido na técnica que a substituição de um aminoácido quimicamente equivalente em um determinado local que não afeta as propriedades funcionais das proteínas codificadas é comum. Para os propósitos da presente invenção, as substituições fornecendo proteínas substancialmente similares são definidas como trocas dentro de um dos cinco grupos a seguir:
1. Resíduos alifáticos pequenos, não-polar ou levemente polar: AIa1Ser, Thr (Pro, Gly);
2. Resíduos polar, carregados negativamente e suas amidas: Asp, Asn, Glu, Gln;
3. Resíduos polar, carregados positivamente: His, Arg, Lys;
4. Resíduos alifáticos grandes, não-polar: Met, Leu, lie, Val (Cys);
e
5. Resíduos aromáticos grandes: Phe, Tyr, Trp. Assim, substituições de um aminoácido por outro nestes grupos podem ser esperadas para produzir uma proteína funcionalmente equivalente. Em muitos casos, as mudanças que resultam na modificação das porções N e C termina! da proteína também não seriam esperadas para alterar a atividade da proteína.
As proteínas substancialmente semelhantes às das SEQ ID que correspondem aos perfis HMMs podem ser 90% ou 95% idênticas na seqüência de aminoácidos de uma das proteínas correspondentes e estas ^^ podem ser usadas na presente invenção.
O técnico no assuntopode facilmente identificar um conjunto de
três subunidades que podem ser usadas juntas para proporcionar uma diol/glicerot desidratase funcional. Especialmente adequado, é uma combinação de uma subunidade grande, média e pequena da mesma cepa de organismo, cujas regiões de codificação estão localizadas perto uma da outra no genoma. Estas subunidades mais provavelmente formariam uma diol ou glicerol desidratase natural. Muitas subunidades grandes, médias e pequenas, estão agrupadas desta forma na tabela 2. Uma combinação de subunidades de cepas ou espécies intimamente relacionadas é adequada para compor uma diol desidratase ou uma glicerol desidratase. Qualquer combinação de subunidades que catalisam a conversão de 2,3-butanodiol para 2-butanona pode ser usada. As combinações de subunidade efetivas podem prontamente ser determinadas pelo versado na técnica através de comparações de seqüências de aminoácidos e/ou ensaios funcionais.
Conseqüentemente, a invenção fornece enzimas de dioí e glicerol desidratase tendo seqüências de aminoácidos compreendendo subunidades grandes, médias e pequenas de comprimento total, cada uma com um parâmetro Ε-valor de 0,01 ou menos, quando pesquisado usando um perfil Hidden Markov Model preparado através do uso das subunidades grandes das SEQ ID N 8, 99, 105, 135, 138, 141, 146 e 164; a subunidade média de SEQ ID n° 10, 101, 107, 136, 139, 142, 148 e 165; e as subunidades pequenas de SEQ ID n° 12, 103, 109, 137, 140, 143, 150 e 166; cada pesquisa sendo executada usando o algoritmo hmmsearch sendo que o parâmetro Z está ajustado para um 1 bilhão.
Alternativamente, a invenção fornece enzimas de diol e glicerol desidratase tendo seqüências de aminoácidos identificadas pelo processo compreendendo a) gerar um perfil Hidden Markov Model a partir do alinhamento das seqüências de aminoácidos correspondendo às subunidades grandes, médias e pequenas de enzimas de diol e glicerol desidratase, sendo que:
i) A subunidade grande compreende uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 8, 99, 105, 135, 138, 141, 146 e 164;
ii) A subunidade média compreende uma seqüência de aminoácidos selecionado do grupo consistindo em SEQ ID n° 10, 101, 107, 136, 139, 142, 148 e 165; e
iii) A pequena subunidade compreende uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 12, 103, 109, 137, 140, 143, 150 e 166;
b) pesquisar pelo menos uma base de dados pública de seqüências de proteína contendo seqüências de diol e glicerol desidratases com o perfil "Hidden Markov Model" de (a) usando o algoritmo hmmsearch sendo que o parâmetro Z está ajustado para um 1 bilhão e o parâmetro E-valor está ajustado para 0,01, para identificar um primeiro conjunto de dados de seqüências de aminoácidos de diol e glicerol desidratase; e
c) remover quaisquer seqüências parciais do primeiro conjunto de dados de (b) para gerar um segundo conjunto de dados de seqüências de aminoácidos de diol e glicerol desidratases, sendo que as enzimas de diol desidratase e de glicerol desidratase são identificadas. Com relação às subunidades grandes de diol e gliceroi desidratases da invenção, as enzimas podem compreender uma subunidade grande que compreende uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada a partir do grupo consistindo de SEQ ID N 8, 93, 99, 105, 135, 138, 141, 146, 164, 167, 170, 173, 176, 179, 182, 185, 188, 191, 194, 197, 200, 203, 206, 209, 212, 215, 218, 221, 224, 227, 130, 243, 254, 255, 256, 257, 258 e 259, com base no método de alinhamento Clustal W usando os parâmetros pré- ^^ estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250.
Com relação às subunidades médias de diol e gliceroi desidratases da invenção, as enzimas podem compreender uma subunidade média que compreende uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada a partir do grupo consistindo de SEQ ID n°10, 95, 101, 107, 136, 139, 142, 148, 165, 168, 171, 174, 177, 180, 183, 186, 189, 192, 195, 198, 201, 204, 207, 210, 213, 216, 219, 222, 225, 228, 231, 244, 250, 252, 260, 261, 262, 263, 364, 265, 266 e 167 com base no método de alinhamento Clustal W usando os parâmetros pré- estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250.
Com relação às subunidades pequenas de diol e gliceroi desidratases da invenção, as enzimas podem compreender uma subunidade média compreendendo uma pequena subunidade que compreende uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada a partir do grupo consistindo de SEQ ID n° 12, 97, 103, 109, 137, 140, 143, 150, 166, 169, 172, 175, 178, 181, 184, 187, 190, 193, 196, 199, 202, 205, 208, 211, 214, 217, 220, 223, 226, 229, 232, 234, 236, 238, 240, 242, 245, 248, 249, 251, 253, 268, 270, 271, 272, 273 e 274, com base no método de alinhamento Clustal W usando os parâmetros pré- estabelecidos de GAP PENALTY=101 GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250.
Alternativamente, a diol desidratase ou glicerol desidratase podem compreender subunidades grande, média e pequena unidas, compreendendo uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo consistindo de SEQ ID N 233, 235, 237, 239, 241, 246 e 247, com base no método de alinhamento Clustal usando os parâmetros pré-estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250.
Alternativamente as enzimas de diol desidratase ou glicerol desidratase podem compreender subunidades grande, média e pequena unidas, tendo pelo menos 95% de identidade com uma seqüência de aminoácidos que compreende todas as três das seqüências de aminoácidos que codificam subunidades grandes, médias e pequenas selecionadas do grupo consistindo em:
a) SEQ ID n° 8, SEQ ID n° 10 e SEQ ID n° 12;
b) SEQ ID n° 93, SEQ ID n° 95 e SEQ ID n° 97;
C) SEQ ID n° 99, SEQ ID n° 101, e SEQ ID n° 103;
d) SEQ ID n° 105, SEQ ID n° 107 e SEQ ID n° 109;
e) SEQ ID n° 135, SEQ ID n° 136 e SEQ ID n° 137;
f) SEQ ID n° 138, SEQ ID n° 139 e SEQ ID n° 140;
9) SEQ ID n° 146, SEQ ID n° 148 e SEQ ID n° 150;
h) SEQ ID n° 141, SEQ ID n° 142 e SEQ ID n° 143 e
i) SEQ ID n° 164, SEQ ID n° 165 e SEQ ID n° 166;
com base no método de alinhamento Clustal W usando os parâmetros predeterminados de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250. Via 4:
(α) Piruvato α Alfa-Acetolactato :
Este substrato para conversão do produto é o mesmo descrito acima para via 1.
(κ) Alfa-Acetolactato a Ácido 2,3-Diidróxi-2-Metilbutanóico:
O substrato para conversão do produto de acetolactato (I) a ácido 2,3-diidróxi-2-metilbutanóico (IX) não é conhecido na técnica. Entretanto, o produto desta conversão foi relatado como um componente dos meios d e ^fermentação (Ziadi et al. (1973) Comptes Rendus des Seances de 1'Academie des Sciences, Serie D: Sciences Naturelles 276:965-8), mas o mecanismo de formação é desconhecido. O provável mecanismo de formação é a redução de acetolactato com o NADH ou NADPH como o doador de elétrons. Para utilizar esta via para a produção de 2-butanol, uma enzima catalisando essa reação precisa ser identificada ou produzida. Entretanto, o precedente para redução enzimática de cetonas a álcoois está bem estabelecido.
(l) Ácido 2,3-Piipróxi-2-Metilbutanóico a Ácido 2-Hidróxi-2-Metil-3-
Fosfobutanóico: Não existem enzimas conhecidas que catalisam o substrato para a conversão do produto de ácido 2,3-diidróxi-2-metilbutanóico (IX) a ácido 2- hidróxi-2-metil-3-fosfobutanóico (X). Entretanto, há um grande número de quinases na natureza que possuem especificidades variadas. Por conseguinte, é provável que uma enzima possa ser isolada ou produzida com essa atividade.
(m) Ácido 2-Hidróxi-2-Metil-3-Fosfobutanóico a 2-Butanona:
Não existem enzimas conhecidas que catalisam o substrato para conversão de produto de ácido 2-hidróxi-2-metil-3-fosfobutanóico (X) em 2- butanona (V). A combinação desta reação com a anterior, é muito parecida com a reação multi-etapa catalisada por mevalonato-5-pirofosfato (M5PP) descarboxilase, que consiste na fosforilação inicial da M5PP a 3- fosfomevalonato-5-ΡΡ, seguido de descarboxilação dependente da eliminação de fosfato (Alvear et ai. (1982) Biochemistry 21:4646-4650).
(f) 2-Butanona a 2-Butanol: Este substrato para conversão do produto é o mesmo descrito
acima para a via 1.
Portanto, como existem múltiplas vias recombinantes de piruvato para 2-butanol, existe uma série de opções para executar as etapas de conversão ^^individuais, e o versado na técnica será capaz de utilizar seqüências publicamente disponíveis e seqüências divulgadas aqui para construir as vias de interesse. Uma listagem de um número representativo de genes conhecidos na técnica e úteis na construção de vias biossintéticas de 2-butanol é dada, sobretudo nas tabelas 1 e 2.
Hospedeiros Microbianos para Produção de 2-Butanol ε 2-Butanona
Os hospedeiros microbianos para produção de 2-butanol e 2-
butanona podem ser selecionados a partir de bactérias, cianobactérias, fungos filamentosos e leveduras. Os hospedeiros microbianos para produção de 2-butanol e 2-butanona devem ser tolerantes ao produto produzido, de modo que a produtividade não é limitada pela toxicidade do produto para o hospedeiro. A seleção de um hospedeiro microbiano para produção de 2- butanol é descrita em detalhe abaixo. Os mesmos critérios são aplicáveis à seleção de um hospedeiro para produção de 2-butanona.
Os micróbios que são metabolicamente ativos em altos níveis de titulagem de 2-butanol não são bem conhecidos na técnica. Embora mutantes tolerantes a butanol foram isoladas de Clostridia solventogenic, existe pouca informação disponível sobre a tolerância de butanol de outras cepas bacterianas potencialmente úteis. A maioria dos estudos sobre a comparação da tolerância de álcool em bactérias sugerem que butanol é mais tóxico do que etanol (de Cavalho et al., Microsc. Res. Tech. 64:215-22 (2004) e Kabelitz et al., FEMS Microbiol. Lett 220:223-227 (2003)). Tomas et al. (J. Bacteriol. 186:2006-2018 (2004)) afirmam que o rendimento de 1-butanol durante a fermentação em Clostridium acetobutylicum pode ser limitada pela toxicidade ao butanol. O principal efeito do 1-butanol sobre Clostridium acetobutylicum é o interrupção das funções da membrana (Hermann et al., AppL Environ. Microbiol. 50:1238-1243 (1985)).
Os hospedeiros microbianos selecionados para a produção de 2- butanol devem ser tolerantes ao 2-butanol e deverão ser capazes de converter ^^carboidratos a 2-butanol utilizando a via biossintética introduzidas. Os critérios para seleção de hospedeiros microbianos adequados incluem o seguinte: a tolerância intrínseca ao 2-butanoi, alta taxa de utilização de carboidratos, a disponibilidade de ferramentas genéticas para a manipulação genética e a capacidade de gerar alterações cromossômicas estáveis.
As cepas hospedeiras adequadas com uma tolerância para 2- butanol podem ser identificadas pelo ensaio com base na intrínseca tolerância da cepa. A tolerância intrínseca dos micróbios ao 2-butanol pode ser medida pela determinação da concentração de 2-butanol que é responsável por 50% de inibição da taxa de crescimento (IC50), quando cultivado em um meio mínimo. Os valores de IC50 podem ser determinados usando métodos conhecidos na técnica. Por exemplo, os micróbios de interesse podem ser cultivados na presença de várias quantidades de 2-butanol e a taxa de crescimento monitorada pela medição da densidade óptica em 600 nanômetros. O tempo para duplicar pode ser calculado a a partir da parte logarítmica da curva de crescimento e utilizada como uma medida da taxa de crescimento. A concentração de 2-butanol que produz 50% de inibição de crescimento pode ser determinada a partir de um gráfico da porcentagem de inibição de crescimento versus a concentração de 2-butanol. Preferencialmente, cepa hospedeira deveria ter uma IC50 para 2-butanol de mais de cerca de 0,5%. Mais adequado é uma cepa hospedeira com uma IC50 para 2-butanol que é maior do que cerca de 1,5%. Particularmente adequado é uma cepa hospedeira com uma IC50 para 2-butanol que é maior do que cerca de 2,5%.
O hospedeiro microbiano para produção de 2-butanol também deve utilizar glicose e/ou outros carboidratos em uma taxa alta. A maioria dos micróbios são capazes de utilizar carboidratos. Entretanto, certos micróbios ambientais não podem usar eficientemente os carboidratos, e, portanto, não seriam hospedeiros adequados.
A habilidade de modificar geneticamente o hospedeiro é essencial para a produção de qualquer microorganismo recombinante. Modos de tecnologia de transferência de gene que podem ser utilizados incluem por eletroporação, conjugação, transdução ou transformação natural. Uma ampla gama de plasmídeos conjugativos hospedeiros e de marcadores resistentes a medicamentos estão disponíveis. Os vetores de clonagem usados com um organismo são personalizados para o organismo hospedeiro com base na natureza dos marcadores resistentes a antibióticos que podem funcionar neste hospedeiro.
O hospedeiro microbiano pode, também, ser manipulado de modo à inativar vias concorrentes para fluxo de carbono pela inativação de vários genes. Isto exige a disponibilização de ou transpósons ou vetores de integração cromossômicos para inativação direta. Adicionalmente, os hospedeiros de produção que são propensos a mutagênese química pode sofrer aprimoramento na intrínseca tolerância a 2-butanol através de mutagênese química e triagem de mutantes.
Com base nos critérios acima descritos, hospedeiros microbianos adequados para a produção de 2-butanol e 2-butanona incluem, mas não estão limitados a, os membros do gênero Clostrídium, Zymomonas, Escherichial Salmonella, Rhodococcus, Pseudomonas, Bacillus, LactobaciHus, Enterococcus, Pediococcus, Alcaligenes, Klebsiella, Paenibacillus, Arthrobacter, Corynebacterium, Brevibacterium, Pichia, Candida, Hansenula e Saccharomyces. Hospedeiros preferenciais incluem: Escherichia eoli, Alcaligenes eutrophus, Bacillus licheniformis, Paenibacillus macerans, Rhodococcus erythropolis, Pseudomonas putida, Lactobacillus plantarum, Enterococcus faecium, Enterococcus gallinarium, Enterococcus faecalis, Pediococcus pentosaceus, Pediococcus acidilactici, Bacillus subtilis e Saccharomyces cerevisiae.
Construção de Hospedeiro de Produção
Os organismos recombinantes contendo os genes necessários que codificam a via enzimática para a conversão de um substrato de carbono fermentável para 2-butanol ou 2-butanona podem ser construídos com técnicas bem conhecidas na técnica. Na presente invenção, genes que codificam as enzimas da via biossintética 3 de 2-butanol: acetolactato sintase, acetolactato descarboxilase, butanodiol dehydrogenase, butanodiol desidratase e butanol desidrogenase; ou via biossintética 3 de 2-butanona omitindo o butanol desidrogenase, podem ser isoladas de várias fontes, conforme descrito acima.
Métodos para obtenção dos genes desejados de um genoma bacteriano são comuns e bem conhecidas na técnica de biologia molecular. Por exemplo, se a seqüência do gene é conhecida, iniciadores podem ser projetados e a pretendida seqüência amplificada utilizando-se métodos de amplificação padrão de iniciador direcionados como a reação em cadeia da polimerase (Patente U.S. N° 4.683.202) para obter quantidades de DNA adequadas para clonagem em vetores de expressão. Se um gene que é heterólogo para uma seqüência conhecida deve ser isolado, bibliotecas genômicas adequadas podem ser criadas por endonuclease de restrição de digestão e pode ser testada com sondas tendo seqüência complementar para a desejada seqüência genética. Uma vez que a seqüência é isolada, o DNA pode ser amplificado utilizando-se métodos de amplificação padrão de iniciador direcionados como a reação em cadeia da polimerase (Patente U.S. N0 4.683.202) para obter quantidades de DNA adequadas para clonagem em vetores de expressão, que são então transformados em células hospedeiras adequadas.
Além disso, dada a seqüência de aminoácidos de uma proteína com atividade enzimática desejada, a seqüência de codificação pode ser verificada pela tradução reversa da seqüência de proteína. Um fragmento de DNA contendo a seqüência de codificação pode ser preparado sinteticamente e clonado em um vetor de expressão, e então transformado na célula hospedeira desejada. Com a preparação de um fragmento de DNA sintético contendo
uma seqüência de codificação, esta seqüência pode ser otimizada para expressão na célula hospedeira procurada. As ferramentas para otimização do códon para expressão em um hospedeiro heterólogo estão prontamente disponíveis. Algumas ferramentas de otimização do códon estão disponíveis 15 baseadas no conteúdo GC do organismo hospedeiro. O conteúdo GC de alguns hospedeiros microbianos exemρIificadores é dado na tabela 3.
Tabela 3
Conteúdos GC de Hospedeiros Microbianos
Cepa % GC B. Iicheniformis 46 B. subtilis 42 C. acetobutylicum 37 E. coli 50 P. putida 61 A. eutrophus 61 <table>table see original document page 65</column></row><table>
Uma vez que os genes relevantes para a via são identificados e isolados eles podem ser transformados em hospedeiros de expressão adequados por meios bem conhecidos na técnica. Os vetores úteis para a transformação de uma grande variedade de células hospedeiras são comuns e comercialmente disponíveis a partir de empresas como EPICENTRE® (Madison, WI), Invitrogen Corp. (Carlsbad, CA), Stratagene (La Jolla, CA) e New England Biolabs, Inc. (Beverly, MA). Tipicamente o vetor contém um marcador selecionável e seqüências que permitem a replicação autônoma ou integração cromossômica no hospedeiro desejado. Além disso, vetores adequados compreendem uma região promotora que abriga controles de iniciação transcricional e uma região de controle transcricional de terminação, entre os quais um fragmento de DNA da região de codificação pode ser inserido, para fornecer a expressão da região de codificação inserida. Ambas as regiões de controle podem ser derivadas a partir de genes homólogos à célula hospedeira transformada, embora deva ser entendido que tais regiões de controle também podem ser derivadas de genes que não são nativos para as espécies específicas escolhidas como hospedeiros de produção.
As regiões de controle de iniciação ou promotoras, as quais são úteis para dirigir a expressão relevante nas regiões de codificação da via da célula hospedeira pretendida, são numerosos e familiares para os versados na técnica. Virtualmente qualquer promotor capaz de acionar estes elementos genéticos é adequado para a presente invenção, incluindo, mas não limitado a, promotores derivados dos seguintes genes: CYC1, HIS3, GAL1, GAL10, ADH1, PGK, PH05, GAPDH1 ADCI, TRPIt URA3, LEU2, ENO, TPIM CUPIt FBA1 GPD e GPM (úteis para expressão em Saccharomyces), AOX1 (úteis para expressão em Pichia)', bem como os promotores lac, ara, tet, trp, IPL, IPr, T7, tac e trc (úteis para expressão em Escherichia coli, Alcaligenes, e Pseudomonas); os promotores amy, apr, e npr, e vários promotores fago úteis para expressão em Bacillus subtilis, Bacillus Iieheniformis, e Paenibacillus maeerans; nisA (úteis para expressão em bactérias Gram-positivas, Eichenbaum et al. AppL Environ. MicrobioL 64(8):2763-2769 (1998)); e o promotor P11 sintético (útil para expressão em Laetobaeillus plantarum, Rud et al., Mierobiology 152:1011-1019 (2006)).
As regiões de controle de terminação podem, também, ser derivadas de vários genes nativos para os hospedeiros preferenciais. Opcionalmente, um sítio de terminação pode ser desnecessário, Entretanto, se incluído, isto é de máxima preferência.
Certos vetores são capazes de replicarem em uma ampla gama de bactérias hospedeiras e podem ser transferidos por conjugação. A seqüência completa e anotada de pRK404 e três vetores relacionados, pRK437, pRK442 e pRK442(H), estão disponíveis. Essas derivações provaram ser valiosas ferramentas para a manipulação genética em bactérias gram- negativas (Scott et al., Plasmid 50(1):74-79 (2003)). Vários plasmídeos derivados da ampla faixa de hospedeiros Inc P4 plasmídeo RSF1010 também estão disponíveis com os promotores que podem funcionar em uma variedade de bactérias gram-negativas. Os plasmídeos pAYC36 e pAYC37, têm ativos promotores junto com múltiplos sítios de clonagem para permitir a genes heterólogos a expressão genética em bactérias gram-negativas.
As ferramentas cromossômicas de substituição genética também estão amplamente disponíveis. Por exemplo, uma variante termosensível do replicon pVW101 de ampla faixa de hospedeiros foi alterado de modo a construir um plasmídeo pVE6002 que pode ser utilizado para produzir substituição genética em uma faixa de bactérias Gram-positivas (Maguin et ai., J. Bacteriol. 174(17):5633-5638 (1992)). Adicionalmente, transposomes in vitro estão disponíveis junto a fontes comerciais como EPICENTRE® para criar mutações aleatórias em diversos genomas.
A expressão de uma via biossintética de 2-butanol em vários ^^hospedeiros preferenciais microbianos é descrita com mais detalhes abaixo. Para a expressão de uma via biossintética de 2-butanona, a mesma descrição se aplica, mas o substrato final para conversão do produto de 2-butanona para 2-butanol é omitido.
Expressão da Via Biossintética de 2-Butanol ou 2-Butanona em E. Cou
Os vetores úteis para a transformação de E. coli são comuns e comercialmente disponíveis a partir das empresas mostradas acima. Por exemplo, os genes de uma via biossintética de 2-butanol podem ser isolados a partir de várias fontes, como descrito acima, clonados em um vetor pUC19 modificado e transformados em E. coli NM522, conforme descrito nos exemplos 6 e 7. Alternativamente, os genes que codificam uma via biossintética de 2-butanol podem ser divididos em múltiplos operons, clonados para expressão de vetores, e transformados em diversas cepas E. coli, conforme descrito nos exemplos 9, 10 e 11. A via biossintética de 2-butanona pode ser expressa de forma semelhante, omitindo o butanol desidrogenase.
Expressão da Via Biossintética de 2-Butanol ou 2-Butanona em Rhodococcus Erythropolis
Uma série de vetores de transferência de E. coli-Rhodococcus estão disponíveis para expressão em R. erythropolis, incluindo, mas não se limitando a pRhBR17 e pDA71 (Kostichka et al., Appi Microbioi Biotechnoi 62:61-68 (2003)). Adicionalmente, uma série de promotores estão disponíveis para expressão de gene heterólogo em R. erythropolis (consulte por exemplo Nakashima et ai, Appi. Environ. Mierobioi 70:5557-5568 (2004), e Tao et ai., Appi. Microbioi Biotechnoí. 2005, DOI 10.1007/s00253-005-0064). As rupturas de gene visadas nos genes cromossômicos do R. erythropolis podem ser criadas utilizando os métodos descritos por Tao et al. acima, e Brans et al. (Appi. Envion. Microbiol. 66: 2029-2036 (2000)).
Os genes heterólogos necessários para a produção de 2-butanol, como descrito acima, podem ser clonados inicialmente em pDA71 ou pRhBR71 e transformados em E. coli. Os vetores podem então ser transformados em R. erythropolis por eletroporação, conforme descrito por Kostichka et al., acima. Os recombinantes podem ser cultivados em meio sintético contendo glicose e a produção de 2-butanol pode acontecer ao se usar métodos de fermentação conhecidos na técnica. A via biossintética de 2-butanona pode ser expressa de forma semelhante, omitindo o butanol desidrogenase.
Expressão da Via Biossintética de 2-Butanol ou 2-Butanona em B. Subtilis Os métodos para a expressão dos genes e criação de mutações em B. subtilis também são bem conhecidos na técnica. Por exemplo, os genes de uma via biossintética de 2-butanol podem ser isolados a partir de várias fontes, como descrito acima, clonados em um vetor de transformação modificada E. coli-BacilIus e transformados em Bacillus subtilis BE1010, conforme descrito no exemplo 8. Os genes desejados podem ser clonados em um vetor de expressão Bacillus e transformados em uma cepa para fazer um hospedeiro de produção. Alternativamente, os genes podem ser integrados no cromossomo Bacillus utilizando replicons condicionais ou vetores suicidas que são conhecidas para o versado na técnica. Por exemplo, o "Bacillus Genetic Stock Center" possui numerosos vetores de integração. A via biossintética de 2-butanona pode ser expressa de forma semelhante, omitindo o butanol desidrogenase. Expressão da Via Biossintética de 2-Butanol ou 2-Butanona em b. Licheniformis
A maioria dos plasmídeos e vetores de transferência que replicam em B. subtilis podem ser usados para transformar B. Iicheniformis por ou transformação por protoplastos ou por eletroporação. Os genes necessários para a produção de 2-butanol podem ser clonados em plasmídeos pBE20 ou pBE60 derivados (Nagarajan et al., Gene 114:121-126 (1992)). Métodos para transformar B. licheniformis são conhecidas na técnica (por exemplo, consulte Fleming et al. Appi Environ. Microbiol., 61(11):3775-3780 (1995)). Os plasmídeos construídos para a expressão em B. subtilis podem ser transformados em B. Iicheniformis para produzir um hospedeiro microbiano recombinante que produz 2-butanol. A via biossintética de 2-butanona pode ser expressa de forma semelhante, omitindo o butanol desidrogenase.
Expressão da Via Biossintética de 2-Butanol ou 2-Butanona em Paenibacillus Macerans
Os plasmídeos podem ser construídos como descrito acima para a expressão em B. subtilis e utilizados para transformar Paenibacillus macerans por transformação de protoplasta para produzir um hospedeiro microbiano recombinante que produz 2-butanol. A via biossintética de 2-butanona pode ser expressa de forma semelhante, omitindo o butanol desidrogenase.
Expressão da Via Biossintética de 2-Butanol ou 2-Butanona em Alcaligenes (Ralstonia) Eutrophus
Os métodos para a expressão dos genes e criação de mutações na Aleafigenes eutrophus são conhecidos na técnica (consulte, por exemplo, Taghavi et al, Appi Environ. Microbiol, 60(10):3585-3591 (1994)). Os genes para uma via biossintética de 2-butanol podem ser clonados em qualquer um dos vetores da ampla faixa de hospedeiros descrita acima, e através de eletroporação em Alcaligenes eutrophus para gerar recombinantes que produzem 2-butanol. A via do poli(hidroxibutirato) em Alcaligenes tem sido descrita em pormenor, uma variedade de técnicas genéticas para modificar o genoma do Alcaligenes eutrophus são conhecidas, e essas ferramentas podem ser aplicadas para projetar uma via biossintética de 2-butanol. A via biossintética de 2-butanona pode ser expressa de forma semelhante, omitindo a butanol desidrogenase.
são conhecidos na técnica (consulte, por exemplo, Ben-Bassat et al., Patente U.S. N0 6.586.229, que é aqui incorporada, por referência). Os genes de uma via biossintética de 2-butanol podem ser inseridos em pPCU18, e este DNA ligado pode ser eletroporado em células eletrocompetentes de Pseudomonas putida DOT-T1 C5aAR1 para gerar recombinantes que produzem 2-butanol. A via biossintética de 2-butanona pode ser expressa de forma semelhante, omitindo o butanol desidrogenase.
plasmídeos e vetores utilizados na transformação de Bacillus subtilis e Streptococcus podem ser usados para Laetobaeillus. Alguns exemplos não- Iimitadores de vetores adequados incluem pAMâl e derivados dessas substâncias (Renault et al., Gene 183:175-182 (1996); e 0'Sullivan et al., Gene 137:227-231 (1993)); pMBB1 e pHW800, um derivado de pMBB1 (Wyckoff et al. Appi. Environ. MierobioL 62:1481-1486 (1996)); pMG1, um plasmídeo conjugativo (Tanimoto et al., J. Baeteriol. 184:5800-5804 (2002)); pNZ9520 (Kleerebezem et al., Appi Environ. Mierobioi. 63:4581-4584 (1997)); pAM401 (Fujimoto et al., Appi. Environ. Mierobioi. 67:1262-1267 (2001)); e pAT392
Expressão da Via Biossintética de 2-Butanol ou 2-Butanona em
Pseudomonas Putida Os métodos para expressão genética em Pseudomonas putida
Expressão da Via Biossintética de 2-Butanol ou 2-Butanona em
Lactobacillus Plantarum
O gênero Laetobaeillus pertence à família Lactobacillales e muitos (Arthur et al., Antimicrob. Agents Chemother. 38:1899-1903 (1994)). Vários plasmídeo a partir de Lactobacillus plantarum têm também sido divulgados (van Kranenburg et al., AppL Environ. Microbiol. 71(3):1223-1230 (2005)).
Os vários genes para uma via biossintética de 2-butanol podem ser montados em qualquer vetor adequado, como aqueles descritos acima. Os códons podem ser otimizados para expressão com base no índice de códon deduzido a partir de seqüências de genoma de Lactobacillus plantarum ou Lactobacillus arizonensis. Os plasmídeos podem ser introduzidos em uma célula hospedeira usando-se métodos conhecidos na técnica, como eletroporação (Cruz-Rodz et al. Molecular Genetics and Genomies 224:1252-154 (1990), Bringel, et al. Appi. Microbiol. Biotechnol. 33: 664-670 (1990), Alegre et al., FEMS Microbiology Ietters 241:73-77 (2004)), e conjugação (Shrago et al., Appi. Environ. Microbiol. 52:574-576 (1986)). Os genes da via biossintética de 2- butanol podem também ser integrados no cromossomo de Lactobacillus usando vetores de integração (Hols et al., Appi. Environ. Microbiol. 60:1401-1403 (1990), Jang et al., Micro. Letí. 24:191-195 (2003)). A via biossintética de 2-butanona pode ser expressa de forma semelhante, omitindo o butanol desidrogenase.
Expressão da Via Biossintética de 2-Butanol ou 2-Butanona em Enterococcus Faecium, Enterococcus Gallinarium ε Enterococcus Faecalis
O gênero Enterococcus pertence à família Lactobacillales e muitos plasmídeos e vetores utilizados na transformação de Lactobacillus, Bacillus subtilis e Streptococcus, descritos acima, podem ser usados para Enterococcus. Os vetores de expressão para E. faecalis usando o gene nisA a partir de Lactococcus podem também ser usados (Eichenbaum et al., Appl. Environ. Microbiol. 64:2763-2769 (1998). Adicionalmente, vetores de substituição genética no cromossomo E. faecium podem ser usados (Nallaapareddy et al., Appi. Environ. Microbiol. 72:334-345 (2006)).
Os vários genes para uma via biossintética de 2-butanol podem ser montados em qualquer vetor adequado, como aqueles descritos acima. Os códons podem ser otimizados para expressão com base no índice de códon deduzido a partir de seqüências de genoma de Enterococcus faecalis ou Enterococcus faecium. Os plasmídeos podem ser introduzidos na célula hospedeira por meio de métodos conhecidos na técnica, como a eletroporação, conforme descrito por Cruz-Rodz et al. (Molecular Geneties and Genomies 224:1252-154 (1990)) ou conjugação, conforme descrito por Tanimoto et al. (J. BaeterioL 184:5800-5804 (2002)) e Grohamann et al. (Mierobiol. Mol. BioL Rev. 67:277-301 (2003)). A via biossintética de 2-butanona pode ser expressa de forma semelhante, omitindo o butanol desidrogenase.
Expressão da Via Biossintética de 2-Butanol ou 2-Butanona em Pediococcus Pentosaceus ε Pediococcus Acidilactici, O gênero Pedioeoceus pertence à família Lactobacillales e muitos plasmídeos e vetores utilizados na transformação de Bacillus subtilis e Streptococcus, descritos acima, podem ser usados para Pedioeoceus. Um exemplo não-limitador de um vetor adequado é pHPS9 (Bukhtiyarova et al. AppL Environ. Microbiol. 60:3405-3408 (1994)). Vários plasmídeos a partir de Pediococcus têm também sido divulgados (Alegre et al., FEMS Microbiol. Lett. 250:151-156 (2005); Shareck etal. Crit Rev Bioteehnol. 24:155-208 (2004)). Os genes para uma via biossintética de 2-butanol podem ser
montados em qualquer vetor adequado, como aqueles descritos acima. Os códons podem ser otimizados para expressão com base no índice de códon deduzido a partir de seqüências de genoma de Pedioeoceus pentosaceus. Os plasmídeos podem ser introduzidos na célula hospedeira por meio de métodos conhecidos na técnica, como eletroporação (consulte, por exemplo, Osmanagaoglu et al., J. Basic Microbiol. 40:233-241 (2000); Alegre et al., FEMS Microbiol. Lett 250:151-156 (2005)) e conjugação (Gonzalez and Kunka, Appl. Environ. Microbiol. 46:81-89 (1983)). Os genes da via biossintética de 2-butanol podem também ser integrados no cromossomo de
Pediococcus usando vetores de integração (Davidson et al. Antonie van Leeuwenhoek 70:161-183 (1996)). A via biossintética de 2-butanona pode ser expressa de forma semelhante, omitindo o butanol desidrogenase. Meio de Fermentação
O meio de fermentação da presente invenção precisa conter substratos adequados de carbono. Os substratos adequados podem incluir, mas não estão limitados a monossacarídeos como a glicose e a frutose, oligossacarídeos como a Iactose ou sacarose, polissacarídeos como o amido ou celulose, ou misturas dos mesmos, e misturas não purificadas a partir de fontes renováveis de matérias primas, como queijo e soro de leite permeado, água de maceração de milho (cornsteep Iiquor), melaço de açúcar de beterraba e malte de cevada. Além disso, o substrato de carbono pode também ser um substrato de carbono como o dióxido de carbono, ou metanol para o qual a conversão metabólica em intermediários bioquímicos vitais foi demonstrada. Além de substratos de um e dois carbonos, organismos metilotróficos são também conhecidos por utilizar uma série de outros compostos que contêm carbono, como a metilamina, glucosamina e uma variedade de aminoácidos para a atividade metabólica. Por exemplo, leveduras metilotróficas são conhecidas por utilizar o carbono de metilamina para formar trealose ou glicerol (Bellion et al., Microb. Growth C1 Compd., [Int. Symp.], 7th (1993), 415-32, Editor(s): Murrell1 J. Collin; Kelly, Don P. Publisher: lntercept, Andover, UK). Semelhantemente, várias espécies de Candida metabolizarão alanina ou ácido oléico (Sulter et al., Arch. Microbiol. 153:485-489 (1990)). Por isso é que se espera uma fonte de carbono para utilização na presente invenção que possa abranger uma grande variedade de substratos que contêm carbono e apenas seja limitada pela escolha do organismo.
Embora seja esperado que todos os substratos de carbono acima mencionados e suas misturas sejam adequados para a presente invenção, substratos preferenciais de carbono são a glicose, frutose e sacarose, assim como as misturas de quaisquer destes açúcares. A sacarose pode ser obtida a partir de matérias primas como cana de açúcar, açúcares de beterraba, mandioca e sorgo doce. A glicose e a dextrose podem ser obtidas através de sacarificação do amido baseado em matérias primas incluindo grãos, como milho, trigo, centeio, cevada e aveia.
Além disso, açúcares fermentáveis podem ser obtidos a partir de celulose e biomassa lignocelulósica através de processos de tratamento prévio e sacarificação, como descrito, por exemplo, no pedido de patente US20070031918A1, que é co-propriedade e co-pendente, o qual está aqui incorporado por referência. A biomassa refere-se a qualquer material celulósico ou lignocelulósico e inclui materiais que compreendem celulose, e opcionalmente compreendendo, ainda, hemicetulose, lignina, amido, oligossacarídeos e/ou monossacarídeos. E la pode, também, compreender componentes adicionais, como proteína e/ou lipídio. A biomassa pode ser derivada de uma única fonte, ou a biomassa pode compreender uma mistura derivada de mais de uma fonte; por exemplo, a biomassa pode compreender uma mistura de sabugos de milho e palha de milho, ou uma mistura de grama e folhas. Ela inclui, mas não se limita a, colheitas usadas para bioenergia, resíduos agrícolas, resíduos sólidos urbanos, resíduos industriais sólidos, lamas provenientes de fábricas papel, resíduos de jardim, madeira e resíduos florestais. Exemplos de biomassa incluem, mas não estão limitados a, grãos de milho, sabugos de milho, restos de colheitas, como cascas de milho, palha de milho, gramíneas, trigo, palha de trigo, cevada, palha de cevada, feno, palha de arroz, capim "switchgrass", resíduos de papel, bagaço de cana de açúcar, sorgo, soja, componentes obtidos a partir de moagem de grãos, árvores, galhos e raízes, folhas, madeira, serradura, arbustos e moitas, legumes, frutos, flores e estrume animal. Além de uma adequada fonte de carbono, meios de fermentação adequados devem conter minerais, sais, cofatores, tampões e outros componentes, conhecidas por aqueles versados na técnica, adequados para o crescimento das culturas e na promoção de uma via enzimática necessária para produção de 2-butanol ou 2-butanona.
Condições da Cultura Tipicamente as células são cultivadas a uma temperatura na faixa de cerca de 25°C a cerca de 40°C em um meio adequado. Os meios de crescimento adequados na presente invenção são comuns e comercialmente preparados como meio Luria Bertani (LB)1 meio Sabouraud dextrose (SD) ou meio Yeast Médium [meio de levedura] (YM). Outros meios de crescimento definidos ou sintéticos podem também ser utilizados, bem como o meio adequado para o crescimento de microorganismos particulares será conhecida por um perito na matéria de microbioiogia ou ciência da fermentação. O uso de agentes conhecidos para modular a repressão de catabólito direta ou indiretamente, por exemplo, adenosina cíclico 2':3'-monofosfato, também podem ser incorporadas na fermentação médio.
A faixa de pH adequada para a fermentação está entre pH 5,0 e pH 9,0, onde pH de 6,0 a pH 8,0 é preferencial como a condição inicial. As fermentações podem ser realizadas sob condições aeróbicas e
anaeróbicas, onde as condições anaeróbias ou microaeróbicas são preferenciais. Fermentações Industriais Por Batelada ε Contínua O presente processo emprega um método de fermentação por batelada. Uma clássica fermentação por batelada é um sistema fechado em que a composição do meio é fixada no início da fermentação e não está sujeita a alterações artificiais durante a fermentação Assim, no início da fermentação o meio é inoculado com o desejado organismo ou organismos, e a fermentação ocorre sem que se acrescente nada ao sistema. Entretanto, tipicamente uma fermentação por "batelada" é batelada com relação à adição de fonte de carbono e muitas vezes são feitas tentativas para controlar fatores tais como pH e concentração de oxigênio. Nos sistemas de batelada, as composições de biomassa e metabólito do sistema mudam constantemente até o momento no qual a fermentação é interrompida. Dentro da batelada as culturas de células moderam através de uma fase Iag estática para uma fase Iog de crescimento elevado e finalmente para uma fase estacionária, onde a taxa de crescimento é diminuída ou interrompida. Se não tratadas, as células em fase estacionária eventualmente morrerão. As células em fase Iog geralmente são responsáveis pela maior parte da produção do produto final ou intermediário.
Uma variação no sistema padrão por batelada é o sistema por batelada alimentado - Os processos de fermentação por batelada alimentados também são adequados na presente invenção e compreendem um sistema típico por batelada com a exceção de que o substrato é adicionado em incrementos enquanto a fermentação progride.- Os sistemas alimentados por batelada são úteis quando a repressão de catabólito é capaz de inibir o metabolismo da célula e quando é desejável se ter limitadas quantidades de substrato no meio.- A medição da concentração real de substrato em sistemas por batelada alimentados é difícil e, portanto, é estimada com base nas variações dos fatores mensuráveis, como pH, oxigênio dissolvido e da pressão parcial de resíduos de gases como o CO2. Bateladas e fermentações por bateladas alimentadas são comuns e bem conhecidas na técnica e exemplos podem ser encontrados em Thomas D. Brock in Biotechnology: A Textbook of Industrial Microbiology, Second Edition (1989) Sinauer Associates, Inc., Sunderland, MA., ou Despende, Mukund V., AppL Biochem. Biotechnol., 36:227, (1992), aqui incorporado por referência.
Embora a presente invenção seja realizada com a modalidade de batelada, se espera que o método seja adaptável aos métodos de fermentação contínua. A fermentação contínua é um sistema aberto em que o meio de fermentação definido é adicionado continuamente para um biorreator e igual quantidade de meio condicionado é removido simultaneamente para processamento. A fermentação contínua geralmente mantém as culturas constantemente em alta densidade.
Ela permite a modulação de um fator ou de qualquer número de fatores que afetam o crescimento celular ou a concentração do produto final. Por exemplo, um método irá manter um nutriente limitante, como a fonte de carbono ou nível de nitrogênio a uma taxa fixa e permitir que todos os outros parâmetros a variar moderadamente Em outros sistemas, uma série de fatores que afetam o crescimento podem ser modificados continuamente enquanto a concentração de células, medida pela turvação do meio de cultura, é mantida constante. Os sistemas contínuos se esforçam para manter um regime permanente de crescimento e, portanto, a perda de células devido ao meio sendo retirado deve ser balanceada com a taxa de crescimento celular na fermentação. Os métodos de modulação de nutrientes e fatores de crescimento para os processos de fermentação contínuos, como técnicas para maximizar a taxa de formação de produto são bem conhecidos na técnica de microbiologia industrial e uma variedade de métodos são detalhados por Brock, acima.
É contemplado que a presente invenção possa ser praticada usando ou processos por batelada, ou processos por batelada alimentado, ou processos contínuos e qualquer modo conhecido de fermentação pode ser adequado. Além disso, espera-se que as células possam ser imobilizadas em um substrato como catalisador da célula inteira, e submetida às condições de fermentação para produção de 2-butanol e 2-butanona.
Métodos para Isolamento de 2-Butanol E 2-Butanona do Meio de Fermentação
O 2-butanol bioproduzido pode ser isolado do meio de fermentação usando métodos conhecidos na técnica de fermentações ABE(consulte por exemplo, Durre, Appf. MicrobioL BiotechnoL 49:639-648 (1998), Groot et al., Process Biochem. 27:61-75 (1992), e referências neste). Por exemplo, sólidos podem ser removidos do meio de fermentação por centrifugação, filtração, decantação ou similares. Em seguida, o 2-butanol pode ser isolado do meio de fermentação usando métodos como a destilação, destilação azeotrópica, extração líquido-líquido, adsorção, arraste gasoso (gas stripping), evaporação por membrana ou pervaporação. Estes mesmos métodos podem ser adaptados para isolar 2-butanona bioproduzida do meio de fermentação Exemplos
A presente invenção está adicionalmente definida nos exemplos a
seguir. Deve ficar entendido que estes exemplos, apesar de indicarem uma modalidade preferencial da invenção, são dados apenas a título de ilustração. A partir da discussão acima e destes exemplos, um versado na técnica pode conhecer as características essenciais desta invenção e, sem que se desvie do caráter e âmbito da mesma, podemos fazer várias alterações e modificações na invenção para adaptá-la às suas diferentes utilizações e condições.
Métodos Gerais As técnicas padrão de DNA recombinante e clonagem molecular descritas nos exemplos são bem conhecidas na técnica e são descritas por Sambrook, J., Fritsch, E. F. F. e Maniatis, T. Molecular Cloning: A Laboratory Manual, nd ed., Cold Spring Harbor Laboratory: Cold Spring Harbor, NY1 (1989) (Maniatis) e por T. J. Silhavy, M. L. Bennan e L. W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1984) e por Ausubel1 F. M. et ai., Current Protocols in Molecular Biology, publicado por Greene Publishing Assoc. e Wiley-Interscience (1987).
Os materiais e métodos adequados para a manutenção e o crescimento de culturas de bactérias são bem conhecidos na técnica. As técnicas adequadas para utilização nos seguintes exemplos podem ser encontradas de acordo com o Manual of Methods for General Bacteriology (Phillipp Gerhardt, R. G. E. Murray, Ralph N. Costilow, Eugene W. Nester1 Willis A. Wood, Noel R. Krieg e G. Briggs Phillips, eds), American Society for Microbiology, Washington, DC. (1994)) ou por Thomas D. Brock em Biotechnology: A Textbook of Industrial Microbiology, Second Edition, Sinauer Associates, Inc., Sunderland, MA (1989). Todos os reagentes, enzimas de restrição e materiais descritos para o crescimento e manutenção das células bacterianas foram obtidos de AIdrich Chemicals (Milwaukee, Wl), BD Diagnostic Systems (Sparks, MD), Life Technologies (Rockville, MD) ou Sigma Chemical Company (St. Louis, MO) a não ser que indicado de outra forma. As cepas bacterianas são obtidas a partir da "American Type Culture Collectionn (ATCC, Manassas, VA) exceto onde especificado em contrário.
Os Iniciadores Oligonucleotídeos Descritos nos Exemplos a Seguir são Apresentados na Tabela 4. Todos os Iniciadores Oligonucleotídeos Foram Sintetizados por Sigma-Genosys (Woodlands, TX). Tabela 4 Clonagem E Triagem de Iniciadores
<table>table see original document page 79</column></row><table> <table>table see original document page 80</column></row><table> Gene Nome do iniciador Seqüência SEQ ID n° Descrição -- BenF ACTTTCTTTC G C CTGTTTC AC 31 -- — BenBPR C ATG AAGCTTGTTTAAACTCG GTG ACCTTG AAAATAATGAAAACTTATATTG Illl GAAAA TAATGAAAACTT ATATTG 32 — budAB BABC F G AGCTC G AATTC AAAG G AG G AAGTGTATAT GAATCATTC 33 budAB forward budAB BABR GGATCCTCTAGAATTAGTTAAATACCATCC CGCCG 34 budAB reverse budC BC Spe F ACTAGTAAAGGAGGAAAGAGTATGAAGAAG GTCGCACT 40 budC forward budC BC Xba R TCTAGAAAGCAGGGGCAAGCCATGTC 41 budA reverse pddABC- ddrAB DDo For AAG CTTAAAG GAG G CTG ATTC ATG AG ATC G AAAAGATT 44 pddABC- ddrAB forward pddABC- ddrAB DDo Rev TCTAGATTATTCATCCTGCTGTTCTCC 45 pddABC- ddrAB reverse chnA ChnAF CATCAATTGACTACGTAGTCGTACGTGTAA GGAGGTTTGAAATGGAAAAAATTATG 54 chnA forward chnA ChnA R CATGCTAGCCCCGGGTATCTTCTACTCATT TTTTATTTCG 55 chnA reverse Top ter F1 CTAG AAGTC AAA AG C CTC C G ACC G G AG G C I I I I GA 58 forward -- Top ter F2 CTGCTCGAGTTGCTAGCAAGTTTAAACAAA AAAAAGC CCGCTC ATTAGGCGGGCTGAGC 59 forward <table>table see original document page 82</column></row><table> <table>table see original document page 83</column></row><table>
Tabela 5
Iniciadores de Sequenciamento
<table>table see original document page 83</column></row><table> <table>table see original document page 84</column></row><table>
Métodos para a Determinação da Concentração de 2-Butanol E 2- Butanona no Meio de Cultura
A concentração de 2-butanol e 2-butanona no meio de cultura pode ser determinada por inúmeros métodos conhecidos na técnica. Por exemplo, um método específico de cromatografia líquida de alta eficiência (HPLC-high performance liquid chromatography) utilizando uma coluna Shodex SH-1011 com uma coluna de segurança Shodex SH-G, ambas compradas de Waters Corporation (Milford, MA), com detecção de índice de refração (IR). A separação cromatográfica foi obtida usando-se H2SO4 0,01 M como a fase móvel, com um fluxo de 0,5 mL/min e uma temperatura de coluna de 50°C. Nas condições usadas, 2-butanona e 2-butanol tiveram tempos de retenção de 39,5 e 44,3 min, respectivamente. Alternativamente, métodos de cromatografia gasosa (GC-gas chromatography) estão disponíveis. Por exemplo, um determinado método GC utilizado um coluna HP-INNOWax (30 m χ 0,53 mm ID1 1 pm de espessura de filme, Agilent Technologies, Wilmington, DE), com um detector por ionização de chama (FID - flame ionization detector). O gás de arraste foi hélio a um fluxo de 4,5 mL/min, medido a 150°C com pressão na cabeça da coluna constante; "split" do injetor foi 1:25 a 200°C; temperatura do forno foi 45°C durante 1 minuto, 45 para 220°C a 10°C/min, e 220°C durante 5 minutos; e detecção FID foi empregada a 240°C com gás de compensação hélio a 26 mL/min. Os tempos de retenção de 2-butanona e 2-butanol foram de 3,61 e 5,03 min, respectivamente.
A 2-Butanona também pode ser detectada por derivatização com 3-metil-2-benzotiazolinona hidrazona (MBTH - 3~methyl-2-benzothiazolinone hydrazone). Uma solução aquosa contendo 2-butanona é misturada com um volume igual de uma solução aquosa de 6 mg/mL de MBTH em 375 mM de glicina-HCI (pH 2,7) e incubados a 100°C por 3 min. As amostras resultantes de derivatizado de MBTH são analisadas em uma coluna(Supelco) com 25 cm χ 4,6 mm (id) Supelosil LC-18-D5 5 pm utilizando uma fase móvel de 55% de acetonitrila em água a um fluxo de 1 mL/min. Os derivados de 2-butanona aparecem como dois picos (isômeros eis e trans), com tempos de retenção de cerca de 12,3 e 13,3 min e absorbância máxima de 230 e 307 nm.
O significado das siglas é o seguinte: "s" significa segundo(s), "min" significa minuto(s), "h" significa hora(s), "psi" significa libras por polegada quadrada, "nm" significa nanômetros, "d" significa dia(s), "pL" significa microlitro(s), "mL" significa mililitro(s), "L" significa litro(s), "mm" significa milímetros(s), "Mm" significa millimolar, nMn significa molar", "mmol" significa millimole(s), "μπΊοΓ significa micromole(s) "g", "significa grama(s)," "mg" "significa micrograma (s) e "Ng" significa nanogramas(s), "PCR" significa reação em cadeia da polimerase, "DO" significa densidade óptica, "D0600", a densidade óptica medida no comprimento de onda de 600 nm, "kDa" significa kilodaltons, "g", a constante gravitacional, "pb" significa par(es) de base, "kpb" significa kilopar(es) de base, "% w/v" significa porcentagem em peso/volume,"% v/v" significa porcentagem em volume/volume, "wt%" significa porcentagem em peso, "HPLC" significa cromatografia líquida de alta eficiência, "GC" significa cromatografia gasosa. O termo "seletividade molar" é o número de moles de produto produzidos por mol de substrato de açúcar consumido e são relatados como uma porcentagem.
Exemplo 1
Clonagem E Expressão de Acetolactato Sintase
O objetivo do presente exemplo foi clonar e expressar em E. coli o gene budB que codifica a enzima acetolactato sintase. O gene budB foi amplificado a partir do DNA genômico de Klebsiella pneumoniae cepa ATCC 25955 usando PCR.
A seqüência budB que codifica acetolactato sintase foi amplificada a partir do DNA genômico de Klebsiella pneumoniae (ATCC 25955) por PCR usando o par iniciador B1 (SEQ ID n° 15) e B2 (SEQ ID n° 16). Outros reagentes de amplificação de PCR (por exemplo, Kod HiFi DNA polimerase (Novagen Inc., Madison1 Wl; catálogo N0 71805-3)) foram fornecidos em kits do fabricante e usados de acordo com o protocolo do fabricante. O DNA genômico de Klebsiella pneumoniae foi preparado usando o kit Gentra Puregene (Gentra Systems, Inc., Minneapolis, MN; catalog number D-5000A). A amplificação foi executada em um termociclador de DNA GeneAmp 9700 (PE Applied Biosystems, Foster city, CA). A seqüência de nucleotídeos do quadro de leitura aberto (ORF - open reading frame) e da seqüência de aminoácidos predita da Enzima são dadas como SEQ ID n° 3 e SEQ ID n° 4, respectivamente.
Para os estudos de expressão a tecnologia de clonagem Gateway (Invitrogen Corp., Carlsbad1 CA) foi usada. O vetor de entrada pENTR/SD/D- TOPO permite clonagem direcional e forneceu uma seqüência Shine-Dalgarno para o gene de interesse. O vetor de destino pDEST14 usou um promotor T7 para expressão do gene sem identificação. O iniciador forward incorporou quatro bases (CACC), imediatamente adjacente ao códon de partida translacional permitir a clonagem direcional da região de codificação budB de acetolactato sintase do produto da PCR em pENTR/SD/D-TOPO (Invitrogen), gerando o plasmídeo pENTRSDD-TOPO budB. O pENTR construído foi transformado em células E. coli TopIO (Invitrogen) e chapeado de acordo com as recomendações do fabricante. Os transformante foram cultivados de um dia para o outro e DNA do plasmídeo foi preparado usando o kit QIAprep Spin Miniprep (Qiagen, Valencia1 CA; catálogo N0 27106) de acordo com as recomendações do fabricante. Para criar um clone de expressão, a região codificante budBde pENTRSDD-TOPObudB foi transferida para o vetor ρDEST 14 por recombinação in vitro usando a mistura LR Clonase (Invitrogen, Corp., Carlsbad, CA). O vetor resultante, pDEST14budB, foi transformado em células de BL-21-AI (Invitrogen Corp.). As células BL-21-AI transportam uma cópia cromossômica da polimerase T7 RNA sobre o controle do promotor arabinose-induzível araBAD.
Os transformantes são inoculados no meio LB suplementado com 50 pg/mL de ampicilina e cultivados de um dia para o outro. Uma alíquota da cultura é usada para inocular 50 mL de meio LB suplementado com 50 ug/mL de ampicilina. A cultura é incubada a 37°C com agitação até a DOeoo atingir 0,6 a 0,8. A cultura é dividida em duas porções de 25-mL e arabinose é adicionada a um dos frascos para uma concentração final de 0,2% de peso por volume. O frasco de controle negativo não é induzido com arabinose. Os frascos são incubados por 4 h a 37°C com agitação. As células são colhidas por centrifugação e os péletes das células estão ressuspensos em Mops 50 mM, tampão pH 7,0. As células são perturbadas, quer por sonicação ou por uma passagem através de uma prensa francesa (French Pressure Cell). Cada Iisado celular é centrifugado produzindo o sobrenadante e o pélete da fração insolúvel. Uma alíquota de cada fração (toda a célula Iisada1 a partir de células induzidas e de controle, é ressuspensa na SDS (MES) tampão de carga (Invitrogen), aquecida a 85°C por 10 min e submetidas à análise SDS-PAGE (NuPAGE 4 a 12% Bis Tris-Gel1 catálogo número NP0322Box, Invitrogen). A proteína de peso molecular esperado, como deduzida a partir da seqüência de ácido nucléico, está presente na cultura induzida mas não no controle não induzido.
A atividade de acetolactato sintase nos extratos livres da célula é medida usando-se o método descrito por Bauerle et al. (Bauerle et al. (1964) Biochim. Biophys. Acta 92:142-149). A concentração protéica é medida ou pelo método Bradford ou pelo Kit Bicinchoninic (Sigma, catálogo N0 BCA-1; St. Louis, MO) usando albumina sérica bovina (BSA) (Bio-Rad1 Hercules, CA) como o padrão.
Exemplo 2
Clonagem E Expressão de Acetolactato Descarboxilase
O objetivo do presente exemplo foi clonar e expressar em E. coli o gene budB que codifica a enzima acetolactato descarboxilase. O gene budB foi amplificado a partir do DNA genômico de Klebsiella pneumoniae cepa ATCC 25955 usando PCR.
A seqüência budA que codifica acetolactato descarboxilase, foi clonada da mesma maneira descrita para budB em exemplo 1, com a exceção de que os iniciadores usados para amplificação de PCR foram B3 (SEQ ID n° 17) e B4 (SEQ ID n° 18). A seqüência de nucleotídeos do quadro de leitura aberto (ORF - open reading frame) e da seqüência de aminoácidos predita da Enzima são dadas como SEQ ID n° 1 e SEQ ID n° 2, respectivamente. O plasmídeo resultante foi chamado pENTRSDD-TOPObudA.
A atividade de acetolactato descarboxilase nos extratos livres da célula é medida usando-se o método descrito por Bauerle et ai., acima.
Exemplo 3 (Profilático)
Clonagem E Expressão de Butanodiol Desidrogenase
O propósito deste exemplo profilático é para descrever como clonar e expressar em E. coli o gene budC que codifica a enzima butanodiol desidrogenase. O gene budC foi amplificado a partir do DNA genômico de Klebsiella pneumoniae cepa IAM1063 usando PCR.
A seqüência budC codificando butanodiol desidrogenase é clonada e expressa da mesma maneira conforme descrito para budA no exemplo 1, exceto que os iniciadores usados para amplificação de PCR são B5 (SEQ ID n° 19) e B6 (SEQ ID n° 20) e o modelo de DNA genômico é da Klebsiella pneumoniae IAM 1063 (a qual é obtida na coleção de culturas do Instituto de microbiologia aplicada, Tóquio, Japão). O DNA genômico de Klebsiella pneumoniae IAM1063 é preparado usando o kit Gentra Puregene (Gentra Systems, Inc., Minneapolis1 MN; catalog number D-5000A). A seqüência de nucleotídeos do quadro de leitura aberto (ORF - open reading frame) e da seqüência de aminoácidos predita da Enzima são dadas como SEQ ID n° 5 e SEQ ID n° 6, respectivamente.
A atividade de butanodiol desidrogenase nos extratos livres da célula é medida espectrofotometricamente através do consumo de NADH em uma absorvância de 340 nm.
Exemplo 4 (Profilático)
Clonagem E Expressão de Butanodiol Desidratase
O propósito deste exemplo profilático é para descrever como clonar e expressar em E. coli os genes pddA, pddB e pddC que codifica a enzima butanodiol desidratase. Os genes pddA, pddB e pddC foram amplificados a partir do DNA genômico de Klebsiella oxytoca ATCC 8724 usando PCR.
As seqüências pddA, pddB e pddC codificando butanodiol desidratase são clonadas e expressas da mesma maneira conforme descrito para budA no exemplo 1, exceto que o modelo genômico de DNA é de Klebsiella oxytoca ATCC 8724, e os iniciadores usados são B7 (SEQ ID n° 21) e B8 (SEQ ID n° 22). Klebsiella oxytoca DNA genômico é preparado usando o kit Gentra Puregene Puregene (Gentra Systems, Inc., Minneapolis, MN; catalog number D- 5000A). Um produto PCR único incluindo todos os três quadros de leitura aberto (ORFs) é clonado, de modo que todas as três regiões de codificação são expressas como um operon a partir de um promotor único no plasmídeo de expressão. As seqüências de nucleotídeos dos quadros de leitura aberto (ORFs) para as três subunidades são dadas como SEQ ID n° 7, 9 e 11, respectivamente, e as seqüências de aminoácidos preditas das três subunidades da enzima são dadas como SEQ ID n° 8, 10 e 12, respectivamente.
A atividade de butanodiol desidatase nos extratos livres da célula é medida pela derivação do produto de cetona com 2,4-dinitrofenilhidrazina (DNPH). Resumidamente, 100 uL da mistura de reação, extrato de células contendo aproximadamente 0,0005 unidades de enzima, tampão de fosfato de potássio 40 mM (pH 8,0), 2 pg de adenosilcobalamina, 5 pg de 2,3,-butanodiol e 1 ug de albumina sérica bovina, são bruscamente arrefecidas pela adição de um volume igual de 0,05%, em peso, de DNPH em HCI 1,0 N. Depois de 15 minutos em temperatura ambiente, a cor é desenvolvido pela adição de 100 pL de NaOH 4 Ν. A quantidade do produto é determinada a partir da absorbância da solução final a 550 nm, em comparação com uma curva padrão preparada com 2- butanona. Todas as reações são executadas a 37°C sobre luz vermelha mortiça.
Exemplo 5 (Profilático)
Clonagem E Expressão de Butanol Desidrogenase
O propósito deste exemplo profilático é para descrever como clonar e expressar em Ε. coli o gene sadh que codifica butanol desidrogenase. O gene sadh foi amplificado a partir do DNA genômico de Rhodococcus ruber cepa 219 usando PCR.
A seqüência sadh codificando butanol desidrogenase é clonada e expressa da mesma maneira conforme descrito para budA no exemplo 1, exceto que o modelo de DNA genômico é Rhodococcus ruber cepa 219 (Meens, Institut fuer Mikrobiologie, Universitaet Hannover, Hannover, Alemanha) e os iniciadores são B9 (SEQ ID n° 23) e B10 (SEQ ID n° 24). O DNA genômico do Rhodococcus ruber é preparado usando o Kit Ultra Clean ™ Microbial DNA Isolation (MO BIO Laboratories Inc., Carlsbad, Califórnia), de acordo com o protocolo do fabricante. A seqüência de nucleotídeos do quadro de leitura aberto (ORF - open reading frame) e da seqüência de aminoácidos predita da enzima são dadas como SEQ ID n° 13 e SEQ ID n° 14, respectivamente.
A atividade da butanol desidrogenase em extratos livres de células é medida através do aumento da absorbância a 340 nm resultante da conversão do NADH para NAD quando a enzima é incubada com NAD e 2-butanol.
Exemplo 6 (Profilático)
Construção de um Vetor de Transformação para os Genes em uma Via Biossintética de 2-Butanol
O propósito deste exemplo profilático é para descrever a preparação de um vetor de transformação para os genes na via biossintética de 2-butanol (isto é, via 3 conforme descrito acima). Como a maioria dos organismos, E. coli converte glicose inicialmente para ácido pirúvico. As enzimas necessárias para converter ácido pirúvico a 2-butanol seguindo a via 3, isto é, acetolactato sintase, acetolactato descarboxilase, butanodiol desidrogenase, butanodiol desidratase e butanol desidrogenase, são codificados pelos genes budA, budB, budC, pddA, pddB, pddC e sadh. Para simplificar a construção da via biossintética de 2-butanol em um organismo recombinante, os genes que codificam as 5 etapas da via são divididos em dois operons. A parte superior da via compreende as três primeiras etapas catalisadas por acetolactato sintase, acetolactato descarboxilase e butanodiol desidrogenase. A parte inferior da via compreende as duas últimas etapas catalisadas por butanodiol desidratase e butanol desidrogenase.
As seqüências de codificação são amplificadas pela PCR com os iniciadores que incorporam sítios de restrição para clonagem posterior e os iniciadores forward contêm um sítio de ligação otimizado no ribossomo de E. coli (AAAGGAGG). Os produtos PCR são Topo clonados no vetor pCR4Blunt- TOPO e transformados em células Top10 (Invitrogen). O DNA do Plasmídeo é preparado a partir dos clones TOPO1 e a seqüência do fragmento clonado PCR é verificada. As enzimas de restrição e T4 DNA ligase (New England Biolabs, Beverly, MA) são usadas de acordo com as recomendações do fabricante. Para experimentos de clonagem, os fragmentos de restrição são purificados por gel utilizando-se kit de extração QIAquick Gel (Qiagen).
Após a confirmação da seqüência, as regiões de codificação são subclonadas em um vetor pUC19 modificado como uma plataforma de clonagem. O vetor pUC19 é modificado por uma digestão com HindIII/SAPI, seguido de tratamento com polimerase Klenow DNA para preencher as extremidades. O fragmento de vetor 2,4 kB é purificado por gel e religado criando pUC19dHS. Alternativamente, o vetor pUC19 é modificado por uma digestão com Sphl/SAPI, seguido de tratamento com polimerase Klenow DNA para embotar as extremidades. O fragmento de vetor 2,4 kB é purificado por gel e religado criando pUC19dSS. A digestão remove o promotor Iac adjacente ao MCS (sítios de clonagem múltiplas [multiple cloning sites]), impedindo a transcrição de operons do vetor.
Via superior:
As regiões de codificação do budABC são amplificadas a partir de DNA genômico da Klebsiella pneumoniae por PCR usando pares de iniciadores Β11 e Β12 (tabela 4), dadas como SEQ ID n° 25 e 26, respectivamente. Os iniciadores forward incorporam um sítio de restrição EcoRI e um sítio de ligação de ribossomo (RBS - ribosome binding site). O iniciador reverse incorpora um sítio de restrição Sphl. O produto PCR é clonado em pCR4 BIunt-TOPO criando pCR4 Blunt-TOPO-budABC.
Para construir a via superior, operon pCR4 Blunt-TOPO-budABC é digerido com EcoRI e Sphl liberando um fragmento budABC 3,2 kbp. O vetor pUC19dSS também é digerido com EcoRI e Sphl, liberando um fragmento de vetor kbp 2,0. O fragmento budABC e os fragmentos do vetor são ligados juntos usando-se T4 DNA Iigase (New England Biolabs) para formar pUC19dSS-budABC.
Via inferior:
As regiões de codificação pddABC são amplificadas a partir de DNA genômico de Klebsiella oxytoca ATCC 8724 por PCR usando iniciadores B13 e B14 (tabela 4), dadas como SEQ ID N0 s: 27 e 28, respectivamente, criando um produto 2,9 kbp. Os iniciadores forward incorporam sítios de restrição EcoRI e Pmel e um sítio de ligação de ribossomo (RBS - ribosome binding site). O iniciador reverse incorpora um sítio de restrição BamHI. O produto PCR é clonado em pCRBIunt II-TOPO criando pCRBIuntll-pdd.
O gene sadh gene é amplificado a partir de DNA genômico de Rhodococcus ruber cepa 219 por PCR usando iniciadores B15 e B16 (tabela 4), dadas como SEQ ID N0 s: 29 e 30, respectivamente, criando um produto 1,0 kbp. Os iniciador forward incorpora um sítio de restrição BamHI e um sítio de ligação de ribossomo (RBS - ribosome binding site). O iniciador reverse incorpora um sítio de restrição Xbal. O produto PCR é clonado em pCRBIunt Il-TOPO criando pCRBIuntll-sadh.
Para construir o operon do percurso inferior, um fragmento de BamHI de 2,9 kbp EcoRI e pCRBIuntll-pdd, um fragmento de 1,0 kbp BamHI e Xbal a partir de pCRBIuntll-sadh, e o fragmento maior a partir de um digerido EcoRI e Xbal de pUC19dHS são ligados juntos. A ligação de três vias cria pUC19dHS-pdd-sadh.
O vetor pUC19dSS-budABC é digerido com Pmel e Hindlll1 liberando um fragmento de 3,2 kbp que é clonado em pBenBP, um vetor de transformação E.coli-B. subtilis. O plasmídeo pBenBP é criado pela modificação do vetor pBE93, que é descrito por Nagarajan (WO 93/2463, exemplo 4). Para gerar pBenBP, a seqüência de sinais de Bacillus amyloliquefaciens promotor protease neutra (NPR) e o gene phoA são removidos do pBE93 com um Ncol/HindIII digerido. O promotor NPR é PCR amplificado a partir de pBE93 por iniciadores BenF e BenBPR, dados pela SEQ ID n° 31 e 32, respectivamente. O iniciador BenBPR incorpora BstEII, Pmel e HindIII sítios a jusante do promotor. O produto PCR é digerido com Ncol e HindIII, e o fragmento é clonado nos sítios correspondentes do vetor pBE93 para criar pBenBP. O fragmento superior do operon é subcionado nos sítios Pmel e HindIII em pBenBP criando pBen-budABC.
O vetor pUC19dHS-pdd-sadh é digerido com Pmel e HindIII, liberando um fragmento de 3,9 kbp que é clonado em sítios Pmel e HindIII de pBenBP, criando pBen-pdd-sadh.
Exemplo 7 (Profilático)
Expressão da Via Biossintética de 2-Butanol em E. Coli
O propósito deste exemplo profilático é para descrever como clonar e expressar a via biossintética de 2-butanol em E. coli.
Os plasmídeos pBen-budABC e pBen-pdd-sadh, preparados conforme descrito no exemplo 6, são separadamente transformados em E. coli NM522 (ATCC N0 47000), e expressão dos genes em cada operon é monitorada pela análise SDS-PAGE e ensaio da enzima. Depois da confirmação da expressão de todos os genes, pBen-budABC é digerido com EcoRI e HindIII para liberar o promotor NPR e o fragmento budABC. O fragmento tem a extremidade embotada usando o fragmento Klenow de polimerase DNA (New England Biolabs, catalog no. M0210S). O plasmídeo pBen-pdd-sadh é digerido com EcoRI e semelhantemente embotado para criar um linearizado fragmento de vetor de extremidade embotada. O vetor e os fragmentos NPR-budABC são ligados, criando p2B0H. O plasmídeo é transformado em E.coii NM522 para fornecer E. coli NM522/p2BOH, e a expressão dos genes é monitorada conforme anteriormente descrito.
E. coli NM522/p2BOH é inoculado em um frasco de mistura de 250 mL contendo 50 mL do meio e agitado a 250 rpm e 35°C. O meio é composto de: dextrose, 5 g/L; MOPS, 0,05 M; sulfato de amônio, 0,01 M; fosfato de potássio, monobásico, 0,005 M; S10 mistura de metais, 1% (v/v); extrato de levedura, 0,1% (peso por volume); ácidos casamino, 0,1% (peso por volume); tiamina, 0,1 mg/L; prolina, 0,05 mg/L; e biotina 0,002 mg/L, e é titulado para pH 7,0 com KOH. S10 mistura de metais contém: MgCI2l 200 mM; CaCI2, TOmM; MnCI2, 5 mM; FeCI3, 0,1 mM; ZnCI2, 0,1 mM; cloridrato de tiamina, 0,2 mM; CuSO4, 172 μΜ; CoCI2, 253 μΜ; e Na2MoO4, 242 μΜ. Depois de 18 h, 2-butanol é detectado por HPLC ou análise por cromatografia a gás usando métodos que são bem conhecidos na técnica, por exemplo, conforme descrito na seção de métodos geral acima.
Exemplo 8 (Profilático)
Expressão da Via Biossintética de 2-Butanol em E. Cou
O propósito deste exemplo profilático é para descrever como clonar e expressar a via biossintética de 2-butanol em BaciHus subtilis.
Os plasmídeos pBen-budABC e pBen-pdd-sadh, preparado conforme descrito no exemplo 6, são separadamente transformados em Bacilius subtilis BE1010 {J. Bacteriol. 173:2278-2282 (1991)) e a expressão dos genes em cada operon é monitorada conforme descrito no exemplo 7. O plasmídeo pBen-budABC é digerido com EcoRI e Hindlll para liberar o fragmento do promotor NPR e budABC. O fragmento tem a extremidade embotada usando o fragmento Klenow de polimerase DNA (New England Biolabs1 catalog no. M0210S). O plasmídeo pBen-pdd-sadh é digerido com EcoRI e semelhantemente embotado para criar um linearizado fragmento de vetor de extremidade embotada. O vetor e os fragmentos NPR-budABC são ligados, criando p2BOH. O plasmídeo é transformado em Baciilus subtilis BE1010 para fornecer Bacilius subtilis BE1010/p2BOH, e a expressão dos genes é monitorada conforme anteriormente descrito.
O Bacillus subtilis BE1010/p2BOHé inoculado em um frasco de mistura de 250 mL contendo 50 mL do meio e agitado a 250 rpm e 35°C por 18 horas. O meio é composto de: dextrose, 5 g/L; MOPS1 0,05 M; ácido glutâmico, 0,02 M; sulfato de amônio, 0,01 M; tampão de fosfato de potássio, monobásico, 0,005 M; S10 mistura de metais (conforme descrito no exemplo 7), 1% (v/v); extrato de levedura, 0,1% (peso por volume); ácidos casamino, 0,1% (peso por volume); triptofano, 50 mg/L; metionina, 50 mg/L; e lisina, 50 mg/L, e é titulado para pH 7,0 com KOH. Depois de 18 h, 2-butanol é detectado por HPLC ou análise por cromatografia a gás usando métodos que são bem conhecidos na técnica, por exemplo, conforme descrito na seção de métodos geral acima.
EXEMPLO 9
Construção de um Vetor de Transformação para os Genes em uma Via Biossintética de 2-Butanol
O propósito deste exemplo foi preparar um hospedeiro recombinante E, coli transportando os genes em uma via biossintética de 2-butanol (isto é, via 3 conforme descrito acima). Como a maioria dos organismos, E. coli converte glicose inicialmente para ácido pirúvico. As enzimas necessárias para converter ácido pirúvico a 2-butanona seguindo a via 3, isto é, acetolactato sintase, acetolactato descarboxilase, butanodiol desidrogenase e butanodiol desidratase, são codificados pelos genes budA, budB, budC, pddA, pddB e pddC. Na última etapa da via, uma butanol desidrogenase converte 2-butanona para 2-butanol. As desidrogenases que executam esta última etapa são promíscuas e pode ser encontradas em muitos organismos. Para simplificar a construção da via biossintética de 2-butanol em um organismo recombinante, os genes que codificam as 5 etapas da via foram divididos em múltiplos operons. A parte superior da via compreende as três primeiras etapas catalisadas por acetolactato sintase, acetolactato desçarboxiIase e butanodiol desidrogenase e foi clonada em um vetor de expressão. A parte inferior da via compreende as duas últimas etapas catalisadas por butanodiol desidratase incluindo o fator de reativação (Mori et al., J. BioL Chem. 272:32034 (1997)) e uma butanol desidrogenase. A diol desidratase pode sofrer inativação suicida durante catalise. A proteína codificada pelo fator de reativação ddrA e ddrB(GenBank AF017781, SEQ ID n° 70) reativa a enzima inativa. Os genes ddrA e ddrB flanqueiam o operon diol desidratase. Os operons para a desidratase/fator de reativação e o butanol desidrogenase foram ou clonados em outro vetor de expressão ou o operon desidratase/fator de reativação foi clonado isoladamente para outro vetor de expressão e a última etapa foi fornecida por uma atividade endógena no hospedeiro demonstrativo.
Construção do Vetor pTrc99a-budABC: As regiões de codificação budAB são amplificadas a partir de DNA genômico de K. pneumoniae ATCC 25955 por PCR usando o par de iniciadores BABC F e BAB R, dados como SEQ ID n° 33 e 34, respectivamente (vide tabela 4), criando um produto 2,5 kpb Os iniciadores forward incorporam sítios de restrição Sacl e EcoRI e um sítio de ligação de ribossomo (RBS - ribosome binding site). O iniciador reverse incorpora um sítio de restrição Spel. O produto PCR foi clonado em pCR4 BIunt-TOPO criando pCR4 BIunt-TOPO- budAB. O plasmídeo de DNA foi preparado a partir de clones TOPO e a seqüência dos genes foi verificada com os iniciadores forward M13 (SEQ ID n° 35), reverse M13 (SEQ ID n° 36), N83 SeqF2 (SEQ ID n° 37), N83 SeqF3 (SEQ ID n0 38) e Ν84 SeqR4 (SEQ ID n° 39) (ver Tabela 5).
As região de codificação budC foi amplificada a partir de DNA genômico de K. pneumoniae ATCC 25955 por PCR usando o par de iniciadores BC Spe F e BC Xba R dados como SEQ ID n° 40 e 41, respectivamente, criando um produto 0,8 kbp. O iniciador forward incorporou um sítio de restrição Spel, um RBS e modificou o CDS mudando o segundo e terceiro códons de AAA para AAG. O iniciador reverse incorpora um sítio de restrição Xbal. O produto PCR foi clonado em pCR4 BIunt-TOPO criando pCR4 Blunt-TOPO-budC. O plasmídeo de DNA foi preparado a partir de clones TOPO e a seqüência dos genes foi verificada com os iniciadores forward M13 (SEQ ID n° 35) e reverse M13 (SEQ ID n° 36).
Para construir o operon budABC, pCR4 Blunt-TOPO-budC foi digerido com SnaBI e Xbal liberando um fragmento budC 1,0 kbp. O vetor pTrc99a (Amann et al., Gene 69(2):301-315 (1988)) foi digerido com Smal e Xbal criando um fragmento de vetor linearizado 4,2 kbp. O vetor e o fragmento budC foram ligados para criar pTrc99a-budC e transformados em células E. coli Top 10 (Invitrogen). Os transformantes foram analisados pela amplificação de PCR com iniciadores Trc F (SEQ ID n° 42) e Trc R (SEQ ID n° 43) para um produto 1,2 kbp para confirmar a presença do elemento de inserção budC. Os genes budAB foram subclonados a partir de pCR4 Blunt- TOPO-budAB como um fragmento 2,5 kbp EcoRI/Spel. O vetor pTrc99a- budC foi digerido com EcoRIand e Spel e o fragmento de vetor resultante 5,0 kbp foi purificado por gel. O vetor purificado e o elemento de inserção budAB foram ligados e transformados em células E. coli Top 10. Os transformantes foram testados pela amplificação PCR com iniciadores Trc F (SEQ ID n° 42) e N84 Seq R2 (SEQ ID n° 65) para confirmar a criação de pTrc99a-budABC. Neste plasmídeo, as regiões de codificação bud A, B e C são adjacentes uma a outra, nesta ordem, e entre o promotor Trc e a seqüência de terminação rrnB. Resultados
Foram examinadas três E. coli Top 10/pTrc99a-budABC independente e isolados para a produção de butanodiol, usando-se E. coli Top 10/pCL1925-Kodd-ddr (descritas abaixo) como controle negativo. As cepas foram cultivadas em meio LB contendo 100pg/mL de carbenicillina. As células resultantes foram usadas para inocular frascos de agitação (aproximadamente 175 ml_ de volume total) contendo 125 ml_ de TM3a/meio de glicose com 100pg/mL de carbenicillina. Além disso, os frascos inoculados com cepas transportam pTrc99a-budABC contendo isopropil β-D-l-tiogalactopiranosideo (IPTG) 0,4 mM. O meio de TM3a/glicose contém (por litro): 10 g de glicose, 13,6 g de KH2PO4l 2,0 g de monoidrato de ácido cítrico, 3,0 g de (NH4)2SO4, 2,0 g de MgSO4JH2O, 0,2 g de CaCI2.2H20, 0,33 g de citrato férrico de amônio, 1,0 mg de tiamina HCI, 0,50 g de extrato de levedura, e 10mL de solução de traços de elementos, pH ajustado para 6,8 com NH4OH. A solução de traços de elementos contém: ácido cítrico.H20 (4,0 g/L), MnSO4-H2O (3,0 g/L), NaCI (1,0 g/L), FeS04.7H20 (0,10 g/L), CoCI2.6H20 (0,10 g/L), ZnSO4JH2O (0,10 g/L), CuS04.5H20 (0,010 g/L), H3BO3 (0,010 g/L), e Na2Mo04.2H20 (0,010 g/L). Os frascos, tampados com tampas com respiro, foram inoculados a uma DOeoo inicial de aproximadamente 0,03 unidades e incubado a 34°C com agitação a 300 rpm. Aproximadamente 23 h depois da indução, uma alíquota do
meio foi analisada por HPLC (coluna Shodex Sugar SH1011) e cromatografia gasosa GC (HP-INNOWax), usando os mesmos métodos descritos na seção geral de métodos para 2-butanol e 2-butanona. Os resultados da análise são dados na tabela 6. Os três clones de E. coli converteram glicose para acetoína e meso-2,3-butanodiol, os intermediários desejados da via, com uma seletividade molar de 14%. Esta seletividade foi aproximadamente 35 vezes mais alta que a observada com a cepa de controle E. coli sem budABC. Tabela 6
Produção de Acetoína ε meso-2,3-Butanodiol por E. Coli Top 1 0/Ptrc99a-budABC
Cepa DO600 Acetoína, mM Meso-2,3- butanodiol, mM Seletividade molara, % Controle negativo 1,4 0,07 0,03 0,4 Isolado n°1 1,5 0,64 1,3 14 Isolado n°2 1,4 0,70 1,2 14 Isolado n°3 1,4 0,74 1,3 15
a Seletividade molar é (acetoína + meso-2,3-butanodiol)/(glicose consumida).
Construção de Vetor pCL1925-KoDD-dpr:
Os operons diol desidratase (GenBank D45071, SEQ ID n° 69) e o fator de reativação (GenBank AF017781, SEQ ID n° 70) foram amplificados PCR a partir de Klebsiella oxytoca ATCC 8724 como uma única unidade com iniciadores DDo para(SEQ ID n°44) e DDo Rev (SEQ ID n° 45). Os iniciadores forward incorporam um RBS otimizado de E.coli e um sítio de restrição HindIII. O iniciador reverse inclui um sítio de restrição Xbal. O produto PCR 5318 bp foi clonado em pCR4Blunt-TOPO e clones do resultante pCR4Blunt-TOPO-Kodd- ddr foram seqüenciados com iniciadores M13 forward (SEQ ID n° 35), M13 reverse (SEQ ID n° 36), DDko seq F2 (SEQ ID n° 46), DDko seq F5 (SEQ ID n° 47), DDko seq F7 (SEQ ID n° 48), DDko seq F9 (SEQ ID n° 49), DDko seq R1 (SEQ ID n° 50), DDko seq R3 (SEQ ID n° 51), DDko seq R7 (SEQ ID n° 52), e DDko seq R10 (SEQ ID n° 53). Um clone tendo o elemento de inserção com a seqüência esperada foi identificado.
Para expressão, a diol desidratase e os genes de fator de reativação foram subclonados em pCL1925 (Patent US N0 7074608), uma baixa cópia de um plasmídeo transportando o promotor de glicose isomerase Streptomcyes. pCR4Blunt-TOPO-Kodd-ddr foi digerido com Hindlll e Xbal e o resultante fragmento Kodd-ddr 5,3 kbp foi purificado por gel. O vetor pCL1925 foi digerido com Hindlll e Xbal e o fragmento de vetor resultante 4539 bp foi purificado por gel. O vetor e o fragmento Kodd-ddr foram ligados e transformados em E. coli Top10. Os transformantes foram testados por PCR com iniciadores DDko Seq F7 (N0 SEQ ID:48) e DDko Seq R7 (SEQ ID n° 52). A ampliação do plasmídeo (pCL1925-Kodd-ddr) carregando o elemento de inserção resultou em um produto de aproximadamente 797 pb.
A atividade da diol desidratase em senso a meso -2,3-butanodiol foi medida pela incubação de extrato de células (proteína total ~ 0,8 mg/ml) com butanodiol coenzima Bi210 mM e 12 mM em HEPES 80 mM (pH 8,2) por 17 h à temperatura ambiente. A formação do esperado produto, 2-butanona, foi determinado por HPLC como descrito nos métodos gerais.
Construção do Vetor pCL1925-KoDD-ddr::T5 chnA ter:
Para proporcionar uma atividade heteróloga da álcool desidrogenase, o gene chnA que codifica cicloexanol desidrogenase a partir de Acinetobacter sp. (Cheng et al., J. Bacteriol. 182:4744-4751 (2000)) foi clonado no vetor pCL1925 com o operon da diol desidratase, pCL1925-Kodd- ddr. O gene chnA, dado como SEQ ID n° 71 (Genbank N0: AF282240, SEQ ID n° 73) foi amplificado a partir pDCQ2, um cosmídeo transportando gene aglomerado de cicloexanol a partir de Acinetobacter, com iniciadores ChnA F (SEQ ID n° 54) e ChnA R (SEQ ID n° 55). O produto resultante da PCR 828 bp foi clonado em pCR4Blunt-TOPO para criar pCR4Blunt-Topo-chnA e transformantes foram testados pela colônia PCR com os iniciadores forward Μ13 (SEQ ID n0 35) e reverse M13 (SEQ ID n° 36). Os clones corretos produziram um produto PCR de cerca de 1 kbp e foram seqüenciados com os iniciadores forward M13 (SEQ ID n° 35) e reverse M13 (SEQ ID n° 36).
Após o seqüenciamento de pCR4Blunt-Topo-chnA para confirmar a correta seqüência, o gene chnA foi subclonado como um plasmídeo a partir de um fragmento 813 bp Mfel/Smal. O vetor de expressão pQE30 (Qiagen) foi digerido com Mfel e Smal e o fragmento do vetor resultante 3350 bp foi purificado por gel. O fragmento chnA e o vetor purificado foram unidos e transformados em células E. coli Top10. Os transformantes da colônia PCR foram testados com iniciadores chnSeq F1 (SEQ ID n° 56) e chnseq R1 (SEQ ID n° 57) para verificar a presença de um produto PCR 494 bp. Esta clonagem colocou o gene chnA sob o controle do promotor T5 no plasmídeo, pQE30-chnA.
Para preparar o vetor pCL1925 para transportar dois operons, terminadores foram adicionados ao vetor. Um fragmento de terminador tonB terminador-mcs- trpA foi preparado por anelelamento de oligonucleotídeo com iniciadores Top ter F1 (SEQ ID n° 58), Top terF2 (SEQ ID n° 59), Bot ter R1 (SEQ ID n° 60) e Bot ter R2 (SEQ ID n° 61). O DNA anelado foi purificado por gel em PAGE gel 6% (Embi-tec, San Diego1 CA). O vetor pCL1925 foi digerido com Sacl e Xbal e purificado por gel. O DNA anelado e o fragmento de vetor foram unidos para criar pCL1925-ter. Os transformantes foram testados pela amplificação da colônia de PCR com iniciadores pCL1925 vec F (SEQ ID n° 62) e pCL1925 vec R 1 (SEQ ID n° 63) para verificar a presença de um produto PCR de aproximadamente 400 bp. Os clones positivos a partir do ensaio com PCR foram seqüenciados com os mesmos iniciadores. O vetor pCL1925-ter foi digerido com Xhol e Pmel e o fragmento
resultante 4622 bp foi purificado por gel. O pQE30-chnA foi digerido com Ncol e do DNA foi tratado com Klenow DNA polimerase para embotar as extremidades. O pQE30-chnA foi, então, digerido com Xhol e o fragmento promotor chnA de vetor resultante 1,2 kbp T5 foi purificado por gel. O vetor pCL1925-ter e o fragmento de operon chnA e foram unidos para resultar em pCL1925-ter-T5chnA e transformados em E. coli Top10. Os transformantes foram testados pela amplificação da colônia de PCR com iniciadores pCL1925 vec F (SEQ ID n° 64) e chnseq R1 (SEQ ID n° 59) para verificar a presença de um produto de aproximadamente 1 kpb.
Para concluir a construção do vetor da via, o plasmídeo pCL1925- KoDD-ddr foi digerido com Xbal e Sacl e o fragmento do vetor resultante 9504 bp foi purificado por gel. O operon chnA flanqueado por terminatores, com o terminator trpA (Koichi et al. (1997) Volume 272, Number 51, pp. 32034-32041) 3' para a seqüência de codificação chnA, a partir de pCL1925-ter-T5chnA foi purificada por gel como um fragmento 1271 bp Xbal/Sacl. Depois da ligação dos fragmentos e transformação em E. coli Top10, os transformantes foram testados pela colônia PCR. Os iniciadores chnSeq F1 (SEQ ID n° 58) e pCL1925 vec R2 (SEQ ID n° 64) amplificaram o esperado produto 1107 bp PCR no plasmídeo resultante, pCL1925-KoDD-ddr::ter-T5chnA.
Exemplo 10
Expressão de uma Via Biossintética de 2-Butanol em E. Coli com superexpressão álcool desidrogenase endógeno
O propósito deste exemplo foi para expressar uma via biossintética de 2-butanol em várias cepas E. coli.
Construção de cepas de E. coli expressando constitutivamente yqhD:
E. coli contém um gene nativo (yqhD) que foi identificado como uma 1,3-propanodiol desidrogenase (patente U.S. N0 6,514,733). O gene yqhD, dado como SEQ ID n° 74, tem 40% de identidade com o gene adhB em Clostrídium, uma butano! desidrogenase dependente provavelmente de NADH. O gene yqhD foi colocado sob a expressão constitutiva de uma variante do promotor 1.6GI de glicose isomerase (SEQ ID n° 67) em cepa de E. coli MG1655 1,6yqhD::Cm (WO 2004/033646) usando e ARed technology (Datsenko e Wannerj Proc. Λ/aí/. Acad. Sei. U.S. A 97:6640 (2000)). Semelhantemente, o promotor nativo foi substituído pelo promotor 1.5GI (WO 2003/089621) (SEQ ID n° 68), criando cepas MG1655 1,5yqhD:: Cm1 assim, substituindo o promotor 1,6GI de MG1655 1,6yqhD:: Cm com o promotor 1.5GI. Os promotores 1.5GI e 1.6GI diferem por 1 pb na região -35, alterando, assim, a resistência dos promotores (WO 2004/033646). Com a substituição do promotor nativo yqhD pelo promotor 1.5GI ou 1.6GI, o gene yqhC que codifica os reguladores transcricionais putativos para o operon yqh é eliminado. A atividade enzimática de butanol desidrogenase foi confirmada pelo ensaio usando métodos que são bem conhecidas na técnica.
Transformação de Cepas e. coli: Os plasmídeos da via pCL1925-Kodd-ddr e pTrc99a-budABC, descritas no exemplo 9, foram co-transformadas em cepas E. coli MG1655, MG1655 1,6yqhD e MG1655 1,5yqhD. As duas últimas cepas superexpressam a 1,3-propanodiol desidrogenase, YqhD, que tem também atividade de butanol desidrogenase. As cepas foram examinadas para a produção de 2-butanona e 2-butanol, essencialmente como descrito acima. As células foram inoculadas em frascos de agitação (volume total de cerca de 175 mL), contendo 50 ou 150 mL de TM3a/meio de glicose (com vitamina Bi2 0,1 mg/L e antibióticos adequados e IPT) para representar o meio e condições de baixas concentrações de oxigênio, respectivamente. Espectinomicina (50 mg/mL) e carbenicilina (100 mg/mL) foram utilizadas para plasmídeos pCL1925 -Kodd ddr e pTrc99a-budABC, respectivamente. Os frascos foram inoculados a uma DO6OO inicial de < 0,04 unidades e incubados a 34°C com agitação a 300 rpm. Os frascos contendo 50 mL do meio foram tampados com tampas com respiro; os frascos contendo 150 mL foram tampados com tampas sem respiro para minimizar troca de ar. IPTG estava presente no tempo zero a uma concentração de zero a 0,04 mM. Os resultados analíticos para produção de 2- butanona e 2-butanol são apresentados na tabela 7. Todas as cepas de E. coli que compreendem uma via biossintética de 2-butanol produzem 2-butanona sob condições de baixas e médias concentrações de oxigênio e produzem 2- butanol sob condições de baixas concentrações de oxigênio.
Tabela 7
Produção de 2-Butanona ε 2-Butanol pelo E. Coli MG1655 Cepas Hospedeiras via Plasmídeos pCL1925-Kodd-ddr ε pTrc99a-budABC
<table>table see original document page 105</column></row><table> <table>table see original document page 106</column></row><table> <table>table see original document page 107</column></row><table>
a N01 e N0 2 representam isolados independentes.
b MG1655 é MG1655/pCL1925-Kodd-ddr/pTrc99a-budABC
MG1655 1,6yqhD é MG1655 1,6yqhD/pCL1925-Kodd-ddr/pTrc99a- budABC
MG1655 1,6yqhD é MG1655 1,5yqhD/pCL1925-Kodd-ddr/pTrc99a-budABC.
Exemplo 11
Expressão de uma Via Biossintética de 2-Butanol em E. Coli com Heterólogo Álcool Desidrogenase
Os plasmídeos pCL1925-KoDD-ddr:: ter-T5chnA e pTrc99a- budABC, descritos no exemplo 9, foram transformados em cepas de E. coli MG1655 e MG1655 Δ yqhCD para uma demonstração da produção de 2- butanol.
MG1655 Δ yqhCD carrega uma inativação yqhCD que foi feito usando o método de Datsenko e Wanner (Proc. NatL Acad. Sei. EUA. 97(12):6640-6645 (2000)). Após a substituição da região com o cassete FRT-CmR-FRT de pKD3, o marcador de resistência a cloranfenicol foi removido usando a recombinase FLP. A seqüência da região apagada é dada como SEQ ID n° 66. As cepas MG1655/pTrc99a-budABC/pCL1925KoDD-ddr:: ter-
T5 chnA e MG1655 AyqhCD/pTrc99a-budABC/pCL1925KoDD-ddr:: ter-T5 chnA foram examinadas para a produção de 2-butanona e 2-butanol, essencialmente como descrito acima. A cepa MG1655 AyqhCD/pCL1925 • foi usada como controle negativo. As células foram inoculadas em frascos de agitação (volume total de cerca de 175 ml_), contendo 50 ou 150 mL de TM3a/meio de glicose (com vitamina B12 0,1 mg/L e antibióticos adequados) para representar o meio e condições de baixas concentrações de oxigênio, respectivamente. Espectinomicina (50 pg/mL) e ampicilina (100pg/mL) foram usados para a seleção de plasmídeos baseados em pCL1925 e pTrc99a-budABC, respectivamente. Os derivados da atividade enzimática a partir de pTrc99a-budABC foram detectados pelo ensaio da enzima na ausência de indutor IPTG1 assim, IPTG não foi adicionado ao meio. Os frascos foram inoculados a uma OD6oo inicial de < 0,01 unidades e incubados a 34°C com agitação a 300 rpm durante 24 h. Os frascos contendo 50 mL do meio foram tampados com tampas com respiro; os frascos contendo 150 mL, foram tampados com tampas sem respiro para minimizar troca de ar. Os resultados analíticos para produção de 2- butanona e 2-butanol são apresentados na tabela 8. Ambas as cepas de E, coli compreendendo uma via biossintética de 2-butanol produzindo 2- butanona sob condições de médias e baixas concentrações de oxigênio e produzindo 2-butanol sob condições de baixas concentrações de oxigênio, enquanto a cepa de controle negativo não produziram níveis detectáveis nem de 2-butanona nem de 2 -butanol. Tabela 8
Produção de 2-Butanona ε 2-Butanol por Cepas de E. Coli
<table>table see original document page 109</column></row><table>
a N° 1 e N° 2 representam isolados independentes.
Exemplo 12 Clonagem de Amino:Piruvato Transaminase (APT)
Uma amino:piruvato transaminase (APT) a partir de Vibrio Fluvialis JS17 foi identificada por Shin et ahj. (Appl. Microbiol Biotechnol. (2003) 61:463-471). Foi descoberto que a seqüência de aminoácidos (SEQ ID n° 122) tem significativa homologia com co-aminoácido:piruvato transaminase (Shin e Kim (J. Org. Chem. 67:2848-2853 (2002)). Foi mostrado que o Vibrio Fluvialis APT tem atividade transaminase com respeito a acetoína.
Para expressão da enzima APT em E. coli, um códon otimizado ® APT região de codificação (SEQ ID n° 144) foi projetado usando os códons E.
coli preferenciais com adicionais considerações como estabilidade de códon e mRNA, e sintetizado (por DNA2.0; Redwood City, CA). O fragmento da região de codificação do DNA foi subclonado no vetor pBAD.HisB (Invitrogen) entre os sítios Ncol e Hindlll e o plasmídeo resultante, a partir de agora chamado de pBAD.APTI, foi transformada em células TOP10.
Exemplo 13
Caracterização de Vibrio Fluvialis APT Atividade de Alanina:Acetoína
Aminotransferase Um volume de 5 mL de meio LB + 100 pg/mL de ampicilina foi inoculado com uma colônia nova de células TOP10/pBAD:APT1. A cultura foi incubada a 37°C por aproximadamente 16 h com agitação (225 rpm). Uma alíquota de 300 pL desta cultura foi usada para inocular 300 mL do mesmo meio, que foi incubada a 37°C com agitação (225 rpm). Quando a cultura atingiu uma D06oo de 0,8, L-arabinose foi adicionado para uma concentração final de 0,2% (peso por volume). A cultura foi incubada por mais 16 h e então colhida. As células foram lavadas uma vez com tampão de fosfato de potássio 100 mM (pH 7,8) e, então, congeladas e armazenadas a -80°C.
Para isolar a enzima, o pélete de célula foi descongelado e ressuspenso em 8 mL de tampão de fosfato de potássio 100mM (pH 7) contendo ettilenodiaminotetraacetato 0, 2 mM, ditiotreitol 1 mM e 1 tablete de coquetel inibidor de protease (Roche; Indianapolis1 IN). As células foram lisadas por duas passagens através de uma prensa francesa (French Pressure Cell) a 6,2 MPa (900 psi), e o Lisado resultante foi clarificado por centrifugação por 30 min a 17000 χ g. Sulfato de amônio foi adicionado até 35% de saturação, e a solução foi agitada por 30 min à temperatura ambiente, e então sólidos precipitados removidos por centrifugação (30 min, 17000 χ g). Mais sulfato de amônio foi adicionado ao sobrenadante para se obter 55% de saturação, e a solução foi novamente agitada por 30 min à temperatura ambiente. Os sólidos precipitados foram removidos por centrifugação (30 min, 17000 χ g) e, então, ressuspensos em 5 mL de tampão de fosfato de potássio 100mM (pH 7) contendo piridoxal 5'-fosfato 10 μΜ e ditiotreitol 1 mM. A solução foi desalinizada pela passagem através de uma coluna PD10 equilibrada com tampão A (tampão bis-tris propano 50 mM (pH 6) contendo piridoxal 5'-fosfato 10 μΜ e ditiotreitol 1 mM). O extrato desalinizado foi, então, colocado em uma coluna de fluxo 20 mL Q-Fast pre-equilibrada com tampão A. O APT foi eluída com um gradiente linear de NaCI 0-0,1 M em tampão A. A enzima foi detectada em frações eluídas pela presença de uma proteína de tamanho de banda - 8.3E-20 g (50 kD) quando analisada pela eletroforese em gel de SDS-poliacrilamida e pela absorbância característica a 418 nm. Frações contendo a enzima eluída em NaCI - 0,3 M. Estas frações foram coligadas para produzir um total de 6 mL de uma solução de 5,45 mg/mL de enzima, que foi >90% de pureza, como julgado pela eletroforese em gel de SDS- poliacrilamida.
A atividade alanina:acetoína aminotransferase de APT foi examinada usando um ensaio lático desidrogenase acoplado. A mistura de reação contendo bis-tris propano 100mM (pH 9,0), piridoxal 5'-fosfato10 μΜ, acetoína 0-50 mM, L-alanina 0 a 5 mM, enzima purificada 0,14 ou 0,28 mg/mL,NADH 200 μΜ e lático desidrogenase 20 U/mL(Sigma; Louist MO). A reação foi seguida pela medida da mudança em absorbância a 340 nm, que indica a oxidação de NADH. Sob estas condições, a kcat/Km para acetoína foi 10 M"1 s"1 e aquela por L-alanina foi 400 M"1 s"1. A identidade do produto esperado de 3-amino-2-butanol foi
confirmado pela comparação a um padrão sintético. Uma mistura de (R1R)- e (^,SJ-S-amino^-butanoI foi sintetizada pelo método de Dickey et al. [J Amer Chem Soc 74:944 (1952)]: 5 g de trans-2,3-epoxibutano foi agitado ® vagarosamente em 150 mL NH4OH de frio (4°C). A reação foi aquecida vagarosamente para temperatura ambiente, lacrada e agitada à temperatura ambiente por mais 10 dias. Então, o excesso de amônia e água e epoxibutano residual foram removidos por evaporação rotativa sob vácuo a 40°C. O óleo transparente (2,9 g) resultante foi ressuspenso em água para uma concentração de 10% (peso por volume). A produção do produto desejado foi confirmado por análise por RMN e comparação entre o espectro e aquele relatado por Levy et al. [Org. Magnetic Resonance 14:214 (1980)]. Uma mistura dos correspondentes isômeros (2R,3S)~ e (2S,3R)~ foi produzido usando o método idêntico com a exceção que o material de partida foi o eis- isômero de 2,3-epoxibutano.
Um método analítico para detecção de 3-amino-2-butanol foi desenvolvido baseado no método de derivatização de o- ftalodialdeído para determinação de aminoácidos relatado por Roth [Anal. Chem. 43:880 (1971)]. Uma alíquota de 200 pL de 3-amino-2-butanol 1 mM (mistura de isômeros) foi misturada com 200 pL de uma solução de borato 50 mM (pH 9,5), ao qual foi adicionado 10 pL de 2-mercaptoetanoI 5 pL/mL em etanol e 10 pL de o - ftalodialdeído 10mg/mL em etanol. A solução foi incubada em temperatura ambiente por 10 min, no momento em que o derivativo foi extraído em 200 pL de hexano. O hexano foi separado da solução aquosa por decantação, e 10 pL foram injetados em uma coluna HPLC Chiracel OD (Daicel Chemical Industries; Fort Lee, NJ). A coluna foi isocraticamente executada com uma fase móvel de hexano 90:10: isopropanol a uma taxa de 1 mL/min. Os isômeros derivatizados de 3-amino-2-butanol foram detectados por absorbância a 340 nm com tempos de retenção de cerca de 15,7 e 16,8 min [(2S, 3S) e (2R, 3R)], e 18,4 e 21,9 min [(2R, 3S) e (2S, 3R)]. e 18,4 e 21,9 min [(2R,3S) e (2S,3R)]. Para diferenciar os enantiômeros na primeira mistura, o isômero puro (2R, 3R) (Bridge Organics; Vicksburg, Ml) foi também executado sob condições idênticas e descoberto para ser o pico a 16,8 min. Para diferenciar os enantiômeros 3091 na segunda mistura, a mistura foi primeiro cineticamente resolvida usando a alanina: acetoína aminotransferase 0,28 mg de enzima purificada foi incubada com piruvato 10mM e 3-amino-2-butanol 10mM [mistura 1:1 de isômeros (2R, 3S) e (2S, 3R)] em 1 ml de Tris propano-bis 100 mM (pH 9,0). Após 24 h à temperatura ambiente, uma alíquota foi retirada e analisada conforme descrito acima. A análise revelou que o pico foi a 18,4 min foi 95% esgotado, enquanto que o pico a 21,9 min foi de >90% retido. Uma alíquota de 100 μΙ_ do remanescente da mistura de reação foi misturada com 50 μL, de NADH20 mM e 10 pL do extrato da cepa TOP10/pTrc99a-BudC descrita no exemplo 9. A enzima BudC é conhecida por reduzir (R) - acetoína para meso- 2,3-butanodiol e CSJ -acetoína para (Sj S) - 2,3-butanodiol [Ui et al.(2004) Letters in Applied Microbiology 39:533-537]. Após 3 h, as amostras foram tomadas a partir da reação e analisadas conforme descrito acima para acetoína e butanodiol. A análise indicou que o principal produto da redução foi meso -2,3-butanodioi, indicando que o produto da reação de aminotransferase foi (R) -acetoína e, por conseguinte, o isômero de 3-amino-2-butanol consumido foi o isômero (2R, 3S). Assim, o tempo de retenção de 18,4 min pode ser atribuído a este isômero e de 21,9 para o isômero (2S, 3R).
Para confirmar que o produto da reação catalisada por APT - alanina:acetoína aminotransferase foi o 3-amino-2-butanol, 0,28 mg de enzima purificada foi incubada com acetoína 10 mM, l-alanina 10 mM, 50 U desidrogenase láctica e NADH 200 μΜ em 1 ml de bis-tris propano 100 mM (pH 9,0). A mistura de reação foi incubada à temperatura ambiente por 20 h, após o qual uma alíquota de 200 μΐ_ foi retirada e derivatizada como descrito acima.
Os tempos de retenção dos produtos derivatizados foram 15,8 min (produto principal) e 18,5 min (produto secundário), que correspondem aos dos padrões de C2S, 3S) - e (2R, 3S) - 3-amino-2-butanol.
Exemplo 14
® Identificação ε Clonagem de Erwinia Carotovora Subespécie Atroseptica Aminoálcool Quinase ε Aminoálcool O-Fosfato Liase
O objetivo deste exemplo é descrever a identificação e clonagem de seqüências codificando uma quinase aminoácido e aminoálcool O-fosfato Iiase da bactéria Erwinia carotovora. Essas duas enzimas são parte da via 1 para a conversão de 3-amino-2-butanol a 2-butanona através do intermediário 3-amino-2-butanol fosfato, conforme mostrado na figura 1.
Previsão da Erwinia Aminoálcool Quinase ε do Aminoálcool O-Fosfato-Liase
As atividades de aminoálcool quinase dependente de ATP e de aminoálcool O -fosfato-liase têm sido detectadas em várias espécies de Pseudomonas e EnNinia, incluindo Pseudomonas sp. P6 (NCIB10431), Pseudomonas putida NCiB 10558 (Jones et ai. (1973) Biochem. J. 134:167-182), Enwinia carotovora, Erwinia amanas, Ensina milietiae, e En/vinia atroseptica (Jones et al. (1973) Biochem. J. 134:959-968). Nestes estudos, os extratos das espécies supracitadas foram mostrados por terem atividade para a conversão enzimática de aminopropano! através de aminopropanol O -fosfato a propionaldeído, e para a conversão de etanolamina através de etanolamina O- fosfato a acetaldeído.
A seqüência do genoma da cepa Erninia atroseptica em que estas atividades foram reportadas a existir (agora designada como de Erwinia carotovora subespécie atroseptica cepa SCR11043 (ATCC BAA-672)) tem sido determinada no Sanger Institute (Bell et al. Proc. Natl. Acad. Sci. USA 101(30): 11105-11110). Análise das quinases putativas na Erwinia carotovora subespécie atroseptica genoma revelou uma seqüência de operons (SEQ ID n° 275) que codificam uma proteína putativa (ECA2059; SEQ ID n° 124) que é 39% idêntica para uma Rhizobium loti homoserina quinase e uma aminotransferase (ECA2060; N0 SEQ ID: 126) dependente de piridoxal-fosfato (PLP-pyridoxai phosphate) classe III putativo que é 58% idêntica a uma aminotransferase putativa a partir de Rhizobium meiiloti. Esperava-se que ECA2059 fosse uma aminoálcool quinase e que ECA2060 fosse uma aminoálcool O -fosfato-liase, que usasse PLP como cofator.
Clonagem do Aminoálcool Quinase Putativa ε Aminoálcool O-Fosfase Liase Putativa a partir de Erwinia Carotovora Subespécie Atroseptica
O DNA genômico de Erwinia carotovora subespécie atroseptica (ATCC #: BAA-672D) foi obtido a partir da American Type Cuiture Collection (ATCC). O operon que codifica a aminoálcool quinase (KA) putativa e aminoálcool O -fosfato-liase (AT), foi nomeado KA-TA (SEQ ID n°. 275. Este operon foi amplificado a partir do DNA genômico de Erwinia pela Phusion DNA polimerase (Finnzymes; via New England Biolabs; Ipswich, MA) usando iniciadores OT872 (SEQ. ID. N0 127) e OT873 (SEQ. ID. N0 128). Um fragmento de DNA de 2,4 kb foi obtido pela reação de PCR, o que corresponde ao tamanho do operon KA-AT. O produto de PCR foi digerido com as enzimas de restrição EcoRI e Pstl, e clonado no vetor pKK223-3 (Amersham Biosciences; Piscataway1 NJ) o qual foi digerido com as mesmas enzimas de restrição. Este produziu piasmídeo pKK223.KA-AT, que contém a Erwinia aminoálcool quinase putativa e operon liase sob controle do promotor tac. Semelhantemente, plasmídeos pKK223.KA e pKK223.AT foram feitos, que colocaram as regiões de codificação da putativa Erwinia quinase e da putativa Erwinia Iiase em vetores separados, cada sob o controle do promotor tac. Para a clonagem de PCR da região de codificação KA (SEQ ID n° 123), iniciadores OT872 (SEQ. ID. N0 127) e OT879 (SEQ. ID. N0 129) foi usada; e para a clonagem de PCR da região de codificação AT (SEQ ID n° 125), iniciadores OT873 (SEQ. ID. N0 128) e OT88O (SEQ. ID. N0 130) foram usados nas amplificações da PCR1 que geraram produtos PCR de 1,1 kb e 1,3 kb, respectivamente. Os produtos de PCR foram cada digeridos com EcoRI e Pstl, e ligados no vetor pKK223-3 para gerar pKK223.KA e pKK223.AT. A ATIVIDADE IN VlVO DO AlVIINOÁLCOOL QUINASE PUTATIVA E AlVIINOÁLCOOL. O-
Fosfato Liase Putativa a partir de Erwinia Carotovora Subespécie
ATROSEPTtCA
Os plasmídeos pKK223.KA-AT, pKK223.KA, pKK223.AT e pKK223-3 foram transformados na cepa E. coii MG1655. Os transformantes foram reaplicados por esfregaço em uma placa com meio mínimo (minimal media) MOPS contendo 1% de glicose, 0,5% de aminopropanol como uma única fonte de nitrogênio, IPTG 1 mM e 100 pg/mL de ampicilina. A expressão de genes KA-AT, KA e AT foram induzidos pelo IPTG. Uma placa de controle não tinha IPTG incluído. As placas foram incubadas a 37°C por 7 dias. Na placa com IPTG1 somente a cepa MG1655/pKK223.KA-AT cresceu, enquanto todas as outras três cepas não cresceram. Na placa sem IPTG adicionado, a cepa M G1655/p KK223. KA-AT cresceu, mas as colônias foram significativamente menores que aquelas na placa contendo IPTG, que corresponde aos níveis de expressão mais baixos de KA evAT nas células não induzidas. Nenhuma das outras três cepas cresceu sobre esta placa. Isso indica que a co-expressão dos genes putativos KA e AT de Erwinia forneceu suficiente atividade enzimática que permitiu a cepa E. coli MG1655/pKK223.KA-AT usar aminopropanol como uma única fonte de nitrogênio. Expressão da de cada enzima individual, quer KA ou AT não foi suficiente para fornecer essa atividade enzimática in vivo.
Exemplo 15
Atividade in Vitro da Erwinia Putativa Aminoálcool Quinase ε Aminoálcool O-Fosfato Liase Subclonagem do Operon Erwinia KA-AT no Vetor pBAD.HisB ε na Indução
da Expressão Protéica
Os níveis de expressão de proteína de enzimas Erwinia putativas KA e AT expressas em células MG1655 do vetor pKK223.KA-AT foram analisadas por análise SDS-Page. O nível de expressão da enzima Erwinia AT foi relativamente baixo, com uma nova proteína banda detectada no correto peso molecular de 7,8- 20 g (46 kD) na fração solúvel de um extrato da célula, enquanto não era detectada nova proteína banda no tamanho previsto para a enzima KA.
Em um esforço para melhorar a expressão dos genes putativos de Erwinia KA e AT1 o operon KA-AT foi subclonado nos sítios EcoRI e Hindlll do vetor pBAD.HisB-EcoRI. A pBAD.HisB-EcoRI foi derivada do vetor pBAD.HisB (Invitrogen), pela substituição do sítio Ncol no pBAD.HisB por um sítio EcoRI através de QuickChange mutagênese sítio-dirigida (Stratagene, La Jolla, CA) usando os iniciadores OT9Ü9 (SEQ ID. n° 131) & OT910 (SEQ ID. n° 132). No plasmídeo construído pBAD.KA-AT1 o operon KA-AT foi colocado diretamente sob controle do promotor araB (sem sua identificação).
O plasmídeo pBAD.KA-AT foi transformado na cepa E. coii TOP10. 50 mL da cultura da cepa TOPIO/pBAD.KA-AT foi cultivada para meados da fase Iog (D06oo = 0,6) em LB1 meio de ampicilina 100 pg/mL, a 37°C com agitação a 250 rpm. A cultura foi induzida através da adição de L- arabinose para uma concentração final de 0,1% (peso por volume), e foi ainda incubada a 37°C durante 5 h antes da colheita por centrifugação. O pélete da célula foi ressuspenso em Tris-HCI 50 mM congelado, pH 8,0, e atingidos por sonicação sobre o gelo com um Fischer Sonic Model 300 Dismembrator (Fischer, Pittsburgh, PA) a 50% de potência, repetindo quatro ciclos de sonicação por 30 segundos com 60 segundos de repouso entre cada ciclo. Cada amostra após a sonicação foi centrifugada (15000 χ g, 4 min, 4°C). Os extratos clarificados livres da célula foram analisados por nível de expressão de proteína e atividade de aminoálcool O- fosfato liase.
Síntese Química de Aminobutanol O-Fosfato ε Aminqpropanol O-Fosfato O substrato de (R, R)-3-amino-2-butanol O -fosfato foi sintetizado por um método baseado no que foi reportado por Ferrari e Ferrari (patente US 2730542 [1956]) para fosfoetanolamina: 10 mmol de H3PO4 em uma solução aquosa 50% (peso por volume) foi misturado com uma solução 50% (peso por volume) de (R,R)-3-amino-2-butanol (Bridge Organics; Vicksburg1 Ml) com agitação em gelo. Depois de misturada, a solução foi lentamente aquecida à temperatura ambiente e, em seguida, agitada sob vácuo e aquecida a 70°C. Depois de 1 h a 70°C, a temperatura foi lentamente aumentada para 185°C e mantida ali por mais 2 h. Então, a reação foi resfriada à temperatura ambiente e liberada do vácuo. O restante do material foi dissolvido em água, e a análise por RMN indicou que 80% do material inicial foi convertido em produto com 20% permanecendo não-reagido. Produtos adicionais não foram observados. Os substratos adicionais de (2R, 3S) -3-amino-2-butanol O -
fosfato e (2S, 3R) — 3-amino-2-butanol O -fosfato foram sintetizados pelo mesmo procedimento utilizando uma mistura 1:1 de (2R, 3S) -3-amino-2 - butanol e (2S, 3R) -3-amino-2-butanol (sintetizada como descrito em exemplo 13) como o material de partida. DL -1-amino-2-propanol O - fosfato, (S) - 2-amino-1-propanol O- fosfato, e (R) -2-amino-1-propanol O- fosfato foram sintetizados pelo mesmo procedimento utilizando DL -1- amino-2-propanol, (R) -2-amino-1-propanol ou (S) -2-amino-1-propanol como o material de partida. Análise da Atividade de Aminopropanol O-Fosfato Liase Codificada Pelo Operon Putativo Erwinia KA-AT
O ensaio aminopropanol O -fosfato-liase foi realizado conforme descrito por Jones et al. (1973, Biochem. J. 134:167-182) e Gori G. et al. (1995, Chromatographia 40:336). A formação de aminopropanol a partir de propionaldeído O -fosfato foi testada colorimetricamente com MBTH1 que permite a detecção de formação de aldeído. A reação foi realizada da seguinte forma. Em um 1 mL da reação, 100 mg de extrato livre de células de E. coli TOP10/pBAD.KA-AT foi adicionado para DL -1-amino-2-propanol O - fosfato 10 mM em Tris-HCI 100 mM, pH 7,8, com PLP 0,1 mM. A reação foi incubada a 37°C por 10 min e 30 min, com uma alíquota de 100 µL de mistura da reação removida em cada ponto de tempo e misturada com 100 µL de MBTH-HCI 6 mg/mL em glicina 375 mM, pH 2,7. Essa mistura foi incubada a 100°C por 3 min, resfriada em gelo durante 15 a 30 s, e 1 mL de FeCI 3.6 H 2 O 3,3 mg/mL (em HCI 10 mM) foi adicionado, seguido de incubação por 30 minutos em temperatura ambiente. A absorbância da mistura de reação que contém o aldeído-MBTH aduto, foi medida a 670 nm. Os resultados do ensaio são indicados na tabela 9. Na presença do substrato de fosfato aminopropanol PLP e extrato livre de células, formação de aldeído foi detectada, conforme indicado por um Abs 67o que era mais elevado do que o controle do fundo de até 0,3. Na ausência de um deles, do substrato ou do extrato livre de célula, a formação de aldeído não foi detectada. Na ausência do PLP adicionado, uma quantidade um pouco menor do aldeído foi detectada, provavelmente devido à presença de PLP no extrato livre de célula. O extrato livre de célula da cultura TOPIO/pBAD.KA-AT não-induzida não produziu qualquer aldeído detectável na reação. Estes resultados indicaram que a Erwinia aminoálcool O- fosfato liase putativa catalisa a conversão de aminopropanol O-fosfato para propionaldeído. Tabela 9.
Ensaio de Aminopropanol O-Fosfato Liase. A Amostra 1 foi a Célula sem o
Extrato do Controle não Induzido de e. coli 70P7Q/pBAD.KA-AT. As Amostra 2 a 5 Continham a Célula Livre de Extrato da Cultura Induzida E.
Coli TOP1 OIpBAD.KA-AT.
Número da Indução por Aminopropanol PLP Extrato de DO670f DO670, amostra 0,1% arabinose O-fosfato enzima 10 min 30 min (100 mg/mL) 1 Não induzido (+) (+) (+) 0,262 0,255 2 induzido (+) <+) (+) 1,229 2,264 3 induzido C-) (+) (+) 0,303 0,223 4 induzido (+) (-) (+) 0,855 1,454 5 induzido (+) (+) (-) 0,156 0,065
Análise da Atividade de Erwinia Aminoálcool O-Fosfato Liase com
Respeito ao Substrato de Aminobutanol O-Fosfato
A atividade da aminoálcool O- fosfato liase rumo à aminobutanol O -fosfato de substratos foi estudada em condições idênticas às descritas acima. A reação foi conduzida a 37°C de um dia para o outro em 1 mL da reação que continha IOOmicrogramas de extrato livre da célula de E. coli TOP10/pBAD.KA-AT, aminobutanol O -fosfato 10mM (quer seja a mistura de (R, R) + (S, S) ou a mistura de isômeros (R, S) + (S, I) descritas no exemplo 15), em Tris -HC1100 mM, pH 7,8, com PLP 0,1 mM. As alíquotas de 100 pL da mistura de reação foram retiradas e o produto 2-butanona foi detectado usando o método de derivatização MBTH descrito em métodos gerais. Os dois picos representando os isômeros derivatizado de 2-butanona foram observados. Portanto, a Erwinia aminoálcool O -fosfato-liase é um aminobutanol fosfato fosfo-liase além de uma aminopropanol fosfato fosfo-liase.
a análise da atividade da erwinia o álcool amino-fosfato-liase no
Sentido de Estereoisõmeros de Aminopropanol O-Fosfato εEAminobutanol O-Fosfato.
A atividade da Erwinia aminoálcool O -fosfato-liase para vários estereoisõmeros de aminopropanol O -fosfato e aminobutanol O -fosfato foi estudada em condições idênticas às descritas acima. Na presença da Erwinia aminoálcool O-fosfato tiase, ambos (R) e (S)-2-amino-1-propanol O-fosfato foram convertidos para propanona pela enzima, mas o produto produzido era muito mais alto com o ísômero (S). A enzima também produziu butanona a partir de ambas as misturas de isômeros de 3-amino) - 2-butanol O -fosfato, com um produto produzido mais elevado encontrado na reação contendo os isômeros dos substratos (R1 S) e (S1 I). Ambos os produtos butanona e propanona foram derivatizados por MBTH1 e detectados por HPLC como descrito em métodos gerais.
Otimização do Nível de Expressão Gênica para Erwinia Aminoálcool Quinase E Aminoálcool O-Fosfato-Liase
A fim de melhorar a expressão de níveis para a Erwinia aminoálcool quinase e aminoálcool O -fosfato-liase em E. coli, as regiões de codificação códon otimizadas para ambas as enzimas (chamado ΕΚΑ: SEQ ID n° 155 e EAT: SEQ ID n° 156 respectivamente) foram sintetizadas por DNA2.0 (Redwood City, CA). Cada região de codificação foi sintetizada com caudas de 5' e 3' incluindo sítios de restrição para clonagem: EKA tem sítios 5' Bbsl e 3' EcoRI, HindIII; EAT tem sítios 5' EcoRI e 3' HindIII. As regiões de codificação EKA e EAT foram fornecidas a partir de DNA2.0 como plasmídeos pEKA e pEAT, que estavam no vetor pJ51 de DNA2.0. A região de codificação da EKA otimizada foi subclonada pela união de um fragmento digerido Bbsl e HindIII de pEKA no vetor pBAD.HisB entre os sítios Ncol e HindIII, para gerar plasmídeo pBAD.EKA. No plasmídeo resultante a região codificante é 5 'para a sua identificação, então uma região de codificação para uma amino-terminal His 6 identificação unida à Erwinia aminoálcool quinase foi construída através da execução de uma QuickChange reação mutagênese dirigida utilizando a um sítio usando iniciadores N0 SEQ ID: 157 e N0 SEQ ID: 158 para gerar o vetor pBAD.His-EKA.
pBAD.His-EKA foi transformada em cepa E. coli BL21AI (F ompT hsdSB (rB~ mB~) gai dcm araB:;T7RNAP-tetA; Invitrogen) para produzir cepa BL21A//pBAD.HisA-EKA. 50 mL de uma cultura BL21-AI/pBAD.HisA- EKA foi cultivada para o meio da fase log (D0600 = 0,6), induzida com arabinose 0,1%, e incubada adicionalmente a 30°C de um dia para o outro. Os extratos livres de célula foram preparados por sonicação. A proteína de fusão marcada com Hisede Erwinia aminoálcool quinase foi purificada usando o Probond™ Sistema de Purificação (Invitrogen), sob condições de purificação não-desnaturante seguindo as instruções do fabricante.
Resultado Profilático
A atividade quinase da Erwinia aminoálcool quinase marcada com His 6 - é analisada pelo ensaio ADP Quest (DiscoveRx, Fremont1 CA), seguindo as instruções do fabricante. Este é um ensaio bioquímico que mede o acúmulo de ADP1 um produto da reação aminoálcool quinase usando quer aminopropanol ou aminobutanol como substrato. O substrato 10mM é misturado com a Erwinia aminoálcool quinase marcada com His 6, em Tris- HCI 100 mM, pH 7,8, MgCI 10 mM2, KCI 2 mM, ATP 0,1 mM, e incubado a 37°C por 1 h em 0,2 mL da reação. O reagente ADP A (100 μL e reagente ADP B (200 pL) são adicionados e a mistura é incubada em temperatura ambiente por 30 min. Um sinal fluorescente indicando atividade é medido com comprimento de onda de excitação de 530 nm e comprimento de onda de emissão de 590 nm. Exemplo 16
Expressão da Inteira Via 3
Construção do Vetor pCL1925-KoDD-ddr:
O vetor pTrc99a::BudABC (descrito no exemplo 9) é digerido com EcoRI, e o DNA é tratado com polimerase Klenow DNA para embotar as extremidades. O vetor embotado é, subseqüentemente, digerido com Spel para produzir um fragmento 2,5 kb contendo os genes budA e budB. O vetor pCL1925-ter-T5chnA (descrito no exemplo 9) é digerido com HindIII, e o DNA foi tratado com Klenow DNA polimerase para embotar as extremidades. O vetor embotado é, subseqüentemente, digerido com Xbal para produzir um fragmento 4,6 kb que é então ligado para o fragmento budAB de pTrc99a::BudABC. O plasmídeo resultante, chamado pCLBudAB-ter-T5chnA, é usado para transformar células de E. coli Top10, e colônias únicas são então testadas para estrutura de plasmídeo própria por PCR usando iniciadores pCL1925vecF (SEQ ID n° 62) e N84seqR3 (SEQ ID n° 159). O plasmídeo é preparada a partir de uma única colônia que produz um produto PCR do tamanho esperado de 1,4 kb.
Construção do Vetor pKK223.KA-AT-APT
O gene APT é amplificado a partir do vetor pBAD.APT (descrito no exemplo 12) por PCR usando iniciadores APTfor (SEQ ID n° 162; 5' incluindo RBS e sítio Smal) e APTrev (SEQ ID n° 163; 3' adicional sítio Smal). O produto do tamanho esperado de 1,7 kbp é purificado por gel e digerido com Smal para produzir extremidades embotadas. O vetor pKK223.KA-AT (descrito no exemplo 14) é digerido com Pstl, e o DNA foi tratado com Klenow DNA polimerase para embotar as extremidades. O fragmento de DNA resultante é ligado com o produto PCR digerido por Smal, e o produto de ligação é usado para transformar células de E, coli Top10. As colônias Individuais resistentes à ampicilina são testadas para PCR usando iniciadores OT872 (SEQ ID n° 127) e APTrev (SEQ ID n° 163). A presença de um produto do PCR do tamanho esperado de 4,1 kbp indica que o gene codificando APT está presente e orientado na mesma direção dos genes que codificam KA e AT. A seqüência dos elementos de inserção é verificada usando os iniciadores APTseqRev (SEQ ID n° 160) e APTseqFor (SEQ ID n° 161). Este plasmídeo é chamado pKK223.KA-AT-APT. A expressão própria de todos os três genes é verificada pelo crescimento de 5 mL de uma cultura de Top10/pKK223.KA-AT-APT em LB + 100 pg/mL de ampicilina a 37°C, com agitação. Quando a DOeoo atinge - 0,8, a expressão dos genes no plasmídeo é induzida pela adição de IPTG a 0,4 mM. A expressão é avaliada pela SDS-PAGE e ensaios de atividade conforme descrito acima. Construção de Cepas de Produção de 2-Butanol ε Produção de 2-
Butanona ε 2-Butanol Ε. A cepa de E. coli MG1655 é transformada com ambos pKK223.KA-AT-APT e pCLBudAB-ter-T5chnA, e transformantes selecionados pela resistência a ampicilina e espectinomicina, indicativos da presença dos plasmídeos. As células são inoculadas nos frascos de agitação (aproximadamente 175 mL de volume total) contendo 50 ou 150 mL de TM3a/meio de glicose (com antibióticos adequados) para representar o meio e condições com pouco oxigênio, Φ respectivamente. 0,4 mM de IPTG é adicionado para induzir expressão de genes a partir de pKK223.KA-AT-APT. Como um controle negativo, células de MG1655 são cultivadas no mesmo meio, mas sem antibióticos. Os frascos são inoculados a uma DOeoo inicial de S 0,01 e incubados a 34°C com agitação a 300 rpm por 24 h. Os frascos contendo 50 mL do meio são tampados com tampas com respiro; os frascos contendo 150 mL, foram tampados com tampas sem respiro para minimizar troca de ar. A cepa 1655/pKK223.KA-AT-APT/pCLBudAB-ter-T5chnA que compreende uma biossintética de 2-butanol produz ambos 2-butanona e 2- butanol sobre condições de oxigênio em baixas e médias concentrações enquanto a cepa de controle negativo não produz níveis detectáveis nem de 2-butanona nem de 2-butanol. Exemplo 17
Caracterização de Atividade de Glicerol Desidratase ButanoDiol
Desidratase
Glicerol desidratase (E.C. 4.2.1.30) e diol desidratase (E.C. 4.2.1.28), enquanto relacionadas estruturalmente, são freqüentemente distinguidas na técnica à base de várias diferenças, que incluem especificidade de substrato. Este exemplo demonstra que glicerol desidratase converte /77eso-2,3-butanodiol para 2-butanona. A cepa recombinante E. coli KLP23/pSYC012, que compreende genes de KIebsieIIa pneumoniae codifica as múltiplas subunidades da glicerol desidratase (alfa: SEQ ID n° 145 (região de codificação) e 146 (proteína); beta SEQ ID n0 SEQ ID n° 147 (região de codificação) e 148 (proteína); e gama SEQ ID n° 149 (região de codificação) e 150 (proteína)) e genes de Klebsiella pneumoniae codificando as múltiplas subunidades de glicerol desidratase reativase (subunidade grande, SEQ ID n° 151 (região de codificação) e 152 (proteína); e pequena subunidade, SEQ ID n° 153 (região de codificação) e 154 (proteína)), é descrito em Emptage et al. US 6.514.733 e no WO 2003089621, os quais estão aqui incorporados, a título de referência. Uma célula bruta, sem extrato de KLP23/pSYC012 foi preparada pelos métodos conhecidos pelo versado na técnica. O ensaio da enzima foi realizado na ausência de luz em tampão 80 mM HEPES, pH 8,2 a 37°C com 12 μΜ coenzima Bi2 e 10mM de meso-2,3-butanodiol. A formação de 2-butanona foi monitorada pela HPLC (coluna Shodex SH- 1011 e SH-G coluna de proteção com índice de refração detecção; H2SO4 0,01 M como a fase móvel a um fluxo de 0,5 mL/min e uma temperatura da coluna de 50°C; tempo de retenção de 2-butanona = 40,2 min). A taxa de formação de 2-butanona pela preparação de glicerol desidratase foi determinada para ser 0,4 nmol/min/mg de proteína bruta. Exemplo 18
Análise Estrutural de Diol/Glicerol Desidratases através de Geração ε Validação de um Perfil HMM para Diol/Glicerol Desidratase Comprovados Experimentalmente As enzimas diol desidratase e glicerol desidratase pertencem às
classes de enzima 4.2.1.28 e 4.2.1.30, respectivamente. Cada uma das enzimas em ambas as classes são um complexo de três subunidades: grande (também chamado de alfa), médio (também chamado de beta) e pequeno ® (também chamado de gama). Foi descoberto que em algumas glicerol desidratases, as subunidades grande e média são unidas.
Identificando Membros da Família Pela Seqüência A enzima butanodiol desidratase de Klebsieila oxytoca foi usada como uma enzima protótipo para identificar uma família de enzimas de diol e glicerol desidratases. As seqüências de aminoácidos da alfa (GenBank N0: BAA08099; SEQ ID n° 8), beta (GenBank N0: BAA08100; SEQ ID n° 10) e gama (GenBank N0: BAA08101; SEQ ID n° 12) cada uma das subunidades foi executada conforme uma seqüência de consulta em uma pesquisa BLASTp na base de dados não-redundantes de proteína utilizando parâmetros pré-definidos. As seqüências com similaridades relevantes foram extraídas. A relevância foi julgada pela pontuação Ε-valor, definição de proteína, detalhes incluídos no relatório GenBank para as proteínas combinadas e revisão da literatura sobre o assunto. Para a subunidade grande, a saída BLAST mostrou uma queda abrupta no E-Valor de e-20 para um E-Valor de 1,5. Todas as seqüências comparadas com um E-Valor de 1,5 ou maior tinham definições inconsistentes com elas sendo desidratases. Muitas destas seqüências foram identificadas como subunidade beta de polimerase RNA dirigida a DNA. Existiram comparações compatíveis com Ε-valores cerca de e-20, que foram seqüências parciais. As seqüências sem anotação foram incluídas se o E-Valor foi menor que 1,5. Usando a Klebsiella oxytoca butanodiol desidratase subunidade alfa como uma referência, 50 homólogos foram identificados como membros desta família de proteínas. Este grupo incluiu algumas seqüências que não são proteínas de comprimento total. As seqüências protótipo de comprimento total identificadas para a família de subunidade alfa de diol/glicerol desidratasessão as SEQ ID n° 8 e SEQ ID n° 93, 99, 105, 135, 138, 141, 146, 164, 167, 170, 173, 176, 179, 182, 185, 188, 191, 194, 197, 200, 203, 206, 209, 212, 215, 218, 221, 224, 227, 130, 243, 254, 255, 256, 257, 258 e 259. SEQ ID n° 233, 235, 237, 239, 241, 246, 247 incluem ambas as subunidades alfa e beta, que são unidas nestes casos.
Usando a Klebsiella oxytoca butanodiol desidratase subunidade beta como uma referência, 51 homólogos foram identificados como membros desta família de proteínas. Este grupo incluiu algumas seqüências que não são proteínas de comprimento total. As seqüências protótipo de comprimento total identificadas para a família de subunidade beta de diol/glicerol desidratases são as SEQ ID n° 10 e SEQ ID n° 95, 101, 107, 136, 139, 142, 148, 165, 168, 171, 174, 177, 180, 183, 186, 189, 192, 195, 198, 201, 204, 207, 210, 213, 216, 219, 222, 225, 228, 231, 244, 250, 252, 260, 261, 262, 263, 364, 265, 266 e 167.
Usando a Klebsiella oxytoca butanodiol desidratase subunidade gama como uma referência, 48 homólogos foram identificados como membros desta família de proteínas. Este grupo incluiu algumas seqüências que não são proteínas de comprimento total. As seqüências protótipo de comprimento total identificadas para a família de subunidade gama de diol/glicerol desidratases são as SEQ ID n° 12 e SEQ ID n° 97, 103, 109, 137, 140, 143, 150, 166, 169, 172, 175, 178, 181, 184, 187, 190, 193, 196, 199, 202, 205, 208, 211, 214, 217, 220, 223, 226, 229, 232, 234, 236, 238, 240, 242, 245, 248, 249, 251, 253, 268, 270, 271, 272, 273 e 274. Identificação de Membros da Família com Função Experimentalmente Avaliada
Para cada seqüência identificado através da análise descrita acima, uma busca por evidência experimental de sua função bioquímica foi conduzida nas bases de dados de BRENDA, UniProt e NCBl Entrez. BRENDA é uma base de dados revisados por humanos (human-curated) que contém informações detalhadas sobre propriedades cinéticas, físicas e bioquímicas da enzima, extraídas da literatura experimental e com links para as bases de dados relevantes (Cologne University Biolnformatics Center). A UniProt Knowledgebase [reservatório de conhecimento] é composta de uma parte revisada por humanos, a base de dados Swiss-Prot e de um machine annotated supplement [suplemento de anotações por máquina], a base de dados TrEMBL. A base de dados curada Swiss-Prot (Swiss Institute of Bioinformatics[lnstituto Suíço de Bioinformática]) fornece um alto nível de anotação de proteína que inclui arquitetura de domínio, modificações pós- traducionais e variantes de seqüência. A NCBI Entrez é o sistema integrado de recuperação, com pesquisa baseada em texto, usado no NCBI (National Center for Biotechnology Information, Bethesda, MD) pelos grandes bancos de dados, incluindo a PubMed, seqüências de nucleotídeo e proteínas, estruturas de proteína, genomas completos e Taxonomia.
Através da análise de informações e referências identificadas a partir destas bases de dados, oito diol/glicerol desidratases com função experimentalmente verificada como um diol ou gliceroi desidratase foram identificados. Estes são mostrados na tabela 10.
Tabela 10
Diol/Glicerol Desidratases com Função Experimentalmente Verificada
Organismo
Klebsiella oxytoca
K. oxytoca
Subunidad e
grande
média
GenBank n°
gi|6980836
gi|6980837
SEQ ID n°
10
Tipo
diol
diol
Referência
Shibata et al.,
Structure 1999; 7:997- 1008 <table>table see original document page 129</column></row><table>
O conjunto de 8 aminoácidos de cada subunidade de diol/glicerol desidratases com função experimentalmente determinada, registradas na tabela 10, foram comparadas através de um alinhamento múltiplo de seqüência usando CIustaIW com parâmetros pré-estabelecidos. A percentagem de identidade com a subunidade grande das seqüências variou de 97,6% a 58,4%. A percentagem de identidade com a subunidade média das seqüências variou de 89,5% a 41,7%. A percentagem de identidade com a subunidade pequena das seqüências variou de 83,3% a 36,4%o. Portanto, a quantidade de identidade de seqüência entre algumas subunidades das seqüências foi muito baixa (como 36,4% e 41,7%), mesmo que estas subunidades fossem conhecidas como componentes de enzimas conhecidas através de dados experimentais para executar a mesma função. O baixo nível de percentagem de identidade das seqüências tornou inviável a utilização deste critério de correlações de estrutura/função.
Relação das Seqüências de Diol/Glicerol Desidratases Verificados Experimentalmente para outros Diol/Glicerol Desidratases
Para realizar esta análise, seqüências altamente redundantes que são >95% idênticas foram retiradas do conjunto de seqüências para subunidades grandes, médias ou pequenas, com exceção de que todas as seqüências de função experimentalmente verificada foram mantidas. As seqüências de proteína parciais ou truncadas também foram removidas. Um alinhamento de seqüência múltiplo foi realizado nas seqüências restantes usando CIustaIW com parâmetros pré-estabelecidos. A percentagem de identidade com as subunidades grandes das seqüências variou de 97,6% (a alta percentagem é de múltiplas seqüências verificadas experimentalmente) a 42,8%. A percentagem de identidade com as subunidades pequenas das seqüências variou de 91,9% a 26,4%. A percentagem de identidade com as subunidades pequenas das seqüências variou de 85,2% a 20,5%. Estas percentagens de identidades têm faixas semelhantes às percentagens de identidades para as seqüências verificadas experimentalmente. Com base nos múltiplos alinhamentos da seqüência, as árvores filogenéticas foram construídas utilizando o algoritmo "neighbor-joining" (como implementado no MEGA pacote de software versão 3.1; Kumar et al., 2004 Briefings in Bioinformatics 5:150-163.) As árvores filogenéticas são mostrados nas figuras 2 (subunidade grande), 3 (subunidade média), e 4 (subunidade pequena), com as identidades das seqüências mapeadas listados em uma chave para cada figura. Conforme pode ser observado a partir das posições marcadas para as
seqüências de função verificada experimentalmente (em círculos cinza claro e
cinza para diol desidratase e glicerol desidratase, respectivamente), estas seqüências estão espalhadas pela maioria árvore. Entretanto, cada árvore não inclui uma ramificação sem membros verificados experimentalmente, mas que parecem pertencer à família diol/glicerol desidratase.
Construindo um Perfil Hidden Markov Model (HMM) da família de Diol/Glicerol-Desidratase com Base no Conjuntos de Oito Seqüências de Subunidades
Uma caracterização alternativa da estrutura/função dos conjuntos de subunidades da família de diol/glicerol desidratase de enzimas foi realizada utilizando o pacote de software HMMER (A teoria que apoia o perfil HMMs é descrita em R. Durbin, S. Eddy, A. Krogh e G. Mitchison, Bioiogicai sequence anaiysis: probabiiistic modeis of proteins and nucleic acids, Cambridge University Press, 1998; Krogh et al., 1994; J. Moi. BioL 235:1501-1531), seguindo o manual do usuário que está disponível através de HMMER (Janelia Farm Research Campus, Ashburn, VA).
Cada conjunto de seqüência de 8 aminoácidos para as subunidades grandes, médias e pequenas da diol/glicerol desidratases caracterizada funcionalmente (na Tabela 10) foi analisada separadamente usando o programa de software HMMER. A saída do programa de software HMMER é um Perfil Hidden Markov Model (HMM) que caracteriza as seqüências de entrada. Como indicado no manual do usuário, os perfis HMMs são modelos estatísticos de alinhamentos múltiplos de seqüência. Eles capturam informações específicas de posição sobre como conservada cada coluna do alinhamento é, e quais resíduos de aminoácidos são mais prováveis de ocorrer em cada posição. Assim HMMs têm uma base formal probabilística. Os Perfis HMMs para um grande número de famílias de proteínas estão disponíveis ao público na base de dados PFAM (Janelia Farm Research Campus1 Ashburn, VA).
Cada perfil HMM foi construído como se segue:
Etapa 1. Construir um Alinhamento de Seqüência
As oito seqüências para a subunidade grande da diol/glicerol desidratases verificada funcionalmente (SEQ ID N 8, 99, 105, 135, 138, 141, 146 e 164) foram alinhadas usando Clustal W com parâmetros pré-estabelecidos. O mesmo foi feito para o conjunto de seqüências de subunidade média (SEQ ID n° 10, 101, 107, 136, 139, 142, 148 e 165) e o conjunto de seqüências de pequena subunidade (SEQ ID n° 12, 103,109,137,140, 143, 150 e 166).
Etapa 2. Construir um Perfil HMM
O programa Hmmbuild foi executado em cada conjunto de seqüências alinhadas usando os parâmetros pré-estabelecidos. O hmmbuild lê o arquivo de alinhamento múltiplo de seqüência, constrói um novo perfil HMM e salva o arquivo de perfil HMM. Usando este programa um perfil não calibrado foi gerado a partir do alinhamento múltiplo para cada conjunto das seqüências de subunidades acima descritas.
As informações seguintes, baseadas no guia do usuário do software HMMER, apresentam algumas descrições da forma que o programa hmmbuild prepara um perfil HMM. Um perfil HMM é capaz de modelar alinhamentos com vãos, por exemplo, incluindo inserções e supressões, que permitem que o software descreva um domínio conservado completo (em vez de apenas um pequeno grupamento sem gaps). As inserções e supressões são modeladas usando estados de inserção (I) e estados de supressão (D). Todas as colunas que contêm mais de uma determinada fração de caracteres de gap χ serão atribuídas como uma coluna de inserção. Como um padrão, χ é ajustado para 0,5. Cada estado de compatibilidade tem um estado I e um D associados a ele. O HMMER nomeia um grupo de três estados (M/D/I) na mesma posição consensual do alinhamento um "nó". Esses estados são interligados com setas chamadas probabilidades do estado de transição. Os estados M (compatibilidade[Match]) e I são emissores, enquanto que os estados D são silenciosos. As transições são dispostas de modo que em cada nó, quer o estado M é usado (e um resíduo seja alinhado e pontuado) ou o estado D é utilizado (e nenhum resíduo é alinhado, resultando num caracter de vão de supressão, '-'). As inserções ocorrem entre "nós", e os estados I têm uma auto-transição, permitindo que um ou mais resíduos inseridos ocorram entre as colunas de consenso.
A pontuação de resíduos em um estado de compatibilidade (ou seja, comparar as pontuações do estado de emissão), ou em um estado de inserção (ou seja, inserir as pontuações do estado de emissão) são proporcionais a Log_2 (p_x) / (null_x). Onde p_x é a probabilidade de um resíduo de aminoácidos, em uma posição particular no alinhamento de acordo com o perfil HMM e null_x é a probabilidade de acordo com o modelo NUII. O modelo Null é um modelo probabilístico simples de um estado com o conjunto de probabilidades de emissões pré-calculadas para cada um dos 20 aminoácidos derivados da distribuição de aminoácidos na SWISSPROT release 24.
As pontuações dos estados de transição são também calculadas como log de parâmetros ímpares e são proporcionais para Log_2 (t_x). Onde t_x é a probabilidade de transitar de um estado emissor para um não emissor.
Etapa 3. Calibrar o Perfil HMM
Cada Perfil HMM foi lido usando hmmcalibrate que pontua um grande número de seqüências aleatórias sintetizadas com o perfil (o número padrão de seqüências sintéticas usadas é 5000), ajusta uma distribuição de valores extremos (EVD-extreme value distribution) para o histograma destas pontuações e salva novamente o arquivo HMM incluindo agora os parâmetros EVD. Estes parâmetros EVD (μ e λ) são usados para calcular os E-values de pontuação "bit" quando o perfil é pesquisado em uma base de dados de seqüências de proteínas. O hmmcalibrate escreve dois parâmetros no arquivo HMM em uma linha marcada como "EVD": estes são os parâmetros μ (localização) e λ (escala), parâmetros de uma distribuição de valores extremos (EVD) que melhor ajusta um histograma das pontuações calculadas em seqüências geradas aleatoriamente com aproximadamente o mesmo comprimento e a mesma composição de resíduos de SWISS-PROT. Esta calibração foi feita uma vez para cada perfil HMM.
Os perfis HMM calibrado para as subunidades grandes, médias e pequenas dos conjuntos de seqüências são fornecidas no apêndice como as tabelas Excel Perfil HMM alfa, Perfil HMM beta e Perfil HMM gama. Cada Perfil HMM é fornecido em uma tabela que indica a probabilidade de cada aminoácido ocorrer em cada posição na seqüência de aminoácidos. A maior probabilidade é destacada para cada posição. A tabela 11 mostra algumas linhas do Perfil HMM preparado para as subunidades grandes de diol/glicerol Tabela 1
<table>table see original document page 135</column></row><table> Os aminoácidos são representados por códigos de uma letra.
A primeira linha para cada posição relata as pontuações de emissão compatíveis: probabilidade para cada aminoácido estar naquele estado (pontuação mais elevada é realçada). A segunda linha relata as pontuações de emissão de inserção e a terceira linha relata sobre as pontuações em transição de estados: M->M, M->I, M->D; I->M, I->I; D->M, D->D; B->M; M->E.
A tabela 11 mostra que, para as subunidades grandes, metionina tem uma probabilidade de 4141 de estar na primeira posição, a mais elevada probabilidade que é realçada. Na segunda posição lisina tem a maior probabilidade, que é 1954. Na terceira posição arginina tem a maior probabilidade, que é 3077.
Etapa 4. Testar a Especificidade ε Sensibilidade do Perfil Construído HMMs
Cada perfil HMM foi avaliado usando hmmsearch, que lê um perfil HMM de hmmfile e pesquisa o arquivo da seqüência em busca de seqüências compatíveis significantemente similares. O arquivo de seqüência pesquisado foi a base de dados de proteínas não redundante GenBank. O tamanho da base de dados (parâmetro Z) foi ajustado para 1 bilhão. Este ajuste de tamanho garante que os Ε-valores significativos na base de dados corrente continuarão a ser significativos no futuro previsível. O valor de corte de E-Valor foi ajustado para 10.
O perfil HMMs para as subunidades grandes, médias e pequenas de diol/glicerol desidratases com função verificada experimentalmente foi específica nas únicas subunidades de diol/glicerol desidratases que foram recuperadas, conforme indicado pela anotação das seqüências coincidentes e sensível nas seqüências parciais pares de subunidades de diol/glicerol desidratases que foram recuperadas. Cada uma das seqüências recuperadas tinha um Ε-valor de 0,01 ou menos.
Todas as seqüências nas árvores filogenéticas nas figuras 2, 3 e 4 foram recuperadas na correspondência de perfil HMM. Todas as seqüências nas ramificações das árvores que não contenham seqüências com função experimentalmente verificada foram pareadas. Assim, todas as diol e glicerol desidratases estavam ligados à 8 diol e glicerol desidratases com função experimentalmente verificada através de correspondência com o perfil HMMs para as subunidades grandes, médias ou pequenas das enzimas. As subunidades de diol e glicerol desidratase de comprimento total que correspondem ao perfil HMMs têm os seguintes SEQ ID N
Subunidades (alfa) grandes: 8, 93, 99, 105, 135, 138, 141, 146, 164, 167, 170, 173, 176, 179, 182, 185, 188, 191, 194, 197, 200, 203,
206, 209, 212, 215, 218, 221, 224, 227, 130, 243, 254, 255, 256, 257, 258 e 259.
Subunidades grandes + médias unidas (a porção da subunidade grande e da subunidade média coincidem com o perfil grande e o perfil média, respectivamente): 233, 235, 237, 239, 241, 246 e 247.
Subunidades (beta) médias: 10, 95, 101, 107, 136, 139, 142, 148, 165, 168, 171, 174, 177, 180, 183, 186, 189, 192, 195, 198, 201, 204,
207, 210, 213, 216, 219, 222, 225, 228, 231, 244, 250, 252, 260, 261, 262, 263, 364, 265, 266 e 167.
Subunidades (gama) pequenas: 12, 97, 103, 109, 137, 140, 143, 150, 166, 169, 172, 175, 178, 181, 184, 187, 190, 193, 196, 199, 202, 205, 208, 211, 214, 217, 220, 223, 226, 229, 232, 234, 236, 238, 240, 242, 245, 248, 249, 251, 253, 268, 270, 271, 272, 273 e 274.
Esta análise mostra que o perfil HMM para cada subunidade, que foi preparada usando seqüências com função verificada experimentalmente, fornece uma estrutura que está ligada à função de enzimas de diol/glicerol desidratase. Comparando todas as seqüências acima para os perfis HMM, por sua vez, fornece um link estrutura/função para estas seqüências. A
cn
UJ
CQ <
e
(ο ι_
cn ο
ο
ό o «03 (λ
ι— >—
ω π
> ο φ rs
ω (D
e e
ο ο
TO O C <φ α CT Φ CO Φ TD O - C (0 Φ ε φ TD TO C χ:· C '5 TO ο C Φ TD Ò -«-< TO TD C CO φ ε C TO Φ -C Φ C TD TO O O CO > TD O 13 CT Ο. -■σ
φ
ε
CL
e ο 'j
tf) £ ω
td
o ο_
2
C φ
e
TO -C c
rô ο
td CO (0 c
·
ο ο co •03 (λ
φ ·»-<
c φ "ό c
ο
CL tf) φ
ι- ο o CO o td
ω in ω co ο
td
TO CL TO Ω.
(λ
e
ω e <ro
to q.
'5
e e
Sl
S o
σ- c
TO £
o e .4= to
C -C D) Ç
« to jb φ -tf) td
® o
g-i cr to
to o o to
TO
TO CL
& ο ο)-s to to í5 ο TO — CL CL CO
TO
CO CO
3 o CO P o o td φ
£ φ <5 .α
e to ο to o φ
S
to c/)
α- φ
S
χ φ.
CO
CX φ
CO
csl co cn o cn
CC m Iii Ill
TO
e e
to td
CL Ν- ίο io
o
1 O S
X Z IJ
ο c
xj
Ib I
± CL Έ
Ü < O < 2 o
•α)
(λ
ο φ
e 15
to ο.
φ
to t_ .q
to o
e e
Io
cr c
TO £
,2 e 5t: to
C SZ
σ> g
TO ^ φ
tf) td
o
ο > > 3
'5 2"
to to o o to
ω ο
ο)-q
to to <- o to = Cl Cl tf)
° õ td £ to — tf) tf) 3 o CO S
o o
td φ
s φ ro λ
ε js
ο »
o φ
TO φ
td
o >
Λ
c0 ο
o 2
to & o
C
<φ
α ct φ
CO φ
td
e ο
ο >
2" to o o td C to
σ
e e
.c
TO -C
TO
φ
to o
ε ε
ο ο
r-» ο
o CN io
io o
LO io
CO
i
T
ιο ιο
co
o o o
CD ι o o ο CO O
TO
τ
CO Ul ίο
σ
iu co
< D
00 i
i- x
o
o o
o TD
JS
CO φ
S φ
td φ
td to ;σ
s
to xi o
to td o
«to ç>
.α
10
td <
ιο
LO
co
i
T
h _ι d z
CO
CO
σ>
CO
co
o CN
CN
ιο 00 o
CN o
σ>
cn
Ts-
σ>
CO
ιο
CO io
ο) cn
00 CO CO
io
co
co
LO LO
io
σ> ιο
o
φ
td tf) to ω
o φ
ο
td
SS φ
ο τ-
"5 00 e
ο
φ
td o
e ο
to ι_
TO CL
o
ο cn
io
CO CO
ο
-ρ 2
c to
ο ω- α) to
τ3 -σ
ο to
e s
ο =
2 E
.S £
|1
φ Xf TO
o o χ2
ε
sco
o
χ! o
<
χ! o ^ to .t= xi φ ·φ
C O ~ φ
ο "§
e ε ο
ç> ο -σ c φ
ο £
™ TO 3 TD o ■=
TO ||
2 CL TO TD
o ito
g-2
E CL
ω μ
<> -TO
Φ
TO
CO O O TD
8 ο
xl o
I'
03
φ" σ-
c CO
φ O £
to <3
> ω
^'η· ο to
cl ο » «to φ co
- CO TO φ
So e 5
TO >
- tf) φ φ
■Λ~>
ZL tf) CO W
S-o
Φ ^
ε c
<to o
to'2 q.
CO ω o o TD >
Il
■ç _ Φ Φ TD TO
ω e =
ο S
TO-jC
> φ C ω C £ •ο to "ξ
ο^ε
8
Εβ%
e ra
ω
< "α ο
CO
CD CN
o
CD CO CD
cd cn
Q >
lu
- >- -880 -1279 > cd cn h- -1028 w -1444 [τ -1425 σ -1356 cl -2229 z -1701 s 4141 _ι ο ν— cd φ Λ ι ε -1390 — ε Λ Xi co co x d->d -1302 O d->m -2022 ll Λ ι -276 lll E Λ ι !-1844 Q m->d i -1585 -2125 o m->i * -982 < E Λ ι E JO CO IO r 1 -965 HMM . CN CO -fr LO CD N 249 Tj- σ> CNl σ> Tt CN I CN IO ν— V- CD Tfr CN ι IO IO ι CD Tfr CN 1 co CN IO ι CD Tfr CN ι CD CN LO ν— CD -fr CNJ ι Ν- ΙΟ CN -294 σ> Ν· I -fr CD CN ι N- CO -fr ι Tfr CD CN ι co N- -fr Gi CN CN OO ι Tfr CT) CN ι CD Tfr N- ι Tfr CD CN ι O CN -369 CD CO -fr σ> CD CO ι CO CD CN ι CD CD CO 1 O CN O τ- ι CD CD CO 1 O CNl CD ι CD CD CO N- N- CD CD CO ι CO 00 CD ι N- v- £ t N- O CD N- I N τ— LO Csl CN ι N- CN N- CD ι N- CO -fr ι N- N CD ν- σ> LO CO LO σ> τ σ> IO CO CO CO 1 σ> LO CO -fr Tfr CD Gi IO CO -fr- ο ο Gi IO CO ιο CN CNJ ι σ> ιο CO CN CD CO ι CO σ> CO CD CO ν— CD CD N- N- O CO CD CD "fr CO ι CD CD Gi Gi LO CD CD CN CO Tfr CO CD σ> CD N- O CNJ ι CD Tt σ> CN CD LO Tfr CD co IO Tf CD co IO Tfr Tt h- IO -fr CD IO ι LO Tfr CO N- I Tt σ> CO IO CD -fr -fr CD co Ν- ΙΟ LO ι Tfr CD CO O co CN Tt CD CO O ιο N- τ— ι Tt CD CO CO N- CO ι -fr CTi CO co ο LO CN ι ιη Ν <Ν ct> LO ι LO Ν- CN σ> CO LO ιο N- CN co CO IO N- CNJ N- Tfr LO ι IO N- CN σ> CTl CO LO N- CN -fr N- CO -720 O CD CO ι O CN N- ι CO CD O CN N- 1 IO CO N- I O CNJ N- I LO CN ι O CN Γ- ι CD CN CO τ- ι O CN N- I ο CD -466 -fr LO CD ι CD CD σ> ιο ^r CD CD t LO O LO CD CD Tfr CD IO CO 1 CD CD T N- CD CO ι CD CD Ί- LO N- I ο CN « Tfr IO σ> ο CN * co N- N- O CN -κ O O CO O CNl * CO O CO O CN * CD LO IO ο CN * IO CN CN CN -626 LO CO ιο I ο N- Γ- ι CD CN CD ι * CD N- -fr CD CN CD ι * co ο Tfr CD CNJ CD * CO N- 00 CD CN CD ι -K Tfr -fr CD ι CD CN CD * CO N- -fr CD O co N- CO ι LO O CN CD O co N- CO LO I CD O O σ> CD LO co I CD O CO N CO CO CD CN ι CD O CO N- co CD Tfr T CD O CO N- CO ι Gi N- CO CD Gi CO τ- Ο N- I Ν σ> CO 1 CD CD CO τ- Ο N- ι CO CO ι CD CD CO IO CO LO ι LO -fr (J) ι CD CD CO ν- O N- I CNJ IO I CD CD CO ο N- I CN CO CD τ- ι CD CD CO O N- I LO CO CN -381 IO ι CN co CN ι 00 CO ι IO ι CO CO CD I 00 CO LO ι O LO CD ν— ν- CO CO LO £ ν- CN CO CO ι LO CO CD O CN ι ν— οο CO 1 LO τ- ι O Tfr N- CO CO ^r Tfr CD CO ι CO CO Ti- -fr Ο) CO 1 CN ν- ΐΟ ι CO Tt -fr CD CO I CD CNJ CN CO -fr- -fr CD 00 CN Tt T CO Tt Tfr Gi CO ι CO O CT) 1 CO -fr -fr CD CO ι IO LO Tfr CN 1 CO CO CN N- co O N- ι CD CD t co co CN CNJ CO CNJ ι Tfr CD Ο) ι CO CO CN co N- N- CD ι IO CNI CO CO CN N- CO O N- I O O co I CO CO CN N- 00 ο N- ν— CO -fr I CO CO CN N CO O N- I CN LO CN ι -500 IO -fr O CD ι CN CO Ν- ι O O ιο I IO Tfr O CD ι CO CD CN t- ι O O IO CD CO Ν- ΙΟ ι N- N- O O O LO LO Tfr O CD ι CD CO CD I O O LO I LO -χΓ O CD ι Tfr V CD ι O O ιο I ιο Tfr O CD 1 O -fr CO ι -149 CO CO CO ο CD CD -fr ι O LO CO ι — co N- I CD -fr ι Tt 1 CD Tf ι CD Tfr CO CO CO CN O I CD Tt ι CO CO ■ τ— 00 CD ι CO CO I CN O CD g CN 1 ι g CO 1 σ Tfr I g LO ι g CD 1 I LL N- 139<table>table see original document page 140</column></row><table>
CO σ> O - CN σ> Tt- CM CO CD CN τ- σ> ττ CN CO LO N- ι σ> CM ι Ν- α· 00 ι CD Tf CN ι οο N- τ- ι CD Tf CM ι CO co CM ι CD Tf CN -294 Ο CO σ> ι Tf σ> CN ι co co CM ι Tf O CM Tf CO CN ι Tf CD CN ι IO οο N- Tf CT) CN ι CN O CO I TT CD CM σ> co CO CO CO 1 σ> CO CO ι CD σ> CO CO ι O CO CD CO co ι CD CO CD ι CD co CO ι CO 5· I CD CO CO Ν- CO N- CO ι N- LO CO I N- CO CO N- N- N- V ι N- CD N- CD ΙΩ CO CO CO CM ι CD IO co CO CO I CD IO CO CN CD σ> CT) IO CO T- CN IO CD LO CO CO 00 CO Gi IO CO CO CD CM N- CO CO O CN co CD IO CO CO I CO CD CN τ— CN 1 CO CD CO N- CO CO σ> IO Tf Tf O CNJ ιο Tf Tf Tf IO ττ Tf CN N- I IO co CD CO LO Tf O CO IO Tf Tf Gi CO O σ> CM I Μ- α· CO co CN τ- ι Tf CD CO CTl CO ιο CM CT) CO N- CN CM Tf CD CO ιο CO CO 1 Tf CD CO ιο N- CNJ Tf CO LO N- CM CM CN LO N- CN CO CO CM 1 IO N- CM Gi IO N- CN co ο LO N- CN -720 Tf CN σ> ι O CM N- T]" σ> I O CN N- I CM ττ N- O CM N- 1 CM CO CD O CN N- I O CO CO O CN N- 1 -466 Tf CN N- V ι CO CO 'ί- CO I CO co ττ ι N- O co CM co CO t CO co Tf ι CD CD Ι- CD co CO CD CD Tf ι ο CM * οο CO CO ο CN * co co ο τ— CN * N- CO CO O CN Ν- ΙΟ CN ο CN # co CM CN O CN * CO CM CO ι * O N- I CO CM CO * CO IO IO I CO CN CO I * 00 CO ττ CO CM CD CN CD CO co CM CD ι * Gi CD N- CO CN CD * CO O οο N- CO ιο co CO O οο N- CO ι O CD co ο 00 N- CO CO O CO I CO O CO N- CO ι CO ι CO O co N- CO I Tf N- CO O 00 r- CO V 1 σ> σ> CO ο N- ι CO O I σ> σ> CO O N- 1 O CO I CD G) CO O Ν- CO LO ττ CN I CD CD CO τ- Ο N- I N- CM CD ι Gi CD CO O Ν- CM TT CM ι CD Gi CO O N- I οο CO LO O O O CN 1 οο co ι LO CO co O T- S CO I ΙΟ ι σ> CN CO CO LO O Γ- ι οο CO I ιο τ— Tf CN CM ι CO CO ι LO Τ- ι CO Tf σ> 00 ι N- σ> ο CN CO Tf ττ Gi CO I ^ ττ N- CO Tf ττ CTl co ι LO σ> CN CM CO Tf Tf Gi CO CD Gi IO co ττ ΤΓ CD CO ι CN CD CO CO Tf Tf CD 00 ι CO CO CN N- CO O N- CN CO co CO CO CN N- 00 O N- CN CM CO CO CM N- co ο N- I CM Tf ιο CM ι CO CO CN N- CO O N ι ττ N- CM CO co CN N- CO O N- I - CO co CN N- 00 O N- ι -500 IO O CO σ> ο N- I O O ιο I LO O co CO CD CO I O O IO I LO Tf O CO I CT) σ> O O ιο I LO Tf O CD ι Gi co O O ιο I IO Tf O CD ι LO Tf N- I O O LO ι ιο Tf O CD ■ σ> ττ 1 CO CO I N- CO σ> Tf ι CO CO CO CN ■sf Gi ττ I CO CO I σ> CO CO CD ττ τ- ι CO CO ι ιο CT) CD CD I CO CO ι CD O LO CD Tf Τ- Ι 00 CO I S CO ι I > σ> I I d ο I ι m I ι CN I ι <table>table see original document page 141</column></row><table>
co τ- ίο τ- co n- co -1529 -249 -2023 -249 -1506 -249 -664 -249 -890 -249 -1915 -249 -1746 -294 -2050 σ> cm i -1910 -294 co ι I -294 -1373 -294 -2388 -294 n- n- ι -369 -1780 -369 2675 o) cd co ι -1264 -369 -706 -369 -2138 Oi co co ι -1148 n- -1216 n- -884 n- -457 n- t- v -260 n- -1239 n- -1225 cd lo co -1129 cd io co -1950 Ui lo co -374 (J) io co co lo co i O) lo co -970 ct) lo co 3432 co σ> -1571 co σ> -2330 co o) co co i co cd lo cm io co O) -1434 co cd -156 lo -1471 lo -sr -2086 lo co ct) cm lo 1890 lo -421 lo -1873 ct> co 3760 ct) co -2716 ct) co -1387 Oi co -1397 <35 co -1858 <35 co -899 lo r- cm -1359 io n- cm -2308 lo n- cm 2258 lo n- cm cd co i io n- cm co O) i io n- cm -1326 -720 -1827 -720 o co o cm n- i -886 -720 ' -294 -720 -2029 -720 -1867 -466 -2268 -466 cd cm cm co co I -1620! -466 lo co co -466 co ν- ιο cm I -466 cn ίο lo o \— cm * -1488 o v- cm # -2256 o cm * co cm co o cm * 1166 o cm co ·<* co i o cm * -1944 co cm co i * o co cm i -626 * 1944 -626 * 1-1597 -626 * -906 -626 -2514 -626 * -446 co o -1378 -1456 co o v- co n- co i -2045 co o co n- co ι 2418 co o -1378 cm co o t- -1378 -662 co o -1378 -1632 <35 O) co -701 -1314 Ui Ci co τ- ο n- i -2731 Ui σ> co -701 1-1098 O) Oi co -701 -1307 <35 05 co o n- -1157 ct) <35 co -701 -2068 -381 -1115 -2187 -381 -1115 -743 -381 -1115 -1218 -381 -1115 -1300 -381 -1115 -2502 -381 -1115 -903 co -894 -1451 co ■sr -894 -2505 co t -894 co co co co -894 co cm co -894 co "sr cm co ■sr <35 co i -1431 co co cm -7087 -1352 co co cm -7087 cd cm i co co cm -7087 o co co co cm -7087 -403 co co cm n- co o n- i 3441 co co cm -7087 -1614 -500 -6045 -1220 -500 -6045 -604 o o io i -6045 io 1 -500 -6045 -1181 -500 -6045 -2063 -500 -6045 co -149 co co i -934 -149 co co i -886 -149 co co -457 -149 co co i -346 -149 co co i -1130 -149 co co i 13(R) i i 14ÍP) i 15(V) i 1 16{H) i i σ h- i 1 q co i <table>table see original document page 142</column></row><table>
σ> O CNj ν— CNJ CN CNJ CO CNJ Tf CNJ -2279 -249 791 -249 -1560 -249 -1352 -249 -1512 -249 O co LO -249 -2198 -294 -109 -294 -1948 -294 -1820 -294 -2255 -294 5696 -294 -1921 -369 co σ> σ> CO CO ι 2430 -369 -1258 -369 -1663 -369 -1643 -369 -1093 N- σ> CO CNl ι N- -911 N- ν- -423 N- IO CO I N- -1992 N- -958 σ> LO co CNJ CO co ι CD IO CO -2058 359 -375 CJ) LO CO -411 σ> LO CO ο LO CNi ι CO LO CO -1790 CO σ> -1976 co (J) -2442 CO CO σ> CO CNJ CO co -438 : CO CO -1777 CO σ> -1590 IO Tf -1598 IO Tf -2191 LO Tj- CO N- CNJ ιο Tf LO CO CNI ιο Tf -1854 LO Tf -1775 Tf σ> CO CD CO LO CNJ I TT σ> CO -2784 Tf σ> CO -1403 Tf σ> CO -1352 Tf CO CO -2383 Tf σ) CO -1324 IO N- CNJ -1982 LO N- CNJ -2414 LO N- CNj Tf N- I ιο N- CNJ 1286 LO N- CN -2018 IO N- CN -2081 O CNJ N- ι CO O co -720 CO TI- CO -720 -915 -720 -1318 -720 -1210 -720 -2644 -466 1465 -466 Tf Tf CNJ -466 -1681 -466 CO N O CNJ I -466 -1347 co CO Tf -1720 ο CNJ « -2076 ο CNl * -2383 ο CNI # 2073 ο CNJ * Ο) co ο CNJ -K -1882 O V CN -2502 -626 * ο Tf Tf -626 * 2359 -626 * -1633 -626 * -2069 -626 * -1602 -626 -1562 CO O -1378 -676 CO O -1378 -2139 CO O -1378 CO co ι CO ο •ί- CO N CO ι LO N- ι CO O -1378 LO CO N- I CO σ 3331 σ> σ> co -701 -2678 σ> σ> CO -701 -2841 Ο) σ> CO ; -701 1239 Ο) Oi CO -701 -963 CO CO CO τ- Ο N- I -2070 CO Ο) CO -2460 -381 -1115 2872 -381 -1115 -752 -381 -1115 -1960 -381 -1115 -2276 -381 -1115 CNl σ> τ— -381 -1487 CO Tf -894 -2396 CO Ti- -894 -2618 CO Tf -894 r- co Tf -894 2406 CO Tf -894 -2370 CO Tf -1313 CO CO CNJ -7087 Tf CD N- CNJ 1 co CO CNJ -7087 Tf CO O CO 1 CO CO CNl -7087 -130 CO CO CNJ -7087 σ> CNJ co CO CO CNJ -7087 -2416 co CO CN -1103 O O LO I IO Tt O CO 1 -1041 O O LO I -6045 -605 -500 -6045 -1326 -500 I -6045 -1990 -500 -6045 -1577 -500 -758 -149 co CO -1300 -149 CO CO CNJ CNJ σ> ι -149 CO CO ι -395 σ> Tf τ- ι CO CO ι -597 σ> Tf ι CO CO I -1926 -149 19(G) ι I 20(F) 1 ■ 21 (V) 22 (K) I 23(Ε) I I 24(W) ι <table>table see original document page 143</column></row><table>
ιο CSJ CD CN LZ co CNl CD CN O CO O CD CO σ> ττ CN ι τ- N- CD CD τ!" CNI CM Tf N- σ> Tf CN ι σ> N- CN CNI σ> Tf CN ι CN CO CM CD Tf CM ι Tf LO LO ι IO I Tf ο> CN ι CD TT CN I Tf CJi CN ι N- O CM CN Tf CD CN 00 Oi CN ι Tf CD CN ι CD CD T Tf CD CN CD CO CD τ- ι co CO T σ> CD CO σ> CO ι σ> CD CO ι σ> σ> N- I σι CD CO ι CM Oi ι CD CD CO ι O O CN CD CD CO ι Tf CD CM σ> CNJ ι N- CO CN N- N- CM ■ςΤ O 1 N- CO σ> ο N- N- CN CN ι N- V" CN CD ι N- N- I σ> IO CO CN CD Tf ι CD LO CO CN CD CO CTi IO co CO LO σ> ι (J) LO CO CN N- CD ι CD LO CO LO CD O CM ι CNI <Ν ι CD σ> N- N- N- I CD CD O N- N- I CD σ> O σ> N- I CD CD CO CD O CM CD CD O Tf CN ι CO CO IO Tf CO CO CN LO Tf O CN ι LO Tf 0 01 LO ι LO Tf CM N- CD τ- ι LO Tf CO co CN N- Tf LO τ— Tf σ> CO O CD CO I Tf σ> CO τ- CN CD 1 Tf CD CO LO N- N- ι CD CO O CN CD CN ι Tf Ο) CO CD CO N- CN ι IO LO N- CN O Tf Tf LO N- CN CO ο τ- ιο N- CN Tf CN CO ι IO N- CN CO N- τ- CN 1 LO Γ«- CN O CN Tf CN t Tf ττ CjJ O CN N- CO LO ιο I O CN N- I CN S O CN N- 1 co ο CN ι O CN N- I Tf CO O O CN N- ι CN N- CO CD LO CD CD CD Tf ι CN O CO CN 1 CD CD Tf ι τ σι CN CD CD Tf Tf CD CM ι CD CD Tf ι CN N- O CN CD CD Tf (J) N- CN * N- \— CN ο CN * N- ι O CN * ο LO CO ι ο T- CN * O CN N- O CM * O N- CN ι O CN * LO CO CO CM * Ν- CO CO co CN CD * N- CN CO CN CD CN CD ι * OO O CN ι CD CN CD * CN O LO CN ι CD CN CD ι * O δ CD CM CD ι * CD co LO CN -1378 CN CD O CO N- CO co ι CD O CO N- CO LO σ> Tf ι CD O CO N- CO 1 CM CD LO CD O τ- co N- CO τ- ο CD O CD O οο N- co ι O Tf CM τ- Ο N- I O CO O σ> (J) co δ N- cn CN σ> σ> σ> co O Ν- CD Oi τ- ι CD (J) CO O N- I CO CO CO CD σ> CO Ο Ν- N- CD N- CM 1 CD CD CO O N- I IO τί- ΟΟ CN -1115 ττ N- ν— CO CO I LO I N- LO CN co CO ι ΙΟ ν ι σ> ο CO CN ι CO CO LO ι O CD Tf CN I δ CO ι ΙΟ ι IO co ο CN 00 CO 1 LO O CO N- -894 S CN CO Tf Tf σ> co TT O Tf CN co ττ Tf σ> CO ι CN IO O CO CO Tf Tf CD 00 N- co Tf I co Tf Tf (J) CO Oi N- Tf CN ι CO Tf Tf CD 00 CO CN CD CN ι -7087 CO Tf Ν- CO CO CN Γ- ΟΟ ο N- σ> ο CD τ- co CO CN N- CO O N- I σ> N- CO CO CO CN N- CO O Ν- CO CO ι CO CO CN N- co ο N- I CD CO CD CN ι CO CO CM N- CO O N- I Oi CD O CO I -6045 CO CO σ> ι O O LO I LO Tf O CD 1 τ* N- CN CM 1 O O LO I LO Tf ο CD ι T- CN CD O O ιο I ΙΟ Tf O CD CO O O O LO ι LO Tf O CD ι CN CO ο ι O O LO IO Tf O CD ι CD CD ι CO CO CD CO ι σ> Tf τ- ι CO CO Tf O N- Ο) Tf 1 CO CO ι CO CO cp σ> Tf ι CO CO I co LO N- I CD Tf ι CO CO ι O O CO I CD Tf CO CO ι CN CO Oi I CL CN I ι S CD CM 1 ι LLI N- CN ι ι § co CN ι LL Oi CN ι O CO <table>table see original document page 144</column></row><table>
CO CM CO CO CO CO LO OO -249 CNl Γ- ι CD ^r CM ι (Ω co CO I CD Tf CM ι δ CD I CD T CM ι Γ- ΟΟ Γ- ι CD ^r CM ι O CO I CD -Sf CM ι -294 σ> CO o CNl I Tf CD CM CO Γ- ι Tf CD CNl ι Tf CM CD I Tf σ> CM ι ιο CM I Tf CD CM ι Γ- ιο Γ- τ— I "sf CD CM ι -369 O Tf CD CD CD CO ι co CM Tf CD CD CO Γ- CD CD CD CD CO CD O O CD CD CO Tf CM ι CD CD CO r- σ> IO CNJ I Γ- LO Tf O ■ Γ- τ- δ Γ- T- τ- τ Γ- CD IO Tf ι Γ- CD LO CO CD IO τ- ι LO co CNl Γ- Γ- ι CD LO CO Is- Tf CD LO CO CD CM CD IO CO Tf CM T CD IO CO <£> CD IO CM CO 1 CD σ> (Ο CD CD CD CD CD CO CD CD Γ- CM O CD CD CO CO CD CD IO ■sf CM O IO Tf Tf Tf Tf LO CD LO CD LO Tf co co LO ι LO ^f CO CO γ— LO Tf Tf O) CO O CO CO τ- Tf CD CO CD CO Tf CM Tf CD CO ιο CD τ— Tf CD co LO ι "Sf CD CO Γ- CD Tf CM Tf CD CO IO r- CNJ Ο) CD CO ι LO Γ- CM Γ— O O CM 1 LO Γ- CM co OO co IO Γ- CM I IO Γ- CM Tf CD ι IO Γ- CM -720 O O I O CM Γ- ι LO Γ- LO CO O CM Γ- ι CD δ O CM Γ- ι CD O τ- ι O CM Γ- ι O IO CO I O CM IsJ- -466 IO Tf LO ■τ- ι CD CD t Γ- ΟΟ Tf CD CD Tf CM Γ- όο I CD CD t Tf CM CD 1 CD CD Tf ι ν- CD LO ι CD CD Tf ι o CNJ * CM CM ι O CM ·* co CD O CNl * CO co LO O CM * O CD γρ O CM * γ- οο τ- O CM * -626 * "xf CO ο CD CM CD ι * CM OO Γ— CD CNl CD ι •κ O O CO CD CM CD * CO Γ- ι CD CM CD ι * δ Tf I CD CM CD ι * CD O ·«- co r- co CM co ι CD O τ- CO Γ- CO CD CO Tf CD O 00 γ- οο τ- ι co CO CM CD O 00 Γ- ΟΟ Is- O CO I CD O OO γ- οο ι CO CO I CD O ου Γ- ΟΟ I CD σ> CO o hp Tf Tf Γ- ι Ο) CD CO δ Γγ Tf O CD CM CD CD CO O Γ- ι LO Γ- T Ο) CD CO O Γ- ι CD σ> CD co δ Γ- ι O CM Ο) CD CO O Γ- ι T~ CO co I IO CM CO Γ- ι δ CO ι LO τ- ι CD CD OO CO LO CD CM CD ι χ— co CO ι LO τ- ι γ- CD CD CO CO ι LO τ· CM CO Γ- ι δ CO LO ι CO ττ Tf CD co LO CD CM CO Ti- CD CO 1 00 σ> ο CNl 1 CO TI- Tf CD OO ι O CO CO Tf -Sl- CD co CD CD CO Tf Tf CD CO ι CD CO ττ -Sf Ο) co ι CO CO CNJ r- 00 o γ- O Γ- CM co CO (Μ Γ- οο ο γ- ι CO δ CNJ CO CO CM Γ- ΟΟ O Γ- Tf Is- f CO CO CM Γ- ΟΟ O Γ- CO IO CD ι οο CO CM γ- οο O Γγ CD ι CO CO CM Γ- ΟΟ O Γ- ι -500 IO Tf O CD «çf Tf τ O O LO I ιο O CD ι CO Tf Cp O O IO ι ιο ττ ο CD CO CO co 1 O O ιο I ιο Tf O CD ι O γ- ΟΟ ι O O ιο ι ιο Tf O CD ι CD CM O σ LO LO Tf O CD -149 CO CO I CD O CO CM CD Tf I CO CO I Γ— CD O I CD Tf τ— CO CO I CO O CD Tf I co CO ι Γ- δ CD Tf I CO CO LO O Tf σ> Tf ι CO CO I I I < τ— CO ι § CM CO 1 ι UJ CO CO ι δ Tf CO I 1 g LO CO I <table>table see original document page 145</column></row><table>
CO CO ν CO CO CO Oi CO o 5· 1610 -249 -1915 -249 -2023 -249 -977 -249 -1515 -249 -1530 -249 1687 -294 -2388 -294 -2050 Tf Oi CM ι -1500 -294 -1971 -294 -1992 -294 -395 -369 -2138 -369 -1780 -369 -221 -369 ! -926 -369 -1038 -369 -493 N- -1239 ν- -1216 r» CO v— Τ- ι ν o N- r-- -220 N- -699 Oi ιο co -970 Oi lo CO -1129 359 -143 OÍ lo CO 1259 o> io CO 2786 Oi lo co -699 CO Oi -1434 CO Oi -1571 CO Oi Tj- CO CM CO Oi -800 CO Oi -1097 CO Oi ν— CO CM ι lo Tf -421 lo ■sr -1471 lo Tf CO CO Tf lo Tt -426 lo Tf -824 lo t -1740 Tt CD CO -1658 Tf O) CO 3760 O) co -300 ' Oi CO 2478 Tj- OÍ CO -1304 Tt Oi CO 2198 lo ν- CM CO cd ι lo N CM -1359 lo r- CM o tt lo N- CM -359 lo p- CM -622 lo N- CM CO -720 cd CM o CM ι -720 ν CM CO ν- ι -720 -399 -720 -950 o CM N- I -1218 o CM N- ι -601 -466 -2578 -466 -2268 -466 -1182 CO CO -1718 -466 -1896 -466 -426 ο CM * -843 o CM * -1488 210 * 1939 o CM * -525 o CM •K -916 o CM •K -508 -626 * Tt lo CM ι -626 * -2160 -626 -K -1024: -626 « -1500 -626 •K -1625 -626 ο CM CO o -1378 -682 CO o -1378 -1456 co o -1378 Oi o CO o V- -1378 CO lo CO I CO o -1378 -949 CO o -1378 -1683 σ> σ> CO τ- ο N- -1157 Oi oí CO τ- ο γ- ι -1314 Gi Oi CO -701 -1107 oí O) CO -701 -628 Oi Ol CO -701 -671 O) oí CO -701 1232 t— CO co i -1115 -2502 -381 -1115 -2187 -381 -1115 -1457 ν- α) CO I lo I -1769 -381 -1115 -1751 -381 -1115 -603 co Ti- -894 CO tt CM CO Ti- -894 -1451 CO Tf CJi co I CO lo CM CO -894 -468 CO Tf -894 -867 CO Tf -894 -1097 co CO CM -7087 3441 co CO CM -7087 -1352 CO CO CM -7087 -247 CO CO CM -7087 -556 CO CO CM -7087 -840 CO CO CM -7087 N- Tf CO ι -500 -6045 -2063 -500 -6045 -1220 -500 -6045 -1085 -500 -6045 -475 -500 -6045 -498 -500 -6045 -556 -149 CO CO -1130 -149 co CO ι -834 -149 CO CO I lo N- -149 CO CO CO CM -149 CO CO I CO -149 co co 36(Ν) ι ι D γ- οο 38(P) I 39(K) CL o" I I CO 5 I <table>table see original document page 146</column></row><table>
CM 'ί- CO Tf Tf TT ιο Tf CD Tf n- Tf Ο Tf io σ> Tf CNl 1 cd ι co Tfr CM I O Tf lo 1 σ> Tf CM ι Tf CD O ι cd Tfr CN ι Tf Ο) co τ- ι CT Tf CN ι σ> n- CN CM cd Tfr CN ι O CM σ> ι Tf cd CM cd CD ι Tf Ο) CM 1 O CM σ> ι Tf cd CM ι CO n- I Tf CT CN ι CD CT O CM ι Tf CT CM CO cd CM Tfr cd CM O CD O CM cd CD CO I IO N- τ- ι σ> CD CO O CD O CM cd CD CO IO ι cd CD CO σ> ιο ι σ> CD CO ι τ- CN σ> ι σ> CD CO CD CNi σ> ι n- CD CD IO n CD CM cd ι n- τ- n CN cd Tf ι n CO cd O 1 n- CNI lo O CNI ι σ> lo CO CD CO t CT ιο co CM IO O CM ι cd io CO n- CO ι CT IO CO CO CO CO I ct lo CO co IO cd ι cd IO CO σ> CNJ CD Ct CD CD CT) cd ν Tf CM 1 CD cd cd Tf CD CT CO CD ι CD cd O σ> n- CD CD CO CO CNJ io ττ CD CD IO LO Tf CD CD τ— CM ι IO Tfr N- O CD LO Tf CD n- σ> io Tf O cd lo io Tf n- n- n- CM σ> CO ττ ττ ι TT σ> CO N n- n- CM ι Tf <35 CO CO O CN ι Tf CT CO ο CN CO I Tf CT CO ld n- n- I Tf cd CO 00 ο Tf CNJ io N- CM σ> ι lo n CNJ CO O Tf CM lo n- CNJ lo O CO lo N CM CO CN io n- CM Tfr CN CO ι ιο n- CN cd CO ο CM n- I CO Ct CD ι O CM n ι σ> CO O CN n- I CD δ I O CM n ι Tf O O CN n- ι οο ο CN ι O CN n- I n- O CO CD CD n- CD Tfr ι CD CD Tf n- O CO CD CD CN CD Tf CD CD T n- σ> co CD CD t Tfr Tf CD CN ι CD CD Tf ι TJ- CD CO CNJ I ο CM * ν- ιο CM CN O CM * Tf CD CO CM ι O CN * cd Tf Ct O V- CN * cd ο CO O CM # O CM n- O CM n- n- CD CM CD CNJ CD * Tf n- ττ ι CD CM CD ι * n- n- CD CM CD CN CD 1 # i CD CM CD ι * co ο cd ι CD CM CD ι * CM O LO CN CD CN CD IO CM CM CD o co n- co ι CO CD CD o CO N CO lo CM CM CD O CO n- CO co CT) CD O CO n- CO 1 IO CM CD O CO n- CO ι CM CD IO 1 CD O CM CO 00 CNI σ> cd CO o n- i n- CO > Ct CTf CO Τ- Ο h- 1 CM CO CO CM ι cd cd CO τ- Ο n- I CO CO O σ> CT CO O n- I O O O cd cd CO O Ν- CO CO CO cd cd CO 00 O Γγ δ CO ι IO ι σ> σ> CO CO CO ι LO τ- ι co ο n- ι CO CO ι IO 1 CO CN n- co CO ι lo ιο IO CN ι co CO ιο ι O CD TJ- CM ι δ CO i σ> ο CD CM CO ττ Ο) CO I Tf n CO Tfr Tf cd CO ι σ> ο CD CM ι CO TI- TT CT) CO 1 n- δ τ- CO Tfr Tf σ) οο CN n- co TJ- Tf cd co ι n- 00 Tf 1 CO Tf CNJ ιο ο CO CO CO CM n- CO O Γ- ι lo CO ιο ι CO CO CM n- CO O Ν- CNI lo O CO ι CO CO CM ν· co ο Ν- ο δ CO CO CM n- 00 ο n- i 00 O n- CO CO CN n- CO O n- ι CO CO ι co CO CN IO CM CD i o o IO ιο Tfr o CD ι CD n- o o lo ιο Tfr O CD IO CM CD ι O O IO ι ιο Tfr O CD ι CM CO Tf τ- ι O O lo 1 IO Tfr O CD CO cd 00 O O lo i lo Tf O CD ι CO O ι O O IO ιο CO cp σ> Tj- CO CO I CJ) co ^ cd Tf CO CO i lo CO cd ι cd Tf ι CO CO O σ> ι cd Tf ι CO co ι CO O lo cd Tf τ- ι CO CO ι co lo n ι CT Tfr CM Tf ι g CO Ti- Tf Tf ι UJ ίο Tj- ι Z CD Tf ι ι § N^ Tf <table>table see original document page 147</column></row><table>
co O) O LO LO CN LO CO IO -760 -249 -1537 -249 -891 -249 -1742: -249 -1041 -249 -1915 -1260 -294 -1933 -294 -1282 -294 -2207 -294 -1224 -294 -2388 r· CM -369 2593 -369 1684 -369 -1799 -369 o N CO -369 -2138 o N- l Ν -898 N- 1596 N y— -1042 N- -1186 N -1239 -176 CT) IO CO -2012 CJi LO CO -941 CT) IO CO -862 ' Oi LO CO -2035 Oi LO CO -970 Ν- CO CO O) -2394 CO Oi -1285 CO CT) -770 CO Oi -1984 co OÍ -1434 CNJ O) LO ■sr -2145 IO -St -968 IO -210 IO -1652 LO -421 -1289 CTl CO -2755 CT) CO -1954 O) CO -1621' ^ Oi CO -2645 -çj- oí CO -1658 CO io N- CN N CO CO CNJ I LO N CN -1247 LO N CN -103 io N- CN -2305 io N CN co Oi I -121 O CN N- I CN ■sr co -720 oí co CO -720 CNJ CO -720 2757 -720 -2029 ■"5T CNI LO I -466 co co CN -466 o CNI -466 oí T— CN -466 2152 -466 -2578 1297 o CN * -2327 o CN * -1115 o CN * -350 o CNI * -2031 o τ- ΟΝ « -843 * -688 -626 * 2117 -626 * 1486 -626 * -2108 -626 * co o CO -626 * -2514 -1378 co CO o -1378 -2098 CO o -1378 -964 (o o τ- -1378 -495 CO o -1378 -1670 CO o V -1378 -662 -701 -1205 OÍ cd co -701 -2794 Oi Oi CO -701 -1819 ο) oí CO -701 co oí I CJi Oi co -701 CN N- co CNl I oí Oi CO -701 -1157 -1115 -1120 -381 -1115 -752 -381 -1115 -565 -381 -1115: -2309 -381 -1115 co cn τ- -381 LO τ- ι -2502 ■sr σ> co co CM cn CO -894 -2567 CO ■sr -894 -1345 CO -894 3052 CO -894 Ο CN I CO ^r -894 CO CNl -7087 -358 CO CO CN -7087 -3012 co co cn -7087 -1856 CO CO CN -7087 Oi N- CO co CO CN -7087 -2945 CO CO CN -7087 3441 -6045 -959 -500 -6045 -603 -500 -6045 -384 . -500 I -6045 -1921 -500 -6045 -1030 -500 -6045 -2063 CO CO I OO CO -149 CO CO 1 -905 -149 CO CO I -367 i -149 co CO -988 -149 CO CO 1 -1262 -149 CO co o CO I 48 (K) ■ 49(V) I 50(V) I to I 52(M) 53(D) <table>table see original document page 148</column></row><table>
ττ IO LO LO CD LO Γ- ιο co LO -249 ιο CD f- ot Tf OJ 1 CO CNJ LO O) Tf fV Γ- Γ- CD ι CD Tf CN ι CD N- CO σ> Tf CN O O CN ι CD Tf CN ι -294 CD O) CNJ Tt ot CNJ CNJ CO Tf OT CVJ O co LO ι Tf CD CN Γ- CD CO T- Tf CTl CN CNI Γ- ΟΟ I Tf OT CN ι -369 O IO O ot CO CO ι O CVJ CD I O) CO CO LO CO CD ι σ> CD co I CN CN CN CD CO CO O N- CD CD CO r- CO IO r- CN r- CD Ν- Τ- Γ- LO Γ- N- V N- Tf CNJ Γ- σ> ΙΛ CO r- Tf o σ> ιο CO Tf O O I Ο) LO CO CD CN Oi LO CO Tf CN CN ι σ> LO co OO co CN CD LO CO CO Ο) 00 I CD Oi ot CD IO CD CD O CO ιο CD CD Tf CO LO CO σ> οο CN CN ι co CD IO Tf CD CD I LO Tf ττ r- IO Tf Γ- Tf CD LO Tf LO LO Tf CD CO Tf LO Tf Tf C3Í CO IO f·- I Tf CD CO O LO Γ- ^f CD CO O Γ- Tf CTl CO co ν- CO Tf CD CO O CO CN Tf CD CO ιο Γ- CNJ IO Tf LO r- CN Γ- Tf IO I LO r- CN Γ- CD N IO Γ- CN IO ι LO N- CN CO CN co LO N- CN -720 co Gi I o CVJ r— I IO CNI O CVJ Γ- ι CN co t O CN Γ- ι co Γ- CN ι O CN Γ- ι CO Γ- ι O CN Γ- ι -466 O O O CVJ 1 CD CO Tf I CD LO CO I CD CD Ι- Tf CO CO CD CO t O I CO co CD O CO ι CO co ^ ο τ— CVJ * co r- CO I O Cvj -K CO O CO ο r~ CN -K CN LO O O CNJ •Κ O CNI -K co ο CO O CN -κ -626 ■κ Tf r- r- V- I CD CN] CD I •K CO Γ- ΟΟ I (D CN CO I * Ο) CO CN τ- ι CD CN CD -K LO CO CO ι CO CN CD -K OO Tf LO CD CN CD ι * CO ο OO Γ- CO ι Γ- ΟΟ CO I CD O 00 r- CO χ- ι CO co CN I CD O CO Γ- ΟΟ ν- CD CN CN CD O CO Γ- ΟΟ O LO CO O CO Γ- ΟΟ ι O CO CD O CO Γ- ΟΟ I Ot σ> CO O Γ- ι OT O ττ CNJ ot o CO O r- I CN IO O) O> CO τ- Ο Γ- ι Γ- CO O I CD CD CO O Γ- ι co CN CN CD CD CO δ N- CO CD CD OT CTl CO O N -381 LO ι O O CVJ I CO CO LO ι N- CN S co I LO CD O CD ι τ— CO CO LO N- ν- CO ι co CO 1 LO I Tf Tf CO ι CO CO I LO I CO ττ Tf σ> co ι CD CD CD CO TÍ- ττ CD 00 I CN Tf Tf CO Tf Tf CD CO ι CO ο IO CO Tf Tf Oi CO I σ> 00 CO Tf Tf CTi CO ι Tf Γ- O Τ— CO Tf CD CO i CO CO CVJ Γ- οο o r- i CD CNJ CO CO CO CNJ Γ- co o r- i o o CO CO CO CNJ Γ- ΟΟ O Γ- ι CO CO CN Γ- co O N- ο ο t CO CO CN γ- οο ο Γ- ι CN CO CO CN γ- οο O Γ- ι -500 IO Tf o CD o co CO o o ιο LO Tf o CD 1 CD CO CO I O O LO IO Tf O CD T— CO ι O O LO ι ιο Tf O CD I 00 Γ— O O O LO IO Tf O CD CO IO τ- O O LO I ιο Tf O CD -149 CO CO CTi CNJ CD ττ co CO I 00 CN O σ> Tf I CO CO ι CO CD σ> Tf ι CO co I co CO CD Tf CO CO ον CD CN OT Tf τ- ι CO CO ι O Tf" LO I I g LO LO I ι g CD LO I g N^ ιο ι ι < οο LO I <table>table see original document page 149</column></row><table> <table>table see original document page 150</column></row><table>
IO CO CD CD Is- LO CO CD CD CD O Is- -1036, -249 3156 -249 -1261 -249 CN Is- Γ -249 -1142 -249 4149 -249 -1489 -294 1026 -294 -1698 -294 -2039 -294 -1826 -294 ο ιο -294 -1021 -369 -1082 -369 1184 σ> CD CO ι -640 -369 -1263 -369 -1248 -369 1 -324 Is- τ~ -1820 r- τ- τ— -1051 h- -259 Is- τ- -144 Is- τ- -1692 f- -398 σ> IO CO -1950 σ> ιο CO CD Is- co ι CD lo CO -156 CD LO CO ο CD CD LO CO -1747 CD LO co 1819 CD CD -2106 CD CD -2070 CD CD IO CN CO I CD CD CD CO Γ"- CD CD -1618 CD CD Tf Ο) IO lo -1627 lo -1943 lo ττ -1102 LO Tf co CD CD io Tf -1423 io Tf -1418 cd co -2714 Tf CD co -2589 •Ί- Ο co ο σο CO ι ■SJ· CD CO -1183 Tf σ> cõ -2415 Tf σ> co is- lo is- CN -1668 lo Is- CN -2180 lo is- CN -869 LO is- CN CD CD io is- CN -1505 io is- CN -534 -720 -540 -720 CD ti- co -720 -1010 -720 -758 -720 -871 O cn γ- ι -314 -466 -657 -466 CD CN co -466 -1545 CD CD Tf ι -1647 -466 -1018 -466 1414 ο CN * -2354 ο CN * -2040 ο CN * -1212 O CN * 1047 ο CN -κ -1658 ο CN -1291 -626 « -984 -626 * CD CO O CO -626 * -1034 -626 * CD CD τ- ι ι -626 -κ -1224 -626 1527 CD O τ- -1378 co CD O -1378 -1853 CD o -1378 -1182 CD O -1378 co CN CD O -1378 LO CN ι CD o -1368 Ο) CD co ο Is- ι -2763 CD CD co -701 -2470 σ> CD CO τ- ο InJ- -744 CD σ> co -701 CO O cd cd co τ- ο |γ -2210 cd CD CO -1664 τ- ι» co -1115 3214 CO CO Γ -1115 -591 -381 -1115 -1732 -381 -1115 -1949 τ- co co I -1115 1181 -381 co o co -894 -2592 co tf -894 -2367 co ti- -894 -1265 co Tf -894 1061 co ti- -894 -1964 co Tf τ- is- LO ι co cõ cn -7087 -2805 co co cn -7087 -2637 co co cn -7087 -1270 co co cn -7087 2118 co co cn -7087! -2001 co co cn -1400 -500 -6045 -1421 -500 -6045 -805 -500 -6045 -444 -500 -6045 -1649 OOS- -6045 -1473 -500 -439 -149 co co -1902 -149 co co 1 -1016 -149 co co ι 2806 -149 co co 1 -196 ! -149 co co ι -1667 -149 65(R) ι LLT ccT cd ι (I)ZQ i < co cd ι ι 69(D) ι (A)OZ <table>table see original document page 151</column></row><table>
N- ZL CO N- Tf N- LO N- CD N- -1815 ' -249 -1261 -249 -1303 -249 |-1198 -249 -1284 -249 -1195' -2164 -294 -1698 -294 -1890 -294 Ν- τ- ι -294 !-2017 -294 -1773 -901 ! -369 1184 -369 -1377 -369 1443 -369 -1412 -369 -1274 οζ- Ν- -1051 Ν- CO CD T Ν- -1025 N- -295 N- -302 ! Ν- CM CD IO CO -1879 σ> IO co -409 σ> LO co -2002 CD LO CO -160 CD LO CO -256 -1180 CD CD -2070 CD CD IO CN CD CD 1-2161 CD CD -200 CD CD 1643 -789 LO Tt -1943 LO Tf O IO CO LO Tf -1813 IO Tf N- CO LO LO Tf N- CO IO -1176 Tf σ> CO -2589 Tf σ> CO CO CD CO ι Tf CD CO -2664 Tf CD CO -322 Tf CD CO -1309 οο Tf IO ι LO N- CNJ -2180 IO Ν. CN 2578 LO N- CN -2321 LO N- CN 1330 LO N- CN 1492 -1097 -720 CD Tt CO -720 -1004 -720 CO CD CD -720 -954 -720 -784 -1871 CD CO Ί- CD CN CO -466 -1761 -466 2042 -466 -1812 -466 -1611 * -974 ο τ~ CN * O Tf O CN ι ο CN # ; 1180 ο CN * -2184 ο CN * LO CD CO ο CN * LO CD N- * -1556 -626 # 3039 -626 * -1734 -626 # 1457 -626 •κ -1841 -626 1 * -1638 -1378 -962 CD O τ- οο N- co ι -1853 co ο -1378 Tf CD O -1378 ο CD N- I CD O -1378 LO CN CO ο -1378 CN N- τ- -701 2267 Ο) σ> co -701 -2470 CD σ> co ο Ν- ι N- CD O ι CD CD CO I -701 -2843 CT) CD CO χ- Ο N- I -964 CD CT) CO -701 I -1144 -1115 -1952 cõ CO ι -1115 -591 -381 -1115 -1979 ν— co CO -1115 -132 -381 -1115 -2082; -381 -1115 -1955 -894 -866 co Tt -894 -2367 CO Tf -894 σ> οο CO CO -894 -2464 co Tf -894 1543 CO Tf -894 1001 -7087 -885 CO CO CN N- OO O N- I -2637 CO co CN -7087 N- O CO CO CO CN -7087 -3000 CO co CNJ -7087 1193 CO CO CN -7087 ο Tf τ- -6045 -310 -500 IO Tt ο CD ι -805 -500 -6045 -1608 -500 -6045 I -806 -500 -6045 -1806 -500 -6045 -1625 CO CO ι 1432 -149 CO CO I -1016 -149 CO CO -504 -149 CO co ι -1081 CD Tt χ- ι CO CO ι co CO -149 CO CO -369 71 (G) Csf N- 73(Ν) ι 74 (L) I I 75(Ε) ι 1 co" N- <table>table see original document page 152</column></row><table> <table>table see original document page 153</column></row><table>
OJ co CO CO Tf CO LO co co co N- CO -984 σ> Tf CM ι LO CO CO I σ> Tf CM O CD N Oi Tf CM CM CO CD I Oi Tf CM co CM Cfi Oi Tf CM CO O CM ι Ol Tf CM ι -1590 Tf o> CM ι σ> Tf σ> Tf CD CM ι σ> CM co CM ι Tf CD CM ι LO ιο O CM ι Tf CD CM ι Tf O CO Tf CD CM ι CM Tf N- 1 ^ Ο) CM -963 Oi CD CO 1 CD N- LO CD CO CO ι N CM O CM ι CD CO CO ι co CO N- 1 CD co CO ι CD CD CM Oi CD CO ι O CM CM ι Oi CO CO cn CD ι N- V co Tf LO N- ν- CO N- CO N- Γ- ΙΟ N CO Ν- ΙΟ N- V- N- co CM r- ιο σ> LO CO CD O O σ> ιο CO CM CO IO ι CD IO CO IO CO CM CM CD IO CO •τ- ι Oi ιο CO Tf O CO I Oi LO CO CO IO ιο CD Oi Ν- CO τ- ι CD CD τ— CM O ι CD CD CO CO O τ- ι CO Oi N- CM Tf I CD Oi CO CM LO CD Ol Tf ^ Oi IO ττ LO TT οο LO Tf co CM IO Tf CO LO co LO Tf CM IO I IO Tf ιο CO ίο LO Tf -1194 Tf σ> CO σ> Tf σ> ι Tf σ> CO IO O Tf ι Tf Ο) CO N CO τ- ι Tf Oi co CD N- O CM ι Tf Oi CO CM Tf CO I Tf Oi CO OO ιο CO IO N- CM Tf LO CM ι LO N- CM O co ^ ιο N- CM CO O IO LO N- CM CO CO Tf ιο N- CM N- CM ιο N- CM -498 O CM N- I LO CO CM O CM N δ Ν- O CM N ι co CO Oi ι O CM N- O CO Tf O CM N- ι CO ιο N- O CM N- I -1352 CO CD Tf N- O CM co CO T ΙΟ LO Tf CNJ CD CO Ί- O CM Γ- ι co CO Ι- CO CO co CD CD Tf ι CO CD IO τ- ι CO CD Tf 1032 O CM * CO CM O ι O CM * Tf CO ο CM * Oi O CO ο CM « CM O CO I O CM * N- CM O CM * -1317 CO CN CO * O Ν- CO CM CD I * δ Tf CM ι CO CM CD ι * co O τ- ι co CM co * N- CD CM CO ι * CO IO IO CO CM CD ι * 5 CM CO O 00 Γ- ΟΟ I Tt- co ι CO O OO N- co ν- O CM ι CD O τ— CO N- CO ι CM IO CO I CO O ν- co N- CO I CO O CD O CO N- CO I CD LO CO O CO N- CO I -495 CD σ> co δ N- CO CM σι 1 CD CD CO τ- Ο Γγ CO CM Οί ι CJi CD CO τ- Ο Ν- Γ"» O ιο Oi Oi CO O N- 1 ιο N- CD Oi Oi CO O N- ι Tf co ι Oi Oi CO O N- I -1633 00 CO ι ιο I co CD co CO I LO Έ- τ- ι οο CM CO CM CO CO ι ΙΟ ι Oi O οο τ~ οο CO IO τ— ν— CO O LO ι δ CO ι ιο CM CO Oi ι ν- OO CO LO τ- ι Ν- IO co Tf Tf CD CO I τ— CO CO CO Tf Tf O CO CM Tf ν— CO Tf Tf Oi co CM CM CO I CO Tf Tf CD 00 N- ITl 1 CO Tf Tf Oi OO CM CM Oi CO Tf Tf Oi co I O CO CO CO CM N- co O Ν- I Tf CO co I CO CO CM N- co O Ν- Tf CD CD CM CO CO CM N- CO O N- ι CD LO CD CO CO CM N- 00 O N- I IO N- O CM ι CO CO CM N- co ο N- I Tf CO CO co CM N- co ο Ν- -1358 O O IO LO ττ O CD I CM CD Tf O O LO ΙΟ Tf O CO I CO CO CO CM ι O O LO ι LO Tf O CD ι O CO CM O O ιο I LO Tf O co ι LO Ύ O O LO I IO Tf O CO I N- Ν- ΙΟ O O LO I ΙΟ Tf O CO I co LO Ν- CD Tf CO CO I CD T CD I CO CO I Tf CM CO Oi Tf 1 CO CO Tf Oi CO Oi Tf CO co I co CD Tf ι CD Tf co CO O Tf ι Oi Tf I CO CO I 82 (K) I g CO CO 1 Q τΓ OO ι 2 LO OO I ι > CD CO ι I g N^ CO I I <table>table see original document page 154</column></row><table> <table>table see original document page 155</column></row><table>
σ> CO σ> f- σ> co CD CD O) O O Τ- -798 -249 -708 -249 -1362 -249 -1097 i- -249 -1529 -249 ω CO O I -1235 -294 -1493 -294 -1816 σ> CN ι -1752 ; -294 I -1746 -294 -1644 CO σ> -369 -1304 σ> CO co ι 2927 -369 -1102 -369 -1717! -369 -990 -339 r- -490 Γ-» CO CN co I r- CD CN ι I-- -1148 r- T- -116 -631 σ> ιο CO -394 σ> IO CO -1368 CD IO CO 1073 CD IO CO -1225 CD IO CO r«- CO -872 CO σ> co CO ι CO σ> -1920 CO CD CO CO CD 3432 CO CTI CN r-- -614 IO CN CO CN IO ■sr -1794 IO CO CD LO LO -156 LO σ> (j) LO 1767 σ> CO -1396 CD CO -2286 ■sr CD CO IO •sr CD CO -1873 O) CO -1211 -863 IO h- CN 2606 LO r» CN -1851 IO h- CN ο CO LO r-- CN -899 LO r-. CN CO CN <Ν CO CN O CN Γ- ι -940 -720 CN CN -720 -659 1 -720 -1326 -720 -554 -125 -466 -1666 -466 LO O T- -466 -1517 CO CO T -1867 -466 -1395 * -572 ο CN * ο CO CN ο CN -κ CO CO CO 1 210 •κ 1000 O CN * CD IO IO o CN * 1343 * 1794 -626 * -1642 -626 * 1107 -626 * -1491 -626 ! * -1944 -626 -K -1344 -1378 ct> CO CO I CO O -1378 1651 co ο -1378 -1727 CO ο -1378 r-- CO o co Γ-- CO I -446 CO O -1378 CD co -701 -1430 σ> CJ) co -701 •«!Τ CO O [ CD CD CO -701 -1965 CD CD CO -701 -999 ! O) ct> CO -701 -1632 CD CD CO τ- Ο Γ- ι LO o ι -1115 CO S I -381 -1115 -1262 τ— co CO -1115 -873 -381 -1115 -1778 -381 -1115 -2066 -381 -1115 -1666 -894 -906 CO ^ -894 ο CD CO CO -894 -2135 CO -894 r»- O CO CO -894 -903 CO -894 r-» CO σ> -7087 -1274 CO co CN -7087 CO CO CO co CN -7087 -2337 CO CO CN -7087 CO CO co CO CO CN -7087 -1431 CO CO CN -7087 o CO -6045 -522 -500 -6045 -1529 -500 -6045 -665 j -500 -6045 CO IO ι -500 -6045 -1614 -500 -6045 -1359 CO CO h» CN ι σ> t CO CO σ> r- "ΝΓ I -149 CO CO -700 -149 CO CO -161 CT) CO co I -1181 -149 CO CO ι CT> CO CO ι 95(1) ι ι 96(Ν) ι ι 97(V) 98(S) I 99(R) 100(K) <table>table see original document page 156</column></row><table> <table>table see original document page 157</column></row><table>
CD O ν- r- ο co ο CTI O O -1539 -249 -1539 -249 -1721 -249 1006 -249 CD CO LO ι -249 -2023 CD Tt CNJ ι -1898 Tt- σ> CNl ι CO CD co I -294 -2039 -294 :-1266 -294 -1898 -294 ; -2050 -294 -557 Gi CD CO ι -557 -369 ο TI- CO ι -369 co CO CD CD CO I Γ- ΙΟ IO ι -369 -1780 -369 3069 Γ- ν- ν- 3069 Γ— ν- τ~ -259 Γ- CD σ> I Γ- 3069 Γ- -1216 Γ— -285 CTl IO CO -285 CD IO co -156 σ> ιο CO -1742 Ο) IO CO -285 Ο) LO CO -1129 CD LO CO -1084 CD σ> -1084 CD σ> -1325 CD σ> -1846 CD σ> Tt CO O I CD σ> -1571 CD σ> -937 LO ττ -937 IO Tt -1102 LO ττ ,-1555 LO τΤ -937 LO Tt -1471 IO Tl- -1455 τΐ- CD CO -1455 τΤ cn CO -1380 394 -2485 TT σ> co -1455 Tt CD CO 3760 Tf σ> οο -843 LO r- CNJ -843 ιο Ι— CN -869 LO Γ- CN CO Tl- O CN ι IO Γ- CN -843 IO Γ— CN -1359 IO Γ- CNl -866 -720 CD CD CO 1 -720 -1010 -720 3350 -720 -866 -720 -1827 -720 -153 -466 -1353 -466 -1545 -466 1002 -466 OO ιο CO ι CD CD T -2268 -466 -950 ο CNJ « -950 ο CN * -1212 ο CN * -1841 ο CN * -950 O CN * οο CO τΤ ι ο CN * -862 -626 * -862 -626 ■κ -1034 -626 * 1740 -626 * -862 -626 ' * -2160 -626 « -1041 CD O -1378 -1041 CD O CO Γ- ΟΟ τ- ι -1182 CD O ν- -1378 -1515 CD O CO Γ- ΟΟ ι -1041 CD O τ- -1378 -1456 CD O -1378 -872 CT) σ> CO -701 -872 σ> σ> CO -701 -744 σ> σ> CO ο Γ- ι -2590 σ> CO -701 -872 Ο) CO -701 Tf ν- CO CD CD CO -701 -1571 -381 -1115 τ- Γ- ιο I -381 -1115 CN CO Γ- ι -381 -1115 IO Γ- ι -381 IO ι -1571 co CO I LO ν- ι -2187 ν- CO CO I -1115 -1112 CO -894 -1112 CO Ti- -894 -1265 co Tl- -894 -2179 co TI- -894 -1112 CO Ti- -894 -1451 CO Ti- -894 -1173 CO CO CNJ Ν co ο Γ- ι -1173 co CO CN -7087 ο Ι— CN ι 233 -7087 -2707 CO co CN -7087 -1173 co CO CN -7087 -1352 co CO CN -7087 -555 -500 -6045 -555 -500 LO τΤ O CD 1 -444 -500 -6045 -770 -500 -6045 -555 009- -6045 -1220 -500 -6045 CNJ LO -149 CO CO CNl LO σ> ττ ι CO co I 2806 -149 CO CO ι -967 -149 ! ι CO OO ι CN IO CD TT I co co ι -934 -149 CO CO ι (1)90 l· ι ι 107(Τ) ι 108 (A) ι 109(Μ) I ι 110(T) 111(Ρ) ι ι <table>table see original document page 158</column></row><table> <table>table see original document page 159</column></row><table>
N- CO CD O OJ τ- OJ CVJ OJ CVJ CD CO -249 O CO I -249 I-1684 -249 -1118 -249 -971 -249 -1327 -1816 -294 -1423 -294 -2078 -294 -1701 -294 IO CT Tf CT CM ι -1900 2927 -369 -1949 -369 -874 -369 -1208 -369 I O O τΤ -369 -1560 CO CVJ CO I N- -779 N- CD N- N- T— -226 ! N- -1112 N- -818 -1368 σ> LO CO -1762 σ> LO CO 2116 CD LO CO -194 CD LO CO -1910 CT IO CO -661 -1920 CD CJl -2066 CD Ct -989 CD CD υ» co τΐ- CD CT CT LO co ι CD CD -810 -1794 LO Tf -1766 IO -546 IO Tl- 1892 LO T -1557 LO -435 -2286 <3- σ> CO -2524 Tf CT CO -1112 CD CO -1278 Tf CT CO -2570 Ti- CD CO -1574 -1851 ιο N- CVJ -2123 IO N- Ol -428 LO N- OJ CO ιο co LO N- CM -2167 LO N- OJ 3456 ZZ O CVi N- I 2211 -720 -951 -720 -699 O CVl N- ι 3295 O CM N- I -1514 -105 -466 Ti- co -466 CO N- N- I -466 CO Tf CD ι -466 1813 -466 -2112 * -1863 ο OJ -κ -2072 ο CVl * -716 ο OJ * 1230 ο OJ * -1878 ο ν- CM * -499 -K 1107 CD OJ CD ι # 2067 -626 « -1551 CD CM CD 1 # -1575Í -626 * ο ο CO -626 * -1965 -1378 -1727 CD O -1378 -1636 CD O -1378 -774 CD O -1378 1852 CD O -13781 -1560 CD O -1378 -624 ο Γ- ι LO CD σ> ι σ> CT CO τ- Ο N- I -2619 CD σ> co ν- O N- I ο OJ CD Ο) Ct CO -701 -1155 CD CD CO -701 -2750 CD σ> CO -701 -1078 -1115 -873 -381 -1115 -347 -381 -1115 CD N- CO ι ν- co CO -1115 -1878 -381 -1115 CO ο -381 -1115 -1773 -894 -2135 CO Tl- -894 -2332 co TI- -894 -685 CO τΤ -894 V- CD τΐ- CO Ti- -894 -2262 CO ττ -894 -148 -7087 -2337 CO co OJ -7087 2869 CO CO OJ N- CO O N- ι -851 CO CO CM -7087 ν- CO co CO CVl -7087 -2799 co CO Ol N- 00 O N- ι IO -6045 -665 -500 -6045 -553 -500 -6045 -281 -500 -6045 -1577 -500 -6045 οο ι -500 -6045 -1349 CO co ι -700 -149 CO CO ι -825 CD τ!" I CO CO 1087 CD TT ν CO CO ι -303 -149 CO CO I -1179 -149 CO CO I -637 ι 117(V) I Ξ CO ι I 119{S) ι 120(Η) ι 121 (M) ι 122(Ν) <table>table see original document page 160</column></row><table> <table>table see original document page 161</column></row><table> Oi CM ο CO CO CM CO CO CO -880 -249 -1721 Oi Tf CM ι -593 -249 1237 -249 -1528 -249 -880 -249 -1279 -294 -2039 -294 -924 -294 -1728 -294 -1812 -294 1279 -294 CD CM -369 -640 -369 CO Ν- ιο CJÍ CO CO ι -1495 -369 -1620 -369 -126 -369 -1028 N -259 N 1122 N- -904 N -972 N- -1028 N -1444 σ> to CO -156 σι IO CO -898 CJi IO CO ; -855 Oi IO co -1004 CTi IO CO -1444 CO IO co -1425 CO Ο) -1325 CO Oi -1035 CO CTi Oi LO 1 CO CJi Oi CO LO CO CJi -1425 co CJi -1356 IO Tt -1102 IO Tf -726 LO Tf 3540 IO Tf- Tf N- ιο Tt -1356 LO Tf -2229 Tt Oi CO -1380 τ!· Oi CO -1866 TT CTi CO -1678 Tj- Oi CO -1750 Tf Oi CO -2229 Tt Oi CO Τ- Ο N I ιο N- CM -869 LO N CM -1122 ιο N CM I -427 LO N- CM -547 ιο N- CM -1701 ιο N CM 4141 -720 -1010 -720 1822 O CM N ι -1161 -720 -1251 -720 4141 -720 ο Ί— CD CD CD Tf ι -1545 -466 1350 -466 -1660 I -466 ! Oi IO co ι -466 ο S -466 -1390 O CM * -1212 ο CM « -895 ο CM # ο CO T- ο CM •κ 3103 ο CM « -1390 ο CM « CO N- CO -626 * -1034 -626 « CO CD CD -626 * -1721 -626 * -1873 -626 * CO r-» CO -626 * -1302 CO ο -1378 -1182 CO O -1378 -711 CD O -1378 Oi Tf I CD O -1378 -263 CD O -1378 -1302 co ο -1378 -2022 σ> Oi CO -701 -744 Oi Oi co -701 -1824 σι σι CO -701 -1336 CO Oi CO -701 ' -1521 CO CJi CO -701 -2022 σι CJi co -701 -276 -381 -1115 -1732 -381 -1115 -135 -381 LO -1672 -381 -1115 -2171 CO CO 1 -1115 -276 -381 -1115 -1844 CO Ti- -894 -1265 CO Ti- -894 -1175 co Ti- -894 -247 CO Tt -894 1 -442 CO Tt -894 -1844 CO ti- -894 -2125 co CO CM -7087 -1270 co CO CM -7087 -1730 co CO CM N- CO O N ι I -321 CO co CM -7087 -800 CO CO CM -7087 -2125 co 00 cm -7087 -982 -500 -6045 -444 -500 -6045 -454 -500 -6045 -1548 -500 -6045' CD CO CD ι -500 -6045 -982 -500 -6045 -965 -149 CO co ι 2806 σι τι- ι CO CO -415 -149 CO CO I CM CD CO ι CJi Tt ι CO co -1028 -149 CO CO ι -965 -149 CO CO ι 128(Μ) ι ι 129(Α) I 130(Μ) ι 131 (Q) ι ι 132(Κ) ι ι Έ CO CO τ- ι ι <table>table see original document page 162</column></row><table> <table>table see original document page 163</column></row><table> <table>table see original document page 164</column></row><table> <table>table see original document page 165</column></row><table>
LO Ί— CN LO τ- CO LO Tf LO LO ιο τ- CD IO -1327 -249 -2023 ■ -249 -1362 -249 -1334 -249 -1261 -249 -1721 -249 -1900 -294 -2050 -294 -1816 -294 -1946 -294 -1698 -294 -2039 -294 -1560 -369 -1780 -369 2927 -369 -1434 -369 1184 -369 -640 -369 -818 Γ"- -1216 ί- -823 r- -517 117 LO ο 1 r— -259 Γ— -661 CD IO CO -1129 Ο IO CO -1368 CD LO co LO t CD LO CO -1879 CD LO CO -156 CD LO CO -810 CD σ> -1571 CD CD -1920 CD CD CO LO CD CD -2070 CD CD -1325 CD CTi -435 LO TT -1471 LO Tt" -1794 LO 2726 LO ττ -1943 LO -1102 LO TT -1574 T)" G) CO ; 3760 Tt CTi CO -2286 Tf CT co -1382 ττ CD CO -2589 Tf CD CO -1380 Tt CT) CO 3456 LO Γ— CN -1359 LO Γ— CN -1851 IO h- CN 00 ο CN LO Γ- CN -2180 IO r- CN -869 LO Γ— CN ■ -1514 ! -720 -1827 -720 CN CN -720 -1012 -720 CD Ti- co -720 -1010 -720 -2112 -466 -2268 -466 -105 -466 -1764 -466 CD CN CO CD CD Tf I -1545 -466 CD σ> τΤ ι ο CN * -1488 ο CN * -1863 210 * r- CD Tf o CN * -2040 O CN * -1212 ο CN * -1985 -626 * -2160 -626 * 1107 -626 * -1774 -626 * 3039 -626 * -1034 -626 * 1 -624 CD O -1378 -1456 CD O -1378 -1727 CD O -1378 CN CN CD O -1378 -1853 CD O -1378 -1182 106 -1378 -1078 σ> σ> co -701 -1314 CD CD CO τ- Ο Γ- ι -1965 σ> σ> co O Γ- ι -1104 CD ct> co -701 -2470 CD σί co -701 -744 CD σ> CO τ- Ο Γ- ι -17731 τ- οο CO I ■-1115 -2187 -381 -1115 -873 τ— co CO -1115 -2047 -381 -1115 -591 -381 -1115 -1732 -381 -1115 -148 CO Tt- -894 -1451 CO Tt τ}· α> CO ι -2135 CO Ti- -894 1123 CO TI- -894 -2367 CO TT -894 -1265 CO ■^t -894 LO CO CO CN -7087 -1352 CO CO CN !-7087 -2337 co CO CN -7087 -447 CO CO CN -7087 -2637 CO CO CN -7087 -1270 co CO CN -7087 -1349 -500 , !-6045 -1220 O O ιο 1 -6045 -665 O O LO I LO Tf O CD ι -1780 -500 -6045 IO O CO I -500 LO Tf O CD ι -444 -500 -6045 -637 -149 CO CO I -934 -149 CO CO I -700 -149 CO co ι -552 -149 CO CO ι -1016 -149 CO co ι CD O 00 CM CD Tf r -33 151 (N) 1 152(Ρ) I 153(V) I 154(Q) ι ι 155(1) ι 156(Α) ι ι <table>table see original document page 166</column></row><table> <table>table see original document page 167</column></row><table> CO CD Tf CO LO CD τ- CD CD N CD co CD -1749 CD Tf CM ι -142 -249 -1529 -249 -2279 -249 CO O CO -249 -1306 σ> σ> ο CNJ 1 Tf CD CM ι 2084 ί -294 -1746 -294 -2198 -294 -260 -294 -1978 -829 -369 Oi CO ιο -369 -1717 -369 -1921 -369 1145 -369 -1244 CM r*- γ— -532 N -1148 N- τ— τ- !-1093 N τ~ -885 Ν- Τ- ! -261 CD Tf CD ιη co -1234 Oi IO CO -1225 CD LO CO -958 CD IO CO -1432 Ο) IO CO ο N co -1154 CO σι -1459 CO σ> 3432 CO σ> -1790 CD Ο) -1756 CD CD -351 -770 ιη Tt -1181 ιη Tf -156 ιη Tf -1590 IO Tf -1420 LO Tf CD CD CO -1165 Tf σ> CO -2094 Tf CD CO -1873 Tf CD CO -1775 Tf Oi CO -2303 Tf σι CO 1136 -559 IO r-- CM CD CO Ln ι LO [-» CM -899 LO Ν· CM :-1324 ιο N CM -1693 ιη N CM CO co CM -1003 -720 Tf CO CD -720 -1326 -720 -2081 -720 co ο CO -720 ι ! -907 σ> Ν N- I -466 1433 -466 -1867 -466 -2644 CD CO ^ LO j -466 CM CO N ι * -949 ο CM -χ -1510 ο CM * CD IO IO ο τ— CM * -1720 ο T— CM * 1-1781 ι ο CM « CO co τ— # -1456 -626 * 1806 -626 * -1944 -626 + -2502 -626 * CO CJi LO j -626 * -1678 -1378 -940 CO O τ- '-1378 1 -835 CD O τ- -1378 I -446 CD O -1378 -1562 CO ο -1378 -675 CD O -1378 co τ- Ο N- ι 1169 Ο Oi co -701 -2141 Ο) CD CO -701 CM CO CD ι Ο) CD co -701 3331 CD CD CO -701 -22461 Ο) CD CO -701 -895 -1115 -1869 -381 -1115 CM Tf CM τ- CO CO I LO ι -2066 τ— CO CO I -1115 -2460 -381 -1115 2900 -381 -1115 -1945 -894 τ- Ο σ> CO Tt -894 -1855 CO Tf -894 j -903 CO Tf -894 -1487 CO Tf -894 -2062 CO Tf -894 CD N IO -7087 -974 CO CO CM -7087 -2434 CO CO CM -7087 -1431 CO co CM -7087 !-1313 CO CO CM -7087 -24591 CO CO CM -7087 1586 -6045 co N CM ι -500 -6045 -435 -500 -6045 -1614 -500 -6045 -1103 -500 -6045 -760 -500 -6045! LO O Tt ι CO co ι 2297 -149 co CO ι -599 -149 CO CO I -1181 . -149 CO co -758 -149 CO CO ι -889 -149 CO CO Tf CM ι I 163(Α) ■ CD ι 165(R) ι 1 166(0) ι LU1 N^ CD ι I 168(D) <table>table see original document page 168</column></row><table> <table>table see original document page 169</column></row><table> <table>table see original document page 170</column></row><table>
ο CO CO τ- CM co τ- CO co CO IO CO -1721 -249 -1330 -249 -125 -249 -1327 -249 -1721 -249 -1201 -249 -2039 -294 ; !-1727 -294 -672 -294 -1900 -294 -2039 -294 -1466 -294 -640 -369 -1110 -369 CO O CO -369 -1560 σ> CD co ι -640 -369 1050 -369 -259 h- τ- -495 ν- ν -975 κ Τ- -818 N- CD LO CM ι N- CD O ι N- -156 ΟΪ LO CO -467 CD LO co -1736 Ο) IO CO -661 CD LO CO -156 CD LO CO -2119 Ο) IO CO -1325 CO σ) N O ν CO CD -1885 CO σ) ο CO I co CD -1325 CD CD -2225 CD CD -1102 LO CO CO I LO ■sr -1505 LO ■sr -435 LO -1102 LO -1919 LO •çf -1380 ^ σ> CO 2899 ■sr CD co -2452 CD CO -1574 CD CO -1380 CD CO -2743 CD CO -869 ιο h- OJ -444 LO N- CM -2020 275 3456 IO N- CM -869 275 -2424 LO N CM -1010 ο CM N ι -902 -720 2107 ο CM N- ι -1514 -720 -1010 ο CM N- ι N- CD -720 -1545 -466 -1586 CO co 1473 -466 -2112 -466 -1545 -466 1719 -466 -1212 ο CM * ZL O CM * -1966 ο CM # -499 ο Ol # -1212 ο CM * -2257 ο CM -1034: -626 * -1453 -626 * δ CO -626 # IO CO CD ι -626 * -1034 -626 * 2333 -626 -1182 CO O -1378 -432 co ο -1378 -1120 CO ο -1378 CM CO ι CO O -1378 -1182 CO O -1378 -1882 CD O -744 , σ> CD CO -701 -1102 Ο) CD co -701 -2617 Ο) CD CO -701 -1078 CD CD CO -701 -744 399 -701 -2929 CD CD CO -1732 -381 -1115 -1687 -381 -1115 2475 ν- CO CO ι 1-1115 ι !-1773 ι 1 -381 |-1115 -1732 τ— OO CO -1115 -159 -381 -1265 CO CD CO ι -377 CO ^ -894 -2263 co -894 CO ^ co -894 -1265 co -894 -2578 CO -1270 CO CO OJ -7087 ο ο co ι CO co CM -7087 -2811 CO CO CM -7087 IO ι CO co CM -7087 -1270 CO co Ol -7087 -3082 CO CO CM -444 1 -500 -6045 -1016 -500 -6045 -829 -500 -6045 -1349 -500 -6045 -444 O O LO I -6045 -842 -500 2806 ' -149 CO co ι -370 -149 CO CO -1055 -149 CO CO N- CO CO ι CD I CO CO ι 2806 -149 CO CO ι -1143 -149 18 O(A) ι ι 181(P) ι 182(F) 183(Ν) I ι < ■sa- co ι 185(1) <table>table see original document page 171</column></row><table> <table>table see original document page 172</column></row><table> <table>table see original document page 173</column></row><table>
N- CD CO σ> CD CD O O Csl O Csl CN O CN -2279 -249 -1362 -249 -1174 -249 -1539 -249 -1237 -249 -1692 -249 -2198 -294 -1816! ' -294 -1411 -294 -1898 -294 -1728 -294 -1855 -294 -1921 -369 2927 -369 CO o CD CD CO CO I -557 -369 -1495 -369 -770 -369 -1093 N- r· -823 N- -1140 N 3069 N -904 N- -927 N- -958 : CD IO CO -1368 CD IO CO -2142 CD LO CO -285 CD IO CO LO IO co CD LO CO Ta- co CD t CD IO CO -1790 (O CD -1920 CO CD CVJ CM I CO CD -1084 CO CD CD LO I CO CD -1922 CO CD -1590 IO -tf -1794 IO "tf 1887 LO "tf -937 LO O "tf LO CO LO "tf -1953 LO Ttf -1775 Ttf CD CO -2286 "tf CD CO -2745 "tf CD CO -1455 CD co -1678 CD CO -1831 "tf CD 00 -1324 LO h- CN -1851 IO N CN -2444 IO N- CN -843 IO N- CsI N- CN T IO N- CsJ -1745 LO N- CN -2081 -720 CN CN -720 1009 -720 -866 -720 CO -720 -1191 -720 -2644 j -466 -105 -466 ι 2016 -466 1353 -466 -1660 -466 -1540 CO CO τ -1720 o CN * -1863 O τ— CM * -2259 o r· CN * -950 o CM * o co τ— 210 * -2034 O CN « -2502, -626 1107 -626 * 1998 -626 * -862 -626 * Csl N- -626 * -987 -626 * -1562 CO O -1378 -1727 co o -1378 -1866 CO O -1378 -1041 CO o -1378 -419 CO o -1378 -1702 CO O Τ- -1378 3331 CD CD CO -701 ; i -1965 Cf) CD CO -701 -2954 CD CD CO o N- I : -872 CD Gi CO o N I -1336 CD CD CO o N- 1 -1253 Ο) CD CO -701 -2460 -381 -1115 -873 -381 -1115 "tf N- I -381 -1115 -1571 -381 -1115 -1672 CO CO ι -1115 LO CO CO I -381 -1115 -1487: CO -tf -894 -2135 CO "tf -894 -2586 CO TJ- -894 CN CO -ít- -894 -247 co -tf -894 -2362 co -tf -894 -1313 CO co CN -7087, -2337 CO CO CN -7087 -3098 CO co CN -7087 -1173 CO 00 CsJ -7087 -321 co CO CM -7087 -2368 CO CO CM -7087 CO o χ- ι -500 ' -6045 -665 -500 -6045 -902 -500 -6045 -555 -500 LO "tf o co -1548 -500 -6045 5196 -500 LO o co I -758 -149 CO CO I -700 -149 CO CO I CO CD τ- ι -149 CO CO 1 CN LO 1 -149 CO CO -862 -149 CO CO I -608 -149 CO CO 197(G) 1 198(V) I 199(L) I 1 200(T) I 201 (Q) I I 202(C) I <table>table see original document page 174</column></row><table> <table>table see original document page 175</column></row><table> <table>table see original document page 176</column></row><table> <table>table see original document page 177</column></row><table> <table>table see original document page 178</column></row><table> <table>table see original document page 179</column></row><table> <table>table see original document page 180</column></row><table> <table>table see original document page 181</column></row><table> <table>table see original document page 182</column></row><table> <table>table see original document page 183</column></row><table> <table>table see original document page 184</column></row><table> <table>table see original document page 185</column></row><table> <table>table see original document page 186</column></row><table> <table>table see original document page 187</column></row><table> <table>table see original document page 188</column></row><table> <table>table see original document page 189</column></row><table> <table>table see original document page 190</column></row><table> <table>table see original document page 191</column></row><table> <table>table see original document page 192</column></row><table> <table>table see original document page 193</column></row><table> <table>table see original document page 194</column></row><table> <table>table see original document page 195</column></row><table> <table>table see original document page 196</column></row><table> <table>table see original document page 197</column></row><table> <table>table see original document page 198</column></row><table> <table>table see original document page 199</column></row><table> <table>table see original document page 200</column></row><table> <table>table see original document page 201</column></row><table> <table>table see original document page 202</column></row><table> <table>table see original document page 203</column></row><table> <table>table see original document page 204</column></row><table> <table>table see original document page 205</column></row><table> <table>table see original document page 206</column></row><table> <table>table see original document page 207</column></row><table> <table>table see original document page 208</column></row><table> <table>table see original document page 209</column></row><table> <table>table see original document page 210</column></row><table> <table>table see original document page 211</column></row><table>
CO N- CO Oi O CN CM -1721 -249 -1721 -249 -969 -249 -1721 -249 -1305 -249 -1237 -2039 CTi CsJ -2039; -294 1406 -294 -2039 -294 -1558 -294 -1728 -640 -369 -640 ' -369 540 -369 ο CO I -369 1488 -369 -1495 -259 N- -259 Ν- -408 N- r· -259 Ν- Τ- -990 Ν- Τ- -904 -156 σ> IO CO -156 Oi IO CO -538 CD ΙΟ CO -156 Ο) IO CO -2088 Ο) LO CO -855 -1325 CO CD -1325 CO CD 2485 CO Oi -1325 CD Ο) -2296 CD Oi Oi ιο ι -1102 IO -1102 IO ■sr co CD to -1102 LO τΤ -1971 IO 3540 -1380 394 -1380 ■sr Oi co -1549 CD CO -1380 ^ CD CO -2727 Oi CO -1678 -869 IO Ν- CNJ -869 IO N- CN -418 275 -869 ιο N- CvJ -2405 ιο N- CN N- CN 7 -1010 -720 -1010 -720 -340 -720 -1010 -720 N- O CO -720 -1161 -1545 -466 -1545 -466 ι -894 -466 -1545 -466 1504 -466 -1660 * -1212 ο Csl * -1212 ο CN * CO CD CO ο CN * -1212 ο CN * -2317 ο CsJ * ο CO * CO ο ι -626 * -1034; 1 -626 * -634 -626 * -1034 -626 * 2322 -626 ■κ -1721 -1378 (Ν CO ι CD O -1378 -1182 CD O -1378 -109 CO O -1378 -1182 CD O -1378 -1918 CO O co N- CO ι -419 -701 -744 CD CD CO -701 •sj- Ν- I Oi Oi CO -701 -1374 399 -701 -744 Oi Oi CO -701 CD Oi co CN ι Oi CD CO -701 -1336 -1115 -1732 CO co I -1115 -1732 -381 -1115 -1251 -381 LO ι -1732 -381 -1115 CD Oi CN ι -381 -1115 -1672 -894 -1265 CO ·*· ■sr σ> CO -1265 CO ^r -894 -360 CO -894 -1265 CO -894 -2580 CO ^r -894 -247 -7087 -1270 CO co CN -7087 -1270 CO CO CN -7087 -965 CO CO CN -7087 -1270 CO CO CN -7087 -3101 CO CO CN -7087 -321 -6045 -444 -500 -6045 -444 -500 -6045 -1022 ! -500 -6045 -444 -500 LO •«ί- ο CD ι -725 -500 -6045 -1548 co CO 2806 -149 CO CO ι 2806 -149 CO co -426 Oi ^ τ- ι co CO ι 2806 -149 CO CO -1039 -149 co co -862 416(Α) 417(Α) ι ι 418(R) ι 419(Α) ι I 420(1) ι 421 (Q) <table>table see original document page 212</column></row><table> <table>table see original document page 213</column></row><table> <table>table see original document page 214</column></row><table> <table>table see original document page 215</column></row><table>
σ> CO Tf O Tf Tj- Tf Tf CM Tf Tf CO Tf Tf Tf Tf CNl N ι σ> Tf CM ι CD CD CM ι Οί Tf CM CD OO LO ι CD Tf CM ι CD Tf CD Tf CM N- CD CD τ- ι CD CM ι CO σ> CO I σ> CO ο CM I Tf (J) CM Tj- CD CD Tf σ> ^ CO σ> CO ι Tf CD CM ι ττ· O UO Tf σ) CM ι Tf Tf O CM ι Tf CD CM ι O CD UO I O ^J- CD ι σ> (Ο CO O O O σ> CD CO ι Ν- ΙΟ IO ι σο CD CO ι CO Tf CM ι cn CD CO CO CO CD CD OO ι UO τ- Ο I CD ΙΩ CN ι N- co O ν— N- CD CD O CO N CM CD CD ι N- O σ> N N Tf CM I CO IO "Γ- σ> ιο CO CD UO cn LO CO LO CO CM ι Ο) UO CO N- N- ι σ> UO co CO CD CD CD UO CO CD CM LO ΙΟ CM CO CD CD τ— IO CD σ> Tf 00 O ι CD σ> οο CD ι CD CD UO Tf O I CD σ> CD ■ CM O τ- LO Tf CO ιο CO LO Tf N- CO CD ι UO Tf οο CM Tf UO Tf 00 CD I u> Tf N co CO Ο οο CO I Tf CD co Tf τ- TJ- Tf CD οο uo UO Tf I Tf CD CO UO CM ι Tf CD CO CO I Tf σ) CO CD CO CM ι cn CO co LO N CM CO CO co LO N CM CO Tf CO UO N- CM UO O UO I LO N- CM N- N- Tf LO N- CM CM τ- Ο ο O I O CM N- I CM CD CM O CM N- ι CD CD οο O CM N- N- CO O CM N- CD O CD ι O CM N ι UO CD ι UO Tf IO ι CD CD CD co N- CD CD t CO IO CO CD CD T CO O CD CD ■γ CM CM N- CD CD Tf ι ιο OO Tf ι * CM CM ι O CM CM CO CD ι O CM * O IO σ> ι O CM * co UO CD O CM * CD CD N- I O CM •κ co CO * TÍ- CO O ι CD CM CD * Tf N- CD CM CD * CM CD OO CD CM CD ι * Tf CM CM CD CM uP * Tf N- Tf ι CD CM CD « Tf UO OO J -1378 CM CO ι CD O CO N- CO I σ> LO CD CD O CO N- CO ι •5· O ι CD O CO N- CO I UO CM CD O οο N οο τ- ι CM CO ι CD O CO N co I N- N co CM -701 Tf N- σ> CD CO O Ν- ^ co CO CD CD CO O N- ι CM N CO ι CD Ο) co O Ν- O CM CM CD CD CO O N ι UO CM N CD CD CO O N I N CM O ι -1115 CM CO N ι co CO 1 ιο I Tf UO ι 00 CO ι LO ι N LO 1 CO CO I ιο I CO CO CO 1 IO ι N CO ( CO CO I UO τ— O CM Tf ι -894 LO CD CM ι CO Ti- Tj- CD 00 I CD CD OO Tf Tf σ> co ι CM ι CO Tf Tf CD CO Tf CD CW CO Tf Tf CD OO ι N CO N ι CO Tf Tf σο CO I uo ο Ν CO ο Ν I O N CM τ- ι co CO CM N 00 O Ν- N- Tf Tf CO OO CM Ν- αό ο N- ι CO N ι CO CO CM N- CO O N- I O O CM co CO CM N CO O N ι CD UO CD ι co CO CM N co O N I UO O CM -6045 ττ ττ Tf O O LO ιο TT O CD CD CM O O LO I UO Tf O CD ι UO UO UO I O O LO I UO Tf O CD I CO N Tf τ— O O UO ι UO Tf O CD ι O Tf CM ι O O UO I UO Tf O CD I N CM CO OO ι CD O co CM σ> Tf I CO CO I Tf CM CM CD Tf CO CO CM LO σο Tf I CO CO I N CD CD ι σ> Tf OO CO ι UO CM CM σ> Tf CO co ^ CM ι ι g σ> CO Tf I I < O Tf Tf P Tf I P Tf Tf < co Tf Tf X Tf Tf Tf <table>table see original document page 216</column></row><table> <table>table see original document page 217</column></row><table> <table>table see original document page 218</column></row><table> <table>table see original document page 219</column></row><table>
CNJ CD Pf co CD ρτ PT CD Pf LO CD Pf CD CD Pf N- CD Pf N Pf CO σ> pf CM ι CO LO LO σ> Pf CM IO CO O I σ> Pf CM 1 CO CM O I σ> Pf CM I CD CO ι σ> ^ CM CM CM Pf CO CD σ> τ- ι pf σ> CM ι ιο IO co CM Ρί- ο CM IO co CM I Pf Ο) CM ι O 00 CM ν- I Pf σ> CM ι ρΙ- 00 I Pf CD CM ι Pf Oi CD CO CD Pf ι Oi co CO I CD co N- I σ> CD co I CO CD CD CD CO co CD co CD CD CO I CM O CNI ι CD CD CO ι CD CO LO ι LO ν pf ι N CD Γ- ΙΟ I ν. LO CD O 1 N- ιο Cp N- τ— LO IO LO N CD N N- ι Pf ιο CO σ> ιο CO O IO co I σ> ιο CO O CD CTl I CD LO CO Τ- ω N- I CD LO CO CD CO ι CD LO CO Pf CO 00 I CO pf CO Oi Ρί- ο CD CD CD N CD O CNJ I CD CD CO co co ν- I CD σ> CO CO co CD N N CM CO CD CM CN LO Pf co CO co ιο Pf N n I LO Pf Oi co IO ι LO Pf O S LO Pf Pf CM LO CM ti- co ι PT σ> co n- O CO Pf σ> CO CD CD CM I Pf CD CO CD σ> Pf CM I Pf CD co CD Oi ι Pf O CO N co CD τ- ι ν ν CM LO N- CM n- Pf PT ιο n- CM CNj CM CO CM I LO N- CM n- O CM ι IO n- CNI CM CM Pf LO N CNl CD co co ι CO CO O O CM N- I O ιο CO I O CM N- CO co CM O CM N- co CM CO O CM n- I CD CO ν- O CM N ι CM CD CJi 1 co CO CD CD t CD Pf ^ CD CO t CD co N CO CO Ρί- Pf OO CD CD CD ■γ Τ- Ο CO co CD Pf ι Oi Oi CD I- ι « OÍ pf tí- O CN « CO co O CNj ■κ LO N- CM ο τ- CM * Pf CO co O CM « CM O CM O CM -κ IO LO N * pi- co co CO CM CD ι * O co CM I co CM CD ■κ CNI O LO co CM CO I * ο CD CO CM CO « CM O co ι CD CN CD ι « <3- Pf CO τ- ι -1378 IO ρί- CO O co N CO I N- CO CD O CO ν- CO I LO CO CD τ— CD O ν- CO N- co O Pf LO I CO O co n- CO CO CO CO O CO n CO χ- ι Pf CN Τ- τ- Ο ν ι ο CO O I CD Οί co O N I OJ CO CD CD co O n- CO LO CO CNl ι Oi CD CO O N- I CD O CO CM ι CD CD CO O N ι CO O O Oi CD CO δ N ι ΙΟ CO ν- -1115 ν- OÍ ο CM CO CO LO τ- ι N 00 co CM cõ CO IO CD CD CO CO IO I CNl Cp τ— οο CO ι LO τ- ι N- N- CO CO CO I LO ι Pf CM CO CM ! -894 CM O ν CO Pi- pf CD CO ι T— LO CNJ CO Pi- Pt σ> co 00 CO Pf cv CO Pf Pf CD co I CD ν— CNI CM CO Pf Pf CD CO ι CM LO CD co Pf Pf Oi CO CO CO CO 1 ν co ο ν I ιο co CO CM ν CO O ν N O IO co co CM N- CO O Γ- ι CM ρι- ο CO CO co CNJ n- CO O ν- CD Pf n- CM CO CO CM N- 00 ο N- I 00 LO CD co CO CM N CO O ν- Pf CO ν- ι ί-6045 ο CO co O O LO LO Pf O CD 1 CO ν- CM I O O ιο 1 LO ρτ O CD ι LO n- co O O IO I ΙΟ Pf O CD ι Pf IO N- I ο ο IO LO Pf O CD ι CD co LO τ— O O LO ι ΙΟ Pf O CO CD N N ι CO CO ι CO ο IO ι CD Pf τ— co CO I ιο CO IO I Oi pf ν- 1 CO CO I LO Pf ι CD Pf 1 CO CO Pf CO Ο) I Oi Pf I co CO ι CM CM CD Pf CO co I ν- ΙΟ Oi ι ι σ cí CD Pf I uj co co 1 I ξ Pf CD Pf I I LO CD Pf ι ι 2 S' CO Pf ι I g ν' CD Pf <table>table see original document page 220</column></row><table> <table>table see original document page 221</column></row><table>
CO N Tf Tt N Tf LO N τί· CO N- Tt N- N- ■sf CO N Tf -1771 -249 -1560 -249 -1506 ! -249 -1238 -249 -1721 -249 -897 -249 CO CD CNJ ι -294 -1948 TJ- CTi CNJ ι -1910 ! -294 -1682 -294 -2039 -294 -1284 Tt CD CN ι co CN O CN ι -369 2407 -369 I 2675 -369 -1276 -369 -640 -369 ο CO -369 -834 N- -913 N ■«ί CO CO I N -406 N- -259 N τ- -1384 N -525 σ> IO CO -2061 σ> LO CO -1950 CD IO CO Tf CN ■ςτ ι Ο) LO CO -156 CD LD co -1992 CD IO CO -964 CD σ> -2444 CD CD -2330 CD σ> 1152 co CT3 LO CN CO I CD CD -1835 CD CD N ιο Tj- -2193 ID Tj- -2086 IO TJ- ο CD 00 LO Tt -1102 ID -1724 LO Tf -1383 Tj- CD CO CD co N CN ι Tj- CD CO -2716 Tf CD CO -1428 CD CO -1380 Tf CD CO -2539 Tf Ο) CO σ> IO Tf ιο N CNJ -2416 IO N CN -2308 ιο N- CNJ CO LO ι LO N CN -869 IO N CN -2168 IO N CN -1727 -720 LO CO -720 ο Tj- CO : -720 -774 -720 ο δ ι -720 CN Tf N -720 -2443 CD CD Tj- N Tf CN -466 CD CNJ CN -466 -1562 -466 -1545 -466 2607 -466 CO ID CN ι O CN * -23861 σ CN * -2256 ο CN * CO CO CN CN ο CN * -1212 ο CN * -1867 ο CN * ID N Tj- CN CD CNJ CD ι # 2385 CD CN CD ι * 1944 -626 * -1602 -626 * -1034 -626 * οο CO Tf -626 * -169 CD O -1378 -2142; CD O -1378 -2045 CO O -1378 CN LO CD O CO N- CO ι -1182 co ο -1378 CO O CO τ- ι CD O -1378 -913 σ> CD CO -701 -2843 Ο) σ> CO ο N- j -2731 CD CD CO -701 CD ι CD CD CO -701 -744 CD CD CO -701 -2453 CD Ο) CO -701 -2641 -381 -1115 τ- ID N 1 ν 00 CO I -1115 -743 ; -381 -1115 -1991 -381 -1115 -1732 -381 -1115 CD CN ι -381 -1115 1455 CO Tf -894 -2621 CO ! -894 -2505 CO Tt -894 CO CO CO Tf -894 -1265 CO Tf -894 -2295 CO Tt Tf CD CO ι 2801 CO CO CN -7087 -3067 co CO CNJ -7087 -2944 CO CO CNJ -7087 -395 CO CO CN -7087 -1270 CO CO CN -7087 -2542 co CO CN -7087 -2412 -500 -6045 CD O CD -500 -6045 -604 -500 -6045 -1536 -500 -6045 -444 -500 LD Tf O CO I -1199 -500 -6045 -792 -149 CO CO -924 -149 CO co ι -886 -149 CO CO ι CD -149 CO CO ι 2806 CD Tf ι CO CO -1369 -149 CO co ι 473(D) 474(V) ι ι 475(V) ι 476(Κ) ι 477(A) I 478(L) 1 <table>table see original document page 222</column></row><table> <table>table see original document page 223</column></row><table> <table>table see original document page 224</column></row><table> <table>table see original document page 225</column></row><table> <table>table see original document page 226</column></row><table> <table>table see original document page 227</column></row><table> <table>table see original document page 228</column></row><table> <table>table see original document page 229</column></row><table> <table>table see original document page 230</column></row><table> <table>table see original document page 231</column></row><table> <table>table see original document page 232</column></row><table> <table>table see original document page 233</column></row><table> <table>table see original document page 234</column></row><table> <table>table see original document page 235</column></row><table> <table>table see original document page 236</column></row><table> <table>table see original document page 237</column></row><table> <table>table see original document page 238</column></row><table> <table>table see original document page 239</column></row><table> <table>table see original document page 240</column></row><table> <table>table see original document page 241</column></row><table> <table>table see original document page 242</column></row><table> <table>table see original document page 243</column></row><table> <table>table see original document page 244</column></row><table> <table>table see original document page 245</column></row><table> <table>table see original document page 246</column></row><table> <table>table see original document page 247</column></row><table> <table>table see original document page 248</column></row><table> <table>table see original document page 249</column></row><table> <table>table see original document page 250</column></row><table> <table>table see original document page 251</column></row><table> <table>table see original document page 252</column></row><table> <table>table see original document page 253</column></row><table> <table>table see original document page 254</column></row><table> <table>table see original document page 255</column></row><table> <table>table see original document page 256</column></row><table> <table>table see original document page 257</column></row><table> <table>table see original document page 258</column></row><table> <table>table see original document page 259</column></row><table> <table>table see original document page 260</column></row><table> <table>table see original document page 261</column></row><table> <table>table see original document page 262</column></row><table> <table>table see original document page 263</column></row><table> <table>table see original document page 264</column></row><table> <table>table see original document page 265</column></row><table> <table>table see original document page 266</column></row><table> <table>table see original document page 267</column></row><table> <table>table see original document page 268</column></row><table> <table>table see original document page 269</column></row><table> <table>table see original document page 270</column></row><table> <table>table see original document page 271</column></row><table> <table>table see original document page 272</column></row><table> <table>table see original document page 273</column></row><table> <table>table see original document page 274</column></row><table> <table>table see original document page 275</column></row><table> <table>table see original document page 276</column></row><table> <table>table see original document page 277</column></row><table> <table>table see original document page 278</column></row><table> <table>table see original document page 279</column></row><table> <table>table see original document page 280</column></row><table> <table>table see original document page 281</column></row><table> <table>table see original document page 282</column></row><table> <table>table see original document page 283</column></row><table> <table>table see original document page 284</column></row><table> <table>table see original document page 285</column></row><table> <table>table see original document page 286</column></row><table> <table>table see original document page 287</column></row><table> <table>table see original document page 288</column></row><table> <table>table see original document page 289</column></row><table> <table>table see original document page 290</column></row><table> <table>table see original document page 291</column></row><table> <table>table see original document page 292</column></row><table> <table>table see original document page 293</column></row><table> <table>table see original document page 294</column></row><table> <table>table see original document page 295</column></row><table> <table>table see original document page 296</column></row><table> <table>table see original document page 297</column></row><table>
CD O N- O οο ο τ- σ> ο O -249 CO σ> Μ- ίτο r σ> M CM ι Μ" CO σ> Μ" CM M- CN I CD Μ" CN ι CD CD N- CO ι σ> M- CN ι CD LO 00 CO I σ> M- CN ι -294 CD N- CO ι M- CD CN ι CO CO N- M- CD CN CD CO IO CN ι M- CD CNJ N- CO IO CO ι M- CD CM ι CD M- CO CO I M- CD CN ι -369 CO M O t CD CO CO ι Γ- CO ιο σ> CD οο ι CO CD CO CN ι Ο) CD CO CO O CO T σ> CD οο ι ιο CM N- CN ι CD CD CO ι N- CO CO O OO 1 Γ— M- CD O CO Ν- τ— τ— CO CN ι N- M- CO ιο co ι N- CO CO 1 N- cd ιο CO CD CO CN ι Ο) ιο CO CD CO CD LO CO οο CD CN ι CD LO CO O CD CD CO ι Oi LO CO O CO CD χ- ι OT IO CO CD cd CO CD CN CO ι CD cd CN τ- N- eo ι CD CD CD CN IO CN CD cd Μ" 00 Μ" CD CD cõ M- CO I CD Ο) IO Μ" N- CD CO CN ι LO Μ" CD O CN CO 1 LO Μ" CN CO Μ" CN LO M- CO CO CNJ IO M- CN CD CO CO I LO M- Μ" CD co CO CO M- CO M- CD CO M- CD O t Μ" cd CO CD CN CN CM M- σ> CO Μ" CD N- OO M- Ο) OO N- M- co CNJ I Μ" CD CO LO Γ- CN CO σ> CN Μ- LO Γ- CM CO CD Μ" CO ιο N- CN O Ν- N- I ιο Γ- CN CD CM CN CO IO N- CN M- N- CM LO Γ- CN -720 : M- O M- O CN Γ- t LO N- Μ- ι O CN Γ- ι Γ- ΙΟ Γ- ι O CM Γ- ι IO CD N- OO ι O CN N- co CM CN CO O CN Γ- ι -466 CO CD LO t CD CD T Γ- Γ- CD CD Μ- ι S IO CN ι CD CD Μ- ι CO M- CN CD CD M- CD M- co CO CD CD M ι o CNJ * cd LO O CO ι O CM # CM CN Μ- ι O CM * CO CO CO O CM * IO CO M- O CN * M- CO CD CO I O CN * -626 * N- CO CD T CD CN CD * 00 O O CD CM CD * CO CM N- CN CD CM CD ι * CO co LO t CD CN CD ι * CO N- M- CO ι CD CN CD ι * co o co I— CO I I-I co CN CD O CO N- CO N- O LO I CD O CO Γ- CO ι CD N- LO CD O CO r- CO ν- Μ" Μ" LO CM CD O CO Γ- CO τ- ι ο> M- CN CO ι CD O τ- CO Γ- ΟΟ τ- O) OT CO •τ- Ο N- CD IO co CN 1 CD CD CO O Γ- I Ν- O CO T CD cd CO O Γ- ι Γ- CN CN ι CD CD CO V O Ν- CO CD M- CO ι CD Ο) CO γ- Ο Ν- M- CM ι Ο) CD CO Ο Γ- ι CO CO I to τ- ι Ι— CD CO co ι CO CO LO M- M- O Μ" CO CO ι LO 00 CO I CO CO ι ΙΟ τ— N- CD CO Μ- ι οο CO ι ΙΟ ι N- CO CO co CO ι IO I CO M- M- cd CO CD Γ- CO CNJ I CO M- M- CD CO 1 LO CD M- ^r CO M- M- σ> co O σ> co CO Μ" M Ο) CO I M- N- CO CO ι CO M M- CD CO r γ- ΟΟ CD CO I co Μ" M οο I CO CO CNJ M- CO M- CO 1 M- LO O CM CO CO CM M- CO M- CO ι IO σ> ιο CO co CN M- CO M- co N- CO ο ι CO CO CN M- CO M- co ι O CO cd co ι CO CO CN M- 00 Μ" CO CD co CO CO I co CO CN M- co M- OO I -500 : CM Μ" M- Ιγ Γ- CN CO O O LO CN M- M- Γ- ι LO CD CN O O IO i CN M- Μ" γ- CO CD CM O O IO ι CM M- M N- Ο) M CO ι O O LO I CN Μ" M- N- CN Γ- ΟΟ I O O ιο I CN M M- N- I -149 CM Oi Μ" N- CN ι cd Μ- CN ι CN Ν- CO ι CD M- CN CD O M- CD Μ- ι CN ι CNJ γ- ιο CO I CD M- τ- I CM N- CN LO CO Ο) M- CN ι Z CD O ι 1 £ r- O g CO O ι g σΓ ο I < O I <table>table see original document page 298</column></row><table> <table>table see original document page 299</column></row><table> <table>table see original document page 300</column></row><table>
CO CN τ- Tf CM LO CN CO CN τ- 127 00 CM τ— -2750 -249 -2465 ι ! -249 4786 -249 -3493 -249 -3578 -249 -2682 -3669i ττ σ> CvJ 1 -2484 Tf σ> CN ι -835 -294 -3716 -294 -3770 -294 -2791 -3060 -369 -100 σ> co CO ι -3631 -369 -4043 -369 -2226 -369 -1600 -1748! Γ·*» V- -2374 I-- -4069 r-» ν— -3038 N- CO Tf O 1 117 -3364 -1421 σ> LO CO -3718 ι Oi ιο CO -3928 Gi UO CO -2819 Gi LO CO 1226 σ) LO CO -4264 -1928 CO σ> -3785 CO CD -3853 CO Gi -3263 CO Gi -3008 CO Oi -3993 -725 IO Tf -3310 ιο Tf !-3602 uo Tf -2867 LO Tf -2728 IO Tf -3767 -2294 Tf σ> CO -4007 -t Gi CO -4179 Tf σ> CO -3433 Tf σ> CO -2256 Tf CD CO -4191 -430 LO h- CN -4133 uo r·- CN -3501 LO f- CN 4298 LO r- CN -2048 LO h- CN -4472 2732 -720 2522 -720 -3045 -720 -4104 -720 -2679 -720 -381 co r- TI- CO ι -466 1320 -466 -3007 -466 -4563 -466 -3557 CO CO Tf 1 3212 * -1178 ο τ— CN * -4059 ο CN * r-» τ- CM ο CM -Ic -3059 ο CM * -3083 O τ- ΟΜ * CO ο co * -3559 -626 * 3063 -626 * -3554 -626 « -4637 -626 * -3260 -626 * -947 -1378 -1079 CO O -1378 -3404 CO O -1378 -1522 CO O -1378 -2871 CO ο -1378 -2756 CO ο -1378 CO ιο CO CO ι -701 -1819 σ> σ) co -701 -4477 Gi Gi CO -701 -3952 Oi Gi CO -701 -2856 Gi Oi co -701 -1484 Gi Oi CO : -701 -4203 -1115 -3701 -381 -1115 ! -906 -381 -1115 ■ -162 -381 -1115 -3897 CO CO I -1115 -3530 co CO I -1115 -1407 I -894 ι 3073 CO Tf Tf σ> co ι -4316 CO Tf -894 Is- Tf T CO Tf -894 -2376 CO Tf -894 -3125 co Tf -894 -4628 -8484 1680 CO co CN Tf CO Tt CO 1 -4861 CO CO CM -8484 -4202 CO CO CM -8484 -2054 CO CO CM -8484 -2991 CO co CN |-8484 -4716 -7442 -3437 ο ο ιο I -7442 -2009 -500 -7442 ο ο CO co ι -500 -7442 -3127 -500 -7442 -1216 -500 !-7442 !-2888 CN ι ο ο -149 CN ι -2462 -149 CN ι -4022 ! -149 ι CM τ- ι -2749 σ> Tf I CM ι 3159 -149 CM ι -3371 1 123(Ε) I 124(1) I 125(Υ) ι I 126(Ν) I < CM ι I 128(L) <table>table see original document page 301</column></row><table> <table>table see original document page 302</column></row><table> <table>table see original document page 303</column></row><table>
ο CM Μ- CO Μ- M- Μ- LO ■sr -3069 -249 -2528 -249 -3578 -249 -2339 -249 -3124 -249 -2682 -249 -3648 -294 !-2920 ' -294 -3770 -294 -3100 -294 -4133 -294 -2791 -294 -2621 -369 00 Oi LO -369 -2226 -369 -2485 -369 -3592 -369 -1600 -369 -1572 Ν- τ- I 1116 Ν- -1046 N- -1320 N- !-2163 N- τ- Μ- CO CO CO I N- -1331 α» IO CO -2453 Oi LO CO 1226 Oi LO CO -1122 CJi LO CO -1723 Oi IO CO -4264 Oi LO CO -2446 CD Oi -3224 CD οι -3008 CD σ> -1226 CD Oi -2526 CD Oi -3993 CO OÍ Ν- ■sr I IO M- -3083 LO -2728 ιο M- I -452 IO Μ" -1008 LO M- -3787 LO "tf -2422 Μ" Oi CO -3390 -tf Oi CO -2256 M- Oi CO -2118 Μ- Oi CO -2480 M Oi CO -4191 M- Oi co -1101 IO N- CNI -3089 ιο N- CM -2048 IO N- CM -427 ιο N- CM -528 LO N- CM -4472 ^ LO N- CN -2733 -720 ! -741 ' -720 -2679 j -720 -2094 -720 -3364 -720 -381 -720 -3465 -466 -885 -466 -3557 CD CD Μ" ι -2909 -466 LO 00 01 CO I -466 3212 i -466 -1907! ο CM * -3226 ο CN * CO CO O CO γ O CM * 1206 ο CM * -1633 ο ·<- CM * -4306 o CM -3268 -626 * 3393 ! -626 * -3260 ι -626 * -2947 CD CN CD ι * -4125 -626 « -947 -626 ■ -1738 CO O -1378 -2999 CO O -1378 ,-2756 CD O -1378 -838 CD O ν— -1378 -1325 CD O -1378 -3653 CD O -1815 Oi Oi CO i -701 1 -3145 Oi Oi CO -701 -1484 Oi Oi CO -701 -1756 Oi Oi co I -701 -1924 Oi Ο) CO -701 -4203 Oi oí CO -3547 -381 -1115 ο 00 i •τ- ω co ι -1115 -3530 -381 -1115 Μ" N- CO ι -381 -1115 -4159 τ— co co i -1115 ,-1407 -381 -918 co "tf -894 -3522 CO "tf -894 -3125 CO M- I -894 CO co co "tf -894 3228 CO M- -894 -4628 co -«tf ; 1557 co co CN -8484 -3802 CO CO CM -8484 -2991 CO CO CM -8484 3038 CO CO cm -8484 2020 CO co CN M- co "tf co I ,-4716: co co CM -2169 -500 -7442 -1435 -500 -7442 -1216 ί -500 -7442 -2776 -500 CM M M N- ι -3966 -500 -7442 -2888 -500 3050 I -149 CN τ— -1583 -149 CM ι 3159 -149 CM ι IO co N- -149 CM ι -2080 Oi M- τ- ι CN ι -3371 σι "tf τ- ι < ο 1 141(1) ι I 142(Α) ι I 143(0) ι I 144(Ε) I I 145(L) <table>table see original document page 304</column></row><table> <table>table see original document page 305</column></row><table> <table>table see original document page 306</column></row><table>
N- LO CO IO O) ιο O CD δ CN CO 1145 -249 ;-2056 -249 -2033 -249 -3980 -249 -3576 -249 -3859 -249 I 4425 j -294 -2494 -294 -2537 NT o> CN I -4008 -294 -3768 -294 -3849 -294 σ> to σ> CN ι -369 -2416 -369 -2097 -369 -4409 -369 -2226 -369 -2725 -369 -3795 Ν- -1775 N x- -1113 N- -3391 N- -1045 N τ- -1813 N -364 σι IO CO -3037 CD IO CO -1082 σ> LO CO -3106 σ> LO CO 1291 Gi IO CO -1630 Gi IO co -3773 CO cn -3480 CD σ> 2967 CD σ> -3224 CO Gi -3005 CD σ> -3481 CD CD -3209 IO ^ -3221 IO Nf -188 ιο Nf -2477 LO Tf -2723 LO Nf -3362 IO Nf -4228 Nf cn CO -3684 Nf σ> CO -2116 Nf CD CO -3462 Nf Gi CO -2255 NT σ> CO -2847 Nf Gi CO -3117 ιο N- CNJ -3460 ιο N CN -687 275 -2114 IO N- CN -2046 LO N- CN -2714 LO CN -2197 -720 -351 -720 -1604 -720 N- Nf CN T i -720 -2677 -720 -3228 -720 -2135 -466 -448 -466 -2416 -466 -4652 -466 co IO LO CO I -466 j-3846 í ! -466 ; -4325 210 « T- Ν- ΙΟ CO I o CN * IO Nf o CN * -2809 o cj * -3078 o CN * -3634 o CN -2763 -626 * 2106 -626 * -2472 CO CN CD ι # -4813 -626 * -3260 -626 * -3478 -626 * -778 CO o CO N- CO -2928 CO O CO N- CO I -604 106 -1378 -2635 CD O -1378 -2753 CO o |-1378 -3249 CD O -1378 ,-4316 σ> σ> CO -701 -3829 CD O) CO Τ- Ο N- I -1951 CD Gi CO -701 -2947 Gi Gi CO -701 -1483 Gi Gi CO -701 -2114 G) Gi CO -701 3780 -381 -1115 2418 CO CO I -1115 -2835 ν- CO co I -1115 -4534 -381 -1115 -3529 -381 J ,-1115 -3817 χ- 00 CO I -1115 -4764 CO NT -894 -3810 CO Nf -894 1128 CO Nf -894 3826 CO -894 !-3120 I co Nf Nf G> co I -3637 CO -894 ο CNJ IO Nf I CO co CN -8484 -4284 CO CO CN -8484 -863 CO CO CNj -8484 -1446 CO co CN -8484 -2990 co CO CN -8484 -3386 I CO co CN -8484 -3011 -500 -7442 -1421 -500 -7442 -2333 -500 -7442 !-3764 -500 -7442 -1216 -500 -7442 -1872 OOS- -7442 -3904 CT> Nf t— CN I -1811 -149 CN I IO CO N- -149 CN I -3263 -149 CN I 3142 -149 CN I 3527 -149 CN τ- ι 157(W) 1 158(F) I 159(R) I 160{E) 161 (A) I I 162 (A) I <table>table see original document page 307</column></row><table> <table>table see original document page 308</column></row><table> <table>table see original document page 309</column></row><table>
ιο h> -249 CM CO CM c^ σ> Tf CM -294 O CM O CO Tf σ> CM -369 ; CO CO CO CM σ> CO co ι h» CO h» r-- σ> LO CO Tf Tf σ> Ο) IO CO CO σ> co CO CM co σ> IO Tf σ> σ> CO LO τΐ- Tf σ> CO σ> CO ο CM 1 Tf σ> co LO h- OJ O CO CO CM ιο h- OJ -720 O οο σ> O CM Γγ -466 IO CM OO CM ι co CO T ο OJ * co CO CO I O τ— CM « -626 * Tj- CO co CM 1 CO CM CO * co ο co ι-» CO Tj- σ> h- I CO O co Ι-» CO 1 σ> Ο) CO Τ- Ο hp CO co <ο I σ> CD CO δ Ν- CO CO I LO V τ- I LO h- O CO co CO I ΙΟ CO Ti- Tf σ> co ι co h- I CO Tf Tf Ο) co ι co CO Ol Tf 00 τί- οο I co CO CM CM CO CO OJ Tf CO Tf co -500 CM Tf Tf [-- I CO CO LO CM ι ο ο IO ι CM Tf Tf r-» I -149 CM ι IO LO CO σ> Tf CM ι I Z LO J*- Listagem de Seqüências
<110> E.X. du Pont de Nemours arid Co.
<120> Produção fermentativa de álcoois de quatro carbonos
<130> CL3893 PCT
<160> 275
<170> PatentIn versão 3.4
<210> 1
<211> 780
<212> DNA
<213> KlebsieTTa pneumoniae
<400> 1
atgaatcatt ctgctgaatg cacctgcgaa gagagtctat gcgaaaccct gcgggcgttt 60 tccgcgcagc atcccgagag cgtgctctat cagacatcgc tcatgagcgc cctgctgagc 120 ggggtttacg aaggcagcac caccatcgcg gacctgctga aacacggcga tttcggcctc 180 ggcaccttta atgagctgga cggggagctg atcgccttca gcagtcaggt ctatcagctg 240 cgcgccgacg gcagcgcgcg caaagcccag ccggagcaga aaacgccgtt cgcggtgatg 300 acctggttcc agccgcagta ccggaaaacc tttgaccatc cggtgagccg ccagcagctg 360 cacgaggtga tcgaccagca aatcccctct gacaacctgt tctgcgccct gcgcatcgac 420 ggccatttcc gccatgccca tacccgcacc gtgccgcgcc agacgccgcc gtaccgggcg 480 atgaccgacg tcctcgacga tcagccggtg ttccgcttta accagcgcga aggggtgctg 540 gtcggcttcc ggaccccgca gcatatgcag gggatcaacg tcgccgggta tcacgagcac 600 tttattaccg atgaccgcaa aggcggcggt cacctgctgg attaccagct cgaccatggg 660 gtgctgacct tcggcgaaat tcacaagctg atgatcgacc tgcccgccga cagcgcgttc 720 ctgcaggcta atctgcatcc cgataatctc gatgccgcca tccgttccgt agaaagttaa 780
<210> 2
<211> 259
<212> PRT
<213> KTebsieTla pneumoniae
<400> 2
Met Asn His Ser Ala Glu Cys Thr Cys Glu Glu Ser Leu Cys Glu Thr 1 5 10 15 Leu Arg Ala Phe Ser Ala Gln His Pro Glu Ser Val Leu Tyr Gln Thr 20 25 30
Ser Leu Met Ser Ala Leu Leu Ser Gly Val Tyr Glu Gly Ser Thr Thr 35 40 45
Ile Ala Asp Leu Leu Lys His Gly Asp Phe Gly Leu Gly Thr Phe Asn 50 55 60
Glu Leu Asp Gly Glu Leu Ile Ala Phe Ser Ser Gln Val Tyr Gln Leu 65 70 75 80
Arg Ala Asp Gly Ser Ala Arg Lys Ala Gln Pro Glu Gln Lys Thr Pro 85 90 95
Phe Ala Val Met Thr Trp Phe Gln Pro Gln Tyr Arg Lys Thr Phe Asp 100 105 110
His Pro Val Ser Arg Gln Gln Leu His Glu Val Ile Asp Gln Gln Ile 115 120 125
Pro Ser Asp Asn Leu Phe Cys Ala Leu Arg Ile Asp Gly His Phe Arg 130 135 140
His Ala His Thr Arg Thr Val Pro Arg Gln Thr Pro Pro Tyr Arg Ala 145 150 155 160
Met Thr Asp Val Leu Asp Asp Gln Pro Val Phe Arg Phe Asn Gln Arg 165 170 175
Glu Gly Val Leu Val Gly Phe Arg Thr Pro Gln His Met Gln Gly Ile 180 185 190
Asn Val Ala Gly Tyr His Glu His Phe Ile Thr Asp Asp Arg Lys Gly 195 200 205
Gly Gly His Leu Leu Asp Tyr Gln Leu Asp His Gly Val Leu Thr Phe 210 215 220
Gly Glu Ile His Lys Leu Met Ile Asp Leu Pro Ala Asp Ser Ala Phe 225 230 235 240
Leu Gln Ala Asn Leu His Pro Asp Asn Leu Asp Ala Ala Ile Arg Ser 245 250 255
Val Glu Ser <210> 3
<211> 1680
<212> DNA
<213> KlebsieTTa pneumoniae
<400> 3
atggacaaac agtatccggt acgccagtgg gcgcacggcg ccgatctcgt cgtcagtcag 60 ctggaagctc agggagtacg ccaggtgttc ggcatccccg gcgccaaaat tgacaaggtc 120 ttcgactcac tgctggattc ctcgattcgc attattccgg tacgccacga agccaacgcc 180 gcgtttatgg ccgccgccgt cggacgcatt accggcaaag cgggcgtggc gctggtcacc 240 tccggtccgg gctgttccaa cctgatcacc ggcatggcca ccgcgaacag cgaaggcgac 300 ccggtggtgg ccctgggcgg cgcggtaaaa cgcgccgata aagcgaagca ggtccaccag 360 agtatggata cggtggcgat gttcagcccg gtcaccaaat acgccgtcga ggtgacggcg 420 ccggatgcgc tggcggaagt ggtctccaac gccttccgcg ccgccgagca gggccggccg 480 ggcagcgcgt tcgttagcct gccgcaggat gtggtcgatg gcccggtcag cggcaaagtg 540 ctgccggcca gcggggcccc gcagatgggc gccgcgccgg atgatgccat cgaccaggtg 600 gcgaagctta tcgcccaggc gaagaacccg atcttcctgc tcggcctgat ggccagccag 660 ccggaaaaca gcaaggcgct gcgccgtttg ctggagacca gccatattcc agtcaccagc 720 acctatcagg ccgccggagc ggtgaatcag gataacttct ctcgcttcgc cggccgggtt 780 gggctgttta acaaccaggc cggggaccgt ctgctgcagc tcgccgacct ggtgatctgc 840 atcggctaca gcccggtgga atacgaaccg gcgatgtgga acagcggcaa cgcgacgctg 900 gtgcacatcg acgtgctgcc cgcctatgaa gagcgcaact acaccccgga tgtcgagctg 960 gtgggcgata tcgccggcac tctcaacaag ctggcgcaaa atatcgatca tcggctggtg 1020 ctctccccgc aggcggcgga gatcctccgc gaccgccagc accagcgcga gctgctggac 1080 cgccgcggcg cgcagctgaa ccagtttgcc ctgcatccgc tgcgcatcgt tcgcgccatg 1140 caggacatcg tcaacagcga cgtcacgttg accgtggaca tgggcagctt ccatatctgg 1200 attgcccgct acctgtacag cttccgcgcc cgtcaggtga tgatctccaa cggccagcag 1260 accatgggcg tcgccctgcc ctgggctatc ggcgcctggc tggtcaatcc tgagcgaaaa 1320 gtggtctccg tctccggcga cggcggcttc ctgcagtcga gcatggagct ggagaccgcc 1380 gtccgcctga aagccaacgt actgcacctg atctgggtcg ataacggcta caacatggtg 1440 gccattcagg aagagaaaaa ataccagcgc ctgtccggcg tcgagttcgg gccgatggat 1500 tttaaagcct atgccgaatc cttcggcgcg aaagggtttg ccgtggaaag cgccgaggcg 1560 ctggagccga ccctgcacgc ggcgatggac gtcgacggcc cggcggtggt ggccattccg 1620 gtggattatc gcgataaccc gctgctgatg ggccagctgc atctgagtca gattctgtaa 1680
<210> 4 <211> 559 <212> PRT
<21Β> KTebsieTTa pneumoniae <400> 4
Met Asp Lys Gln Tyr Pro Val Arg Gln Trp Ala His Gly Ala Asp Leu 1 5 10 15
Val Val Ser Gln Leu Glu Ala Gln Gly Val Arg Gln Val Phe Gly Ile 20 25 BO
Pro Gly Ala Lys Ile Asp Lys Val Phe Asp Ser Leu Leu Asp Ser Ser 35 40 45
Ile Arg Ile Ile Pro Val Arg His Glu Ala Asn Ala Ala Phe Met Ala 50 55 60
Ala Ala Val Gly Arg Ile Thr Gly Lys Ala Gly Val Ala Leu Val Thr 65 70 75 80
Ser Gly Pro Gly Cys Ser Asn Leu Ile Thr Gly Met Ala Thr Ala Asn 85 90 95
Ser Glu Gly Asp Pro Val Val Ala Leu Gly Gly Ala Val Lys Arg Ala 100 105 110
Asp Lys Ala Lys Gln Val His Gln Ser Met Asp Thr Val Ala Met Phe 115 120 125
Ser Pro Val Thr Lys Tyr Ala Val Glu Val Thr Ala Pro Asp Ala Leu 130 135 140
Ala Glu Val Val Ser Asn Ala Phe Arg Ala Ala Glu Gln Gly Arg Pro 145 150 155 160
Gly Ser Ala Phe Val Ser Leu Pro Gln Asp Val Val Asp Gly Pro Val 165 170 175
Ser Gly Lys Val Leu Pro Ala Ser Gly Ala Pro Gln Met Gly Ala Ala 180 185 190
Pro Asp Asp Ala Ile Asp Gln Val Ala Lys Leu Ile Ala Gln Ala Lys 195 200 205 Asn Pro Ile Phe Leu Leu Gly Leu Met Ala Ser Cln Pro Glu Asn Ser 210 215 220
Lys Ala Leu Arg Arg Leu Leu Glu Thr Ser His Ile Pro Val Thr Ser 225 230 235 240
Thr Tyr Gln Ala Ala Gly Ala Val Asn Gln Asp Asn Phe Ser Arg Phe 245 250 255
Ala Gly Arg Val Gly Leu Phe Asn Asn Gln Ala Gly Asp Arg Leu Leu 260 265 270
Gln Leu Ala Asp Leu Val Ile Cys Ile Gly Tyr Ser Pro Val Glu Tyr 275 280 285
Glu Pro Ala Met Trp Asn Ser Gly Asn Ala Thr Leu Val His Ile Asp 290 295 300
Val Leu Pro Ala Tyr Glu Glu Arg Asn Tyr Thr Pro Asp Val Glu Leu 305 310 315 320
Val Gly Asp Ile Ala Gly Thr Leu Asn Lys Leu Ala Gln Asn Ile Asp 325 330 335
His Arg Leu Val Leu Ser Pro Gln Ala Ala Glu Ile Leu Arg Asp Arg 340 345 350
Gln His Gln Arg Glu Leu Leu Asp Arg Arg Gly Ala Gln Leu Asn Gln 355 360 365
Phe Ala Leu His Pro Leu Arg Ile Val Arg Ala Met Gln Asp Ile Val 370 375 380
Asn Ser Asp Val Thr Leu Thr Val Asp Met Gly Ser Phe His Ile Trp 385 390 395 400
Ile Ala Arg Tyr Leu Tyr Ser Phe Arg Ala Arg Gln Val Met Ile Ser 405 410 415
Asn Gly Gln Gln Thr Met Gly Val Ala Leu Pro Trp Ala Ile Gly Ala 420 425 430
Trp Leu Val Asn Pro Glu Arg Lys Val Val Ser Val Ser Gly Asp Gly 435 440 445 Gly Phe Leu Gln Ser Ser Met Glu Leu Glu Thr Ala Val Arg Leu Lys
Ala Asn Val Leu His Leu Ile Trp Val Asp Asn Gly Tyr Asn Met Val
Ala Ile Gln Glu Glu Lys Lys Tyr Gln Arg Leu Ser Gly Val Glu Phe
Gly Pro Met Asp Phe Lys Ala Tyr Ala Glu Ser Phe Gly Ala Lys Gly
Phe Ala Val Glu Ser Ala Glu Ala Leu Glu Pro Thr Leu His Ala Ala
Met Asp Val Asp Gly Pro Ala Val Val Ala Ile Pro Val Asp Tyr Arg
Asp Asn Pro Leu Leu Met Gly Gln Leu His Leu Ser Gln Ile Leu
<210> 5 <211> 771 <212> DNA
<213> KTebsieTla pneumoniae
<400> 5
atgaaaaaag tcgcacttgt taccggcgcc ggccagggga ttggtaaagc tatcgccctt 60
cgtctggtga aggatggatt tgccgtggcc attgccgatt ataacgacgc caccgccaaa 120
gcggtcgcct cggaaatcaa ccaggccggc ggacacgccg tggcggtgaa agtggatgtc 180
tccgaccgcg atcaggtatt tgccgccgtt gaacaggcgc gcaaaacgct gggcggcttc 240
gacgtcatcg tcaataacgc cggtgtggca ccgtctacgc cgatcgagtc cattaccccg 300
gagattgtcg acaaagtcta caacatcaac gtcaaagggg tgatctgggg tattcaggcg 360
gcggtcgagg cctttaagaa agaggggcac ggcgggaaaa tcatcaacgc ctgttcccag 420
gccggccacg tcggcaaccc ggagctggcg gtgtatagct ccagtaaatt cgcggtacgc 480
ggcttaaccc agaccgccgc tcgcgacctc gcgccgctgg gcatcacggt caacggctac 540
tgcccgggga ttgtcaaaac gccaatgtgg gccgaaattg accgccaggt gtccgaagcc 600
gccggtaaac cgctgggcta cggtaccgcc gagttcgcca aacgcatcac tctcggtcgt 660
ctgtccgagc cggaagatgt cgccgcctgc gtctcctatc ttgccagccc ggattctgat 720
tacatgaccg gtcagtcgtt gctgatcgac ggcgggatgg tatttaacta a 771 <210> 6 <211> 256 <212> PRT
<213> Klebsiella pneumoniae <400> 6
Met Lys Lys Val Ala Leu Val Thr Gly Ala Gly Gln Gly Ile Gly Lys 1 5 10 15
Ala Ile Ala Leu Arg Leu Val Lys Asp Gly Phe Ala Val Ala Ile Ala 20 25 30
Asp Tyr Asn Asp Ala Thr Ala Lys Ala Val Ala Ser Glu Ile Asn Gln 35 40 45
Ala Gly Gly His Ala Val Ala Val Lys Val Asp Val Ser Asp Arg Asp 50 55 60
Gln Val Phe Ala Ala Val Glu Gln Ala Arg Lys Thr Leu Gly Gly Phe 65 70 75 80
Asp Val Ile Val Asn Asn Ala Gly Val Ala Pro Ser Thr Pro Ile Glu 85 90 95
Ser Ile Thr Pro Glu Ile Val Asp Lys Val Tyr Asn Ile Asn Val Lys 100 105 110
Gly Val Ile Trp Gly Ile Gln Ala Ala Val Glu Ala Phe Lys Lys Glu 115 120 125
Gly His Gly Gly Lys Ile Ile Asn Ala Cys Ser Gln Ala Gly His Val 130 135 140
Gly Asn Pro Glu Leu Ala Val Tyr Ser Ser Ser Lys Phe Ala Val Arg 145 150 155 160
Gly Leu Thr Gln Thr Ala Ala Arg Asp Leu Ala Pro Leu Gly Ile Thr 165 170 175
Val Asn Gly Tyr Cys Pro Gly Ile Val Lys Thr Pro Met Trp Ala Glu 180 185 190
Ile Asp Arg Gln Val Ser Glu Ala Ala Gly Lys Pro Leu Gly Tyr Gly 195 200 205
Thr Ala Glu Phe Ala Lys Arg Ile Thr Leu Gly Arg Leu Ser Glu Pro 210 215 220 Clu Asp Val Ala Ala Cys Val Ser Tyr Leu Ala Ser Pro Asp Ser Asp 225 230 235 240
Tyr Met Thr Gly Gln Ser Leu Leu Ile Asp Gly Gly Met Val Phe Asn 245 250 255
<210> 7 <211> 1665 <212> DNA
<213> KTebsielTa oxytoca <400> 7
atgagatcga aaagatttga agcactggcg aaacgccctg tgaatcagga cggcttcgtt 60 aaggagtgga tcgaagaagg ctttatcgcg atggaaagcc cgaacgaccc aaaaccgtcg 120 attaaaatcg ttaacggcgc ggtgaccgag ctggacggga aaccggtaag cgattttgac 180 ctgatcgacc actttatcgc ccgctacggt atcaacctga accgcgccga agaagtgatg 240 gcgatggatt cggtcaagct ggccaacatg ctgtgcgatc cgaacgttaa acgcagcgaa 300 atcgtcccgc tgaccaccgc gatgacgccg gcgaaaattg tcgaagtggt ttcgcatatg 360 aacgtcgtcg agatgatgat ggcgatgcag aaaatgcgcg cccgccgcac cccgtcccag 420 caggcgcacg tcaccaacgt caaagataac ccggtacaga ttgccgccga cgccgccgaa 480 ggggcatggc gcggatttga cgaacaggaa accaccgttg cggtagcgcg ctatgcgccg 540 ttcaacgcca tcgcgctgct ggtgggctcg caggtaggcc gtccgggcgt gctgacgcag 600 tgctcgctgg aagaagccac cgagctgaag ctcggcatgc tgggccacac ctgctacgcc 660 gaaaccatct ccgtctacgg caccgagccg gtctttaccg acggcgacga cacgccgtgg 720 tcgaagggct tcctcgcctc gtcctacgcc tctcgcgggc tgaaaatgcg ctttacctcc 780 ggctccggct cggaagtgca gatgggctac gccgaaggca aatccatgct ttatctggaa 840 gcgcgctgca tctacatcac caaagccgcg ggcgtacagg gtctgcaaaa cggttccgta 900 agctgcatcg gcgtgccgtc tgcggtgcct tccggcattc gcgcggtgct ggcggaaaac 960 ctgatctgtt cgtcgctgga tctggagtgc gcctccagca acgaccagac cttcacccac 1020 tccgatatgc gtcgtaccgc gcgcctgctg atgcagttcc tgccgggcac cgactttatc 1080 tcctccggtt attccgcggt gccgaactac gacaacatgt tcgccggctc caacgaagat 1140 gccgaagact ttgacgacta caacgtcatc cagcgcgacc tgaaggtgga cggcggtttg 1200 cgtccggttc gcgaagagga cgtcatcgcc atccgtaaca aagccgcccg cgcgctgcag 1260 gccgtgtttg ccggaatggg gctgccgccg attaccgatg aagaagttga agccgcgacc 1320 tacgcccacg gttcgaaaga tatgccggag cgcaacatcg tcgaagacat caagttcgcc 1380 caggaaatca tcaataaaaa ccgcaacggt ctggaagtgg tgaaagcgct ggcgcagggc 1440 ggattcaccg acgtggccca ggacatgctc aacatccaga aagctaagct gaccggggac 1500 tacctgcata cctccgcgat tatcgtcggc gacgggcagg tgctgtcagc cgtcaacgac 1560 gtcaacgact atgccggtcc ggcaacgggc tatcgcctgc agggcgaacg ctgggaagag 1620 attaaaaaca tccctggcgc tcttgatccc aacgagattg attaa 1665
<210> 8 <211> 554 <212> PRT
<213> KTebsieTTa oxytoca <400> 8
Met Arg Ser Lys Arg Phe Clu Ala Leu Ala Lys Arg Pro Val Asn Gln 1 5 10 15
Asp Cly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Ala Val 35 40 45
Thr Glu Leu Asp Gly Lys Pro Val Ser Asp Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Asn Arg Ala Glu Glu Val Met 65 70 75 80
Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Lys Arg Ser Glu Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ala 115 120 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val 130 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Gly Ala Trp Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala 165 170 175 Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Cly Ser Cln Val 180 185 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Gly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320
Leu Ile Cys Ser Ser Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Cln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala 405 410 415 Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile
Asn Lys Asn Arg Asn Gly Leu Glu Val Val Lys Ala Leu Ala Gln Gly
Gly Phe Thr Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Gly Asp Gly
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala
Thr Gly Tyr Arg Leu Gln Gly Glu Arg Trp Glu Glu Ile Lys Asn Ile
Pro Gly Ala Leu Asp Pro Asn Glu Ile Asp
<210> 9 <211> 675 <212> DNA
<213> KlebsieTTa oxytoca
<400> 9
atggaaatta atgaaaaatt gctgcgccag ataattgaag acgtgctcag cgagatgaag 60
ggcagcgata aaccggtctc gtttaatgcg ccggcggcct ccgcggcgcc ccaggccacg 120
ccgcccgccg gcgacggctt cctgacggaa gtgggcgaag cgcgtcaggg aacccagcag 180
gacgaagtga ttatcgccgt cggcccggct ttcggcctgg cgcagaccgt caatatcgtc 240
ggcatcccgc ataagagcat tttgcgcgaa gtcattgccg gtattgaaga agaaggcatt 300
aaggcgcgcg tgattcgctg ctttaaatcc tccgacgtgg ccttcgtcgc cgttgaaggt 360
aatcgcctga gcggctccgg catctctatc ggcatccagt cgaaaggcac cacggtgatc 420
caccagcagg ggctgccgcc gctctctaac ctggagctgt tcccgcaggc gccgctgctg 480
accctggaaa cctatcgcca gatcggcaaa aacgccgccc gctatgcgaa acgcgaatcg 540 ccgcagccgg tcccgacgct gaatgaccag atggcgcggc cgaagtacca ggcgaaatcg 600 gccattttgc acattaaaga gaccaagtac gtggtgacgg gcaaaaaccc gcaggaactg 660 cgcgtggcgc tttga 675
<210> 10 <211> 224 <212> PRT
<213> KTebsieTTa oxytoca <400> 10
Met Glu Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Asp Val Leu 1 5 10 15
Ser Glu Met Lys Gly Ser Asp Lys Pro Val Ser Phe Asn Ala Pro Ala 20 2 5 30
Ala Ser Ala Ala Pro Gln Ala Thr Pro Pro Ala Gly Asp Gly Phe Leu 35 40 45
Thr Glu Val Gly Glu Ala Arg Gln Gly Thr Gln Gln Asp Glu Val Ile 50 55 60
Ile Ala Val Gly Pro Ala Phe Gly Leu Ala Gln Thr Val Asn Ile Val 65 70 75 80
Gly Ile Pro His Lys Ser Ile Leu Arg Glu Val Ile Ala Gly Ile Glu 85 90 95
Glu Glu Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp 100 105 110
Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Gly Ser Gly Ile 115 120 125
Ser Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly 130 135 140
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu 145 150 155 160
Thr Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala 165 170 175
Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala 180 185 190 Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr 195 200 205
Lys Tyr VaT Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu 210 215 220
<210> 11
<211> 522
<212> DNA
<213> KTebsieTTa oxytoca
<400> 11
atgaataccg acgcaattga atcgatggta cgcgacgtat tgagccgcat gaacagcctg 60 cagggcgagg cgcctgcggc ggctccggcg gctggcggcg cgtcccgtag cgccagggtc 120 agcgactacc cgctggcgaa caagcacccg gaatgggtga aaaccgccac caataaaacg 180 ctggacgact ttacgctgga aaacgtgctg agcaataaag tcaccgccca ggatatgcgt 240 attaccccgg aaaccctgcg cttacaggct tctattgcca aagacgcggg ccgcgaccgg 300 ctggcgatga acttcgagcg cgccgccgag ctgaccgcgg taccggacga tcgcattctt 360 gaaatctaca acgccctccg cccctatcgc tcgacgaaag aggagctgct ggcgatcgcc 420 gacgatctcg aaagccgcta tcaggcgaag atttgcgccg ctttcgttcg cgaagcggcc 480 acgctgtacg tcgagcgtaa aaaactcaaa ggcgacgatt aa 522
<210> 12 <211> 173 <212> PRT
<213> KTebsieTTa oxytoca <400> 12
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Arg 1 5 10 15
Met Asn Ser Leu Gln Gly Glu Ala Pro Ala Ala Ala Pro Ala Ala Gly 20 25 30
Gly Ala Ser Arg Ser Ala Arg Val Ser Asp Tyr Pro Leu Ala Asn Lys 35 40 45
His Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe 50 55 60
Thr Leu Glu Asn Val Leu Ser Asn Lys Val Thr Ala Gln Asp Met Arg 65 70 75 80 Ile Thr Pro Clu Thr Leu Arg Leu Gln Ala Ser Ile Ala Lys Asp Ala
Cly Arg Asp Arg Leu Ala Met Asn Phe Clu Arg Ala Ala Glu Leu Thr
Ala Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro
Tyr Arg Ser Thr Lys Glu Glu Leu Leu Ala Ile Ala Asp Asp Leu Glu
Ser Arg Tyr Cln Ala Lys Ile Cys Ala Ala Phe Val Arg Glu Ala Ala
Thr Leu Tyr Val Glu Arg Lys Lys Leu Lys Gly Asp Asp
<210> 13 <211> 1041 <212> DNA
<213> Rhodococcus ruber <400> 13
atgaaagccc tccagtacac cgagatcggc tccgagccgg tcgtcgtcga cgtccccacc 60
ccggcgcccg ggccgggtga gatcctgctg aaggtcaccg cggccggctt gtgccactcg 120
gacatcttcg tgatggacat gccggcagag cagtacatct acggtcttcc cctcaccctc 180
ggccacgagg gcgtcggcac cgtcgccgaa ctcggcgccg gcgtcaccgg attcgagacg 240
ggggacgccg tcgccgtgta cgggccgtgg gggtgcggtg cgtgccacgc gtgcgcgcgc 300
ggccgggaga actactgcac ccgcgccgcc gagctgggca tcaccccgcc cggtctcggc 360
tcgcccgggt cgatggccga gtacatgatc gtcgactcgg cgcgccacct cgtcccgatc 420
ggggacctcg accccgtcgc ggcggttccg ctcaccgacg cgggcctgac gccgtaccac 480
gcgatctcgc gggtcctgcc cctgctggga cccggctcga ccgcggtcgt catcggggtc 540
ggcggactcg ggcacgtcgg catccagatc ctgcgcgccg tcagcgcggc ccgcgtgatc 600
gccgtcgatc tcgacgacga ccgactcgcg ctcgcccgcg aggtcggcgc cgacgcggcg 660
gtgaagtcgg gcgccggggc ggcggacgcg atccgggagc tgaccggcgg tgagggcgcg 720
acggcggtgt tcgacttcgt cggcgcccag tcgacgatcg acacggcgca gcaggtggtc 780
gcgatcgacg ggcacatctc ggtggtcggc atccatgccg gcgcccacgc caaggtcggc 840
ttcttcatga tcccgttcgg cgcgtccgtc gtgacgccgt actggggcac gcggtccgag 900 ctgatggacg tcgtggacct ggcccgtgcc ggccggctcg acatccacac cgagacgttc 960 accctcgacg agggacccac ggcctaccgg cggctacgcg agggcagcat ccgcggccgc 1020 ggggtggtcg tcccgggctg a 1041
<210> 14 <211> 346 <212> PRT
<213> Klebsiella oxytoca <400> 14
Met Lys Ala Leu Gln Tyr Thr Glu Ile Gly Ser Glu Pro Val Val Val 1 5 10 15
Asp Val Pro Thr Pro Ala Pro Gly Pro Gly Glu Ile Leu Leu Lys Val 20 25 30
Thr Ala Ala Gly Leu Cys His Ser Asp Ile Phe Val Met Asp Met Pro 35 40 45
Ala Glu Gln Tyr Ile Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly 50 55 60
Val Gly Thr Val Ala Glu Leu Gly Ala Gly Val Thr Gly Phe Glu Thr 65 70 75 80
Gly Asp Ala Val Ala Val Tyr Gly Pro Trp Gly Cys Gly Ala Cys His 85 90 95
Ala Cys Ala Arg Gly Arg Glu Asn Tyr Cys Thr Arg Ala Ala Glu Leu 100 105 110
Gly Ile Thr Pro Pro Gly Leu Gly Ser Pro Gly Ser Met Ala Glu Tyr 115 120 125
Met Ile Val Asp Ser Ala Arg His Leu Val Pro Ile Gly Asp Leu Asp 130 135 140
Pro Val Ala Ala Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His 145 150 155 160
Ala Ile Ser Arg Val Leu Pro Leu Leu Gly Pro Gly Ser Thr Ala Val 165 170 175
Val Ile Gly Val Gly Gly Leu Gly His Val Gly Ile Gln Ile Leu Arg 180 185 190 Ala Val Ser Ala Ala Arg Val Ile Ala Val Asp Leu Asp Asp Asp Arg 195 200 205
Leu Ala Leu Ala Arg Clu Val Gly Ala Asp Ala Ala Val Lys Ser Gly 210 215 220
Ala Gly Ala Ala Asp Ala Ile Arg Glu Leu Thr Gly Gly Glu Gly Ala 225 230 235 240
Thr Ala Val Phe Asp Phe Val Gly Ala Gln Ser Thr Ile Asp Thr Ala 245 250 255
Gln Gln Val Val Ala Ile Asp Gly His Ile Ser Val Val Gly Ile His 260 265 270
Ala Gly Ala His Ala Lys Val Gly Phe Phe Met Ile Pro Phe Gly Ala 275 280 285
Ser Val Val Thr Pro Tyr Trp Gly Thr Arg Ser Glu Leu Met Asp Val 290 295 300
Val Asp Leu Ala Arg Ala Gly Arg Leu Asp Ile His Thr Glu Thr Phe 305 310 315 320
Thr Leu Asp Glu Gly Pro Thr Ala Tyr Arg Arg Leu Arg Glu Gly Ser 325 330 335
Ile Arg Gly Arg Gly Val Val Val Pro Gly 340 345
<210> 15
<211> 29
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador <400> 15
caccatggac aaacagtatc cggtacgcc
<210> 16
<211> 25
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador <400> 16
cgaagggcga tagctttacc aatcc
25
<210> 17
<211> 32
<212> DNA
<213> Seqüência artificial
<220>
<22 Β> Iniciador
<400> 17
caccatgaat cattctgctg aatgcacctg cg 32
<210> 18
<211> 22
<212> DNA
<213> Seqüência artificial
<220>
<223> Ini ciador
<210> 19
<211> 28
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 19
caccatgaaa aaagtcgcac ttgttacc 28
<210> 20
<211> 15
<212> DNA
<213> Seqüência artificial
<220>
<22 3> Iniciador
<400> 18
gatactgttt gtccatgtga cc
22
<400> 20 ttagttaaat accat
15
<210> 21 <211> 23 <212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador <400> 21
caccatgaga tcgaaaagat ttg
23
<210> 22
<211> 22
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 22
cttagagaag ttaatcgtcg cc 22
<210> 23
<211> 25
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<210> 24
<211> 18
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 24
cgtcgtgtca tgcccggg 18
<210> 25
<211> 36
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 23
caccatgaaa gccctccagt acacc
25
<400> 25
gatcgaattc gtttaaactt agttttctac cgcacg
36
<210> 26 <211> 34 <212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador <400> 26 gatcgcatgc aagctttcat atagtcggaa <210> 27 <211> 43 <212> DNA <213> Seqüência artificial <220> <22 3> Ini ciador <400> 27
gatcgaattc gtttaaacaa aggaggtctg attcatgaga tcg
<210> 28
<211> 22
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 28
gatcggattc ttaatcgtcg cc
<210> 29 <211> 36 <212> DNA <213> Seqüência <220> <223> Ini ciador <400> 29
gatcggatcc aaaggaggtc gggcgcatga aagccc
<210> 30 <211> 32 <212> DNA <213> Seqüência <220> <22 3> Ini ci ador <400> 30
gatctctaga aagctttcag cccgggacga cc
<210> 31
<211> 21
<212> DNA
<213> Seqüência artificial
<220>
<223> Ini ci ador <400> 31
actttctttc gcctgtttca c 21
<210> 32 <211> 79 <212> DNA <213> Seqüência
<220>
<223> Iniciador
artificial
<400> 32
catgaagctt gtttaaactc ggtgaccttg aaaataatga aaacttatat tgttttgaaa 60 ataatgaaaa cttatattg 79
<210> 33 <211> 39 <212> DNA <213> Seqüência artificial <220> <223> Iniciador BABC F <400> 33
gagctcgaat tcaaaggagg aagtgtatat gaatcattc 39
<210> 34 <211> 35 <212> DNA <213> Seqüência artificial <220> <22 3> Iniciador BAB R <400> 34
ggatcctcta gaattagtta aataccatcc cgccg 35
<210> 35
<211> 17
<212> DNA
<213> Seqüência artificial
<220>
<22B> Iniciador M13 forward
<400> 35
gtaaaacgac ggccagt 17
<210> 36
<211> 16
<212> DNA
<213> Seqüência
artificial
<220> <223> Iniciador Μ13 Reverse
<400> 36 aacagctatg accatg
16
<210> 37 <211> 20 <212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador Ν83 SeqF2
<400> 37
gctggattac cagctcgacc 20
<210> 38 <211> 20 <212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador N83SeqF3
<210> 39
<211> 20
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador Ν84 SeqR4
<400> 39
cgaagcgaga gaagttatcc 20
<210> 40
<211> 38
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador BC Spe F
<400> 38
cggacgcatt accggcaaag
20
<400> 40
actagtaaag gaggaaagag tatgaagaag gtcgcact
38
<210> 41 <211> 26 <212> DNA
<213> Seqüência artificial
<220> <223> Iniciador BC Xba R
<400> 41
tctagaaagc aggggcaagc catgtc
26
<210> 42
<211> 20
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador Trc
<400> 42
ttgacaatta atcatccggc 20
<210> 43
<211> 20
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador Trc R
<210> 44 <211> 38 <212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador DDo For <400> 44
aagcttaaag gaggctgatt catgagatcg aaaagatt 38
<210> 45 <211> 27 <212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador DDo Rev
<400> 43
cttctctcat ccgccaaaac
20
<400> 45
tctagattat tcatcctgct gttctcc
27
<210> 46 <211> 22 <212> DNA
<213> Seqüência artificial
<220> <22Β> Iniciador DDko seq F2
<400> 46
gcatggcgcg gatttgacga ac
<210> 47
<211> 22
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador DDko seq F5
<400> 47
cattaaagag accaagtacg tg
<210> 48
<211> 24
<212> DNA
<213> Seqüência artificial
<220>
<22B> Iniciador DDko seq F7
<400> 48
atatcctggt ggtgtcgtcg gcgt
<210> 49
<211> 22
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador DDko seq F9
<400> 49
tctttgtcac caacgccctg cg
<210> 50
<211> 22
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador DDko seq Rl
<400> 50
gcccaccgcg ctcgccgccg cg
<210> 51
<211> 22
<212> DNA
<213> Seqüência
artifi ciai
<220> <223> Iniciador DDko seq R3 <400> 51
cccccaggat ggcggcttcg gc
<210> 52
<211> 22
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador DDko seq R7
<400> 52
gggccgacgg cgataatcac tt
<210> 53
<211> 22
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador DDko seq RlO <400> 53
ttcttcgatc cactccttaa cg
<210> 54
<211> 56
<212> DNA
<213> Seqüência
<220>
<223> Iniciador
artificial ChnA F
<400> 54
catcaattga ctacgtagtc gtacgtgtaa ggaggtttga aatggaaaaa attatg
<210> 55 <211> 40 <212> DNA <213> Seqüência artificial <220> <223> Iniciador ChnA R <400> 55
catgctagcc ccgggtatct tctactcatt ttttatttcg
<210> 56
<211> 22
<212> DNA
<213> Artificiai Squence
<220> <223> Iniciador chnSeq Fl
<400> 56
ctcaacaggg tgtaagtgta gt
<210> 57
<211> 22
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador chnSeq Rl
<400> 57
cgttttgata tagccaggat gt
<210> 58
<211> 35
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador Top ter Fl
<400> 58
ctagaagtca aaagcctccg accggaggct tttga
<210> 59 <211> 60 <212> DNA <213> Seqüência artificial <220> <22 B> Iniciador Top ter F2 <400> 59
ctgctcgagt tgctagcaag tttaaacaaa aaaaagcccg ctcattaggc gggctgagct
<210> 60 <211> 37 <212> DNA <213> Seqüência artificial <220> <223> Iniciador Bot ter Rl <400> 60
cagcccgcct aatgagcggg cttttttttg tttaaac
<210> 61
<211> 50
<212> DNA
<213> Seqüência
artifi ciai
<220> <22Β> Iniciador Bot ter R2
<400> 61
ttgctagcaa ctcgagcagt caaaagcctc cggtcggagg cttttgactt 50
<210> 62
<211> 22
<212> DNA
<213> Seqüência artificial
<220>
<22B> Iniciador pCL1925 vec F
<400> 62
cggtatcatc aacaggctta cc 22
<210> 63 <211> 22 <212> DNA <213> Seqüência artificial <220> <223> Iniciador pCL1925 vec <400> 63 agggttttcc cagtcacgac gt <210> 64 <211> 22 <212> DNA <213> Seqüência artificial
22
<220>
<223> Iniciador pCL1925 vec R2
<400> 64
cgcaatagtt ggcgaagtaa tc 22
<210> 65
<211> 20
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador N84 Seq R2
<400> 65
gcatcgagat tatcgggatg 20
<210> 66
<211> 208
<212> DNA
<213> Escherichia coli
<400> 66 atcgcccgca ttcttgccgc atcttccccc ggcgtcacac cggctgtgta ggctggagct gcttcgaagt tcctatactt gaataggaac taaggaggat attcatatga ttacgttgga aagccgcccg ctaagctttt tacgcctc
<210> 67
<211> 42
<212> DNA
<213> Seqüência Artificial <220>
<223> Promotor 1.6GI Variante
<400> 67
gcccttgaca atgccacatc ctgagcaaat aattcaacca
<210> 68
<211> 42
<212> DNA
<21B> Seqüência artificial
<220>
<22B> Promotor 1.5 CI
<400> 68
gcccttgact atgccacatc ctgagcaaat aattcaacca
<210> 69 <211> 3240 <212> DNA
<213> KlebsielTa oxytoca <400> 69
ggcgcggtcc gccaggcggt cacctccgcg cgcgaaatcg ctcggtgctg aaccgaaaaa cgatcgcccg tcctacatct atgagatcga aaagatttga agcactggcg aaacgccctg aaggagtgga tcgaagaagg ctttatcgcg atggaaagcc attaaaatcg ttaacggcgc ggtgaccgag ctggacggga ctgatcgacc actttatcgc ccgctacggt atcaacctga gcgatggatt cggtcaagct ggccaacatg ctgtgcgatc atcgtcccgc tgaccaccgc gatgacgccg gcgaaaattg aacgtcgtcg agatgatgat ggcgatgcag aaaatgcgcg caggcgcacg tcaccaacgt caaagataac ccggtacaga ggggcatggc gcggatttga cgaacaggaa accaccgttg
cgaagtaacg tttaaactca 60 tctagagaat aggaacttcg 120 tgtcagccgc cgtatatacg 180 208 Ct 42 Ct 42 gcaaaaccgt ccttgcgacc 60 gatacccacg aggctgattc 120 tgaatcagga cggcttcgtt 180 cgaacgaccc aaaaccgtcg 240 aaccggtaag cgattttgac 300 accgcgccga agaagtgatg 360 cgaacgttaa acgcagcgaa 420 tcgaagtggt ttcgcatatg 480 cccgccgcac cccgtcccag 540 ttgccgccga cgccgccgaa 600 cggtagcgcg ctatgcgccg 660 ttcaacgcca tcgcgctgct ggtgggctcg caggtaggcc gtccgggcgt gctgacgcag 720 tgctcgctgg aagaagccac cgagctgaag ctcggcatgc tgggccacac ctgctacgcc 780 gaaaccatct ccgtctacgg caccgagccg gtctttaccg acggcgacga cacgccgtgg 840 tcgaagggct tcctcgcctc gtcctacgcc tctcgcgggc tgaaaatgcg ctttacctcc 900 ggctccggct cggaagtgca gatgggctac gccgaaggca aatccatgct ttatctggaa 960 gcgcgctgca tctacatcac caaagccgcg ggcgtacagg gtctgcaaaa cggttccgta 1020 agctgcatcg gcgtgccgtc tgcggtgcct tccggcattc gcgcggtgct ggcggaaaac 1080 ctgatctgtt cgtcgctgga tctggagtgc gcctccagca acgaccagac cttcacccac 1140 tccgatatgc gtcgtaccgc gcgcctgctg atgcagttcc tgccgggcac cgactttatc 1200 tcctccggtt attccgcggt gccgaactac gacaacatgt tcgccggctc caacgaagat 1260 gccgaagact ttgacgacta caacgtcatc cagcgcgacc tgaaggtgga cggcggtttg 1320 cgtccggttc gcgaagagga cgtcatcgcc atccgtaaca aagccgcccg cgcgctgcag 1380 gccgtgtttg ccggaatggg gctgccgccg attaccgatg aagaagttga agccgcgacc 1440 tacgcccacg gttcgaaaga tatgccggag cgcaacatcg tcgaagacat caagttcgcc 1500 caggaaatca tcaataaaaa ccgcaacggt ctggaagtgg tgaaagcgct ggcgcagggc 1560 ggattcaccg acgtggccca ggacatgctc aacatccaga aagctaagct gaccggggac 1620 tacctgcata cctccgcgat tatcgtcggc gacgggcagg tgctgtcagc cgtcaacgac 1680 gtcaacgact atgccggtcc ggcaacgggc tatcgcctgc agggcgaacg ctgggaagag 1740 attaaaaaca tccctggcgc tcttgatccc aacgagattg attaaggggt gagaaatgga 1800 aattaatgaa aaattgctgc gccagataat tgaagacgtg ctcagcgaga tgaagggcag 1860 cgataaaccg gtctcgttta atgcgccggc ggcctccgcg gcgccccagg ccacgccgcc 1920 cgccggcgac ggcttcctga cggaagtggg cgaagcgcgt cagggaaccc agcaggacga 1980 agtgattatc gccgtcggcc cggctttcgg cctggcgcag accgtcaata tcgtcggcat 2040 cccgcataag agcattttgc gcgaagtcat tgccggtatt gaagaagaag gcattaaggc 2100 gcgcgtgatt cgctgcttta aatcctccga cgtggccttc gtcgccgttg aaggtaatcg 2160 cctgagcggc tccggcatct ctatcggcat ccagtcgaaa ggcaccacgg tgatccacca 2220 gcaggggctg ccgccgctct ctaacctgga gctgttcccg caggcgccgc tgctgaccct 2280 ggaaacctat cgccagatcg gcaaaaacgc cgcccgctat gcgaaacgcg aatcgccgca 2340 gccggtcccg acgctgaatg accagatggc gcggccgaag taccaggcga aatcggccat 2400 tttgcacatt aaagagacca agtacgtggt gacgggcaaa aacccgcagg aactgcgcgt 2460 ggcgctttga taaaggataa ctccatgaat accgacgcaa gtattgagcc gcatgaacag cctgcagggc gaggcgcctg ggcgcgtccc gtagcgccag ggtcagcgac tacccgctgg gtgaaaaccg ccaccaataa aacgctggac gactttacgc aaagtcaccg cccaggatat gcgtattacc ccggaaaccc gccaaagacg cgggccgcga ccggctggcg atgaacttcg gcggtaccgg acgatcgcat tcttgaaatc tacaacgccc aaagaggagc tgctggcgat cgccgacgat ctcgaaagcc gccgctttcg ttcgcgaagc ggccacgctg tacgtcgagc gattaacttc tctaagtaat tcgagatgca ttgaggcggc tggaacgaat ttgaacagcc ataggctggc tttagtgagg ccccgatgag cttactgtag taagtgattc gggtgaaaga gtttgaagta cgacgagaaa aggggcatgt gatgcgatat
<210> 70
<211> 2640
<212> DNA
<21Β> KTebsieTla oxytoca
<400> 70
acgtcgagcg taaaaaactc aaaggcgacg attaacttct tgaggcggca agtgagtgac aaattcgtct ggaacgaatt ttagtgaggg acagggatgt ccctcataac cccgatgagc ggtgaaagaa cgcagccaac aaaaaggcag tttgaagtac atgcgatata tagctggcat tgatatcggc aactcatcga ctggatgagg ctggcgcgct gacgatcacc cacagcgcgc aaaggcacgt tgcgtaacgt gttcgggatt caggaggcgc gccgggatcg ccgtcagcga tatttcgctc atccgcatca ggcgatgtgg cgatggaaac cattaccgaa accatcatca cataacccga aaacgcccgg cggcgcgggg cttggcacag gagctgctaa cccgcccggc ggacgcgccc tatatcctgg tttgccgata tcgccagcgt gattaacgct tccctgcgcg gtcattttac agcgcgacga tggcgtgctg gtcagcaacc atcgttgacg aagtgctgta catcgaccgc attccgctgg
ttgaatcgat ggtacgcgac 2520 cggcggctcc ggcggctggc 2580 cgaacaagca cccggaatgg 2640 tggaaaacgt gctgagcaat 2700 tgcgcttaca ggcttctatt 2760 agcgcgccgc cgagctgacc 2820 tccgccccta tcgctcgacg 2880 gctatcaggc gaagatttgc 2940 gtaaaaaact caaaggcgac 3000 aagtgagtga caaattcgtc 3060 gacagggatg tccctcataa 3120 acgcagccaa caaaaaggca 3180 atagctggca ttgatatcgg 3240 ctaagtaatt cgagatgcat 60 tgaacagcca taggctggct 120 ttactgtagt aagtgattcg 180 gacgagaaaa ggggcatgtg 240 cggaagtcgc cctggcgacc 300 tggcggaaac caccggaatc 360 tcgccctcgt cgccagaggc 420 acgaagcgac gccggtgatt 480 ccgaatcgac catgatcggc 540 gcatcaccat tacgccgcag 600 tggtgtcgtc ggcgttcgat 660 ccgggtatca gattaccggc 720 ggctggaaaa accgctgccg 780 ggatgctggc ggcgattgag 840 gtcgccgttc cggggaaggt catcgaaacc ctctctaacc tttaacctca gccccgagga gacgaagaac atcgtcccga aaccgttccg ccgtggtggt caaaacgcca tccggcgacg gccggtaatc ttgagctgct ggcccagggc cgtagcgtgc gccgaagcca tcatgaaagc ggtcgacggc tgcggcaggc tccggcacca atatcggcgg catgctggaa cacgtgcgcc aacaagccga gcagcgaaat atttattcag gacctgctgg gtgagcgtta ccggcggtct ggccggggag ttctcgctgg tcgatggtga aatcggatcg cctgcagatg gcaatgatcg ctcaatatcg acgtgcagat cggcggcgca gaggccgaag accacgccgg gcaccacccg accgctggcg atcctcgacc gcctccatca tcaaccccaa aggcgacatc atcgccaccc atggtgacga tgattattgc ccgcgagctg gggctggaag atcaagaagt acccgctggc taaggtggaa agcctgttcc agcgtgcagt tcttctccac gccgctgccg cccgccgtgt aaagcggacg aactggtgcc gctgcccggc gatttagcgc cgccgcagcg ccaaagagcg ggtctttgtc accaacgccc agccccaccg gcaacattcg cgatattccg ttcgtggtgc gatttcgaag tcccgcagct ggtcaccgat gcgctggcgc cggggaaata ttcgcggcag cgagggcccc cgaaacgcgg tcctggcata aggagtttgc gcatgaacgg taatcacagc cgtcatcgac ggctgcgacg gcctgtggcg cgaagtgctg tatccctttc cggctccagc atcacccggc cggagaggtc ggcgcgcagc tcgccgctgc tggtgggcat cgcctgcgac ctacaagaat ttacccgcat cggcgccgct ttttacgctg ggcccatcgc aacaccggta ataacgcggc acggctggtc tctgaatagc gaagcaacag gagaacagca ggatgaataa caaaagggtt agtgggcgcc attgaggccg ccgatgcgat agctggtcgg ctacgaaaaa attggctcgg gcctcgtcac tcggcgcggt caaagcggcg gtagacgcgg gcagcgcggc
cttacggcat cgccaccgtc 900 tggcccgggc gctgattggc 960 tcaaagcgcg cgcgataccc 1020 gcgtggatgt ggccgccggc 1080 tcgataacgt caccggcgaa 1140 agaccatggc cgagctgacc 1200 ccgttgatac ctcggtaccg 1260 agcaggccgt gggcatcgcc 1320 cccgcgaaat cgagcagaag 1380 ccgccatcct gggggcgctg 1440 tcggcgcggg ctccaccgat 1500 atctcgccgg cgcaggcgac 1560 accgctatct ggcggaagag 1620 atttacgcca cgaggacggc 1680 tcgcccgcgt ctgcgtggtg 1740 tggaaaaagt gcgcgccatt 1800 tgcgcgcgct gcgtcaggtc 1860 tggtcggcgg ttcgtcgctg 1920 actaccgcct ggttgccgga 1980 tggccaccgg cctgattctc 2040 gccccggcca tcgcgatcgc 2100 ctgggtatcg aagaggaagg 2160 gtggacagcg cctggcaggc 2220 cgccatatgc tggtcgtgca 2280 atgcatcatc aggacagtca 2340 aaggggatcc ctttccggga 2400 cgcactggga ctggttgaaa 2460 ggtgaaatcc gccaacgtgc 2520 cgtgatggtg cgcggcgacg 2580 ggcgagcgcg gtgggcgaag 2640 <210> 71 <211> 756 <212> DNA <213> Aeinetobaeter sp. <400> 71 atggaaaaaa ttatgtcaaa taaattcaac aataaagtcg ctttaattac tggcgctggt 60 tcaggtattg gtaaaagcac cgcactgctt ttggctcaac agggtgtaag tgtagtggtt 120 tcagatatta acctggaagc agcacagaaa gttgtggacg aaattgtcgc tttaggcggg 180 aaagcggctg cgaataaggc caatactgct gagcctgaag acatgaaagc tgcagtcgag 240 tttgcggtca gcacttttgg tgcactgcat ttggccttca ataatgcggg aattctgggt 300 gaagttaact ccaccgaaga attgagcatt gaaggatggc gtcgtgtgat tgatgtgaac 360 ttgaatgcgg ttttctacag catgcattat gaagttcctg caatcttggc cgcagggggc 420 ggagcgattg tcaataccgc ttctattgca ggcttgatcg ggattcaaaa tatttcaggc 480 tatgtcgctg caaaacatgg cgtaacgggt ctaacgaaag cggcggcatt ggaatatgca 540 gataaaggga ttcgcattaa ttcagtacat cctggctata tcaaaacgcc tttgattgca 600 gaatttgaag aagcagaaat ggtaaaacta catccgattg gtcgtttggg acagccggaa 660 gaagttgctc aggttgttgc cttcctactt tctgatgatg cttcatttgt gaccggtagt 720 cagtatgtgg tcgatggtgc atatacctcg aaataa 756
<210> 72 <211> 251 <212> PRT
<213> Acinetobacter sp <400> 72
Met Clu Lys Ile Met Ser Asn Lys Phe Asn Asn Lys Val Ala Leu Ile 1 5 10 15
Thr Gly Ala Cly Ser Gly Ile Gly Lys Ser Thr Ala Leu Leu Leu Ala 20 25 30
Gln Gln Gly Val Ser Val Val Val Ser Asp Ile Asn Leu Glu Ala Ala 35 40 45
Gln Lys Val Val Asp Glu Ile Val Ala Leu Gly Gly Lys Ala Ala Ala 50 55 60
Asn Lys Ala Asn Thr Ala Glu Pro Glu Asp Met Lys Ala Ala Val Glu 65 70 75 80 Phe Ala Val Ser Thr Phe Gly Ala Leu His Leu Ala Phe Asn Asn Ala 85 90 95
Gly Ile Leu Gly Glu Val Asn Ser Thr Glu Glu Leu Ser Ile Glu Gly 100 105 110
Trp Arg Arg Val Ile Asp Val Asn Leu Asn Ala Val Phe Tyr Ser Met 115 120 125
His Tyr Glu Val Pro Ala Ile Leu Ala Ala Gly Gly Gly Ala Ile Val 130 135 140
Asn Thr Ala Ser Ile Ala Gly Leu Ile Gly Ile Gln Asn Ile Ser Gly 145 150 155 160
Tyr Val Ala Ala Lys His Gly Val Thr Gly Leu Thr Lys Ala Ala Ala 165 170 175
Leu Glu Tyr Ala Asp Lys Gly Ile Arg Ile Asn Ser Val His Pro Gly 180 185 190
Tyr Ile Lys Thr Pro Leu Ile Ala Glu Phe Glu Glu Ala Glu Met Val 195 200 205
Lys Leu His Pro Xle Gly Arg Leu Gly Gln Pro Glu Glu Val Ala Gln 210 215 220
Val Val Ala Phe Leu Leu Ser Asp Asp Ala Ser Phe Val Thr Gly Ser 225 230 235 240
Gln Tyr Val Val Asp Gly Ala Tyr Thr Ser Lys 245 250
<210> 73 <211> 17417 <212> DNA
<213> Acinetobacter sp.
<400> 73
ctagcattta cgcgtgaggt aggtgggtag gtctgtaatg tgaagatcta cgaggaaatc 60 ggcgtcatga cgtgaggtcc agcgaaccgt cttgcgtaat ccgtcattca tggtgagtaa 120 cattgcccgt atttcgcgtt cagtatatag cagaccagca tgattaacga gatcctgggt 180 attttagtcc ggacacccaa agtcccatgc ggtcgccaga tccagtaagt cgactacgac 240 ttgctcatct gtagccaacc ccgcaatcac ttccacaatt ttcatcagtg gaaccggatt 300 gaagaaatgg aaacctgcga tacggccctg atgctgacac gcagatgcaa ttgaggtcac 360 agatagtgag gatgtatttg aaaccagaat agtttcttca gccacaatcc tttcaagctg 420 tttaaacaaa gtttgcttga tttccagatt ttcaataatt gcttctacga ccagatcaac 480 gccagcaacc tcttcaatgc tttccaagat aatcaatcgg gctaaggtat ccacaagctg 540 ctgttcggtt aactttcctt tagcagctag tttgtgcaag gttactttta atttttccaa 600 gccttgctca gcagcgccgg gtttagcatc aaataaacgg acctcaacac ccgcctgtgc 660 tgcaatttgc gcaataccca ttcccattac gcctgtgcca atcaaggcca ttttttgaat 720 cgtcatgact tattttcctt gatattgagg gcttcgcttt tcgaaaaagg cattgacgcc 780 ttctttttga tcttgtgtat caaataaaat ttggaaggct ttacgctcta atgccaaagc 840 accatcgagt ggcatattgg cacctagtgt tgtgacttct ttgatctgtt caacggcaat 900 cggtgagagt tgggcaatct gtgtcgcaat ttcaaccgct ttagcaaggg tttgatcatc 960 ctcaaccact tcggaaacca accccatttt gtcagcttct tctgcagaaa agatctttcc 1020 tgttaacact atttgcatgg ctttaaactt ccctaccgca cgcagtaagc gttgggtacc 1080 accagcacct ggcatcagcc ccaatttgac ttcaggctga ccaaactggg ctgattttcc 1140 ggcaataatg atgtctgcat gcattgcaag ttcacaccca ccacccaatg catatccatt 1200 cacagcagcc acaatcggtt tagggcaatc aataatggcc cgccagtact gttccgtatg 1260 gcgtaaatac atgtctacgg tttttgcagt ggtgaagtcc cggatatccg cacctgctgc 1320 aaatactttt tcaccaccag taatgacaat tgcgcggact gtatcagatg cagcgagctg 1380 ctcaaacatt gctgcgagct gttggcgcag ttccagattc aatgcatttc tagtatctgg 1440 acgatgtagt tcaacaatgg ccacaccatt actttgaata tctaaattca atatttcatt 1500 ttccataaca acctacatgt ttcgcatagc ggtttattta aaccaaatat acctgttttt 1560 ttgcaacaat aaagcccaca ggaacatagt tttaaattaa aaattggcta aaaatattta 1620 aaaaacacaa ataaaatacc gcacagcggt atttgatatc aatattattg catttatttt 1680 tccattctgt catattattt tcattccaaa gcattagatc acccctgcat gaagcagaga 1740 tggctaaatt tacctatcta atacaagggc ttaaaaatga ttcgcgatca agacacatta 1800 aatcagctgg ttgacatgat ccgtcagttt gtcgatggcg ttcttattcc caatgaagaa 1860 attgttgcgg aaaccgatga aattccagct gaaatcgtgc agcaaatgaa agaactgggt 1920 ctttttggtc tcaccattcc tgaggaatat gagggtcttg gcctgaccat ggaggaagag 1980 gtttacattg catttgaact gggacgtacc tctcctgctt tccgttcact gatcggcact 2040 aacaatggga tcggttcatc aggcttaatt attgatggct ccgaagagca gaaacagtat 2100 tttttgccac gtctggcaag tggtgaaatt tccggttcag atgctgcctc tttaaaaacc ttaaatggca ctaagcgtta catcaccaat gcacgtacca gtaccgaaat taaaggtaca aaaactcctg gtatttcctt gggtaaacgt acctgtgatg tgatttttga aaactgtcgt gaaggtgtag gttttaaaac tgcaatgaag gcattaagtg taggtgctgc tacgcgtatg cgcaaacagt ttggtcaagc gattgcgaac ^^tctaaagctg aaatttacgc agcaaaatgt gctggacaga atgtcagcac ggaagcatct ggccgtgtcg cagatcgtgg cgtacagatc gctattgagc gtttttaccg tgatgtacgt atccaacagg tcattattgc ccgcaatatg aggtattgag tgtatctaaa aggacgggat tcctgacttt ttgatggcaa ggctataaaa cacagctgaa agatattttc agtcttcatc attttatgaa tatgcaagaa caagaaatcg ttgtcggcgc aggaccggcc ggtctttctg aaaacaacct gaacgatctg tcggtttgtg acatcttgtc cggtgcggta ctggaaccac aggaagaagg tgcaccttta aatgttccag cggatgaaaa atcacaagaa gcgccacact gcaactatgt tatctcgctc ggcaacgtag tggaagtatc tattttcccg ggctttgccg cggtgaaagg cattcaaacc ggtgacatgg actttactcc gggctatgaa ctgcatgcca gccacctcgg caagcgttta attgccaaat attacggtat cggtatcaaa gagctgtggg tggtgatgca cggtgccggc tggccattgt
attggttcat tctgtttaac tgaacctgat 2160 acagcggtga aagatggtga tcattacatt 2220 gcaccgcatg cgggtgtctt tactgtcatg 2280 ggtggaattt cagcctttat cgtggacagt 2340 gataagaaga tgggccaaaa aggtgcacat 2400 attcctgcat ctgcactcat tggtggtgtt 2460 gtacttgata aaggccgtat tcatattgct 2520 ctggaagatt ccctacaata tgccgttgag 2580 ttccagttga ttcaaggtat gttagccgat 2640 atggtattag atgctgcccg acttcgtgat 2700 tgtgccaaga tgtttgccac tgaaatgtgt 2760 catggtggtg cgggttatat cagtgaatat 2820 ttattccgtt tgtatgaagg tacaacgcaa 2880 atccgtgaag cgactcaata attgtataac 2940 tagtgattta agctataact tgaatactaa 3000 cctcctagct cattttatct ctaagctaat 3060 cttaccagac agttcacaat acaaaattgg 3120 aacgcgaatc aatggagttt gacgtcgtga 3180 cagcgatcaa gatccgtcaa cttgcaattg 3240 tggtggaaaa aggctctgaa gtcggtgcgc 3300 gtgccatgaa tgagctgttc ccgaactgga 3360 tgaccgaaga caagacctat ttcctgctct 3420 ggatggtgcc taaaaccatg cataacgatg 3480 tgcgctggtt gggtcaaaaa gcggaagagc 3540 ctgctgaaat tctgtaccat gcagatggtt 3600 gcattggcaa ggatggcgaa ccgacccata 3660 aatacaccct gtttgctgaa ggctgccgtg 3720 acaacctcga taaagattca gatccacaac 3780 aaatcgaccc ggcgaaacac aagccaggtc 3840 ctgaaaccgg ttcttcaggc ggctggtggt 3900 tgtatcatgc ggaaaacaat caggtgactt tgggcatgat cgtcgatctg tcttacacca 3960 acccgcatat gtatccgttt atggaaatgc agcgctggaa aacccatccg ctgatcaagc 4020 agtatctgga aggtggcaaa cgtatttctt atggcgcgcg tgcggtaacc aaaggcggct 4080 ttaactcgct accgaaattt accttcccgg gcggatcgct gattggtgac gatgccggct 4140 tcctgaactt tgccaaaatc aagggctcac ataccgcgat gaaatccggc atgctctgcg 4200 gtgaagcagt gtttgaagcc attgctgccg gtgtggaaaa aggtggtgac cttgcggttg 4260 cgcgtgtgac ggaaggcgaa gacttgtttg ccaaaaaact gacttcttac accgacaagt 4320 tcaataatag ctggctgaaa gaagagctgt acaactcgcg taactttggc ccggccatgc 4380 acaagtttgg tcagtggctc ggtggtgcgt ttaactttat cgaccagaac gtgtttaagg 4440 tgccgtttac cctgcatgac ctggtgacgg atttcggtgc gctgaaaacc gtcgatgcgg 4500 tgaacttcaa gccgaattat ccaaaaccgg atggcaaact gacctttgac cgtctgtctt 4560 cggtgtttgt atccaacacg gtgcatgaag aaaaccagcc agcgcattta aaactgactg 4620 acacttcgat tccggtgaat gtcaacctgc caaaatggga tgaaccggcg cagcgctact 4680 gccccgcggg tgtatacgaa atcatggaaa atgatgacgg ttcgaaacgc ttccagatca 4740 atgcagccaa ctgtgtgcac tgcaagacct gtgacatcaa ggatccttca cagaacatca 4800 cctgggtaac accggaaggt ggtggtggtc caaactatcc gaatatgtaa gtctaatcac 4860 ttcaaggaag aggtttccca tttcccttct ttctagcaga tgaagaagct tgcaactaaa 4920 agagattgtt tggatcagtt acccaaaatc gttgaaaaga ttttaactct tcgattttta 4980 ttttttaggt aatcctagcc ctctcggggg ctaggattaa aaattttaag ttattccaac 5040 acgaatgaca aattgttcaa tgcaaaataa aaacatacaa tatataaata tattttttaa 5100 ttaaaacata agattacaat aaaataagaa tttttatttg gagtttgttt tttttctaca 5160 atgatcatta tgtacaattt ttaggttcac cccatccaag ccttgtgatt gcattcctgc 5220 gattctttat tcaatgaata agcaatgcta ttaatcagca atgaataacc agcactgcag 5280 attttgaata aattcacatg tcgtaatgga gattatcatg tcacaaaaaa tggattttga 5340 tgctatcgtg attggtggtg gttttggcgg actttatgca gtcaaaaaat taagagacga 5400 gctcgaactt aaggttcagg cttttgataa agccacggat gtcgcaggta cttggtactg 5460 gaaccgttac ccaggtgcat tgtcggatac agaaacccac ctctactgct attcttggga 5520 taaagaatta ctacaatcgc tagaaatcaa gaaaaaatat gtgcaaggcc ctgatgtacg 5580 caagtattta cagcaagtgg ctgaaaagca tgatttaaag aagagctatc aattcaatac 5640 cgcggttcaa tcggctcatt acaacgaagc agatgccttg tgggaagtca ccactgaata 5700 tggtgataag tacacggcgc gtttcctcat cactgcttta ggcttattgt ctgcgcctaa 5760 cttgccaaac atcaaaggca ttaatcagtt taaaggtgag ctgcatcata ccagccgctg 5820 gccagatgac gtaagttttg aaggtaaacg tgtcggcgtg attggtacgg gttccaccgg 5880 tgttcaggtt attacggctg tggcacctct ggctaaacac ctcactgtct tccagcgttc 5940 tgcacaatac agcgttccaa ttggcaatga tccactgtct gaagaagatg ttaaaaagat 6000 caaagacaat tatgacaaaa tttgggatgg tgtatggaat tcagcccttg cctttggcct 6060 gaatgaaagc acagtgccag caatgagcgt atcagctgaa gaacgcaagg cagtttttga 6120 aaaggcatgg caaacaggtg gcggtttccg tttcatgttt gaaactttcg gtgatattgc 6180 caccaatatg gaagccaata tcgaagcgca aaatttcatt aagggtaaaa ttgctgaaat 6240 cgtcaaagat ccagccattg cacagaagct tatgccacag gatttgtatg caaaacgtcc 6300 gttgtgtgac agtggttact acaacacctt taaccgtgac aatgtccgtt tagaagatgt 6360 gaaagccaat ccgattgttg aaattaccga aaacggtgtg aaactcgaaa atggcgattt 6420 cgttgaatta gacatgctga tatgtgccac aggttttgat gccgtcgatg gcaactatgt 6480 gcgcatggac attcaaggta aaaacggctt ggccatgaaa gactactgga aagaaggtcc 6540 gtcgagctat atgggtgtca ccgtaaataa ctatccaaac atgttcatgg tgcttggacc 6600 gaatggcccg tttaccaacc tgccgccatc aattgaatca caggtggaat ggatcagtga 6660 taccattcaa tacacggttg aaaacaatgt tgaatccatt gaagcgacaa aagaagcgga 6720 agaacaatgg actcaaactt gcgccaatat tgcggaaatg accttattcc ctaaagcgca 6780 atcctggatt tttggtgcga atatcccggg caagaaaaac acggtttact tctatctcgg 6840 tggtttaaaa gaatatcgca gtgcgctagc caactgcaaa aaccatgcct atgaaggttt 6900 tgatattcaa ttacaacgtt cagatatcaa gcaacctgcc aatgcctaaa tatatggggg 6960 gcatccccca tattccattt tgtttaacat cagtcatatg ccagggatgt cttatcatga 7020 actatccaaa tataccttta tatatcaacg gtgagtttct agatcatacc aatagagacg 7080 tcaaagaagt ttttaatcca gtgaaccatg aatgtattgg actcatggcc tgtgcatcac 7140 aagcagacct ggactacgca cttgaaagtt cacaacaggc ttttctaagg tggaaaaaaa 7200 cttctcctat cacccgtagt gaaatcctca gaacctttgc gaaactagcg cgtgaaaaag 7260 cagcagaaat cgggcgcaat attacccttg atcaaggtaa gcccctgaaa gaagccattg 7320 cagaagtcac tgtctgtgca gaacatgcag aatggcatgc agaagaatgc cgacgcattt 7380 atggccgtgt tattccaccg cgtaacccaa atgtacagca actagtagtc agagaaccgc 7440 tgggcgtatg tctggcattt tcaccgtgga atttcccgtt taatcaggca attcgtaaaa 7500 tttctgctgc aattgctgcc ggctgcacca tcattgtgaa aggttctggc gacacaccaa 7560 gcgcggtata tgcgattgcc cagctatttc atgaggcggg tttgccgaat ggtgtgctga 7620 atgtgatttg gggtgactca aacttcattt ctgattacat gatcaaatcg ccgatcatcc 7680 aaaagatttc attcacaggc tcaaccccgg tgggtaaaaa attagcctcg caagcgagtc 7740 tgtatatgaa gccttgcacc atggaattgg gtggtcatgc accggtcatc gtctgtgatg 7800 atgctgatat tgatgccgct gttgaacatc tggtcggtta taaattccgt aatgcaggac 7860 aggtctgtgt atcaccaacc cgtttttatg tgcaggaagg tatttataag gaattttctg 7920 agaaagtggt gttaagagcc aaacagatca aagtgggttg tggcttagac gcatcctcag 7980 atatgggacc attggctcaa gctcgccgca tgcatgcaat gcaacaaatt gttgaagatg 8040 cggttcataa aggctcaaaa ttactgcttg gcggaaataa aatttctgac aaaggcaatt 8100 tttttgaacc aacggtactc ggtgacttgt gcaatgacac ccagtttatg aatgacgagc 8160 catttggtcc gatcattggt ttgatacctt ttgacacaat agaccatgtc ctggaagaag 8220 caaatcgatt accatttgga ttagcctctt acgcttttac cacatccagc aaaaatgcgc 8280 atcaaatctc atacggactg gaggctggca tggtttcgat taaccacatg ggattggcgc 8340 tcgctgaaac accttttggt ggtattaagg atagcggttt tggtagtgaa gggggtatcg 8400 aaacctttga cggttacctc agaaccaaat ttattacgca actcaattag aaatggatct 8460 tggtgtgcgt aggcacacca attctctttt gactttaagg atgaaagtta aatgagcaca 8520 gacaaagcaa atacgctgat caaacccgaa gatgtcgtgt tatggattcc gggtaatgtc 8580 acaattgaca gcatgaatgc cggttgggaa aacattgcaa tcagagggta cgaatatacc 8640 aacctcgatg tgcatattcc tgccatgcgt gactacatga tcgtcaacta taaaaaaagt 8700 gcggcggaaa tgcgtagaaa aggcgatgcc tcttgggata cccaagtggt taagccgggt 8760 tatgtctcct tgttgacctg tggtgaagat tcccgctggg cgtggaatga ccatattgcc 8820 gtcacccatg tctacatttc gcatgactcc atcacctcaa tggcgaataa ggtgtttgat 8880 tatgatatcg cttcgatccg aatcagagac gaagtcggtg tggaagatca tgttttacct 8940 gctctgactt cacttttaga actagaatta aagcaaggtg gtttaggtgg aaacctgtat 9000 ttagagagca ttaaaaacca gatcgccctg catttactcc gtcagtatgc caaattagat 9060 tttaaggaag gacagtgccg ttctggtttt actcccctac aacgcagact gttattagaa 9120 tttatcaatg aaaacatgag cattaaaatt accctcgaag atttagcggg attagtcaag 9180 atgagcgtgc ctcatttaat gagaaaattt aaagtcgatt ttggtaattc ccctgctgcc 9240 tacatcatga atctcagggt gcaatttgct aaacgtttgc tcacttcaaa aaaagaaatt 9300 ccactgaaag tgattgccag tgaagccggt ttttgcgatc agagccatat gacccgagta 9360 tttcaaaaat tttttgggaa aacacccatc gaaatcagac aggaacacac caatctcgtg 9420 tctgaaaatt cagtctcctc tattgttttt tgagtactaa gagccacgca agaacctgat 9480 tttcaataaa gcatccactg aaaaccagtg tggacttaca tgcattattt atgcaaaata 9540 acaaatgtca tgtgagtatc aagatatact ttctatcgct atcaagaact tgccagtaca 9600 ggcaatatgg atgcactcat caaccagagt cgcagaactc caaatttaaa aaaccgagtg 9660 gatgagcaaa ctgaataagc tgttgttgat tttgcaatcc aatatccagc ttatggtcag 9720 catcggacca gtaatgagct acgtcagatt ggcatcttcg tatctggcag cggtgtgcgc 9780 tctatctggc ttagacacaa tcttgagaat ttcaaaaagc gattaaaggc acttgaaatt 9840 aaagttgctc aagaaggcat tcagttgaat gatcagcaga ttgccgcatt agaacgtaaa 9900 catgaagatg atgttgcttg tggtgaaatt gaaacacatc atccaggtta ccttggagca 9960 caagatactt tttatgtcgg aaatctaaaa ggtgttgggc atatttatca gcaaactttt 10020 attgatactt atagcaaagt ggttcactgc aagctgtaca caaccaagac accaatcaca 10080 gccgcagatt tattgaatga ccgcgtgtta ccattctatg agtcacaagg attgccaatg 10140 cttcgcattt tgaccgacag aggcaccgaa tattgcggta aagttgaaca tcacgattat 10200 gagctttatt tggctctgaa tgatattgat cacactaaaa ctaaagcagc atcaccacaa 10260 acaaatggga tctgtgagcg cttccataag acgatcttgc aggagtttta tcagattact 10Β20 tttcgaaaga aactctatag ctcattagaa gagttacagc ttgatctaga cggttggctg 10380 aaattctata atactgaacg aacccatcag ggtaaggtgt gtaatggcag atgagcagca 10440 ttgctgcgca agattgcaac attacttgat ggaaaacgta tttgggctga aaagaattta 10500 gttcaaattt aacctgacag tcttaagcaa atatcggtaa ctatcagatc aggtttgaga 10560 taccgtctga aacgtcaagt aaatgattga gaattcatgc tcaataatct gcttgataag 10620 gctgttggtg tttgagcaca ccataacaaa gatgaatcaa cttcctcatc gcggctccaa 10680 tcgctatcat cttggtttta ccattcgcca ataaacgttc attcattgcc ctgatgtgag 10740 ggttatgccg agttgcgaca atggctgcca tatataaacc agcacgtatt ttggaagagc 10800 ccgctttgga taaacggctt ctgccatgaa tggaactacc cgattgcttt tgaatgggga 10860 ccaaaccgac aaaggcagcc gcttgactag ccctttcaaa agtatggctg cgcaagaaac 10920 tgagcattaa taaactggtt cgatctgcaa tggctggaat actgctgagc agttctttat 10980 cattttttaa atcaggattc tgattaatgt gatcatcaat ttgctggtcg ataccctgaa 11040 tgtgtttgtt taactgttca atactcttgt ggatagactg aagtacaggt tccatcgtga 11100 aggtcgactc tgctttttcc aaacgattct tttcacgttg taaatcttca caaagaatag 11160 ctcttctatc cagcaaagca ttcagcaatt gaatatgttt aggtaaaggt tgccaaaaat 11220 gtagatcggc agtcatcgca aatcgagcta ggacctcact atccaccttg tctgttttat 11280 tcagcttaga catactctga gcaaaatatc gagctctggc aggattggtt acacagactt 11340 gatagcccgc atcaaataaa tatttaacca agagttcatg ataaatagat gttgcttcca 11400 ttaaaataat ggtctgcgta gaagttgcag catgctgctt tagccaggtt tgaagttgct 11460 caaaaccttt tggtgtattt gaaaaagttt tggttttctt tttatttgca gaattttcta 11520 aaattaaaca gcaatcaatt ttagctttag caacatcaat accaagataa aacataatct 11580 ttacctgctt tatttatcca attattgttt tagcataacc accgtctttt cttgtgaatg 11640 cagcatcaaa gtgcttgtta ccgtccagag ttgtgcaagt ggttagggca aattacaggt 11700 tttatctcaa actctaactt tatgttttgc tagtacacga aactctgcaa tttgcaatat 11760 agtgatagct aatcactatg aatggtaaga tacaagctag tacacataag aagatattac 11820 ttcttctcag gcagattcgc agcaaagaaa aattttccct tacaacaata gataaaagaa 11880 aagagggtat cacccctctt tcctctttat atgggggtat cttctactca ttttttattt 11940 cgaggtatat gcaccatcga ccacatactg actaccggtc acaaatgaag catcatcaga 12000 aagtaggaag gcaacaacct gagcaacttc ttccggctgt cccaaacgac caatcggatg 12060 tagttttacc atttctgctt cttcaaattc tgcaatcaaa ggcgttttga tatagccagg 12120 atgtactgaa ttaatgcgaa tccctttatc tgcatattcc aatgccgccg ctttcgttag 12180 acccgttacg ccatgttttg cagcgacata gcctgaaata ttttgaatcc cgatcaagcc 12240 tgcaatagaa gcggtattga caatcgctcc gccccctgcg gccaagattg caggaacttc 12300 ataatgcatg ctgtagaaaa ccgcattcaa gttcacatca atcacacgac gccatccttc 12360 aatgctcaat tcttcggtgg agttaacttc acccagaatt cccgcattat tgaaggccaa 12420 atgcagtgca ccaaaagtgc tgaccgcaaa ctcgactgca gctttcatgt cttcaggctc 12480 agcagtattg gccttattcg cagccgcttt cccgcctaaa gcgacaattt cgtccacaac 12540 tttctgtgct gcttccaggt taatatctga aaccactaca cttacaccct gttgagccaa 12600 aagcagtgcg gtgcttttac caatacctga accagcgcca gtaattaaag cgactttatt 12660 gttgaattta tttgacataa ttttttccat ttcaaatttt aagcatcaaa gcttgtttca 12720 tattttaaga ttcaagaaac cagatccggt agatgactcg tctgccaagc gacaacccgt 12780 ctgatatcag gcttgcgatt caccctgtag acggttttca ttcctaaatt ctgtatttcc 12840 aagttatata aacaaaagtg ctaatctatg gggaattccc aggatccaaa caaatagaat 12900 gccatgaaag catcttttgc caagcgctgt gctgtatgtt tcctagacaa accaccaacg 12960 ataactgcaa ctttttgaac tccttacaat ttccttattt tctttcccct tcatcgcata 13020 aaaatagttt ttgcattcac aacaaaatca gcatgaatag tttttaaact cactgtacat 13080 attttctata ttgatgacca agctggatat tgaattgcaa aattctatac agcctgttca 13140 acatgatcga tttagaaggc atacagtaaa cgtgactgaa gtccagaaat ttccaagcca 13200 ttttcaacat tcacatcttg tcgccattgt aataatagct gcagattcgg cttgatattg 13260 gtagaagcag aaacgacaaa ggtatctttt ctatcactgc cacgttcagt gacaccattc 13320 accttttctt taccgccatc ggtatgtctc caggtgacag ccaaattgga tttatcggtc 13380 actttataga gtgcggagaa atctgtctgg aaaaaaacct ctttctcaat gttggtatat 13440 ttttgctcgc tataaagttc aaactgcccc accccctcaa gcgcaaattt atcagttaaa 13500 gcatggtaat aaccggcctg aacattatat tgatagcgat cattactgat ggcaaaaccc 13560 ttcgtttcat tactgccggt aggtacggtc aaaaaaccac cgaaaccaaa atagcgccct 13620 ttttcagcat catgcaatgg ccaggcgata ccacccacaa ttaaatcacc gacacccgag 13680 atatcatcag cgccattcat cttttgcttg gcaaaaggca agaggaattg aggatctaca 13740 atccaatccc ctacttcaat aaaacgaacg taacgcaata ttcccaaatc aatgcttaaa 13800 tcgagatcat cagcgacttt atcaccattt gcatacgcct tatccgcttc cgtatgctgg 13860 taataggcaa ccgctaagtt ggttccccct ggaagtgctt gataatcccc ggcatcagaa 13920 ctcacccctg cggcttgcag gtccaaagcg gcagttaaag caaagaccaa agcagctatt 13980 ttttgatttg aacgatgata gaaatagttt ttcatttgtt tcatttttaa ctctccgttg 14040 ttttgactca tttttttaaa atgagtcttc ctagcacaaa gaccactcag gtctttgcgc 14100 aatttcttga ttttgatttg ggtattaaat atggaaaaac gttgggtgat cagttttcgt 14160 gcataagcac aatacgcccg atgacgttgc catctttcaa gtctccaaat gcggaattga 14220 tctgcgaaat tggcagtttt ttcacgggaa tggctgacat gtgggtttct ttcaccagct 14280 ccaccagctc tcttaattcc tctaccgtcc ctacataact gccctggatt gtgagtggtc 14340 tcattggaat caccggaatg gaaagcttaa tttctccccc catcaatccg cagatcacaa 14400 tatgcccacc acgtgcagca ctcgccaagg caaggctcaa tgttggatta ctgccaacca 14460 gatcaaggat cagacgtgca ccaccgtcag ttgcctgaat cagctgttga gcagcatcct 14520 cacttcggct attgatgacc gataatgcac cggcagcacg tgctgcttcc agtttgctgt 14580 catcaatatc aactacgatt gcgcctttgg cttgcatagc tttgagcaac tcgagtgcca 14640 tcagccctaa accaccggca ccaatgatca ccaccggctc gctttgaatc aaatcaccga 14700 attttttcag tgcactgtat gttgtcacgc ctgcacatgc caaaggtgca gcttcagcca 14760 gatccagacc tgcaatatcc accagatatc gtggatgcgg cacgatgata tattcggcaa 14820 aaccacccgg cttggcgatg cctaactgtt gcggtttggc acacaggttt tcttcgccac 14880 gtttacagta gttgcattca ccgcaaccaa tccatggatg aaccaagctg accatgccga 14940 ccttgactga ttccgcatct ggaccgacag caaccacctg acctgtaatt tcatgactta 15000 aggttaaggg tggcttcagc ccacgatctg caagggataa acgcttgccc ccacctagat 15060 cataataacc ttcccataag tgtaaatccg tatggcatag acctgcggct tttacatgga 15120 gtaaaacttc agtacctttc ggttgcggaa tttctttctc aacgtcttcg agtggttgtc 15180 catgatgcgt cacgcagtaa cagtgcatga atctctcctt tgaaacaata aaatagacgg 15240 ccttgtagtg aacaaagtct tttattcact aagttttata cgccgtgtgg gcactgattt 15300 atgctttaaa ccactgcgca attttcgcta attcttgatc agcttcactt gcacgcccag 15360 ctaggaaagg aaaaacgtgc tgcatgttgt ccaccacaga taaagtcaca tcaacaccct 15420 ctttttttgc aatatcagca agacgtgttg cattgtctac aagtgattca actgatccgg 15480 cattgatata caaacgtggg aaaacctgat aattggcttt taacggattc gccaatggat 15540 ttgccggatc accatgttca cccaagaaca tttgtgacat gcctttaagc agatccactg 15600 taatcaaggc atcagtggca tcgttgctga tcagggtttc acctttgtgc tccatatcca 15660 gccaaggaga gaatgcaatc actgctcctg gcaactcaat cccttcattt cgtagattga 15720 gtacggttga tatcgccaga ttcccccccg cagaatcccc tgcggtcagc atattttttg 15780 cagtaaagcc acgctggagt agttctttat atactgctgt cacgtcctga atttgtgccg 15840 ggaagacatg ttctggtgaa cgtcggtaat caaccacaaa tgcggatacc cctaaatact 15900 tggccaaatg ccccaccagc ttacggtgac tggccgaaga accgaccgca aatccaccgc 15960 catgggtata aatgatgact ttggataagt cagcatcttt cggataaatc caaagacctt 16020 ctacacctgc cacaacatcg aatttataag acacttcttc cggttccaat gtaggttgat 16080 gccattcatc aaacatactg cgaaagtctt caatggtcat attcggattt tcctgcatcc 16140 gtcttgacca gttcgcatat aaatcgaaaa gaaattgagt attgctttgt gtgctattca 16200 ttttaaaatc cttgatttga tatttaagga ataaatccta gttttattcc atgaagatat 16260 aaaaacttga gtgccatcac tcatggctag acactcagaa gatccaaatc taaagagtgg 16320 ctttgcatca ctggtttgat acaatttttt gcatgactaa gtaatctacg gataatctaa 16380 ccgtttcaaa ttagtatttt aaaatgtaaa aaatacatac cagcgaatgt tttctgcaaa 16440 atcgcatcct gttcaatata gcttttgatc ctacttattc tcttttctat tccagtccgt 16500 tataaaaaag ctttcattca ttttcatgca atcatgagct atgaatgttc ttaaacatta 16560 aacgattgtg tgtatggctg acttgtacat tcttgtactt atttttgtat aaaatgatca 16620 ggctcatcaa tttatgggaa aaattacaat tcgggtacaa tatctttcct gtttcatgaa 16680 tctattcaac tcattaaact tacgaccctc aactgcccaa aatcatagga tctgccgatc 16740 cacttgcaga attagcaatg ctaaaacatg aactccaaag agttactaaa aaaagagcat 16800 attaaaaaaa agccgtggca tatttcgcaa gccagttcaa gtcaggtatg tctttattca 16860 gtacctcagt taaactttag attttcataa cgatggttat tctgcatggc taaatacgct 16920 aatcagcaaa aaactctcca aaagataggc acagaaacac atatcaacca taaaaaccat 16980 ctcagacagt atatttacaa gcctctaatt caccgcactc acacttctct gcaagccttt 17040 ttaaataccc tgtacaaagt tctcagcctg atgaagcttc accttggact tagctttcag 17100 ttcagcctgt acttggtcag tttctgaatt ttcatttgca taaaactcct ccaccacatc 17160 cataccctcc tcaatgtcag tttcaaaatg tgcattgtca tagccttgcc gtgccatttg 17220 aatggcttat tgaagattaa tggcatcacg taaagttaaa tccacgtaat acacaggtgt 17280 tcgatagctt tgcgtcgtag actttctcga agagtcaatt gcagcggtag gcatgacagc 17340 aagccattca atgccgcatg gtaataactc agccgtgcgg ccaacgttcg tatgctgtta 17400 aaacccggtt attctaa 17417 <210> 74 <211> 1164 <212> DNA <213> Escherichia coli <400> 74 atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60 ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120 gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180 gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240 gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300 accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360 caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420 gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480 caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540 tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600 gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660 ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720 cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780 ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840 cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900 cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960 gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020 acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080 gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140 cgtatatacg aagccgcccg ctaa 1164
<210> 75 <211> 387 <212> PRT
<213> Escherichia coli
<400> 75
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys 1 5 10 15
Cly Ala Ile Ala Cly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
20 25 30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp 35 40 45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly 50 5 5 60
Ile Clu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu 65 70 75 80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Cly Ser 85 90 95
Val Leu Asp Cly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu 100 105 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
115 120 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
130 135 140 Glu Ser Asn Ala Cly Ala Val Ile Ser Arg Lys Thr Thr Cly Asp Lys 145 150 155 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp 165 170 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val 180 185 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val 195 200 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu 210 215 220
Ile Glu Asp Cly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val 225 230 235 240
Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile 245 250 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu 260 265 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val 275 280 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu 290 295 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp 305 310 315 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln 325 330 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser 340 345 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu 355 360 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu 370 375 380 Ala Ala Arg
385
<210> 76
<211> 1623
<212> DNA
<213> BaciTTus subtilis
<400> 76
atgtatttgg cattccaggt gcaaaaattg atgcggtatt tgacgcttta caagataaag 60 gacctgaaat tatcgttgcc cggcacgaac aaaacgcagc aattcatggc ccaagcagtc 120 ggccgtttaa ctggaaaacc gggagtcgtg ttagtcacat caggaccggg tgcctctaac 180 ttggcaacag gcctgctgac agcgaacact gaaggagacc ctgtcgttgc gcttgctgga 240 aacgtgatcc gtgcatatcg tttaaaacgg acacatcaat ctttggataa tgcggcgcta 300 ttccagccga ttacaaaata cagtgtagaa gttcaagatg taaaaaatat accggaagct 360 gttacaaatg catttaggat agcgtcagca gggcaggctg gggccgcttt tgtgagcttt 420 ccgcaagatg ttgtgaatga agtcacaaat acgaaaaacg tgcgtgctgt tgcagcgcca 480 aaactcggtc ctgcagcaga tgatgcaatc agtgcggcca tagcaaaaat ccaaacagca 540 aaacttcctg tcgttttggt cggcatgaaa ggcggaagac cggaagcaat taaagcggtt 600 cgcaagcttt tgaaaaaggt tcagcttcca tttgttgaaa catatcaagc tgccggtacc 660 ctttctagag atttagagga tcaatatttt ggccgtatcg gtttgttccg caaccagcct 720 ggcgatttac tgctagagca ggcagatgtt gttctgacga tcggctatga cccgattgaa 780 tatgatccga aattctggaa tatcaatgga gaccggacaa ttatccattt agacgagatt 840 atcgctgaca ttgatcatgc ttaccagcct gatcttgaat tgatcggtga cattccgtcc 900 acgatcaatc atatcgaaca cgatgctgtg aaagtggaat ttgcagagcg tgagcagaaa 960 atcctttctg atttaaaaca atatatgcat gaaggtgagc aggtgcctgc agattggaaa 1020 tcagacagag cgcaccctct tgaaatcgtt aaagagttgc gtaatgcagt cgatgatcat 1080 gttacagtaa cttgcgatat cggttcgcac tccatttgga tgtcacgtta tttccgcagc 1140 tacgagccgt taacattaat gatcagtaac ggtatgcaaa cactcggcgt tgcgcttcct 1200 tgggcaatcg gcgcttcatt ggtgaaaccg ggagaaaaag tggtttctgt ctctggtgac 1260 ggcggtttct tattctcagc aatggaatta gagacagcag ttcgactaaa agcaccaatt 1320 gtacacattg tatggaacga cagcacatat gacatggtgc atttccagca attgaaaaaa 1380 tataaccgta catctgcggt cgatttcgga aatatcgata tcgtgaaata tgcggaaagc 1440 ttcggagcaa ctgcgttgcg cgtagaatca ccagaccagc tggcagatgt tctgcgtcaa 1500 ggcatgaacg ctgaaggtcc tgtcatcatc gatgtcccgg ttgactacag tgataacatt 1560 aatttagcaa gtgacaagct tccgaaagaa ttcggggaac tcatgaaaac gaaagctctc 1620 tag 1623
<210> 77 <211> 540 <212> PRT
<213> BacilTus subtilis <400> 77
Met Tyr Leu Ala Phe Cln Val Gln Lys Leu Met Arg Tyr Leu Thr Leu 1 5 10 15
Tyr Lys Ile Lys Asp Leu Lys Leu Ser Leu Pro Gly Thr Asn Lys Thr 20 25 30
Gln Gln Phe Met Ala Gln Ala Val Gly Arg Leu Thr Gly Lys Pro Gly 35 40 45
Val Val Leu Val Thr Ser Gly Pro Gly Ala Ser Asn Leu Ala Thr Gly 50 55 60
Leu Leu Thr Ala Asn Thr Glu Gly Asp Pro Val Val Ala Leu Ala Gly 65 70 75 80
Asn Val Ile Arg Ala Tyr Arg Leu Lys Arg Thr His Gln Ser Leu Asp 85 90 95
Asn Ala Ala Leu Phe Gln Pro Ile Thr Lys Tyr Ser Val Glu Val Gln 100 105 110
Asp Val Lys Asn Ile Pro Glu Ala Val Thr Asn Ala Phe Arg Ile Ala 115 120 125
Ser Ala Gly Gln Ala Gly Ala Ala Phe Val Ser Phe Pro Gln Asp Val 130 135 140
Val Asn Glu Val Thr Asn Thr Lys Asn Val Arg Ala Val Ala Ala Pro 145 150 155 160
Lys Leu Gly Pro Ala Ala Asp Asp Ala Ile Ser Ala Ala Ile Ala Lys 165 170 175
Ile Gln Thr Ala Lys Leu Pro Val Val Leu Val Gly Met Lys Gly Gly 180 185 190 Arg Pro Glu Ala Ile Lys Ala Val Arg Lys Leu Leu Lys Lys Val Gln 195 200 205
Leu Pro Phe Val Glu Thr Tyr Gln Ala Ala Gly Thr Leu Ser Arg Asp 210 215 220
Leu Glu Asp Gln Tyr Phe Gly Arg Ile Gly Leu Phe Arg Asn Gln Pro 225 230 235 240
Gly Asp Leu Leu Leu Glu Gln Ala Asp Val Val Leu Thr Ile Gly Tyr 245 250 255
Asp Pro Ile Glu Tyr Asp Pro Lys Phe Trp Asn Ile Asn Gly Asp Arg 260 265 270
Thr Ile Ile His Leu Asp Glu Ile Ile Ala Asp Ile Asp His Ala Tyr 275 280 285
Gln Pro Asp Leu Glu Leu Ile Gly Asp Ile Pro Ser Thr Ile Asn His 290 295 300
Ile Glu His Asp Ala Val Lys Val Glu Phe Ala Glu Arg Glu Gln Lys 305 310 315 320
Ile Leu Ser Asp Leu Lys Gln Tyr Met His Glu Gly Glu Gln Val Pro 325 330 335
Ala Asp Trp Lys Ser Asp Arg Ala His Pro Leu Glu Ile Val Lys Glu 340 345 350
Leu Arg Asn Ala Val Asp Asp His Val Thr Val Thr Cys Asp Ile Gly 355 360 365
Ser His Ser Ile Trp Met Ser Arg Tyr Phe Arg Ser Tyr Glu Pro Leu 370 375 380
Thr Leu Met Ile Ser Asn Gly Met Gln Thr Leu Gly Val Ala Leu Pro 385 390 395 400
Trp Ala Ile Gly Ala Ser Leu Val Lys Pro Gly Glu Lys Val Val Ser 405 410 415
Val Ser Gly Asp Gly Gly Phe Leu Phe Ser Ala Met Glu Leu Glu Thr 420 425 430 Ala Val Arg Leu Lys Ala Pro Ile Val His Ile Val Trp Asn Asp Ser 435 440 445
Thr Tyr Asp Met Val His Phe Gln Glri Leu Lys Lys Tyr Asn Arg Thr 450 455 460
Ser Ala Val Asp Phe Gly Asn Ile Asp Ile Val Lys Tyr Ala Glu Ser 465 470 475 480
Phe Gly Ala Thr Ala Leu Arg Val Glu Ser Pro Asp Gln Leu Ala Asp 485 490 495
Val Leu Arg Gln Gly Met Asn Ala Glu Gly Pro Val Ile Ile Asp Val 500 505 510
Pro Val Asp Tyr Ser Asp Asn Ile Asn Leu Ala Ser Asp Lys Leu Pro 515 520 525
Lys Glu Phe Gly Glu Leu Met Lys Thr Lys Ala Leu 530 535 540
<210> 78 <211> 1680 <212> DNA
<213> KTebsielTa terrigena
<400> 78
atggacaaac cgcgtcacga acgtcaatgg gcccacggtg ccgacttaat cgtcagccag 60
cttgaggccc agggcgtacg ccaggtcttc ggcatccccg gtgccaaaat cgacaaggtg 120
tttgattccc tcctcgactc ctcaatccgc attattccgg tgcgccacga ggctaacgcc 180
gcctttatgg ccgcggcggt cgggcggatt accggtaaag cgggcgtcgc gctggtgacc 240
tccggtcccg gctgctcaaa cctgattacc ggcatggcca ccgccaatag cgaaggcgac 300
ccggtggtgg cgctgggcgg cgcggtgaag cgcgcggata aggccaagct ggttcaccaa 360
agcatggaca ccgtggcgat gttcagcccg gtcaccaaat acgccgtcga ggtgaccgcc 420
tccgacgcgc tggccgaggt ggtctccaac gcctttcgcg ccgccgaaca ggggcgtccg 480
gggagcgcgt ttgtcagcct gccgcaggat atcgttgacg gccccgccag cggcagcacg 540
ctgcccgcca gcagagcgcc gcagatgggc gccgcgccgg atggcgccgt tgacagcgtg 600
gcgcaggcga tcgccgcggc gaagaaccct atcttcctgc tcgggctgat ggccagccag 660
ccggaaaaca gccgcgccct gcaccgccat gctggaaaaa agccatattc cggtcaccag 720
cacctatcag gcgccggggc ggtaaatcag gataacttcg cccgcttcgc cggccgggta 780 ggcctgttta ataaccaggc gggcgatcgc ctgctgcgtc aggcggacct gatcatctgc 840 atcggctata gcccggttga gtacgaaccg gcgatgtgga acagcggcac ggcaaccctg 900 gtgcatatcg acgtgctgcc ggcctatgaa gagcggaact acgtcccgga tatcgagctg 960 gtgggcgaca tcgccgccac cctcgagaag ctggcccagc gcattgaaca tcggctggtg 1020 ttaactccgc aggcggcgga catcctcgcc gaccgccagc gccagcggga gctgcttgac 1080 cgccgcgggg cgcagctgaa tcagtttgcg ctccacccgc tgcgcatcgt gcgggcgatg 1140 caggatatcg tcaatagcga cgtcaccttg accgtcgata tgggcagttt ccatatctgg 1200 attgcccgct acctctacag cttccgcgcc cgccaggtga tgatctccaa cggtcagcaa 1260 acgatgggcg tcgcgctgcc gtgggcaatc ggcgcgtggc tggtcaatcc gcagcgcaag 1320 gtggtctcgg tatccggcga tggcggcttc ctgcagtcga gcatggagct ggagaccgcc 1380 gtgcgcctgc acgccaatat tctgcacatc atctgggtcg ataacggcta caacatggtg 1440 gcgattcagg aacagaagaa atatcagcgc ctctccggcg tggagttcgg cccggtcgat 1500 ttcaaagtct acgccgaagc gttcggggcc tgcgggtttg cggtagagag cgccgaggcc 1560 ctggagccga ccctgcgcgc ggcgatggat gtcgacggcc cggcggtggt cgccattccg 1620 gtcgattacc gcgataaccc tctgctgatg ggccagctcc atctcagcca aatactgtga 1680
<210> 79 <211> 559 <212> PRT
<213> KlebsieTla terrigena
<400> 79
Met Asp Lys Pro Arg His Glu Arg Gln Trp Ala His Gly Ala Asp Leu 1 5 10 15
Ile Val Ser Gln Leu Glu Ala Gln Gly Val Arg Gln Val Phe Gly Ile 20 25 30
Pro Gly Ala Lys Ile Asp Lys Val Phe Asp Ser Leu Leu Asp Ser Ser 35 40 45
Ile Arg Ile Ile Pro Val Arg His Glu Ala Asn Ala Ala Phe Met Ala 50 55 60
Ala Ala Val Gly Arg Ile Thr Gly Lys Ala Gly Val Ala Leu Val Thr 65 70 75 80
Ser Gly Pro Gly Cys Ser Asn Leu Ile Thr Gly Met Ala Thr Ala Asn 85 90 95 Ser Glu Cly Asp Pro Val Val Ala Leu Gly Gly Ala Val Lys Arg Ala 100 105 110
Asp Lys Ala Lys Leu Val His Gln Ser Met Asp Thr Val Ala Met Phe 115 120 125
Ser Pro Val Thr Lys Tyr Ala Val Glu Val Thr Ala Ser Asp Ala Leu 130 135 140
Ala Glu Val Val Ser Asn Ala Phe Arg Ala Ala Glu Gln Gly Arg Pro 145 150 155 160
Gly Ser Ala Phe Val Ser Leu Pro Gln Asp Ile Val Asp Gly Pro Ala 165 170 175
Ser Gly Ser Thr Leu Pro Ala Ser Arg Ala Pro Gln Met Gly Ala Ala 180 185 190
Pro Asp Gly Ala Val Asp Ser Val Ala Gln Ala Ile Ala Ala Ala Lys 195 200 205
Asn Pro Ile Phe Leu Leu Gly Leu Met Ala Ser Gln Pro Glu Asn Ser 210 215 220
Arg Ala Leu His Arg His Ala Gly Lys Lys Pro Tyr Ser Gly His Gln 225 230 235 240
His Leu Ser Gly Ala Gly Ala Val Asn Gln Asp Asn Phe Ala Arg Phe 245 250 255
Ala Gly Arg Val Gly Leu Phe Asn Asn Gln Ala Gly Asp Arg Leu Leu 260 265 270
Arg Gln Ala Asp Leu Ile Ile Cys Ile Gly Tyr Ser Pro Val Glu Tyr 275 280 285
Glu Pro Ala Met Trp Asn Ser Cly Thr Ala Thr Leu Val His Ile Asp 290 295 300
Val Leu Pro Ala Tyr Glu Glu Arg Asn Tyr Val Pro Asp Ile Glu Leu 305 310 315 320
Val Gly Asp Ile Ala Ala Thr Leu Glu Lys Leu Ala Gln Arg Ile Glu 325 330 335 His Arg Leu Val Leu Thr Pro Gln Ala Ala Asp Ile Leu Ala Asp Arg 340 345 350
Cln Arg Gln Arg Glu Leu Leu Asp Arg Arg Gly Ala Gln Leu Asn Gln 355 360 365
Phe Ala Leu His Pro Leu Arg Ile Val Arg Ala Met Gln Asp Ile Val 370 375 380
Asn Ser Asp Val Thr Leu Thr Val Asp Met Gly Ser Phe His Ile Trp 385 390 395 400
Ile Ala Arg Tyr Leu Tyr Ser Phe Arg Ala Arg Gln Val Met Ile Ser 405 410 415
Asn Gly Gln Gln Thr Met Gly Val Ala Leu Pro Trp Ala Ile Gly Ala 420 425 430
Trp Leu Val Asn Pro Gln Arg Lys Val Val Ser Val Ser Gly Asp Gly 435 440 445
Gly Phe Leu Gln Ser Ser Met Glu Leu Glu Thr Ala Val Arg Leu His 450 455 460
Ala Asn Ile Leu His Ile Ile Trp Val Asp Asn Gly Tyr Asn Met Val 465 470 475 480
Ala Ile Gln Glu Gln Lys Lys Tyr Gln Arg Leu Ser Gly Val Glu Phe 485 490 495
Gly Pro Val Asp Phe Lys Val Tyr Ala Glu Ala Phe Gly Ala Cys Gly 500 505 510
Phe Ala Val Glu Ser Ala Glu Ala Leu Glu Pro Thr Leu Arg Ala Ala 515 520 525
Met Asp Val Asp Gly Pro Ala Val Val Ala Ile Pro Val Asp Tyr Arg 530 535 540
Asp Asn Pro Leu Leu Met Gly Gln Leu His Leu Ser Gln Ile Leu 545 550 555
<210> 80
<211> 768
<212> DNA
<213> Bacillus subtilis <400> 80
atgaaacgag aaagcaacat tcaagtgctc agccgtggtc aaaaagatca gcctgtgagc 60 cagatttatc aagtatcaac aatgacttct ctattagacg gagtatatga cggagatttt 120 gaactgtcag agattccgaa atatggagac ttcggtatcg gaacctttaa caagcttgac 180 ggagagctga ttgggtttga cggcgaattt taccgtcttc gctcagacgg aaccgcgaca 240 ccggtccaaa atggagaccg ttcaccgttc tgttcattta cgttctttac accggacatg 300 acgcacaaaa ttgatgcgaa aatgacacgc gaagactttg aaaaagagat caacagcatg 360 ctgccaagca gaaacttatt ttatgcaatt cgcattgacg gattgtttaa aaaggtgcag 420 acaagaacag tagaacttca agaaaaacct tacgtgccaa tggttgaagc ggtcaaaaca 480 cagccgattt tcaacttcga caacgtgaga ggaacgattg taggtttctt gacaccagct 540 tatgcaaacg gaatcgccgt ttctggctat cacctgcact tcattgacga aggacgcaat 600 tcaggcggac acgtttttga ctatgtgctt gaggattgca cggttacgat ttctcaaaaa 660 atgaacatga atctcagact tccgaacaca gcggatttct ttaatgcgaa tctggataac 720 cctgattttg cgaaagatat cgaaacaact gaaggaagcc ctgaataa 768
<210> 81 <211> 255 <212> PRT
<21Β> BaciTTus subtiTis
<400> 81
Met Lys Arg Clu Ser Asn Ile Gln Val Leu Ser Arg Gly Gln Lys Asp 1 5 10 15
Gln Pro Val Ser Gln Ile Tyr Gln Val Ser Thr Met Thr Ser Leu Leu 20 25 30
Asp Gly Val Tyr Asp Gly Asp Phe Glu Leu Ser Glu Ile Pro Lys Tyr 35 40 45
Gly Asp Phe Gly Ile Gly Thr Phe Asn Lys Leu Asp Gly Glu Leu Ile
50 55 60
Gly Phe Asp Gly Glu Phe Tyr Arg Leu Arg Ser Asp Gly Thr Ala Thr
65 70 75 80
Pro Val Gln Asn Gly Asp Arg Ser Pro Phe Cys Ser Phe Thr Phe Phe 85 90 95 Thr Pro Asp Met Thr His Lys Ile Asp Ala Lys Met Thr Arg Glu Asp 100 105 110
Phe Clu Lys Glu Ile Asn Ser Met Leu Pro Ser Arg Asn Leu Phe Tyr 115 120 125
Ala Ile Arg Ile Asp Gly Leu Phe Lys Lys Val Gln Thr Arg Thr Val 130 135 140
Glu Leu Gln Glu Lys Pro Tyr Val Pro Met Val Glu Ala Val Lys Thr 145 150 155 160
Gln Pro Ile Phe Asn Phe Asp Asn Val Arg Gly Thr Ile Val Gly Phe 165 170 175
Leu Thr Pro Ala Tyr Ala Asn Gly Ile Ala Val Ser Gly Tyr His Leu 180 185 190
His Phe Ile Asp Glu Gly Arg Asn Ser Gly Gly His Val Phe Asp Tyr 195 200 205
Val Leu Glu Asp Cys Thr Val Thr Ile Ser Gln Lys Met Asn Met Asn 210 215 220
Leu Arg Leu Pro Asn Thr Ala Asp Phe Phe Asn Ala Asn Leu Asp Asn 225 230 235 240
Pro Asp Phe Ala Lys Asp Ile Glu Thr Thr Glu Gly Ser Pro Glu 245 250 255
60 120 180 240 300 360 420
<210> 82 <211> 780 <212> DNA <213> KTebsieTTa terrigena <400> 82 gtgaatcatt atcctgaatg cacctgccag tccgcccacc accctgatag cgttatctat ggggtctatg agggtagcac caccatcgcc ggcaccttta acgaactcga tggcgaactg cgcgctgacg gcagcgcgcg taaagcccgg acctggttca gaccgcagta ccgtaaaacc cacgacgtta tcgaccagca aatcccctcc
gagagcctgt gcgaaaccgt acgcggcttc cagacctctc tgatgagcgc gctgctgagc gacctgctga cccacggcga cttcggtctc attgccttta gcagcgaggt ctaccagctg gcggatcaaa aaacgccctt cgcggtgatg tttgaccacc cggtcagccg ccagcagctg gataacctgt tctgcgccct gcatattgat ggtcactttc gccacgccca cacccgcacc gtgccgcggc agacgccgcc ctatcgggcg 480 atgaccgacg tgctcgatga ccagccggtt ttccgcttca accagcgcaa ggggacgctg 540 gtcggctttc gcaccccgca gcatatgcag ggccttaacg ttgccggcta ccacgagcac 600 tttattaccg acgatcgcca gggcggcggc catctgctgg actaccagct cgatagcggc 660 gtgctgacct tcggcgagat ccacaagctg atgattgacc tcccggccga cagcgctttc 720 ctgcaggccg acctgcatcc tgacaatctc gatgccgcta ttcgtgcggt agaaaactaa 780
<210> 83 <211> 259 <212> PRT
<213> KTebsieTTa terrigena <400> 83
Met Asn His Tyr Pro Clu Cys Thr Cys Cln Glu Ser Leu Cys Glu Thr 1 5 10 15
Val Arg Gly Phe Ser Ala His His Pro Asp Ser Val Ile Tyr Gln Thr 20 25 30
Ser Leu Met Ser Ala Leu Leu Ser Gly Val Tyr Glu Gly Ser Thr Thr 35 40 45
Ile Ala Asp Leu Leu Thr His Gly Asp Phe Gly Leu Gly Thr Phe Asn 50 55 60
Glu Leu Asp Gly Glu Leu Ile Ala Phe Ser Ser Glu Val Tyr Gln Leu 65 70 75 80
Arg Ala Asp Gly Ser Ala Arg Lys Ala Arg Ala Asp Gln Lys Thr Pro 85 90 95
Phe Ala Val Met Thr Trp Phe Arg Pro Gln Tyr Arg Lys Thr Phe Asp 100 105 110
His Pro Val Ser Arg Gln Gln Leu His Asp Val Ile Asp Gln Gln Ile 115 120 125
Pro Ser Asp Asn Leu Phe Cys Ala Leu His Ile Asp Gly His Phe Arg 130 135 140
His Ala His Thr Arg Thr Val Pro Arg Gln Thr Pro Pro Tyr Arg Ala 145 150 155 160 Met Thr Asp Val Leu Asp Asp GTn Pro Val Phe Arg Phe Asn Gln Arg
165 170 175
Lys Gly Thr Leu Val Gly Phe Arg Thr Pro Gln His Net Gln Gly Leu 180 185 190
Asn Val Ala Gly Tyr His Glu His Phe Ile Thr Asp Asp Arg Gln Gly 195 200 205
Gly Gly His Leu Leu Asp Tyr Gln Leu Asp Ser Gly Val Leu Thr Phe
210 215 220
Gly Glu Ile His Lys Leu Met Ile Asp Leu Pro Ala Asp Ser Ala Phe
225 230 235 240
Leu Gln Ala Asp Leu His Pro Asp Asn Leu Asp Ala Ala Ile Arg Ala 245 250 255
Val Glu Asn
<210> 84 <211> 1053 <212> DNA
<213> BacilTus cereus <400> 84
atgaaagcac tactttggca taatcaacgt gatgtacgag tagaagaagt accagaacca 60
acagtaaaac caggaacagt gaaaatcaaa gttaaatggt gtggtatttg tgggacagac 120
ttgcatgaat atttagcagg gcctattttt attccaacag aagaacatcc attaacacat 180
gtgaaagcac ctgttatttt aggtcatgag tttagtggtg aggtaataga gattggtgaa 240
ggagttacat ctcataaagt gggagaccgc gttgttgtag agccaattta ttcttgtggt 300
aaatgtgaag cttgtaaaca tggacattac aatgtttgtg aacaacttgt tttccacggt 360
cttggcggag aaggcggcgg tttctctgaa tatacagtag taccagaaga tatggttcat 420
cacattccag atgaaatgac gtatgaacaa ggtgcgcttg tagaaccagc agcagtagca 480
gttcatgcag tacgtcaaag taaattaaaa gaaggggaag ctgtagcggt atttggttgc 540
ggtccaattg gacttcttgt tatccaagca gctaaagcag caggagcaac tcctgttatt 600
gcagttgaac tttctaaaga acgtcaagag ttagcgaaat tagcaggtgc ggattatgta 660
ttaaatccag caactcaaga tgtgttagct gaaattcgta acttaacaaa tggtttaggt 720
gtaaatgtta gctttgaagt aacaggtgtt gaagttgtac tacgccaagc gattgaaagt 780 acaagcttcg aaggacaaac tgtaattgtt agtgtatggg aaaaagacgc aacaattact 840 ccaaataact tagtattaaa agaaaaagaa gttattggta ttttaggata ccgtcacatc 900 ttcccagctg ttattaaatt gattagctcc ggtcaaattc aagcagagaa attaattacg 960 aaaaaaatta cagtggatca agttgttgaa gaaggatttg aagcacttgt aaaagataaa 1020 acacaagtga aaattcttgt ttcacctaaa taa 1053
<210> 85 <211> 350 <212> PRT
<213> BacilTus cereus <400> 85
Met Lys Ala Leu Leu Trp His Asn Gln Arg Asp Val Arg Val Clu Glu 1 5 10 15
Val Pro Glu Pro Thr Val Lys Pro Gly Thr Val Lys Ile Lys Val Lys 20 2 5 30
Trp Cys Gly Ile Cys Gly Thr Asp Leu His Clu Tyr Leu Ala Gly Pro 35 40 45
Ile Phe Ile Pro Thr Clu Clu His Pro Leu Thr His Val Lys Ala Pro 50 55 60
Val Ile Leu Cly His Glu Phe Ser Gly Glu Val Ile Glu Ile Gly Glu 65 70 75 80
Gly Val Thr Ser His Lys Val Gly Asp Arg Val Val Val Clu Pro Ile 85 90 95
Tyr Ser Cys Cly Lys Cys Clu Ala Cys Lys His Gly His Tyr Asn Val 100 105 110
Cys Clu Cln Leu Val Phe His Gly Leu Gly Cly Glu Gly Gly Gly Phe 115 120 125
Ser Glu Tyr Thr Val Val Pro Glu Asp Met Val His His Ile Pro Asp 130 135 140
Glu Met Thr Tyr Glu Gln Gly Ala Leu Val Glu Pro Ala Ala Val Ala 145 150 155 160
Val His Ala Val Arg Gln Ser Lys Leu Lys Glu Gly Glu Ala Val Ala 165 170 175 Val Phe Cly Cys Cly Pro Ile Gly Leu Leu Val Ile Cln Ala Ala Lys 180 185 190
Ala Ala Gly Ala Thr Pro Val Ile Ala Val Glu Leu Ser Lys Glu Arg 195 200 205
Gln Glu Leu Ala Lys Leu Ala Gly Ala Asp Tyr Val Leu Asn Pro Ala 210 215 220
Thr Gln Asp Val Leu Ala Glu Ile Arg Asn Leu Thr Asn Gly Leu Cly 225 230 235 240
Val Asn Val Ser Phe Glu Val Thr Gly Val Glu Val Val Leu Arg Gln 245 250 255
Ala Ile Glu Ser Thr Ser Phe Glu Gly Gln Thr Val Ile Val Ser Val 260 265 270
Trp Glu Lys Asp Ala Thr Ile Thr Pro Asn Asn Leu Val Leu Lys Glu 275 280 285
Lys Glu Val Ile Cly Ile Leu Gly Tyr Arg His Ile Phe Pro Ala Val 290 295 300
Ile Lys Leu Ile Ser Ser Gly Gln Ile Gln Ala Glu Lys Leu Ile Thr 305 310 315 320
Lys Lys Ile Thr Val Asp Gln Val Val Glu Glu Gly Phe Glu Ala Leu 325 330 335
Val Lys Asp Lys Thr Gln Val Lys Ile Leu Val Ser Pro Lys 340 345 350
<210> 86
<211> 1053
<212> DNA
<213> BaciTTus cereus
<400> 86
<4UU> Ob
atgaaagcac tactttggca taatcaacgt gatgtacgag tagaagaagt accagaacca 60
acagtaaaac caggaacagt gaaaatcaaa gttaaatggt gtggtatttg tgggacagac 120
ttgcatgaat atttagcagg gcctattttt attccaacag aagaacatcc attaacacat 180
gtgaaagcac ctgttatttt aggtcatgag tttagtggtg aggtaataga gattggtgaa 240
ggagttacat ctcataaagt gggagaccgc gttgttgtag agccaattta ttcttgtggt 300 aaatgtgaag cttgtaaaca tggacattac aatgtttgtg aacaacttgt tttccacggt 360 cttggcggag aaggcggcgg tttctctgaa tatacagtag taccagaaga tatggttcat 420 cacattccag atgaaatgac gtatgaacaa ggtgcgcttg tagaaccagc agcagtagca 480 gttcatgcag tacgtcaaag taaattaaaa gaaggggaag ctgtagcggt atttggttgc 540 ggtccaattg gacttcttgt tatccaagca gctaaagcag caggagcaac tcctgttatt 600 gcagttgaac tttctaaaga acgtcaagag ttagcgaaat tagcaggtgc ggattatgta 660 ttaaatccag caactcaaga tgtgttagct gaaattcgta acttaacaaa tggtttaggt 720 gtaaatgtta gctttgaagt aacaggtgtt gaagttgtac tacgccaagc gattgaaagt 780 acaagcttcg aaggacaaac tgtaattgtt agtgtatggg aaaaagacgc aacaattact 840 ccaaataact tagtattaaa agaaaaagaa gttattggta ttttaggata ccgtcacatc 900 ttcccagctg ttattaaatt gattagctcc ggtcaaattc aagcagagaa attaattacg 960 aaaaaaatta cagtggatca agttgttgaa gaaggatttg aagcacttgt aaaagataaa 1020 acacaagtga aaattcttgt ttcacctaaa taa 1053
<210> 87 <211> 350 <212> PRT
<213> BaciTTus cereus <400> 87
Met Lys Ala Leu Leu Trp His Asn Gln Arg Asp Val Arg Val Clu Glu 1 5 10 15
Val Pro Glu Pro Thr Val Lys Pro Gly Thr Val Lys Ile Lys Val Lys 20 25 30
Trp Cys Gly Ile Cys Gly Thr Asp Leu His Glu Tyr Leu Ala Gly Pro
35 40 45
Ile Phe Ile Pro Thr Glu Glu His Pro Leu Thr His Val Lys Ala Pro 50 55 60
Val Ile Leu Gly His Clu Phe Ser Gly Glu Val Ile Glu Ile Cly Clu 65 70 75 80
Gly Val Thr Ser His Lys Val Gly Asp Arg Val Val Val Glu Pro Ile 85 90 95
Tyr Ser Cys Gly Lys Cys Glu Ala Cys Lys His Gly His Tyr Asn Val 100 105 110 Cys Glu Gln Leu Val Phe His Gly Leu Gly Gly Glu Gly Gly Gly Phe 115 120 125
Ser Glu Tyr Thr Val Val Pro Glu Asp Met Val His His Ile Pro Asp 130 135 140
Glu Met Thr Tyr Glu Gln Gly Ala Leu Val Glu Pro Ala Ala Val Ala 145 150 155 160
Val His Ala Val Arg Gln Ser Lys Leu Lys Glu Gly Glu Ala Val Ala 165 170 175
Val Phe Gly Cys Gly Pro Ile Gly Leu Leu Val Ile Gln Ala Ala Lys 180 185 190
Ala Ala Gly Ala Thr Pro Val Ile Ala Val Glu Leu Ser Lys Glu Arg 195 200 205
Gln Glu Leu Ala Lys Leu Ala Gly Ala Asp Tyr Val Leu Asn Pro Ala 210 215 220
Thr Gln Asp Val Leu Ala Glu Ile Arg Asn Leu Thr Asn Gly Leu Gly 225 230 235 240
Val Asn Val Ser Phe Glu Val Thr Gly Val Glu Val Val Leu Arg Gln 245 250 255
Ala Ile Glu Ser Thr Ser Phe Glu Gly Gln Thr Val Ile Val Ser Val 260 265 270
Trp Glu Lys Asp Ala Thr Ile Thr Pro Asn Asn Leu Val Leu Lys Glu 275 280 285
Lys Glu Val Ile Gly Ile Leu Gly Tyr Arg His Ile Phe Pro Ala Val 290 295 300
Ile Lys Leu Ile Ser Ser Gly Gln Ile Gln Ala Glu Lys Leu Ile Thr 305 310 315 320
Lys Lys Ile Thr Val Asp Gln Val Val Glu Glu Gly Phe Glu Ala Leu 325 330 335
Val Lys Asp Lys Thr Gln Val Lys Ile Leu Val Ser Pro Lys 340 345 350 <210> 88
<211> IllB
<212> DNA
<213> Lactococcus Tactis
<400> 88
ttgcctgaaa cgacaaccat cctatataga ggaggcgttt ttatgcgcgc agcacgtttt 60 tacgaccgcg gggatatccg cattgatgaa attaatgaac caatagtaaa agctggccaa 120 gttggcattg atgtggcttg gtgtggaatt tgtggaacag atctccatga atttttagat 180 ggcccaattt tttgtccgtc agcagaacat cctaatccaa ttactggaga agtaccacca 240 gtcactcttg gacatgaaat gtctggggtt gtaaatttta taggtgaagg agtaagcgga 300 cttaaagtag gtgaccatgt cgttgtcgaa ccttatatcg ttcccgaagg gactgataca 360 agtgaaactg gacattataa cctctcagaa ggctcaaact ttattggttt gggcggaaat 420 ggtggaggtt tggctgaaaa aatttctgtt gatgaacgtt gggttcacaa aattcctgat 480 aacttaccat tggatgaagc tgctctaatt gagccactat cagtcggcta tcacgctgtt 540 gaacgagcaa atttaagtga aaagagtacg gtattagttg ttggtgctgg accaattgga 600 ctattaactg ctgccgttgc aaaagcgcaa ggacatactg ttatcatcag tgaacctagt 660 ggacttcgtc gtaaaaaagc acaagaagca caagttgctg attatttctt caatccaatt 720 gaagatgaca ttcaagctaa agttcatgaa attaatgaaa aaggagtgga cgcagccttt 780 gaatgtacct ctgtccaacc gggatttgac gcttgtctag atgcgattcg tatgggtgga 840 acagttgtca ttgtcgcaat ttggggcaag cctgctagtg ttgatatggc aaaattagta 900 atcaaagaag ctaacctttt aggaacgatt gcttataata acactcatcc aaaaacaatt 960 gatttagtat caacaggtaa aataaaattg gaccaattca tcacagctaa aatcggtttg 1020 gatgatttga ttgataaagg attcgatacg ctgattcatc ataatgaaac agctgttaaa 1080 attttagttt caccaactgg taaaggtcta taa 1113
<210> 89 <211> 370 <212> PRT
<213> Lactococcus Taetis
<400> 89
Met Pro Clu Thr Thr Thr Ile Leu Tyr Arg Gly Gly Val Phe Met Arg 1 5 10 15
Ala Ala Arg Phe Tyr Asp Arg Gly Asp Ile Arg Ile Asp Glu Ile Asn 20 25 30 Glu Pro Ile Val Lys Ala Gly Gln Val Gly Ile Asp Val Ala Trp Cys 35 40 45
Gly Ile Cys Gly Thr Asp Leu His Glu Phe Leu Asp Gly Pro Ile Phe 50 55 60
Cys Pro Ser Ala Glu His Pro Asn Pro Ile Thr Gly Glu Val Pro Pro 65 70 75 80
Val Thr Leu Gly His Glu Met Ser Gly Val Val Asn Phe Ile Gly Glu 85 90 95
Gly Val Ser Gly Leu Lys Val Gly Asp His Val Val Val Glu Pro Tyr 100 105 110
Ile Val Pro Glu Gly Thr Asp Thr Ser Glu Thr Gly His Tyr Asn Leu 115 120 125
Ser Glu Gly Ser Asn Phe Ile Gly Leu Gly Gly Asn Gly Gly Gly Leu 130 135 140
Ala Glu Lys Ile Ser Val Asp Glu Arg Trp Val His Lys Ile Pro Asp 145 150 155 160
Asn Leu Pro Leu Asp Glu Ala Ala Leu Ile Glu Pro Leu Ser Val Gly 165 170 175
Tyr His Ala Val Glu Arg Ala Asn Leu Ser Glu Lys Ser Thr Val Leu 180 185 190
Val Val Gly Ala Gly Pro Ile Gly Leu Leu Thr Ala Ala Val Ala Lys 195 200 205
Ala Gln Gly His Thr Val Ile Ile Ser Glu Pro Ser Gly Leu Arg Arg 210 215 220
Lys Lys Ala Gln Glu Ala Gln Val Ala Asp Tyr Phe Phe Asn Pro Ile 225 230 235 240
Glu Asp Asp Ile Gln Ala Lys Val His Glu Ile Asn Glu Lys Gly Val 245 250 255
Asp Ala Ala Phe Glu Cys Thr Ser Val Gln Pro Gly Phe Asp Ala Cys 260 265 270 Leu Asp Ala Ile Arg Met Gly Gly Thr Val Val Ile Val Ala Ile Trp 275 280 285 Gly Lys Pro Ala Ser Val Asp Met Ala Lys Leu Val Ile Lys Glu Ala 290 295 300 Asn Leu Leu Gly Thr Ile Ala Tyr Asn Asn Thr His Pro Lys Thr Ile 305 310 315 320 Asp Leu Val Ser Thr Gly Lys Ile Lys Leu Asp Gln Phe Ile Thr Ala 325 330 335 Lys Ile Gly Leu Asp Asp Leu Ile Asp Lys Gly Phe Asp Thr Leu Ile 340 345 350 His His Asn Glu Thr Ala Val Lys Ile Leu Val Ser Pro Thr Gly Lys 355 360 365 Gly Leu 370
<210> 90 <211> 705 <212> DNA
<213> Pyrococcus furiosus <400> 90
atgaaggttg ccgtaattac tggggcatcc cgtggaatcg gggaagctat agcaaaggcc 60
cttgctgaag atggatattc ccttgcctta ggggctagaa gtgttgatag gttagagaag 120
attgccaagg aactcagcga aaaacatggg gtggaggtat tttacgacta cctcgatgta 180
tcaaaaccag aaagcgttga agagtttgca aggaaaacgc tagctcactt tggagatgtg 240
gacgttgttg tggccaatgc ggggcttggt tactttggta ggcttgaaga gcttacagaa 300
gagcagttcc acgaaatgat tgaagtaaac cttttgggag tttggagaac aataaaagct 360
ttcttaaact ccttaaagcg gactggagga gtggctattg ttgttacttc agatgtttct 420
gcaaggctac ttccatacgg tggaggttat gtggcaacta aatgggctgc aagagcattg 480
gtaaggacct tccagattga gaatccagat gtgaggttct tcgagctaag acctggagca 540
gtagatacat attttggagg gagcaaagct gggaagccaa aggagcaagg gtatttaaaa 600
cctgaggaag ttgctgaggc agtaaaatac ctcctaagac ttccaaagga tgttagggtt 660
gaggaattaa tgttgcgctc aatttatcaa aaacctgagt attga 705
<210> 91 <211> 234 <212> PRT
<213> Pyrococcus furiosus <400> 91
Met Lys Val Ala Val Ile Thr Gly Ala Ser Arg Gly Ile Gly Glu Ala 1 5 10 15
Ile Ala Lys Ala Leu Ala Glu Asp Gly Tyr Ser Leu Ala Leu Gly Ala 20 25 30
Arg Ser Val Asp Arg Leu Glu Lys Ile Ala Lys Glu Leu Ser Glu Lys 35 40 45
His Gly Val Glu Val Phe Tyr Asp Tyr Leu Asp Val Ser Lys Pro Glu 50 55 60
Ser Val Glu Glu Phe Ala Arg Lys Thr Leu Ala His Phe Gly Asp Val 65 70 75 80
Asp Val Val Val Ala Asn Ala Gly Leu Gly Tyr Phe Gly Arg Leu Glu 85 90 95
Glu Leu Thr Glu Glu Gln Phe His Glu Met Ile Glu Val Asn Leu Leu 100 105 110
Gly Val Trp Arg Thr Ile Lys Ala Phe Leu Asn Ser Leu Lys Arg Thr 115 120 125
Gly Gly Val Ala Ile Val Val Thr Ser Asp Val Ser Ala Arg Leu Leu 130 135 140
Pro Tyr Gly Gly Gly Tyr Val Ala Thr Lys Trp Ala Ala Arg Ala Leu 145 150 155 160
Val Arg Thr Phe Gln Ile Glu Asn Pro Asp Val Arg Phe Phe Glu Leu 165 170 175
Arg Pro Gly Ala Val Asp Thr Tyr Phe Gly Gly Ser Lys Ala Gly Lys 180 185 190
Pro Lys Glu Gln Gly Tyr Leu Lys Pro Glu Glu Val Ala Glu Ala Val 195 200 205
Lys Tyr Leu Leu Arg Leu Pro Lys Asp Val Arg Val Glu Glu Leu Met 210 215 220 Leu Arg Ser Ile Tyr Cln Lys Pro Glu Tyr
225 230
<210> 92 <211> 1665 <212> DNA
<213> SalmoneTTa typhimurium <400> 92
atgagatcga aaagatttga agcactggcg aaacgccctg aaggagtgga tcgaagaagg ctttatcgcg atggaaagcc ataaaaatcg ttaacggcgc ggtaaccgag ctggacggaa ctgatcgacc actttatcgc ccgctacggc atcaacctga gcgatggatt cggtcaagct ggctaacatg ctgtgcgatc atcgttccgc taaccaccgc gatgacccca gcgaaaattg aacgtggttg agatgatgat ggcgatgcag aaaatgcgcg caggcgcacg tcaccaacgt taaagacaac ccggtgcaaa ggcgcatggc gcgggtttga cgaacaagag acgacggttg ttcaacgcca tcgcgctgct ggttggttct caggtaggtc tgctcgctgg aagaagccac cgagctgaag ctcggcatgc gaaaccatct ccgtttacgg caccgagccg gtcttcaccg tcgaagggct tcttagcctc ttcctacgcc tctcgcggcc ggctccggct ccgaagtgca gatgggctac gccgaaggca gcgcgctgca tctatatcac caaagccgcg ggcgttcagg agcagcatcg gcgtaccgtc tgccgtgccg tcaggcattc ctgatctgct cttcgctgga tctggaatgc gcctccagta tccgatatgc gtcgtaccgc tcgcctgctg atgcagttcc tcctccggtt attccgcggt gccgaactac gacaacatgt gcggaagact ttgacgacta caacgttatc cagcgtgacc cgcccggttc gcgaagagga cgttatcgcc atccgtaaca gccgtgtttg ccggaatggg actgccgccg attaccgatg tatgcccacg gttcgaaaga tatgccggag cgcaacatcg caggaaatca tcaataaaaa ccgcaacggt ctggaagttg gggtttaccg acgtggccca ggacatgctc aacatccaga
tgaatcagga cggctttgtt 60 cgaacgaccc aaaaccgtcg 120 aaccggttag cgaattcgac 180 accgcgccga agaagtgatg 240 cgaacgtcaa gcgcagcgaa 300 tcgaagtggt ttcgcatatg 360 cccgccgtac tccatctcaa 420 ttgccgccga tgccgccgaa 480 cggtagcgcg ctatgcgccg 540 gtccgggggt actgactcaa 600 tgggccacac ctgctacgcc 660 acggtgacga taccccatgg 720 tgaaaatgcg cttcacctcc 780 aatccatgct gtatctggaa 840 ggctgcaaaa cggctccgta 900 gtgccgtgct ggcggaaaac 960 acgaccagac cttcacccac 1020 tgccgggtac cgactttatc 1080 tcgccggttc caacgaagat 1140 tgaaagtgga cggcggtctg 1200 aagccgcccg cgcgctgcag 1260 aagaagttga agccgcgacc 1320 tcgaagacat caagttcgcc 1380 tgaaagcgct ggctcagggc 1440 aagccaagct aaccggcgac 1500 tatttgcaca cctccgccat tatcgtcggc gacggacaag tgctctctgc ggttaatgac 1560 gtcaatgact atgccggtcc ggcaacaggt tatcgcctgc agggagaacg ctgggaagag 1620 attaaaaaca tccctggcgc tcttgatccc aacgagattg attaa 1665
<210> 93 <211> 554 <212> PRT
<213> SalmoneTla typhimurium <400> 93
Met Arg Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Cln 1 5 10 15
Asp Cly Phe Val Lys Clu Trp Ile Glu Glu Cly Phe Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Cly Ala Val 35 40 45
Thr Glu Leu Asp Gly Lys Pro Val Ser Glu Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Asn Arg Ala Glu Clu Val Met 65 70 75 80
Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Lys Arg Ser Glu Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser His Met Asn Val Val Clu Met Met Met Ala 115 120 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val 130 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Gly Ala Trp Arg Gly Phe Asp Clu Gln Clu Thr Thr Val Ala Val Ala 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Cly Ser Gln Val 180 185 190 Cly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Clu Glu Ala Thr Glu 195 200 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Cly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Ser Ile Gly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320
Leu Ile Cys Ser Ser Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Cln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Cly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Gly Cly Leu 385 390 395 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr 420 425 430 Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile
Asn Lys Asn Arg Asn Gly Leu Glu Val Val Lys Ala Leu Ala Gln Gly
Gly Phe Thr Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Gly Asp Gly
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala
Thr Gly Tyr Arg Leu Gln Gly Glu Arg Trp Glu Glu Ile Lys Asn Ile
Pro Gly Ala Leu Asp Pro Asn Glu Ile Asp
<210> 94 <211> 675 <212> DNA
<213> Salmonella typhimurium <400> 94
atggaaatta atgaaaaatt gctgcgccag ataattgaag acgtactccg cgatatgaag 60
ggcagcgata aacccgtctc gtttaatgcg cctgcggcat ccacagcacc acagaccgct 120
gcgcctgcgg gcgacggctt tctgaccgaa gtgggcgaag cgcgccaggg cactcagcag 180
gacgaagtca ttatcgccgt cggcccggca tttggcctgg cgcaaaccgt caatatcgtc 240
ggcttaccgc ataagagcat tctgcgcgaa gtcattgccg gtattgaaga agaaggcatc 300
aaggcgcgcg tgattcgctg ctttaaatct tccgacgtgg cgttcgtcgc cgttgaaggt 360
aaccgcctga gcggatccgg catctccatc ggcatccagt cgaaaggtac tacggttatc 420
caccagcagg ggctaccgcc gctctccaac ctggagctgt tcccgcaggc accgctgctg 480
acgctggaaa cctaccgtca gattggtaaa aacgccgccc gctatgcgaa acgagaatca 540
ccgcagccgg tccctacgct caatgaccag atggcacgcc cgaagtacca ggcaaagtcg 600
gccattttgc atattaaaga gaccaagtac gtcgtgacgg gcaaaaaccc gcaggaactg 660 cgcgtggcgc tttga 675
<210> 95 <211> 224 <212> PRT
<21Β> Salmonella typhimurium <400> 95
Met Glu Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Asp Val Leu 1 5 10 15
Arg Asp Met Lys Gly Ser Asp Lys Pro Val Ser Phe Asn Ala Pro Ala 20 25 30
Ala Ser Thr Ala Pro Gln Thr Ala Ala Pro Ala Gly Asp Gly Phe Leu 35 40 45
Thr Glu Val Gly Glu Ala Arg Gln Gly Thr Gln Gln Asp Glu Val Ile 50 55 60
Ile Ala Val Gly Pro Ala Phe Gly Leu Ala Gln Thr Val Asn Ile Val 65 70 75 80
Gly Leu Pro His Lys Ser Ile Leu Arg Glu Val Ile Ala Gly Ile Glu 85 90 95
Glu Glu Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp 100 105 110
Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Gly Ser Gly Ile 115 120 125
Ser Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly 130 135 140
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu 145 150 155 160
Thr Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala 165 170 175
Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala 180 185 190
Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr 195 200 205 Lys Tyr Val Val Thr Gly Lys Asn Pro Cln Glu Leu Arg Val Ala Leu 210 215 220
<210> 96
<211> 522
<212> DNA
<213> SaTmoneTla typhimurium
<400> 96
atgaataccg acgcaattga atcgatggtc cgggacgtat tgagccgcat gaacagcctg 60 cagggcgatg cgccagcagc ggctcctgcg gcaggcggca cgtcccgcag cgcaaaggtc 120 agcgactacc cgctggcgaa caaacacccg gaatgggtga aaaccgccac caataaaacg 180 ctggacgact ttacgctgga aaacgtgctg agcaataaag tcaccgctca ggatatgcgt 240 attaccccgg aaaccctgcg cttacaggcc tctatcgcca aagatgcggg tcgcgaccgg 300 ctggcgatga acttcgaacg cgccgccgaa ctgaccgcgg taccggacga tcgcattctt 360 gaaatctaca acgcccttcg tccgtatcgt tcaacgaaag aagagctgct cgctatcgcc 420 gacgatctcg aaaaccgtta tcaggcaaag atttgcgcag ctttcgttcg tgaagcggca 480 gggctgtacg ttgagcgtaa aaaactcaaa ggcgacgatt aa 522
<210> 97 <211> 173
<212> PRT
<213> SaTmoneTTa typhimurium <400> 97
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Arg 1 5 10 15
Met Asn Ser Leu Gln Gly Asp Ala Pro Ala Ala Ala Pro Ala Ala Gly 20 25 30
Gly Thr Ser Arg Ser Ala Lys Val Ser Asp Tyr Pro Leu Ala Asn Lys 35 40 45
His Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe 50 55 60
Thr Leu Glu Asn Val Leu Ser Asn Lys Val Thr Ala Gln Asp Met Arg 65 70 75 80
Ile Thr Pro Glu Thr Leu Arg Leu Gln Ala Ser Ile Ala Lys Asp Ala 85 90 95 Gly Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu Thr 100 105 110
Ala Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro
115 120 125
Tyr Arg Ser Thr Lys Glu Glu Leu Leu Ala Ile Ala Asp Asp Leu Glu
130 135 140
Asn Arg Tyr Gln Ala Lys Ile Cys Ala Ala Phe Val Arg Glu Ala Ala
145 150 155 160
Gly Leu Tyr Val Glu Arg Lys Lys Leu Lys Gly Asp Asp
<210> 98
<211> 1677
<212> DNA
<213> Lactobacillus collinoides
<400> 98
ttggaacgtc aaaaaagatt tgaaaaatta gagaaacgtc cagtgcattt agatgggttc 60 gttaagaact gggacgacga aggtttagtt gcccttaacg gtaagaacga tccaaagcca 120 agcattacga tcgaaaacgg tgttgttact gaaatggatg gtaagaagaa ggcagacttc 180 gaccttatcg acaagtacat cgctgaatac gggatcaact tggacaatgc tgaaaagact 240 ttaaacacag attcagttaa gatcgccaac atgatgtgtg atcctaacgt ctcccgtgct 300 gaaattattg aatatacaac tgctatgaca ccagccaagg ctgctgaagt tatcagccag 360 ttaaacttcg ctgaaatgat catggcaact caaaagatgc ggccacgtcg gacccctatg 420 actcaagtcc acgctaccaa cactttggat aacccagttg aaatcgctgc tgatgctgcc 480 gaagctgcat tacgtggggt tcctgaagaa gaaaccacca ctgccattgc tcggtatgcg 540 ccaatgaacg ctatttcaat catggttggg gcccaagcag gccgtcctgg tgttatcacc 600 caatgttcag ttgaagaagc tgacgaattg agtttgggga tgcgtgggtt tactgcctat 660 gctgaaacca tttcagttta tgggactgac cgggtcttca ctgatggtga tgatacccct 720 tggtcaaaag gtttcttagc ttcttgctac gcttcacgtg gtttgaagat gcggtttact 780 tcaggtgccg gttcagaagc tatgatgggc tacactgaag gtaaatcaat gctttacctt 840 gaagctcgtt gtatctacat taccaaggcg tcaggtgttc aaggtctgca aaacggtggt 900 gttagttgta tcgggatgcc aggtgccgtc gttggtggta tccgtgaagt cttaggtgaa 960 aacttactat gtatgtcact tgatgttgaa tgtgcttctg gttgtgacca agccttctct 1020 cactctgaca ttcgtcggac tggccggatg attggccaat tcatcgctgg tactgattac 1080 ctgtcatcag gttacgctgc cgaagaaaac atggataaca ccttcgctgg ttcaaacatg 1140 gatgttctgg actacgatga ttacatcact ttggaacgtg atatggctat taacggtggt 1200 atcatgccaa ttaccgaaga ggaatctatt aagattcgtc acaaggctgc ggttgctatc 1260 caagctgtct ttgatggctt aggcctacca cagatcactg atgaagaagt tgaagccgca 1320 acttatggca gcaattcaaa cgacatgcca aaacgtgaca tggttcaaga tatgaaagct 1380 gctcaaggtc tgatgactcg tggcattact gttgttgacg ttatcaaggc cttatatgac 1440 catgatatta aagacgtcgc tgaggctgtg cttaagttag cgcaacaaaa ggtttgtggt 1500 gattacctgc aaacatctgc tgtcttcttg gatggttgga agtgtacttc agctattaac 1560 aacgctaacg attacaaagg cccaggtact ggttaccgtc tatgggaaga caaagacaaa 1620 tgggatcgtc tagaaaacgt tccgtgggct ttggatcctc agaagttgga attctaa 1677
<210> 99 <211> 558 <212> PRT
<21Β> Lactobaci Πus colIinoides <400> 99
Met Glu Arg Gln Lys Arg Phe Glu Lys Leu Glu Lys Arg Pro Val His 1 5 10 15
Leu Asp Gly Phe Val Lys Asn Trp Asp Asp Glu Gly Leu Val Ala Leu 20 25 30
Asn Gly Lys Asn Asp Pro Lys Pro Ser Ile Thr Ile Glu Asn Gly Val 35 40 45
Val Thr Glu Met Asp Gly Lys Lys Lys Ala Asp Phe Asp Leu Ile Asp 50 55 60
Lys Tyr Ile Ala Glu Tyr Gly Ile Asn Leu Asp Asn Ala Glu Lys Thr 65 70 75 80
Leu Asn Thr Asp Ser Val Lys Ile Ala Asn Met Met Cys Asp Pro Asn 85 90 95
Val Ser Arg Ala Glu Ile Ile Glu Tyr Thr Thr Ala Met Thr Pro Ala 100 105 110
Lys Ala Ala Glu Val Ile Ser Gln Leu Asn Phe Ala Glu Met Ile Met 115 120 125 Ala Thr Gln Lys Met Arg Pro Arg Arg Thr Pro Met Thr Gln Val His 130 135 140
Ala Thr Asn Thr Leu Asp Asn Pro Val Glu Ile Ala Ala Asp Ala Ala 145 150 155 160
Glu Ala Ala Leu Arg Gly Val Pro Glu Glu Glu Thr Thr Thr Ala Ile 165 170 175
Ala Arg Tyr Ala Pro Met Asn Ala Ile Ser Ile Met Val Gly Ala Gln 180 185 190
Ala Gly Arg Pro Gly Val Ile Thr Gln Cys Ser Val Glu Glu Ala Asp 195 200 205
Glu Leu Ser Leu Gly Met Arg Gly Phe Thr Ala Tyr Ala Glu Thr Ile 210 215 220
Ser Val Tyr Gly Thr Asp Arg Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Gly Phe Leu Ala Ser Cys Tyr Ala Ser Arg Gly Leu Lys 245 250 255
Met Arg Phe Thr Ser Gly Ala Gly Ser Glu Ala Met Met Gly Tyr Thr 260 265 270
Glu Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr 275 280 285
Lys Ala Ser Gly Val Gln Gly Leu Gln Asn Gly Gly Val Ser Cys Ile 290 295 300
Gly Met Pro Gly Ala Val Val Gly Gly Ile Arg Glu Val Leu Gly Glu 305 310 315 320
Asn Leu Leu Cys Met Ser Leu Asp Val Glu Cys Ala Ser Gly Cys Asp 325 330 335
Gln Ala Phe Ser His Ser Asp Ile Arg Arg Thr Gly Arg Met Ile Gly 340 345 350
Gln Phe Ile Ala Gly Thr Asp Tyr Leu Ser Ser Gly Tyr Ala Ala Glu 355 360 365 Glu Asn Met Asp Asn Thr Phe Ala Gly Ser Asn Met Asp Val Leu Asp B70 375 380
Tyr Asp Asp Tyr Ile Thr Leu Glu Arg Asp Met Ala Ile Asn Gly Gly 385 390 395 400
Ile Met Pro Ile Thr Glu Glu Glu Ser Ile Lys Ile Arg His Lys Ala 405 410 415
Ala Val Ala Ile Gln Ala Val Phe Asp Gly Leu Gly Leu Pro Gln Ile 420 425 430
Thr Asp Glu Glu Val Glu Ala Ala Thr Tyr Gly Ser Asn Ser Asn Asp 435 440 445
Met Pro Lys Arg Asp Met Val Gln Asp Met Lys Ala Ala Gln Gly Leu 450 455 460
Met Thr Arg Gly Ile Thr Val Val Asp Val Ile Lys Ala Leu Tyr Asp 465 470 475 480
His Asp Ile Lys Asp Val Ala Glu Ala Val Leu Lys Leu Ala Gln Gln 485 490 495
Lys Val Cys Gly Asp Tyr Leu Gln Thr Ser Ala Val Phe Leu Asp Gly 500 505 510
Trp Lys Cys Thr Ser Ala Ile Asn Asn Ala Asn Asp Tyr Lys Gly Pro 515 520 525
Gly Thr Gly Tyr Arg Leu Trp Glu Asp Lys Asp Lys Trp Asp Arg Leu 530 535 540
Glu Asn Val Pro Trp Ala Leu Asp Pro Gln Lys Leu Glu Phe 545 550 555
<210> 100 <211> 693 <212> DNA
<213> Lactobacillus collinoides <400> 100
gtgagttcag aaatcgatga aacattgctt agaaatatca ttaaaggcgt tttaaatgaa gttcaaaact ctgatacgcc aatttccttt ggtggccaag atgcagcccc agttgccggt
gccaaggaag gtgccgcacc agaaaagaag ttggattggt tccaacacgt tggaatcgcc aaaccaggtt tgtcaaagga tgaagttgta attggtgttg ccccagcatt tgctgaagtg 240 ttgacgcaaa ctatgacgaa gatccaacac aaagacatcc tgcgtcaaat cattgccgga 300 gttgaagaag aaggtctcaa ggcccgtgtc gttaaggttt atcggacttc agacgtttcc 360 ttcgtttccg ctgatgttga caagttgtca ggttcaggaa tttcagttgc cgttcaatca 420 aaggggacaa cgattattca ccaaaaggat caagcaccgt tgtcaaacct tgaattgttc 480 ccacaggctc cagttttgac attggacgct taccgtcaaa tcggtaagaa cgctgcccag 540 tatgctaagg gtatgtcacc aaccccagtg ccaacaatta acgaccagat ggcacgtgtg 600 caatatcaag cactttctgc tttgatgcac atcaaggaaa caaaacaggt tgttgttggg 660 aagcctgctg aagaaattaa ggtaaccttt tag 693
<210> 101 <211> 230 <212> PRT
<213> LactobaciTlus collinoides <400> 101
Met Ser Ser Glu Ile Asp Glu Thr Leu Leu Arg Asn Ile Ile Lys Gly 1 5 10 15
Val Leu Asn Glu Val Gln Asn Ser Asp Thr Pro Ile Ser Phe Gly Gly 20 25 30
Gln Asp Ala Ala Pro Val Ala Gly Ala Lys Glu Gly Ala Ala Pro Glu 35 40 45
Lys Lys Leu Asp Trp Phe Gln His Val Gly Ile Ala Lys Pro Gly Leu 50 5 5 60
Ser Lys Asp Glu Val Val Ile Gly Val Ala Pro Ala Phe Ala Glu Val 65 70 75 80
Leu Thr Gln Thr Met Thr Lys Ile Gln His Lys Asp Ile Leu Arg Gln 85 90 95
Ile Ile Ala Gly Val Glu Glu Glu Gly Leu Lys Ala Arg Val Val Lys 100 105 110
Val Tyr Arg Thr Ser Asp Val Ser Phe Val Ser Ala Asp Val Asp Lys 115 120 125
Leu Ser Gly Ser Gly Ile Ser Val Ala Val Gln Ser Lys Gly Thr Thr 130 135 140 Ile Ile His Gln Lys 145
Asp 150
Gln Ala Pro Leu Ser Asn 155
Leu Glu Leu Phe 160
Pro Gln Ala Pro Val 165
Leu Thr Leu Asp Ala Tyr Arg 170
Gln Ile Gly Lys 175
Asn Ala Ala Gln Tyr Ala 180
Lys Gly Met Ser Pro Thr 185
Pro Val Pro Thr 190
Ile Asn Asp Gln Met 195
Ala Arg Val Gln Tyr Gln Ala 200
Leu Ser Ala Leu 205
Met His Ile Lys Glu Thr 210
Lys 215
Gln Val Val Val Gly Lys Pro Ala Glu 220
Glu Ile Lys Val Thr 225
Phe 230
<210> 102 <211> 522 <212> DNA
<213> Lactobacillus collinoides <400> 102
atgagtgaag tagatgactt agtagctaga attgctgctc agctacaaca aagtggaaac 60 gcttctagtg cctcaactag tgccggtact tctgctggtt ccgagaaaga attaggcgca 120 gcagattacc cactatttga aaagcaccca gatcaaatca agacgccatc aggtaaaaat 180 gttgaagaaa tcaccttgga aaatgttatt aacggcaagg tagacgcaaa ggatatgcgg 240 attacgcccg caaccctgaa gttacaaggt gaaattgctg ccaacgcagg tcggccagca 300 atccaacgga acttccagcg ggcttctgaa ttaacttcag ttcccgatga tgttgttttg 360 gacttatata attcattacg gccattccgt tcaaccaagc aagaattatt ggataccgcc 420 aaggagcttc gtgacaagta tcacgcacct atctgtgccg gctggttcga agaagcagcc 480 gaaaactacg aagtcaacaa gaagttgaag ggcgataact ag 522
<210> 103 <211> 173 <212> PRT
<213> Lactobacillus collinoides <400> 103
Met Ser Glu Val Asp Asp Leu Val Ala Arg Ile Ala Ala Gln Leu Gln 15 10 15 Gln Ser Gly Asn Ala Ser Ser Ala Ser Thr Ser Ala Gly Thr Ser Ala 20 25 BO
Gly Ser Glu Lys Glu Leu Gly Ala Ala Asp Tyr Pro Leu Phe Glu Lys 35 40 45
His Pro Asp Gln Ile Lys Thr Pro Ser Gly Lys Asn Val Glu Glu Ile 50 55 60
Thr Leu Glu Asn Val Ile Asn Gly Lys Val Asp Ala Lys Asp Met Arg 65 70 75 80
Ile Thr Pro Ala Thr Leu Lys Leu Gln Gly Glu Ile Ala Ala Asn Ala 85 90 95
Gly Arg Pro Ala Ile Gln Arg Asn Phe Gln Arg Ala Ser Glu Leu Thr 100 105 110
Ser Val Pro Asp Asp Val Val Leu Asp Leu Tyr Asn Ser Leu Arg Pro 115 120 125
Phe Arg Ser Thr Lys Gln Glu Leu Leu Asp Thr Ala Lys Glu Leu Arg 130 135 140
Asp Lys Tyr His Ala Pro Ile Cys Ala Gly Trp Phe Glu Glu Ala Ala 145 150 155 160
Glu Asn Tyr Glu Val Asn Lys Lys Leu Lys Gly Asp Asn 165 170
<210> 104
<211> 1665
<212> DNA
<213> KlebsieTTa pneumoniae
<400> 104
atgagatcga aaagatttga agcactggcg aaacgccctg tgaatcagga tggtttcgtt 60 aaggagtgga ttgaagaggg ctttatcgcg atggaaagtc ctaacgatcc caaaccttct 120 atccgcatcg tcaacggcgc ggtgaccgaa ctcgacggta aaccggttga cgagttcgac 180 ctgattgacc actttatcgc gcgctacggc attaatctcg cccgggccga agaagtgatg 240 gccatggatt cggttaagct cgccaacatg ctctgcgacc cgaacgttaa acgcagcgac 300 atcgtgccgc tcactaccgc gatgaccccg gcgaaaatcg tggaagtggt gtcgcatatg 360 aacgtggtcg agatgatgat ggcgatgcaa aaaatgcgcg cccgccgcac gccgtcccag 420 caggcgcatg tcactaatat caaagataat ccggtacaga ttgccgccga cgccgctgaa 480 ggcgcatggc gcggctttga cgaacaggag accaccgtcg ccgtggcgcg ctacgcgcgg 540 ttcaacgcca tcgccctgct ggtgggttca caggttggcc gccccggcgt cctcacccag 600 tgttcgctgg aagaagccac cgagctgaaa ctgggcatgc tgggccacac ctgctatgcc 660 gaaaccattt cggtatacgg tacggaaccg gtgtttaccg atggcgatga cactccatgg 720 tcgaaaggct tcctcgcctc ctcctacgcc tcgcgcggcc tgaaaatgcg ctttacctcc 780 ggttccggtt ctgaagtaca gatgggctat gccgaaggca aatcgatgct ttatctcgaa 840 gcgcgctgca tctacatcac caaagccgcc ggggtgcaag gcctgcagaa tggctccgtc 900 agctgtatcg gcgtaccgtc cgccgtgccg tccgggatcc gcgccgtact ggcggaaaac 960 ctgatctgct cagcgctgga tctggagtgc gcctccagca acgatcaaac ctttacccac 1020 tcggatatgc ggcgtaccgc gcgtctgctg atgcagttcc tgccaggcac cgacttcatc 1080 tcctccggtt actcggcggt gcccaactac gacaacatgt tcgccggttc caacgaagat 1140 gccgaagact tcgatgacta caacgtgatc cagcgcgacc tgaaggtcga tgggggtctg 1200 cggccggtgc gtgaagagga cgtgatcgcc attcgcaaca aagccgcccg cgcgctgcag 1260 gcggtatttg ccggcatggg tttgccgcct attacggatg aagaggtaga agccgccacc 1320 tacgcccacg gttcaaaaga tatgcctgag cgcaatatcg tcgaggacat caagtttgct 1380 caggagatca tcaacaagaa ccgcaacggc ctggaggtgg tgaaagccct ggcgaaaggc 1440 ggcttccccg atgtcgccca ggacatgctc aatattcaga aagccaagct caccggcgac 1500 tacctgcata cctccgccat cattgttggc gagggccagg tgctctcggc cgtgaatgac 1560 gtgaacgatt atgccggtcc ggcaacaggc taccgcctgc aaggcgagcg ctgggaagag 1620 attaaaaata tcccgggcgc gctcgatccc aatgaacttg gctaa 1665
<210> 105 <211> 554 <212> PRT
<213> KlebsieTTa pneumoniae <400> 105
Met Arg Ser Lys Arg Phe Clu Ala Leu Ala Lys Arg Pro Val Asn Gln 1 5 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Arg Ile Val Asn Gly Ala Val 35 40 45 Thr Clu Leu Asp Cly Lys Pro Val Asp Glu Phe Asp Leu Ile Asp His 50 5 5 60
Phe Ile Ala Arg Tyr Cly Ile Asn Leu Ala Arg Ala Clu Glu Val Met 65 70 75 80
Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Lys Arg Ser Asp Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ala 115 120 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Cln Gln Ala His Val 130 135 140
Thr Asn Ile Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Cly Ala Trp Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala 165 170 175
Arg Tyr Ala Arg Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val 180 185 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285 Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Gly 290 295 BOO
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 BlO 315 320
Leu Ile Cys Ser Ala Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr 420 425 430
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile 450 455 460
Asn Lys Asn Arg Asn Gly Leu Glu Val Val Lys Ala Leu Ala Lys Gly 465 470 475 480
Gly Phe Pro Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys 485 490 495
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Gly Glu Gly 500 505 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala 515 520 525 Thr Cly Tyr Arg Leu Gln Gly Glu Arg Trp Glu Glu Ile Lys Asn Ile 530 535 540
Pro Gly Ala Leu Asp Pro Asn Glu Leu Gly 545 550
<210> 106
<211> 687
<212> DNA
<213> KTebsieTTa pneumoniae
<400> 106
atggaaatta acgaaacgct gctgcgccag attatcgaag aggtgctgtc ggagatgaaa 60 tcaggcgcag ataagccggt ctcctttagc gcgccggcgt ctgtcgcctc tgccgcgccg 120 gtcgccgttg cgcctgtgtc cggcgacagc ttcctgacgg aaatcggcga agccaaaccc 180 ggcacgcagc aggatgaagt cattattgcc gtcgggccag cgtttggtct ggcgcaaacc 240 gccaatatcg tcggcattcc gcataaaaat attctgcgcg aagtgatcgc cggcattgag 300 gaagaaggca tcaaagcccg ggtgatccgc tgctttaagt catctgacgt cgccttcgtg 360 gcagtggaag gcaaccgcct gagcggctcc ggcatctcga tcggtattca gtcgaaaggc 420 accaccgtca tccaccagcg cggcctgccg ccgctttcca atctggaact cttcccgcag 480 gcgccgctgt taacgctgga aacctaccgt cagattggca aaaacgccgc gcgctacgcc 540 aaacgcgagt cgccgcagcc ggtgccgacg cttaacgatc agatggctcg tcccaaatac 600 caggcgaagt cggccatttt gcacattaaa gagaccaaat acgtggtgac gggcaaaaac 660 ccgcaggaac tgcgcgtggc gctttaa 687
<210> 107 <211> 228 <212> PRT
<213> KTebsieTTa pneumoniae <400> 107
Met Glu Ile Asn Glu Thr Leu Leu Arg Gln Ile Ile Glu Glu Val Leu 1 5 10 15
Ser Glu Met Lys Ser Gly Ala Asp Lys Pro Val Ser Phe Ser Ala Pro 20 25 30
Ala Ser Val Ala Ser Ala Ala Pro Val Ala Val Ala Pro Val Ser Gly 35 40 45
Asp Ser Phe Leu Thr Glu Ile Gly Glu Ala Lys Pro Gly Thr Gln Gln 50 55 60 Asp Glu Val Ile Ile Ala Val Gly Pro Ala Phe Gly Leu Ala Gln Thr 65 70 75 80
Ala Asn Ile Val Gly Ile Pro His Lys Asn Ile Leu Arg Glu Val Ile 85 90 95
Ala Gly Ile Glu Glu Glu Gly Ile Lys Ala Arg Val Ile Arg Cys Phe 100 105 110
Lys Ser Ser Asp Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser 115 120 125
Gly Ser Gly Ile Ser Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile 130 135 140
His Gln Arg Gly Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln 145 150 155 160
Ala Pro Leu Leu Thr Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala 165 170 175
Ala Arg Tyr Ala Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu Asn 180 185 190
Asp Gln Met Ala Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His 195 200 205
Ile Lys Glu Thr Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu 210 215 220
Arg Val Ala Leu 225
60 120 180 240 300
<210> 108 <211> 525 <212> DNA
<213> KTebsieTTa pneumoniae <400> 108
atgaataccg acgcaattga atccatggta cgcgacgtgc tgagccggat gaacagccta caggacgggg taacgcccgc gccagccgcg ccgacaaacg acaccgttcg ccagccaaaa gttagcgact acccgttagc gacctgccat ccggagtggg tcaaaaccgc taccaataaa acgctcgatg acctgacgct ggagaacgta ttaagcgatc gcgttacggc gcaggacatg cgcatcactc cggaaacgct gcgtatgcag gcggcgatcg cccaggatgc cggacgcgat cggctggcga tgaactttga gcgggccgca gagctcaccg cggttcccga cgaccgaatc 360 cttgagatct acaacgccct gcgcccatac cgttccaccc aggcggagct actggcgatc 420 gctgatgacc tcgagcatcg ctaccaggca cgactctgtg ccgcctttgt tcgggaagcg 480 gccgggctgt acatcgagcg taagaagctg aaaggcgacg attaa 525
<210> 109 <211> 174 <212> PRT
<213> Klebsiella pneumoniae <400> 109
Met Asn Thr Asp Ala Ile Clu Ser Met Val Arg Asp Val Leu Ser Arg 1 5 10 15
Met Asn Ser Leu Cln Asp Gly Val Thr Pro Ala Pro Ala Ala Pro Thr 20 25 BO
Asn Asp Thr Val Arg Cln Pro Lys Val Ser Asp Tyr Pro Leu Ala Thr 35 40 45
Cys His Pro Clu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp 50 5 5 60
Leu Thr Leu Clu Asn Val Leu Ser Asp Arg Val Thr Ala Gln Asp Met 65 70 75 80
Arg Ile Thr Pro Glu Thr Leu Arg Met Gln Ala Ala Ile Ala Cln Asp 85 90 95
Ala Gly Arg Asp Arg Leu Ala Met Asn Phe Clu Arg Ala Ala Glu Leu 100 105 110
Thr Ala Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg 115 120 125
Pro Tyr Arg Ser Thr Gln Ala Glu Leu Leu Ala Ile Ala Asp Asp Leu 130 135 140
Glu His Arg Tyr Cln Ala Arg Leu Cys Ala Ala Phe Val Arg Glu Ala 145 150 155 160
Ala Gly Leu Tyr Ile Clu Arg Lys Lys Leu Lys Gly Asp Asp 165 170 <210> 110
<211> 1833
<212> DNA
<213> Klebsiella oxytoca
<400> 110
atgcgatata tagctggcat tgatatcggc aactcatcga cggaagtcgc cctggcgacc 60 ctggatgagg ctggcgcgct gacgatcacc cacagcgcgc tggcggaaac caccggaatc 120 aaaggcacgt tgcgtaacgt gttcgggatt caggaggcgc tcgccctcgt cgccagaggc 180 gccgggatcg ccgtcagcga tatttcgctc atccgcatca acgaagcgac gccggtgatt 240 ggcgatgtgg cgatggaaac cattaccgaa accatcatca ccgaatcgac catgatcggc 300 cataacccga aaacgcccgg cggcgcgggg cttggcacag gcatcaccat tacgccgcag 360 gagctgctaa cccgcccggc ggacgcgccc tatatcctgg tggtgtcgtc ggcgttcgat 420 tttgccgata tcgccagcgt gattaacgct tccctgcgcg ccgggtatca gattaccggc 480 gtcattttac agcgcgacga tggcgtgctg gtcagcaacc ggctggaaaa accgctgccg 540 atcgttgacg aagtgctgta catcgaccgc attccgctgg ggatgctggc ggcgattgag 600 gtcgccgttc cggggaaggt catcgaaacc ctctctaacc cttacggcat cgccaccgtc 660 tttaacctca gccccgagga gacgaagaac atcgtcccga tggcccgggc gctgattggc 720 aaccgttccg ccgtggtggt caaaacgcca tccggcgacg tcaaagcgcg cgcgataccc 780 gccggtaatc ttgagctgct ggcccagggc cgtagcgtgc gcgtggatgt ggccgccggc 840 gccgaagcca tcatgaaagc ggtcgacggc tgcggcaggc tcgataacgt caccggcgaa 900 tccggcacca atatcggcgg catgctggaa cacgtgcgcc agaccatggc cgagctgacc 960 aacaagccga gcagcgaaat atttattcag gacctgctgg ccgttgatac ctcggtaccg 1020 gtgagcgtta ccggcggtct ggccggggag ttctcgctgg agcaggccgt gggcatcgcc 1080 tcgatggtga aatcggatcg cctgcagatg gcaatgatcg cccgcgaaat cgagcagaag 1140 ctcaatatcg acgtgcagat cggcggcgca gaggccgaag ccgccatcct gggggcgctg 1200 accacgccgg gcaccacccg accgctggcg atcctcgacc tcggcgcggg ctccaccgat 1260 gcctccatca tcaaccccaa aggcgacatc atcgccaccc atctcgccgg cgcaggcgac 1320 atggtgacga tgattattgc ccgcgagctg gggctggaag accgctatct ggcggaagag 1380 atcaagaagt acccgctggc taaggtggaa agcctgttcc atttacgcca cgaggacggc 1440 agcgtgcagt tcttctccac gccgctgccg cccgccgtgt tcgcccgcgt ctgcgtggtg 1500 aaagcggacg aactggtgcc gctgcccggc gatttagcgc tggaaaaagt gcgcgccatt 1560 cgccgcagcg ccaaagagcg ggtctttgtc accaacgccc tgcgcgcgct gcgtcaggtc 1620 agccccaccg gcaacattcg cgatattccg ttcgtggtgc tggtcggcgg ttcgtcgctg 1680 gatttcgaag tcccgcagct ggtcaccgat gcgctggcgc actaccgcct ggttgccgga 1740 cggggaaata ttcgcggcag cgagggcccc cgaaacgcgg tggccaccgg cctgattctc 1800 tcctggcata aggagtttgc gcatgaacgg taa 1833
<210> 111 <211> 610 <212> PRT
<213> KlebsieTTa oxytoca <400> 111
Met Arg Tyr Ile Ala Gly Ile Asp Ile Gly Asn Ser Ser Thr Glu Val 1 5 10 15
Ala Leu Ala Thr Leu Asp Glu Ala Gly Ala Leu Thr Ile Thr His Ser 20 25 30
Ala Leu Ala Glu Thr Thr Gly Ile Lys Gly Thr Leu Arg Asn Val Phe 35 40 45
Gly Ile Gln Glu Ala Leu Ala Leu Val Ala Arg Gly Ala Gly Ile Ala 50 55 60
Val Ser Asp Ile Ser Leu Ile Arg Ile Asn Glu Ala Thr Pro Val Ile 65 70 75 80
Gly Asp Val Ala Met Glu Thr Ile Thr Glu Thr Ile Ile Thr Glu Ser 85 90 95
Thr Met Ile Gly His Asn Pro Lys Thr Pro Gly Gly Ala Gly Leu Gly 100 105 110
Thr Gly Ile Thr Ile Thr Pro Gln Glu Leu Leu Thr Arg Pro Ala Asp 115 120 125
Ala Pro Tyr Ile Leu Val Val Ser Ser Ala Phe Asp Phe Ala Asp Ile 130 135 140
Ala Ser Val Ile Asn Ala Ser Leu Arg Ala Gly Tyr Gln Ile Thr Gly 145 150 155 160
Val Ile Leu Gln Arg Asp Asp Gly Val Leu Val Ser Asn Arg Leu Glu 165 170 175 Lys Pro Leu Pro Ile Val Asp Glu Val Leu Tyr Ile Asp Arg Ile Pro 180 185 190
Leu Gly Met Leu Ala Ala Ile Glu Val Ala Val Pro Gly Lys Val Ile 195 200 205
Glu Thr Leu Ser Asn Pro Tyr Gly Ile Ala Thr Val Phe Asn Leu Ser 210 215 220
Pro Glu Glu Thr Lys Asn Ile Val Pro Met Ala Arg Ala Leu Ile Gly 225 230 235 240
Asn Arg Ser Ala Val Val Val Lys Thr Pro Ser Gly Asp Val Lys Ala 245 250 255
Arg Ala Ile Pro Ala Gly Asn Leu Glu Leu Leu Ala Gln Gly Arg Ser 260 265 270
Val Arg Val Asp Val Ala Ala Gly Ala Glu Ala Ile Met Lys Ala Val 275 280 285
Asp Gly Cys Gly Arg Leu Asp Asn Val Thr Gly Glu Ser Gly Thr Asn 290 295 300
Ile Gly Gly Met Leu Glu His Val Arg Gln Thr Met Ala Glu Leu Thr 305 310 315 320
Asn Lys Pro Ser Ser Glu Ile Phe Ile Gln Asp Leu Leu Ala Val Asp 325 330 335
Thr Ser Val Pro Val Ser Val Thr Gly Gly Leu Ala Gly Glu Phe Ser 340 345 350
Leu Glu Gln Ala Val Gly Ile Ala Ser Met Val Lys Ser Asp Arg Leu 355 360 365
Gln Met Ala Met Ile Ala Arg Glu Ile Glu Gln Lys Leu Asn Ile Asp 370 375 380
Val Gln Ile Gly Gly Ala Glu Ala Glu Ala Ala Ile Leu Gly Ala Leu 385 390 395 400
Thr Thr Pro Gly Thr Thr Arg Pro Leu Ala Ile Leu Asp Leu Gly Ala 405 410 415 Gly Ser Thr Asp Ala Ser Ile Ile Asn Pro Lys Cly Asp Ile Ile Ala 420 425 430
Thr His Leu Ala Cly Ala Cly Asp Met Val Thr Met Ile Ile Ala Arg 435 440 445
Clu Leu Gly Leu Glu Asp Arg Tyr Leu Ala Clu Clu Ile Lys Lys Tyr 450 455 460
Pro Leu Ala Lys Val Glu Ser Leu Phe His Leu Arg His Glu Asp Gly 465 470 475 480
Ser Val Gln Phe Phe Ser Thr Pro Leu Pro Pro Ala Val Phe Ala Arg 485 490 495
Val Cys Val Val Lys Ala Asp Clu Leu Val Pro Leu Pro Gly Asp Leu 500 505 510
Ala Leu Glu Lys Val Arg Ala Ile Arg Arg Ser Ala Lys Glu Arg Val 515 520 525
Phe Val Thr Asn Ala Leu Arg Ala Leu Arg Gln Val Ser Pro Thr Gly 530 535 540
Asn Ile Arg Asp Ile Pro Phe Val Val Leu Val Gly Gly Ser Ser Leu 545 550 555 560
Asp Phe Glu Val Pro Gln Leu Val Thr Asp Ala Leu Ala His Tyr Arg 565 570 575
Leu Val Ala Gly Arg Cly Asn Ile Arg Gly Ser Glu Gly Pro Arg Asn 580 585 590
Ala Val Ala Thr Gly Leu Ile Leu Ser Trp His Lys Glu Phe Ala His 595 600 605
Glu Arg 610
<210> 112
<211> 378
<212> DNA
<213> KlebsieTTa oxytoca
<400> 112
atgaacggta atcacagcgc cccggccatc gcgatcgccg tcatcgacgg ctgcgacggc ctgtggcgcg aagtgctgct gggtatcgaa gaggaaggta tccctttccg gctccagcat 120 cacccggccg gagaggtcgt ggacagcgcc tggcaggcgg cgcgcagctc gccgctgctg 180 gtgggcatcg cctgcgaccg ccatatgctg gtcgtgcact acaagaattt acccgcatcg 240 gcgccgcttt ttacgctgat gcatcatcag gacagtcagg cccatcgcaa caccggtaat 300 aacgcggcac ggctggtcaa ggggatccct ttccgggatc tgaatagcga agcaacagga 360 gaacagcagg atgaataa 378
<210> 113 <211> 125 <212> PRT
<213> KTebsieTTa oxytoca
<400> 113
Met Asn Cly Asn His Ser Ala Pro Ala Ile Ala Ile Ala Val Ile Asp 1 5 10 15
Gly Cys Asp Gly Leu Trp Arg Glu Val Leu Leu Cly Ile Glu Glu Glu 20 25 30
Gly Ile Pro Phe Arg Leu Gln His His Pro Ala Gly Glu Val Val Asp 35 40 45
Ser Ala Trp Gln Ala Ala Arg Ser Ser Pro Leu Leu Val Gly Ile Ala 50 55 60
Cys Asp Arg His Met Leu Val Val His Tyr Lys Asn Leu Pro Ala Ser 65 70 75 80
Ala Pro Leu Phe Thr Leu Met His His Gln Asp Ser Gln Ala His Arg 85 90 95
Asn Thr Gly Asn Asn Ala Ala Arg Leu Val Lys Gly Ile Pro Phe Arg 100 105 110
Asp Leu Asn Ser Glu Ala Thr Gly Glu Gln Gln Asp Glu 115 120 125
<210> 114
<211> 1833
<212> DNA
<213> SaTmoneTTa typhimurium
<400> 114
atgcgatata tagctggcat tgacatcggt aactcatcaa cggaagtcgc actggcgcgg
60 caagatgaga ctggcgcact gacgattaca cacagcgcgc aaaggcacgt tgcgtaacgt gttcggcatt caggaagcgc gcggggatca atgtcagaga tatttcgctc atccgcatta ggcgatgtgg cgatggaaac cattaccgaa accatcatca cataacccaa aaacgccggg cggagcaggc cttggtgtgg gagctgttaa cccgcccggc ggactcgtcc tatattctgg tttgctgata tcgccaatgt tatcaacgcc tcaatgcgcg gtcattttgc agcgcgacga tggcgtactg gtcagcaacc attgtcgatg aagttctgta catcgaccgc attccgctgg gtcgccgtgc cgggaaaggt tatcgaaacc ctctctaacc tttaatctca acgccgatga gacaaaaaac atcgtcccga aaccgttccg ccgtggtggt taaaacgcca tccggcgacg gccggtaacc tggagctgca ggctcagggt cgtaccgtgc gccgaagcca tcatgaaagc ggtggacggt tgcggcaagc gccgggacca atatcggcgg catgctggag cacgtgcgcc aacaagccga gcagtgagat tttcattcag gatctactgg gtgagcgtca ccggcggtct ggccggggag ttctcgctgg tcgatggtga aatcagaccg tctgcagatg gcgatgattg cttaatatcg acgtgcagat cggcggcgct gaggctgaag accacgccgg gtaccacccg accgctggcg atcctcgacc gcctccatca tcaaccctaa aggcgaaatc atcgccaccc atggtcacga tgattattgc ccgcgaactg gggctggaag atcaaaaaat acccgctggc taaggtcgaa agcctgttcc agcgtccagt tcttcccgac gccgctgcct cccgccgtgt aaaccggacg aactggtgcc gcttcccggc gacttagcgc cgccgcagcg ctaaagaacg cgtctttgtc accaacgccc agtccaaccg gcaacattcg cgatattccg ttcgtggtgc gatttcgaag ttccgcagct ggtcaccgat gcgctggcgc cgaggaaata ttcgcggcag cgaaggccca agaaacgcgg tcctggcata aggagtttgc gcatggacag taa
tggcggaaac caccgggatc 120 tcgccctcgt cgcaaagcgc 180 acgaagccac gccggtgatt 240 ccgaatcgac aatgatcggc BOO gtatcacgat tacgccggag 360 tggtatcgtc agcctttgat 420 ccggatacca gattaccggc 480 ggctggaaaa atcgctaccg 540 ggatgctggc ggcgattgaa 600 cttacggcat cgccaccgta 660 tggcgcgcgc gctgattggc 720 tcaaagcgcg cgcaataccc 780 gcgtggatgt tgccgccggt 840 tcgacaacgt caccggcgag 900 agaccatggc cgaactgacc 960 ccgttgacac ctcggttccg 1020 agcaggccgt cggcatcgcc 1080 cccgtgaaat tgagcagaag 1140 ccgccattct gggcgcgctg 1200 tcggcgcggg ctccaccgat 1260 atctcgccgg ggcaggcgac 1320 accgctatct ggcggaagag 1380 acttacgcca cgaggacggc 1440 tcgcccgcgt ctgcgtggtg 1500 tggaaaaagt gcgcgccatt 1560 tgcgcgcgct gcgccaggtc 1620 tggtcggcgg ctcgtcgctg 1680 actaccgcct ggtcgccggg 1740 tggccaccgg cctgattctc 1800 1833 <210> 115 <211> 610 <212> PRT
<213> SaTmoneTTa typhimurium <400> 115
Met Arg Tyr Ile Ala Gly Ile Asp Ile Gly Asn Ser Ser Thr Glu Val 1 5 10 15
Ala Leu Ala Arg Gln Asp Glu Thr Gly Ala Leu Thr Ile Thr His Ser 20 25 30
Ala Leu Ala Glu Thr Thr Gly Ile Lys Gly Thr Leu Arg Asn Val Phe 35 40 45
Gly Ile Gln Glu Ala Leu Ala Leu Val Ala Lys Arg Ala Gly Ile Asn 50 55 60
Val Arg Asp Ile Ser Leu Ile Arg Ile Asn Glu Ala Thr Pro Val Ile 65 70 75 80
Gly Asp Val Ala Met Glu Thr Ile Thr Glu Thr Ile Ile Thr Glu Ser 85 90 95
Thr Met Ile Gly His Asn Pro Lys Thr Pro Gly Gly Ala Gly Leu Gly 100 105 110
Val Gly Ile Thr Ile Thr Pro Glu Glu Leu Leu Thr Arg Pro Ala Asp 115 120 125
Ser Ser Tyr Ile Leu Val Val Ser Ser Ala Phe Asp Phe Ala Asp Ile 130 135 140
Ala Asn Val Ile Asn Ala Ser Met Arg Ala Gly Tyr Gln Ile Thr Gly 145 150 155 160
Val Ile Leu Gln Arg Asp Asp Gly Val Leu Val Ser Asn Arg Leu Glu 165 170 175
Lys Ser Leu Pro Ile Val Asp Glu Val Leu Tyr Ile Asp Arg Ile Pro 180 185 190
Leu Gly Met Leu Ala Ala Ile Glu Val Ala Val Pro Gly Lys Val Ile 195 200 205
Glu Thr Leu Ser Asn Pro Tyr Gly Ile Ala Thr Val Phe Asn Leu Asn 210 215 220 Ala Asp Glu Thr Lys Asn Ile Val Pro Met Ala Arg Ala Leu Ile Gly 225 230 235 240
Asn Arg Ser Ala Val Val Val Lys Thr Pro Ser Gly Asp Val Lys Ala 245 250 255
Arg Ala Ile Pro Ala Gly Asn Leu Glu Leu Gln Ala Gln Gly Arg Thr 260 265 270
Val Arg Val Asp Val Ala Ala Gly Ala Glu Ala Ile Met Lys Ala Val 275 280 285
Asp Gly Cys Gly Lys Leu Asp Asn Val Thr Gly Glu Ala Gly Thr Asn 290 295 300
Ile Gly Gly Met Leu Glu His Val Arg Gln Thr Met Ala Glu Leu Thr 305 310 315 320
Asn Lys Pro Ser Ser Glu Ile Phe Ile Gln Asp Leu Leu Ala Val Asp 325 330 335
Thr Ser Val Pro Val Ser Val Thr Gly Gly Leu Ala Gly Glu Phe Ser 340 345 350
Leu Glu Gln Ala Val Gly Ile Ala Ser Met Val Lys Ser Asp Arg Leu 355 360 365
Gln Met Ala Met Ile Ala Arg Glu Ile Glu Gln Lys Leu Asn Ile Asp 370 375 380
Val Gln Ile Gly Gly Ala Glu Ala Glu Ala Ala Ile Leu Gly Ala Leu 385 390 395 400
Thr Thr Pro Gly Thr Thr Arg Pro Leu Ala Ile Leu Asp Leu Gly Ala 405 410 415
Gly Ser Thr Asp Ala Ser Ile Ile Asn Pro Lys Gly Glu Ile Ile Ala 420 425 430
Thr His Leu Ala Gly Ala Gly Asp Met Val Thr Met Ile Ile Ala Arg 435 440 445
Glu Leu Gly Leu Glu Asp Arg Tyr Leu Ala Glu Glu Ile Lys Lys Tyr 450 455 460 Pro Leu Ala Lys Val Glu Ser Leu Phe His Leu Arg His Glu Asp Gly 465 470 475 480
Ser Val Gln Phe Phe Pro Thr Pro Leu Pro Pro Ala Val Phe Ala Arg 485 490 495
Val Cys Val Val Lys Pro Asp Glu Leu Val Pro Leu Pro Gly Asp Leu 500 505 510
Ala Leu Glu Lys Val Arg Ala Ile Arg Arg Ser Ala Lys Glu Arg Val 515 520 525
Phe Val Thr Asn Ala Leu Arg Ala Leu Arg Gln Val Ser Pro Thr Gly 530 535 540
Asn Ile Arg Asp Ile Pro Phe Val Val Leu Val Gly Gly Ser Ser Leu 545 550 555 560
Asp Phe Glu Val Pro Gln Leu Val Thr Asp Ala Leu Ala His Tyr Arg 565 570 575
Leu Val Ala Gly Arg Gly Asn Ile Arg Gly Ser Glu Gly Pro Arg Asn 580 585 590
Ala Val Ala Thr Gly Leu Ile Leu Ser Trp His Lys Glu Phe Ala His 595 600 605
Gly Gln 610
<210> 116 <211> 372 <212> DNA
<213> SaTmoneTTa typhimurium <400> 116
atggacagta atcacagcgc cccggctatc gtcattaccg ttatcaacga ctgcgccagc 60 ctctggcacg aagtgctgct gggcattgaa gaggaaggca tccctttcct gcttcagcat 120 cacccggctg gagatatcgt tgacagcgcc tggcaggcgg cgcgcagctc gccgctgctg 180 gtcggcattg cctgcgatcg acactcgctg gtcgtgcatt acaagaattt acccgcatcg 240 gcgccgcttt ttacgctgat gcatcatcag gacagtcagg cccaacgcaa caccggtaat 300 aacgcggcac ggctggtcaa agggatccct ttcgggatct ccatgcttaa tcacaggaga 360 acggcagtat ga 372 <210> 117 <211> 123 <212> PRT
<213> SaTmoneTla typhimurium <400> 117
Met Asp Ser Asn His Ser Ala Pro Ala Ile Val Ile Thr Val Ile Asn 1 5 10 15
Asp Cys Ala Ser Leu Trp His Clu Val Leu Leu Gly Ile Clu Clu Glu 20 25 30
Gly Ile Pro Phe Leu Leu Cln His His Pro Ala Gly Asp Ile Val Asp 35 40 45
Ser Ala Trp Gln Ala Ala Arg Ser Ser Pro Leu Leu Val Cly Ile Ala 50 55 60
Cys Asp Arg His Ser Leu Val Val His Tyr Lys Asn Leu Pro Ala Ser 65 70 75 80
Ala Pro Leu Phe Thr Leu Met His His Gln Asp Ser Gln Ala Gln Arg 85 90 95
Asn Thr Gly Asn Asn Ala Ala Arg Leu Val Lys Gly Ile Pro Phe Gly 100 105 110
Ile Ser Met Leu Asn His Arg Arg Thr Ala Val 115 120
<210> 118 <211> 1833 <212> DNA
<213> LactobaciTTus coTTinoides <400> 118
atgacacgtg taattggtgt tgatatcggg aattcctcta cagaagttgc gcttgctgat 60 gtgtctgaca gtggtgaagt aaatttcatt aattctggaa tttccgatac aactggcatt 120 aaaggtacta aacaaaattt gatcggggtg cgtaaatcca tccagatcgt tttgaaaaag 180 tcgaatatgc aaatttccga tgttgacctg attcggatca acgaagcaac gcccgttatc 240 ggtgatgttg ccatggagac catcaccgaa acggtgatta ctgaatcgac gatgatcggc 300 cacaacccag ggactcctgg gggtgtcggt actggttctg gttacacggt gaatttgctt 360 gatttgttga gccaaacgga taaggatcgt ccttatatcg ttatcatctc gaaagaaatc 420 gattttgctg acgcagctaa gctgatcaac gcttatgtgg cttctggtta taatattacc 480 gctgccattc tgcaaagtga tgatggggtg ctgatcaata atcggttgac ccataagatt 540 cccatcgtgg atgaagtctc acagatcgac aaggtaccgt tgaacatgct tgccgcagtg 600 gaagttgcac cgcctggcaa agtaattgct caactttcca acccgtatgg cattgccaca 660 ctgttcgaac tttcctctga agaaaccaag aacattgtgc cagttgcccg agccttaatc 720 ggaaaccggt cagcggttgt tattaaaacc cctgccggtg atgttaaagc tcgtgttatc 780 ccagccggga aaatcttgat caatggccaa ccgaatggtc atggtgaagt taacgttgcg 840 gctggtgccg atgccatcat gaaaaaggtg aacgagttcg atagtgtcga tgacattacc 900 ggtgaatcgg gcactaacgt tggtgggatg cttgaaaaag ttcgtcaaac aatggctgag 960 ttgaccgaca agcaaaatag cgacattgcc attcaagatt tattagctgt caatacgtcc 1020 gttccagtaa cggtgcgtgg tggtctggct ggtgaattct caatggaaca agccgttggg 1080 attgctgcta tggtcaaatc tgatcacttg caaatgcaag cgattgcaga cctgatgaaa 1140 gatgaatttc acgttcaagt cgaaatcggc ggtgctgaag ctgaatcagc catcctcggt 1200 gcgctaacaa cgccagggac gacaaaacca attgccatcc ttgatttggg ggctggttca 1260 acggatgcat caattatcaa ccaaaaggac gaaaaggtcg ctattcactt ggctggtgcc 1320 ggtgatatgg ttaccatgat catcaattct gaacttgggt tggaagaccc atatttagct 1380 gaggatatta agaaatatcc gctggctaaa gttgataatc tattccagct acggcatgaa 1440 gatggtgccg ttcaattctt tgaagatcca ttacctgctg atttatttgc cagagttgtg 1500 gctgttaaac cagatggtta cgaaccactt cctggtaatt tgagtatcga gaaagttaaa 1560 atcgtccgtc aaactgctaa gaagcgggtg ttcgtaacga acgcaattcg tgccttacac 1620 cacgttagcc caacaggtaa tatccgagat atcccatttg tggtcattgt cggcggctca 1680 gccctcgatt ttgaaattcc acaattggtc accgatgaat tatcacactt taacttagtt 1740 gcaggtcgtg gtaatattcg gggaattgaa ggtccacgga acgccgtggc aactggtttg 1800 attctttcat acgcgagtga gaagagggga tag 1833
<210> 119 <211> 610 <212> PRT
<21Β> Lactobacillus coTTinoides <400> 119
Met Thr Arg Val Ile Gly Val Asp Ile Gly Asn Ser Ser Thr Glu Val 1 5 10 15
Ala Leu Ala Asp Val Ser Asp Ser Gly Glu Val Asn Phe Ile Asn Ser 20 25 30 Gly Ile Ser Asp Thr Thr Gly Ile Lys Gly Thr Lys Gln Asn Leu Ile 35 40 45
Gly Val Arg Lys Ser Ile Gln Ile Val Leu Lys Lys Ser Asn Met Gln 50 55 60
Ile Ser Asp Val Asp Leu Ile Arg Ile Asn Glu Ala Thr Pro Val Ile 65 70 75 80
Gly Asp Val Ala Met Glu Thr Ile Thr Glu Thr Val Ile Thr Glu Ser 85 90 95
Thr Met Ile Gly His Asn Pro Gly Thr Pro Gly Gly Val Gly Thr Gly 100 105 110
Ser Gly Tyr Thr Val Asn Leu Leu Asp Leu Leu Ser Gln Thr Asp Lys 115 120 125
Asp Arg Pro Tyr Ile Val Ile Ile Ser Lys Glu Ile Asp Phe Ala Asp 130 135 140
Ala Ala Lys Leu Ile Asn Ala Tyr Val Ala Ser Gly Tyr Asn Ile Thr 145 150 155 160
Ala Ala Ile Leu Gln Ser Asp Asp Gly Val Leu Ile Asn Asn Arg Leu 165 170 175
Thr His Lys Ile Pro Ile Val Asp Glu Val Ser Gln Ile Asp Lys Val 180 185 190
Pro Leu Asn Met Leu Ala Ala Val Glu Val Ala Pro Pro Gly Lys Val 195 200 205
Ile Ala Gln Leu Ser Asn Pro Tyr Gly Ile Ala Thr Leu Phe Glu Leu 210 215 220
Ser Ser Glu Glu Thr Lys Asn Ile Val Pro Val Ala Arg Ala Leu Ile 225 230 235 240
Gly Asn Arg Ser Ala Val Val Ile Lys Thr Pro Ala Gly Asp Val Lys 245 250 255
Ala Arg Val Ile Pro Ala Gly Lys Ile Leu Ile Asn Gly Gln Pro Asn 260 265 270 Cly His Gly Glu Val Asn Val Ala Ala Gly Ala Asp Ala Ile Met Lys 275 280 285
Lys Val Asn Glu Phe Asp Ser Val Asp Asp Ile Thr Gly Glu Ser Gly 290 295 300
Thr Asn Val Gly Gly Met Leu Glu Lys Val Arg Gln Thr Met Ala Glu 305 310 315 320
Leu Thr Asp Lys Gln Asn Ser Asp Ile Ala Ile Gln Asp Leu Leu Ala 325 330 335
Val Asn Thr Ser Val Pro Val Thr Val Arg Gly Gly Leu Ala Gly Glu 340 345 350
Phe Ser Met Glu Gln Ala Val Gly Ile Ala Ala Met Val Lys Ser Asp 355 360 365
His Leu Gln Met Gln Ala Ile Ala Asp Leu Met Lys Asp Glu Phe His 370 375 380
Val Gln Val Glu Ile Gly Gly Ala Glu Ala Glu Ser Ala Ile Leu Gly 385 390 395 400
Ala Leu Thr Thr Pro Gly Thr Thr Lys Pro Ile Ala Ile Leu Asp Leu 405 410 415
Gly Ala Gly Ser Thr Asp Ala Ser Ile Ile Asn Gln Lys Asp Glu Lys 420 425 430
Val Ala Ile His Leu Ala Gly Ala Gly Asp Met Val Thr Met Ile Ile 435 440 445
Asn Ser Glu Leu Gly Leu Glu Asp Pro Tyr Leu Ala Glu Asp Ile Lys 450 455 460
Lys Tyr Pro Leu Ala Lys Val Asp Asn Leu Phe Gln Leu Arg His Glu 465 470 475 480
Asp Gly Ala Val Gln Phe Phe Glu Asp Pro Leu Pro Ala Asp Leu Phe 485 490 495
Ala Arg Val Val Ala Val Lys Pro Asp Gly Tyr Glu Pro Leu Pro Gly 500 505 510 Asn Leu Ser Ile Glu Lys Val Lys Ile Val Arg Cln Thr Ala Lys Lys 515 520 525
Arg Val Phe Val Thr Asn Ala Ile Arg Ala Leu His His Val Ser Pro 530 535 540
Thr Gly Asn Ile Arg Asp Ile Pro Phe Val Val Ile Val Gly Gly Ser 545 550 555 560
Ala Leu Asp Phe Glu Ile Pro Gln Leu Val Thr Asp Glu Leu Ser His 565 570 575
Phe Asn Leu Val Ala Gly Arg Gly Asn Ile Arg Gly Ile Glu Gly Pro 580 585 590
Arg Asn Ala Val Ala Thr Gly Leu Ile Leu Ser Tyr Ala Ser Glu Lys 595 600 605
Arg Gly 610
<210> 120
<211> 351
<212> DNA
<213> Lactobacmus collinoides
<400> 120
atggcatttg attctgaacg tccgtcaatt ctattggcga caccaacggg ttctaatggc 60 caacttccag aagttctaaa accaatgctc aatggtattg aagaagaaca gattcctttt 120 cagattctcg atatggaagg cggttcagca gttgagcggg cttataacgc gtcagttgct 180 tcacgattat cagtgggcgt tgggtttgat gatgcacata tcattgtgca ttataaaaac 240 ttgaaaccag aaaaaccgct gtttgatgtt gccatcactg atgcagcatc cattcgtaaa 300 gttggcgcaa acgccgctcg acttgtaaag ggagttccat tcaagaagta a 351
<210> 121 <211> 116 <212> PRT
<213> Lactobacillus collinoides <400> 121
Met Ala Phe Asp Ser Glu Arg Pro Ser Ile Leu Leu Ala Thr Pro Thr 1 5 10 15
Gly Ser Asn Gly Gln Leu Pro Glu Val Leu Lys Pro Met Leu Asn Gly 20 25 30 Ile Glu Glu Glu Gln Ile Pro Phe Gln Ile Leu Asp Met Glu Gly Gly 35 40 45
Ser Ala Val Glu Arg Ala Tyr Asn Ala Ser Val Ala Ser Arg Leu Ser 50 55 60
Val Gly Val Gly Phe Asp Asp Ala His Ile Ile Val His Tyr Lys Asn 65 70 75 80
Leu Lys Pro Glu Lys Pro Leu Phe Asp Val Ala Ile Thr Asp Ala Ala 85 90 95
Ser Ile Arg Lys Val Gly Ala Asn Ala Ala Arg Leu Val Lys Gly Val 100 105 110
Pro Phe Lys Lys 115
<210> 122 <211> 453 <212> PRT
<213> Vibrio fluvialis <400> 122
Met Asn Lys Pro Gln Ser Trp Glu Ala Arg Ala Glu Thr Tyr Ser Leu 1 5 10 15
Tyr Gly Phe Thr Asp Met Pro Ser Leu His Gln Arg Gly Thr Val Val 20 25 30
Val Thr His Gly Glu Gly Pro Tyr Ile Val Asp Val Asn Gly Arg Arg 35 40 45
Tyr Leu Asp Ala Asn Ser Gly Leu Trp Asn Met Val Ala Gly Phe Asp 50 5 5 60
His Lys Gly Leu Ile Asp Ala Ala Lys Ala Gln Tyr Glu Arg Phe Pro 65 70 75 80
Gly Tyr His Ala Phe Phe Gly Arg Met Ser Asp Gln Thr Val Met Leu 85 90 95
Ser Glu Lys Leu Val Glu Val Ser Pro Phe Asp Ser Gly Arg Val Phe 100 105 110
Tyr Thr Asn Ser Gly Ser Glu Ala Asn Asp Thr Met Val Lys Met Leu 115 120 125 Trp Phe Leu His Ala Ala Clu Gly Lys Pro Gln Lys Arg Lys Ile Leu 130 135 140
Thr Arg Trp Asn Ala Tyr His Gly Val Thr Ala Val Ser Ala Ser Met 145 150 155 160
Thr Gly Lys Pro Tyr Asn Ser Val Phe Gly Leu Pro Leu Pro Gly Phe 165 170 175
Val His Leu Thr Cys Pro His Tyr Trp Arg Tyr Gly Glu Glu Gly Glu 180 185 190
Thr Glu Glu Gln Phe Val Ala Arg Leu Ala Arg Glu Leu Glu Glu Thr 195 200 205
Ile Gln Arg Clu Gly Ala Asp Thr Ile Ala Gly Phe Phe Ala Glu Pro 210 215 220
Val Met Gly Ala Gly Gly Val Ile Pro Pro Ala Lys Gly Tyr Phe Gln 225 230 235 240
Ala Ile Leu Pro Ile Leu Arg Lys Tyr Asp Ile Pro Val Ile Ser Asp 245 250 255
Glu Val Ile Cys Gly Phe Gly Arg Thr Gly Asn Thr Trp Gly Cys Val 260 265 270
Thr Tyr Asp Phe Thr Pro Asp Ala Ile Ile Ser Ser Lys Asn Leu Thr 275 280 285
Ala Gly Phe Phe Pro Met Gly Ala Val Ile Leu Cly Pro Glu Leu Ser 290 295 300
Lys Arg Leu Glu Thr Ala Ile Glu Ala Ile Glu Glu Phe Pro His Gly 305 310 315 320
Phe Thr Ala Ser Gly His Pro Val Gly Cys Ala Ile Ala Leu Lys Ala 325 330 335
Ile Asp Val Val Met Asn Glu Gly Leu Ala Glu Asn Val Arg Arg Leu 340 345 350
Ala Pro Arg Phe Glu Glu Arg Leu Lys His Ile Ala Glu Arg Pro Asn 355 360 365 Ile Cly Clu Tyr Arg Gly Ile Gly Phe Met Trp Ala Leu Glu Ala Val
370 375 380
Lys Asp Lys Ala Ser Lys Thr Pro Phe Asp Gly Asn Leu Ser Val Ser 385 390 395 400
Glu Arg Ile Ala Asn Thr Cys Thr Asp Leu Gly Leu Ile Cys Arg Pro
405 410 415
Leu Gly Gln Ser Val Val Leu Cys Pro Pro Phe Ile Leu Thr Glu Ala 420 425 430
Gln Met Asp Glu Met Phe Asp Lys Leu Glu Lys Ala Leu Asp Lys Val 435 440 445
Phe Ala Clu Val Ala 450
<210> 123
<211> 1122
<212> DNA
<213> Erwinia caratovora subespécie atroseptica
<400> 123
atgtctgacg gacgactcac cgcacttttt cctgcattcc cacacccggc gtccaatcag 60 cccgtatttg ccgaggcttc accgcacgac gacgagttaa tgacgcaggc cgtaccgcag 120 gtttcctgtc agcaggcgtt ggcgattgcg cagcaagaat atggcttgtc tgggcagatg 180 tcgctgcttc agggcgagcg tgatgtgaat ttctgtctga cggtgacgcc agatgaacgc 240 tacatgctga aagtcatcaa tgcggcagaa cctgccgacg tcagcaattt ccaaaccgcg 300 ctgctgctgc atcttgcccg tcaggcacct gaactgcccg taccgcgtat caggtcgaca 360 aaagcgggtc agtcggaaac aggcgttgag atcgatggtg tactgctgcg tgtgcggctt 420 gtgagctatc tggcaggaat gccgcagtat ctggcctcac cgtcaacggc gctgatgccg 480 cagttggggg gaacgctggc gcagttggat aacgcgcttc acagctttac gcatccggcg 540 gcaaaccgtg cgctgctgtg ggatatcagc cgggcagagc aggtgcgtcc ttacctcgat 600 ttcgtttctg aaccgcagca gtatcagcat cttcagcgta tttttgaccg ttatgacagt 660 aacgttgctc ctctgttgac gacgctacgt cgtcaggtca ttcataacga tctgaatccg 720 cataacgtgc tggtggatgg atcgtcgccg acgcgggtta ctggcattat cgattttggc 780 gatgccgtat ttgccccgtt aatttgcgaa gtcgcgacgg cactggcgta tcagatcggc 840 gatggaaccg atttgttgga gcatgttgtg ccgtttgttg cggcctatca ccaacgcatt 900 ccgttagcac cggaggagat tgcgctgtta cccgatctga tagcgacccg tatggcgctg 960
accctgacca ttgcgcagtg gcgagcatcg cgttatcccg acaatcggga gtatctgctg 1020
cgtaacgtgc cgcgctgttg gcacagtttg cagcgcattg cgacctattc ccatgcgcaa 1080
tttttgactc gcctacagca ggtttgcccg gagaatgcgc ga 1122
<210> 124 <211> 374 <212> PRT
<213> Erwinia caratovora subespécie atroseptica <400> 124
Met Ser Asp Cly Arg Leu Thr Ala Leu Phe Pro Ala Phe Pro His Pro 1 5 10 15
Ala Ser Asn Gln Pro Val Phe Ala Glu Ala Ser Pro His Asp Asp Glu 20 25 30
Leu Met Thr Gln Ala Val Pro Gln Val Ser Cys Gln Gln Ala Leu Ala 35 40 45
Ile Ala Gln Gln Glu Tyr Gly Leu Ser Gly Gln Met Ser Leu Leu Gln 50 55 60
Gly Glu Arg Asp Val Asn Phe Cys Leu Thr Val Thr Pro Asp Glu Arg 65 70 75 80
Tyr Met Leu Lys Val Ile Asn Ala Ala Glu Pro Ala Asp Val Ser Asn 85 90 95
Phe Gln Thr Ala Leu Leu Leu His Leu Ala Arg Gln Ala Pro Glu Leu 100 105 110
Pro Val Pro Arg Ile Arg Ser Thr Lys Ala Gly Gln Ser Glu Thr Gly 115 120 125
Val Glu Ile Asp Gly Val Leu Leu Arg Val Arg Leu Val Ser Tyr Leu 130 135 140
Ala Gly Met Pro Gln Tyr Leu Ala Ser Pro Ser Thr Ala Leu Met Pro 145 150 155 160
Gln Leu Gly Gly Thr Leu Ala Gln Leu Asp Asn Ala Leu His Ser Phe 165 170 175 Thr His Pro Ala Ala Asn Arg Ala Leu Leu Trp Asp Ile Ser Arg Ala 180 185 190
Glu Cln Val Arg Pro Tyr Leu Asp Phe Val Ser Glu Pro Gln Gln Tyr 195 200 205
Gln His Leu Gln Arg Ile Phe Asp Arg Tyr Asp Ser Asn Val Ala Pro 210 215 220
Leu Leu Thr Thr Leu Arg Arg Gln Val Ile His Asn Asp Leu Asn Pro 225 230 235 240
His Asn Val Leu Val Asp Gly Ser Ser Pro Thr Arg Val Thr Gly Ile 245 250 255
Ile Asp Phe Gly Asp Ala Val Phe Ala Pro Leu Ile Cys Glu Val Ala 260 265 270
Thr Ala Leu Ala Tyr Gln Ile Gly Asp Gly Thr Asp Leu Leu Glu His 275 280 285
Val Val Pro Phe Val Ala Ala Tyr His Gln Arg Ile Pro Leu Ala Pro 290 295 300
Glu Glu Ile Ala Leu Leu Pro Asp Leu Ile Ala Thr Arg Met Ala Leu 305 310 315 320
Thr Leu Thr Ile Ala Gln Trp Arg Ala Ser Arg Tyr Pro Asp Asn Arg 325 330 335
Glu Tyr Leu Leu Arg Asn Val Pro Arg Cys Trp His Ser Leu Gln Arg 340 345 350
Ile Ala Thr Tyr Ser His Ala Gln Phe Leu Thr Arg Leu Gln Gln Val 355 360 365
Cys Pro Glu Asn Ala Arg 370
<210> 12 5
<211> 1272
<212> DNA
<213> Erwinia caratovora subespécie atroseptica
<400> 12 5
atgacagcga cagaagcttt gctggcgcgc cgtcagcgag tgttgggcgg cggttatcgc ctgttttatg aagagccgct gcatgtcgcg cgcggcgagg gcgtgtggct gttcgatcac 120 caagggaaac gttatctgga tgtctacaat aatgtggctt cggtcggaca ttgccacccc 180 gcggtggttg aagccgtggc gcgacagagc gcacaactca atacccacac gcgctatttg 240 caccacgcga ttgtcgattt tgcggaagat ttgctgagcg aatttcccgc cgaattgaac 300 aatgtaatgc tgacctgtac cggcagtgag gctaacgatc tggcgctgcg tatcgcccga 360 catgtcacgg gcgggacggg gatgttggtg acgcgctggg cgtatcacgg cgtgaccagc 420 gcgctggcgg aactgtctcc gtcgctgggg gatggcgttg tgcgcggtag ccatgtgaag 480 ctgatcgacg cgccagacac ttatcgtcag cccggtgcat ttcttaccag cattcgtgaa 540 gcgctggcgc agatgcaacg ggaaggtatt cgtcctgcgg cgctgctggt agataccatt 600 ttttccagcg atggcgtgtt ctgtgcgccg gaaggcgaaa tggcacaggc ggcggcgttg 660 atccgtcagg cgggcgggct gtttattgcg gatgaagtgc agccgggctt cgggcgcacc 720 ggggaatcac tgtggggctt tgcgcgccac aatgtcgtcc ctgatttggt gagtctaggg 780 aaaccgatgg gcaacggaca tcccatcgct ggattggtgg ggcgttccgc tctgttcgac 840 gcatttgggc gcgatgtgcg ctatttcaat acctttggcg gcaatccggt ttcctgtcag 900 gcggcgcacg cggtgctgcg ggtgattcgg gaagagcagt tgcagcagaa tgcccagcgg 960 gtcggtgatt atctgcggca agggttgcag caactggcgc agcatttccc gctgattggt 1020 gatattcggg cttacggcct gtttattggt gcggagctgg tcagcgatcg cgaaagtaaa 1080 acgccggcaa gtgaatccgc gttgcaggtg gtgaatgcga tgcgccaacg tggtgtgctc 1140 atcagcgcga cggggccagc ggcgaacata ctgaaaattc gcccgccgct ggtgtttctg 1200 gaagaacacg ccgatgtgtt cttaaccacg ctgagtgacg ttttagcgct catcggcact 1260 cgtgcacaga ga 1272
<210> 126 <211> 424 <212> PRT
<213> Erwinia caratovora subespécie atroseptica <400> 126
Met Thr Ala Thr Clu Ala Leu Leu Ala Arg Arg Cln Arg Val Leu Cly 1 5 10 15
Cly Gly Tyr Arg Leu Phe Tyr Clu Glu Pro Leu His Val Ala Arg Gly 20 25 30
Glu Gly Val Trp Leu Phe Asp His Gln Gly Lys Arg Tyr Leu Asp Val 35 40 45 Tyr Asn Asn Val Ala Ser Val Gly His Cys His Pro Ala Val Val Glu 50 55 60
Ala Val Ala Arg Gln Ser Ala Gln Leu Asn Thr His Thr Arg Tyr Leu 65 70 75 80
His His Ala Ile Val Asp Phe Ala Glu Asp Leu Leu Ser Glu Phe Pro 85 90 95
Ala Glu Leu Asn Asn Val Met Leu Thr Cys Thr Gly Ser Glu Ala Asn 100 105 110
Asp Leu Ala Leu Arg Ile Ala Arg His Val Thr Gly Gly Thr Gly Met 115 120 125
Leu Val Thr Arg Trp Ala Tyr His Gly Val Thr Ser Ala Leu Ala Glu 130 135 140
Leu Ser Pro Ser Leu Gly Asp Gly Val Val Arg Gly Ser His Val Lys 145 150 155 160
Leu Ile Asp Ala Pro Asp Thr Tyr Arg Gln Pro Gly Ala Phe Leu Thr 165 170 175
Ser Ile Arg Glu Ala Leu Ala Gln Met Gln Arg Glu Gly Ile Arg Pro 180 185 190
Ala Ala Leu Leu Val Asp Thr Ile Phe Ser Ser Asp Gly Val Phe Cys 195 200 205
Ala Pro Glu Gly Glu Met Ala Gln Ala Ala Ala Leu Ile Arg Gln Ala 210 215 220
Gly Gly Leu Phe Ile Ala Asp Glu Val Gln Pro Gly Phe Gly Arg Thr 225 230 235 240
Gly Glu Ser Leu Trp Gly Phe Ala Arg His Asn Val Val Pro Asp Leu 245 250 255
Val Ser Leu Gly Lys Pro Met Gly Asn Gly His Pro Ile Ala Gly Leu 260 265 270
Val Gly Arg Ser Ala Leu Phe Asp Ala Phe Gly Arg Asp Val Arg Tyr 275 280 285 Phe Asn Thr Phe Gly Gly Asn Pro Val Ser Cys Gln Ala Ala His Ala 290 295 300
Val Leu Arg Val Ile Arg Glu Glu Gln Leu Gln Gln Asn Ala Gln Arg 305 310 315 320
Val Gly Asp Tyr Leu Arg Gln Gly Leu Gln Gln Leu Ala Gln His Phe 325 330 335
Pro Leu Ile Gly Asp Ile Arg Ala Tyr Gly Leu Phe Ile Gly Ala Glu 340 345 350
Leu Val Ser Asp Arg Glu Ser Lys Thr Pro Ala Ser Glu Ser Ala Leu 355 360 365
Gln Val Val Asn Ala Met Arg Gln Arg Gly Val Leu Ile Ser Ala Thr 370 375 380
Gly Pro Ala Ala Asn Ile Leu Lys Ile Arg Pro Pro Leu Val Phe Leu 385 390 395 400
Glu Glu His Ala Asp Val Phe Leu Thr Thr Leu Ser Asp Val Leu Ala 405 410 415
Leu Ile Gly Thr Arg Ala Gln Arg 420
<210> 127 <211> 35 <212> DNA <213> Seqüência <220> <223> Ini ciador <400> 127
ctccggaatt catgtctgac ggacgactca ccgca 35
<210> 128
<211> 46
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 128
ttccaatgca ttggctgcag ttatctctgt gcacgagtgc cgatga
46 <210> 129
<211> 40
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 129
aacagccaag cttggctgca gtcatcgcgc attctccggg 40
<210> 130
<211> 40
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 130
tctccggaat tcatgacgtc tgaaatgaca gcgacagaag 40
<210> 131 <211> 33 <212> DNA <213> Seqüência <220> <223> Ini ciador <400> 131
gctaacagga ggaagaattc atggggggtt ctc 33
<210> 132
<211> 33
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 132
gagaaccccc catgaattct tcctcctgtt age 33
<210> 133
<211> 723
<212> DNA
<213> Klebsiella terrigena
<400> 133
atgcaaaaag tcgcacttgt caccggcgcc ggtcagggca tcggtaaagc tatcgccctg 60 cgtctggtga aggatggatt tgccgtggca atcgccgatt acaacgacgc tacggccaca 120
gcggtagccg ctgaaatcaa ccaggccggc ggccgcgcgg tggccattaa ggtcgacgtc 180 tcgcgccggg accaggtttt cgccgccgtt gagcaggcgc gtaaagccct gggcggattc 240 aacgttatcg tcaacaacgc cggcatcgcg ccgtcaacgc cgatcgagtc catcaccgag 300 gagatcgtcg accgggtcta taacatcaac gttaagggcg tcatctgggg gatgcaggcg 360 gcggtggagg ccttcaaaaa agaggggcac ggcgggaaga tcgtcaacgc ctgctcccag 420 gccggccacg tcggcaaccc ggagctggcg gtctacagtt cgagtaaatt cgccgtgcgc 480 ggcctgacgc aaaccgccgc ccgcgatctg gcgccgctgg gcatcaccgt taacggcttc 540 tgcccaggga tcgttaagac gccaatgtgg gcggagattg accgtcagtg tcggaagcgg 600 cgggcaaacc gctgggctac ggcacggctg aatttgccaa acgcatcacc cttggccgcc 660 tgtcggagcc tgaagacgtc gccgcctgcg tgtcgttcct cgccagcccg gattccgact 720 ata 723
<210> 134 <211> 241 <212> PRT
<213> KTebsielTa terrigena <400> 134
Met Gln Lys Val Ala Leu Val Thr Gly Ala Gly Gln Gly Ile Gly Lys 1 5 10 15
Ala Ile Ala Leu Arg Leu Val Lys Asp Gly Phe Ala Val Ala Ile Ala 20 25 30
Asp Tyr Asn Asp Ala Thr Ala Thr ATa Val Ala Ala Glu Ile Asn Gln 35 40 45
Ala Gly Gly Arg Ala Val Ala Ile Lys Val Asp Val Ser Arg Arg Asp 50 55 60
Gln Val Phe Ala Ala Val Glu Gln ATa Arg Lys Ala Leu Gly Gly Phe 65 70 75 80
Asn Val Ile Val Asn Asn Ala Gly Ile Ala Pro Ser Thr Pro Ile Glu 85 90 95
Ser Ile Thr Glu Glu Ile Val Asp Arg Val Tyr Asn ITe Asn Val Lys 100 105 110
Gly Val Ile Trp Gly Met Gln Ala Ala Val Glu Ala Phe Lys Lys Glu 115 120 125 Cly His GTy Cly Lys Ile Val Asn Ala Cys Ser Cln Ala Cly His Val 130 135 140
Gly Asn Pro Clu Leu Ala Val Tyr Ser Ser Ser Lys Phe Ala Val Arg 145 150 155 160
Gly Leu Thr Cln Thr Ala Ala Arg Asp Leu Ala Pro Leu Cly Ile Thr 165 170 175
Val Asn Gly Phe Cys Pro Cly Ile Val Lys Thr Pro Met Trp Ala Glu 180 185 190
Ile Asp Arg Gln Cys Arg Lys Arg Arg Ala Asn Arg Trp Ala Thr Ala 195 200 205
Arg Leu Asn Leu Pro Asn Ala Ser Pro Leu Ala Ala Cys Arg Ser Leu 210 215 220
Lys Thr Ser Pro Pro Ala Cys Arg Ser Ser Pro Ala Arg Ile Pro Thr 225 230 235 240
Ile
<210> 135 <211> 554 <212> PRT
<213> CTostridium pasteurianum
<400> 135
Met Lys Ser Lys Arg Phe Cln Val Leu Ser Glu Arg Pro Val Asn Lys 1 5 10 15
Asp Gly Phe Ile Gly Glu Trp Pro Glu Glu Gly Leu Ile Ala Met Ser 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Lys Glu Gly Lys Val 35 40 45
Ile Glu Leu Asp Gly Lys Asn Arg Glu Asp Phe Asp Met Ile Asp Arg 50 55 60
Phe Ile Ala Asn Tyr Gly Ile Asn Leu Asn Arg Ala Glu Asp Val Ile 65 70 75 80 Lys Met Asp Ser Val Lys Leu Ala Lys Met Leu Val Asp Ile Asn Val 85 90 95
Asp Arg Lys Thr Ile Val Glu Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Gly Asn Met Asn Val Val Glu Met Met Met Ala 115 120 125
Leu Gln Lys Met Arg Ala Arg Lys Thr Pro Ser Asn Gln Cys His Val 130 135 140
Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Ala Ala Ile Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Gly Ile Val 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ala Gln Val 180 185 190
Gly Arg Gly Gly Val Leu Thr Gln Cys Ala Ile Glu Glu Ala Thr Glu 195 200 205
Leu Glu Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val Ser 210 215 220
Val Tyr Gly Thr Glu Asn Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Ala Leu Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Gly 290 295 300
Met Thr Gly Ala Leu Pro Ser Gly Ile Arg Ala Val Leu Gly Glu Asn 305 310 315 320 Leu Ile Thr Thr Met Leu Asp Ile Glu Val Ala Ser Ala Asn Asp Gln 325 BBO 335
Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Met Leu Met Gln 340 345 350
Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ser Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Met Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Ser Glu Glu Glu Val Ile Thr Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Ile Gln Ala Val Phe Glu Gly Leu Lys Leu Pro Ala Ile Thr 420 425 430
Asp Glu Glu Val Glu Ala Val Thr Tyr Ser His Gly Ser Lys Asp Val 435 440 445
Pro Glu Arg Asn Val Val Glu Asp Leu Lys Ala Ala Glu Glu Met Ile 450 455 460
Asn Arg Gly Ile Thr Gly Ile Asp Val Val Lys Ala Leu Ser Lys His 465 470 475 480
Gly Phe Asp Asp Ile Ala Glu Asn Ile Leu Asn Met Leu Lys Gln Arg 485 490 495
Ile Ser Gly Asp Tyr Leu Gln Thr Ser Ala Ile Ile Asp Lys Asn Phe 500 505 510
Asn Val Val Ser Ala Val Asn Asp Cys Asn Asp Tyr Met Gly Pro Gly 515 520 525
Thr Gly Tyr Arg Leu Ser Lys Glu Arg Trp Asp Glu Ile Lys Asn Ile 530 535 540
Pro Asn Ala Met Lys Pro Glu Asp Ile Lys 545 550 <210> 136 <211> 179 <212> PRT
<213> Clostridium pasteurianum <400> 136
Met Clu Leu Lys Clu Lys Asp ITe Ala Leu Ser Gly Asn Cln Ser Asn 1 5 10 15
Clu Val Val Ile Cly Ile Ala Pro Ala Phe Cly Lys Tyr Cln His Gln 20 25 30
Ser Ile Val Cly Val Pro His Asp Lys Ile Leu Arg Clu Leu Ile Ala 35 40 45
Cly Ile Clu Clu Clu Cly Leu Lys Ser Arg Val Val Arg Ile Ile Arg SO 55 60
Thr Ser Asp Val Ser Phe Ile Ala His Asp Ala Ala Val Leu Ser Cly 65 70 75 80
Ser Gly Ile Cly Ile Cly Ile Cln Ser Lys Cly Thr Thr Val Ile His 85 90 95
Cln Lys Asp Leu Leu Pro Leu Asn Asn Leu Clu Leu Phe Pro Cln Ala 100 105 HO
Pro Leu Leu Asp Leu Asp Ile Phe Arg Leu Ile Gly Lys Asn Ala Ala 115 120 125
Lys Tyr Ala Lys Cly Clu Ser Pro Asn Pro Val Pro Thr Arg Asn Asp 130 135 140
Cln Met Val Arg Pro Lys Phe Cln Ala Lys Ala Ala Leu Leu His Ile 145 150 155 160
Lys Clu Thr Lys His Val Val Cln Asn Ala Lys Pro Ile Clu Leu Glu 165 170 175
Ile Ile Ser
<210> 137
<211> 146
<212> PRT
<213> CTostridium pasteurianum Met Ser Asp Ile Thr Asn Asn Ile Lys Val Asp Tyr Glu Asn Asp Tyr 1 5 10 15
Pro Leu Ala Ala Lys Arg Ser Clu Trp Ile Lys Thr Pro Thr Cly Lys
Asn Leu Lys Asp Ile Thr Leu Clu Ala Val Ile Asp Clu Asn Val Lys 35 40 45
Ala Clu Asp Val Arg Ile Ser Arg Asp Thr Leu Clu Leu Cln Ala Cln 50 55 60
Val Ala Clu Cly Ser Cly Arg Cys Ala Ile Ala Arg Asn Phe Arg Arg 65 70 75 80
Ala Ala Clu Leu Ile Ser Ile Ser Asp Clu Arg Ile Leu Clu Ile Tyr 85 90 95
Asn Ala Leu Arg Pro Tyr Arg Ser Thr Lys Asn Clu Leu Leu Ala Ile 100 105 HO
Ala Asp Glu Leu Glu Clu Lys Tyr Asp Ala Lys Val Asn Ala Asp Phe 115 120 12 5
Ile Arg Glu Ala Ala Glu Val Tyr Ser Lys Arg Asn Lys Val Arg Ile 130 135 140
Glu Asp "Ί45
<210> 138
<211> 555
<212> PRT
<213> Escherichia blattae
<400> 138
Met Arg Arg Ser Lys Arg Phe Glu Val Leu Clu Lys Arg Pro Val Asn 1 5 10 I5
Cln Asp Cly Leu Ile Cly Clu Trp Pro Clu Clu Gly Leu Ile Ala Net 20 25 30
Cly Ser Pro Trp Asp Pro Pro Ser Ser Val Lys Val Clu Cln Cly Arg He Val Clu Leu Asp Gly Lys Ala Arg Ala Asp Phe Asp Met Ile Asp 50 5 5 60
Arg Phe Ile Ala Asp Tyr Ala Ile Asn Ile Glu Glu Thr Glu His Ala 65 70 75 80
Met Gly Leu Asp Ala Leu Thr Ile Ala Arg Met Leu Val Asp Ile Asn 85 90 95
Val Ser Arg Ala Glu Ile Ile Lys Val Thr Thr Ala Ile Thr Pro Ala 100 105 110
Lys Ala Val Glu Val Met Ser His Met Asn Val Val Glu Met Met Met 115 120 125
Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His 130 135 140
Val Thr Asn Leu Lys Asp Asn Pro Val Cln Ile Ala Ala Asp Ala Ala 145 150 155 160
Glu 'Ala Gly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Cly Ile 165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Ile Gly Ser Cln 180 185 190
Ser Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Clu Ala Thr 195 200 205
Clu Leu Clu Leu Gly Met Arg Gly Phe Thr Ser Tyr Ala Glu Thr Val 210 215 220
Ser Val Tyr Gly Thr Glu Ala Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys 245 250 255
Met Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ala 260 265 270
Glu Ser Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr 275 280 285 Lys Cly Ala Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile 290 295 300
Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu 305 310 315 320
Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp 325 330 335
Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met 340 345 350
Gln Met Leu Pro Cly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val 355 360 365
Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp 370 375 380
Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly 385 390 395 400
Leu Arg Pro Val Ser Glu Glu Glu Thr Ile Ala Ile Arg Asn Lys Ala 405 410 415
Ala Arg Ala Val Gln Ala Val Phe Arg Glu Leu Gly Leu Pro Pro Val 420 425 430
Thr Asp Glu Glu Val Thr Ala Ala Thr Tyr Ala His Gly Ser Lys Asp 435 440 445
Met Pro Pro Arg Asn Val Val Glu Asp Leu Ser Ala Val Glu Glu Met 450 455 460
Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Arg Ala Leu Ser Val 465 470 475 480
Asn Gly Phe Asp Asp Val Ala Asn Asn Ile Leu Asn Met Leu Arg Gln 485 490 495
Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Glu 500 505 510
Phe Glu Val Val Ser Ala Val Asn Asp Ile Asn Asp Tyr Gln Gly Pro 515 520 525 Gly Thr Gly Tyr Arg Ile Ser Pro Gln Arg Trp Glu Glu Ile Lys Asn 530 535 540
Ile Ala Thr Val Ile Gln Pro Asp Ser Ile Glu 545 550 555
<210> 139 <211> 196 <212> PRT
<213> Escherichia blattae <400> 139
Met Glu Thr Thr Gln Lys Lys Ala Pro Val Phe Thr Leu Asn Leu Val 1 5 10 15
Glu Ser Gly Val Ala Lys Pro Gly Glu Arg Ser Asp Glu Val Val Ile 20 25 30
Gly Val Gly Pro Ala Phe Asp Lys Tyr Gln His Lys Thr Leu Ile Asp 35 40 45
Met Pro His Lys Ala Ile Ile Lys Glu Leu Val Ala Gly Val Glu Glu 50 55 60
Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val 65 70 75 80
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly 85 90 95
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu 100 105 110
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr 115 120 125
Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg 130 135 140
Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg 145 150 155 160
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys 165 170 175
His Val Val Ala Asp Ala Lys Pro Val Thr Leu Asn Ile Glu Ile Thr 180 185 190 Arg Glu Clu Ala 195
<210> 140
<211> 141
<212> PRT
<213> Escherichia blattae
<400> 140
Met Thr Thr Thr Lys Met Ser Ala Ala Asp Tyr Pro Leu Ala Ser Arg 1 5 10 15
Cys Pro Clu Arg Ile Gln Thr Pro Thr Gly Lys Pro Leu Thr Asp Ile 20 25 30
Thr Leu Glu Asn Val Leu Ala Gly Lys Val Gly Pro Gln Asp Val Arg 35 40 45
Ile Ser Arg Glu Thr Leu Glu Tyr Gln Ala Gln Ile Ala Glu Gln Met 50 55 60
His Arg His Ala Ile Ala Arg Asn Leu Arg Arg Ala Gly Glu Leu Ile 65 70 75 80
Ala Ile Pro Asp Ala Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro 85 90 95
Tyr Arg Ser Ser Val Glu Clu Leu Leu Ala Ile Ala Asp Glu Leu Glu 100 105 110
Thr Arg Tyr Gln Ala Thr Val Asn Ala Ala Phe Ile Arg Clu Ala Ala 115 120 125
Glu Val Tyr Arg Gln Arg Asp Lys Leu Arg Lys Glu Ala 130 135 140
<210> 141 <211> 555 <212> PRT
<213> Citrobacter freundii <400> 141
Met Arg Arg Ser Lys Arg Phe Clu Val Leu Ala Cln Arg Pro Val Asn 1 5 10 15
Cln Asp Gly Leu Ile Gly Glu Trp Pro Glu Clu Gly Leu Ile Ala Met 20 25 30 Glu Ser Pro Tyr Asp Pro Ala Ser Ser Val Lys Val Glu Asn Gly Arg 35 40 45
Ile Val Glu Leu Asp Gly Lys Ser Arg Ala Glu Phe Asp Met Ile Asp 50 55 60
Arg Phe Ile Ala Asp Tyr Ala Ile Asn Val Pro Glu Ala Glu Arg Ala 65 70 75 80
Met Gln Leu Asp Ala Leu Glu Ile Ala Arg Met Leu Val Asp Ile His 85 90 95
Val Ser Arg Glu Glu Ile Ile Ala Ile Thr Thr Ala Ile Thr Pro Ala 100 105 110
Lys Arg Leu Glu Val Met Ala Gln Met Asn Val Val Glu Met Met Met 115 120 125
Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His 130 135 140
Val Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala 145 150 155 160
Glu Ala Gly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile 165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ser Gln 180 185 190
Cys Gly Ala Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr 195 200 205
Glu Leu Glu Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val 210 215 220
Ser Val Tyr Gly Thr Glu Ser Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys 245 250 255
Met Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ser 260 265 270 Glu Ser Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr 275 280 285
Lys Gly Ala Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile 290 295 300
Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu 305 310 315 320
Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp 325 330 335
Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met 340 345 350
Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val 355 360 365
Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp 370 375 380
Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly 385 390 395 400
Leu Arg Pro Val Thr Glu Glu Glu Thr Ile Ala Ile Arg Asn Lys Ala 405 410 415
Ala Arg Ala Ile Gln Ala Val Phe Arg Glu Leu Gly Leu Pro Leu Ile 420 425 430
Ser Asp Glu Glu Val Asp Ala Ala Thr Tyr Ala His Gly Ser Lys Asp 435 440 445
Met Pro Ala Arg Asn Val Val Glu Asp Leu Ala Ala Val Glu Glu Met 450 455 460
Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Gly Ala Leu Ser Ser 465 470 475 480
Ser Gly Phe Glu Asp Ile Ala Ser Asn Ile Leu Asn Met Leu Arg Gln 485 490 495
Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Gln 500 505 510 Phe Asp Val Val Ser Ala VaT Asn Asp Ile Asn Asp Tyr Cln Gly Pro 515 520 525
Cly Thr Gly Tyr Arg Ile Ser Ala Glu Arg Trp Ala Glu Ile Lys Asn 530 535 540
Ile Ala Gly Val Val Gln Pro Gly Ser Ile Glu 545 550 555
<210> 142 <211> 194 <212> PRT
<213> Citrobacter freundii <400> 142
Met Glu Cys Thr Thr Glu Arg Lys Pro Val Phe Thr Leu Gln Val Ser 1 5 10 15
Glu Gly Glu Ala Ala Lys Ala Asp Glu Arg Val Asp Glu Val Val Ile 20 25 30
Gly Val Gly Pro Ala Phe Asp Lys Tyr Gln His Lys Thr Leu Ile Asp 35 40 45
Met Pro His Lys Ala Ile Leu Lys Glu Leu Val Ala Gly Ile Clu Glu 50 55 60
Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val 65 70 75 80
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly 85 90 95
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu 100 105 110
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr 115 120 125
Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg 130 135 140
Lys Clu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg
145 150 155 160
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys
165 170 175 His Val Val Cln Asp Arg Ala Pro Val Thr Leu His Ile Ala Leu Val 180 185 190
Arg Glu
<210> 143 <211> 142 <212> PRT
<213> Citrobacter freundii <400> 143
Met Asn Asp Asn Ile Met Thr Ala Gln Asp Tyr Pro Leu Ala Thr Arg 15 10 15
Cys Pro Glu Lys Ile Gln Thr Pro Thr Gly Lys Pro Leu Thr Glu Ile 20 25 30
Thr Leu Glu Asn Val Leu Ala Gly Arg Val Gly Pro Gln Asp Val Arg 35 40 45
Ile Ser Gln Gln Thr Leu Glu Tyr Gln Ala Gln Ile Ala Glu Gln Met 50 55 60
Gln Arg His Ala Val Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile 65 70 75 80
Ala Ile Pro Asp Ala Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro 85 90 95
Phe Arg Ser Ser Phe Ala Glu Leu Gln Ala Ile Ala Asp Glu Leu Glu 100 105 110
His Thr Trp His Ala Thr Val Asn Ala Gly Phe Val Arg Glu Ser Ala 115 120 125
Glu Val Tyr Leu Gln Arg Asn Lys Leu Arg Lys Gly Ser Gln 130 135 140
<210> 144 <211> 1359 <212> DNA <213> Seqüência artificial <220> <22 3> Amino:piruvato transaminase <400> 144 atgaacaaac cacagtcttg ggaagctcgt gcagaaacct attctctgta cggcttcact 60 gacatgccgt ccctgcacca gcgtggtact gttgttgtca cgcacggcga aggtccgtac 120 attgttgacg tcaatggtcg ccgttatctg gacgctaatt ctggcctgtg gaatatggtt 180 gcaggttttg accataaggg tctgatcgac gcagctaagg ctcagtacga gcgttttccg 240 ggctaccatg cgttcttcgg tcgtatgagc gatcagacgg tgatgctgtc cgaaaaactg 300 gtagaagtct ctccgttcga cagcggccgt gtgttctata cgaacagcgg tagcgaagca 360 aacgacacta tggttaagat gctgtggttc ctgcatgcgg cggaaggtaa gccacaaaag 420 cgcaaaattc tgacccgttg gaacgcgtat cacggcgtta ctgcagttag cgcctccatg 480 accggtaaac cgtacaacag cgttttcggt ctgccgctgc caggtttcgt tcacctgact 540 tgccctcact actggcgtta cggtgaagaa ggcgagacgg aagaacaatt cgttgcacgc 600 ctggcacgcg aactggaaga gactatccag cgtgagggtg ctgacactat cgctggcttc 660 tttgctgagc cggttatggg tgcaggtggt gttattccgc ctgctaaagg ttattttcag 720 gctattctgc caatcctgcg taaatatgac atcccggtta tctctgacga agttatctgt 780 ggttttggtc gcactggcaa cacctggggt tgcgtaactt atgattttac tccggatgct 840 atcatctcta gcaaaaacct gaccgccggt ttcttcccga tgggcgcagt gatcctgggt 900 ccagaactga gcaagcgcct ggaaaccgca attgaagcaa tcgaggaatt tccgcacggc 960 tttaccgcgt ccggccatcc ggtaggctgt gcaatcgcgc tgaaagcgat cgatgttgtt 1020 atgaacgaag gcctggcgga aaacgttcgc cgtctggcac cgcgcttcga agaacgtctg 1080 aaacatatcg cggaacgtcc gaacattggt gaatatcgtg gtatcggttt tatgtgggct 1140 ctggaggcag tcaaagacaa agcgtctaaa actccgttcg atggcaatct gagcgtgagc 1200 gaacgtatcg ccaacacttg caccgacctg ggtctgatct gccgtccact gggccaaagc 1260 gtagtgctgt gtccgccgtt tatcctgacc gaagcgcaaa tggacgaaat gttcgacaaa 1320 ctggagaaag cactggataa agtgttcgca gaggtggca 1359 <210> 145 <211> 1668 <212> DNA <213> KTebsieTTa pneumoniae <400> 145 atgaaaagat caaaacgatt tgcagtactg gcccagcgcc ccgtcaatca ggacgggctg 60 attggcgagt ggcctgaaga ggggctgatc gccatggaca gcccctttga cccggtctct 120 tcagtaaaag tggacaacgg tctgatcgtc gaactggacg gcaaacgccg ggaccagttt 180 gacatgatcg accgatttat cgccgattac gcgatcaacg ttgagcgcac agagcaggca 240 atgcgcctgg aggcggtgga aatagcccgt atgctggtgg atattcacgt cagccgggag 300 gagatcattg ccatcactac cgccatcacg ccggccaaag cggtcgaggt gatggcgcag 360 atgaacgtgg tggagatgat gatggcgctg cagaagatgc gtgcccgccg gaccccctcc 420 aaccagtgcc acgtcaccaa tctcaaagat aatccggtgc agattgccgc tgacgccgcc 480 gaggccggga tccgcggctt ctcagaacag gagaccacgg tcggtatcgc gcgctacgcg 540 ccgtttaacg ccctggcgct gttggtcggt tcgcagtgcg gccgccccgg cgtgttgacg 600 cagtgctcgg tggaagaggc caccgagctg gagctgggca tgcgtggctt aaccagctac 660 gccgagacgg tgtcggtcta cggcaccgaa gcggtattta ccgacggcga tgatacgccg 720 tggtcaaagg cgttcctcgc ctcggcctac gcctcccgcg ggttgaaaat gcgctacacc 780 tccggcaccg gatccgaagc gctgatgggc tattcggaga gcaagtcgat gctctacctc 840 gaatcgcgct gcatcttcat tactaaaggc gccggggttc agggactgca aaacggcgcg 900 gtgagctgta tcggcatgac cggcgctgtg ccgtcgggca ttcgggcggt gctggcggaa 960 aacctgatcg cctctatgct cgacctcgaa gtggcgtccg ccaacgacca gactttctcc 1020 cactcggata ttcgccgcac cgcgcgcacc ctgatgcaga tgctgccggg caccgacttt 1080 attttctccg gctacagcgc ggtgccgaac tacgacaaca tgttcgccgg ctcgaacttc 1140 gatgcggaag attttgatga ttacaacatc ctgcagcgtg acctgatggt tgacggcggc 1200 ctgcgtccgg tgaccgaggc ggaaaccatt gccattcgcc agaaagcggc gcgggcgatc 1260 caggcggttt tccgcgagct ggggctgccg ccaatcgccg acgaggaggt ggaggccgcc 1320 acctacgcgc acggcagcaa cgagatgccg ccgcgtaacg tggtggagga tctgagtgcg 1380 gtggaagaga tgatgaagcg caacatcacc ggcctcgata ttgtcggcgc gctgagccgc 1440 agcggctttg aggatatcgc cagcaatatt ctcaatatgc tgcgccagcg ggtcaccggc 1500 gattacctgc agacctcggc cattctcgat cggcagttcg aggtggtgag tgcggtcaac 1560 gacatcaatg actatcaggg gccgggcacc ggctatcgca tctctgccga acgctgggcg 1620 gagatcaaaa atattccggg cgtggttcag cccgacacca ttgaataa 1668
<210> 146 <211> 555 <212> PRT
<21Β> KTebsieTTa pneumoniae <400> 146
Met Lys Arg Ser Lys Arg Phe Ala Val Leu Ala Cln Arg Pro Val Asn 1 5 10 15 Gln Asp Gly Leu Ile Gly Glu Trp Pro Glu Glu Gly Leu Ile Ala Met 20 25 30
Asp Ser Pro Phe Asp Pro Val Ser Ser Val Lys Val Asp Asn Gly Leu 35 40 45
Ile Val Glu Leu Asp Gly Lys Arg Arg Asp Gln Phe Asp Met Ile Asp 50 55 60
Arg Phe Ile Ala Asp Tyr Ala Ile Asn Val Glu Arg Thr Glu Gln Ala 65 70 75 80
Met Arg Leu Glu Ala Val Glu Ile Ala Arg Met Leu Val Asp Ile His 85 90 95
Val Ser Arg Glu Glu Ile Ile Ala Ile Thr Thr Ala Ile Thr Pro Ala 100 105 110
Lys Ala Val Glu Val Met Ala Gln Met Asn Val Val Glu Met Met Met 115 120 125
Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His 130 135 140
Val Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala 145 150 155 160
Glu Ala Gly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile 165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ser Gln 180 185 190
Cys Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr 195 200 205
Glu Leu Glu Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val 210 215 220
Ser Val Tyr Gly Thr Glu Ala Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys 245 250 255 Met Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ser 260 265 270
Glu Ser Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr 275 280 285
Lys Gly Ala Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile 290 295 300
Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu 305 310 315 320
Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp 325 330 335
Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met 340 345 350
Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val 355 360 365
Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp 370 375 380
Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly 385 390 395 400
Leu Arg Pro Val Thr Glu Ala Glu Thr Ile Ala Ile Arg Gln Lys Ala 405 410 415
Ala Arg Ala Ile Gln Ala Val Phe Arg Glu Leu Gly Leu Pro Pro Ile 420 425 430
Ala Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Asn Glu 435 440 445
Met Pro Pro Arg Asn Val Val Glu Asp Leu Ser Ala Val Glu Glu Met 450 455 460
Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Gly Ala Leu Ser Arg 465 470 475 480
Ser Gly Phe Glu Asp Ile Ala Ser Asn Ile Leu Asn Met Leu Arg Gln 485 490 495 Arg VaT Thr Cly Asp Tyr 500
Leu Gln Thr 505
Ser Ala Ile Leu Asp Arg Gln 510
Phe Glu Val Val 515
Ser Ala Val Asn Asp 520
Ile Asn Asp Tyr Gln Gly Pro 525
Gly Thr Gly Tyr Arg Ile 530
Ser Ala Glu 535
Arg Trp Ala Glu Ile Lys Asn 540
Ile Pro Gly Val Val 545
Gln
550
Pro Asp Thr Ile Glu 555
<210> 147 <211> 585 <212> DNA
<213> KlebsielTa pneumoniae <400> 147
gtgcaacaga caacccaaat tcagccctct tttaccctga aaacccgcga gggcggggta 60
gcttctgccg atgaacgcgc cgatgaagtg gtgatcggcg tcggccctgc cttcgataaa 120
caccagcatc acactctgat cgatatgccc catggcgcga tcctcaaaga gctgattgcc 180
ggggtggaag aagaggggct tcacgcccgg gtggtgcgca ttctgcgcac gtccgacgtc 240
tcctttatgg cctgggatgc ggccaacctg agcggctcgg ggatcggcat cggtatccag 300
tcgaagggga ccacggtcat ccatcagcgc gatctgctgc cgctcagcaa cctggagctg 360
ttctcccagg cgccgctgct gacgctggag acctaccggc agattggcaa aaacgctgcg 420
cgctatgcgc gcaaagagtc accttcgccg gtgccggtgg tgaacgatca gatggtgcgg 480
ccgaaattta tggccaaagc cgcgctattt catatcaaag agaccaaaca tgtggtgcag 540
gacgccgagc ccgtcaccct gcacatcgac ttagtaaggg agtga 585
<210> 148 <211> 194 <212> PRT
<213> Klebsiella pneumoniae <400> 148
Met Gln Gln Thr Thr Gln Ile Gln Pro Ser Phe Thr Leu Lys Thr Arg 1 5 10 15
Glu Gly Gly Val Ala Ser Ala Asp Glu Arg Ala Asp Glu Val Val Ile
20
25
30
Gly Val Gly Pro Ala Phe Asp Lys His Gln His His Thr Leu Ile Asp 35 40 45 Met Pro His Gly Ala Ile Leu Lys GTu Leu Ile Ala Gly Val Glu Glu 50 55 60
Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val 65 70 75 80
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly 85 90 95
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu 100 105 110
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr 115 120 125
Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg 130 135 140
Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg 145 150 155 160
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys 165 170 175
His Val Val Gln Asp Ala Glu Pro Val Thr Leu His Ile Asp Leu Val 180 185 190
Arg Glu
<210> 149 <211> 426 <212> DNA <213> KTebsieTTa pneumoniae <400> 149 atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg cccggagcat 60 atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt gctctctggc 120 gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca ggcgcagatt 180 gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc ggagcttatc 240 gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt ccgctcctcg 300 caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc gacagtgaat 360 gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct gcgtaaagga 420 agctaa 426
<210> 150 <211> 141 <212> PRT
<21Β> Klebsiella pneumoniae <400> 150
Met Ser Clu Lys Thr Met Arg Val Gln Asp Tyr Pro Leu Ala Thr Arg 1 5 10 15
Cys Pro Clu His Ile Leu Thr Pro Thr Gly Lys Pro Leu Thr Asp Ile 20 25 30
Thr Leu Glu Lys Val Leu Ser Gly Glu Val Cly Pro Gln Asp Val Arg 35 40 45
Ile Ser Arg Gln Thr Leu Glu Tyr Gln Ala Gln Ile Ala Glu Gln Met 50 55 60
Gln Arg His Ala Val Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile 65 70 75 80
Ala Ile Pro Asp Clu Arg Ile Leu Ala Ile Tyr Asn Ala Leu Arg Pro 85 90 95
Phe Arg Ser Ser Cln Ala Clu Leu Leu Ala Ile Ala Asp Clu Leu Glu 100 105 110
His Thr Trp His Ala Thr Val Asn Ala Ala Phe Val Arg Glu Ser Ala 115 120 125
Glu Val Tyr Gln Gln Arg His Lys Leu Arg Lys Gly Ser 130 135 140
<210> 151 <211> 1824 <212> DNA
<213> Klebsiella pneumoniae <400> 151
atgccgttaa tagccgggat tgatatcggc aacgccacca ccgaggtggc gctggcgtcc 60 gactacccgc aggcgagggc gtttgttgcc agcgggatcg tcgcgacgac gggcatgaaa 120 gggacgcggg acaatatcgc cgggaccctc gccgcgctgg agcaggccct ggcgaaaaca 180 ccgtggtcga tgagcgatgt ctctcgcatc tatcttaacg aagccgcgcc ggtgattggc 240 gatgtggcga tggagaccat caccgagacc attatcaccg aatcgaccat gatcggtcat 300 aacccgcaga cgccgggcgg ggtgggcgtt ggcgtgggga cgactatcgc cctcgggcgg 360 ctggcgacgc tgccggcggc gcagtatgcc gaggggtgga tcgtactgat tgacgacgcc 420 gtcgatttcc ttgacgccgt gtggtggctc aatgaggcgc tcgaccgggg gatcaacgtg 480 gtggcggcga tcctcaaaaa ggacgacggc gtgctggtga acaaccgcct gcgtaaaacc 540 ctgccggtgg tggatgaagt gacgctgctg gagcaggtcc ccgagggggt aatggcggcg 600 gtggaagtgg ccgcgccggg ccaggtggtg cggatcctgt cgaatcccta cgggatcgcc 660 accttcttcg ggctaagccc ggaagagacc caggccatcg tccccatcgc ccgcgccctg 720 attggcaacc gttccgcggt ggtgctcaag accccgcagg gggatgtgca gtcgcgggtg 780 atcccggcgg gcaacctcta cattagcggc gaaaagcgcc gcggagaggc cgatgtcgcc 840 gagggcgcgg aagccatcat gcaggcgatg agcgcctgcg ctccggtacg cgacatccgc 900 ggcgaaccgg gcacccacgc cggcggcatg cttgagcggg tgcgcaaggt aatggcgtcc 960 ctgaccggcc atgagatgag cgcgatatac atccaggatc tgctggcggt ggatacgttt 1020 attccgcgca aggtgcaggg cgggatggcc ggcgagtgcg ccatggagaa tgccgtcggg 1080 atggcggcga tggtgaaagc ggatcgtctg caaatgcagg ttatcgcccg cgaactgagc 1140 gcccgactgc agaccgaggt ggtggtgggc ggcgtggagg ccaacatggc catcgccggg 1200 gcgttaacca ctcccggctg tgcggcgccg ctggcgatcc tcgacctcgg cgccggctcg 1260 acggatgcgg cgatcgtcaa cgcggagggg cagataacgg cggtccatct cgccggggcg 1320 gggaatatgg tcagcctgtt gattaaaacc gagctgggcc tcgaggatct ttcgctggcg 1380 gaagcgataa aaaaataccc gctggccaaa gtggaaagcc tgttcagtat tcgtcacgag 1440 aatggcgcgg tggagttctt tcgggaagcc ctcagcccgg cggtgttcgc caaagtggtg 1500 tacatcaagg agggcgaact ggtgccgatc gataacgcca gcccgctgga aaaaattcgt 1560 ctcgtgcgcc ggcaggcgaa agagaaagtg tttgtcacca actgcctgcg cgcgctgcgc 1620 caggtctcac ccggcggttc cattcgcgat atcgcctttg tggtgctggt gggcggctca 1680 tcgctggact ttgagatccc gcagcttatc acggaagcct tgtcgcacta tggcgtggtc 1740 gccgggcagg gcaatattcg gggaacagaa gggccgcgca atgcggtcgc caccgggctg 1800 ctactggccg gtcaggcgaa ttaa 1824
<210> 152
<211> 607
<212> PRT
<213> KTebsieTla pneumoniae <400> 152
Met Pro Leu Ile Ala Cly Ile Asp Ile Gly Asn Ala Thr Thr Glu Val 1 5 10 15
Ala Leu Ala Ser Asp Tyr Pro Gln Ala Arg Ala Phe Val Ala Ser Gly 20 25 30
Ile Val Ala Thr Thr Gly Met Lys Gly Thr Arg Asp Asn Ile Ala Gly 35 40 45
Thr Leu Ala Ala Leu Glu Gln Ala Leu Ala Lys Thr Pro Trp Ser Met 50 55 60
Ser Asp Val Ser Arg Ile Tyr Leu Asn Glu Ala Ala Pro Val Ile Gly 65 70 75 80
Asp Val Ala Met Glu Thr Ile Thr Glu Thr Ile Ile Thr Glu Ser Thr 85 90 95
Met Ile Gly His Asn Pro Gln Thr Pro Gly Gly Val Gly Val Gly Val 100 105 110
Gly Thr Thr Ile Ala Leu Gly Arg Leu Ala Thr Leu Pro Ala Ala Gln 115 120 125
Tyr Ala Glu Gly Trp Ile Val Leu Ile Asp Asp Ala Val Asp Phe Leu 130 135 140
Asp Ala Val Trp Trp Leu Asn Glu Ala Leu Asp Arg Gly Ile Asn Val 145 150 155 160
Val Ala Ala Ile Leu Lys Lys Asp Asp Gly Val Leu Val Asn Asn Arg 165 170 175
Leu Arg Lys Thr Leu Pro Val Val Asp Glu Val Thr Leu Leu Glu Gln 180 185 190
Val Pro Glu Gly Val Met Ala Ala Val Glu Val Ala Ala Pro Gly Gln 195 200 205
Val Val Arg Ile Leu Ser Asn Pro Tyr Gly Ile Ala Thr Phe Phe Gly 210 215 220
Leu Ser Pro Glu Glu Thr Gln Ala Ile Val Pro Ile Ala Arg Ala Leu 225 230 235 240 Ile Cly Asn Arg Ser Ala Val Val Leu Lys Thr Pro Cln Gly Asp Val 245 250 255
Gln Ser Arg Val Ile Pro Ala Gly Asn Leu Tyr Ile Ser Gly Glu Lys 260 265 270
Arg Arg Gly Glu Ala Asp Val Ala Glu Gly Ala Glu Ala Ile Met Gln 275 280 285
Ala Met Ser Ala Cys Ala Pro Val Arg Asp Ile Arg Gly Clu Pro Gly 290 295 300
Thr His Ala Gly Cly Met Leu Glu Arg Val Arg Lys Val Met Ala Ser 305 310 315 320
Leu Thr Gly His Clu Met Ser Ala Ile Tyr Ile Gln Asp Leu Leu Ala 325 330 335
Val Asp Thr Phe Ile Pro Arg Lys Val Gln Gly Gly Met Ala Gly Glu 340 345 350
Cys Ala Met Glu Asn Ala Val Gly Met Ala Ala Met Val Lys Ala Asp 355 360 365
Arg Leu Gln Met Gln Val Ile Ala Arg Glu Leu Ser Ala Arg Leu Gln 370 375 380
Thr Glu Val Val Val Cly Gly Val Glu Ala Asn Met Ala Ile Ala Cly 385 390 395 400
Ala Leu Thr Thr Pro Gly Cys Ala Ala Pro Leu Ala Ile Leu Asp Leu 405 410 415
Gly Ala Gly Ser Thr Asp Ala Ala Ile Val Asn Ala Glu Gly Gln Ile 420 425 430
Thr Ala Val His Leu Ala Gly Ala Gly Asn Met Val Ser Leu Leu Ile 435 440 445
Lys Thr Clu Leu Cly Leu Clu Asp Leu Ser Leu Ala Glu Ala Ile Lys 450 455 460
Lys Tyr Pro Leu Ala Lys Val Glu Ser Leu Phe Ser Ile Arg His Clu 465 470 475 480 Asn Gly Ala Val Clu Phe Phe Arg Glu Ala Leu Ser Pro Ala Val Phe 485 490 495
Ala Lys Val Val Tyr Ile Lys Glu Gly Glu Leu Val Pro Ile Asp Asn 500 505 510
Ala Ser Pro Leu Glu Lys Ile Arg Leu Val Arg Arg Gln Ala Lys Glu 515 520 525
Lys Val Phe Val Thr Asn Cys Leu Arg Ala Leu Arg Gln Val Ser Pro 530 535 540
Gly Cly Ser Ile Arg Asp Ile Ala Phe Val Val Leu Val Gly Gly Ser 545 550 555 560
Ser Leu Asp Phe Glu Ile Pro Gln Leu Ile Thr Glu Ala Leu Ser His 565 570 575
Tyr Cly Val Val Ala Gly Gln Gly Asn Ile Arg Gly Thr Glu Gly Pro 580 585 590
Arg Asn Ala Val Ala Thr Gly Leu Leu Leu Ala Gly Gln Ala Asn 595 600 605
<210> 153
<211> 354
<212> DNA
<213> KTebsieTTa pneumoniae
<400> 153
atgtcgcttt caccgccagg cgtacgcctg ttttacgatc cgcgcgggca ccatgccggc 60 gccatcaatg agctgtgctg ggggctggag gagcaggggg tcccctgcca gaccataacc 120 tatgacggag gcggtgacgc cgctgcgctg ggcgccctgg cggccagaag ctcgcccctg 180 cgggtgggta tcgggctcag cgcgtccggc gagatagccc tcactcatgc ccagctgccg 240 gcggacgcgc cgctggctac cggacacgtc accgatagcg acgatcaact gcgtacgctc 300 ggcgccaacg ccgggcagct ggttaaagtc ctgccgttaa gtgagagaaa ctga 354
<210> 154
<211> 117
<212> PRT
<213> KTebsieTTa pneumoniae
<400> 154
Met Ser Leu Ser Pro Pro Gly Val Arg Leu Phe Tyr Asp Pro Arg Gly 1 5 10 15 His His Ala Gly Ala Ile Asn Glu Leu Cys Trp Gly Leu Glu Glu Gln 20 25 30
Gly Val Pro Cys Gln Thr Ile Thr Tyr Asp Gly Gly Gly Asp Ala Ala 35 40 45
Ala Leu Gly Ala Leu Ala Ala Arg Ser Ser Pro Leu Arg Val Gly Ile 50 55 60
Gly Leu Ser Ala Ser Gly Glu Ile Ala Leu Thr His Ala Gln Leu Pro 65 70 75 80
Ala Asp Ala Pro Leu Ala Thr Cly His Val Thr Asp Ser Asp Asp Gln 85 90 95
Leu Arg Thr Leu Gly Ala Asn Ala Gly Gln Leu Val Lys Val Leu Pro 100 105 110
Leu Ser Glu Arg Asn 115
<210> 155
<211> 112 5
<212> DNA
<213> Seqüência artificial
<220>
<223> aminoálcool quinase códon otimizada de Erwinia caratovora subespécie atroseptica
<400> 155
atgagcgatg gccgtctgac cgcactgttt cctgcatttc cacatccggc atccaaccag 60 ccagtgtttg cggaggcttc cccgcacgac gatgaactga tgacgcaggc ggtgccgcag 120 gtttcctgcc agcaagccct ggcaattgcc cagcaggaat atggcctgag cggtcagatg 180 agcctgctgc agggcgaacg tgacgttaat ttctgtctga ccgtaacgcc agatgaacgc 240 tatatgctga aagtcatcaa cgctgctgaa ccggcagatg tgagcaactt tcagactgcg 300 ctgctgctgc acctggcacg tcaggcgcca gaactgccag tccctcgtat ccgctccacg 360 aaggctggtc agtctgaaac gggcgtcgaa attgatggtg ttctgctgcg tgtgcgtctg 420 gtttcctacc tggctggcat gccgcagtac ctggcgtctc cgagcacggc actgatgcca 480 cagctgggcg gtactctggc gcagctggac aacgctctgc actctttcac ccatccggcg 540 gctaaccgtg ctctgctgtg ggacatctcc cgcgcagagc aggtccgccc gtacctggac 600 ttcgttagcg agccgcagca gtatcagcac ctgcagcgca tctttgatcg ctatgactct 660 aacgtggcac cgctgctgac gacgctgcgc cgccaggtta tccacaacga cctgaacccg 720 cataacgtcc tggtcgatgg ttccagcccg acgcgcgtca cgggtatcat cgacttcggc 780 gatgcagtgt tcgcgccgct gatctgtgag gttgcgaccg ctctggcgta ccaaattggc 840 gacggcacgg atctgctgga acatgtggta ccgtttgtcg cagcgtatca ccagcgtatt 900 ccgctggcgc cggaggaaat cgccctgctg ccagatctga tcgcgacccg catggcactg 960 actctgacca tcgctcagtg gcgtgcgtct cgctacccag ataaccgcga atacctgctg 1020 cgcaacgtgc cgcgctgctg gcactccctg cagcgtatcg caacttacag ccacgcacaa 1080 tttctgacgc gcctgcagca ggtttgccca gaaaacgctc gttga 1125
<210> 156 <211> 1275 <212> DNA
<213> Seqüência artificial
<220>
<223> Aminoálcool 0-fosfato Iiase códon otimizada de Erwinia caratovora subespécie atroseptica
<400> 156
atgactgcaa ctgaagctct gctggcacgt cgtcagcgcg ttctgggcgg tggctaccgt 60 ctgttctacg aagaaccgct gcatgttgca cgcggcgaag gtgtatggct gttcgatcat 120 cagggtaaac gttacctgga cgtatataac aacgtagcta gcgtaggtca ctgtcacccg 180 gccgttgtag aagcggtcgc gcgtcaatct gcgcaactga acacccatac gcgctacctg 240 catcacgcga tcgtagattt tgctgaagat ctgctgtctg agttcccggc agaactgaac 300 aacgtcatgc tgacctgtac tggctccgaa gcgaacgacc tggccctgcg cattgcgcgt 360 cacgttacgg gtggtaccgg catgctggtg acccgttggg cctaccatgg tgttacgtcc 420 gctctggcgg agctgtcccc gtccctgggc gacggcgtag tacgcggttc ccacgtaaag 480 ctgatcgatg ctccggatac ctaccgtcag ccgggtgctt tcctgacctc tatccgcgaa 540 gcgctggcac agatgcagcg tgaaggtatt cgtccggcgg ctctgctggt tgatactatc 600 ttctcctccg acggtgtatt ctgtgcgccg gaaggtgaga tggcccaggc agccgcactg 660 atccgtcagg ccggtggcct gttcattgcg gacgaagtgc agccgggctt tggtcgtacc 720 ggtgaatccc tgtggggttt cgcacgtcat aacgtggttc cagatctggt ttctctgggc 780 aaaccgatgg gtaacggcca tccgattgct ggtctggtag gtcgctccgc actgttcgac 840 gcttttggtc gtgatgttcg ctactttaat actttcggcg gtaacccagt atcctgccag 900 gcggcacatg ctgttctgcg cgttatccgt gaagaacagc tgcagcagaa cgcgcagcgt 960 gttggtgatt atctgcgcca aggtctgcag cagctggcac aacacttccc gctgatcggt 1020 gacattcgtg catatggtct gtttatcggt gctgaactgg tttccgaccg tgaatccaaa 1080
accccagcga gcgagtctgc actgcaggtt gttaacgcga tgcgtcagcg tggtgtactg 1140
atctccgcaa ccggcccggc ggcgaacatt ctgaagatcc gtcctccgct ggtattcctg 1200
gaggaacacg cggacgtgtt cctgactacc ctgtccgacg tgctggcgct gatcggtact 1260
cgtgcacagc gttaa 1275
<210> 157 <211> 77 <212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador <400> 157
caggaggaat taaccatggg gggttctcat catcatcatc atcatggtga cgatgacgat 60 aagatgagcg atggccg 77
<210> 158 <211> 77 <212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador <400> 158
cggccatcgc tcatcttatc gtcatcgtca ccatgatgat gatgatgatg agaacccccc 60 atggttaatt cctcctg 77
<210> 159
<211> 20
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 159
ggacctgctt cgctttatcg 20
<210> 160
<211> 15
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 160 gctagagatg atagc 15
<210> 161
<211> 18
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 161
ggaagagact atccagcg 18
<210> 162
<211> 50
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 162
gcgcgcccgg gaagaaggag ctcttcacca tgaacaaacc acagtcttgg 50
<210> 163
<211> 28
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador
<400> 163
gcgcgcccgg gttcatgcca cctctgcg 28
<210> 164 <211> 558 <212> PRT
<213> LactobaciIlus brevis <400> 164
Met Lys Arg Gln Lys Arg Phe Glu Glu Leu Glu Lys Arg Pro Ile His 1 5 10 15
Leu Asp Gly Phe Val Lys Glu Trp Pro Glu Glu Gly Phe Val Ala Met 20 25 30
Met Gly Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Glu Asn Gly Lys 35 40 45
Val Thr Glu Met Asp Ser Lys Pro Ala Ala Asp Phe Asp Leu Ile Asp 50 55 60 Leu Tyr Ile Ala Lys Tyr Cly Ile Lys Leu Glu Asn Ala Glu Lys Val 65 70 75 80
Met Ala Met Asp Ser Thr Lys Ile Ala Asn Met Leu Cys Asp Pro Asn 85 90 95
Val Pro Arg Lys Asp Ile Ile Glu Ile Thr Thr Ala Met Thr Pro Ala 100 105 110
Lys Ala Clu Glu Val Ile Ser Lys Leu Asn Phe Ala Clu Met Ile Met 115 120 125
Ala Thr Cln Lys Met Arg Pro Arg Arg Thr Pro Ala Thr Gln Cys His 130 135 140
Val Thr Asn Ile Arg Asp Asn Pro Val Cln Ile Ala Ala Asp Ala Ala 145 150 155 160
Asp Ala Ala Leu Arg Gly Phe Pro Glu Gln Glu Thr Thr Thr Ala Val 165 170 175
Ala Arg Tyr Ala Pro Leu Asn Ala Ile Ser Leu Met Val Gly Ala Gln 180 185 190
Thr Gly Arg Pro Gly Val Ile Thr Gln Cys Ser Val Clu Clu Ala Clu 195 200 205
Clu Leu Ser Leu Gly Met Arg Gly Phe Thr Cly Tyr Ala Glu Thr Ile 210 215 220
Ser Val Tyr Gly Thr Asp Lys Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Gly Phe Leu Ala Ser Cys Tyr Ala Ser Arg Cly Leu Lys 245 250 255
Met Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Met Met Gly Tyr Thr 260 265 270
Glu Gly Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr 275 280 285
Lys Ala Ser Gly Val Cln Gly Leu Gln Asn Gly Gly Val Ser Cys Ile 290 295 300 Gly Ile Pro Gly Ser Val Pro Ser Gly Ile Arg Ser Val Leu Gly Glu 305 310 315 320
Asn Leu Leu Cys Met Met Leu Asp Leu Glu Cys Ala Ser Ala Asn Asp 325 330 335
Gln Ala Phe Ser His Ser Asp Met Arg Arg Thr Glu Arg Leu Leu Gly 340 345 350
Gln Phe Ile Ala Gly Thr Asp Tyr Ile Ser Ser Gly Tyr Ser Ser Thr 355 360 365
Pro Asn Tyr Asp Asn Thr Phe Ala Gly Ser Asn Thr Asp Gly Leu Asp 370 375 380
Tyr Asp Asp Tyr Tyr Val Met Glu Arg Asp Leu Ala Ile Asn Gly Gly 385 390 395 400
Ile His Pro Val Asp Glu Gln Thr Ile Ile Lys Ala Arg Asn Lys Ala 405 410 415
Ala Arg Ala Leu Gln Gly Val Phe Glu Asp Leu Gly Leu Pro Lys Ile 420 425 430
Thr Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala Asn Thr Ser Lys Asp 435 440 445
Met Pro Glu Arg Asn Met Val Glu Asp Met Lys Ala Ala Gln Asp Leu 450 455 460
Met Asp Arg Gly Ile Thr Gly Val Asp Ile Val Lys Ala Leu Phe Asn 465 470 475 480
His Gly Phe Lys Asp Val Ala Gln Ala Val Leu Asp Leu Gln Lys Gln 485 490 495
Lys Val Cys Gly Asp Phe Leu Gln Thr Ser Ala Ile Phe Asp Ser Lys 500 505 510
Trp His Val Ile Ser Ala Val Asn Asp Ala Asn Asp Tyr Gln Gly Pro 515 520 525
Gly Thr Gly Tyr Arg Leu Glu Glu Asp Thr Glu Glu Trp Glu Arg Ile 530 535 540 Lys Asn Leu Pro Phe Ala Ile Asp Pro Gln Asn Met Cln Leu 545 550 555
<210> 165 <211> 239 <212> PRT
<21B> LactobaciTlus brevis <400> 165
Met Ala Gln Glu Ile Asp Glu Asn Leu Leu Arg Asn Ile Ile Arg Asp 1 5 10 15
Val Ile Ala Glu Thr Gln Thr Gly Asp Thr Pro Ile Ser Phe Lys Ala 20 25 BO
Asp Ala Pro Ala Ala Ser Ser Ala Thr Thr Ala Thr Ala Ala Pro Val 35 40 45
Asn Gly Asp Gly Pro Glu Pro Glu Lys Pro Val Asp Trp Phe Lys His 50 55 60
Val Gly Val Ala Lys Pro Gly Tyr Ser Arg Asp Glu Val Val Ile Ala 65 70 75 80
Val Ala Pro Ala Phe Ala Glu Val Met Asp His Asn Leu Thr Gly Ile 85 90 95
Ser His Lys Glu Ile Leu Arg Gln Met Val Ala Gly Ile Glu Glu Glu 100 105 110
Gly Leu Lys Ala Arg Ile Val Lys Val Tyr Arg Thr Ser Asp Val Ser 115 120 125
Phe Cys Gly Ala Glu Gly Asp His Leu Ser Gly Ser Gly Ile Ala Ile 130 135 140
Ala Ile Gln Ser Lys Gly Thr Thr Ile Ile His Gln Lys Asp Gln Glu 145 150 155 160
Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Val Leu Asp Gly 165 170 175
Asp Thr Tyr Arg Ala Ile Gly Lys Asn Ala Ala Glu Tyr Ala Lys Gly
180 185 190
Met Ser Pro Ser Pro Val Pro Thr Val Asn Asp Gln Met Ala Arg Val
195 200 205 Cln Tyr Cln Ala Leu Ser Ala Leu Met His Ile Lys Clu Thr Lys Gln 210 215 220
Val Val Met Gly Lys Pro Ala Glu Gln Ile Glu Val Asn Phe Asn 225 230 235
<210> 166 <211> 175 <212> PRT
<213> Lactobaci7 7us brevis
<400> 166
Met Ser Glu Ile Asp Asp Leu Val Ala Lys Ile Val Cln Gln Ile Gly 15 10 15
Gly Thr Glu Ala Ala Asp Gln Thr Thr Ala Thr Pro Thr Ser Thr Ala 20 25 30
Thr Gln Thr Gln His Ala Ala Leu Ser Lys Gln Asp Tyr Pro Leu Tyr 35 40 45
Ser Lys His Pro Glu Leu Val His Ser Pro Ser Gly Lys Ala Leu Asn 50 55 60
Asp Ile Thr Leu Asp Asn Val Leu Asn Asp Asp Ile Lys Ala Asn Asp 65 70 75 80
Leu Arg Ile Thr Pro Asp Thr Leu Arg Met Gln Gly Glu Val Ala Asn 85 90 95
Asp Ala Gly Arg Asp Ala Val Gln Arg Asn Phe Gln Arg Ala Ser Glu 100 105 110
Leu Thr Ser Ile Pro Asp Asp Arg Leu Leu Glu Met Tyr Asn Ala Leu 115 120 125
Arg Pro Tyr Arg Ser Thr Lys Ala Glu Leu Leu Ala Ile Ser Ala Glu 130 135 140
Leu Lys Asp Lys Tyr His Ala Pro Val Asn Ala Gly Trp Phe Ala Glu 145 150 155 160
Ala Ala Asp Tyr Tyr Glu Ser Arg Lys Lys Leu Lys Gly Asp Asn 165 170 175 <210> 167 <211> 554 <212> PRT
<213> SalmonelTa enterica subespécie enterica sorovar Choleraesuis <400> 167
Met Arg Ser Lys Arg Phe GTu Ala Leu Ala Lys Arg Pro Val Asn Cln 1 5 10 15
Asp Cly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu 20 25 BO
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Ala Val 35 40 45
Thr Glu Leu Asp Gly Lys Pro Val Ser Glu Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Asn Arg Ala Glu Glu Val Met 65 70 75 80
Ala Met Asp Ser Ile Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Lys Arg Ser Glu Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ala 115 120 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val 130 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Gly Ala Trp Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val 180 185 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205 Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Thr Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Gly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320
Leu Ile Cys Ser Ser Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr 420 425 430
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met 435 440 445 Pro Clu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile 450 455 460
Asn Lys Asn Arg Asn Gly Leu Glu Val Val Lys Ala Leu Ala Gln Gly 465 470 475 480
Gly Phe Thr Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys 485 490 495
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Gly Asp Gly 500 505 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala 515 520 525
Thr Gly Tyr Arg Leu Gln Gly Glu Arg Trp Glu Glu Ile Lys Asn Ile 530 535 540
Pro Gly Ala Leu Asp Pro Asn Glu Ile Asp 545 550
<210> 168 <211> 224 <212> PRT
<213> SaTmoneTTa enterica subespécie enterica sorovar ChoTeraesuis cepa SC-B67
<400> 168
Met Glu Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Asp Val Leu 1 5 10 15
Arg Asp Met Lys Gly Ser Asp Lys Pro Val Ser Phe Asn Ala Pro Ala 20 25 30
Ala Ser Thr Ala Pro Gln Thr Ala Ala Pro Ala Gly Asp Gly Phe Leu 35 40 45
Thr Glu Val Gly Glu Ala Arg Gln Gly Thr Gln Gln Asp Glu Val Ile 50 55 60
Ile Ala Val Gly Pro Ala Phe Gly Leu Ala Gln Thr Val Asn Ile Val 65 70 75 80
Gly Leu Pro His Lys Ser Ile Leu Arg Glu Val Ile Ala Gly Ile Glu 85 90 95 Glu Glu Gly Ile Arg Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp 100 105 110
Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Gly Ser Gly Ile 115 120 125
Ser Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly IBO 135 140
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu 145 150 155 160
Thr Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala 165 170 175
Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala 180 185 190
Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr 195 200 205
Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu 210 215 220
<210> 169 <211> 173 <212> PRT
<213> Salmonella enterica subespécie enterica sorovar ChoTeraesuis cepa SC-B67
<400> 169
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Arg 15 10 15
Met Asn Ser Leu Gln Gly Asp Ala Pro Ala Ala Ala Ser Ala Ala Gly 20 25 30
Gly Thr Ser Arg Ser Ala Lys Val Ser Asp Tyr Pro Leu Ala Asn Lys 35 40 45
His Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe 50 55 60
Thr Leu Glu Asn Val Leu Ser Asn Lys Val Thr Ala Gln Asp Met Arg 65 70 75 80 He Thr Pro Clu Thr Leu Arg Leu Gln Ala Ser Ile Ala Lys Asp Ala 85 90 95
Gly Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu Thr 100 105 110
Ala Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro 115 120 125
Tyr Arg Ser Thr Lys Glu Glu Leu Met Ala Ile Ala Asp Asp Leu Glu 130 135 140
Asn Arg Tyr Gln Ala Lys Ile Cys Ala Ala Phe Val Arg Glu Ala Ala 145 150 155 160
Thr Leu Tyr Val Glu Arg Lys Lys Leu Lys Gly Asp Asp 165 170
<210> 170 <211> 554 <212> PRT
<213> Escherichia coli <400> 170
Met Arg Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Gln 1 5 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Val Val 35 40 45
Thr Glu Leu Asp Gly Lys Pro Ala Ser Gln Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Ala Arg Ala Glu Glu Val Ile 65 70 75 80
Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Lys Arg Ser Asp Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser Gln Met Asn Val Val Glu Met Met Met Ala 115 120 125 Met Cln Lys Met Arg ATa Arg Arg Thr Pro Ser Cln Cln Ala His Val 130 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Cly Ala Trp Arg Gly Phe Asp Glu Gln Clu Thr Thr Val Ala Val Ala 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val 180 185 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Clu Ala Thr Glu 195 200 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Cln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Gly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320
Leu Ile Cys Ser Ser Leu Asp Leu Clu Cys Ala Ser Ser Asn Asp Gln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Phe Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Phe Ser Ala Val Pro 355 360 365 Asn Tyr Asp Asn Met Phe Ala Cly Ser Asn Clu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr 420 425 430
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile 450 455 460
Asn Lys Asn Arg Asn Ser Leu Glu Val Val Lys Ala Leu Ala Gln Gly 465 470 475 480
Gly Phe Thr Asp Val Ala Gln Asp Met Leu Asn Met Gln Lys Ala Lys 485 490 495
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Asp Asp Gly 500 505 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala 515 520 525
Thr Gly Tyr Arg Leu Gln Gly Glu Arg Trp Glu Glu Ile Lys Asn Ile 530 535 540
Pro Gly Ala Leu Asp Pro Asn Glu Ile Asp 545 550
<210> 171
<211> 222
<212> PRT
<213> Escherichia coli
<400> 171
Met Glu Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Asp Val Leu 1 5 10 15
Ala Glu Met Gln Pro Ser Asp Lys Ser Val Ser Phe Arg Ala Pro Val 20 25 30 Ser Ala Thr Val Ser Ser Ala Pro Asp Thr GTy Asn Phe Leu Thr Glu 35 40 45
Ile Gly Glu Ala Gln Gln Gly Thr Gln Gln Asp Glu Val Ile Ile Ala 50 55 60
Val Gly Pro Ala Phe Gly Leu Ala Gln Thr Val Asn Ile Ile Gly Ile 65 70 75 80
Pro His Lys Asn Ile Leu Arg Glu Val Ile Ala Gly Ile Glu Glu Glu 85 90 95
Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp Val Ala 100 105 110
Phe Val Ala Val Glu Gly Asp Arg Leu Ser Gly Ser Gly Ile Ala Ile 115 120 125
Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly Leu Pro 130 135 140
Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu Thr Leu 145 ' 150 155 160
Asp Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Lys Arg 165 170 175
Glu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala Arg Pro 180 185 190
Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr Lys Tyr 195 200 205
Val Val Thr Gly Lys Lys Pro Gln Glu Leu Arg Val Thr Phe 210 215 220
<210> 172 <211> 172 <212> PRT
<213> Escherichia coli <400> 172
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Asn Arg 15 10 15 Met Asn Ser Leu Gln Asp Ala Ala Pro Val Ser Ala Val Pro Asn Ala 20 25 BO
Ser Ile Leu Ser Ala Lys Val Thr Asp Tyr Pro Leu Ala Asn Lys His 35 40 45
Pro Clu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe Thr 50 55 60
Leu Clu Asn Val Leu Ser Asp Asn Val Thr Ala Leu Asp Met Arg Ile 65 70 75 80
Thr Pro Glu Thr Leu Arg Ile Gln Ala Ala Ile Ala Arg Asp Ala Gly 85 90 95
Cys Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Clu Leu Thr Ser 100 105 110
Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro Tyr 115 120 125
Arg Ser Thr Lys Gln Glu Leu Ile Ala Ile Ala Asp Asp Leu Clu Gln 130 135 140
Arg Tyr Gln Ala Lys Ile Cys Ala Ala Phe Val Arg Clu Ala Ala Glu 145 150 155 160
Leu Tyr Val Glu Arg Lys Lys Leu Lys Gly Asp Asp 165 170
<210> 173 <211> 554 <212> PRT
<213> ShigeTTa sonnei
<400> 173
Met Arg Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Gln 1 5 10 15
Asp Cly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Val Val 35 40 45 Thr Glu Leu Asp Cly Lys Pro Ala Ser Gln Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Ala Arg Ala Glu Glu Val Ile 65 70 75 80
Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Lys Arg Ser Asp Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 lio
Ile Val Clu Val Val Ser Gln Met Asn Val Val Glu Met Met Met Ala 115 120 12 5
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val IBO 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Gly Ala Trp Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val 180 185 190
Cly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Lys Leu Cly Met Leu Cly His Thr Cys Tyr Ala Clu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Clu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Cly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Cly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Cly Lys Ser Met Leu Tyr Leu Clu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285 Ala Ala Cly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Gly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320
Leu Ile Cys Ser Ser Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Phe Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Phe Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr 420 425 430
Asp Glu Clu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile 450 455 460
Asn Lys Asn Arg Asn Ser Leu Glu Val Val Lys Ala Leu Ala Gln Gly 465 470 475 480
Ser Phe Thr Asp Val Ala Gln Asp Met Leu Asn Met Gln Lys Ala Lys 485 490 495
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Asp Asp Gly 500 505 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala 515 520 525 Thr Gly Tyr Arg Leu Gln Gly Glu Arg Trp Glu Glu Ile Lys Asn Ile 530 535 540
Pro Gly Ala Leu Asp Pro Asn Glu Ile Asp 545 550
<210> 174 <211> 222 <212> PRT
<213> Shigella sonnei <400> 174
Met Glu Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Asp Val Leu 15 10 15
Ala Glu Met Gln Pro Ser Asp Lys Ser Val Ser Phe Arg Ala Pro Val 20 25 30
Ser Ala Thr Val Pro Ser Ala Pro Asp Thr Gly Asn Phe Leu Thr Glu 35 40 45
Ile Gly Glu Ala Gln Gln Gly Thr Gln Gln Asp Glu Val Ile Ile Ala 50 55 60
Val Gly Pro Ala Phe Gly Leu Ala Gln Thr Val Asn Ile Ile Gly Ile 65 70 75 80
Pro His Lys Asn Ile Leu Arg Glu Val Ile Ala Gly Ile Glu Glu Glu 85 90 95
Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp Val Ala 100 105 110
Phe Val Ala Val Glu Gly Asp Arg Leu Ser Gly Ser Gly Ile Ala Ile 115 120 125
Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly Leu Pro 130 135 140
Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu Thr Leu 145 150 155 160
Asp Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Lys Arg 165 170 175 Clu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala Arg Pro 180 185 190
Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr Lys Tyr 195 200 205
Val Val Thr Gly Lys Lys Pro Gln Glu Leu Arg Val Thr Phe 210 215 220
<210> 175 <211> 172 <212> PRT
<213> ShigeTTa sonnei <400> 175
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Asn Arg 1 5 10 15
Met Asn Ser Leu Gln Asp Ala Ala Pro Val Ser Ala Val Pro Asn Ala 20 25 30
Ser Ile Leu Ser Ala Lys Val Thr Asp Tyr Pro Leu Ala Asn Lys His 35 40 45
Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe Thr 50 55 60
Leu Glu Asn Val Leu Ser Asp Asn Val Thr Ala Leu Asp Met Arg Ile 65 70 75 80
Thr Pro Glu Thr Leu Arg Ile Gln Ala Ala Ile Ala Arg Asp Ala Gly 85 90 95
Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu Thr Ser 100 105 110
Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro Tyr 115 120 125
Arg Ser Thr Lys Gln Glu Leu Ile Ala Ile Ala Asp Asp Leu Glu Gln 130 135 140
Arg Tyr Gln Ala Lys Ile Cys Ala Ala Phe Val Arg Glu Ala Ala Glu 145 150 155 160 Leu Tyr Val GTu Arg Lys Lys Leu Lys Gly Asp Asp 165 170
<210> 176 <211> 554 <212> PRT
<213> Yersinia bercovieri <400> 176
Met Lys Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Gln 15 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Val Val 35 40 45
Thr Glu Leu Asp Gly Lys Pro Gln Ser Ser Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Asp His Ala Glu Glu Val Met 65 70 75 80
Lys Met Asp Ser Ile Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Ser Arg Arg Thr Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ser 115 120 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val 130 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Gly Ala Phe Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val 180 185 190 Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Val Gly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Ile Leu Ala Glu Asn 305 310 315 320
Leu Ile Cys Ser Ala Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Leu Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Leu Glu Ala Asp Val Val Ala Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr 420 425 430 Asp Clu Glu Val Ile Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile 450 455 460
Ser Lys Asn Arg Thr Gly Leu Glu Val Val Lys Ala Leu Ala Gln Gly 465 470 475 480
Gly Phe Glu Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys 485 490 495
Ile Ala Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Lys Gly Asp Asn 500 505 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala 515 520 525
Thr Gly Tyr Arg Leu Glu Gly Ala Arg Trp Glu Glu Ile Lys Asn Ile 530 535 540
Pro Asn Ala Leu Asp Pro Asn Glu Leu Gly 545 550
<210> 177
<211> 221
<212> PRT
<213> Yersinia
bercovieri
<400> 177
Met Val Asp Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Gly Val 15 10 15
Leu Gln Glu Met Gln Gly Glu Lys Asn Ser Val Ser Phe Lys Gln Glu 20 25 30
Ser Gln Pro Ala Thr Ala Val Ala Ser Gly Asp Phe Leu Thr Glu Val 35 40 45
Gly Glu Ala Arg Pro Gly Ser Asn Gln Asp Glu Val Ile Ile Ala Val 50 55 60
Gly Pro Ala Phe Gly Leu Ser Gln Thr Ala Asn Ile Val Gly Ile Pro
65 70 75 80
His Lys Asn Ile Leu Arg Glu Leu Ile Ala Gly Ile Glu Glu Glu Gly 85 90 95 Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp Val Ala Phe 100 105 110
Val Ala Val Glu Gly Asri Arg Leu Ser Gly Ser Gly Ile Ser Ile Gly 115 120 125
Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly Leu Pro Pro 130 135 140
Leu 145
Ser Asn Leu Glu
Leu Phe Pro Gln Ala Pro 150 155
Leu Leu Thr Leu
Glu 160
Thr Tyr Arg Leu Ile Gly Lys Asn Ala Ala Arg Tyr Ala Lys Arg Glu 165 170 175
Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala Arg Pro Lys 180 185 190
Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr Lys Tyr Val 195 200 205
Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu 210 215 220
<210> 178
<211> 174
<212> PRT
<213> Yersinia bercovieri
<400> 178
Met Asn Ser Glu Ala Ile Glu Ser Met Val Arg Asp Val Leu Asn Lys 1 5 10 15
Met Asn Ser Leu Gln Gly Gln Ala Pro Ala Ala Cys Pro Ala Pro Ala 20 25 30
Ala Ser Ser Arg Ser Asp Ala Lys Val Ser Asp Tyr Pro Leu Ala Asn 35 40 45
Lys His Pro Asp Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp 50 55 60
Leu Thr Leu Ala Asn Val Leu Asn Gly Ser Val Thr Ser Gln Asp Leu 65 70 75 80 Arg Ile Thr Pro Glu Ile Leu Arg Ile Cln Ala Ser Ile Ala Lys Asp 85 90 95
Ala Gly Arg Pro Leu Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu 100 105 110
Thr Ala Val Pro Asp Asp Lys Val Leu Asp Ile Tyr Asn Ala Leu Arg 115 120 125
Pro Phe Arg Ser Ser Lys Glu Glu Leu Asn Ala Ile Ala Asp Asp Leu IBO 135 140
Glu Lys Thr Tyr Gln Ala Thr Ile Cys Ala Ala Phe Val Arg Glu Ala 145 150 155 160
Ala Val Leu Tyr Val Gln Arg Lys Lys Leu Lys Gly Asp Asp 165 170
<210> 179 <211> 551 <212> PRT
<213> Yersinia mollaretii <400> 179
Met Lys Ser Lys Arg Phe Glu Ala Arg Pro Val Asn Gln Asp Gly Phe 15 10 15
Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu Ser Pro Asn 20 25 30
Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Val Val Thr Glu Leu 35 40 45
Asp Gly Lys Pro Gln Ser Ser Phe Asp Leu Ile Asp His Phe Ile Ala 50 5 5 60
Arg Tyr Gly Ile Asn Leu Asp His Ala Glu Glu Val Met Lys Met Asp 65 70 75 80
Ser Ile Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val Ser Arg Arg 85 90 95
Thr Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys Ile Val Clu 100 105 110 Val Val Ser His Met Asn Val Val Glu Met Met Met Ser Met Cln Lys 115 120 125
Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val Thr Asn Val IBO 135 140
Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu Gly Ala Phe 145 150 155 160
Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala Arg Tyr Ala 165 170 175
Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val Gly Arg Pro 180 185 190
Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu Leu Lys Leu 195 200 205
Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser Val Tyr Gly 210 215 220
Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp Ser Lys Gly 225 230 235 240
Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met Arg Phe Thr 245 250 255
Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu Gly Lys Ser 260 265 270
Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys Ala Ala Gly 275 280 285
Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Val Gly Val Pro Ser 290 295 300
Ala Val Pro Ser Gly Ile Arg Ala Ile Leu Ala Glu Asn Leu Ile Cys 305 310 315 320
Ser Ala Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln Thr Phe Thr 325 330 335
His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln Phe Leu Pro 340 345 350 Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro Asn Tyr Asp 355 360 365
Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe Asp Asp Tyr 370 375 380
Asn Val Leu Gln Arg Asp Leu Lys Val Asp Gly Gly Leu Arg Pro Val 385 390 395 400
Leu Glu Ala Asp Val Val Ala Ile Arg Asn Lys Ala Ala Arg Ala Leu 405 410 415
Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr Asp Glu Glu 420 425 430
Val Ile Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met Pro Asp Arg 435 440 445
Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile Ser Lys Asn 450 455 460
Arg Thr Gly Leu Glu Val Val Lys Ala Leu Ala Gln Gly Gly Phe Glu 465 470 475 480
Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys Ile Ala Gly 485 490 495
Asp Tyr Leu His Thr Ser Ala Ile Ile Lys Gly Asp Asn Gln Val Leu 500 505 510
Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala Thr Gly Tyr 515 520 525
Arg Leu Glu Gly Ala Arg Trp Glu Glu Ile Lys Asn Ile Pro Asn Ala 530 535 540
Leu Asp Pro Asn Glu Leu Gly 545 550
<210> 180
<211> 224
<212> PRT
<213> Yersinia mollaretii
<400> 180 Met Val Asp Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Gly Val 1 5 10 15
Leu Gln Glu Met Gln Gly Asp Asn Asn Thr Val Ser Phe Lys Pro Val 20 25 30
Ser Gln Pro Ala Thr Ala Ala Thr Ala Val Ala Ala Gly Asp Phe Leu 35 40 45
Thr Glu Val Gly Glu Ala Arg Pro Gly Ser Asn Gln Asp Glu Val Ile 50 55 60
Ile Ala Val Gly Pro Ala Phe Gly Leu Ser Gln Thr Ala Asn Ile Val 65 70 75 80
Gly Ile Pro His Lys Asn Ile Leu Arg Glu Leu Ile Ala Gly Ile Glu 85 90 95
Glu Glu Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp 100 105 110
Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Gly Ser Gly Ile 115 120 125
Ser Ile Gly Ile Gln Ser Lys Gly Thr Ile Val Ile His Gln Gln Gly 130 135 140
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu 145 150 155 160
Thr Leu Asp Thr Tyr Arg Leu Ile Gly Lys Asn Ala Ala Arg Tyr Ala 165 170 175
Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala 180 185 190
Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr 195 200 205
Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu 210 215 220
<210> 181 <211> 175 <212> PRT <213> Yersinia mollaretii <400> 181
Met Asn Ser Glu Ala Ile Glu Ser Met Val Arg Asp Val Leu Asn Lys 15 10 15
Met Asn Ser Leu Gln Gly Gln Thr Pro Ala Ala Ala Cys Ala Ala Pro 20 25 30
Ala Ala Ser Ser Arg Ser Asn Ala Lys Val Ser Asp Tyr Pro Leu Ala 35 40 45
Asn Lys His Pro Asp Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp 50 5 5 60
Asp Leu Thr Leu Ala Asn Val Leu Asn Gly Ser Val Thr Ser Gln Asp 65 70 75 80
Leu Arg Ile Thr Pro Glu Ile Leu Arg Ile Gln Ala Ser Ile Ala Lys 85 90 95
Asp Ala Gly Arg Pro Leu Leu Ala Met Asn Phe Glu Arg Ala Ala Glu 100 105 110
Leu Thr Ala Val Pro Asp Asp Lys Val Leu Asp Ile Tyr Asn Ala Leu 115 120 125
Arg Pro Phe Arg Ser Ser Lys Glu Glu Leu Asn Ala Ile Ala Asp Asp 130 135 140
Leu Glu Lys Thr Tyr Lys Ala Thr Ile Cys Ala Ala Phe Val Arg Glu 145 150 155 160
Ala Ala Val Leu Tyr Val Gln Arg Lys Lys Leu Lys Gly Asp Asp 165 170 175
<210> 182 <211> 554 <212> PRT
<213> Yersinia enterocolitica subespécie enterocoTitica <400> 182
Met Lys Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Gln 15 10 15 Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Val Val 35 40 45
Thr Glu Leu Asp Gly Lys Pro Gln Ser Ser Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Ala His Ala Glu Glu Val Met 65 70 75 80
Lys Met Asp Ser Ile Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Ser Arg Arg Thr Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ser 115 120 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val 130 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Gly Ala Phe Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val 180 185 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255 Arg Phe Thr Ser GTy Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Val Gly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Ile Leu Ala Glu Asn 305 310 315 320
Leu Ile Cys Ser Ala Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Met Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Leu Glu Ala Asp Val Val Ala Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr 420 425 430
Asp Glu Glu Val Ile Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile 450 455 460
Ser Lys Asn Arg Thr Gly Leu Glu Val Val Lys Ala Leu Ala Gln Gly 465 470 475 480
Gly Phe Glu Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys 485 490 495 Ile Ala CTy Asp Tyr Leu His Thr Ser Ala Ile Ile Lys Gly Asp Asn 500 505 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala 515 520 525
Thr Gly Tyr Arg Leu Glu Gly Ala Arg Trp Glu Glu Ile Lys Asn Ile 530 535 540
Pro Asn Ala Leu Asp Pro Asn Glu Leu Gly 545 550
<210> 183 <211> 223 <212> PRT
<213> Yersinia enterocolitica subespécie enterocolitica <400> 183
Met Val Asp Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Gly Val 1 5 10 15
Leu Gln Glu Met Gln Gly Asp Ser Asn Thr Val Ser Phe Lys Gln Glu 20 25 30
Thr Gln Pro Thr Ala Thr Ala Ala Val Ala Ser Gly Asp Phe Leu Thr 35 40 45
Glu Val Gly Glu Ala Arg Pro Gly Thr His Gln Asp Glu Val Ile Ile 50 55 60
Ala Val Gly Pro Ala Phe Gly Leu Ser Gln Thr Ala Asn Ile Val Gly 65 70 75 80
Ile Pro His Lys Asn Ile Leu Arg Glu Leu Ile Ala Gly Ile Glu Glu 85 90 95
Glu Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp Val 100 105 110
Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Gly Ser Gly Ile Ser 115 120 125
Ile Gly Ile Cln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly Leu 130 135 140
Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu Thr
145 150 155 160 Leu Clu Thr Tyr Arg Leu Ile Cly Lys Asn Ala Ala Arg Tyr Ala Lys 165 170 175
Arg Clu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala Arg 180 185 190
Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr Lys 195 200 205
Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu 210 215 220
<210> 184 <211> 174 <212> PRT
<213> Yersinia enterocolitica subespécie enterocolitica <400> 184
Met Asn Ser Glu Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Lys 1 5 10 15
Met Asn Ser Leu Gln Gly Gln Thr Pro Thr Thr Ala Cys Ala Pro Ala 20 25 30
Ala Ser Ser Arg Ser Asp Ala Lys Val Ser Asp Tyr Pro Leu Ala Asn 35 40 45
Lys His Pro Asp Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp 50 55 60
Leu Thr Leu Ala Asn Val Leu Asn Gly Ser Val Thr Ser Gln Asp Leu 65 70 75 80
Arg Ile Thr Pro Glu Ile Leu Arg Ile Gln Ala Ser Ile Ala Lys Asp 85 90 95
Ala Gly Arg Pro Leu Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu 100 105 110
Thr Ala Val Pro Asp Asp Lys Val Leu Asp Ile Tyr Asn Ala Leu Arg 115 120 125
Pro Phe Arg Ser Ser Lys Glu Glu Leu Asn Ala Ile Ala Asp Asp Leu 130 135 140
Glu Gln Thr Tyr Lys Ala Thr Ile Cys Ala Ala Phe Val Arg Glu Ala 145 150 155 160 Ia Val Leu Tyr Val Gln Arg Lys Lys Leu Lys Cly Asp Asp 165 170
<210> 185
<211> 554
<212> PRT
<21B> Yersinia intermedia
<400> 185
Met Lys Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Gln 1 5 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Val Val 35 40 45
Thr Glu Leu Asp Gly Lys Pro Gln Ser Ser Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Ala His Ala Glu Glu Val Met 65 70 75 80
Lys Met Asp Ser Ile Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Ser Arg Arg Thr Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ser 115 120 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val 130 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Gly Ala Tyr Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val
180 185 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Clu
195 200 205 Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
VaT Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Val Gly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Ile Leu Ala Glu Asn 305 310 315 320
Leu Ile Cys Ser Ala Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Phe Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Leu Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Leu Glu Ala Asp Val Val Ala Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr 420 425 430
Asp Glu Glu Val Ile Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met 435 440 445 Pro Glu Arg Asn Ile Val Clu Asp Ile Lys Phe Ala Cln Glu Ile Ile 450 455 460
Ser Lys Asn Arg Thr Gly Leu Glu Val Val Lys Ala Leu Ala Cln Gly 465 470 475 480
Gly Phe Glu Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys 485 490 495
Ile Ala Cly Asp Tyr Leu His Thr Ser Ala Ile Ile Lys Cly Asp Asn 500 505 510
Cln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala 515 520 525
Thr Gly Tyr Arg Leu Glu Cly Ala Arg Trp Clu Clu Ile Lys Asn Ile 530 535 540
Pro Asn Ala Leu Asp Pro Asn Glu Leu Gly 545 550
<210> 186
<211> 224
<212> PRT
<213> Yersinia intermedia
<400> 186
Met Val Asp Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Gly Val 15 10 15
Leu Gln Glu Met Gln Gly Asp Lys Asn Thr Val Ser Phe Lys Gln Asp 20 25 30
Thr Cln Pro Ala Ala Ala Ala Ala Thr Val Ala Glu Gly Asn Phe Leu 35 40 45
Thr Glu Val Cly Clu Ala Arg Pro Cly Ser Asn Gln Asp Glu Val Ile 50 55 60
Ile Ala Val Gly Pro Ala Phe Gly Leu Ser Cln Thr Ala Asn Ile Val 65 70 75 80
Gly Ile Pro His Lys Asn Ile Leu Arg Glu Leu Ile Ala Gly Ile Glu
85 90 95
Glu Glu Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp
100 105 110 Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Gly Ser Gly Ile 115 120 125
Ser Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly 130 135 140
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu 145 150 155 160
Thr Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala 165 170 175
Lys Arg Glu Ser Pro Gln Pro 180
Val
Pro Thr 185
Leu Asn Asp
Gln 190
Met Ala
Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr 195 200 205
Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu 210 215 220
<210> 187
<211> 175
<212> PRT
<213> Yersinia intermedia
<400> 187
Met Asn Ser Glu Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Lys 15 10 15
Met Asn Ser Leu Gln Ser Gln Thr Pro Ala Ala Ala Cys Ala Ala Pro 20 25 30
Ala Thr Ser Ser Arg Asn Asp Ala Lys Val Ser Asp Tyr Pro Leu Ala 35 40 45
Asn Lys His Pro Asp Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp 50 55 60
Asp Leu Thr Leu Ala Asn Val Leu Asn Gly Ser Val Thr Ser Gln Asp 65 70 75 80
Leu Arg Ile Thr Pro Glu Ile Leu Arg Ile Gln Ala Ser Ile Ala Arg 85 90 95
Asp Ala Gly Arg Pro Leu Leu Ala Ile Asn Phe Glu Arg Ala Ala Glu 100 105 110 Leu Thr Ala Val Pro Asp Asp Lys Val Leu Asp Ile Tyr Asn Ala Leu 115 120 125
Arg Pro Phe Arg Ser Ser Lys Glu Glu Leu Asn Ala Ile Ala Asp Asp 130 135 140
Leu Glu Gln Thr Tyr Lys Ala Thr Ile Cys Ala Ala Phe Val Arg Glu 145 150 155 160
Ala Ala Val Leu Tyr Val Gln Arg Lys Lys Leu Lys Gly Asp Asp 165 170 175
<210> 188 <211> 554 <212> PRT
<213> Listeria welshimeri <400> 188
Met Lys Ser Lys Arg Phe Glu Glu Leu Ala Lys Arg Pro Val Asn Gln 15 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Leu Ile Ala Met Glu 20 2 5 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Glu Asn Gly Lys Val 35 40 45
Val Glu Met Asp Ser Lys Lys Leu Ala Asp Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Lys Tyr Gly Val Asp Leu Ser Arg Ala Glu Glu Val Met 65 70 75 80
Gln Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Pro Arg Glu Lys Ile Val Leu Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser Gln Met Asn Val Val Glu Met Met Met Ser 115 120 125
Met Gln Lys Met Arg Ser Arg Arg Thr Pro Thr Thr Gln Ala His Val 130 135 140 Thr Asn Leu Arg Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Ala Ala Ile Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Val 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Leu Ser Leu Leu Val Gly Ser Gln Thr 180 185 190
Gly Arg Gly Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Glu Leu Gly Met Arg Gly Leu Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Ile Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Thr Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Ile Ser Cys Ile Gly 290 295 300
Ile Pro Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320
Leu Ile Ala Val Met Leu Asp Leu Glu Val Ala Ser Gly Asn Asp Gln 325 330 335
Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Tyr Ile Ser Ser Gly Tyr Ser Ala Thr Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Asp Asp Phe 370 375 380 Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Lys Val Asp Cly Gly Leu 385 390 395 400
Thr Pro Val Thr Glu Glu Glu Val Val Ala Val Arg Asn Lys Ala Ala 405 410 415
Arg Val Ile Gln Val Val Phe Glu Lys Leu Gly Leu Pro Thr Val Thr 420 425 430
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala Arg Gly Ser Asn Asp Met 435 440 445
Pro Glu Arg Asn Met Val Glu Asp Ile Lys Ala Ala Ala Glu Met Met 450 455 460
Asp Arg Gly Val Thr Gly Leu Asp Val Val Lys Ala Leu Ser Ala Gly 465 470 475 480
Gly Phe Asp Asp Val Ala Glu Ser Val Leu Asn Met Leu Lys Gln Arg 485 490 495
Val Ser Gly Asp Phe Leu His Thr Ser Ala Ile Ile Asp Lys Asp Trp 500 505 510
Asn Val Ile Ser Ser Val Asn Asp Leu Asn Asp Tyr Ala Gly Pro Gly 515 520 525
Thr Gly Tyr Arg Leu Glu Gly Glu Arg Trp Glu Lys Leu Lys Asn Ile 530 535 540
Ala Val Ala Val Asp Ala Asn Glu Leu Asp 545 550
<210> 189 <211> 219 <212> PRT
<213> Listeria welshimeri <400> 189
Met Val Glu Ile Asn Glu Lys Val Leu Arg Gly Ile Ile Ser Glu Val 15 10 15
Leu Asp Glu Leu Gln Leu Lys Glu Asp Lys Val Ser Phe Gln Lys Glu
20 25 30
Pro Ser Asn Pro Val Val Ser Asp Glu Ser Phe Leu Thr Glu Val Gly 35 40 45 Asp Ala Lys Pro Gly Arg GTri Lys Asp Glu Val Val Ile Ala Val Ala 50 5 5 60
Pro Ala Phe Gly Lys Tyr Gln Thr Lys Asn Ile Val Gly Val Pro His 65 70 75 80
Lys Gln Ile Leu Arg Glu Val Ile Ala Gly Ile Glu Glu Glu Gly Leu 85 90 95
Lys Ala Arg Val Val Arg Val Phe Arg Ser Ser Asp Val Ala Phe Val 100 105 110
Ala Val Glu Gly Asp Arg Leu Ser Gly Ser Gly Ile Cys Ile Gly Ile 115 120 125
Gln Ser Arg Gly Thr Ala Leu Ile His Gln Lys Asp Leu Gln Pro Leu 130 135 140
Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Ile Thr Leu Glu Thr 145 150 155 160
Tyr Arg Ala Ile Gly Lys Asn Ala Ala Lys Tyr Ala Lys Gly Glu Ser 165 170 175
Pro Asn Pro Val Pro Met Val Asn Asp Gln Met Ala Arg Pro Lys Phe 180 185 190
Gln Ala Lys Ala Ala Leu Leu His Ile Lys Glu Thr Lys His Val Val 195 200 205
Gln Gly Lys Asn Ala Val Glu Leu Gln Val Asn 210 215
<210> 190 <211> 170 <212> PRT
<213> Listeria welshimeri <400> 190
Met Asn Gln Glu Ala Leu Glu Asn Met Val Arg Asn Ile Leu Gln Glu 15 10 15
Val Asn Ser Gly Ala Val Ser Thr Thr Thr Ser Gln Lys Val Ser Gly
20 25 30
Asp Thr Leu Thr Val Arg Asp Tyr Pro Leu Gly Lys Lys Arg Pro Glu 35 40 45 Leu Val Lys Thr Ser Thr Ser Lys Ser Leu Asp Asp Ile Thr Leu Lys 50 55 60
Ser Val Leu Asp Gly Thr Ile Lys Pro Glu Asp Val Arg Val Thr Ala 65 70 75 80
Glu Thr Leu Lys Met Glri Ala Gln Val Ala Arg Asp Ala Gly Arg Ala 85 90 95
Thr Leu Ala Asn Asn Phe Glu Arg Ala Ala Glu Leu Thr Ile Val Pro 100 105 110
Asp Glu Arg Ile Leu Glu Ile Tyr Asn Ala Met Arg Pro Tyr Arg Ser 115 120 125
Ser Lys Glu Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu Ser Val Tyr 1B0 135 140
His Ala Thr Ile Cys Ser Asn Tyr Val Arg Glu Ala Ala Gln Leu Tyr 145 150 155 160
Gln Glu Arg Lys Lys Leu Lys Gly Asp Asn 165 170
<210> 191 <211> 554 <212> PRT
<213> Listeria innocua <400> 191
Met Lys Ser Lys Arg Phe Glu Glu Leu Ala Lys Arg Pro Val Asn Gln 15 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Leu Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Glu Asn Gly Lys Val 35 40 45
Val Glu Met Asp Ser Lys Lys Leu Ala Asp Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Lys Tyr Gly Val Asp Leu Ser Arg Ala Glu Glu Val Met 65 70 75 80 Lys Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Pro Arg Clu Lys Ile Val Leu Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Clu Val Val Ser Gln Met Asn Val Val Glu Met Met Met Ser 115 120 125
Met Gln Lys Met Arg Ser Arg Arg Thr Pro Thr Thr Gln Ala His Val IBO 135 140
Thr Asn Leu Arg Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Ala Ala Ile Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Val 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Leu Ser Leu Leu Val Gly Ser Gln Thr 180 185 190
Gly Arg Gly Gly Val Leu Thr Gln Cys Ser Leu Clu Clu Ala Thr Glu 195 200 205
Leu Glu Leu Gly Met Arg Gly Leu Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Cly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Ile Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Thr Cly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Ile Ser Cys Ile Cly 290 295 300
Ile Pro Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320 Leu Ile Ala Val Met Leu Asp Leu Glu Val Ala Ser Cly Asn Asp Cln 325 330 335
Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Tyr Ile Ser Ser Gly Tyr Ser Ala Thr Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Asp Asp Phe 370 375 380
Asp Asp Tyr Asn Ile Leu Cln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Thr Pro Val Thr Glu Clu Clu Val Val Ala Val Arg Asn Lys Ala Ala 405 410 415
Arg Val Ile Cln Val Val Phe Asp Lys Leu Cly Leu Pro Ala Val Thr 420 425 430
Asp Glu Glu Val Clu Ala Ala Thr Tyr Ala Arg Gly Ser Asn Asp Met 435 440 445
Pro Glu Arg Asn Met Val Glu Asp Ile Lys Ala Ala Ala Glu Met Met 450 455 460
Asp Arg Gly Val Thr Gly Leu Asp Val Val Lys Ala Leu Ala Ala Cly 465 470 475 480
Gly Phe Asp Asp Val Ala Glu Ser Val Leu Asn Met Leu Lys Gln Arg 485 490 495
Val Ser Gly Asp Phe Leu His Thr Ser Ala Ile Ile Asp Lys Asp Trp 500 505 510
Asn Val Ile Ser Ser Val Asn Asp Leu Asn Asp Tyr Ala Cly Pro Cly 515 520 525
Thr Gly Tyr Arg Leu Glu Gly Clu Arg Trp Clu Lys Leu Lys Asp Ile 530 535 540
Ala Val Ala Val Asp Ala Asn Clu Leu Asp 545 550 <210> 192 <211> 219 <212> PRT
<21Β> Listeria innocua
<400> 192
Met Val Glu Ile Asn Glu Lys Val Leu Arg Gly Ile Ile Ser Glu Val 15 10 15
Leu Asp Glu Leu Gln Leu Lys Glu Asp Lys Val Ser Phe Gln Lys Glu 20 25 30
Gln Pro Ser Val Ala Val Ser Asp Glu Ser Phe Leu Thr Glu Val Gly 35 40 45
Asp Ala Lys Pro Gly Arg Gln Lys Asp Glu Val Val Ile Ala Val Ala 50 55 60
Pro Ala Phe Gly Lys Tyr Gln Thr Lys Asn Ile Val Gly Val Pro His 65 70 75 80
Lys Gln Ile Leu Arg Glu Val Ile Ala Gly Ile Glu Glu Glu Gly Leu 85 90 95
Lys Ala Arg Val Val Arg Val Phe Arg Ser Ser Asp Val Ala Phe Val 100 105 110
Ala Val Glu Gly Asp Lys Leu Ser Gly Ser Gly Ile Cys Ile Gly Ile 115 120 125
Gln Ser Arg Gly Thr Ala Leu Ile His Gln Lys Asp Leu Gln Pro Leu 130 135 140
Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Ile Thr Leu Glu Thr 145 150 155 160
Tyr Arg Ala Ile Gly Lys Asn Ala Ala Lys Tyr Ala Lys Gly Glu Ser 165 170 175
Pro Asn Pro Val Pro Met Val Asn Asp Gln Met Ala Arg Pro Lys Phe 180 185 190
Gln Ala Lys Ala Ala Leu Leu His Ile Lys Glu Thr Lys His Val Val 195 200 205 Gln Cly Lys Asn Ala Val Glu Leu Gln Val Asn 210 215
<210> 193
<211> 170
<212> PRT
<21B> Listeria irwocua
<400> 193
Met Asn Gln Glu Ala Leu Glu Asn Met Val Arg Asn Ile Leu Gln Glu 15 10 15
Val Asn Ser Gly Ala Val Thr Thr Thr Thr Ser Gln Lys Ala Ser Gly 20 25 30
Asp Ser Leu Thr Val Arg Asp Tyr Pro Leu Gly Thr Lys Arg Pro Glu 35 40 45
Leu Val Lys Thr Ala Ser Ser Lys Ser Leu Asp Asp Ile Thr Leu Lys 50 5 5 60
Ser Val Leu Asp Gly Thr Ile Lys Pro Glu Asp Val Arg Val Thr Ala 65 70 75 80
Glu Thr Leu Lys Met Gln Ala Gln Val Ala Arg Asp Ala Gly Arg Ala 85 90 95
Thr Leu Ala Asn Asn Phe Glu Arg Ala Ala Glu Leu Thr Val Val Pro 100 105 110
Asp Glu Arg Ile Leu Glu Ile Tyr Asn Ala Met Arg Pro Tyr Arg Ser 115 120 125
Ser Arg Glu Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu Asn Val Tyr 130 135 140
Gln Ala Thr Ile Cys Ser Asn Tyr Val Arg Glu Ala Ala Gln Leu Tyr 145 150 155 160
Gln Glu Arg Lys Lys Leu Lys Gly Asp Asn 165 170
<210> 194
<211> 554
<212> PRT
<213> Listeria monocytogenes <400> 194
Met Lys Ser Lys Arg Phe Glu Glu Leu Ala Lys Arg Pro Val Asn Gln 15 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Leu Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Glu Asn Gly Lys Val 35 40 45
Val Glu Met Asp Ser Lys Lys Leu Ala Asp Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Lys Tyr Gly Val Asp Leu Ser Arg Ala Glu Glu Val Met 65 70 75 80
Gln Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Pro Arg Glu Lys Ile Val Leu Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 lio
Ile Val Glu Val Val Ser Gln Met Asn Val Val Glu Met Met Met Ser 115 120 125
Met Gln Lys Met Arg Ser Arg Arg Thr Pro Thr Thr Gln Ala His Val 130 135 140
Thr Asn Leu Arg Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Ala Ala Ile Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Val 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Leu Ser Leu Leu Val Gly Ser Gln Thr 180 185 190
Gly Arg Gly Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Glu Leu Gly Met Arg Gly Leu Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240 179
Ser Lys Gly Ile Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Thr Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Ile Ser Cys Ile Gly 290 295 300
Ile Pro Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320
Leu Ile Ala Val Met Leu Asp Leu Glu Val Ala Ser Gly Asn Asp Gln 325 330 335
Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Tyr Ile Ser Ser Gly Tyr Ser Ala Thr Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Asp Asp Phe 370 375 380
Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Thr Pro Val Thr Glu Glu Glu Val Val Ala Val Arg Asn Lys Ala Ala 405 410 415
Arg Val Ile Gln Ala Val Phe Asp Lys Leu Gly Leu Pro Glu Val Thr 420 425 430
Asp Ala Glu Val Glu Ala Ala Thr Tyr Ala Arg Gly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asn Met Val Glu Asp Ile Lys Ala Ala Ala Glu Met Met 450 455 460
Asp Arg Gly Val Thr Gly Leu Asp Val Val Lys Ala Leu Ser Ala Gly 465 470 475 480 Cly Phe Asp Asp Val Ala Clu Ser Val Leu Asn Met Leu Lys Cln Arg 485 490 495
Val Ser Cly Asp Phe Leu His Thr Ser Ala Ile Ile Asp Lys Asp Trp 500 505 510
Asn Val Ile Ser Ser Val Asn Asp Leu Asn Asp Tyr Ala Gly Pro Gly 515 520 525
Thr Gly Tyr Arg Leu Glu Cly Glu Arg Trp Clu Lys Leu Lys Asp Ile 530 535 540
Ala Val Ala Val Asp Ala Asn Glu Leu Asp 545 550
<210> 195 <211> 219 <212> PRT
<213> Listeria monocytogenes
<400> 195
Met Val Glu Ile Asn Glu Lys Val Leu Arg Gly Ile Ile Ser Glu Val 15 10 15
Leu Asp Glu Leu Gln Leu Lys Glu Asp Lys Val Ser Phe Gln Lys Glu 20 25 30
Cln Pro Ser Val Ala Val Ser Asp Glu Ser Phe Leu Thr Glu Val Gly 35 40 45
Asp Ala Glu Pro Gly Arg Gln Lys Asp Glu Val Val Ile Ala Val Ala 50 55 60
Pro Ala Phe Gly Lys Tyr Gln Thr Lys Asn Ile Val Gly Val Pro His 65 70 75 80
Lys Gln Ile Leu Arg Glu Leu Ile Ala Gly Ile Glu Glu Glu Cly Leu 85 90 95
Lys Ala Arg Val Val Arg Val Phe Arg Ser Ser Asp Val Ala Phe Val 100 105 110
Ala Val Glu Gly Asp Lys Leu Ser Cly Ser Gly Ile Cys Ile Gly Ile 115 120 125
Gln Ser Arg Gly Thr Ala Leu Ile His Gln Lys Asp Leu Gln Pro Leu 130 135 140 Ser Asn Leu Glu Leu Phe Pro Glri Ala Pro Leu Ile Thr Leu Glu Thr 145 150 155 160
Tyr Arg Ala ITe Gly Lys Asn Ala Ala Lys Tyr Ala Lys Gly Glu Ser 165 170 175
Pro Asn Pro Val Pro Met Val Asn Asp Gln Met Ala Arg Pro Lys Phe 180 185 190
Gln Ala Lys Ala Ala Leu Leu His Ile Lys Glu Thr Lys His Val Val 195 200 205
Gln Gly Lys Asn Ala Val Glu Leu Gln Val Asn 210 215
<210> 196 <211> 170 <212> PRT
<213> Listeria monocytogenes <400> 196
Met Asn Gln Glu Ala Leu Glu Asn Met Val Arg Asn Ile Leu Gln Glu 15 10 15
Val Asn Ser Gly Gly Val Ser Thr Thr Thr Ser Gln Lys Val Ser Gly 20 25 30
Asp Thr Leu Thr Val Arg Asp Tyr Pro Leu Gly Thr Lys Arg Pro Glu 35 40 45
Leu Val Lys Thr Ser Thr Ser Lys Ser Leu Asp Asp Ile Thr Leu Lys 50 5 5 60
Ser Val Leu Asp Gly Thr Ile Lys Pro Glu Asp Val Arg Val Thr Ala 65 70 75 80
Glu Thr Leu Lys Met Gln Ala Gln Val Ala Arg Asp Ala Gly Arg Ala 85 90 95
Thr Leu Ala Asn Asn Phe Glu Arg Ala Ala Glu Leu Thr Ile Val Pro 100 105 110
Asp Glu Arg Ile Leu Glu Ile Tyr Asn Ala Met Arg Pro Tyr Arg Ser
115 120 12 5
Ser Arg Glu Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu Ser Val Tyr
130 135 140 His Ala Thr Ile Cys Ser Asn Tyr Val Arg Clu Ala Ala Gln Leu Tyr 145 150 155 160
Gln Glu Arg Lys Lys Leu Lys Gly Asp Asn 165 170
<210> 197 <211> 554 <212> PRT
<213> SaTmoneTTa enterica subespécie enterica sorovar Typhi <400> 197
Met Arg Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Gln 15 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu 20 2 5 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Ala Val 35 40 45
Thr Glu Leu Asp Gly Lys Pro Val Ser Glu Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Asn Arg Ala Glu Glu Val Met 65 70 75 80
Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Lys Arg Ser Glu Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ala 115 120 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val 130 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Gly Ala Trp Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala 165 170 175 Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Cly Ser Gln Val 180 185 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Clu Clu Ala Thr Glu 195 200 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Clu Thr Ile Ser 210 215 220
Val Tyr Cly Thr Clu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Cly Leu Lys Met 245 250 255
Arg Phe Thr Ser Cly Ser Gly Ser Glu Val Gln Met Cly Tyr Ala Glu 260 265 270
Cly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Cly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320
Leu Ile Cys Ser Ser Leu Asp Leu Glu Cys Ser Ser Ser Asn Asp Gln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Cly Gly Leu 385 390 395 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala 405 410 415 Arg Ala Leu Cln ATa Val Phe Ala Cly Met Gly Leu Pro Pro Ile Thr 420 425 430
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Cly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile 450 455 460
Asn Lys Asn Arg Asn Gly Leu Glu Val Val Lys Ala Leu Ala Gln Gly 465 470 475 480
Gly Phe Thr Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys 485 490 495
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Cly Asp Cly 500 505 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala 515 520 525
Thr Gly Tyr Arg Leu Gln Gly Glu Arg Trp Clu Glu Ile Lys Asn Ile 530 535 540
Pro Cly Ala Leu Asp Pro Asn Clu Ile Asp 545 550
<210> 198 <211> 224 <212> PRT
<213> SalmoneTla enterica subespécie enterica sorovar Typhi <400> 198
Met Glu Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Asp Val Leu 15 10 15
Arg Asp Met Lys Gly Ser Asp Lys Pro Val Ser Phe Asn Thr Pro Ala 20 25 30
Ala Ser Thr Ala Pro Cln Thr Ala Ala Pro Ala Gly Asp Gly Phe Leu 35 40 45
Thr Glu Val Gly Glu Ala Arg Gln Gly Thr Gln Gln Asp Glu Val Ile 50 55 60 Ile Ala Val Gly Pro Ala Phe Gly Leu Ala Gln Thr Val Asn Ile Val 65 70 75 80
Gly Leu Pro His Lys Ser Ile Leu Arg Glu Val Ile Ala Gly Ile Glu 85 90 95
Glu Glu Gly Ile Arg Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp 100 105 110
Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Gly Ser Gly Ile 115 120 125
Ser Ile Gly Ile Gln Ser Lys Asp Thr Thr Val Ile His Gln Gln Gly 130 135 140
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu 145 150 155 160
Thr Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala 165 170 175
Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala 180 185 190
Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr 195 200 205
Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Thr Leu 210 215 220
<210> 199
<211> 173
<212> PRT
<213> SaTmoneTTa enterica subespécie enterica sorovar Typhi
<400> 199
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Arg 15 10 15
Met Asn Ser Leu Gln Gly Asp Ala Pro Ala Ala Ala Pro Ala Ala Gly 20 25 30
Gly Thr Ser Arg Ser Ala Lys Val Ser Asp Tyr Pro Leu Ala Asn Lys 35 40 45 His Pro Clu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe 50 55 60
Thr Leu Glu Asn Val Leu Ser Asn Lys Val Thr Ala Gln Asp Met Arg 65 70 75 80
Ile Thr Pro Lys Thr Leu Arg Leu Gln Ala Ser Ile Ala Lys Asp Ala 85 90 95
Gly Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu Thr 100 105 110
Ala Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro 115 120 125
Tyr Arg Ser Thr Lys Glu Glu Leu Leu Ala Ile Ala Asp Asp Leu Glu IBO 135 140
Asn Arg Tyr Gln Ala Lys Ile Cys Ala Ala Phe Val Arg Glu Ala Ala 145 150 155 160
Gly Leu Tyr Val Glu Arg Lys Lys Leu Lys Gly Asp Asp 165 170
<210> 200 <211> 554 <212> PRT
<213> Escherichia coli <400> 200
Met Arg Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Gln 15 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Val Val 35 40 45
Thr Glu Leu Asp Gly Lys Pro Ala Ser Gln Phe Asp Leu Ile Asp His 50 5 5 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Ala Arg Ala Glu Glu Val Ile 65 70 75 80 Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Lys Arg Ser Asp Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser Cln Met Asn Val Val Glu Met Met Met Ala 115 120 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val 130 135 140
Thr Asn Ile Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Gly Ala Trp Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val 180 185 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Cly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Gly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320 Leu Ile Cys Ser Ser Leu Asp Leu Clu Cys Ala Ser Ser Asn Asp Cln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Phe Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Phe Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Cly Gly Leu 385 390 395 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr 420 425 430
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Cly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile 450 455 460
Asn Lys Asn Arg Asn Ser Leu Glu Val Val Lys Ala Leu Ala Gln Cly 465 470 475 480
Gly Phe Thr Asp Val Ala Gln Asp Met Leu Asn Met Gln Lys Ala Lys 485 490 495
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Asp Asp Gly 500 505 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala 515 520 525
Thr Gly Tyr Arg Leu Cln Gly Glu Arg Trp Glu Clu Ile Lys Asn Ile 530 535 540
Pro Gly Ala Leu Asp Pro Asn Glu Ile Asp 545 550 <210> 201 <211> 222 <212> PRT
<21Β> Escherichia coli <400> 201
Met Glu Ile Asn Clu Lys Leu Leu Arg Gln Ile Ile Glu Asp Val Leu 15 10 15
Ala Glu Met Gln Thr Ser Asp Lys Ser Val Ser Phe Arg Ala Pro Val 20 25 30
Ser Ala Thr Val Ser Ser Val Pro Asp Thr Glu Asn Phe Leu Thr Glu 35 40 45
Ile Gly Glu Ala Gln Gln Gly Thr Gln Gln Asp Glu Val Ile Ile Ala 50 55 60
Val Gly Pro Ala Phe Gly Leu Ala Gln Thr Val Asn Ile Ile Gly Ile 65 70 75 80
Pro His Lys Asn Ile Leu Arg Glu Val Ile Ala Gly Ile Glu Glu Glu 85 90 95
Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp Val Ala 100 105 110
Phe Val Ala Val Glu Gly Asp Arg Leu Ser Gly Ser Gly Ile Ala Ile 115 120 12 5
Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly Leu Pro 130 135 140
Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu Thr Leu 145 150 155 160
Asp Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Lys Arg 165 170 175
Glu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala Arg Pro 180 185 190
Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr Lys Tyr 195 200 205 Val Val Thr Cly Lys Lys Pro Gln Glu Leu Arg Val Thr Phe 210 215 220
<210> 202
<211> 172
<212> PRT
<213> Escherichia coli
<400> 202
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Asn Arg 15 10 15
Met Asn Ser Leu Gln Asp Ala Ala Pro Val Ser Ala Val Pro Ser Ala 20 25 30
Ser Ile Gln Ser Ala Lys Val Thr Asp Tyr Pro Leu Ala Asn Lys His 35 40 45
Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe Thr 50 55 60
Leu Glu Asn Val Leu Ser Asp Asn Val Thr Ala Gln Asp Met Arg Ile 65 70 75 80
Thr Pro Glu Thr Leu Arg Ile Gln Ala Ala Ile Ala Arg Asp Ala Gly 85 90 95
Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu Thr Ser 100 105 110
Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro Tyr 115 120 125
Arg Ser Thr Lys Gln Glu Leu Ile Ala Ile Ala Asp Asp Leu Glu Arg 130 135 140
Arg Tyr Gln Ala Gln Ile Cys Ala Ala Phe Val Arg Glu Ala Ala Glu 145 150 155 160
Leu Tyr Val Clu Arg Lys Lys Leu Lys Cly Asp Asp 165 170
<210> 203
<211> 554
<212> PRT
<213> Listeria monocytogenes <400> 203
Met Lys Ser Lys Arg Phe Clu Glu Leu Ala Lys Arg Pro VaT Asn Gln 15 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Leu Ile Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Glu Asn Gly Lys Val 35 40 45
Val Glu Met Asp Ser Lys Lys Leu Ala Asp Phe Asp Leu Ile Asp His 50 55 60
Phe Ile Ala Lys Tyr Gly Val Asp Leu Ser Arg Ala Glu Glu Val Met 65 70 75 80
Gln Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val 85 90 95
Pro Arg Glu Lys Ile Val Leu Leu Thr Thr Ala Met Thr Pro Ala Lys 100 105 110
Ile Val Glu Val Val Ser Gln Met Asn Val Val Glu Met Met Met Ser 115 120 125
Met Gln Lys Met Arg Ser Arg Arg Thr Pro Thr Thr Gln Ala His Val 130 135 140
Thr Asn Leu Arg Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Ala Ala Ile Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Val 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Leu Ser Leu Leu Val Gly Ser Gln Thr 180 185 190
Gly Arg Gly Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Glu Leu Gly Met Arg Gly Leu Thr Cys Tyr Ala Glu Thr Ile Ser
210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp
225 230 235 240 Ser Lys Gly Ile Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Thr Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Ile Ser Cys Ile Gly 290 295 300
Ile Pro Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320
Leu Ile Ala Val Met Leu Asp Leu Glu Val Ala Ser Gly Asn Asp Gln 325 330 335
Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Tyr Ile Ser Ser Gly Tyr Ser Ala Thr Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Asp Asp Phe 370 375 380
Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Thr Pro Val Thr Glu Glu Glu Val Val Ala Val Arg Asn Lys Ala Ala 405 410 415
Arg Val Ile Gln Ala Val Phe Asp Lys Leu Gly Leu Pro Glu Val Thr 420 425 430
Asp Ala Glu Val Glu Ala Ala Thr Tyr Ala Arg Gly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asn Met Val Glu Asp Ile Lys Ala Ala Ala Glu Met Met 450 455 460
Asp Arg Gly Val Thr Gly Leu Asp Val Val Lys Ala Leu Ser Ala Gly 465 470 475 480 Gly Phe Asp Asp Val Ala Glu Ser Val Leu Asn Met Leu Lys Gln Arg 485 490 495
Val Ser Gly Asp Phe Leu His Thr Ser Ala Ile Ile Asp Lys Asp Trp 500 505 510
Asn Val Ile Ser Ser Val Asn Asp Leu Asn Asp Tyr Ala Gly Pro Gly 515 520 525
Thr Gly Tyr Arg Leu Glu Gly Glu Arg Trp Glu Lys Leu Lys Asp Ile 530 535 540
Ala Val Ala Val Asp Ala Asn Glu Leu Glu 545 550
<210> 204
<211> 219
<212> PRT
<213> Listeria monocytogenes
<400> 204
Met Val Glu Ile Asn Glu Lys Val Leu Arg Gly Ile Ile Ser Glu Val 15 10 15
Leu Asp Glu Leu Gln Leu Lys Glu Asp Lys Val Ser Phe Gln Lys Glu 20 25 30
Gln Pro Ser Val Ala Val Ser Asp Glu Ser Phe Leu Thr Glu Val Gly 35 40 45
Asp Ala Glu Pro Gly Arg Gln Lys Asp Glu Val Val Ile Ala Val Ala 50 55 60
Pro Ala Phe Gly Lys Tyr Gln Thr Lys Asn Ile Val Gly Val Pro His 65 70 75 80
Lys Gln Ile Leu Arg Glu Val Ile Ala Gly Ile Glu Glu Glu Gly Leu 85 90 95
Lys Ala Arg Val Val Arg Val Phe Arg Ser Ser Asp Val Ala Phe Val 100 105 110
Ala Val Glu Gly Asp Lys Leu Ser Gly Ser Gly Ile Cys Ile Gly Ile 115 120 125 Cln Ser Arg Gly Thr Ala Leu Ile His Cln Lys Asp Leu Gln Pro Leu 130 135 140
Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Ile Thr Leu Glu Thr 145 150 155 160
Tyr Arg Ala Ile Gly Lys Asn Ala Ala Lys Tyr Ala Lys Gly Glu Ser 165 170 175
Pro Asn Pro Val Pro Met Val Asn Asp Cln Met Ala Arg Pro Lys Phe 180 185 190
Cln Ala Lys Ala Ala Leu Leu His Ile Lys Clu Thr Lys His Val Val 195 200 205
Cln Gly Lys Asn Ala Val Glu Leu Gln Val Asn 210 215
<210> 205 <211> 170
<212> PRT
<213> Listeria monocytogenes
<400> 205
Met Asn Gln Glu Ala Leu Glu Asn Met Val Arg Asn Ile Leu Gln Glu 15 10 15
Val Asn Ser Gly Ala Val Ser Thr Thr Thr Ser Gln Lys Val Ser Cly 20 25 30
Asp Thr Leu Thr Val Arg Asp Tyr Pro Leu Gly Thr Lys Arg Pro Glu 35 40 45
Leu Val Lys Thr Ser Thr Ser Lys Ser Leu Asp Asp Ile Thr Leu Lys 50 55 60
Ser Val Leu Asp Gly Thr Ile Lys Pro Glu Asp Val Arg Val Thr Ala 65 70 75 80
Clu Thr Leu Lys Met Gln Ala Gln Val Ala Arg Asp Ala Gly Arg Ala 85 90 95
Thr Leu Ala Asn Asn Phe Glu Arg Ala Ala Glu Leu Thr Ile Val Pro 100 105 110 Asp Clu Arg Ile Leu Glu Ile Tyr Asn Ala Met Arg Pro Tyr Arg Ser 115 120 12 5
Ser Arg Clu Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu Ser Val Tyr 130 135 140
His Ala Thr Ile Cys Ser Asn Tyr Val Arg Glu Ala Ala Gln Leu Tyr 145 150 155 160
Gln Glu Arg Lys Lys Leu Lys Gly Asp Asn 165 170
<210> 206 <211> 553 <212> PRT
<213> Streptococcus sanguinis <400> 206
Met Arg Ser Lys Arg Phe Glu Val Leu Ser Glu Arg Pro Ile Asn Gln 15 10 15
Asp Gly Phe Val Lys Glu Trp Val Clu Glu Gly Leu Val Ala Met Glu 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Gln Asn Gly Lys Val 35 40 45
Val Glu Leu Asp Gly Lys Pro Lys Glu Glu Phe Asp Leu Ile Asp Gln 50 55 60
Phe Ile Ala Asn Tyr Gly Ile Asp Leu Ser Leu Ala Glu Glu Val Ile 65 70 75 80
Gln Met Asp Ser Arg Glu Ile Ala Asn Lys Ile Leu Thr Pro Ser Val 85 90 95
Pro Arg Thr Glu Ile Ile Lys Leu Thr Lys Ala Met Thr Pro Ala Lys 100 105 110
Ile Ile Glu Val Val Asn Gln Met Asn Val Val Glu Ile Met Met Cys 115 120 125
Leu Gln Lys Met Arg Thr Arg Lys Gln Thr Ala Thr Cln Ala His Val 130 135 140 Thr Asn Val Asn Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Gly Ala Leu Arg Gly Phe Ala Glu Gln Glu Thr Thr Val Ala Val Val 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Leu Ser Leu Met Ile Gly Ser Gln Val 180 185 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Glu Phe Gly Met Arg Gly Phe Thr Ala Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Asp Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Thr Gly Ser Glu Val Gln Met Gly Gln Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Leu Tyr Val Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Thr Gln Asn Gly Ser Val Ser Cys Ile Gly 290 295 300
Ile Pro Ala Ala Val Pro Ser Gly Ile Arg Ala Val Val Ala Glu Asn 305 310 315 320
Leu Ile Ala Ser Met Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln 325 330 335
Thr Phe Thr His Ser Asp Leu Arg Arg Ser Val Arg Thr Leu Met Gln 340 345 350
Phe Ala Pro Gly Thr Asp Phe Ile Asn Ser Gly Tyr Ser Ala Thr Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Trp Asp Ala Glu Asp Phe 370 375 380 Asp Asp Tyr Asn Val Leu Cln Arg Asp Leu Arg Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Arg Glu Glu Glu Val Val Lys Val Arg Asn Lys Ala Ala 405 410 415
Arg Val Met Gln Ala Leu Phe Lys Gly Leu Gly Leu Pro Gln Ile Thr 420 425 430
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asp Lys Val Glu Asp Ile Lys Ala Ala Gln Gly Ile Leu 450 455 460
Glu Arg Gly Val Gln Gly Ala Asp Leu Ile Lys Ala Leu Ala Asn Asn 465 470 475 480
Gly Phe Pro Glu Val Ala Asn Glu Leu Leu Asn Leu Phe Lys Gln Arg 485 490 495
Val Ala Gly Asp Phe Leu Gln Thr Ser Ala Ile Phe Asp Arg Asp Trp 500 505 510
Asn Val Ile Ser Ala Val Asn Ser Pro Asn Asp Tyr Val Gly Val Gly 515 520 525
Thr Gly His Arg Leu Val Gly Glu Glu Trp Glu Lys Val Lys Asp Ile 530 535 540
Pro Lys Ala Ile Asp Pro Arg Asp Val 545 550
<210> 207 <211> 222 <212> PRT
<213> Streptococcus sanguinis
<400> 207
Met Thr Glu Ile Asn Glu Thr Leu Leu Arg Ser Ile Ile Ala Glu Val 15 10 15
Met Lys Glu Met Ser Ala Asn Thr
20
Glu Lys Pro Val Thr Lys Pro Val
35 40
Lys Glu Thr Ala Ala Glu Thr Ser
25 30
Ser Asn Glu Lys Ala Val Ile Arg 45 Thr Val Gly Val Ala Lys Pro Ser Cln Ser Thr Asp Clu Val Val Ile 50 55 60
Ala Val Gly Pro Ala Phe Cly Glu Gln Gln Val Lys Thr Met Val Asp 65 70 75 80
Ile Pro His Thr Glu Val Leu Arg Gln Leu Val Ala Cly Ile Clu Glu 85 90 95
Glu Gly Leu Lys Ala Arg Ile Val Lys Val Tyr Arg Ser Ser Asp Val 100 105 110
Ala Phe Val Ala Val Clu Gly Asp His Leu Ser Gly Ser Gly Ile Ser 115 120 125
Ile Gly Val Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu IBO 135 140
Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu Thr 145 150 155 160
Pro Glu Thr Tyr Arg Leu Ile Gly Lys Asn Ala Ala Lys Tyr Ala Lys 165 170 175
Gly Glu Thr Pro Asn Pro Val Pro Thr Leu Asn Asp Gln Met Ala Arg 180 185 190
Pro Lys Tyr Gln Ala Tyr Ser Ala Leu Leu His Ile Lys Glu Thr Lys 195 200 205
Leu Val Lys Arg Gly Lys Pro Ala Asp Glu Cys Cln Val Ile 210 215 220
<210> 208 <211> 171 <212> PRT
<213> Streptococcus sanguinis
<400> 208
Met Ser Glu Ser Val Glu Thr Leu Val Lys Gln Ile Leu Ala Glu Leu 15 10 15
Ser Asp Ser Gly Ser Ala Ser Cln Gly Ala Val Asn Arg Pro Val Ser 20 25 30 Ser Asp Clu ATa Thr Ala Ala Asp Tyr Pro Ile Ser Lys Lys His Pro 35 40 45
Asp Trp Ile Lys Val Cly Cln Asp Lys Lys Phe Glu Asp Ile Thr Leu 50 55 60
Clu Asn Ile Leu Ser Cly Tyr Val Lys Ala Glu Asp Leu Arg Ile Lys 65 70 75 80
Pro Glu Ile Leu Ile Lys Gln Gly Glu Ile Ala Lys Asn Ala Gly Arg 85 90 95
Glu Ala Ile Gln Tyr Asn Phe Ser Arg Ala Ala Glu Leu Thr Lys Val 100 105 110
Pro Asp Ala Arg Val Leu Glu Ile Tyr Asn Ala Leu Arg Pro Tyr Arg 115 120 125
Ser Ser Lys Gln Glu Leu Leu Asp Ile Ala Asn Glu Leu Glu Asn Gln 130 135 140
Tyr Gly Ala Val Ile Cys Ala Gly Phe Val Arg Glu Ala Ala Glu Asn 145 150 155 160
Tyr Glu Arg Arg Lys Lys Leu Lys Gly Asp Asn 165 170
<210> 209 <211> 555 <212> PRT
<213> Escherichia blattae <400> 209
Met Arg Arg Ser Lys Arg Phe Glu Val Leu Glu Lys Arg Pro Val Asn 15 10 15
Gln Asp Gly Leu Ile Gly Glu Trp Pro Glu Glu Gly Leu Ile Ala Met 20 25 30
Gly Ser Pro Trp Asp Pro Pro Ser Ser Val Lys Val Glu Gln Cly Arg 35 40 45
Ile Val Glu Leu Asp Gly Lys Ala Arg Ala Asp Phe Asp Met Ile Asp
50 55 60
Arg Phe Ile Ala Asp Tyr Ala Ile Asn Ile Asp Glu Thr Glu His Ala 65 70 75 80 Met Cly Leu Asp Ala Leu Thr Ile Ala Arg Met Leu Val Asp Ile Asn 85 90 95
Val Ser Arg Ala Glu Ile Ile Lys Val Thr Thr Ala Ile Thr Pro Ala 100 105 110
Lys Ala Val Clu Val Met Ser His Met Asn Val Val Glu Met Met Met 115 120 125
Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Cln Cys His 130 135 140
Val Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala 145 150 155 160
Clu Ala Cly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile 165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Ile Gly Ser Gln 180 185 190
Ser Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Clu Ala Thr 195 200 205
Clu Leu Glu Leu Gly Met Arg Gly Phe Thr Ser Tyr Ala Glu Thr Val 210 215 220
Ser Val Tyr Gly Thr Glu Ala Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys 245 250 255
Met Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ala 260 265 270
Glu Ser Lys Ser Met Leu Tyr Leu Clu Ser Arg Cys Ile Phe Ile Thr 275 280 285
Lys Gly Ala Gly Val Gln Gly Leu Gln Asn Gly Ala Gly Ser Cys Ile 290 295 300
Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Pro Gly Leu Ala Glu 305 310 315 320 Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp 325 330 335
Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met 340 345 350
Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val 355 360 365
Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp 370 375 380
Phe Asp Gly Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly 385 390 395 400
Leu Arg Pro Val Ser Glu Glu Glu Thr Ile Ala Ile Arg Asn Lys Ala 405 410 415
Ala Arg Ala Val Gln Ala Val Phe Arg Gly Leu Gly Leu Pro Pro Val 420 425 430
Thr Asp Glu Glu Val Thr Ala Ala Thr Tyr Ala His Gly Ser Lys Asp 435 440 445
Met Pro Pro Arg Asn Val Val Glu Asp Leu Ser Ala Val Glu Glu Met 450 455 460
Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Arg Ala Leu Ser Val 465 470 475 480
Asn Gly Phe Asp Asp Val Ala Asn Asn Ile Leu Asn Met Leu Arg Gln 485 490 495
Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Glu 500 505 510
Phe Glu Val Val Ser Ala Val Asn Asp Ile Asn Asp Tyr Gln Gly Pro 515 520 525
Gly Thr Gly Tyr Arg Ile Ser Pro Gln Arg Trp Glu Glu Ile Lys Asn 530 535 540
Ile Ala Thr Val Ile Gln Pro Asp Ser Ile Glu 545 550 555 <210> 210
<211> 196
<212> PRT
<21Β> Escherichia blattae
<400> 210
Met Glu Thr Thr Gln Lys Lys Ala Pro Val Phe Thr Leu Asn Leu Val 15 10 15
Glu Ser Gly Val Ala Lys Pro Gly Glu Arg Ser Asp Glu Val Val Ile 20 25 BO
Gly Val Gly Pro Ala Phe Asp Lys Tyr Gln His Lys Thr Leu Ile Asp 35 40 45
Met Pro His Lys Ala Ile Ile Lys Glu Met Val Ala Gly Val Glu Glu 50 55 60
Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val 65 70 75 80
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly 85 90 95
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu 100 105 110
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr 115 120 125
Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg 130 135 140
Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg 145 150 155 160
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys 165 170 175
His Val Val Gly Asp Ala Lys Pro Val Thr Leu Asn Ile Glu Ile Thr 180 185 190
Arg Glu Glu Ala 195
<210> 211 <211> 140 <212> PRT
<213> Escherichia blattae <400> 211
Met Thr Thr Thr Lys Met Ser Ala Ala Asp Tyr Pro Leu Ala Ser Arg 15 10 15
Cys Pro Glu Arg Ile Cln Thr Pro Thr Cly Lys Pro Leu Thr Asp Ile 20 25 30
Thr Leu Clu Asn Val Leu Ala Gly Lys Val Gly Thr Gln Asp Clu Arg 35 40 45
Ile Ser Arg Glu Thr Leu Glu Tyr Gln Ala Cln Ile Ala Glu Gln Met 50 55 60
His Arg His Ala Ile Ala Arg Asn Leu Arg Arg Ala Gly Glu Leu Ile 65 70 75 80
Ala Ile Pro Asp Ala Arg Ile Leu Clu Ile Tyr Asn Ala Leu Arg Pro 85 90 95
Tyr Arg Ser Ser Val Glu Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu 100 105 110
Thr Arg Tyr Gln Ala Thr Val Asn Ala Ala Phe Ile Arg Clu Ala Ala 115 120 125
Glu Val Tyr Arg Gln Arg Asp Lys Leu Arg Lys Glu 130 135 140
<210> 212 <211> 554 <212> PRT
<213> CTostridium perfringens
<400> 212
Met Lys Ser Lys Arg Phe Cln Val Leu Ser Clu Arg Pro Val Asn Gln 15 10 15
Asp Cly Leu Ile Gly Glu Trp Ala Asp Glu Gly Leu Ile Ala Leu Asp 20 25 30
Ser Pro Asn Asp Pro Lys Ser Ser Ile Lys Ile Glu Asn Gly Ile Ile 35 40 45 Thr Glu Leu Asp Gly Arg Ser Arg Asp GTu Phe Asp Met Ile Asp Lys 50 55 60
Phe Ile Ala Glu Tyr Ala Ile Asn Ile Glu Asp Ala Glu Ala Ser Met 65 70 75 80
Lys Leu Ser Ser Lys Glu Ile Ala Arg Arg Leu Val Asp Ile Asn Val 85 90 95
Ser Arg Asp Glu Ile Val Lys Ile Thr Thr Ser Ile Thr Pro Met Lys 100 105 110
Ala Val Glu Val Ile Gln Glu Met Asn Val Val Glu Met Met Met Ala 115 120 125
Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ala Asn Gln Cys His Val IBO 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Ala Ala Leu Arg Gly Phe Ala Glu Gln Glu Thr Thr Val Gly Ile Val 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Leu Ala Ile Leu Val Gly Ser Gln Val 180 185 190
Gly Arg Gly Gly Val Leu Thr Gln Cys Ala Val Glu Glu Ala Thr Glu 195 200 205
Leu Asp Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val Ser 210 215 220
Val Tyr Gly Thr Glu Ser Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Ala Leu Met Gly Tyr Ser Glu 260 265 270
Gly Arg Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Tyr Ile Thr Lys 275 280 285 Cly Ala Gly Val Cln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile Gly 290 295 300
Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Gly Glu Asn 305 310 315 320
Leu Ile Ala Ala Met Leu Asp Ile Glu Val Ala Ser Ala Asn Asp Gln 325 330 335
Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Met Leu Met Gln 340 345 350
Met Leu Pro Cly Thr Asp Phe Ile Phe Ser Cly Tyr Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Ile Leu Cln Arg Asp Leu Lys Val Asp Cly Gly Leu 385 390 395 400
Arg Pro Val Thr Glu Clu Glu Thr Ile Lys Val Arg Asn Lys Ala Ala 405 410 415
Lys Cys Ile Gln Ile Ile Phe Arg Glu Leu Cly Phe Pro Clu Val Thr 420 425 430
Asp Glu Glu Val Clu Ala Ala Thr Tyr Cys His Gly Ser Lys Glu Met 435 440 445
Pro Asn Arg Asn Val Val Glu Asp Leu Lys Ala Ala Glu Glu Met Leu 450 455 460
Glu Arg Arg Ile Thr Gly Leu Asp Ile Ile Lys Ala Leu Ser Lys Asn 465 470 475 480
Gly Met Glu Asp Ile Ala Asn Asn Leu Leu Asn Met Leu Lys Gln Arg 485 490 495
Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Lys Asp Phe 500 505 510
Asn Val Ile Ser Ala Val Asn Asp Val Asn Asp Tyr Met Gly Pro Gly 515 520 525 Thr Cly Tyr Arg Leu Asp Cly Gln Arg Trp Glu Glu Ile Lys Lys Val 530 535 540
Pro Thr Val Met Arg Pro Glu Asp Ile Glu 545 550
<210> 213 <211> 190 <212> PRT
<213> CTostridium perfringens
<400> 213
Met Thr Met Glu Glu Arg Thr Phe Ile Pro Glu Ile Thr Val Glu Glu 15 10 15
Val Gly Glu Ala Lys Val Gly Leu Arg Ser Asp Glu Val Val Ile Gly 20 25 30
Leu Ala Pro Ala Phe Leu Lys Tyr Gln Asn Lys Thr Ile Val Asp Val 35 40 45
Pro His Thr Glu Thr Leu Leu Glu Ile Ile Ala Gly Ile Clu Glu Glu 50 55 60
Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val Ser 65 70 75 80
Phe Ile Ala His Asp Ala Ala Cys Leu Ser Gly Ser Gly Ile Gly Ile 85 90 95
Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Lys Asp Leu Leu 100 105 110
Pro Leu Asn Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr Thr 115 120 125
Clu Thr Tyr Arg Leu Ile Gly Lys Asn Ala Ala Lys Tyr Ala Lys Gly 130 135 140
Glu Ser Pro Thr Pro Val Pro Val Lys Asn Asp Gln Met Val Arg Pro 145 150 155 160
Lys Phe Met Ala Lys Ala Ala Leu Leu His Ile Lys Glu Thr Lys His 165 170 175 Val Glu Pro Gly Lys Lys Pro Val Gln Leu Glu Val Lys Phe 180 185 190
<210> 214 <211> 141 <212> PRT
<213> Clostridium perfringens <400> 214
Met Glu Asn Lys Arg Met Thr Ala Ala Asp Tyr Pro Leu Thr Ser Lys 15 10 15
Arg Lys Gly Asp Ile Lys Thr Pro Thr Gly Lys Ala Leu Glu Asp Ile 20 25 30
Thr
Leu Glu 35
Lys Val Leu Ser
Gly Glu Ile Asn Ala Asp Asp Ile Arg 40 45
Ile Ser Pro Glu Thr Leu Glu Met Gln Ala Gln Ile Ala Glu Ser Met 50 55 60
Asn Arg Asp Ala Ile Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile 65 70 75 80
Arg Val Pro Asp Asp Arg Ile Leu Glu Met Tyr Asn Ala Leu Arg Pro 85 90 95
Tyr Arg Ser Thr Lys Glu Asp Leu Phe Lys Ile Ala Asp Glu Leu Glu 100 105 110
Thr Lys Tyr Asp Ala Lys Val Asn Ala Asp Phe Val Arg Glu Ala Ala 115 120 125
Glu Val Tyr Glu Thr Arg Asn Lys Leu Arg Ile Glu Glu 130 135 140
<210> 215
<211> 408
<212> PRT
<213> Yersinia frederiksenii
<400> 215
Met Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu Gly Ala
15 10 15
Phe Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala Arg Tyr 20 25 30 Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val Gly Arg 35 40 45
Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu Leu Lys 50 55 60
Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser Val Tyr 65 70 75 80
Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp Ser Lys 85 90 95
Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met Arg Phe 100 105 110
Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu Gly Lys 115 120 125
Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys Ala Ala 130 135 140
Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Val Gly Val Pro 145 150 155 160
Ser Ala Val Pro Ser Gly Ile Arg Ala Ile Leu Ala Glu Asn Leu Ile 165 170 175
Cys Ser Ala Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln Thr Phe 180 185 190
Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln Phe Leu 195 200 205
Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro Asn Tyr 210 215 220
Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe Asp Asp 225 230 235 240
Tyr Asn Val Met Gln Arg Asp Leu Lys Val Asp Gly Gly Leu Arg Pro 245 250 255
Val Leu Glu Ala Asp Val Val Ala Ile Arg Asn Lys Ala Ala Arg Ala 260 265 270 Leu Cln Ala Val Phe Ala GTy Met Gly Leu Pro Pro Ile Thr Asp Glu 275 280 285
Glu Val Ile Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met Pro Glu 290 295 300
Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile Ser Lys 305 310 315 320
Asn Arg Thr Gly Leu Glu Val Val Lys Ala Leu Ala Gln Gly Gly Phe 325 330 335
Glu Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys Ile Ala 340 345 350
Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Lys Gly Asp Asn Gln Val 355 360 365
Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala Thr Gly 370 375 380
Tyr Arg Leu Glu Gly Ala Arg Trp Glu Glu Ile Lys Asn Ile Pro Asn 385 390 395 400
Ala Leu Asp Pro Asn Glu Leu Gly 405
<210> 216 <211> 224 <212> PRT
<213> Yersinia frederiksenii
<400> 216
Met Val Asp Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Gly Val 15 10 15
Leu Gln Glu Met Gln Gly Asp Gln Asn Thr Val Ser Phe Lys Gln Glu 20 25 30
Thr Gln Pro Ala Ala Ala Val Asn Thr Thr Ala Ser Gly Asp Phe Leu 35 40 45
Thr Glu Val Gly Glu Ala Arg Pro Gly Thr His Gln Asp Glu Val Ile
50 55 60
Ile Ala Val Gly Pro Ala Phe Gly Leu Ser Gln Thr Thr Asn Ile Val 65 70 75 80 Gly Ile Pro His Lys Asn Ile Leu Arg Glu Leu Ile Ala Gly Ile Glu 85 90 95
Glu Glu Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp 100 105 110
Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Gly Ser Gly Ile 115 120 125
Ser Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly 130 135 140
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu 145 150 155 160
Thr Leu Glu Thr Tyr Arg Leu Ile Gly Lys Asn Ala Ala Arg Tyr Ala IS5 170 175
Lys Arg Glu Ser Pro Gln P-o Val Pro Thr Leu Asn Asp Gln Met Ala 180 185 190
Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr 195 200 205
Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu 210 215 220
<210> 217 <211> 175 <212> PRT
<213> Yersinia frederiksenii
<400> 217
Met Asn Ser Glu Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Lys 15 10 15
Met Asn Ser Leu Gln Gly Gln Ser Pro Ala Ala Ala Cys Pro Ala Pro 20 25 30
Ala Ala Ser Ser Arg Ser Asp Ala Lys Val Ser Asp Tyr Pro Leu Ala 35 40 45
Asn Lys His Pro Asp Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp 50 5 5 60 Asp Leu Thr Leu Ala Asn Val Leu Asn Cly Ser Val Thr Ser Cln Asp 65 70 75 80
Leu Arg Ile Thr Pro Glu Ile Leu Arg Ile Cln Ala Ser Ile Ala Lys 85 90 95
Asp Ala Gly Arg Pro Leu Leu Ala Met Asn Phe Clu Arg Ala Ala Clu 100 105 110
Leu Thr Ala Val Pro Asp Asp Lys Val Leu Asp Ile Tyr Asn Ala Leu 115 120 125
Arg Pro Phe Arg Ser Ser Lys Asp Glu Leu Asn Ala Ile Ala Asp Asp 130 135 140
Leu Glu Lys Thr Tyr Lys Ala Thr Ile Cys Ala Ala Phe Val Arg Glu 145 150 155 160
Ala Ala Val Leu Tyr Val Gln Arg Lys Lys Leu Lys Gly Asp Asp 165 170 175
<210> 218 <211> 554 <212> PRT
<213> Thermoanaerobacter ethanolicus <400> 218
Met Arg Ser Lys Arg Phe Glu Val Leu Ala Lys Arg Pro Val Asn Gln 15 10 15
Asp Gly Ile Ile Ala Glu Trp Pro Glu Val Cly Leu Ile Ala Val Asn 20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Glu Asn Gly Lys Ile 35 40 45
Val Glu Met Asp Gly Lys Lys Arg Glu Clu Phe Asp Met Ile Glu Gln 50 55 60
Phe Ile Ala Asp Tyr Ala Ile Asn Ile Glu Met Ala Glu Lys Ala Met 65 70 75 80
Gly Met Asp Ser Leu Glu Ile Ala Arg Met Leu Val Asp Ile Asn Val 85 90 95
Pro Arg Glu Glu Ile Val Lys Ile Val Ser Gly Leu Thr Pro Ala Lys 100 105 110 Val Val Glu Val Val Asn His Leu Asn Val Val Glu Ile Met Met Ala 115 120 125
Ile Gln Lys Met Arg Ala Arg Lys Arg Pro Gly Asn Gln Ala His Val 130 135 140
Thr Asn Leu Arg Asp Asn Pro Val Leu Ile Ala Ala Asp Ala Ala Glu 145 150 155 160
Ala Ala Leu Arg Gly Phe Asp Glu Leu Glu Thr Thr Val Gly Ile Thr 165 170 175
Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ser Gln Thr 180 185 190
Gly Arg Gly Gly Val Leu Thr Gln Asp Ala Leu Glu Glu Ser Phe Glu 195 200 205
Leu Thr Ile Gly Met Arg Gly Phe Thr Ser Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Gln Val Phe Val Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Thr Gly Ser Glu Cys Gln Met Gly Phe Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Val Met Ile Ala Lys 275 280 285
Gly Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Ile Ser Cys Ile Gly 290 295 300
Val Pro Gly Ala Val Pro Gly Gly Ile Arg Ala Val Ala Ala Glu Asn 305 310 315 320
Leu Ile Thr Met Met Glu Asp Leu Glu Val Ala Ser Gly Asn Asp Gln 325 330 335
Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Leu Leu 340 345 350 Met Leu Pro Gly Thr Asp Leu Ile Phe Ser Cly Tyr Ser Ala Val Pro B 5 5 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Leu Met Leu Gln Arg Asp Leu Met Val Glu Gly Gly Val 385 390 395 400
Ser Pro Val Thr Glu Asp Glu Val Ile Ala Val Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ser Val Phe Lys Lys Leu Asn Leu Pro Pro Ile Thr 420 425 430
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met 435 440 445
Pro Pro Arg Asp Val Asn Ala Asp Leu Lys Ala Ala Thr Glu Leu Met 450 455 460
Glu Lys Gly Leu Thr Gly Leu Asp Val Val Lys Ala Leu Ala Glu Ser 465 470 475 480
Gly Phe Thr Asp Val Ala Glu Asn Val Leu Asn Met Leu Lys Gln Arg 485 490 495
Ile Ala Gly Asp Tyr Leu Gln Thr Ser Ala Val Leu Asp Lys Asp Phe 500 505 510
Asn Ile Asp Ser Ala Val Asn Asn Ser Asn Asp Tyr Lys Gly Pro Gly 515 520 525
Thr Gly Phe Arg Leu Ser Lys Glu Arg Trp Glu Arg Ile Lys Asn Val 530 535 540
Pro Gln Ala Leu Lys Pro Glu Asp Leu Ala 545 550
<210> 219
<211> 229
<212> PRT
<213> Themoanaerobacter ethanolicus
<400> 219
Met Val Lys Thr Glu Ser Leu Val Glu Gln Ile Val Lys Glu Val Leu 15 10 15 Lys Lys Leu Glu Asn Val Glu Ile Ala Ala Pro Ala Thr Gln Ser Ser 20 25 30
Asp Asp Ala Asn Gln Glu Trp Glu Met Ile Ile Glu Glu Ile Gly Glu 35 40 45
Ala Lys Gln Gly Val Asn Val Asp Glu Val Val Ile Gly Val Ser Pro 50 5 5 60
Gly Phe Tyr Ile Lys Phe Lys Lys Asn Ile Ile Gly Ile Pro Leu Gly 65 70 75 80
Asn Ile Leu Arg Glu Ile Ile Ser Gly Ile Thr Glu Gln Gly Leu Lys 85 90 95
Ala Arg Ile Val Arg Val Lys His Thr Ala Asp Val Gly Phe Ile Ala 100 105 110
His Thr Ala Ala Lys Leu Ser Gly Ser Gly Ile Gly Ile Gly Ile Gln 115 120 125
Ser Arg Gly Thr Val Val Ile His Gln Lys Asp Leu Gln Pro Leu Asn 130 135 140
Asn Leu Glu Leu Phe Pro Gln Cys Pro Val Leu Thr Leu Glu Thr Tyr 145 150 155 160
Arg Ala Ile Gly Arg Asn Ala Ala Leu Tyr Ala Lys Gly Glu Ser Pro 165 170 175
Thr Pro Val Pro Val Gln Asn Asp Gln Met Ala Arg Pro Lys Tyr Gln 180 185 190
Ala Ile Ala Ala Val Met His Asn Phe Glu Thr Lys Tyr Val Gln Thr 195 200 205
Gly Ala Lys Pro Val Glu Leu Lys Val Ser Phe Ala Arg Lys Gly Gly 210 215 220
Asn Lys Ser Asp Arg 225
<210> 220
<211> 182
<212> PRT
<213> Thermoanaerobacter ethanolicus <400> 220
Met Leu Glu Lys Cly Gly Ile Arg Val Ile Asp Glu Lys Thr Leu Glu 15 10 15
Ile Ile Val Arg Glu Val Leu Thr Asn Leu Thr Ser Asp Lys Gly Thr 20 25 30
Gln Asn Gln Gln Lys Thr Ala Ser Ser Ser Leu Pro Lys Leu Asp Pro 35 40 45
Lys Arg Asp Tyr Pro Leu Ala Lys Asn Lys Pro Glu Leu Ala Lys Ser 50 55 60
Ile Thr Gly Lys Thr Ile Asn Glu Ile Thr Leu Gln Ala Val Arg Glu 65 70 75 80
Gly Lys Val Leu Pro Asp Asp Leu Lys Ile Ser Pro Glu Thr Leu Leu 85 90 95
Ala Gln Ala Glu Ile Ala Glu Ala Ala Gly Arg Lys Gln Leu Ala Asn 100 105 110
Asn Phe Arg Arg Ala Ala Glu Leu Thr Lys Val Pro Asp Lys Arg Ile 115 120 125
Leu Glu Ile Tyr Asn Ala Leu Arg Pro Tyr Arg Ser Thr Lys Glu Glu 130 135 140
Leu Leu Ala Ile Ala Asp Glu Leu Asp Asn Ala Tyr Gly Ala Lys Val 145 150 155 160
Cys Ala Ala Phe Val Arg Glu Ala Ala Glu Val Tyr Glu Arg Arg Gly 165 170 175
Arg Leu Lys Gly Met Glu 180
<210> 221
<211> 558
<212> PRT
<213> Lactobaci7 Tus
<400> 221
hilgardii
Met Lys Arg Gln Lys Arg Phe Glu Lys Leu Glu Lys Arg Pro Val His 15 10 15 Lgu Asp Cly Phe Val Lys Glu Trp Asp Asp Glu Gly Leu Val Ala Met 20 2 5 30
Glu Gly Lys Asn Asp Pro Lys Pro Ser Ile Lys Ile Glu Asn Gly Val 35 40 45
Val Thr Glu Leu Asp Gly Lys Lys Lys Asp Asp Phe Asp Leu Ile Asp 50 55 60
Gln Tyr Ile Ala Glu Tyr Gly Ile Asn Leu Asn Asn Ala Glu Lys Val 65 70 75 80
Met Lys Met Asp Ser Leu Lys Ile Ala Lys Met Leu Val Asp Pro Asn 85 90 95
Asp Ser Arg Ser Glu Ile Ile Gln Leu Thr Thr Ala Met Thr Pro Ala 100 105 110
Lys Ala Glu Glu Val Ile Ser Lys Leu Asn Phe Ala Glu Met Ile Met 115 120 125
Ala Ala Gln Lys Met Arg Pro Arg Arg Thr Pro Ala Thr Gln Cys His 130 135 140
Ile Thr Asn Thr Leu Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala 145 150 155 160
Glu Ala Ala Leu Arg Gly Phe Pro Glu Gln Glu Thr Thr Thr Ala Val 165 170 175
Ala Arg Tyr Ala Pro Met Asn Ala Ile Ser Ile Met Val Gly Ser Gln 180 185 190
Thr Gly Arg Pro Gly Val Ile Thr Gln Cys Ser Val Glu Glu Ser Glu 195 200 205
Glu Leu Ser Leu Gly Met Arg Gly Phe Thr Ala Tyr Ala Glu Thr Ile 210 215 220
Ser Val Tyr Gly Thr Asp Arg Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Gly Phe Leu Ala Ser Cys Tyr Ala Ser Arg Gly Leu Lys 245 250 255 Met Arg Phe Thr Ser Cly Ala Gly Ser Glu Ala Met Met Gly Tyr Thr 260 265 270
Glu Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Phe Ile Thr 275 280 285
Lys Ala Ser Cly Val Gln Gly Leu Gln Asn Gly Gly Val Ser Cys Ile 290 295 BOO
Gly Ile Pro Gly Ala Val Pro Gly Gly Ile Arg Glu Val Leu Gly Glu 305 BlO 315 320
Asn Leu Leu Cys Met Met Leu Asp Ile Clu Cys Ala Ser Gly Asn Asp 325 330 335
Gln Ala Phe Ser His Ser Asp Ile Arg Arg Thr Glu Arg Met Ile Gly 340 345 350
Gln Phe Ile Ala Gly Thr Asp Tyr Ile Ser Ser Gly Tyr Ala Ala Glu 355 360 365
Glu Asn Arg Asp Asn Thr Phe Ala Gly Ser Asn Met Asp Val Leu Asp 370 375 380
Tyr Asp Asp Tyr Cys Ser Met Glu Arg Asp Leu Ala Val Asn Gly Ser 385 390 395 400
Ile Leu Pro Ile His Glu Glu Asp Ala Ile Lys Ile Arg Asn Arg Ala 405 410 415
Ala Lys Ala Ile Gln Ala Val Phe Asp Gly Leu Gly Leu Pro Pro Ile 420 425 430
Ser Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala Ser Asn Ser Gly Asp 435 440 445
Met Pro Lys Arg Asp Met Val Gln Asp Ile Lys Ala Ala Gln Asp Leu 450 455 460
Met Asn Arg Asp Ile Thr Ile Ser Asp Ile Ile Lys Ala Leu Tyr Asn 465 470 475 480
His Gly Phe Lys Asp Val Ala Gln Ala Val Leu Thr Leu Ala Gln Gln 485 490 495 Lys Val Cys Gly Asp Tyr Leu Gln Thr Ser Ala Ile Phe Asn Gly Lys 500 505 510
Trp His Cys Val Ser Ala Ile Asn Asp Ala Asn Asp Tyr Glu Gly Pro 515 520 525
Gly Thr Gly Tyr Arg Val Trp Glu Asp Lys Glu Gln Trp Lys Lys Leu 530 535 540
Lys Asp Ile Pro Trp Ala Val Asp Pro Gln His Met Asn Phe 545 550 555
<210> 222 <211> 217 <212> PRT
<213> Lactobaci77us hiTgardii <400> 222
Met Asn Asp Thr Asp Gln Ala Ile Ser Phe Lys Ala Asp Ser Thr Thr 15 10 15
Ala Thr Asp Thr Ala Thr Ala Ala Lys Pro Ser Thr Ser Gln Glu Ser 20 25 30
Asp Ile Lys Pro Val Asp Trp Phe Lys His Val Gly Val Ala Lys Pro 35 40 45
Gly Phe Ser Lys Asp Glu Val Val Ile Ala Val Ala Pro Ala Phe Ala 50 5 5 60
Glu Val Leu Thr Lys Thr Met Thr Lys Ile Ser His Arg Asp Val Leu 65 70 75 80
Arg Gln Val Ile Ala Gly Ile Glu Glu Glu Gly Ile Lys Ala Arg Val 85 90 95
Ile Lys Val Tyr Arg Thr Ser Asp Val Ser Phe Cys Ser Val Glu Ala 100 105 110
Asp Lys Leu Ser Gly Ser Gly Ile Ala Ile Ala Ile Gln Ser Lys Gly 115 120 125
Thr Thr Ile Ile His Gln Arg Asp Gln Glu Pro Leu Asn Asn Leu Glu
130 135 140
Leu Phe Pro Gln Ala Pro Val Leu Thr Leu Asp Thr Tyr Arg Ala Ile
145 150 155 160 Gly Lys Asn Ala Ala Gln Tyr Ala Arg Gly Met Ser Pro Asn Pro Val 165 170 175
Pro Thr Val Asn Asp Gln Met Ala Arg Val Gln Tyr Gln Ala Leu Ser 180 185 190
Thr Leu Met His Ile Gln Glu Thr Lys Gln Val Val Met Gly Lys Pro 195 200 205
Ala Asp Glu Ile Gln Val Ser Val Glu 210 215
<210> 223 <211> 176 <212> PRT
<213> Lactobacillus hilgardii
<400> 223
Met Ser Glu Val Asp Glu Leu Val Ser Lys Ile Met Asn Glu Leu Lys 15 10 15
Asp Gly Gln Ser Ser Ser Thr Pro Asn Ser Thr Pro Glu Ser Ala Pro 20 25 30
Ser Gln Val Pro Thr Gly Lys Lys Leu Gly Lys Ser Asp Tyr Pro Leu 35 40 45
Tyr Glu Lys His Pro Lys Asp Val Lys Ser Pro Thr Gly Lys Ser Leu 50 55 60
Asn Glu Ile Thr Leu Glu Asn Ile Ile Asn Gly Asn Val Thr Ser Lys 65 70 75 80
Asp Leu Arg Ile Thr Pro Asp Thr Leu Arg Met Gln Gly Gln Ile Ala 85 90 95
Ala Ser Ala Gly Arg Val Ala Ile Gln Arg Asn Phe Gln Arg Ala Ala 100 105 lio
Gly Leu Thr Ala Ile Pro Asp Asp Arg Val Leu Ala Leu Tyr Asn Ser 115 120 125
Leu Arg Ala Tyr Arg Ser Phe Lys Gln Glu Leu Leu Asp Thr Ala Asn
130 135 140
Glu Leu Arg Thr Lys Tyr His Ala Pro Val Cys Ala Gly Trp Phe Glu 145 150 155 160 Glu Ala Ala Glu Asn Tyr Glu Lys Asp Arg Lys Leu Lys Gly Asp Asn 165 170 175
<210> 224 <211> 558 <212> PRT
<213> LactobaciTlus reuteri <400> 224
Met Lys Arg Gln Lys Arg Phe Glu Glu Leu Glu Lys Arg Pro Ile His 15 10 15
Gln Asp Thr Phe Val Lys Glu Trp Pro Glu Glu Gly Phe Val Ala Met 20 25 BO
Met Gly Pro Asn Asp Pro Lys Pro Ser Val Lys Val Glu Asn Gly Lys 35 40 45
Ile Val Glu Met Asp Gly Lys Lys Leu Glu Asp Phe Asp Leu Ile Asp 50 55 60
Leu Tyr Ile Ala Lys Tyr Gly Ile Asn Ile Asp Asn Val Glu Lys Val 65 70 75 80
Met Asn Met Asp Ser Thr Lys Ile Ala Arg Met Leu Val Asp Pro Asn 85 90 95
Val Ser Arg Asp Glu Ile Ile Glu Ile Thr Ser Ala Leu Thr Pro Ala 100 105 110
Lys Ala Glu Glu Ile Ile Ser Lys Leu Asp Phe Gly Glu Met Ile Met 115 120 125
Ala Val Lys Lys Met Arg Pro Arg Arg Lys Pro Asp Asn Gln Cys His 130 135 140
Val Thr Asn Thr Val Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala 145 150 155 160
Asp Ala Ala Leu Arg Gly Phe Pro Glu Gln Glu Thr Thr Thr Ala Val 165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Ile Ser Ile Leu Ile Gly Ala Gln 180 185 190
Thr Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr 195 200 205 Glu Leu Gln Leu Gly Met Arg Gly Phe Thr Ala Tyr Ala Glu Thr Ile 210 215 220
Ser Val Tyr Gly Thr Asp Arg Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Gly Phe Leu Ala Ser Cys Tyr Ala Ser Arg Gly Leu Lys 245 250 255
Met Arg Phe Thr Ser Gly Ala Gly Ser Glu Val Leu Met Gly Tyr Pro 260 265 270
Glu Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Leu Leu Thr 275 280 285
Lys Ala Ser Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile 290 295 300
Glu Ile Pro Gly Ala Val Pro Asn Gly Ile Arg Glu Val Leu Gly Glu 305 310 315 320
Asn Leu Leu Cys Met Met Cys Asp Ile Glu Cys Ala Ser Gly Cys Asp 325 330 335
Gln Ala Tyr Ser His Ser Asp Met Arg Arg Thr Glu Arg Phe Ile Gly 340 345 350
Gln Phe Ile Ala Gly Thr Asp Tyr Ile Asn Ser Gly Tyr Ser Ser Thr 355 360 365
Pro Asn Tyr Asp Asn Thr Phe Ala Gly Ser Asn Thr Asp Ala Met Asp 370 375 380
Tyr Asp Asp Met Tyr Val Met Glu Arg Asp Leu Gly Gln Tyr Tyr Gly 385 390 395 400
Ile His Pro Val Lys Glu Glu Thr Ile Ile Lys Ala Arg Asn Lys Ala 405 410 415
Ala Lys Ala Leu Gln Ala Val Phe Glu Asp Leu Gly Leu Pro Lys Ile 420 425 430
Thr Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala Asn Thr His Asp Asp 435 440 445 Met Pro Lys Arg Asp Met Val Ala Asp Met Lys Ala Ala Cln Asp Met 450 455 460
Met Asp Arg Cly Ile Thr Ala Ile Asp Ile Ile Lys Ala Leu Tyr Asn 465 470 475 480
His Gly Phe Lys Asp Val Ala Clu Ala Ile Leu Asn Leu Cln Lys Cln 485 490 495
Lys Val Val Cly Asp Tyr Leu Gln Thr Ser Ser Ile Phe Asp Lys Asp 500 505 510
Trp Asn Val Thr Ser Ala Val Asn Asp Gly Asn Asp Tyr Gln Gly Pro 515 520 525
Cly Thr Gly Tyr Arg Leu Tyr Glu Asp Lys Glu Clu Trp Asp Arg Ile 530 535 540
Lys Asp Leu Pro Phe Ala Leu Asp Pro Glu His Leu Clu Leu 545 550 555
<210> 225
<211> 236
<212> PRT
<213> LactobaciIlus reuteri
<400> 225
Met Ala Asp Ile Asp Glu Asn Leu Leu Arg Lys Ile Val Lys Glu Val 15 10 15
Leu Ser Glu Thr Asn Gln Ile Asp Thr Lys Ile Asp Phe Asp Lys Ser 20 25 30
Asn Asp Ser Thr Ala Thr Ala Thr Cln Glu Val Gln Gln Pro Asn Ser 35 40 45
Lys Ala Val Pro Glu Lys Lys Leu Asp Trp Phe Gln Pro Val Gly Glu 50 55 60
Ala Lys Pro Gly Tyr Ser Lys Asp Glu Val Val 65 70 75
Ile Ala Val
Cly Pro 80
Ala Phe Ala Thr Val Leu Asp Lys Thr Glu Thr Gly Ile Pro His Lys
85 90 95
Glu Val Leu Arg Gln Val Ile Ala Gly Ile Glu Clu Glu Cly Leu Lys 100 105 110 Ala Arg Val Val Lys Val Tyr Arg Ser Ser Asp Val Ala Phe Cys Ala 115 120 125
Val Gln Gly Asp His Leu Ser Gly Ser Gly Ile Ala Ile Gly Ile Gln 130 135 140
Ser Lys Gly Thr Thr Val Ile His Gln Lys Asp Gln Asp Pro Leu Gly 145 150 155 160
Asn Leu Glu Leu
Phe Pro Gln Ala Pro Val 165 170
Leu Thr Pro Glu
Thr Tyr 175
Arg Ala Ile Gly Lys Asn Ala Ala Met Tyr Ala Lys Gly Glu Ser Pro 180 185 190
Glu Pro Val Pro Ala Lys Asn Asp Gln Leu Ala Arg Ile His Tyr Gln 195 200 205
Ala Ile Ser Ala Ile Met His Ile Arg Glu Thr His Gln Val Val Val 210 215 220
Gly Lys Pro Glu Glu Glu Ile Lys Val Thr Phe Asp 225 230 235
<210> 226
<211> 172
<212> PRT
<213> Lactobacillus reuteri
<400> 226
Met Met Ser Glu Val Asp Asp Leu Val Ala Lys Ile Met Ala Gln Met 15 10 15
Gly Asn Ser Ser Ser Ala Asn Ser Ser Thr Gly Thr Ser Thr Ala Ser 20 25 30
Thr Ser Lys Glu Met Thr Ala Asp Asp Tyr Pro Leu Tyr Gln Lys His 35 40 45
Arg Asp Leu Val Lys Thr Pro Lys Gly His Asn Leu Asp Asp Ile Asn 50 55 60
Leu Gln Lys Val Val Asn Asn Gln Val Asp Pro Lys Glu Leu Arg Ile
65 70 75 80
Thr Pro Glu Ala Leu Lys Leu Gln Gly Glu Ile Ala Ala Asn Ala Gly 85 90 95 Arg Pro Ala Ile Gln Lys Asn Leu Gln Arg Ala Ala Glu Leu Thr Arg 100 105 110
Val Pro Asp Glu Arg Val Leu Glu Met Tyr Asp Ala Leu Arg Pro Phe 115 120 125
Arg Ser Thr Lys Gln Glu Leu Leu Asn Ile Ala Lys Glu Leu Arg Asp 130 135 140
Lys Tyr Asp Ala Asn Val Cys Ala Ala Trp Phe Glu Glu Ala Ala Asp 145 150 155 160
ITyr Tyr Glu Ser Arg Lys Lys Leu Lys Gly Asp Asn 165 170
<210> 227 <211> 558 <212> PRT
<213> Lactobacillus diolivorans
<400> 227
Met Lys Arg Gln Lys Arg Phe Glu Lys Leu Glu Lys Arg Pro Val His 15 10 15
Leu Asp Gly Phe Val Lys Glu Trp Asp Asp Glu Gly Leu Val Ala Met 20 25 30
Glu Gly Lys Asn Asp Pro Lys Pro Ser Val Lys Val Glu Asn Gly Val 35 40 45
Val Thr Glu Leu Asp Gly Lys Lys Lys Ala Asp Phe Asp Leu Ile Asp 50 55 60
Lys Tyr Ile Ala Glu Tyr Gly Leu Asn Ile Asp Lys Ala Glu Glu Val 65 70 75 80
Met Ala Met Asp Ser Thr Lys Ile Ala Lys Met Leu Val Asp Pro Asn 85 90 95
Val Pro Arg Ser Glu Ile Val Lys Leu Thr Thr Ala Met Thr Pro Ala 100 105 110
Lys Ala Glu Glu Val Ile Ser Lys Leu Asn Phe Gly Glu Met Ile Met 115 120 125 Ala Val Gln Lys Met Arg Pro Arg Arg Thr Pro Ala Thr Gln Cys His IBO 135 140
Ile Thr Asn Thr Arg Asp Asn Pro Val Glu Ile Ala Ala Asp Ala Ala 145 150 155 160
Glu Ala Ser Leu Arg Gly Phe Pro Glu Gln Glu Thr Thr Thr Ala Thr 165 170 175
Ala Arg Tyr Ala Pro Leu Asn Ala Ile Ser Ile Met Val Gly Ser Gln 180 185 190
IThr Gly Arg Pro Gly Val Ile Ser Gln Cys Ser Val Glu Gly Ser Glu 195 200 205
Glu Leu Ser Leu Gly Met Arg Gly Phe Thr Ala Tyr Ala Glu Thr Ile 210 215 220
Ser Val Tyr Gly Thr Asp Arg Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Gly Phe Leu Ala Ser Cys Tyr Ala Ser Arg Gly Leu Lys 245 250 255
Met Arg Phe Thr Ser Gly Ala Gly Ser Glu Val Met Met Gly Tyr Thr 260 265 270
Glu Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Phe Ile Thr 275 280 285
Lys Gly Ser Gly Val Gln Gly Leu Gln Asn Gly Gly Val Ser Cys Ile 290 295 300
Gly Ile Pro Gly Ala Val Pro Ser Gly Leu Arg Gly Val Leu Gly Glu 305 310 315 320
Asn Leu Leu Cys Met Met Ile Asp Val Glu Cys Ala Ser Gly Cys Asp 325 330 335
Gln Ala Phe Ser His Ser Asp Ile Arg Arg Thr Glu Arg Met Ile Gly 340 345 350
Gln Phe Ile Ala Gly Thr Asp Tyr Ile Ser Ser Gly Tyr Ala Ala Glu 355 360 365 Glu Asn Arg Asp Asn Thr Phe Ala Gly Ser Asn Met Asp Val Leu Asp 370 375 380
Tyr Asp Asp Tyr Cys Ser Met Glu Arg Asp Leu Ser Ile Asn Gly Gly 385 390 395 400
Ile Val Pro Ile His Glu Glu Asp Ala Ile Lys Ile Arg Asn Lys Gly 405 410 415
Ala Lys Ala Ile Gln Ala Val Phe Asp Gly Leu Gly Leu Pro Lys Ile 420 425 430
Thr Asp Glu Glu Val Glu Ala Ala Thr Tyr Gly Ser Asn Ser Asp Asp 435 440 445
Met Pro Lys Arg Asp Met Val Gln Asp Met Lys Ala Ala Gln Asp Leu 450 455 460
Met Asp Arg Gly Thr Thr Ile Ser Asp Val Ile Lys Ala Leu Tyr Asp 465 470 475 480
His Asp Phe Lys Asp Val Ala Glu Ala Val Leu Lys Leu Ala Gln Gln 485 490 495
Lys Val Cys Gly Asp Tyr Leu Gln Thr Ser Ala Ile Phe Asp Gly Asp 500 505 510
Trp Asn Cys Ile Ser Ala Val Asn Asp Thr Asn Asp Tyr Met Gly Pro 515 520 525
Gly Thr Gly Tyr Arg Leu Trp Glu Asp Lys Pro Gln Asp Gln Arg Tyr 530 535 540
Ser Met Gly Asn Gly Ser Thr Thr Tyr Gly Leu Leu Ile Asp 545 550 555
<210> 228
<211> 245
<212> PRT
<213> Lactobacillus diolivorans
<400> 228
Met Lys Asp Thr Asp Thr Pro Ile Ser Phe Gly Lys Lys Asp Ser Ser 15 10 15
Ala Asn His Glu Ser Asn Gln Leu Ala Leu His Gly Asp Ser Trp Phe 20 25 30 Lys Ser Gly Asp Asp Pro Val Ser Asn Ser Ser Ser Ala Thr Ala Thr 35 40 45
Ala Ser Ala Pro Ser Gln Ser Thr Ser Gly Asn Gly Asp Ile Lys Ser 50 55 60
Leu Asp Trp Phe Lys His Val Gly Val Ala Lys Pro Gly Leu Ser Lys 65 70 75 80
Asp Glu Val Val Ile Gly Val Ala Pro Ala Phe Ala Glu Val Leu Thr 85 90 95
Lys Thr Met Thr Lys Ile Pro His Lys Asp Val Leu Arg Gln Ile Ile 100 105 110
Ala Gly Ile Glu Glu Glu Gly Leu Lys Ala Arg Val Val Lys Val Tyr 115 120 125
Arg Thr Ser Asp Val Ser Phe Ile Ala Asp Glu Val Asp Lys Leu Ser 130 135 140
Gly Ser Gly Ile Ala Val Ala Val Gln Ser Lys Gly Thr Ala Ile Ile 145 150 155 160
His Gln Lys Asp Gln Glu Pro Leu Asn Asn Leu Glu Leu Phe Pro Gln 165 170 175
Ala Pro Val Ile Asp Leu Pro Thr Tyr Arg Ala Ile Gly Lys Asn Ala 180 185 190
Ala Gln Tyr Ala Lys Gly Leu Ser Pro Asp Pro Val Pro Thr Val Asn 195 200 205
Asp Gln Met Ala Arg Val Gln Tyr Thr Ala Leu Ser Ser Leu Met His 210 215 220
Ile Ala Glu Thr Lys Arg Val Val Val Gly Lys Pro Ala Glu Glu Ile 225 230 235 240
Gln Val Thr Phe Asn 245
<210> 229
<211> 180
<212> PRT
<213> LactobaciTTus diolivorans <400> 229
Met Ser Clu Val Asp Glu Leu Val Ser Lys Ile Leu Ser Cln Leu Asn 15 10 15
Asn Gly Asp Ser Ser Cln Ser Thr Gly Thr Thr Thr Ala Ser Ser Val 20 2 5 .30
Thr Pro Thr Ser Ser Pro Ala Asn Ser Gly Lys Thr Phe Asp Lys Cly 35 40 45
Asp Tyr Pro Leu Phe Arg Lys His Pro Asp Asp Val Lys Thr Pro Thr 50 55 60
Cly Lys Ala Val Ser Asp Ile Thr Leu Asp Asn Val Val Ser Gly Lys 65 70 75 80
Val Asp Ser Lys Asp Leu Arg Ile Thr Ala Asn Thr Leu Arg Arg Gln 85 90 95
Cly Glu Ile Ala Ala Ser Ala Gly Arg Pro Ala Ile Cln Arg Asn Phe 100 105 lio
Cln Arg Ala Ala Glu Leu Thr Lys Ile Pro Asp Asp Lys Val Leu Ser 115 120 125
Phe Tyr His Ala Leu Arg Pro Phe Arg Ser Ser Lys Gln Asp Leu Leu 130 135 140
Asp Ile Ala Lys Gln Leu Arg Asp Thr Tyr His Ala Pro Val Cys Ala 145 150 155 160
Asn Trp Phe Glu Glu Ala Ala Gly Asn Tyr Glu Ile Ser Lys Lys Leu 165 170 175
Lys Gly Asp Asn 180
<210> 230
<211> 558
<212> PRT
<213> Lactobacillus reuteri
<400> 230
Met Lys Arg Gln Lys Arg Phe Clu Glu Leu Glu Lys Arg Pro Ile His 15 10 15 Gln Asp Thr Phe VaT Lys Glu Trp Pro Glu Glu Gly Phe Val Ala Met 20 25 30
Met Gly Pro Asn Asp Pro Lys Pro Ser Val Lys Val Glu Asn Gly Lys 35 40 45
Ile Val Glu Met Asp Gly Lys Lys Leu Glu Asp Phe Asp Leu Ile Asp 50 55 60
Leu Tyr Ile Ala Lys Tyr Gly Ile Asn Ile Asp Asn Val Glu Lys Val 65 70 75 80
Met Asn Met Asp Ser Thr Lys Ile Ala Arg Met Leu Val Asp Pro Asn 85 90 95
Val Ser Arg Glu Ser Ile Ile Glu Ile Thr Ser Ala Leu Thr Pro Ala 100 105 110
Lys Ala Glu Glu Ile Ile Ser Lys Leu Asp Phe Gly Glu Met Ile Met 115 120 125
Ala Ile Lys Lys Met Arg Pro Arg Arg Lys Pro Asp Asn Gln Cys His 130 135 140
Val Thr Asn Thr Val Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala 145 150 155 160
Asp Ala Ala Leu Arg Gly Phe Pro Glu Gln Glu Thr Thr Thr Ala Val 165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Ile Ser Ile Leu Ile Gly Ala Gln 180 185 190
Thr Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr 195 200 205
Glu Leu Gln Leu Gly Met Arg Gly Phe Thr Ala Tyr Ala Glu Thr Ile 210 215 220
Ser Val Tyr Gly Thr Asp Arg Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Gly Phe Leu Ala Ser Cys Tyr Ala Ser Arg Gly Leu Lys 245 250 255 Met Arg Phe Thr Ser Gly Ala Gly Ser Glu Val Leu Met Gly Tyr Pro 260 265 270
Glu Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Leu Leu Thr 275 280 285
Lys Ala Ser Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile 290 295 300
Glu Ile Pro Gly Ala Val Pro Asn Gly Ile Arg Glu Val Leu Gly Glu 305 310 315 320
Asn Leu Leu Cys Met Met Cys Asp Ile Glu Cys Ala Ser Gly Cys Asp 325 330 335
Gln Ala Tyr Ser His Ser Asp Met Arg Arg Thr Glu Arg Phe Ile Gly 340 345 350
Gln Phe Ile Ala Gly Thr Asp Tyr Ile Asn Ser Gly Tyr Ser Ser Thr 355 360 365
Pro Asn Tyr Asp Asn Thr Phe Ala Gly Ser Asn Thr Asp Ala Met Asp 370 375 380
Tyr Asp Asp Met Tyr Val Met Glu Arg Asp Leu Gly Gln Tyr Tyr Gly 385 390 395 400
Ile His Pro Val Gln Glu Glu Thr Ile Ile Lys Ala Arg Asn Lys Ala 405 410 415
Ala Lys Ala Leu Gln Ala Val Phe Glu Asp Leu Gly Leu Pro Lys Ile 420 425 430
Thr Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala Asn Thr His Asp Asp 435 440 445
Met Pro Lys Arg Asp Met Val Ala Asp Met Lys Ala Ala Gln Asp Met 450 455 460
Met Asp Arg Gly Ile Thr Ala Val Asp Ile Ile Lys Ala Leu Tyr Asn 465 470 475 480
His Gly Phe Lys Asp Val Ala Glu Ala Val Leu Asn Leu Gln Lys Gln 485 490 495 Lys Val Val Cly Asp Tyr Leu Gln Thr Ser Ser Ile Phe Asp Lys Asp 500 505 510
Trp Asn Ile Thr Ser Ala Val Asn Asp Gly Asn Asp Tyr Gln Gly Pro 515 520 525
Gly Thr Gly Tyr Arg Leu Tyr Glu Asp Lys Glu Glu Trp Asp Arg Ile 530 535 540
Lys Asp Leu Pro Phe Ala Leu Asp Pro Glu His Leu Glu Leu 545 550 555
<210> 231 <211> 236 <212> PRT
<213> Lactobacillus reuteri
<400> 231
Met Ala Asp Ile Asp Glu Asn Leu Leu Arg Lys Ile Val Lys Glu Val 1 5 10 15
Leu Asn Glu Thr Asn Gln Ile Asp Thr Lys Ile Asn Phe Asp Lys Glu 20 25 30
Asn Asn Ser Thr Ala Thr Ala Thr Glu Glu Val Gln Gln Pro Asn Ser 35 40 45
Lys Ala Val Pro Glu Lys Lys Leu Asp Trp Phe Gln Pro Ile Gly Glu 50 55 60
Ala Lys Pro Gly Tyr Ser Lys Asp Glu Val Val Ile Ala Val Gly Pro 65 70 75 80
Ala Phe Ala Thr Val Leu Asp Lys Thr Glu Thr Gly Ile Pro His Lys 85 90 95
Glu Val Leu Arg Gln Val Ile Ala Gly Ile Glu Glu Glu Gly Leu Lys 100 105 110
Ala Arg Val Val Lys Val Tyr Arg Ser Ser Asp Val Ala Phe Cys Ala 115 120 125
Val Gln Gly Asp His Leu Ser Gly Ser Gly Ile Ala Ile Gly Ile Gln 130 135 140 Ser Lys Gly Thr Thr Val Ile His Cln Lys Asp Cln Asp Pro Leu Gly 145 150 155 160
Asn Leu Clu Leu Phe Pro Gln Ala Pro Val Leu Thr Pro Glu Thr Phe 165 170 175
Arg Ala Ile Gly Lys Asn Ala Ala Met Tyr Ala Lys Gly Glu Ser Pro 180 185 190
Glu Pro Val Pro Ala Lys Asn Asp Gln Leu Ala Arg Ile His Tyr Cln 195 200 205
Ala Ile Ser Ala Ile Met His Ile Arg Clu Thr His Cln Val Val Val 210 215 220
Cly Lys Pro Clu Glu Glu Ile Lys Val Thr Phe Asp 225 230 235
<210> 232 <211> 171 <212> PRT
<213> LactobaciTlus reuteri
<400> 232
Met Ser Glu Val Asp Asp Leu Val Ala Lys Ile Met Ala Gln Met Gly 15 10 15
Asn Ser Ser Ser Ser Asp Ser Ser Thr Ser Ala Thr Ser Thr Asn Asn 20 25 30
Gly Lys Glu Met Thr Ala Asp Asp Tyr Pro Leu Tyr Cln Lys His Arg 35 40 45
Asp Leu Val Lys Thr Pro Ser Cly Lys Lys Leu Asp Asp Ile Thr Leu 50 55 60
Gln Lys Val Val Asn Asp Gln Val Asn Pro Lys Glu Leu Arg Ile Thr 65 70 75 80
Pro Glu Ala Leu Lys Leu Gln Gly Glu Ile Ala Ala Asn Ala Gly Arg 85 90 95
Pro Ala Ile Gln Lys Asn Leu Gln Arg Ala Ala Glu Leu Thr Arg Val
100 105 110
Pro Asp Glu Arg Val Leu Gln Met Tyr Asp Ala Leu Arg Pro Phe Arg 115 120 125 Ser Thr Lys Gln Glu Leu Leu Asp Ile Ala Asn Glu Leu Arg Asp Lys 130 135 140
Tyr His Ala Glu Val Cys Ala Ala Trp Phe Glu Glu Ala Ala Asp Tyr 145 150 155 160
Tyr Glu Ser
Arg Lys 165
Lys Leu Lys Gly
Asp Asn 170
<210> 233
<211> 756
<212> PRT
<213> Mesorhizobium Ioti
<400> 233
Met Thr Pro Lys Leu Asn Arg Trp Lys Arg Phe Ala Asp Trp Asp Glu 15 10 15
Arg Pro Leu Arg Leu Asp Lys Phe Ala Ala Glu Asp Pro Ala Asn Gly 20 25 30
Phe Ser Ala Phe Ser Ser Pro Ala Asp Pro Lys Pro Gly Ile Gly Ile 35 40 45
Lys Asp Gly Arg Val Ile Ser Leu Asp Gly Val Leu Glu His Asp Tyr 50 55 60
Asp Met Ile Asp Arg Phe Ile Ala Arg His His Ile Asp Pro Glu Val 65 70 75 80
Ala Pro Glu Ala Met Ala Leu Asp Ser Ala Thr Val Ala Arg Trp Leu 85 90 95
Val Asp Met Asn Val Pro Arg Glu Thr Leu Val Arg Leu Ala His Gly 100 105 110
Met Thr Pro Ala Lys Leu Ala Glu Val Val Ser Gln Leu Asn Ala Leu 115 120 125
Glu Ile Ala Phe Ala Tyr Ser Lys Met Arg Ala Arg Lys Thr Pro Gly 130 135 140
Asn Gln Ala His Val Thr Asn Ala Lys Asp Asp Pro Leu Gln Leu Ala
145 150 155 160
Ala Asp Ala Ala Thr Ala Val Ala Phe Gly Phe Asp Glu Ile Glu Thr 165 170 175 Thr Met Arg Val Ser Arg Asn Ala Trp Ser Asn Ala Val Ala Cys Ala 180 185 190
Val Gly Gly Ala Val Gly Arg Trp Gly Thr Leu Phe Gln Cys Ser Ser 195 200 205
Glu Glu Ala Glu Glu Leu Arg Ile Ala Met Ala Gly Phe Thr Ser Tyr 210 215 220
Ala Glu Thr Val Ser Val Tyr Gly Thr Glu Lys Ser Phe Thr Asp Gly 225 230 235 240
Asp Asp Thr Pro Trp Ser Lys Ala Phe Leu Ala Ala Ala Tyr Ala Ser 245 250 255
Arg Gly Val Lys Met Arg Cys Thr Ser Gly Ala Gly Ser Glu Leu Leu 260 265 270
Met Gly Phe His Glu Ala Lys Ser Leu Leu Tyr Leu Glu Ala Arg Cys 275 280 285
Leu Cys Leu Gln Arg Gly Met Gly Val Gln Gly Thr Gln Asn Gly Gly 290 295 300
Ile Asp Gly Ala Pro Leu Thr Ala Thr Ile Pro Gly Gly Val Arg Glu 305 310 315 320
Leu Met Ala Glu Asn Leu Ile Ala Val Trp Leu Asp Leu Glu Cys Ala 325 330 335
Ser Gly Asn Asp Ala Arg Ser Thr Glu Ser Glu Ile Arg Val Gly Ala 340 345 350
Lys Ile Leu Pro Tyr Leu Ile Ala Gly Ser Asp Leu Ile Cys Ser Gly 355 360 365
Met Gly Ser Ile Leu Lys Tyr Asp Asn Ser Phe Asn Pro Ser Leu Ile 370 375 380
Asn Gly Glu Glu Leu Glu Asp Tyr Leu Val Leu Gln Arg Asp Phe Glu 385 390 395 400
Ala Asp Gly Gly Leu Thr Pro Leu Pro Glu Ser Arg Ala Ile Glu Leu 405 410 415 Arg Glu Arg Ala Val Clu Ala Ile Ala Ala Val Phe Glu Glu Leu Gly 420 425 430
Leu Ser Ser Pro Thr Glu Asp Met Lys Ser Ser Val Val Tyr Ala Ser 435 440 445
Gly Ser Asp Asp Thr Arg Ser Leu Met Pro Arg Asp Val Ser Phe Ile 450 455 460
Ser Glu Ala Ile Lys Glu Arg Gly Ile Thr Val Ile Asp Val Val Lys 465 470 475 480
Ala Leu Ala Lys Arg Gly Phe Arg Glu Glu Ala Glu Asn Leu Leu Asp 485 490 495
Val Val Lys Leu Arg Leu Ser Gly Asp Tyr Leu Gln Thr Ser Ala Met 500 505 510
Ile Arg Asn Gly Arg Ile Val Ser Ala Val Asn Asp Pro Asn Asp Tyr 515 520 525
Leu Gly Pro Gly Ser Gly Tyr Arg Val Ser Glu Glu Arg Arg Leu Gln 530 535 540
Leu Asn Asp Ile Arg Asp Val Leu Asp Gln Lys Glu Val Leu Arg Ser 545 550 555 560
Glu Ala Leu His Glu Lys Asp Glu Ala Arg His Ile Arg Tyr Arg Asn 565 570 575
Leu Gly Pro Ala Ala Asn Gly Ser Ala Lys Asp Asp Val Val Ile Gly 580 585 590
Ile Ser Pro Ala Phe Gly Leu Lys Leu Tyr Arg Thr Thr Ala Gly His 595 600 605
Arg Leu Ser Glu Val Leu Gly Ala Met Leu Asp Ala Ile His Ala Arg 610 615 620
Gly Leu Lys Ala Arg Val Val Arg Phe Arg His Thr Ala Asp Thr Ser 625 630 635 640
Phe Leu Gly Leu Ser Ala Ala Arg Leu Ala Gly Ser Gly Ile Gly Ile 645 650 655 Cly Ile Cln Ala Lys Gly Thr Ala Val Ile His Gln Arg Asp Arg Gln
Pro His Asn Asn Leu Glu Leu Phe Ser Asn Ala Pro Ile Thr Arg Leu
Glu His Tyr Arg Ala Leu Gly Ala Asn Ala Ala Ala Tyr Ala Leu Gly
Glu Met Pro Glu Pro Val Val Val Pro Gln Arg Gly Glu Ala Met Gly
Ser Arg Tyr His Ala Arg Val Ala Leu Ile Tyr Ala Ile Glu Thr Gly
Leu Thr Glu Ala Gly Ala Ala Pro Glu Glu Val Asp Val Ile Leu Thr
Gly Val Lys Ser
<210> 234 <211> 139 <212> PRT
<213> Mesorhizobium Toti
<400> 234
Met Thr His Thr Arg Ala Asp Tyr Pro Leu Ala Glu Thr Gln Pro Gly
Ala Val Lys Gly Lys Arg Gly Lys Ser Leu Ala Glu Ile Thr Leu Asp
Ser Val Leu Ala Gly Asp Val Thr Met Glu Asp Leu Arg Ile Thr Pro
Gln Ala Leu Gln Ala Gln Ala Asp Val Ala Arg Asp Val Gly Arg Pro
Thr Leu Ala Leu Asn Phe Glu Arg Gly Ala Glu Leu Val Glu Val Pro
Gln Asp Phe Ile Met Gln Val Tyr Glu Leu Leu Arg Pro Gly Arg Ala 237
Lys Ser Lys Clu Glu Leu Leu Gln Ala Ala Thr Thr Met Arg Asp Thr 100 105 110
Tyr Gln Ala Glu Arg Ile Ala Arg Phe Ile Glu Glu Ala Ala Glu Thr 115 120 125
Tyr Ala Ala Arg Gly Leu Phe Thr Phe Arg Phe 130 135
<210> 235 <211> 746 <212> PRT
<213> Mycobacterium vanbaalenii
<400> 235
Met Ala Asp Glu Leu Gly Arg Phe Arg Val Leu Asn Ser Lys Pro Val 15 10 15
Asn Leu Asp Gly Phe Ser Val Pro Asp Ala Gly Leu Gly Leu Val Ala 20 25 30
Met Ser Ser Pro His Asp Pro Ala Pro Ser Leu Lys Ile Arg Gly Gly 35 40 45
Glu Val Val Glu Leu Asp Gly Lys Gly Ala Gly Glu Phe Asp Val Ile 50 55 60
Asp Glu Phe Ile Ala Arg Tyr Gly Ile Asp Leu Thr Val Ala Glu Glu 65 70 75 80
Ala Met Ala Leu Gly Asp Glu Thr Leu Ala Arg Met Val Val Asp Ile 85 90 95
Asn Val Pro Arg Ala Glu Val Val Arg Leu Ile Gly Gly Thr Thr Pro 100 105 110
Ala Lys Leu Ala Arg Val Val Ala Leu Leu Ser Pro Val Glu Met Gln 115 120 125
Met Ala Met Ala Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Ala 130 135 140
His Val Thr Asn Gln Leu Asp Asp Pro Leu Leu Ile Ala Ala Asp Ala 145 150 155 160 Ala Ser Ala Val Ala Tyr Cly Phe Arg Clu Val Glu Thr Thr Val Pro
Val Leu Gly Asp Ala Pro Ser Asn Ala Val Ala Leu Leu Ile Gly Ser
Gln Val Gly Ser Pro Gly Ala Met Ala Cln Cys Ser Ile Glu Glu Ala
Leu Glu Leu Arg Leu Gly Leu Arg Gly Leu Thr Ser Tyr Ala Glu Thr
Ile Ser Ile Tyr Gly Thr Glu Gln Val Phe Val Asp Gly Asp Asp Thr
Pro Phe Ser Lys Ala Ile Leu Thr Ser Ala Tyr Ala Ser Arg Gly Leu
Lys Met Arg Val Thr Ser Gly Gly Gly Ala Glu Val Leu Met Gly Ala
Ala Glu Lys Cys Ser Ile Leu Tyr Leu Glu Ser Arg Cys Val Ser Leu
Ala Arg Ala Leu Gly Ser Gln Gly Val Gln Asn Gly Gly Ile Asp Gly
Val Gly Val Val Ala Ser Val Pro Glu Gly Met Lys Glu Leu Leu Ala
Clu Asn Leu Met Val Met Met Arg Asp Leu Glu Ser Cys Ala Cly Asn
Asp Asn Leu Ile Ser Glu Ser Asp Ile Arg Arg Ser Ala His Thr Leu
Pro Val Leu Leu Ala Gly Ala Asp Phe Val Phe Ser Gly Phe Gly Ser
Ile Pro Arg Tyr Asp Asn Ala Phe Ala Leu Ser Asn Phe Asn Ser Asp
Asp Met Asp Asp Phe Leu Val Leu Gln Arg Asp Trp Gly Ala Asp Gly Gly Leu Arg Thr Val Ser Pro Glu His Leu Glu Ala Val Arg Arg Arg
Ala Ala Lys Ala Val Gln Ala Val Tyr Arg Asp Leu Gly Leu Ala Asp
Tyr Glu Asp Ala Arg Val Glu Glu Val Val Ala Ala Asn Gly Ser Arg
Asp Leu Pro Ala Gly His Pro Lys Met Val Ala Glu Ala Ala Ala Ser
Ile Glu Ala Arg Gln Leu Thr Val Phe Asp Val Ile Ala Ser Leu His
Arg Thr Gly Phe Thr Asp Glu Ala Glu Ala Ile Thr Thr Leu Thr Arg
Glu Arg Leu Arg Gly Asp Gln Leu Gln Thr Ser Ala Ile Phe Asp Glu
Lys Phe Arg Val Leu Ser Lys Leu Thr Asp Pro Asn Asp Tyr Thr Gly
Pro Ala Thr Gly Tyr Ala Leu Thr Asp Arg Arg Arg Ala Glu Ile Asp
Ala Ile Arg Gln Ala Arg Ser Ser Ala Glu Leu Thr Ala Asp Gln Glu
Ser Tyr Arg Gly His Val Leu Val Thr Asp Val Glu Pro Ala Gln Gln
Gly Ser Asp Pro Arg Glu Val Cys Ile Gly Leu Ser Pro Ala Trp Gly
Arg Ser Val Trp Leu Thr Leu Cys Gly Leu Thr Ile Gly Glu Val Leu
Arg Gln Ile Ser Ala Gly Leu Glu Glu Glu Gly Cys Ile Ala Arg Pro
Val Arg Val Arg Ser Thr Ile Asp Val Gly Leu Ile Gly Leu Thr Ala Ala Arg Leu Ser Gly Ser Gly Ile Gly Ile Gly Leu Gln Gly Lys Gly
Thr Ala Leu Ile His Arg Arg Asp Leu Ala Pro Leu Ala Asn Leu Glu
Leu Phe Ser Val Ala Pro Leu Leu Thr Ala Lys Met Tyr Arg Glu Leu
Gly Lys Asn Ala Ala Arg His Ala Lys Gly Met Ala Pro Val Pro Ile
Phe Thr Gly Gly Thr Asp Glu Ser Ile Ser Ala Arg Tyr His Ala Arg
Ala Val Ala Leu Val Ala Leu Glu Arg Glu Ser Cys Glu Pro Gly Gln
Pro Pro Val Thr Val Lys Val Glu Trp Pro
<210> 236 <211> 119 <212> PRT
<213> Mycobacterium vanbaalenii <400> 236
Met Ala Met Ser Glu Ile Ser Ala Ala Ser Arg Glu Asn Ile Thr Val
Gly Asn Ala Val Asp Gly Lys Leu Gly Leu Gly Asp Leu Arg Met Asp
Pro Ala Thr Leu Ala His Gln Ala Ala Val Ala Glu Ala Gly Gly Asn
Pro Gln Leu Ala Glu Asn Phe Arg Arg Ala Ala Glu Leu Ala Thr Ile
Glu Asp Glu Gln Val Met Ala Leu Tyr Glu Ala Leu Arg Pro His Arg
Ser Thr Ala Ala Glu Leu Glu Glu Leu Arg Ala Ser Leu Leu Ala Arg Gly Ala Pro Arg Cys Ala Ala Leu Val
Glu Gln Ala Ala Ala Val Tyr
Ala Arg Arg Gly Leu Leu Arg
<210> 237 <211> 739 <212> PRT
<213> Mycobacterium sp. <400> 237
Met Arg Ile Leu Asp Ala Lys Pro Val Asn Leu Asp Gly Phe Ser Val
Thr Asp Pro Ala Leu Gly Leu Val Ala Met His Ser Pro His Asp Pro
Gln Pro Ser Leu Val Val Arg Asp Gly Arg Val Val Glu Leu Asp Gly
Arg Pro Ala Ala Asp Phe Asp Val Ile Asp Glu Phe Ile Ala Arg Tyr
Gly Ile Asp Leu Thr Val Ala Glu Glu Ala Met Ala Leu Asp Asp Ala
Val Leu Ala Arg Met Ala Val Asp Val Asn Val Pro Arg Ala Glu Val
Val Arg Leu Ile Gly Gly Thr Thr Pro Ala Lys Leu Ala Arg Val Met
Ala Val Met Thr Pro Val Glu Met Gln Met Ala Met His Lys Met Arg
Ala Arg Arg Thr Pro Ser Asn Gln Ala His Val Thr Asn Gln Leu Asp
Asp Pro Leu Leu Ile Ala Ala Asp Ala Ala Ser Ala Val Ala Tyr Gly
Phe Arg Glu Val Glu Thr Thr Val Pro Val Phe Gly Asp Ala Pro Ser Asn Ala Ile Ala Leu Leu Ile Cly Ser Gln Val Gly Val Pro Gly Ala
Met Ala Gln Cys Ser Ile Glu Clu Ala Met Glu Leu Arg Leu Gly Leu
Arg Gly Leu Thr Ser Tyr Ala Glu Thr Ile Ser Ile Tyr Gly Thr Glu
Gln Val Phe Val Asp Gly Asp Asp Thr Pro Phe Ser Lys Ala Ile Leu
Thr Ala Ala Tyr Ala Ser Arg Gly Leu Lys Met Arg Val Thr Ser Gly
Gly Gly Ala Glu Val Leu Met Gly Ala Ala Glu Lys Cys Ser Ile Leu
Tyr Leu Glu Ser Arg Cys Val Ser Leu Ala Arg Ala Leu Cly Ser Gln
Gly Val Gln Asn Gly Gly Ile Asp Gly Val Gly Val Val Ala Ser Val
Pro Clu Gly Met Lys Glu Leu Leu Ala Glu Asn Leu Met Val Met Met
Arg Asp Leu Glu Ser Cys Ala Gly Asn Asp Asn Leu Ile Ser Glu Ser
Asp Ile Arg Arg Ser Ala His Thr Leu Pro Val Leu Leu Ala Gly Ala
Asp Phe Ile Phe Ser Gly Phe Gly Ser Ile Pro Arg Tyr Asp Asn Ala
Phe Ala Leu Ser Asn Phe Asn Ala Asp Asp Met Asp Asp Phe Leu Val
Leu Gln Arg Asp Trp Gly Ala Asp Cly Gly Leu Arg Thr Val Ser Arg
Glu His Leu Ala Arg Val Arg Arg Arg Ala Ala Thr Ala Val Cln Ala Val Tyr Arg Asp Leu Gly Leu Ala Asp Phe Asp Asp Thr Arg Ile Asp
Ala Val Val Val Ala Asn Asp Ser Arg Asp Leu Pro Ala Gly Asp Pro
Lys Ala Val Ala Glu Ala Ala Thr Ala Ile Glu Ala Arg Gln Leu Thr
Val Phe Asp Val Val Ala Ala Leu His Arg Thr Gly Tyr Ala Pro Glu
Ala Glu Ala Ile Met Arg Leu Thr Arg Glu Arg Leu Arg Gly Asp Gln
Leu Gln Thr Ser Ala Ile Phe Asp Asp Gln Phe Gln Val Leu Ser Lys
Ile Thr Asp Pro Asn Asp Tyr Ala Gly Pro Gly Ser Gly Tyr Thr Pro
Thr Glu Lys Arg Arg Ala Glu Ile Asp Gly Ile Arg Gln Ala Arg Thr
Ser Ala Glu Leu Thr Ala Asp Gln Ala Glu His Arg Gly His Val Val
Phe Ser Asp Val Glu Pro Ala His Gln Gly Ser Asp Pro Arg Glu Val
Cys Ile Gly Leu Ser Pro Ala Leu Gly Arg Ser Val Trp Leu Thr Leu
Cys Gly Leu Thr Val Gly Glu Val Leu Arg Gln Leu Ser Ala Gly Leu
Glu Glu Glu Gly Cys Val Pro Arg Leu Val Arg Val Arg Ser Thr Ile
Asp Val Gly Leu Ile Gly Leu Thr Ala Ala Arg Leu Ser Gly Ser Gly
Ile Gly Ile Gly Leu Gln Gly Lys Gly Thr Ala Leu Ile His Arg Arg Asp Leu Ala Pro Leu Ala Asn Leu Glu Leu Phe Ser Val Ala Pro Leu
Leu Thr Ala Lys Met Tyr Arg Glu Leu Gly Arg Asn Ala Ala Arg His
Ala Lys Gly Met Ala Pro Leu Pro Ile Leu Ala Gly Gly Thr Asp Glu
Ser Ile Ser Ala Arg Tyr His Ala Arg Ala Val Ala Leu Val Ala Leu
Glu Arg Gln Ala Cys Glu Pro Gly Gln Ala Pro Ile Thr Val Glu Ala
Lys Arg Val
<210> 238 <211> 110 <212> PRT
<213> Mycobacterium sp.
Met Thr Glu Lys Phe Thr Val Ala Ala Ala Val Asp Gly Lys Leu Thr
Leu Ser Asp Leu Arg Met Asp Pro Ala Thr Leu Ala Tyr Gln Ala Val
Val Ala Glu Gln Asp Gly Asn Pro Gln Leu Ala Glu Asn Phe Leu Arg
Ala Ala Glu Leu Ala Val Ile Asp Asp Glu Ala Val Met Lys Phe Tyr
Glu Ala Leu Arg Pro His Arg Ser Thr Ala Ala Glu Leu Glu Glu Leu
Arg Val Ser Leu Glu Thr Gly Gly Ala Ser Arg Cys Ala Glu Leu Val
Arg Gln Ala Ala Glu Val Tyr Ala Arg Arg Gly Leu Leu Arg <210> 239 <211> 746 <212> PRT
<213> Mycobacterium fTavescens <400> 239
Met Ala Asp Glu Leu Gly Arg Phe Arg Val Leu Asn Ser Lys Pro Val
Asn Leu Asp Gly Phe Ser Val Pro Asp Ala Ala Leu Gly Leu Val Ala
Met Ser Ser Pro His Asp Pro Ala Pro Ser Leu Val Ile Arg Asp Gly
Ala Val Val Glu Leu Asp Ser Lys Asp Val Ala Glu Phe Asp Val Ile
Asp Glu Phe Ile Ala Arg Tyr Gly Ile Asp Leu Ser Val Ala Glu Glu
Ala Met Ala Leu Asp Asp Glu Thr Leu Ala Arg Met Val Val Asp Ile
Asn Val Pro Arg Ala Gly Val Val Arg Leu Ile Gly Gly Thr Thr Pro
Ala Lys Leu Ala Arg Val Val Ala Leu Leu Ser Pro Val Glu Met Gln
Met Ala Met Val Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Ala
His Val Thr Asn Gln Leu Asp Asp Pro Leu Leu Ile Ala Ala Asp Ala
Ala Ser Ala Val Ala Tyr Gly Phe Arg Glu Val Glu Thr Thr Val Pro
Val Leu Gly Asp Ala Pro Ser Asn Ala Val Ala Leu Leu Ile Gly Ser
Gln Val Gly Thr Pro Gly Ala Met Ala Gln Cys Ser Ile Glu Glu Ala Leu Clu Leu Arg Leu Cly Leu Arg Gly Leu Thr Ser Tyr Ala Clu Thr
Ile Ser Ile Tyr Cly Thr Clu Gln Val Phe Ile Asp Gly Asp Asp Thr
Pro Phe Ser Lys Ala Ile Leu Thr Ser Ala Tyr Ala Ser Arg Gly Leu
Lys Met Arg Val Thr Ser Gly Gly Gly Ala Glu Val Leu Met Gly Ala
Ala Gln Lys Cys Ser Ile Leu Tyr Leu Glu Ser Arg Cys Val Ser Leu
Ala Arg Ala Leu Gly Ser Gln Gly Val Gln Asn Gly Cly Ile Asp Gly
Val Gly Val Val Ala Ser Val Pro Glu Gly Met Lys Clu Leu Leu Ala
Clu Asn Leu Met Val Met Met Arg Asp Leu Glu Ser Cys Ala Gly Asn
Asp Asn Leu Ile Ser Glu Ser Asp Ile Arg Arg Ser Ala His Thr Leu
Pro Val Leu Leu Ala Gly Ala Asp Phe Ile Phe Ser Gly Phe Gly Ser
Ile Pro Arg Tyr Asp Asn Ala Phe Ala Leu Ser Asn Phe Asn Ser Asp
Asp Met Asp Asp Phe Leu Val Leu Gln Arg Asp Trp Gly Ala Asp Gly
Gly Leu Arg Thr Val Ser Pro Glu His Leu Glu Ala Val Arg Arg Arg
Ala Ala Gln Ala Val Gln Ala Val Tyr Arg Asp Leu Gly Leu Ala Asp
Tyr Asp Asp Ala Arg Val Glu Asp Val Val Ala Ala Asn Gly Ser Arg Asp Leu Pro Ala Gly His Pro Lys Met Val Ala Glu Ala Ala Ala Ser
Ile Glu Ala Arg Gln Leu Thr Val Phe Asp Val Ile Ala Ala Leu His
Arg Thr Gly Phe Thr Glu Glu Ala Glu Ala Ile Thr Thr Leu Thr Arg
Glu Arg Leu Arg Gly Asp Gln Leu Gln Thr Ser Ala Ile Phe Asp Glu
Gln Phe Arg Val Phe Ser Lys Leu Thr Asp Pro Asn Asp Tyr Arg Gly
Pro Ala Thr Gly Tyr Ala Leu Thr Glu Gln Arg Arg Ala Glu Ile Asp
Ala Ile Arg Gln Ala Arg Ser Gly Ala Glu Leu Thr Val Asp Gln Glu
Glu His Arg Gly His Val Val Val Thr Asp Val Glu Pro Ala His Gln
Gly Ser Asp Pro Arg Glu Val Cys Ile Gly Leu Ser Pro Ala Trp Gly
Arg Ser Val Trp Leu Thr Leu Cys Gly Leu Thr Val Gly Glu Val Leu
Arg Gln Ile Ala Ala Gly Leu Glu Glu Glu Gly Cys Ile Ala Arg Thr
Val Arg Val Cys Ser Thr Ile Asp Thr Gly Leu Ile Gly Leu Thr Ala
Ala Arg Leu Ser Gly Ser Gly Ile Gly Ile Gly Leu Gln Gly Lys Gly
Thr Ala Leu Ile His Arg Arg Asp Leu Ala Pro Leu Ala Asn Leu Glu
Leu Phe Ser Val Ala Pro Leu Leu Thr Ala Lys Met Tyr Arg Glu Leu GTy Lys Asn Ala Ala Arg His Ala Lys Cly Met Ala Pro Val Pro Ile
Phe Thr Cly Cly Thr Asp Clu Ser Ile Ser Ala Arg Tyr His Ala Arg
Ala Val Ala Leu Val Ala Leu Glu Arg Asp Ala Cys Glu Pro Gly Arg
Ala Pro Val Thr Val Lys Val Glu Ala Arg
<210> 240 <211> 109 <212> PRT
<213> Mycobacterium flavescens
<400> 240
Met Ser Glu Ile Thr Thr Gln Asn Ala Val Asp Cly Lys Leu Gly Leu
Gly Asp Leu Arg Met Asp Pro Ala Val Leu Glu His Gln Ala Ala Val
Ala Glu Glu Gly Gly Asn Pro Gln Leu Ala Glu Asn Phe Arg Arg Ala
Ala Glu Leu Ala Thr Ile Asp Asp Asp Thr Val Met Ala Leu Tyr Glu
Ala Leu Arg Pro His Arg Ser Thr Ala Ala Glu Leu Asp Glu Leu His
Ser Ser Leu Ile Ala Arg Gly Ala Pro Arg Cys Ala Ala Leu Val Glu
Gln Ala Ala Ala Val Tyr Ala Arg Arg Gly Leu Leu Arg
<210> 241
<211> 739
<212> PRT
<213> Mycobacterium sp.
<400> 241
Met Arg Ile Leu Asp Ala Lys Pro Val Asn Leu Asp Gly Phe Ser Val Thr Asp Pro Ala Leu Gly Leu Val Ala Met His Ser Pro His Asp Pro
Gln Pro Ser Leu Val Val Arg Asp Gly Arg Val Val Glu Leu Asp Gly
Arg Pro Ala Ala Asp Phe Asp Val Ile Asp Glu Phe Ile Ala Arg Tyr
Gly Ile Asp Leu Thr Val Ala Glu Glu Ala Met Ala Leu Asp Asp Ala
Val Leu Ala Arg Met Ala Val Asp Val Asn Val Pro Arg Ala Glu Val
Val Arg Leu Ile Gly Gly Thr Thr Pro Ala Lys Leu Ala Arg Val Met
Ala Val Met Thr Pro Val Glu Met Gln Met Ala Met His Lys Met Arg
Ala Arg Arg Thr Pro Ser Asn Gln Ala His Val Thr Asn Gln Leu Asp
Asp Pro Leu Leu Ile Ala Ala Asp Ala Ala Ser Ala Val Ala Tyr Gly
Phe Arg Glu Val Glu Thr Thr Val Pro Val Phe Gly Asp Ala Pro Ser
Asn Ala Ile Ala Leu Leu Ile Gly Ser Gln Val Gly Val Pro Gly Ala
Met Ala Gln Cys Ser Ile Glu Glu Ala Met Glu Leu Arg Leu Gly Leu
Arg Gly Leu Thr Ser Tyr Ala Glu Thr Ile Ser Ile Tyr Gly Thr Glu
Gln Val Phe Val Asp Gly Asp Asp Thr Pro Phe Ser Lys Ala Ile Leu
Thr Ala Ala Tyr Ala Ser Arg Gly Leu Lys Met Arg Val Thr Ser Gly Gly Cly Ala Glu Val Leu Met Gly Ala Ala Glu Lys Cys Ser Ile Leu
Tyr Leu Glu Ser Arg Cys Val Ser Leu Ala Arg Ala Leu Gly Ser Gln
Gly Val Gln Asn Cly Cly Ile Asp Gly Val Gly Val Val Ala Ser Val
Pro Clu Gly Met Lys Clu Leu Leu Ala Glu Asn Leu Met Val Met Met
Arg Asp Leu Clu Ser Cys Ala Gly Asn Asp Asn Leu Ile Ser Clu Ser
Asp Ile Arg Arg Ser Ala His Thr Leu Pro Val Leu Leu Ala Gly Ala
Asp Phe Ile Phe Ser Cly Phe Cly Ser Ile Pro Arg Tyr Asp Asn Ala
Phe Ala Leu Ser Asn Phe Asn Ala Asp Asp Met Asp Asp Phe Leu Val
Leu Gln Arg Asp Trp Gly Ala Asp Cly Gly Leu Arg Thr Val Ser Arg
Glu His Leu Ala Arg Val Arg Arg Arg Ala Ala Thr Ala Val Gln Ala
Val Tyr Arg Asp Leu Gly Leu Ala Asp Phe Asp Asp Thr Arg Ile Asp
Ala Val Val Val Ala Asn Asp Ser Arg Asp Leu Pro Ala Cly Asp Pro
Lys Ala Val Ala Glu Ala Ala Thr Ala Ile Clu Ala Arg Gln Leu Thr
Val Phe Asp Val Val Ala Ala Leu His Arg Thr Gly Tyr Ala Pro Glu
Ala Glu Ala Ile Met Arg Leu Thr Arg Glu Arg Leu Arg Gly Asp Gln Leu Gln Thr Ser Ala Ile Phe Asp Asp Cln Phe Gln Val Leu Ser Lys
Ile Thr Asp Pro Asn Asp Tyr Ala Gly Pro Gly Ser Gly Tyr Thr Pro
Thr Glu Lys Arg Arg Ala Glu Ile Asp Gly Ile Arg Gln Ala Arg Thr
Ser Ala Glu Leu Thr Ala Asp Gln Ala Glu His Arg Gly His Val Val
Phe Ser Asp Val Glu Pro Ala Arg Gln Gly Ser Asp Pro Arg Glu Val
Cys Ile Gly Leu Ser Pro Ala Leu Gly Arg Ser Val Trp Leu Thr Leu
Cys Gly Leu Thr Val Gly Glu Val Leu Arg Gln Leu Ser Ala Gly Leu
Glu Glu Glu Gly Cys Val Pro Arg Leu Val Arg Val Arg Ser Thr Ile
Asp Val Gly Leu Ile Gly Leu Thr Ala Ala Arg Leu Ser Gly Ser Gly
Ile Gly Ile Gly Leu Gln Gly Lys Gly Thr Ala Leu Ile His Arg Arg
Asp Leu Ala Pro Leu Ala Asn Leu Glu Leu Phe Ser Val Ala Pro Leu
Leu Thr Ala Lys Met Tyr Arg Glu Leu Gly Arg Asn Ala Ala Arg His
Ala Lys Gly Met Ala Pro Leu Pro Ile Leu Ala Gly Gly Thr Asp Glu
Ser Ile Ser Ala Arg Tyr His Ala Arg Ala Val Ala Leu Val Ala Leu
Glu Arg Gln Ala Cys Glu Pro Gly Gln Ala Pro Ile Thr Val Glu Ala Lys Arg Val
<210> 242 <211> 110 <212> PRT <213> Mycobacterium sp. <400> 242 Met Thr Glu Lys Phe Thr
Leu Ser Asp Leu Arg Met Asp Pro Ala Thr Leu Ala Tyr Gln Ala Val
Val Ala Glu Gln Asp Gly Asn Pro Gln Leu Ala Glu Asn Phe Leu Arg
Ala Ala Glu Leu Ala Val Ile Asp Asp Glu Ala Val Met Lys Leu Tyr
Glu Ala Leu Arg Pro His Arg Ser Thr Ala Ala Glu Leu Glu Glu Leu
Arg Val Ser Leu Glu Thr Gly Gly Ala Ser Arg Cys Ala Glu Leu Val
Arg Gln Ala Ala Glu Val Tyr Ala Arg Arg Gly Leu Leu Arg
<210> 243 <211> 570 <212> PRT
<213> Mycobacterium smegmatis <400> 243
Met Thr Thr Ala Arg Asn Leu Gly Thr Glu Ala Lys Arg Gln Ser Glu
Arg Thr Lys Leu Leu Glu Glu Arg Pro Val Asn Leu Asp Gly Phe Val
Gln Glu Trp Pro Glu Val Gly Met Val Ala Met Asp Ser Ala Phe Asp
Pro Glu Pro Ser Val Arg Val Glu Asn Gly Val Ile Val Glu Met Asp Gly Arg Ala Arg Ala Asp Phe Asp Phe Ile Asp Gln Phe Ile Ala Asp
His Ala Ile Asp Val Ala Thr Thr Glu Gln Ser Met Ala Leu Pro Ala
Val Glu Ile Ala Arg Met Leu Val Asp Pro Arg Val Thr Arg Asp Glu
Val Ile Ala Val Thr Gly Gly Leu Thr Pro Ala Lys Leu Leu Glu Val
Ala Lys Asn Leu Asn Ile Val Glu Ile Met Met Gly Ile Gln Lys Met
Arg Ala Arg Arg Thr Pro Ala Asn Gln Ala His Cys Thr Ser Ala Arg
Asp Asn Pro Leu Gln Val Ala Cys Glu Ala Ala Glu Ala Ser Leu Arg
Gly Phe Ser Glu Val Glu Thr Thr Leu Gly Val Val Arg Tyr Ala Pro
Leu Val Ala Met Ala Leu Gln Ile Gly Ser Gln Val Gly Ser Gly Gly
Leu Leu Thr Gln Cys Ala Leu Glu Glu Ala Thr Glu Leu Glu Leu Gly
Met Arg Gly Ile Thr Ala Tyr Ala Glu Thr Ile Ser Val Tyr Gly Thr
Glu Ser Val Phe Val Asp Gly Asp Asp Thr Pro Trp Ser Lys Ala Phe
Leu Ala Ala Ala Tyr Ala Ser Arg Gly Ile Lys Met Arg Phe Thr Ser
Gly Thr Gly Ser Glu Val Gln Met Gly Asn Ala Glu Gly Arg Ser Met
Leu Tyr Leu Glu Ile Arg Cys Ile Leu Val Ala Lys Gly Ala Gly Val 290 295 300 Gln Cly Leu Gln Asn Gly Ser Ile Ser Cys Ile Gly Val Pro Gly Ala
Val Pro Ala Gly Ile Arg Ala Val Ala Ala Glu Asn Leu Ile Ala Ser
Ala Val Asp Leu Clu Cys Ala Ser Gly Asn Asp Gln Ser Phe Ser His
Ser Pro Met Arg Arg Thr Ala Arg Leu Leu Pro Gln Met Leu Pro Gly
Thr Asp Phe Val Cys Ser Gly Tyr Ser Ala Val Pro Asn Tyr Asp Asn
Met Phe Ala Gly Ser Asn Leu Asp Ala Glu Asp Phe Asp Asp Phe Asn
Thr Ile Gln Arg Asp Leu Gln Val Asp Gly Gly Leu Arg His Val Asn
Glu Ala Glu Ile Val Ala Ala Arg Arg Arg Ala Ala Gln Ala Leu Gln
Ala Val Phe Arg Tyr Leu Asp Leu Pro Ala Ile Thr Asp Ala Glu Ile
Glu Ala Ala Val Tyr Ala His Gly Ser Arg Glu Leu Ile Pro Arg Asp
Val Leu Glu Asp Leu Lys Gly Ala Gln Gln Val Met Asp Arg Asn Val
Thr Gly Leu Asp Leu Val Lys Ala Leu Glu Ser Thr Gly Phe Ala Asp
Ile Ala Glu Asn Leu Leu Ala Val Leu Arg Gln Arg Val Ser Gly Asp
Leu Leu Gln Thr Ser Ala Ile Met Thr Arg Asp Leu Lys Pro Leu Ser
Ala Val Asn Asp Arg Asn Asp Tyr Ala Gly Pro Gly Thr Gly Tyr Arg Pro Ser Cly Ala Arg Trp Glu Glu Met Lys Arg Leu Arg His Val Thr
Ser Ala Glu Asn Pro Glu Leu Glu Val Glu
<210> 244
<211> 200
<212> PRT
<213> Mycobacterium smegmatis
<400> 244
Met Ile Met Ser Ala Gln Ser Thr Gln Ala Gln Arg Thr Leu Glu Leu
Val Gly Asp Ser Pro Ala Glu Pro Gly Lys Arg Ser Asp Glu Val Val
Leu Ala Val Ser Pro Ala Phe Ala Asp Phe Phe Ser Gln Thr Ile Ile
Gly Leu Ser His Ala Asp Val Ile Arg Glu Ile Leu Ala Gly Ile Glu
Glu Gln Glu Val His Ala Arg Cys Ile Arg Val Arg His Ser Ser Asp
Leu Ala Val Leu Ala His Thr Ala Ala Lys Leu Ser Gly Ser Gly Ile
Cly Ile Gly Ile Leu Ser Arg Gly Thr Ser Met Ile His Gln Arg Asp
Leu Pro Arg Leu Ser Ser Leu Glu Leu Phe Pro Gln Ser Pro Leu Met
Thr Leu Glu Thr Tyr Arg Ser Ile Gly Ser Asn Ala Ala Gln Tyr Ala
Lys Gly Glu Ser Pro Glu Pro Val Pro Thr Leu Asn Asp Gln Met Ala
Arg Pro Arg Trp Gln Ala Lys Ala Ala Leu Leu His Leu Lys Glu Thr Glu Cln Val Val Lys Gln Ala Lys Pro Val Glu Val Val Pro Gln Phe
Gly Val Ala Glu Ala Leu Gly Thr
<210> 245 <211> 114 <212> PRT
<213> Mycobacterium smegmatis <400> 245
Met Asn Asp Lys Phe Thr Asp Lys Tyr Thr Val Ala Ala Ala Val Asp
Gly Lys Leu Asp Leu Ser Asp Leu Arg Met Asp Pro Ala Val Leu Ala
His Gln Ala Val Ile Ala Glu Glu Asn Gly Asn Pro Gln Leu Ala Glu
Asn Phe Leu Arg Ala Ala Glu Leu Ala Thr Ile Asp Asp Glu Asp Val
Met Arg Leu Tyr Glu Ala Leu Arg Pro Tyr Arg Ser Ser Ala Glu Asp
Leu Asp Ala Leu Gln Ala Ser Leu Glu Ser Arg Gly Ala Ala Arg Cys
Ala Glu Leu Val Arg Gln Ala Ala Glu Ala Tyr Ala Arg Arg Gly Leu
Leu Arg
<210> 246 <211> 754 <212> PRT
<213> Mycobacterium smegmatis <400> 246
Met His Leu Asn Ser Thr Glu Val Asp Ser Arg Leu Gly Arg Ile Arg
Leu Leu Asp Arg Gln Arg Val Asn Leu Asp Gly Phe Ala Asp Val Asp Ala Glu Leu Gly Met Ile Ser His Leu Ser Pro Asn Asp Pro Glu Pro
Ser Trp Val Val Ala Asp Asp Gly Thr Val Leu Glu Met Asp Ser Lys
Pro Ala Glu Asp Phe Asp Thr Ile Asp Glu Phe Ile Val Lys Tyr Ala
Ile Asp His Glu Gln Ala Pro Arg Ser Met Ala Met Thr Asp Leu Asp
Leu Ala Arg Met Ile Val Asp Pro Gly Arg Pro Arg Glu Glu Ile Leu
Arg Val Cys Ser Gly Leu Thr Pro Ala Lys Met Ala Arg Val Val Ala
Ser Leu Gln Pro Val Glu Ile Gln Met Ala Met Met Lys Met Arg Ala
Arg Arg Thr Pro Ala Asn Gln Ala His Val Thr Asn Arg Leu Asp Asp
Pro Leu Leu Ile Ala Ala Asp Ala Ala Thr Ala Val Val Tyr Gly Phe
Arg Glu Leu Glu Ala Thr Val Pro Val Leu Asp Asp Ala Pro Ala Val
Ala Val Gly Leu Leu Ile Gly Ser Gln Val Pro Ala Pro Gly Ala Leu
Thr Gln Cys Ser Val Glu Glu Ala Arg Glu Leu Glu Leu Gly Val Arg
Gly Leu Val Ser Tyr Ala Glu Thr Val Ser Val Tyr Gly Thr Glu Gln
Val Phe Thr Asp Gly Asp Asp Thr Pro Trp Ser Lys Ala Phe Leu Thr
Ser Cys Tyr Ala Ser Arg Gly Ile Lys Met Arg Leu Ser Ser Gly Ala Gly Ser Glu Val Leu Met Gly Gln Ala Glu Gly Lys Ser Met Asn Tyr 275 280 285
Leu Glu Ala Arg Cys Val Ala Leu Ala Arg Gly Ile Gly Ala Gln Gly 290 295 300
Val Gln Asn Gly Gly Val Asp Gly Ala Ala Ile Thr Ala Ser Val Pro 305 310 315 320
Gly Gly Val Lys Glu Leu His Ala Glu Asn Leu Met Val Met Leu Arg 325 330 335
Gly Leu Glu Ser Cys Ser Gly Asn Asp Ser Leu Met Ser Glu Ser Thr 340 345 350
Met Arg Arg Thr Ser Arg Thr Leu Pro Thr Leu Leu Ser Gly Ser Asp 355 360 365
Phe Ile Phe Ser Gly Phe Gly Ser Val Val Ser Tyr Asp Asn Met Phe 370 375 380
Gly Pro Ser Asn Phe Asn Ala Ala Asp Leu Asp Asp Tyr Leu Val Leu 385 390 395 400
Gln Arg Asp Trp Gly Val Asp Gly Gly Leu Arg Ser Val Asp Pro Thr 405 410 415
Thr Leu Glu Ser Met Arg Arg Glu Ala Ala Glu Ala Thr Arg Ala Val 420 425 430
Phe Glu Tyr Leu Gly Leu Ala Asp Phe Asp Asp Asp His Val Glu Ala 435 440 445
Val Val Gly Ala Glu Gly Ser Lys Asp Leu Pro Gln Asp Asp Gly Val 450 455 460
Lys Val Leu Ser Ala Ala Arg Met Ile Asp Gln Ser Gly Leu Thr Val 465 470 475 480
Leu Asp Ile Val Ser Ala Leu Ala Glu Thr Gly Phe Thr His Ile Ala 485 490 495
Asp Arg Val Leu Gly Met Ala Arg Ala Arg Val Thr Gly Asp Tyr Leu 500 505 510 GTn Thr Ala Ala Ile Phe Asp Glu Glu Met Asn Val Leu Ser Ala Leu
His Asp Pro Asn Asp Tyr Arg Gly Pro Gly Thr Gly Tyr Arg Pro Thr
Pro Glu Arg Gln Ala Gln Ile Asp Ala Val Arg Gln Ala Arg Ser Val
Ala Asp Leu Val Lys Glu Gln Ala Thr Ser Ala Gln Pro Asp Arg Leu
Arg Val Leu Gly Ala Ala Thr Val Gly Glu Asp Pro Arg Glu Val Val
Ile Gly Val Ser Pro Ala Phe Gly Thr Lys Leu Phe Arg Thr Leu Ser
Gly Met Thr Ile Tyr Asp Val Leu Glu Gln Ile Leu Ala Gly Leu Glu
Glu Glu His Cys Val Pro Arg Leu Val Arg Ile Thr Asp Ser Ile Asp
Leu Gly Ala Ile Gly Lys Ser Ala Ala Gln Leu Ser Gly Ser Gly Ile
Gly Val Gly Leu Gln Ala Lys Gly Thr Thr Leu Ile His Arg Arg Asp
Leu Pro Pro Leu Ala Asn Leu Glu Leu Leu Ser Val Ala Pro Leu Ile
Thr Pro Glu Met Tyr Arg Leu Ile Gly Ile Asn Ala Gly Arg His Ala
Lys Gly Ala Thr Pro Ser Pro Met Arg Asn Ala Tyr Thr Asp Glu Ala
Ile Thr Ala Arg Tyr His Thr Lys Val Val Ser Met Val Ala Ile Glu
Arg Glu Glu Ser Glu Arg Arg Glu Thr Gly Asn Val Glu Leu Glu Ile Thr Arg
<210> 247 <211> 757 <212> PRT
<21Β> Mycobacterium smegmatis <400> 247
Met Val Ala Val Thr Glu Ser Gly Asp Pro Gly Gln Ser Pro Glu Leu
Gly Arg Met Arg Ile Leu Asp Ala Lys Pro Val Asn Leu Asp Gly Phe
Ser Val Pro Asp Pro Asp Leu Gly Leu Ala Ala Met Ser Ser Pro His
Asp Pro Gln Pro Ser Leu Val Ile Arg Asp Gly Arg Val Val Glu Met
Asp Gly Lys Ala Ala Glu Asp Phe Asp Val Ile Asp Glu Phe Ile Ala
Arg Tyr Gly Leu Asp Leu Asp Val Ala Pro Glu Ala Met Ala Met Ser
Asp Ile Asp Leu Ala Arg Met Ala Val Asp Ile Asn Val Pro Arg Ala
Glu Val Val Arg Leu Ile Ala Gly Thr Thr Pro Ala Lys Leu Ala Lys
Val Ile Ala Val Leu Thr Pro Val Glu Met Gln Ala Ala Met Ala Lys
Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Ala His Val Thr Asn Gln
Leu Asp Asp Pro Leu Leu Ile Ala Ala Asp Ala Ala Ser Ala Val Ala
Tyr Gly Phe Arg Glu Val Glu Thr Thr Val Pro Val Leu Ala Asp Ala
Pro Ser Asn Ala Val Ala Leu Leu Ile Gly Ser Gln Val Gly Val Pro Cly Ala Met Ala Gln Cys Ser Ile Glu Clu Ala Leu Glu Leu Arg Leu
Gly Leu Arg Gly Leu Thr Ser Tyr Ala Glu Thr Ile Ser Ile Tyr Gly
Thr Glu Gln Val Phe Val Asp Gly Asp Asp Thr Pro Phe Ser Lys Ala
Ile Leu Thr Ser Ala Tyr Ala Ser Arg Gly Leu Lys Met Arg Val Thr
Ser Gly Gly Gly Ala Glu Val Leu Met Gly Ala Ala Clu Lys Cys Ser
Ile Leu Tyr Leu Glu Ser Arg Cys Val Ser Leu Ala Arg Ala Leu Cly
Ser Gln Gly Val Gln Asn Gly Gly Ile Asp Cly Val Gly Val Val Ala
Ser Val Pro Asp Gly Met Lys Glu Leu Leu Ala Glu Asn Leu Met Val
Met Met Arg Asp Leu Clu Ser Cys Ala Gly Asn Asp Asn Leu Ile Ser
Glu Ser Asp Ile Arg Arg Ser Ala His Thr Leu Pro Val Leu Leu Ala
Gly Ala Asp Phe Ile Phe Ser Cly Phe Gly Ser Ile Pro Arg Tyr Asp
Asn Ala Phe Ala Leu Ser Asn Phe Asn Ser Asp Asp Met Asp Asp Phe
Leu Val Leu Gln Arg Asp Trp Gly Ala Asp Gly Gly Leu Arg Thr Val
Pro Ala Asp Gln Leu Ala Ala Val Arg Arg Arg Ala Ala Arg Ala Val
Gln Ala Val Tyr Arg Asp Leu Gly Leu Ala Asp Phe Asp Asp Gln His Ile Glu Asn Val Val Ala Ala Asrt Gly Ser Arg Asp Leu Pro Pro Gly
Asp Pro Lys Ala Val Leu Glu Ala Ala Asn Ala Ile Glu Ala Lys Gln
Leu Thr Val Phe Asp Val Val Ala Ser Leu Lys Arg Thr Gly Phe Asp
Pro Glu Ala Glu Ala Ile Met Arg Leu Thr Ala Glu Arg Met Arg Gly
Asp Gln Leu Gln Thr Ser Ala Ile Phe Asp Glu Gln Phe Arg Val Leu
Ser Lys Ile Thr Asp Pro Asn Asp Tyr Ala Gly Pro Gly Thr Gly Tyr
Thr Leu Ser Glu Gln Arg Arg Ala Glu Ile Asp Asn Ile Arg Gln Gln
Arg Ser Ala Ala Glu Leu Thr Ala Asp Gln Ala Glu His Ala Gly His
Ile Thr Val Thr Glu Ile Glu Pro Ala Arg Gln Gly Ser Asp Pro Arg
Glu Val Cys Ile Gly Leu Ser Pro Ala Leu Gly Arg Ser Val Trp Leu
Ser Leu Cys Gly Leu Pro Ile Gly Glu Val Ile Arg Gln Ile Ser Ala
Gly Leu Glu Glu Glu Gly Cys Val Pro Arg Phe Val Arg Val Arg Ser
Thr Ile Asp Val Gly Leu Ile Gly Leu Thr Ala Ala Lys Leu Ala Gly
Ser Gly Ile Gly Ile Gly Leu Gln Gly Lys Gly Thr Ala Leu Ile His
Arg Arg Asp Leu Ala Pro Leu Ala Asn Leu Glu Leu Phe Ser Val Ala Pro Leu Leu Thr Ala Arg Asn Tyr Arg Clu Leu Gly Arg Asn Ala Ala 690 695 700
Arg His Ala Lys Cly Met Ala Pro Val Pro Ile Leu Thr Gly Gly Thr 705 710 715 720
Asp Clu Ser Ile Ser Ala Arg Tyr His Ala Arg Ala Val Ala Leu Val 725 730 735
Ala Leu Clu Arg Gln Ala Ser Glu Pro Cly Clu Ala Pro Val Thr Val 740 745 750
Clu Val Arg Arg Pro 755
<210> 248 <211> 142 <212> PRT
<213> Mycobacterium smegmatis <400> 248
Met Ser Glu Pro Val Leu Asp Pro Ala Val Asp Tyr Pro Leu Ser Leu 1 5 10 15
Asn Arg Lys Asp Leu Leu Thr Thr Pro Asn Cly Lys Pro Ile Asp Ala 20 25 30
Ile Thr Met Asp Ala Val Met Ser Cly Clu Val Ser Ala Ser Asp Leu 35 40 45
Arg Ile Thr Pro Glu Thr Leu Arg Leu Cln Ala Gln Ile Ala Glu Gly 50 55 60
Val Gly Arg Lys Cln Leu Gly Ala Asn Leu Arg Arg Ala Ala Clu Met 65 70 75 80
Thr Ala Ile Ser Asp Glu Arg Val Leu Gln Ile Tyr Asn Ala Leu Arg 85 90 95
Pro Asn Ala Ser Thr Lys Ala Glu Leu Asp Ala Ile Ala Glu Glu Leu 100 105 110
Glu Thr Cln Tyr Gly Ala Thr Met Leu Ala Gly Leu Val Arg Glu Ala
115 120 125
Ala Asp Val Tyr Glu Arg Arg Asp Ile Leu Ala Thr Ser Glu
130 135 140 <210> 249 <211> 119 <212> PRT
<213> Mycobacterium smegmatis <400> 249
Met Thr Ile Thr Ser His Ser Gly Arg Ser Ile Asp Glu Val Thr Val 1 5 10 15
Glu Ala Ala Arg Gly Gly Asp Leu Thr Leu Asp Asp Ile Arg Ile Ser 20 25 30
Arg Asp Thr Leu Ile Ser Gln Ala Glu Ala Ala Glu Arg Thr Gly Ser 35 40 45
Glu Gln Leu Gly Leu Asn Leu Arg Arg Ala Ala Glu Leu Thr Ala Leu 50 55 60
Ser Ser Asp Asp Met Leu Ala Ala Tyr Glu Ala Leu Arg Pro Gly Arg 65 70 75 80
Ser Thr Phe Ser Glu Leu Glu Ala Leu Ala Gln Arg Leu Ala Ala Gln 85 90 95
Glu Ala His Thr Cys Ala Gln Leu Val Arg Glu Ala Ala Ala Ala Tyr 100 105 110
Arg Arg Arg Gly Leu Leu Arg 115
<210> 250 <211> 224 <212> PRT
<213> Salmonella enterica subespécie enterica sorovar Paratyphi <400> 250
Met Glu Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Asp Val Leu 1 5 10 15
Arg Asp Met Lys Gly Ser Asp Lys Pro Val Ser Phe Asn Thr Pro Ala 20 25 30
Ala Ser Thr Ala Pro Gln Thr Ala Ala Pro Ala Gly Asp Gly Phe Leu 35 40 45
Thr Glu Val Gly Glu Ala Arg Gln Gly Thr Gln Gln Asp Glu Val Ile 50 55 60 Ile Ala Val Cly Pro Ala Phe Cly Leu Ala Cln Thr Val Asn Ile Val
Cly Leu Pro His Lys Ser Ile Leu Arg Glu Val Ile Ala Cly Ile Clu
Glu Glu Gly Ile Arg Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp
Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Cly Ser Gly Ile
Ser Ile Gly Ile Cln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu
Thr Leu Glu Thr Tyr Arg Gln Ile Asp Lys Asn Ala Ala Arg Tyr Ala
Lys Arg Glu Ser Pro Cln Pro Val Pro Thr Leu Asn Asp Gln Met Ala
Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Clu Thr
Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu
<210> 251 <211> 173 <212> PRT
<213> SaTmonena enterica subespécie enterica sorovar Paratyphi <400> 251
Met Asn Ile Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Arg
Met Asn Ser Leu Cln Gly Asp Ala Pro Ala Ala Ala Pro Ala Ala Cly
Cly Thr Ser Arg Ser Ala Lys Val Ser Asp Tyr Pro Leu Ala Asn Lys
His Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe Thr Leu Clu Asn Val Leu Ser Asn Lys Val Thr Ala Gln Asp Met Arg
Ile Thr Pro Glu Thr Leu Arg Leu Gln Ala Ser Ile Ala Lys Asp Ala
Gly Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu Thr
Ala Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro
Tyr Arg Ser Thr Lys Glu Glu Leu Leu Ala Ile Ala Asp Asp Leu Glu
Asn Arg Tyr Gln Ala Lys Ile Cys Ala Ala Phe Val Arg Glu Ala Ala
Gly Leu Tyr Val Glu Arg Lys Lys Leu Lys Gly Asp Asp
<210> 252 <211> 188 <212> PRT
<213> Clostridium perfringens
<400> 252
Met Glu Glu Arg Thr Phe Ile Pro Glu Ile Thr Val Glu Glu Val Cly
Glu Ala Lys Val Gly Leu Arg Ser Asp Glu Val Val Ile Gly Leu Ala
Pro Ala Phe Leu Lys Tyr Cln Asn Lys Thr Ile Val Asp Val Pro His
Thr Glu Thr Leu Leu Glu Ile Ile Ala Cly Ile Glu Glu Glu Cly Leu
His Ala Arg Val Val Arg Val Leu Arg Thr Ser Asp Val Ser Phe Ile
Ala His Asp Ala Ala Cys Leu Ser Cly Ser Gly Ile Gly Ile Gly Ile
Gln Ser Lys Gly Thr Thr Val Ile His Gln Lys Asp Leu Leu Pro Leu Asn Asn Leu Clu Leu Phe Ser Gln Ala Pro Leu Leu Thr Pro Glu Thr 115 120 125
Tyr Arg Leu Ile Gly Lys Asn Ala Ala Lys Tyr Ala Lys Gly Glu Ser IBO 135 140
Pro Thr Pro Val Pro Val Lys Asn Asp Gln Met Val Arg Pro Lys Phe 145 150 155 160
Met Ala Lys Ala Ala Leu Leu His Ile Lys Glu Thr Lys His Val Glu 165 170 175
Pro Gly Lys Lys Pro Val Gln Leu Glu Val Lys Phe 180 185
<210> 253 <211> 141 <212> PRT
<213> CTostridium perfringens
<400> 253
Met Glu Asn Lys Arg Met Thr Ala Ala Asp Tyr Pro Leu Thr Ser Lys 15 10 15
Arg Lys Gly Asp Ile Lys Thr Pro Thr Gly Lys Ala Leu Glu Asp Ile 20 25 30
Thr Leu Glu Lys Val Leu Ser Gly Glu Ile Asn Ala Asp Asp Ile Arg 35 40 45
Ile Ser Pro Glu Thr Leu Glu Met Gln Ala Gln Ile Ala Glu Ser Met 50 55 60
Asn Arg Asp Ala Ile Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile 65 70 75 80
Arg Val Pro Asp Asp Arg Ile Leu Glu Met Tyr Asn Ala Leu Arg Pro 85 90 95
Tyr Arg Ser Thr Lys Glu Asp Leu Phe Lys Ile Ala Asp Glu Leu Glu 100 105 HO
Thr Lys Tyr Asp Ala Lys Val Asn Ala Asn Phe Val Arg Glu Ala Ala 115 120 125 Clu Val Tyr Glu Thr Arg Asn Lys Leu Arg Ile Clu Glu
<210> 254 <211> 554 <212> PRT
<213> SaTmoneTTa enterica subespécie enterica sorovar Typhimurium <400> 254
Met Arg Ser Lys Arg Phe Clu Ala Leu Ala Lys Arg Pro Val Asn Gln
Asp Gly Phe Val Lys Glu Trp Ile Clu Clu Cly Phe Ile Ala Met Glu
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Ala Val
Thr Clu Leu Asp Gly Lys Pro Val Ser Glu Phe Asp Leu Ile Asp His
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Asn Arg Ala Glu Glu Val Met
Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val
Lys Arg Ser Glu Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys
Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ala
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu
Gly Ala Trp Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val Gly Arg Pro Cly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu 195 200 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser 210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp 225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met 245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu 260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys 275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Ser Ile Gly 290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn 305 310 315 320
Leu Ile Cys Ser Ser Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln 325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln 340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro 355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe 370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Gly Gly Leu 385 390 395 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala 405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr 420 425 430 Asp Glu Clu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met 435 440 445
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile 450 455 460
Asn Lys Asn Arg Asn Gly Leu Glu Val Val Lys Ala Leu Ala Gln Gly 465 470 475 480
Gly Phe Thr Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys 485 490 495
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Gly Asp Gly 500 505 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala 515 520 525
Thr Gly Tyr Arg Leu Gln Gly Glu Arg Trp Glu Glu Ile Lys Asn Ile 530 535 540
Pro Gly Ala Leu Asp Pro Asn Glu Ile Asp 545 550
<210> 255 <211> 524 <212> PRT
<213> Listeria monocytogenes
<400> 255
Met Glu Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Glu Asn Gly 1 5 10 15
Lys Val Val Glu Met Asp Ser Lys Lys Leu Ala Asp Phe Asp Leu Ile 20 25 30
Asp His Phe Ile Ala Lys Tyr Gly Val Asp Leu Ser Arg Ala Glu Glu 35 40 45
Val Met Gln Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro 50 55 60
Asn Val Pro Arg Glu Lys Ile Val Leu Leu Thr Thr Ala Met Thr Pro
65 70 75 80
Ala Lys Ile Val Glu Val Val Ser Gln Met Asn Val Val Glu Met Met 85 90 95 Met Ser Met Gln Lys Met Arg Ser Arg Arg Thr Pro Thr Thr Gln Ala 100 105 110
His Val Thr Asn Leu Arg Asp Asn Pro Val Gln Ile Ala Ala Asp Ala 115 120 125
Ala Glu Ala Ala Ile Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala 130 135 140
Val Val Arg Tyr Ala Pro Phe Asn Ala Leu Ser Leu Leu Val Gly Ser 145 150 155 160
Gln Thr Gly Arg Gly Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala 165 170 175
Thr Glu Leu Glu Leu Gly Met Arg Gly Leu Thr Cys Tyr Ala Glu Thr 180 185 190
Ile Ser Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr 195 200 205
Pro Trp Ser Lys Gly Ile Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu 210 215 220
Lys Met Arg Phe Thr Ser Gly Thr Gly Ser Glu Val Gln Met Gly Tyr 225 230 235 240
Ala Glu Gly Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile 245 250 255
Thr Lys Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Ile Ser Cys 260 265 270
Ile Gly Ile Pro Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala 275 280 285
Glu Asn Leu Ile Ala Val Met Leu Asp Leu Glu Val Ala Ser Gly Asn 290 295 300
Asp Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Leu Leu 305 310 315 320
Met Gln Phe Leu Pro Gly Thr Asp Tyr Ile Ser Ser Gly Tyr Ser Ala 325 330 335 Thr Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Asp 340 345 350
Asp Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Lys Val Asp Gly 355 360 365
Gly Leu Thr Pro Val Thr Glu Glu Glu Val Val Ala Val Arg Asn Lys 370 375 380
Ala Ala Arg Val Ile Gln Ala Val Phe Asp Lys Leu Gly Leu Pro Glu 385 390 395 400
Val Thr Asp Ala Glu Val Glu Ala Ala Thr Tyr Ala Arg Gly Ser Lys 405 410 415
Asp Met Pro Glu Arg Asn Met Val Glu Asp Ile Lys Ala Ala Ala Glu 420 425 430
Met Met Asp Arg Gly Val Thr Gly Leu Asp Val Val Lys Ala Leu Ser 435 440 445
Ala Gly Gly Phe Asp Asp Val Ala Glu Ser Val Leu Asn Met Leu Lys 450 455 460
Gln Arg Val Ser Gly Asp Phe Leu His Thr Ser Ala Ile Ile Asp Lys 465 470 475 480
Asp Trp Asn Val Ile Ser Ser Val Asn Asp Leu Asn Asp Tyr Ala Gly 485 490 495
Pro Gly Thr Gly Tyr Arg 500
Leu Glu Gly Glu Arg Trp Glu Lys Leu Lys 505 510
Asp Ile Ala Val Ala Val Asp Ala Asn Glu Leu Glu 515 520
<210> 256
<211> 555
<212> PRT
<213> Escherichia blattae
<400> 256
Met Arg Arg Ser Lys Arg Phe Glu Val Leu Glu Lys Arg Pro Val Asn 1 5 10 15
Gln Asp Gly Leu Ile Gly Glu Trp Pro Glu Glu Gly Leu Ile Ala Met 20 25 30 Cly Ser Pro Trp Asp Pro Pro Ser Ser Val Lys Val Clu Gln Gly Arg 35 40 45
Ile Val Clu Leu Asp Gly Lys Ala Arg Ala Asp Phe Asp Met Ile Asp 50 55 60
Arg Phe Ile Ala Asp Tyr Ala Ile Asn Ile Glu Clu Thr Glu His Ala 65 70 75 80
Met Gly Leu Asp Ala Leu Thr Ile Ala Arg Met Leu Val Asp Ile Asn 85 90 95
Val Ser Arg Ala Clu Ile Ile Lys Val Thr Thr Ala Ile Thr Pro Ala 100 105 110
Lys Ala Glu Clu Val Met Ser His Met Asn Val Val Clu Met Met Val 115 120 125
Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His 130 135 140
Val Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala 145 150 155 160
Glu Ala Gly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile 165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Ile Gly Ser Gln 180 185 190
Ser Cly Arg Pro Cly Val Leu Thr Gln Cys Ser Val Clu Glu Ala Thr 195 200 205
Glu Leu Glu Leu Gly Met Arg Gly Phe Thr Ser Tyr Ala Glu Thr Val 210 215 220
Ser Val Tyr Cly Thr Clu Ala Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys 245 250 255
Met Arg Tyr Thr Ser Cly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ala 260 265 270 Clu Ser Lys Ser Met Leu Tyr Leu Clu Ser Arg Cys Ile Phe Ile Thr 275 280 285
Lys Gly Ala Cly Val Cln Cly Leu Gln Asn Cly Ala Val Ser Cys Ile 290 295 300
Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu 305 310 315 320
Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp 325 330 335
Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met 340 345 350
Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val 355 360 365
Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Clu Asp 370 375 380
Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly 385 390 395 400
Leu Arg Pro Val Ser Glu Clu Clu Thr Ile Ala Ile Arg Asn Lys Ala 405 410 415
Ala Arg Ala Val Gln Ala Val Phe Arg Clu Leu Gly Leu Pro Pro Val 420 425 430
Thr Asp Glu Clu Val Thr Ala Ala Thr Tyr Ala His Gly Ser Lys Asp 435 440 445
Met Pro Pro Arg Asn Val Val Clu Asp Leu Ser Ala Val Glu Glu Met 450 455 460
Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Arg Ala Leu Ser Val 465 470 475 480
Asn Gly Phe Asp Asp Val Ala Asn Asn Ile Leu Asn Met Leu Arg Gln 485 490 495
Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Clu 500 505 510 Phe GTu Val Val Ser ATa VaT Asn Asp ITe Asn Asp Tyr GTn GTy Pro 515 520 525
Gly Thr GTy Tyr Arg ITe Ser Pro Gln Arg Trp Glu Glu ITe Lys Asn 530 535 540
Ile Ala Thr Val Ile Gln Pro Asp Ser ITe Glu 545 550 555
<210> 257 <211> 555 <212> PRT
<213> não identificada
<400> 257
Met Arg Arg Ser Lys Arg Phe Glu VaT Leu Ala GTn Arg Pro Val Asn 1 5 10 15
Gln Asp Gly Leu Ile Gly Glu Trp Pro Glu Glu GTy Leu ITe Ala Met 20 25 30
Glu Ser Pro Tyr Asp Pro ATa Ser Ser Val Lys Val Glu Asn GTy Arg 35 40 45
Ile Val Glu Leu Asp Gly Lys Ser Arg ATa Glu Phe Asp Met Ile Asp 50 55 60
Arg Phe Ile Ala Asp Tyr Ala Ile Asn Val Pro GTu Ala GTu Arg Ala 65 70 75 80
Met GTn Leu Asp Ala Leu Glu Ile Ala Arg Met Leu Val Asp Ile His 85 90 95
Val Ser Arg Glu Glu Ile Ile Ala Ile Thr Thr ATa ITe Thr Pro ATa 100 105 110
Lys Ala Val Glu Val Met Ala Gln Met Asn Val VaT Glu Met Met Met 115 120 125
ATa Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His 130 135 140
Val Thr Asn Leu Lys Asp Asn Pro Val Gln ITe ATa Ala Asp Ala Ala 145 150 155 160 Clu Ala Gly Ile Arg Cly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile 165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ser Gln 180 185 190
Cys Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Clu Glu Ala Thr 195 200 205
Glu Leu Glu Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val 210 215 220
Ser Val Tyr Gly Thr Glu Ser Val Phe Thr Asp Gly Asp Asp Thr Pro
225 230 235 240
Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys 245 250 255
Met Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ser 260 265 270
Clu Ser Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr 275 280 285
Lys Gly Ala Gly Val Gln Gly Leu Gln Asn Cly Ala Val Ser Cys Ile 290 295 300
Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu 305 310 315 320
Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp 325 330 335
Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met 340 345 350
Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val 355 360 365
Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp 370 375 380
Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly 385 390 395 400 Leu Arg Pro Val Thr Glu Clu Glu Thr Ile Ala Ile Arg Asn Lys Ala 405 410 415
Ala Arg Ala Ile Gln Ala Val Phe Arg Glu Leu Gly Leu Pro Leu Ile 420 425 430
Ser Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp 435 440 445
Met Pro Ala Arg Asn Val Val Glu Asp Leu Ala Ala Val Glu Glu Met 450 455 460
Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Gly Ala Leu Ser Ser 465 470 475 480
Ser Gly Phe Glu Asp Ile Ala Ser Asn Ile Leu Asn Met Leu Arg Gln 485 490 495
Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Gln 500 505 510
Phe Asp Val Val Ser Ala Val Asn Asp Ile Asn Asp Tyr Gln Gly Pro 515 520 525
Gly Thr Gly Tyr Arg Ile Ser Ala Glu Arg Trp Ala Glu Ile Lys Asn 530 535 540
Ile Ala Gly Val Val Gln Pro Gly Ser Ile Glu 545 550 555
<210> 258 <211> 555 <212> PRT
<213> não identificada
<400> 258
Met Arg Arg Ser Lys Arg Phe Glu Val Leu Ala Gln Arg Pro Val Asn 1 5 10 15
Gln Asp Gly Leu Ile Gly Glu Trp Pro Glu Glu Gly Leu Ile Ala Met 20 25 30
Glu Ser Pro Tyr Asp Pro Ala Ser Ser Val Lys Val Glu Asn Gly Arg
35 40 45
Ile Val Glu Leu Asp Gly Lys Asp Arg Ala Gln Phe Asp Met Ile Asp 50 55 60 Arg Phe Ile Ala Asp Tyr Ala Ile Asn Val Ala Glu Thr Glu Arg Ala 65 70 75 80
Met Gln Leu Asp Ala Leu Glu Ile Ala Arg Met Leu Val Asp Ile His 85 90 95
Val Ser Arg Glu Glu Ile Ile Ala Ile Thr Thr Ala Ile Thr Pro Ala 100 105 110
Lys Ala Val Glu Val Met Ala Lys Met Asn Val Val Glu Met Met Met 115 120 125
Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His 130 135 140
Val Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala 145 150 155 160
Glu Ala Gly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile 165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ser Gln 180 185 190
Cys Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr 195 200 205
Glu Leu Glu Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val 210 215 220
Ser Val Tyr Gly Thr Glu Ser Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys 245 250 255
Met Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ser 260 265 270
Glu Ser Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr 275 280 285
Lys Gly Ala Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile 290 295 300 Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu 305 3lO 315 320
Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp 325 330 335
Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met 340 345 350
Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val 355 360 365
Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp 370 375 380
Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly 385 390 395 400
Leu Arg Pro Val Thr Glu Glu Glu Thr Ile Ala Ile Arg Asn Lys Ala 405 410 415
Ala Arg Ala Ile Gln Ala Val Phe Arg Glu Leu Gly Leu Pro Leu Ile 420 425 430
Ser Asp Glu Glu Val Asp Ala Ala Thr Tyr Ala His Gly Ser Lys Asp 435 440 445
Met Pro Ala Arg Asn Val Val Glu Asp Leu Ala Ala Glu Glu Glu Met 450 455 460
Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Gly Ala Leu Asn Ser 465 470 475 480
Ser Gly Phe Glu Asp Ile Ala Ser Asn Ile Leu Asn Met Leu Lys Gln 485 490 495
Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Gln 500 505 510
Phe Glu Val Val Ser Ala Val Asn Asp Ile Asn Asp Tyr Gln Gly Pro 515 520 525
Gly Thr Gly Tyr Arg Ile Ser Ala Glu Arg Trp Ala Glu Ile Lys Asn 530 535 540 Ile Ala Gly Val Val Gln Pro Ser Ala Ile Glu 545 550 555 <210> 259 <211> 556 <212> PRT <213> Lactobacillus collinoides <400> 259
Met Glu Arg Gln Lys Arg Phe Glu Lys Leu Glu Glu Arg Pro Val His 1 5 10 15
Leu Asp Gly Phe Val Lys Asn Trp Asp Asp Glu Gly Leu Val Ala Leu 20 25 30
Asn Gly Lys Asn Asp Pro Lys Pro Ser Ile Thr Ile Glu Asn Gly Val 35 40 45
Val Thr Glu Met Asp Gly Lys Lys Lys Ala Asp Phe Asp Leu Ile Asp 50 55 60
Lys Tyr Ile Ala Glu Tyr Gly Ile Asn Leu Asp Asn Ala Glu Lys Thr 65 70 75 80
Leu Asn Thr Asp Ser Val Lys Ile Ala Asn Met Met Cys Asp Pro Asn 85 90 95
Val Ser Arg Ala Glu Ile Ile Glu Tyr Thr Thr Ala Met Thr Pro Ala 100 105 110
Lys Ala Ala Glu Val Ile Ser Gln Leu Asn Phe Ala Glu Met Ile Met 115 120 125
Ala Thr Gln Lys Met Arg Pro Arg Arg Thr Pro Met Ala Gln Val His 130 135 140
Ala Thr Asn Thr Leu Asp Asn Pro Val Glu Ile Ala Ala Asp Ala Ala 145 150 155 160
Glu Ala Ala Leu Arg Gly Val Pro Glu Glu Glu Thr Thr Thr Ala Ile 165 170 175
Ala Arg Tyr Ala Pro Met Asn Ala Ile Ser Ile Met Val Gly Ala Gln 180 185 190 Ala Gly Arg Pro CTy Val Ile Thr Gln Cys Ser Val Glu Clu Ala Asp 195 200 205
Glu Leu Ser Leu Gly Met Arg Gly Phe Thr Ala Tyr Ala Glu Thr Ile 210 215 220
Ser Val Tyr Gly Thr Asp Arg Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240
Trp Ser Lys Gly Phe Leu Ala Ser Cys Tyr Ala Ser Arg Cly Leu Lys 245 250 255
Met Arg Phe Thr Ser Gly Ala Gly Ser Glu Ala Met Met Gly Tyr Thr 260 265 270
Glu Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr 275 280 285
Lys Ala Ser Gly Val Gln Gly Leu Gln Asn Gly Gly Val Ser Cys Ile 290 295 300
Gly Met Pro Gly Ala Val Val Cly Gly Ile Arg Glu Val Leu Gly Glu 305 310 315 320
Asn Leu Leu Cys Met Ser Leu Asp Val Glu Cys Ala Ser Gly Cys Asp 325 330 335
Gln Ala Phe Ser His Ser Asp Ile Arg Arg Thr Gly Arg Met Ile Gly 340 345 350
Gln Phe Ile Ala Gly Thr Asp Tyr Leu Ser Ser Ser Tyr Ala Ala Glu 355 360 365
Glu Asn Met Asp Asn Thr Phe Ala Gly Ser Asn Met Asp Val Leu Asp 370 375 380
Cys Asp Asp Tyr Ile Thr Leu Glu Arg Asp Met Ala Ile Asn Gly Gly 385 390 395 400
Ile Met Pro Ile Thr Glu Glu Clu Ser Ile Lys Ile Arg His Lys Ala 405 410 415
Ala Val Ala Ile Gln Ala Val Phe Asp Gly Leu Gly Leu Pro Gln Ile 420 425 430 Thr Asp Glu Clu Val Clu Ala Ala Thr Tyr Gly Ser Asn Ser Asn Asp 435 440 445
Met Pro Lys Arg Asp Met Val Gln Asp Met Lys Ala Ala Gln Gly Leu 450 455 460
Met Thr Arg Gly Ile Thr Val Val Asp Val Ile Lys Ala Leu Tyr Asp 465 470 475 480
His Asp Ile Lys Asp Val Ala Glu Ala Val Leu Lys Leu Ala Gln Gln 485 490 495
Lys Val Cys Gly Asp Tyr Leu Cln Thr Ser Ala Val Phe Leu Asp Gly 500 505 510
Trp Lys Cys Thr Ser Ala Ile Asn Asn Ala Asn Asp Tyr Lys Gly Pro 515 520 525
Gly Thr Cly Tyr Arg Leu Trp Glu Asp Lys Asp Lys Trp Asp Arg Leu 530 535 540
Glu Asn Val Pro Trp Ala Leu Asp Pro Gln Lys Leu 545 550 555
<210> 260
<211> 224
<212> PRT
<213> não identificada
<400> 260
Met Glu Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Asp Val Leu 1 5 10 15
Ser Glu Met Gln Thr Ser Asp Lys Pro Val Ser Phe Arg Ser Ser Ala 20 25 30
Ala Ala Thr Ala Pro Gln Met Ala Thr Ala Pro Gly Asp Ser Phe Leu 35 40 45
Thr Glu Ile Gly Glu Ala Lys Gln Cly Gln Gln Gln Asp Glu Val Ile 50 55 60
Ile Ala Val Gly Pro Ala Phe Gly Leu Ser Gln Thr Val Asn Ile Val
65 70 75 80
Gly Ile Pro His Lys Asn Ile Leu Arg Glu Val Ile Ala Gly Ile Glu 85 90 95 Clu Clu Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp 100 105 110
Val Ala Phe Val Ala Val Clu Gly Asn Arg Leu Ser Cly Ser Gly Ile 115 120 125
Ser Ile Gly Ile Gln Ser Lys Cly Thr Thr Val Ile His Gln Gln Cly 130 135 140
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu 145 150 155 160
Thr Leu Clu Thr Tyr Arg Gln Ile Cly Lys Asn Ala Ala Arg Tyr Ala 165 170 175 Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala 180 185 190
Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr 195 200 205
Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu 210 215 220
<210> 261
<211> 224
<212> PRT
<213> não identificada
<400> 261
Met Glu Ile Asn Clu Lys Leu Leu Arg Gln Ile Ile Clu Asp Val Leu 1 5 10 15
Ser Glu Met Gln Thr Ser Asp Lys Pro Val Ser Phe Arg Ser Ser Thr 20 25 30
Ala Ala Ser Ala Pro Gln Ala Ala Ala Ala Gln Gly Asp Ser Phe Leu 35 40 45
Thr Glu Ile Gly Clu Ala Lys Gln Gly Cln Gln Gln Asp Glu Val Ile 50 55 60
Ile Ala Val Gly Pro Ala Phe Cly Leu Ser Gln Thr Val Asn Ile Val 65 70 75 80 Cly Ile Pro His Lys Ser Ile Leu Arg Glu Val Ile Ala Gly Ile Glu 85 90 95
Glu Glu Gly Val Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp 100 105 110
Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Gly Ser Gly Ile 115 120 125
Ser Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly 130 135 140
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu 145 150 155 160
Thr Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala 165 170 175
Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala 180 185 190
Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr 195 200 205
Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu 210 215 220
<210> 262
<211> 194
<212> PRT
<213> não identificada
<400> 262
Met Glu Cys Thr Ile Glu Arg Lys Pro Val Phe Ile Leu Gln Val Ser 1 5 10 15
Glu Gly Glu Ala Ala Lys Ala Gly Asp Arg Ala Asp Glu Val Val Ile 20 25 30
Gly Val Gly Pro Ala Phe Asp Lys Tyr Gln His Lys Thr Leu Ile Asp 35 40 45
Met Pro His Lys Ala Ile Leu Lys Glu Leu Val Ala Gly Ile Glu Glu 50 55 60 Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val 65 70 75 80
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly 85 90 95
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu 100 105 110
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr 115 120 125
kLeu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg 130 135 140
Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg 145 150 155 160
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys 165 170 175
His Val Val Gln Asp Ala Ala Pro Val Thr Leu His Ile Ala Leu Val 180 185 190
Lys Glu
<210> 263 <211> 194 <212> PRT
<213> não identificada
<400> 263
Met Glu Cys Thr Thr Glu Arg Lys Pro Val Phe Thr Leu Gln Val Ser 1 5 10 15
Glu Gly Glu Ala Ala Lys Ala Asp Asp Arg Ala Asp Glu Val Val Ile 20 25 30
Gly Val Gly Pro Ala Phe Asp Lys Tyr Gln His Lys Thr Leu Ile Asp 35 40 45
Met Pro His Lys Ala Ile Leu Lys Glu Leu Val Ala Gly Ile Glu Glu 50 55 60 Clu Cly Leu His Ala Arg Val Val Arg Val Leu Arg Thr Ser Asp Val 65 70 75 80
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly 85 90 95
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu 100 105 110
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr 115 120 125
Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg 130 135 140 Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg 145 150 155 160
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys 165 170 175
His Val Val Gln Asp Ala Ala Pro Val Thr Leu His Ile Ala Leu Val 180 185 190
Arg Glu
<210> 264 <211> 194 <212> PRT
<213> não identificada
<400> 264
Met Glu Cys Thr Thr Clu Arg Lys Pro Val Phe Thr Leu Gln Val Ser 1 5 10 15 Clu Cly Glu Ala Ala Lys Ala Asp Glu Arg Val Asp Glu Val Val Ile 20 25 30
Gly Val Gly Pro Ala Phe Asp Lys Tyr Gln His Lys Thr Leu Ile Asp 35 40 45
Met Pro His Asn Ala Ile Leu Lys Glu Leu Val Ala Gly Ile Glu Glu 50 55 60 Glu Cly Leu His ATa Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val 65 70 75 80
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly 85 90 95
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu 100 105 110
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr 115 120 125
Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg 130 135 140
Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg 145 150 155 160
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys 165 170 175
His Val Val Gln Asp Ala Ala Pro Val Thr Leu His Ile Ala Leu Val 180 185 190
Arg Glu
<210> 265 <211> 188 <212> PRT
<213> CTostridium perfringens
<400> 265
Met Glu Glu Arg Thr Phe Ile Pro Glu Ile Thr Val Glu Glu Val Gly 1 5 10 15
Glu Ala Lys Val Gly Leu Arg Ser Asp Glu Val Val Ile Gly Leu Ala 20 25 30
Pro Ala Phe Leu Lys Tyr Gln Asn Lys Thr Ile Val Asp Val Pro His 35 40 45
Thr Glu Thr Leu Leu Glu Ile Ile Ala Gly Ile Glu Glu Glu Gly Leu 50 55 60 His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val Ser Phe Ile 65 70 75 80
Ala His Asp Ala Ala Cys Leu Ser Cly Ser Gly Ile Gly Ile Gly Ile 85 90 95
Gln Ser Lys Gly Thr Thr Val Ile His Gln Lys Asp Leu Leu Pro Leu 100 105 110
Asn Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr Pro Glu Thr 115 120 125
kTyr Arg Leu Ile Gly Lys Asn Ala Ala Lys Tyr Ala Lys Gly Glu Ser 130 135 140
Pro Thr Pro Val Pro Val Lys Asn Asp Gln Met Val Arg Pro Lys Phe 145 150 155 160
Met Ala Lys Ala Ala Leu Leu His Ile Lys Glu Thr Lys His Val Glu 165 170 175
Pro Cly Lys Lys Pro Val Gln Leu Glu Val Lys Phe 180 185
<210> 266 <211> 146 <212> PRT
<213> não identificada
<400> 266
Met Pro His Gly Ala Ile Leu Lys Glu Leu Ile Ala Gly Val Glu Glu 1 5 10 15
Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val 20 25 30
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly 35 40 45
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu 50 55 60
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr 65 70 75 80 Leu Glu Thr Tyr Arg Cln Ile Cly Lys Asn Ala Ala Arg Tyr Ala Arg 85 90 95
Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg 100 105 110
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys 115 120 125
His Val Val Gln Asp Ala Glu Pro Val Thr Leu His Ile Asp Leu Val 130 135 140
Arg Glu 145
<210> 267 <211> 148 <212> PRT
<213> Escherichia blattae <400> 267
Met Pro His Lys Ala Ile Ile Lys Clu Leu Val Ala Cly Val Glu Glu 1 5 10 15
Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val 20 25 30
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly 35 40 45
Ile Gly Ile Cln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu 50 55 60
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr 65 70 75 80
Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg 85 90 95
Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg 100 105 110
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys 115 120 125 His Val Val Ala Asp Ala Lys Pro Ala Thr Leu Asn Ile Glu Ile Thr 130 135 140
Arg Glu Glu Ala 145
<210> 268 <211> 172 <212> PRT
<213> não identificada
<400> 268
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Arg 1 5 10 15
Met Asn Ser Leu Gln Gly Glu Thr Val Thr Pro Ser Ala Thr Val Ser 20 25 30
Ser Thr His Thr Ala Lys Val Thr Asp Tyr Pro Leu Ala Asn Lys His 35 40 45
Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe Thr 50 55 60
Leu Glu Asn Val Leu Ser Asn Lys Val Thr Ala Gln Asp Met Arg Ile 65 70 75 80
Thr Pro Glu Thr Leu Arg Leu Gln Ala Glu Ile Ala Lys Asp Ala Gly 85 90 95
Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu Thr Ala 100 105 110
Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro Tyr 115 120 125
Arg Ser Thr Lys Asp Glu Leu Met Ala Ile Ala Asp Asp Leu Glu Asn 130 135 140
Arg Tyr Gln Ala Lys Ile Cys Ala Ala Phe Val Arg Glu Ala Ala Val 145 150 155 160
Leu Tyr Val Glu Arg Lys Lys Leu Lys Gly Asp Asp 165 170
<210> 269 <211> 121 <212> PRT
<213> não identificada
<400> 269
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Arg 1 5 10 15
Met Asn Ser Leu Gln Gly Glu Thr Val Thr Pro Ala Ala Thr Gly Ser 20 25 30
Ser Ala His Thr Ala Lys Val Thr Asp Tyr Pro Leu Ala Asn Lys His 35 40 45
Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe Thr 50 55 60
Leu Glu Asn Val Leu Ser Asn Lys Val Thr Ala Gln Asp Met Arg Ile 65 70 75 80
Thr Pro Glu Thr Leu Arg Ile Gln Ala Asp Ile Ala Lys Asp Ala Gly 85 90 95
Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu Thr Ala 100 105 110
Val Pro Asp Asp Arg Ile Leu Glu Val 115 120
<210> 270 <211> 170 <212> PRT
<213> Listeria monocytogenes <400> 270
Met Asn Gln Glu Ala Leu Glu Asn Met Val Arg Asn Ile Leu Gln Glu 1 5 10 15
Val Asn Ser Gly Ala Val Ser Thr Thr Thr Ser Gln Lys Val Ser Gly 20 25 30
Asp Thr Leu Thr Val Arg Asp Tyr Pro Leu Gly Thr Lys Arg Pro Glu 35 40 45
Leu Val Lys Thr Ser Thr Ser Lys Ser Leu Asp Asp Ile Thr Leu Lys 50 55 60 Ser Val Leu Asp Gly Thr Ile Lys Pro GTu Asp VaT Arg Val Thr Ala 65 70 75 80
Glu Thr Leu Lys Met Gln ATa Gln Val Ala Arg Asp Ala GTy Arg ATa 85 90 95
Thr Leu ATa Asn Asn Phe GTu Arg Ala Ala GTu Leu Thr Ile Val Pro 100 105 110
Asp Glu Arg Ile Leu Glu Ile Tyr Asn ATa Met Arg Pro Tyr Arg Ser 115 120 125
Ser Arg GTu GTu Leu Leu Ala ITe ATa Asp Glu Leu Glu Ser VaT Tyr 130 135 140
His ATa Thr ITe Cys Ser Asn Tyr VaT Arg Glu ATa Thr GTn Leu Tyr 145 150 155 160
GTn GTu Arg Lys
Lys Leu Lys Gly Asp Asn 165 170
<210> 271
<211> 142
<212> PRT
<213> não identificada
<400> 271
Met Asn Asp Asn Ile Met Thr Ala Gln Asp Tyr Pro Leu ATa Thr Arg 1 5 10 15
Cys Pro GTu Lys Ile Leu Thr Pro Thr Gly Lys Pro Leu Thr Asp Ile 20 25 30
Thr Leu Glu Asn VaT Leu Ala Gly Arg Val Gly Pro Gln Asp VaT Arg 35 40 45
ITe Ser Gln Gln Thr Leu Glu Tyr Gln Ala Gln Ile ATa Glu Gln Met 50 55 60
Gln Arg His Ala Val Ala Arg Asn Phe Arg Arg ATa ATa Glu Leu Ile 65 70 75 80
Ala Ile Pro Asp Ala Arg ITe Leu Glu ITe Tyr Asn Ala Leu Arg Pro
85 90 95
Phe Arg Ser Ser Leu Ala Glu Leu Leu Ala Ile ATa Asp Glu Leu Glu 100 105 110 His Thr Trp His Ala Thr Val Asn Ala Gly Phe Val Arg Glu Ser Ala 115 120 125
Glu Val Tyr Gln Gln Arg Asn Lys Leu Arg Lys Gly Ser Gln I3O 135 140
<210> 272 <211> 142 <212> PRT
<213> não identificada
<400> 272
Met Asn Glu Asn Ile Met Thr Ala Gln Asp Tyr Pro Leu Ala Thr Arg 1 5 10 15
Cys Pro Glu Lys Ile Leu Thr Pro Thr Gly Lys Pro Leu Thr Asp Ile 20 25 30
Thr Leu Glu Asn Val Leu Ala Gly Arg Val Gly Pro Gln Asp Val Arg 35 40 45
Ile Ser Gln Gln Thr Leu Glu Tyr Gln Ala Gln Ile Ala Glu Gln Met 50 55 60
Gln Arg His Ala Val Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile 65 70 75 80
Ala Ile Pro Asp Ala Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro 85 90 95
Phe Arg Ser Ser Phe Thr Glu Leu Gln Ala Ile Ala Asp Glu Leu Glu 100 105 110
His Thr Trp His Ala Thr Val Asn Ala Gly Phe Val Arg Glu Ser Ala 115 120 125
Asp Val Tyr Gln Gln Arg Asn Lys Leu Arg Lys Gly Ser Gln 130 135 140
<210> 273
<211> 142
<212> PRT
<213> não identificada
<400> 273
Met Asn Asp Asn Ile Met Thr Ala Gln Asp Tyr Pro Leu Ala Thr Arg 1 5 10 15 Cys Pro Glu Lys Ile Gln Thr Pro Thr Gly Lys Pro Leu Thr Glu Ile 20 25 30
Thr Leu Glu Asn Val Leu Ala Gly Arg Val Gly Pro Gln Asp Val Arg 35 40 45
Ile Ser Gln Gln Thr Leu Glu Tyr Gln Ala Gln Ile Ala Glu Gln Met 50 55 60
Gln Arg His Ala Val Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile 65 70 75 80
Ala Ile Pro Asp Ala Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro 85 90 95
Phe Arg Ser Ser Phe Ala Glu Leu Gln Ala Ile Ala Asp Glu Leu Glu 100 105 110
His Thr Trp His Ala Thr Val Asn Ala Gly Phe Val Arg Glu Ser Ala 115 120 125
Glu Val Tyr Gln Gln Arg Asn Lys Leu Arg Lys Gly Ser Gln 130 135 140
<210> 274 <211> 170 <212> PRT
<213> Listeria monocytogenes <400> 274
Met Asn Gln Glu Ala Leu Glu Asn Met Val Arg Asn Ile Leu Gln Glu 1 5 10 15
Val Asn Ser Gly Ala Val Ser Thr Thr Thr Ser Gln Lys Val Ser Gly 20 25 30
Asp Thr Leu Thr Val Arg Asp Tyr Pro Leu Gly Thr Lys Arg Pro Glu 35 40 45
Leu Val Lys Thr Ser Thr Ser Lys Ser Leu Asp Asp Ile Thr Leu Lys 50 55 60
Ser Val Leu Asp Gly Thr Ile Lys Pro Glu Asp Val Arg Val Thr Val
65 70 75 80
Glu Thr Leu Lys Met Gln Ala Gln Val Ala Arg Asp Ala Gly Arg Ala 85 90 95 Thr Leu Ala Asn Asn Phe Glu Arg Ala Ala Glu Leu Thr Ile Val Pro 100 105 110 Asp Glu Arg Ile Leu Glu Ile Tyr Asn Ala Met Arg Pro Tyr Arg Ser 115 120 125 Ser Arg Glu Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu Ser Val Tyr 130 135 140 His Ala Thr Ile Cys Ser Asn Tyr Val Arg Glu Ala Ala Gln Leu Tyr 145 150 155 160 Gln Glu Arg Lys Lys Leu Lys Gly Asp Asn 165 170 <210> 275 <211> 2432 <212> DNA
<213> Erwinia caratovora subespécie atroseptica
<400> 275
atgtctgacg gacgactcac cgcacttttt cctgcattcc cacacccggc gtccaatcag 60
cccgtatttg ccgaggcttc accgcacgac gacgagttaa tgacgcaggc cgtaccgcag 120
gtttcctgtc agcaggcgtt ggcgattgcg cagcaagaat atggcttgtc tgggcagatg 180
tcgctgcttc agggcgagcg tgatgtgaat ttctgtctga cggtgacgcc agatgaacgc 240
tacatgctga aagtcatcaa tgcggcagaa cctgccgacg tcagcaattt ccaaaccgcg 300
ctgctgctgc atcttgcccg tcaggcacct gaactgcccg taccgcgtat caggtcgaca 360
aaagcgggtc agtcggaaac aggcgttgag atcgatggtg tactgctgcg tgtgcggctt 420
gtgagctatc tggcaggaat gccgcagtat ctggcctcac cgtcaacggc gctgatgccg 480
cagttggggg gaacgctggc gcagttggat aacgcgcttc acagctttac gcatccggcg 540
gcaaaccgtg cgctgctgtg ggatatcagc cgggcagagc aggtgcgtcc ttacctcgat 600
ttcgtttctg aaccgcagca gtatcagcat cttcagcgta tttttgaccg ttatgacagt 660
aacgttgctc ctctgttgac gacgctacgt cgtcaggtca ttcataacga tctgaatccg 720
cataacgtgc tggtggatgg atcgtcgccg acgcgggtta ctggcattat cgattttggc 780
gatgccgtat ttgccccgtt aatttgcgaa gtcgcgacgg cactggcgta tcagatcggc 840
gatggaaccg atttgttgga gcatgttgtg ccgtttgttg cggcctatca ccaacgcatt 900
ccgttagcac cggaggagat tgcgctgtta cccgatctga tagcgacccg tatggcgctg 960
accctgacca ttgcgcagtg gcgagcatcg cgttatcccg acaatcggga gtatctgctg 1020 cgtaacgtgc cgcgctgttg gcacagtttg cagcgcattg tttttgactc gcctacagca ggtttgcccg gagaatgcgc cgtctatgac gtctgaaatg acagcgacag aagctttgct tgggcggcgg ttatcgcctg ttttatgaag agccgctgca tgtggctgtt cgatcaccaa gggaaacgtt atctggatgt tcggacattg ccaccccgcg gtggttgaag ccgtggcgcg cccacacgcg ctatttgcac cacgcgattg tcgattttgc ttcccgccga attgaacaat gtaatgctga cctgtaccgg cgctgcgtat cgcccgacat gtcacgggcg ggacggggat atcacggcgt gaccagcgcg ctggcggaac tgtctccgtc gcggtagcca tgtgaagctg atcgacgcgc cagacactta ttaccagcat tcgtgaagcg ctggcgcaga tgcaacggga tgctggtaga taccattttt tccagcgatg gcgtgttctg cacaggcggc ggcgttgatc cgtcaggcgg gcgggctgtt cgggcttcgg gcgcaccggg gaatcactgt ggggctttgc atttggtgag tctagggaaa ccgatgggca acggacatcc gttccgctct gttcgacgca tttgggcgcg atgtgcgcta atccggtttc ctgtcaggcg gcgcacgcgg tgctgcgggt agcagaatgc ccagcgggtc ggtgattatc tgcggcaagg atttcccgct gattggtgat attcgggctt acggcctgtt gcgatcgcga aagtaaaacg ccggcaagtg aatccgcgtt gccaacgtgg tgtgctcatc agcgcgacgg ggccagcggc cgccgctggt gtttctggaa gaacacgccg atgtgttctt tagcgctcat cggcactcgt gcacagagat aa
cgacctattc ccatgcgcaa 1080 gatgaaccag aaaggaatga 1140 ggcgcgccgt cagcgagtgt 1200 tgtcgcgcgc ggcgagggcg 1260 ctacaataat gtggcttcgg 1320 acagagcgca caactcaata 1380 ggaagatttg ctgagcgaat 1440 cagtgaggct aacgatctgg 1500 gttggtgacg cgctgggcgt 1560 gctgggggat ggcgttgtgc 1620 tcgtcagccc ggtgcatttc 1680 aggtattcgt cctgcggcgc 1740 tgcgccggaa ggcgaaatgg 1800 tattgcggat gaagtgcagc 1860 gcgccacaat gtcgtccctg 1920 catcgctgga ttggtggggc 1980 tttcaatacc tttggcggca 2040 gattcgggaa gagcagttgc 2100 gttgcagcaa ctggcgcagc 2160 tattggtgcg gagctggtca 2220 gcaggtggtg aatgcgatgc 2280 gaacatactg aaaattcgcc 2 340 aaccacgctg agtgacgttt 2400 2432
Claims (43)
1. CÉLULA HOSPEDEIRA MICROBIANA RECOMBINANTE, caracterizada pelo fato de que compreende pelo menos uma molécula de DNA que codifica um polipeptídeo que catalisa um substrato para produzir a conversão selecionada do grupo consistindo em: i) piruvato para alfa-acetolactato; ii) alfa-acetolactato para acetoína; i) acetoína para 2,3-butanodiol; iii) 2,3-butanodiol para 2-butanona; e iv) 2-butanona para 2-butanol; sendo que pelo menos uma molécula de DNA é heteróloga à dita célula hospedeira microbiana e sendo que a dita célula hospedeira microbiana produz 2-butanol.
2. CÉLULA HOSPEDEIRA MICROBIANA RECOMBINANTE, caracterizada pelo fato de que compreende pelo menos uma molécula de DNA que codifica um polipeptídeo que catalisa um substrato para produzir a conversão selecionada do grupo consistindo em: i) piruvato para alfa-acetolactato; ii) alfa-acetolactato para acetoína; iii) acetoína para 2,3-butanodiol; e iv) 2,3-butanodiol para 2-butanona: sendo que pelo menos uma molécula de DNA é heteróloga à dita célula hospedeira microbiana e sendo que a dita célula hospedeira microbiana produz 2-butanona.
3. CÉLULA HOSPEDEIRA, de acordo com as reivindicações 1 ou .2, caracterizada pelo fato de que o polipeptídeo que catalisa um substrato para produzir a conversão de piruvato em alfa-acetolactato é acetolactato sintase.
4. CÉLULA HOSPEDEIRA, de acordo com as reivindicações 1 ou 2, caracterizada pelo fato de que o polipeptídeo que catalisa um substrato para produzir a conversão de alfa-acetolactato em acetoína é acetolactato descarboxilase.
5. CÉLULA HOSPEDEIRA, de acordo com as reivindicações 1 ou 2, caracterizada pelo fato de que o polipeptídeo que catalisa um substrato para produzir a conversão de acetoína em 2,3-butanodiol é butanodiol desidrogenase.
6. CÉLULA HOSPEDEIRA, de acordo com as reivindicações 1 ou .2, caracterizada pelo fato de que o polipeptídeo que catalisa um substrato para produzir a conversão de 2,3-butanodiol em 2-butanona é diol desidratase ou glicerol desidratase.
7. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 1, caracterizada pelo fato de que o polipeptídeo que catalisa um substrato para produzir a conversão de 2-butanona em 2-butanol é butanol desidrogenase.
8. CÉLULA HOSPEDEIRA, de acordo com as reivindicações 1 ou 2, caracterizada pelo fato de ser selecionada do grupo que consiste em: uma bactéria, uma cianobactéria, um fungo filamentoso e uma levedura.
9. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 8, caracterizada pelo fato de ser membro de um gênero selecionado do grupo consistindo em Clostrídium, Zymomonas, Escheríchia, Salmonella, Rhodococcusj Pseudomonas, Bacillus, Lactobacillus, Enterococcus, Pediococcus, Alcaiigenes1 Kiebsieiia, Paenibacilius, Arthrobaeter, Corynebaeterium, Brevibaeteriumj Pichia, Candida, Hansenuia e Saeeharomyees.
10. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 3, caracterizada pelo fato de que a acetolactato sintase tem uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 4, SEQ ID n° 77 e SEQ ID n° 79 com base no método de alinhamento Clustal W usando os parâmetros predeterminados de GAP PENALTY=10, GAP LENGTH PENALTy=O,1 e séries de matriz de peso de proteína Gonnet 250.
11. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 4, caracterizada pelo fato de que a acetolactato descarboxilase tem uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 2, SEQ ID n° 81, e SEQ ID n° 83 com base no método de alinhamento Clustal W usando os parâmetros predeterminados de GAP PENALTY=101 GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250.
12. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 5, caracterizada pelo fato de que a butanodiol desidrogenase tem uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 6, SEQ ID n° 85, SEQ ID n° 87 e SEQ ID n° 89 com base no método de alinhamento Clustal W usando os parâmetros predeterminados de GAP PENALTY=10, GAP LENGTH PENALTy=O, 1 e séries de matriz de peso de proteína Gonnet 250.
13. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 6, caracterizada pelo fato de que a diol desidratase ou glicerol desidratase compreendem subunidades grandes, médias e pequenas de comprimento total e cada uma tem um parâmetro E-Valor de 0,01 ou menos quando pesquisada usando um perfil Hidden Markov Model1 preparado com o uso das subunidades grandes das SEQ ID n° 8, 99, 105, 135, 138, 141, 146 e 164; das subunidades média das SEQ ID n° 10, 101, 107, 136, 139, 142, 148 e .165; e das subunidades pequenas das SEQ ID n° 12, 103, 109, 137, 140, .143, 150 e 166, sendo que cada pesquisa é executada usando-se o algoritmo hmmsearch com o parâmetro Z ajustado em 1 bilhão.
14. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 6, caracterizada pelo fato de que a diol desidratase ou a glicerol desidratase é identificada por meio de um processo que compreende as etapas de: a) gerar um perfil "Hidden Markov Model" a partir do alinhamento da seqüência de aminoácidos correspondendo às subunidades grandes, médias e pequenas das enzimas de diol e glicerol desidratase, sendo que: i) A subunidade grande compreende uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 8, 99, 105, 135, .138, 141, 146 e 164; ii) A subunidade média compreende uma seqüência de aminoácidos selecionado do grupo consistindo em SEQ ID n° 10, 101, 107, .136, 139, 142, 148 e 165; e iii) A subunidade pequena compreende uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 12, 103, 109, .137, 140, 143, 150 e166; b) pesquisar pelo menos uma base de dados pública de seqüências de proteína contendo seqüências de diol e glicerol desidratases com o perfil "Hidden Markov Model" de (a) usando o algoritmo hmmsearch no qual o parâmetro Z é ajustado em 1 bilhão e o parâmetro E-Valor é ajustado em 0,01, para identificar um primeiro conjunto de dados de seqüências de aminoácidos de diol e glicerol desidratase; e c) remover quaisquer seqüências parciais do primeiro conjunto de dados de (b) para gerar um segundo conjunto de dados de seqüências de aminoácidos de diol e glicerol desidratases, no qual as enzimas de diol desidratase e de glicerol desidratase são identificadas.
15. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 6, caracterizada pelo fato de que a diol desidratase ou glicerol desidratase compreendem uma subunidade grande que compreende uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 8, 93, 99, 105, .135, 138, 141, 146, 164, 167, 170, 173, 176, 179, 182, 185, 188, 191, 194, 197, .200, 203, 206, 209, 212, 215, 218, 221, 224, 227, 130, 243, 254, 255, 256, 257, .258 e 259, com base no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e séries de matriz de peso de proteína Gonnet 250.
16. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 6, caracterizada pelo fato de que a diol desidratase ou glicerol desidratase compreendem uma subunidade média que compreende uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID n° 10, 95, 101, 107, .136, 139, 142, 148, 165, 168, 171, 174, 177, 180, 183, 186, 189, 192, 195, 198, .201, 204, 207, 210, 213, 216, 219, 222, 225, 228, 231, 244, 250, 252, 260, 261, .262, 263, 264, 265, 266 e 167 com base no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e as séries de matriz de peso de proteína Gonnet 250.
17. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 6, caracterizada pelo fato de que a diol desidratase ou glicerol desidratase compreendem uma subunidade pequena que compreende uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID n° 12, 97, 103, .109, 137, 140, 143, 150, 166, 169, 172, 175, 178, 181, 184, 187, 190, 193, .196, 199, 202, 205, 208, 211, 214, 217, 220, 223, 226, 229, 232, 234, 236, .238, 240, 242, 245, 248, 249, 251, 253, 268, 270, 271, 272, 273 e 274, com base no método de alinhamento Clustal W usando os parâmetros pré- estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e nas séries de matriz de peso de proteína Gonnet 250.
18. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 6, caracterizada pelo fato de que a diol desidratase ou glicerol desidratase compreendem subunidades grande, média e pequena unidas, que compreendem uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID n° 233, 235, 237, 239, 241, 246 e 247, com base no método de alinhamento Clustal W usando os parâmetros pré-estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e nas séries de matriz de peso de proteína Gonnet 250.
19. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 6, caracterizada pelo fato de que a diol desidratase ou glicerol desidratase compreendem subunidades grande, média e pequena unidas e têm pelo menos 95% de identidade com uma seqüência de aminoácidos que compreende todas as três seqüências de aminoácidos que codificam subunidades grandes, pequenas e médias, selecionadas do grupo que consiste em: a) SEQ IDn0 8, SEQ IDn0 IOeSEQ IDn0 12; b) SEQ ID n° 93, SEQ ID n° 95 e SEQ ID n° 97; c) SEQ ID n° 99, SEQ ID n° 101, e SEQ ID n° 103; d) SEQ ID n° 105, SEQ ID n° 107 e SEQ ID n° 109 e) SEQ ID n° 135, SEQ ID n° 136 e SEQ ID n° 137 0 SEQ ID n° 138, SEQ ID n° 139 e SEQ ID n° 140 g) SEQ ID n° 146, SEQ ID n° 148 e SEQ ID n° 150 h) SEQ ID n° 141, SEQ ID n° 142 e SEQ ID n° 143 i) SEQ ID n° 164, SEQ ID n° 165 e SEQ ID n° 166 com base no método de alinhamento Clustal W e com o uso dos parâmetros predeterminados de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e das séries de matriz de peso de proteína Gonnet 250.
20. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 7 caracterizada pelo fato de que a butanol desidrogenase tem uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 14, SEQ ID n° .72, SEQ ID n° 75 e SEQ ID n° 91 com base no método de alinhamento Clustal W e com o uso dos parâmetros predeterminados de GAP PENALTY=10, GAP LENGTH PENALTy=O, 1 e das séries de matriz de peso de proteína Gonnet .250.
21. MÉTODO PARA PRODUÇÃO DE 2-BUTANOL, caracterizado pelo fato de que compreende: (1) fornecer uma célula hospedeira microbiana recombinante que compreende pelo menos uma molécula de DNA que codifica um polipeptídeo que catalisa um substrato para produzir a conversão selecionada do grupo consistindo em: i) piruvato para alfa-acetolactato; ii) alfa-acetolactato para acetoína; iii) acetoína para 2,3-butanodiol; iv) 2,3-butanodiol para 2-butanona; e v) 2-butanona para 2-butanol; sendo que a pelo menos uma molécula de DNA é heteróloga à dita célula hospedeira microbiana; (2) colocar a célula hospedeira de (1) em contato com um substrato fermentável de carbono em um meio de fermentação nas condições em que o 2-butanol é produzido.
22. MÉTODO PARA PRODUÇÃO DE 2-BUTANONA, caracterizado pelo fato de que compreende: (1) fornecer uma célula hospedeira microbiana recombinante que compreende pelo menos uma molécula de DNA que codifica um polipeptídeo que catalisa um substrato para produzir a conversão selecionada do grupo consistindo em: i) piruvato para alfa-acetolactato; ii) alfa-acetolactato para acetoína; iii) acetoína para 2,3-butanodiol; e ív) 2,3-butanodiol para 2-butanona: sendo que a pelo menos uma molécula de DNA é heteróloga à dita célula hospedeira microbiana; 2) colocar a célula hospedeira de (1) em contato com um substrato fermentável de carbono em um meio de fermentação nas condições em que a 2-butanona é produzida.
23. MÉTODO, de acordo com as reivindicações 21 ou 22, caracterizado pelo fato de que o substrato de carbono fermentável é selecionado do grupo que consiste em monossacarídeos, oligossacarídeos e poiissacarídeos.
24. MÉTODO, de acordo com as reivindicações 21 ou 22, caracterizado pelo fato de que o polipeptídeo que catalisa um substrato para produzir a conversão de piruvato em alfa-acetolactato é acetolactato sintase.
25. MÉTODO, de acordo com as reivindicações 21 ou 22, caracterizado pelo fato de que o polipeptídeo que catalisa um substrato para produzir a conversão de alfa-acetolactato em acetoína é acetolactato descarboxilase.
26. MÉTODO, de acordo com as reivindicações 21 ou 22, caracterizado pelo fato de que o polipeptídeo que catalisa um substrato para produzir a conversão de acetoína em 2,3-butanodiol é butanodiol desidrogenase.
27. MÉTODO, de acordo com as reivindicações 21 ou 22, caracterizado pelo fato de que o polipeptídeo que catalisa um substrato para produzir a conversão de 2,3-butanodiol em 2-butanona é diol desidratase ou glicerol desidratase.
28. MÉTODO, de acordo com a reivindicação 21, caracterizado pelo fato de que o polipeptídeo que catalisa um substrato para produzir a conversão de 2-butanona em 2-butanol é butanol desidrogenase.
29. MÉTODO, de acordo com as reivindicações 21 ou 22, caracterizado pelo fato de que a célula é selecionada do grupo que consiste em: uma bactéria, uma cianobactéria, um fungo filamentoso e uma levedura.
30. MÉTODO, de acordo com a reivindicação 29, caracterizado pelo fato de que a célula é membro de um gênero selecionado do grupo consistindo em Clostridium, Zymomonas, Escherichia, Saimonella, Rhodococcus, Pseudomonas, BaciHusl Lactobacillus, Enterococcus, Pediococcus, Alcaiigenes, Klebsiella, Paenibacfflus, Arthrobacterj Corynebacterium, Brevibacterium, Pichia, Candida, Hansenuia e Saccharomyces.
31. MÉTODO, de acordo com a reivindicação 24, caracterizado pelo fato de que a acetolactato sintase tem uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 4, SEQ ID n° 77 e SEQ ID n° .79 com base no método de alinhamento Clustal W com o uso dos parâmetros predeterminados de GAP PENALTY=10, GAP LENGTH PENALTy=O1 1 e das séries de matriz de peso de proteína Gonnet 250.
32. MÉTODO, de acordo com a reivindicação 25, caracterizado pelo fato de que a acetolactato descarboxilase tem uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 2, SEQ ID n° 81, e SEQ ID n° 83 com base no método de alinhamento Clustal W e com o uso dos parâmetros predeterminados de GAP PENALTY= 10, GAP LENGTH PENALTY=0,1 e das séries de matriz de peso de proteína Gonnet 250.
33. MÉTODO, de acordo com a reivindicação 26, caracterizado pelo fato de que a butanodiol desidrogenase tem uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo consistindo em seq ID n° 6, seq ID n° 85, seq ID n° 87 e seq ID n° 89 com base no método de alinhamento Clustal W e com o uso dos parâmetros predeterminados de GAP PeNALTY=IO1 GAP LENGTH PENALTY=0,1 e das séries de matriz de peso de proteína Gonnet .250.
34. MÉTODO, de acordo com a reivindicação 27, caracterizado pelo fato de que a diol desidratase ou glicerol desidratase compreendem subunidades grandes, médias e pequenas de comprimento total e cada uma tem um parâmetro E-Valorde 0,01 ou menos quando pesquisada usando-se um perfil Hidden Markov Model, preparado com o uso das subunidades grandes das SEQ ID n° 8, 99, 105, .135, 138, 141, 146 e 164; das subunidades médias das SEQ ID n° 10, 101, 107, .136, 139, 142, 148 e 165, e das subunidades pequenas das SEQ ID n° 12, 103, .109, 137, 140, 143, 150 e 166, cada pesquisa sendo executada usando-se o algoritmo hmmsearch com o parâmetro Z ajustado em 1 bilhão.
35. MÉTODO, de acordo com a reivindicação 27, caracterizado pelo fato de que a diol desidratase ou a glicerol desidratase é identificada por meio de um processo que compreende as etapas de: a) gerar um perfil "Hidden Markov Model" a partir do alinhamento da seqüência de aminoácidos correspondendo às subunidades grande, média e pequena das enzimas diol e glicerol desidratase, sendo que: i) A subunidade grande compreende uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID n° 8, 99, 105, 135, .138, 141, 146 e 164; ii) A subunidade média compreende uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID n° 10, 101, 107, .136, 139, 142, 148 e 165; e iii) A subunidade pequena compreende uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID n° 12, 103, 109, .137, 140, 143, 150e166; b) pesquisar pelo menos uma base de dados pública de seqüências de proteína contendo seqüências de diol e gücerol desidratases com o perfil "Hidden Markov Model" de (a) usando o algoritmo hmmsearch com o parâmetro Z ajustado em um 1 bilhão e o parâmetro E-Valor ajustado em .0,01, para identificar um primeiro conjunto de dados de seqüências de aminoácidos de diol e glicerol desidratase; e c) remover quaisquer seqüências parciais do primeiro conjunto de dados de (b) para gerar um segundo conjunto de dados de seqüências de aminoácidos de diol e glicerol desidratases no qual as enzimas de diol desidratase e de glicerol desidratase são identificadas.
36. MÉTODO, de acordo com a reivindicação 27, caracterizado pelo fato de que a diol desidratase ou glicerol desidratase compreendem uma subunidade grande que compreende uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID n° 8, 93, 99, 105, 135, 138, .141, 146, 164, 167, 170, 173, 176, 179, 182, 185, 188, 191, 194, 197, 200, 203, .206, 209, 212, 215, 218, 221, 224, 227, 130, 243, 254, 255, 256, 257, 258 e .259, com base no método de alinhamento Clustal W e com o uso dos parâmetros pré-estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e das séries de matriz de peso de proteína Gonnet 250.
37. MÉTODO, de acordo com a reivindicação 27, caracterizado pelo fato de que a diol desidratase ou glicerol desidratase compreendem uma subunidade média que compreende uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID n° 10, 95, 101, 107, 136, 139, 142, 148, 165, .168, 171, 174, 177, 180, 183, 186, 189, 192, 195, 198, 201, 204, 207, 210, 213, .216, 219, 222, 225, 228, 231, 244, 250, 252, 260, 261, 262, 263, 264 265, 266 e .167 com base no método de alinhamento Clustal W e com o uso dos parâmetros pré-estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e das séries de matriz de peso de proteína Gonnet 250.
38. MÉTODO, de acordo com a reivindicação 27, caracterizado pelo fato de que a diol desidratase ou glicerol desidratase compreendem uma subunidade pequena que compreende uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo consistindo em SEQ ID n° 12, 97, 103, 109, 137, 140, 143, 150, 166, .169, 172, 175, 178, 181, 184, 187, 190, 193, 196, 199, 202, 205, 208, 211, 214, .217, 220, 223, 226, 229, 232, 234, 236, 238, 240, 242, 245, 248, 249, 251, 253, .268, 270, 271, 272, 273 e 274, com base no método de alinhamento Clustal W e com o uso dos parâmetros pré-estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e das séries de matriz de peso de proteína Gonnet 250.
39. MÉTODO, de acordo com a reivindicação 27, caracterizado pelo fato de que a diol desidratase ou glicerol desidratase compreendem subunidades grande, média e pequena unidas, que compreendem uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID n° .233, 235, 237, 239, 241, 246 e 247, com base no método de alinhamento Clustal W e com o uso dos parâmetros pré-estabelecidos de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e das séries de matriz de peso de proteína Gonnet 250.
40. MÉTODO, de acordo com a reivindicação 27, caracterizado pelo fato de que a diol desidratase ou glicerol desidratase compreendem subunidades grande, média e pequena unidas e têm pelo menos 95% de identidade com uma seqüência de aminoácidos que compreende todas as três seqüências de aminoácidos que codificam subunidades grandes, pequenas e médias, selecionadas do grupo que consiste em: a) SEQ ID n° 8, SEQ ID n° 10 e SEQ ID n° 12; b) SEQ ID n° 93, SEQ ID n° 95 e SEQ ID n° 97; c) SEQ ID n° 99, SEQ ID n° 101, e SEQ ID n° 103; d) SEQ ID n° 105, SEQ ID n° 107 e SEQ ID n° 109 e) SEQ ID n° 135, SEQ ID n° 136 e SEQ ID n° 137 f) SEQ ID n° 138, SEQ ID n° 139 e SEQ ID n° 140 g) SEQ ID n° 146, SEQ ID n° 148 e SEQ ID n° 150 h) SEQ ID n° 141, SEQ ID n° 142 e SEQ ID n° 143; e i) SEQ ID n° 164, SEQ ID n° 165 e SEQ ID n° 166; com base no método de alinhamento Clustal W e com o uso dos parâmetros predeterminados de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e das séries de matriz de peso de proteína Gonnet 250. pelo fato de que a butanol desidrogenase tem uma seqüência de aminoácidos tendo pelo menos 95% de identidade com uma seqüência de aminoácidos selecionada do grupo que consiste em SEQ ID n° 14, SEQ ID n° 72, SEQ ID n° .75 e SEQ ID n° 91 com base no método de alinhamento Clustal W e com o uso dos parâmetros predeterminados de GAP PENALTY=10, GAP LENGTH PENALTY=0,1 e das séries de matriz de peso de proteína Gonnet 250. fermentação de produto produzido pelo método conforme definido na reivindicação 21. fermentação de produto produzido pelo método conforme definido na reivindicação 22.
41. MÉTODO, de acordo com a reivindicação 28, caracterizado
42. 2-BUTANOL, caracterizado pelo fato de que contém meio de
43. 2-BUTANONA, caracterizada pelo fato de que contém meio de
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US79681606P | 2006-05-02 | 2006-05-02 | |
US60/796,816 | 2006-05-02 | ||
US87115606P | 2006-12-21 | 2006-12-21 | |
US60/871,156 | 2006-12-21 | ||
PCT/US2007/010744 WO2007130521A2 (en) | 2006-05-02 | 2007-05-02 | Fermentive production of four carbon alcohols |
Publications (1)
Publication Number | Publication Date |
---|---|
BRPI0710412A2 true BRPI0710412A2 (pt) | 2012-09-18 |
Family
ID=38668305
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0710414-6A BRPI0710414A2 (pt) | 2006-05-02 | 2007-05-02 | células hospedeiras microbianas recombinantes, método para produção de 2-butanol, método para produção de 2-butanona, 2-butanol e 2-butanona |
BRPI0710412-0A BRPI0710412A2 (pt) | 2006-05-02 | 2007-05-02 | " celulas hospedeiras microbianas recombinantes, método para produção de 2-butanol, método para produção de 2-butanona, 2-butanol e 2- butanona" |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0710414-6A BRPI0710414A2 (pt) | 2006-05-02 | 2007-05-02 | células hospedeiras microbianas recombinantes, método para produção de 2-butanol, método para produção de 2-butanona, 2-butanol e 2-butanona |
Country Status (12)
Country | Link |
---|---|
US (4) | US8962298B2 (pt) |
EP (4) | EP2010664B1 (pt) |
JP (2) | JP5315232B2 (pt) |
AU (2) | AU2007248560C1 (pt) |
BR (2) | BRPI0710414A2 (pt) |
CA (2) | CA2646641A1 (pt) |
ES (1) | ES2441182T3 (pt) |
MX (2) | MX2008013881A (pt) |
NZ (2) | NZ570930A (pt) |
RU (2) | RU2008147372A (pt) |
WO (2) | WO2007130518A2 (pt) |
ZA (1) | ZA200807718B (pt) |
Families Citing this family (193)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0612937B1 (pt) | 2005-04-12 | 2015-07-07 | Du Pont | Sistema de processamento de biomassa em bateladas e processo de tratamento de biomassa |
US20070029252A1 (en) | 2005-04-12 | 2007-02-08 | Dunson James B Jr | System and process for biomass treatment |
US8945899B2 (en) | 2007-12-20 | 2015-02-03 | Butamax Advanced Biofuels Llc | Ketol-acid reductoisomerase using NADH |
US8273558B2 (en) | 2005-10-26 | 2012-09-25 | Butamax(Tm) Advanced Biofuels Llc | Fermentive production of four carbon alcohols |
US9303225B2 (en) | 2005-10-26 | 2016-04-05 | Butamax Advanced Biofuels Llc | Method for the production of isobutanol by recombinant yeast |
US8962298B2 (en) * | 2006-05-02 | 2015-02-24 | Butamax Advanced Biofuels Llc | Recombinant host cell comprising a diol dehydratase |
US8828704B2 (en) * | 2006-05-02 | 2014-09-09 | Butamax Advanced Biofuels Llc | Fermentive production of four carbon alcohols |
US7541173B2 (en) | 2006-06-15 | 2009-06-02 | E.I. Du Pont De Nemours And Company | Solvent tolerant microorganisms and methods of isolation |
EP2084288A1 (en) | 2006-10-31 | 2009-08-05 | Metabolic Explorer | Process for the biological production of 1,3-propanediol from glycerol with high yield |
US8017364B2 (en) * | 2006-12-12 | 2011-09-13 | Butamax(Tm) Advanced Biofuels Llc | Solvent tolerant microorganisms |
AU2007332241A1 (en) * | 2006-12-15 | 2008-06-19 | Biofuelchem Co., Ltd. | Enhanced butanol producing microorganisms and method for preparing butanol using the same |
WO2008074794A1 (en) * | 2006-12-19 | 2008-06-26 | Dsm Ip Assets B.V. | Butanol production in a prokaryotic cell |
WO2008091627A2 (en) | 2007-01-22 | 2008-07-31 | Genomatica, Inc. | Methods and organisms for growth-coupled production of 3-hydroxypropionic acid |
US20100143985A1 (en) * | 2007-02-08 | 2010-06-10 | Biofuelchem Co., Ltd. | Method for preparing butanol through butyryl-coa as an intermediate using yeast |
AU2008229076B2 (en) | 2007-03-16 | 2014-05-15 | Genomatica, Inc. | Compositions and methods for the biosynthesis of 1,4-butanediol and its precursors |
MX2009011192A (es) | 2007-04-18 | 2009-10-30 | Du Pont | Produccion fermentativa de isobutanol con el uso de enzimas reductoisomerasas con alta actividad acida y cetolica. |
US20080274522A1 (en) * | 2007-05-02 | 2008-11-06 | Bramucci Michael G | Method for the production of 2-butanone |
US8426174B2 (en) * | 2007-05-02 | 2013-04-23 | Butamax(Tm) Advanced Biofuels Llc | Method for the production of 2-butanol |
US20100323426A1 (en) * | 2007-06-08 | 2010-12-23 | Bower Benjamin S | Heterologous and Homologous Cellulase Expression System |
US7947483B2 (en) | 2007-08-10 | 2011-05-24 | Genomatica, Inc. | Methods and organisms for the growth-coupled production of 1,4-butanediol |
TWI525195B (zh) * | 2007-08-10 | 2016-03-11 | 奇諾麥提卡公司 | 合成烯酸及其衍生物之方法 |
US7819976B2 (en) | 2007-08-22 | 2010-10-26 | E. I. Du Pont De Nemours And Company | Biomass treatment method |
US20090215137A1 (en) | 2007-10-31 | 2009-08-27 | Gevo, Inc. | Methods for the economical production of biofuel precursor that is also a biofuel from biomass |
US8193402B2 (en) | 2007-12-03 | 2012-06-05 | Gevo, Inc. | Renewable compositions |
CN101952398B (zh) | 2007-12-03 | 2014-05-21 | 格沃股份有限公司 | 可再生组合物 |
EP2240593A4 (en) * | 2007-12-10 | 2014-05-21 | Synthetic Genomics Inc | METHYLBUTANOL AS IMPROVED BIOCARBURANT |
EP2237679A4 (en) * | 2007-12-14 | 2014-01-01 | Abengoa Bioenergy New Technologies Inc | IMPROVED QUALITY AND VALUE OF BIO PRODUCTS OF THE ETHANOL PRODUCTION INDUSTRY |
WO2009078712A2 (en) * | 2007-12-17 | 2009-06-25 | Universiteit Van Amsterdam | Light-driven co2 reduction to organic compounds to serve as fuels or as industrial half products by an autotroph containing a fermentative gene cassette |
US20090162911A1 (en) * | 2007-12-21 | 2009-06-25 | E.I. Du Pont De Nemours And Company | Strain for butanol production |
US8518678B2 (en) * | 2007-12-21 | 2013-08-27 | Butamax(Tm) Advanced Biofuels Llc | Strain comprising increased expression of a CFA coding region for butanol production |
EP2072621A1 (en) * | 2007-12-21 | 2009-06-24 | DSM IP Assets B.V. | Solvent tolerant microorganisms |
US8372612B2 (en) * | 2007-12-21 | 2013-02-12 | Butamax(Tm) Advanced Biofuels Llc | Production of four carbon alcohols using improved strain |
WO2009094485A1 (en) | 2008-01-22 | 2009-07-30 | Genomatica, Inc. | Methods and organisms for utilizing synthesis gas or other gaseous carbon sources and methanol |
CN104357431A (zh) * | 2008-02-21 | 2015-02-18 | 巴斯夫欧洲公司 | 产生γ-氨基丁酸的方法 |
SI2262901T1 (sl) * | 2008-03-05 | 2019-02-28 | Genomatica, Inc. | Primarni alkohol producirajoči organizmi |
TWI627153B (zh) * | 2008-03-11 | 2018-06-21 | Dsm智慧財產有限公司 | 由α-酮庚二酸製備6-胺己酸之技術 |
SI2265709T1 (en) | 2008-03-27 | 2018-03-30 | Genomatica, Inc. | MICROORGANISMS FOR PREPARATION OF ADYPIC ACID AND OTHER COMPOUNDS |
WO2009128644A2 (ko) * | 2008-04-14 | 2009-10-22 | 한국과학기술원 | 게놈 수준에서의 부탄올 생산 미생물의 대사 네트워크 모델 및 이를 이용한 부탄올 생성 미생물의 대사특성분석 및 결실 표적 스크리닝 방법 |
US8188250B2 (en) | 2008-04-28 | 2012-05-29 | Butamax(Tm) Advanced Biofuels Llc | Butanol dehydrogenase enzyme from the bacterium Achromobacter xylosoxidans |
US8241877B2 (en) * | 2008-05-01 | 2012-08-14 | Genomatica, Inc. | Microorganisms for the production of methacrylic acid |
US8389252B2 (en) * | 2008-05-12 | 2013-03-05 | Butamax(Tm) Advanced Biofuels Llc | Yeast strain for production of four carbon alcohols |
WO2009143455A2 (en) | 2008-05-22 | 2009-11-26 | Microbia, Inc. | Engineering resistance to aliphatic alcohols |
JP2011522543A (ja) * | 2008-06-04 | 2011-08-04 | ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー | 二相抽出発酵を用いてブタノールを生産するための方法 |
US20100112649A1 (en) * | 2008-06-04 | 2010-05-06 | Willson Bryan Dennis | Compositions, methods and uses for growth of microorganisms and production of their products |
US8828695B2 (en) * | 2008-06-04 | 2014-09-09 | Butamax Advanced Biofuels Llc | Method for producing butanol using two-phase extractive fermentation |
JP2011522541A (ja) * | 2008-06-04 | 2011-08-04 | ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー | イソブタノールを生産するための欠失突然変異体 |
BRPI0909989A2 (pt) | 2008-06-05 | 2021-06-22 | Butamax Advanced Biofuels Llc | célula de levedura recombinante e método para a produção de um produto |
CN102317463B (zh) | 2008-06-09 | 2014-12-03 | 蓝瑟科技纽西兰有限公司 | 厌氧微生物发酵生产丁二醇 |
CA2725549A1 (en) * | 2008-06-17 | 2009-12-23 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of fumarate, malate, and acrylate |
AU2009291825B2 (en) | 2008-09-10 | 2016-05-05 | Genomatica, Inc. | Microorganisms for the production of 1,4-butanediol |
WO2010031772A2 (en) * | 2008-09-16 | 2010-03-25 | Dsm Ip Assets B.V. | Alternative butanol production process in a microbial cell |
CA2735948A1 (en) | 2008-09-29 | 2011-04-01 | Butamaxtm Advanced Biofuels Llc | Enhanced pyruvate to 2,3-butanediol conversion in lactic acid bacteria |
CA2735690A1 (en) * | 2008-09-29 | 2010-04-01 | Dennis Flint | Identification and use of bacterial [2fe-2s] dihydroxy-acid dehydratases |
EP2337856A1 (en) | 2008-09-29 | 2011-06-29 | Butamax Advanced Biofuels Llc | INCREASED HETEROLOGOUS Fe-S ENZYME ACTIIVTY IN YEAST |
CA2738452C (en) | 2008-10-03 | 2016-06-21 | Metabolic Explorer | Method for purifying an alcohol from a fermentation broth using a falling film, a wiped film, a thin film or a short path evaporator |
US20100184173A1 (en) * | 2008-11-14 | 2010-07-22 | Genomatica, Inc. | Microorganisms for the production of methyl ethyl ketone and 2-butanol |
US8652823B2 (en) | 2008-12-03 | 2014-02-18 | Butamax(Tm) Advanced Biofuels Llc | Strain for butanol production with increased membrane unsaturated trans fatty acids |
US20100144000A1 (en) * | 2008-12-04 | 2010-06-10 | E. I. Du Pont De Nemours And Company | Process for fermentive preparation fo alcohols and recovery of product |
US20100140166A1 (en) * | 2008-12-04 | 2010-06-10 | E.I. Du Pont De Nemours And Company | Process for fermentive preparation of alcohols and recovery of product |
US20100143995A1 (en) * | 2008-12-04 | 2010-06-10 | E. I. Du Pont De Nemours And Company | Process for Fermentive Preparation of Alcohols and Recovery of Product |
US20100143999A1 (en) * | 2008-12-04 | 2010-06-10 | E.I. Du Pont De Nemours And Company | Process for fermentive preparation of alcohols and recovery of product |
US20100143992A1 (en) * | 2008-12-04 | 2010-06-10 | E. I Du Pont De Nemours And Company | Process for Fermentive Preparation of Alcohols and Recovery of Product |
US20100143994A1 (en) * | 2008-12-04 | 2010-06-10 | E. I. Du Pont De Memours And Company | Process for fermentive preparation of alcohols and recovery of product |
US20100139154A1 (en) * | 2008-12-04 | 2010-06-10 | E.I. Du Pont De Nemours And Company | Process for fermentive preparation of alcohols and recovery of product |
US20100143993A1 (en) * | 2008-12-04 | 2010-06-10 | E.I. Du Pont De Nemours And Company | Process for fermentive preparationfor alcolhols and recovery of product |
BRPI0922276A2 (pt) | 2008-12-16 | 2015-08-04 | Genomatica Inc | "organismo microbiano de ocorrência não-natural, e , método para produzir isopropanol, 4-hidroxibutirato,e, 1,4-butanodiol." |
WO2010080489A1 (en) * | 2008-12-19 | 2010-07-15 | E. I. Du Pont De Nemours And Company | Ozone treatment of biomass to enhance enzymatic saccharification |
RU2405826C2 (ru) | 2008-12-29 | 2010-12-10 | Дэвон Инвестмент Лимитед | Способ получения органических растворителей, установка для его осуществления, продукт, полученный описанным способом |
US8557562B2 (en) * | 2008-12-29 | 2013-10-15 | Butamax(Tm) Advanced Biofuels Llc | Yeast with increased butanol tolerance involving filamentous growth response |
US8795992B2 (en) * | 2008-12-29 | 2014-08-05 | Butamax Advanced Biofuels Llc | Yeast with increased butanol tolerance involving cell wall integrity pathway |
US8455225B2 (en) * | 2008-12-29 | 2013-06-04 | Butamax Advanced Biofuels Llc | Yeast with increased butanol tolerance involving high osmolarity/glycerol response pathway |
WO2010081053A2 (en) | 2009-01-08 | 2010-07-15 | Codexis, Inc. | Transaminase polypeptides |
RU2405828C2 (ru) | 2009-01-29 | 2010-12-10 | Дэвон Инвестмент Лимитед | Способ получения органических растворителей |
US8614085B2 (en) | 2009-02-27 | 2013-12-24 | Butamax(Tm) Advanced Biofuels Llc | Yeast with increased butanol tolerance involving a multidrug efflux pump gene |
WO2010115054A2 (en) | 2009-04-01 | 2010-10-07 | Xylofuel, Llc | Process to produce organic compounds from synthesis gases |
JP2012523245A (ja) | 2009-04-13 | 2012-10-04 | ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー | 抽出発酵を用いてブタノールを生成するための方法 |
BRPI1013505A2 (pt) | 2009-04-30 | 2018-02-14 | Genomatica Inc | organismos para a produção de isopropanol, n-butanol, e isobutanol |
CN106119113A (zh) | 2009-04-30 | 2016-11-16 | 基因组股份公司 | 用于生产 1,3‑丁二醇的生物 |
KR102099295B1 (ko) | 2009-05-07 | 2020-04-09 | 게노마티카 인코포레이티드 | 아디페이트, 헥사메틸렌디아민 및 6-아미노카프로산의 생합성을 위한 미생물 및 방법 |
EP2429587A4 (en) | 2009-05-15 | 2014-10-08 | Genomatica Inc | ORGANISMS FOR THE PREPARATION OF CYCLOHEXANONE |
SI3392340T1 (sl) | 2009-06-04 | 2022-05-31 | Genomatica, Inc. | Mikroorganizmi za proizvodnjo 1,4-BUTANDIOLA in pripadajoči postopki |
PL3199511T3 (pl) | 2009-06-04 | 2020-05-18 | Genomatica, Inc. | Sposób oddzielania składników brzeczki fermentacyjnej |
WO2010144746A2 (en) * | 2009-06-10 | 2010-12-16 | Genomatica, Inc. | Microorganisms and methods for carbon-efficient biosynthesis of mek and 2-butanol |
BR112012002643A2 (pt) | 2009-08-05 | 2018-08-28 | Genomatica Inc | ácido tereftalático semissintético por meio de micro-organismos que produzem ácido mucônico |
SG179048A1 (en) | 2009-09-09 | 2012-04-27 | Genomatica Inc | Microorganisms and methods for the co-production of isopropanol with primary alcohols, diols and acids |
WO2011037414A2 (ko) * | 2009-09-22 | 2011-03-31 | 한국과학기술원 | 알코올 생성능이 증가된 재조합 변이 미생물 및 이를 이용한 알코올의 제조방법 |
AU2010300653B2 (en) * | 2009-09-29 | 2016-01-28 | Butamax(Tm) Advanced Biofuels Llc | Improved yeast production host cells |
US20110195505A1 (en) * | 2009-10-08 | 2011-08-11 | Butamax(Tm) Advanced Biofuels Llc | Bacterial strains for butanol production |
US8377666B2 (en) | 2009-10-13 | 2013-02-19 | Genomatica, Inc. | Microorganisms for the production of 1,4-butanediol, 4-hydroxybutanal, 4-hydroxybutyryl-coa, putrescine and related compounds, and methods related thereto |
PH12012500766A1 (en) | 2009-10-23 | 2012-11-26 | Genomatica Inc | Microorganisms for the production of aniline |
CA2779460A1 (en) * | 2009-11-23 | 2011-05-26 | Butamax(Tm) Advanced Biofuels Llc | Method for producing butanol using extractive fermentation with osmolyte addition |
IN2012DN03440A (pt) | 2009-11-23 | 2015-10-23 | Butamax Tm Advanced Biofuels | |
WO2011066076A1 (en) | 2009-11-25 | 2011-06-03 | Genomatica, Inc. | Microorganisms and methods for the coproduction of 1,4-butanediol and gamma-butyrolactone |
KR20120120493A (ko) | 2009-12-10 | 2012-11-01 | 게노마티카 인코포레이티드 | 합성 가스 또는 기타 가스상 탄소원 및 메탄올을 1,3-부탄디올로 변환하는 방법 및 변환용 유기체 |
CN102666863A (zh) | 2009-12-15 | 2012-09-12 | 思德力公司 | 从稀的水溶液中回收有机组分的方法 |
EP2519628A2 (en) | 2009-12-29 | 2012-11-07 | Butamax (TM) Advanced Biofuels LLC | Alcohol dehydrogenases (adh) useful for fermentive production of lower alkyl alcohols |
CN102741401A (zh) | 2009-12-29 | 2012-10-17 | 布特马斯先进生物燃料有限责任公司 | 己糖激酶在重组宿主细胞中的表达 |
BR112012016883A2 (pt) | 2010-01-08 | 2018-06-05 | Gevo Inc | metodos integrados de preparar produsot quimicos renovaveis |
WO2011094131A1 (en) * | 2010-01-29 | 2011-08-04 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of p-toluate and terephthalate |
US8574406B2 (en) | 2010-02-09 | 2013-11-05 | Butamax Advanced Biofuels Llc | Process to remove product alcohol from a fermentation by vaporization under vacuum |
GB2501143B (en) | 2010-02-12 | 2014-03-26 | Gevo Inc | Yeast microorganisms genetically engineered to improve isobutanol biosynthesis |
CA2788842C (en) | 2010-02-17 | 2019-03-19 | Butamax(Tm) Advanced Biofuels Llc | Improving activity of fe-s cluster requiring proteins |
US8445244B2 (en) | 2010-02-23 | 2013-05-21 | Genomatica, Inc. | Methods for increasing product yields |
US8048661B2 (en) | 2010-02-23 | 2011-11-01 | Genomatica, Inc. | Microbial organisms comprising exogenous nucleic acids encoding reductive TCA pathway enzymes |
US9023636B2 (en) | 2010-04-30 | 2015-05-05 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of propylene |
SG10201503501TA (en) | 2010-05-05 | 2015-06-29 | Genomatica Inc | Microorganisms and methods for the biosynthesis of butadiene |
US8373012B2 (en) | 2010-05-07 | 2013-02-12 | Gevo, Inc. | Renewable jet fuel blendstock from isobutanol |
US8852900B2 (en) | 2010-06-17 | 2014-10-07 | Codexis, Inc. | Biocatalysts and methods for the synthesis of (S)-3-(1-aminoethyl)-phenol |
KR20130027551A (ko) | 2010-06-17 | 2013-03-15 | 부타맥스 어드밴스드 바이오퓨얼스 엘엘씨 | 부탄올 생산을 위한 효모 생산 배양물 |
CN103003436A (zh) | 2010-06-18 | 2013-03-27 | 布特马斯先进生物燃料有限责任公司 | 来源于在提取发酵中用于醇移除的油的提取溶剂 |
US8871488B2 (en) | 2010-06-18 | 2014-10-28 | Butamax Advanced Biofuels Llc | Recombinant host cells comprising phosphoketolases |
US9040263B2 (en) | 2010-07-28 | 2015-05-26 | Butamax Advanced Biofuels Llc | Production of alcohol esters and in situ product removal during alcohol fermentation |
US9012190B2 (en) | 2011-06-15 | 2015-04-21 | Butamax Advanced Biofuels Llc | Use of thiamine and nicotine adenine dinucleotide for butanol production |
CN103119172B (zh) | 2010-06-18 | 2016-05-11 | 布特马斯先进生物燃料有限责任公司 | 在提取发酵中用于醇移除的来源于油的提取溶剂 |
EP3312284A3 (en) | 2010-07-26 | 2018-05-30 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of aromatics, 2,4-pentadienoate and 1,3-butadiene |
WO2012027642A1 (en) * | 2010-08-27 | 2012-03-01 | Gevo, Inc. | Balanced four-step pathways to renewable butanols |
JP2013544072A (ja) | 2010-09-02 | 2013-12-12 | ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー | 真空下での蒸発により発酵から生成物アルコールを取り出す方法 |
WO2012033832A2 (en) | 2010-09-07 | 2012-03-15 | Butamax(Tm) Advanced Biofuels Llc | Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion |
DE102011003394A1 (de) * | 2011-01-31 | 2012-08-02 | Wacker Chemie Ag | Verfahren zur fermentativen Herstellung von 2,3-Butandiol |
DE102011003387A1 (de) * | 2011-01-31 | 2012-08-02 | Wacker Chemie Ag | Verfahren zur fermentativen Herstellung von 2,3-Butandiol |
DE102011003383A1 (de) * | 2011-01-31 | 2012-08-02 | Wacker Chemie Ag | Verfahren zur fermentativen Herstellung von 2,3-Butandiol |
US20130040340A1 (en) | 2011-02-07 | 2013-02-14 | E. I. Du Pont De Nemours And Company | Production of alcohol esters in situ using alcohols and fatty acids produced by microorganisms |
US8765425B2 (en) | 2011-03-23 | 2014-07-01 | Butamax Advanced Biofuels Llc | In situ expression of lipase for enzymatic production of alcohol esters during fermentation |
US8759044B2 (en) | 2011-03-23 | 2014-06-24 | Butamax Advanced Biofuels Llc | In situ expression of lipase for enzymatic production of alcohol esters during fermentation |
MX347976B (es) | 2011-03-24 | 2017-05-22 | Butamax(Tm) Advanced Biofuels Llc | Celulas huesped y metodos para producir isobutanol. |
EP2699618A4 (en) | 2011-04-19 | 2014-12-17 | Gevo Inc | VARIATIONS OF A PRINS REACTION FOR THE PREPARATION OF 2,5-DIMETHYLHEXADIENE FROM ISOBUTANOL |
KR101298988B1 (ko) * | 2011-05-18 | 2013-08-26 | 서강대학교산학협력단 | 2,3-부탄다이올 생산을 위한 크렙시엘라 뉴모니아 균주 및 제조방법 |
KR20140039292A (ko) | 2011-06-17 | 2014-04-01 | 부타맥스 어드밴스드 바이오퓨얼스 엘엘씨 | 바이오연료 생성 프로세스로부터의 공동-생성물 및 이의 생성 방법 |
BR112013032320A2 (pt) | 2011-06-17 | 2016-12-20 | Butamax Advanced Biofuels Llc | método e composição de produção de butanol, composição de butanol e isobutanol, método de cultivo de um micro-organismo produtor de butanol em material lignocelulósico e método para inibir o crescimento de micro-organismos que não produzem butanol em uma composição |
US9238828B2 (en) | 2011-07-28 | 2016-01-19 | Butamax Advanced Biofuels Llc | Keto-isovalerate decarboxylase enzymes and methods of use thereof |
US20130180164A1 (en) | 2011-07-28 | 2013-07-18 | Butamax(Tm) Advanced Biofuels Llc | Low sulfur fuel compositions having improved lubricity |
US9556458B2 (en) | 2011-10-27 | 2017-01-31 | The Regents Of The University Of California | Bacterial production of methyl ketones |
AU2012347687A1 (en) | 2011-12-09 | 2014-05-29 | Butamax Advanced Biofuels Llc | Process to remove product alcohols from fermentation broth by multistep flash evaporation |
CA2861613A1 (en) | 2011-12-30 | 2013-07-04 | Butamax Advanced Biofuels Llc | Fermentative production of alcohols |
KR20140113997A (ko) | 2011-12-30 | 2014-09-25 | 부타맥스 어드밴스드 바이오퓨얼스 엘엘씨 | 부탄올 생성을 위한 유전자 스위치 |
MX2014011355A (es) | 2012-03-23 | 2014-12-05 | Butamax Advanced Biofuels Llc | Complementacion con acetato de medio para butanologenos. |
CA2870567A1 (en) | 2012-05-04 | 2013-11-07 | Butamax Advanced Biofuels Llc | Processes and systems for alcohol production and recovery |
US9169467B2 (en) | 2012-05-11 | 2015-10-27 | Butamax Advanced Biofuels Llc | Ketol-acid reductoisomerase enzymes and methods of use |
GB201209425D0 (en) | 2012-05-28 | 2012-07-11 | Lucite Int Uk Ltd | Process for production of methyl methacrylate |
BR112014030202A2 (pt) | 2012-06-04 | 2017-09-12 | Genomatica Inc | microorganismos e métodos para a produção de 4-hidroxibutirato 1,4-butanodiol e compostos relacionados |
KR102079275B1 (ko) * | 2012-06-08 | 2020-02-19 | 란자테크 뉴질랜드 리미티드 | 재조합 미생물 및 그에 대한 용도 |
US9783832B2 (en) | 2012-07-17 | 2017-10-10 | Biopolis, S.L. | Method for producing 2,3-butanediol using improved strains of Raoultella planticola |
US20140024064A1 (en) | 2012-07-23 | 2014-01-23 | Butamax(Tm) Advanced Biofuels Llc | Processes and systems for the production of fermentative alcohols |
US9809520B2 (en) | 2012-07-26 | 2017-11-07 | Butamax Advanced Biofuels Llc | Butanol purification |
AU2013305714A1 (en) | 2012-08-22 | 2015-02-05 | Butamax Advanced Biofuels Llc | Production of fermentation products |
KR102121888B1 (ko) * | 2012-08-28 | 2020-06-12 | 란자테크 뉴질랜드 리미티드 | 재조합 미생물 및 이에 대한 용도 |
NZ705079A (en) | 2012-09-12 | 2017-10-27 | Butamax Advanced Biofuels Llc | Processes and systems for the production of fermentation products |
WO2014047421A1 (en) | 2012-09-21 | 2014-03-27 | Butamax(Tm) Advanced Biofuels Llc | Production of renewable hydrocarbon compositions |
CN104981544B (zh) | 2012-09-21 | 2018-05-15 | 布特马斯先进生物燃料有限责任公司 | 用于使用两相萃取发酵和可循环利用的提取剂组合物制备丁醇的方法 |
CN105102616A (zh) | 2012-09-26 | 2015-11-25 | 布特马斯先进生物燃料有限责任公司 | 具有酮醇酸还原异构酶活性的多肽 |
DE112013004785T5 (de) | 2012-09-28 | 2015-08-20 | The Regents Of The University Of California | Verfahren zur Herstellung von Acetoin und 2,3-Butandiol unter Verwendung von photosynthetischen Mikroorganismen |
CA2884876A1 (en) | 2012-09-28 | 2014-04-03 | Butamax Advanced Biofuels Llc | Production of fermentation products |
US9273330B2 (en) | 2012-10-03 | 2016-03-01 | Butamax Advanced Biofuels Llc | Butanol tolerance in microorganisms |
WO2014059273A1 (en) | 2012-10-11 | 2014-04-17 | Butamax Advanced Biofuels Llc | Processes and systems for the production of fermentation products |
US10290479B2 (en) * | 2012-11-07 | 2019-05-14 | Ohio University | Online monitoring of fuel cell reactions by desorption electrospray mass spectrometry |
WO2014074701A1 (en) | 2012-11-07 | 2014-05-15 | Ohio University | Ionization of chemicals in mixture at low ph by ambient ionization / mass spectrometry |
US10288610B2 (en) * | 2012-11-13 | 2019-05-14 | The General Hospital Corporation | Vitro assays for detecting Salmonella enterica serotype typhi |
US20140142352A1 (en) | 2012-11-20 | 2014-05-22 | Butamax Advanced Biofuels Llc | Butanol purification |
WO2014092562A1 (en) * | 2012-12-11 | 2014-06-19 | Photanol B.V. | Synthesis of acetoin, 2,3-butanediol and 2-butanol by cyanobacteria by heterologous expression of a catabolic pathway |
US20140178954A1 (en) | 2012-12-20 | 2014-06-26 | E I Du Pont De Nemours And Company | Expression of xylose isomerase activity in yeast |
US9650624B2 (en) | 2012-12-28 | 2017-05-16 | Butamax Advanced Biofuels Llc | DHAD variants for butanol production |
WO2014105840A1 (en) | 2012-12-31 | 2014-07-03 | Butamax Advanced Biofuels Llc | Fermentative production of alcohols |
US20160002131A1 (en) | 2013-02-21 | 2016-01-07 | Butamax Advanced Biofuels Llc | Vapor recompression |
US8669076B1 (en) | 2013-03-11 | 2014-03-11 | E I Du Pont De Nemours And Company | Cow rumen xylose isomerases active in yeast cells |
US9187743B2 (en) | 2013-03-11 | 2015-11-17 | E I Du Pont De Nemours And Company | Bacterial xylose isomerases active in yeast cells |
WO2014159309A1 (en) | 2013-03-12 | 2014-10-02 | Butamax Advanced Biofuels Llc | Processes and systems for the production of alcohols |
US20140273105A1 (en) | 2013-03-12 | 2014-09-18 | E I Du Pont De Nemours And Company | Gradient pretreatment of lignocellulosic biomass |
AU2014244216A1 (en) | 2013-03-14 | 2015-09-24 | E.I. Du Pont De Nemours And Company | Glycerol 3- phosphate dehydrogenase for butanol production |
WO2014144210A2 (en) | 2013-03-15 | 2014-09-18 | Butamax Advanced Biofuels Llc | Competitive growth and/or production advantage for butanologen microorganism |
WO2014151645A1 (en) | 2013-03-15 | 2014-09-25 | Butamax Advanced Biofuels Llc | Process for maximizing biomass growth and butanol yield by feedback control |
US9580705B2 (en) | 2013-03-15 | 2017-02-28 | Butamax Advanced Biofuels Llc | DHAD variants and methods of screening |
CN105229156A (zh) | 2013-03-15 | 2016-01-06 | 布特马斯先进生物燃料有限责任公司 | 用于利用提取发酵生产丁醇的方法 |
WO2014144643A1 (en) | 2013-03-15 | 2014-09-18 | Butamax Advanced Biofuels Llc | Method for producing butanol using extractive fermentation |
US9663759B2 (en) | 2013-07-03 | 2017-05-30 | Butamax Advanced Biofuels Llc | Partial adaptation for butanol production |
EP3063263A1 (en) | 2013-10-28 | 2016-09-07 | Danisco US Inc. | Large scale genetically engineered active dry yeast |
US20150147786A1 (en) | 2013-11-24 | 2015-05-28 | E I Du Pont De Nemours And Company | High force and high stress destructuring for starch biomass processing |
US20150152445A1 (en) * | 2013-12-03 | 2015-06-04 | Lanzatech New Zealand Limited | Microorganisms and methods for the production of ketones |
CN103627698A (zh) * | 2013-12-05 | 2014-03-12 | 江南大学 | 乙偶姻高耐受性菌株的选育和用该菌株发酵生产乙偶姻 |
CN105219666B (zh) * | 2014-06-18 | 2021-03-26 | 清华大学 | 用于在微氧条件下生产丁醇的共生菌体系和方法 |
CA2957920A1 (en) | 2014-08-11 | 2016-02-18 | Butamax Advanced Biofuels Llc | Yeast preparations and methods of making the same |
EA035950B1 (ru) * | 2014-12-08 | 2020-09-04 | Ланцатек Нью Зилэнд Лимитед | Рекомбинантные микроорганизмы, проявляющие повышенный поток при ферментационном пути |
MX2017008739A (es) * | 2014-12-31 | 2017-11-17 | Poet Res Inc | Metodos y sistemas de flujo de almidon de alta pureza. |
MX2017008738A (es) | 2014-12-31 | 2017-11-17 | Poet Res Inc | Uso de flujo de azucar en fermentacion de etanol para producir otros productos. |
ES2867964T3 (es) * | 2015-12-11 | 2021-10-21 | Wacker Chemie Ag | Cepa de microorganismos y procedimiento para la producción fermentativa exenta de antibióticos de sustancias y proteínas de bajo peso molecular |
US20190112590A1 (en) | 2016-04-08 | 2019-04-18 | Ei Du Pont De Nemours And Company | Arabinose isomerases for yeast |
KR102028161B1 (ko) * | 2017-01-10 | 2019-10-02 | 경희대학교 산학협력단 | 형질전환 미생물을 이용한 2,3-부탄디올 생산방법 |
WO2018131898A2 (ko) | 2017-01-10 | 2018-07-19 | 경희대학교 산학협력단 | 메틸로모나스 속 dh-1 균주의 신규한 용도 |
EP3574081A4 (en) * | 2017-01-30 | 2021-04-14 | Intrexon Corporation | PROCESSES AND MICRO-ORGANISMS FOR THE MANUFACTURE OF 2,3-BUTANEDIOL AND ITS DERIVATIVES FROM C1 CARBON COMPOUNDS |
AU2018260733B2 (en) | 2017-04-28 | 2023-08-17 | Precigen, Inc. | Methods and microorganisms for the fermentation of methane to multi-carbon compounds |
WO2019055498A1 (en) * | 2017-09-12 | 2019-03-21 | Igc Bio, Inc. | PROSS OPTIMIZED ENZYMES |
IL296841A (en) | 2020-04-10 | 2022-11-01 | Codexis Inc | Engineered transaminase polypeptides |
FR3115988A1 (fr) | 2020-11-06 | 2022-05-13 | Global Bioenergies | Composition de maquillage à base d’isododécane biosourcé et son procédé de préparation |
FR3157389A1 (fr) | 2023-12-22 | 2025-06-27 | Axens | Procédé de production de bioalkylat ou d’essence biosourcée |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2198104A (en) | 1938-12-15 | 1940-04-23 | Commercial Solvents Corp | Butyl alcohol fermentation process |
US2730542A (en) | 1951-06-25 | 1956-01-10 | Ferrari Vittorio Emiliano | Process for preparing ethanol-2-aminophosphoric acid |
US4424275A (en) | 1979-09-17 | 1984-01-03 | Sidney Levy | Continuous process for producing N-butanol employing anaerobic fermentation |
US4568643A (en) | 1981-08-03 | 1986-02-04 | Sidney Levy | Continuous process for producing n-butanol employing anaerobic fermentation |
US4520104A (en) | 1982-11-18 | 1985-05-28 | Cpc International Inc. | Production of butanol by a continuous fermentation process |
JPS61209594A (ja) | 1985-03-14 | 1986-09-17 | Res Assoc Petroleum Alternat Dev<Rapad> | アルコ−ルの製造方法 |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
JPS6317695A (ja) | 1986-07-09 | 1988-01-25 | Idemitsu Kosan Co Ltd | アルコ−ル類の製造法 |
JPS63102687A (ja) | 1986-10-20 | 1988-05-07 | Res Assoc Petroleum Alternat Dev<Rapad> | ブタノ−ルの製造方法 |
AT388174B (de) | 1987-03-10 | 1989-05-10 | Vogelbusch Gmbh | Verfahren zur vergaerung von kohlenhydrathaeltigen medien mit hilfe von bakterien |
JPS63254986A (ja) | 1987-04-10 | 1988-10-21 | Res Assoc Petroleum Alternat Dev<Rapad> | アルコ−ルの製造法 |
JPH084515B2 (ja) | 1987-11-09 | 1996-01-24 | 出光興産株式会社 | 有機化合物の製造方法 |
US5000000A (en) | 1988-08-31 | 1991-03-19 | University Of Florida | Ethanol production by Escherichia coli strains co-expressing Zymomonas PDC and ADH genes |
US5424202A (en) | 1988-08-31 | 1995-06-13 | The University Of Florida | Ethanol production by recombinant hosts |
US5192673A (en) | 1990-04-30 | 1993-03-09 | Michigan Biotechnology Institute | Mutant strain of C. acetobutylicum and process for making butanol |
US5063156A (en) | 1990-04-30 | 1991-11-05 | Glassner David A | Process for the fermentative production of acetone, butanol and ethanol |
WO1993002463A1 (de) | 1991-07-24 | 1993-02-04 | Elin Energieversorgung Gesellschaft M.B.H. | Schalterpol eines leistungsschalters |
US5210032A (en) | 1992-01-21 | 1993-05-11 | Trustees Of The Boston University | Degeneration-resistant solventogenic clostridia |
US5523223A (en) | 1992-03-13 | 1996-06-04 | Forschungszentrum Julich Gmbh | Ketoester reductase for conversion of keto acid esters to optically active hydroxy acid esters |
JP3574682B2 (ja) | 1993-09-24 | 2004-10-06 | ダイセル化学工業株式会社 | 新規な酵素、該酵素を製造する方法、該酵素をコードするdna、該dnaを含む形質転換体、該酵素による光学活性アルコール等の製造方法 |
US5686276A (en) | 1995-05-12 | 1997-11-11 | E. I. Du Pont De Nemours And Company | Bioconversion of a fermentable carbon source to 1,3-propanediol by a single microorganism |
US6358717B1 (en) | 1997-05-14 | 2002-03-19 | The Board Of Trustees Of The University Of Illinois | Method of producing butanol using a mutant strain of Clostridium beijerinckii |
US7074608B1 (en) | 1998-05-12 | 2006-07-11 | E. I. Du Pont De Nemours And Company | Method for the production of 1,3-propanediol by recombinant organisms comprising genes for coenzyme B12 synthesis |
US6432688B1 (en) | 1999-01-18 | 2002-08-13 | Daicel Chemical Industries, Ltd. | Amino alcohol dehydrogenase converts keto alcohol to amino alcohol and amino alcohol to keto alcohol |
DE60029971T2 (de) | 1999-08-18 | 2007-05-16 | E.I. Dupont De Nemours And Co., Wilmington | Verfahren zur biologischen herstellung von 1,3-propandiol |
EP1149918A1 (de) | 2000-04-27 | 2001-10-31 | Creavis Gesellschaft für Technologie und Innovation mbH | Verfahren zur Oxidation von Kohlenwasserstoffen unter Verwendung von Mikroorganismen |
US6586229B1 (en) | 2000-06-01 | 2003-07-01 | North Carolina State University | Method for the production of ρ-Hydroxybenzoate in species of pseudomonas and agrobacterium |
US6960465B1 (en) | 2001-06-27 | 2005-11-01 | Northwestern University | Increased cell resistance to toxic organic substances |
WO2003078615A1 (en) | 2002-03-18 | 2003-09-25 | Ciba Specialty Chemicals Holding Inc. | Alcohol dehydrogenases with high solvent and temperature stability |
MXPA04010366A (es) | 2002-04-22 | 2005-02-17 | Du Pont | Sistema promotor y plasmido para ingenieria genetica. |
CN100471946C (zh) | 2002-10-04 | 2009-03-25 | 纳幕尔杜邦公司 | 高产量生物生产1,3-丙二醇的方法 |
MXPA05009553A (es) | 2003-03-10 | 2006-03-17 | Broin And Associates Inc | Metodo para producir etanol utilizando almidon como materia prima. |
JP4294382B2 (ja) | 2003-06-06 | 2009-07-08 | ダイセル化学工業株式会社 | (2s,3s)−2,3−ブタンジオール脱水素酵素 |
AT413541B (de) | 2004-05-10 | 2006-03-15 | Iep Gmbh | Verfahren zur herstellung von 2-butanol |
BRPI0612937B1 (pt) | 2005-04-12 | 2015-07-07 | Du Pont | Sistema de processamento de biomassa em bateladas e processo de tratamento de biomassa |
US8962298B2 (en) | 2006-05-02 | 2015-02-24 | Butamax Advanced Biofuels Llc | Recombinant host cell comprising a diol dehydratase |
US8828704B2 (en) | 2006-05-02 | 2014-09-09 | Butamax Advanced Biofuels Llc | Fermentive production of four carbon alcohols |
US7659104B2 (en) | 2006-05-05 | 2010-02-09 | E.I. Du Pont De Nemours And Company | Solvent tolerant microorganisms and methods of isolation |
US7541173B2 (en) | 2006-06-15 | 2009-06-02 | E.I. Du Pont De Nemours And Company | Solvent tolerant microorganisms and methods of isolation |
WO2008006038A2 (en) | 2006-07-06 | 2008-01-10 | Integrated Genomics, Inc. | Methods and compositions for butanol production |
US8426174B2 (en) | 2007-05-02 | 2013-04-23 | Butamax(Tm) Advanced Biofuels Llc | Method for the production of 2-butanol |
US8188250B2 (en) | 2008-04-28 | 2012-05-29 | Butamax(Tm) Advanced Biofuels Llc | Butanol dehydrogenase enzyme from the bacterium Achromobacter xylosoxidans |
-
2007
- 2007-04-30 US US11/741,916 patent/US8962298B2/en active Active
- 2007-04-30 US US11/741,892 patent/US8206970B2/en active Active
- 2007-05-02 EP EP07776681.4A patent/EP2010664B1/en not_active Not-in-force
- 2007-05-02 MX MX2008013881A patent/MX2008013881A/es active IP Right Grant
- 2007-05-02 JP JP2009509717A patent/JP5315232B2/ja not_active Expired - Fee Related
- 2007-05-02 AU AU2007248560A patent/AU2007248560C1/en not_active Ceased
- 2007-05-02 NZ NZ570930A patent/NZ570930A/en not_active IP Right Cessation
- 2007-05-02 WO PCT/US2007/010741 patent/WO2007130518A2/en active Application Filing
- 2007-05-02 CA CA002646641A patent/CA2646641A1/en not_active Abandoned
- 2007-05-02 EP EP11177249A patent/EP2402452A1/en not_active Withdrawn
- 2007-05-02 NZ NZ570931A patent/NZ570931A/xx not_active IP Right Cessation
- 2007-05-02 MX MX2008013882A patent/MX2008013882A/es active IP Right Grant
- 2007-05-02 ES ES07776684.8T patent/ES2441182T3/es active Active
- 2007-05-02 WO PCT/US2007/010744 patent/WO2007130521A2/en active Application Filing
- 2007-05-02 EP EP11176986A patent/EP2405014A1/en not_active Withdrawn
- 2007-05-02 BR BRPI0710414-6A patent/BRPI0710414A2/pt not_active Application Discontinuation
- 2007-05-02 RU RU2008147372/13A patent/RU2008147372A/ru not_active Application Discontinuation
- 2007-05-02 JP JP2009509715A patent/JP2009535062A/ja active Pending
- 2007-05-02 EP EP07776684.8A patent/EP2010643B1/en active Active
- 2007-05-02 CA CA002645497A patent/CA2645497A1/en not_active Abandoned
- 2007-05-02 RU RU2008147393/13A patent/RU2008147393A/ru not_active Application Discontinuation
- 2007-05-02 BR BRPI0710412-0A patent/BRPI0710412A2/pt not_active Application Discontinuation
- 2007-05-02 AU AU2007248557A patent/AU2007248557B2/en not_active Ceased
-
2008
- 2008-09-08 ZA ZA2008/07718A patent/ZA200807718B/en unknown
-
2009
- 2009-05-27 US US12/472,765 patent/US8980612B2/en active Active
-
2011
- 2011-10-26 US US13/281,872 patent/US20120196341A1/en not_active Abandoned
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BRPI0710412A2 (pt) | " celulas hospedeiras microbianas recombinantes, método para produção de 2-butanol, método para produção de 2-butanona, 2-butanol e 2- butanona" | |
US8222017B2 (en) | Ketol-acid reductoisomerase using NADH | |
EP2271741B1 (en) | Fermentive production of four carbon alcohols | |
US8945899B2 (en) | Ketol-acid reductoisomerase using NADH | |
US8426174B2 (en) | Method for the production of 2-butanol | |
US20080274522A1 (en) | Method for the production of 2-butanone | |
CA2723874A1 (en) | Deletion mutants for the production of isobutanol |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according art. 34 industrial property law | ||
B07A | Technical examination (opinion): publication of technical examination (opinion) | ||
B09B | Decision: refusal | ||
B09B | Decision: refusal |