KR20190134706A - 알데하이드 데하이드로게나제 변이체 및 사용 방법 - Google Patents
알데하이드 데하이드로게나제 변이체 및 사용 방법 Download PDFInfo
- Publication number
- KR20190134706A KR20190134706A KR1020197032015A KR20197032015A KR20190134706A KR 20190134706 A KR20190134706 A KR 20190134706A KR 1020197032015 A KR1020197032015 A KR 1020197032015A KR 20197032015 A KR20197032015 A KR 20197032015A KR 20190134706 A KR20190134706 A KR 20190134706A
- Authority
- KR
- South Korea
- Prior art keywords
- bdo
- hbal
- amino acid
- polypeptide
- cell
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 203
- 108020002663 Aldehyde Dehydrogenase Proteins 0.000 title claims abstract description 158
- 102000005369 Aldehyde Dehydrogenase Human genes 0.000 title claims abstract description 158
- HSJKGGMUJITCBW-UHFFFAOYSA-N 3-hydroxybutanal Chemical compound CC(O)CC=O HSJKGGMUJITCBW-UHFFFAOYSA-N 0.000 claims abstract description 612
- AXPZIVKEZRHGAS-UHFFFAOYSA-N 3-benzyl-5-[(2-nitrophenoxy)methyl]oxolan-2-one Chemical compound [O-][N+](=O)C1=CC=CC=C1OCC1OC(=O)C(CC=2C=CC=CC=2)C1 AXPZIVKEZRHGAS-UHFFFAOYSA-N 0.000 claims abstract description 278
- PIAOXUVIBAKVSP-UHFFFAOYSA-N γ-hydroxybutyraldehyde Chemical compound OCCCC=O PIAOXUVIBAKVSP-UHFFFAOYSA-N 0.000 claims abstract description 266
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 192
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 172
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 172
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 172
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 172
- 229920001184 polypeptide Polymers 0.000 claims abstract description 170
- 150000002148 esters Chemical class 0.000 claims abstract description 132
- 150000001408 amides Chemical class 0.000 claims abstract description 129
- 239000013592 cell lysate Substances 0.000 claims abstract description 32
- 238000012258 culturing Methods 0.000 claims abstract description 10
- 239000000047 product Substances 0.000 claims description 312
- 210000004027 cell Anatomy 0.000 claims description 266
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 164
- 102000004190 Enzymes Human genes 0.000 claims description 122
- 108090000790 Enzymes Proteins 0.000 claims description 122
- 230000037361 pathway Effects 0.000 claims description 116
- 238000006467 substitution reaction Methods 0.000 claims description 95
- 238000006243 chemical reaction Methods 0.000 claims description 77
- PUPZLCDOIYMWBV-UHFFFAOYSA-N (+/-)-1,3-Butanediol Chemical compound CC(O)CCO PUPZLCDOIYMWBV-UHFFFAOYSA-N 0.000 claims description 76
- KAKZBPTYRLMSJV-UHFFFAOYSA-N Butadiene Chemical compound C=CC=C KAKZBPTYRLMSJV-UHFFFAOYSA-N 0.000 claims description 70
- 230000000694 effects Effects 0.000 claims description 68
- -1 elastic fibers Polymers 0.000 claims description 66
- 239000000758 substrate Substances 0.000 claims description 64
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 claims description 53
- WERYXYBDKMZEQL-UHFFFAOYSA-N butane-1,4-diol Chemical compound OCCCCO WERYXYBDKMZEQL-UHFFFAOYSA-N 0.000 claims description 53
- BAMBWCGEVIAQBF-CITAKDKDSA-N 4-hydroxybutyryl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCO)O[C@H]1N1C2=NC=NC(N)=C2N=C1 BAMBWCGEVIAQBF-CITAKDKDSA-N 0.000 claims description 50
- 229910052799 carbon Inorganic materials 0.000 claims description 46
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 44
- 238000004519 manufacturing process Methods 0.000 claims description 44
- QHHKKMYHDBRONY-RMNRSTNRSA-N 3-hydroxybutanoyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 QHHKKMYHDBRONY-RMNRSTNRSA-N 0.000 claims description 43
- 229920001791 ((R)-3-Hydroxybutanoyl)(n-2) Polymers 0.000 claims description 42
- 238000000855 fermentation Methods 0.000 claims description 40
- 230000004151 fermentation Effects 0.000 claims description 39
- 238000000338 in vitro Methods 0.000 claims description 33
- 229920002791 poly-4-hydroxybutyrate Polymers 0.000 claims description 32
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical group CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 31
- 150000001875 compounds Chemical class 0.000 claims description 27
- 239000000203 mixture Substances 0.000 claims description 26
- 230000004048 modification Effects 0.000 claims description 26
- 238000012986 modification Methods 0.000 claims description 26
- OKTJSMMVPCPJKN-NJFSPNSNSA-N Carbon-14 Chemical compound [14C] OKTJSMMVPCPJKN-NJFSPNSNSA-N 0.000 claims description 25
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 23
- 230000000813 microbial effect Effects 0.000 claims description 20
- 229920002635 polyurethane Polymers 0.000 claims description 20
- 239000004814 polyurethane Substances 0.000 claims description 20
- 239000006227 byproduct Substances 0.000 claims description 19
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 claims description 18
- 229920001577 copolymer Polymers 0.000 claims description 18
- 239000003960 organic solvent Substances 0.000 claims description 18
- 210000004177 elastic tissue Anatomy 0.000 claims description 17
- 239000001963 growth medium Substances 0.000 claims description 17
- 229920003023 plastic Polymers 0.000 claims description 17
- 239000004033 plastic Substances 0.000 claims description 17
- 229920000728 polyester Polymers 0.000 claims description 17
- OKTJSMMVPCPJKN-IGMARMGPSA-N Carbon-12 Chemical compound [12C] OKTJSMMVPCPJKN-IGMARMGPSA-N 0.000 claims description 16
- 230000002255 enzymatic effect Effects 0.000 claims description 16
- 238000009396 hybridization Methods 0.000 claims description 16
- 229920001778 nylon Polymers 0.000 claims description 16
- 229920001225 polyester resin Polymers 0.000 claims description 16
- 239000004645 polyester resin Substances 0.000 claims description 16
- 229920005749 polyurethane resin Polymers 0.000 claims description 16
- OKTJSMMVPCPJKN-OUBTZVSYSA-N Carbon-13 Chemical compound [13C] OKTJSMMVPCPJKN-OUBTZVSYSA-N 0.000 claims description 15
- 108020004414 DNA Proteins 0.000 claims description 15
- 229920002396 Polyurea Polymers 0.000 claims description 15
- 229940126904 hypoglycaemic agent Drugs 0.000 claims description 15
- 241000894006 Bacteria Species 0.000 claims description 14
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 14
- 239000003472 antidiabetic agent Substances 0.000 claims description 14
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 13
- 239000005014 poly(hydroxyalkanoate) Substances 0.000 claims description 13
- 229920000903 polyhydroxyalkanoate Polymers 0.000 claims description 13
- 239000004677 Nylon Substances 0.000 claims description 11
- 210000000349 chromosome Anatomy 0.000 claims description 11
- 239000006096 absorbing agent Substances 0.000 claims description 10
- 239000013604 expression vector Substances 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 10
- 238000013518 transcription Methods 0.000 claims description 10
- 230000035897 transcription Effects 0.000 claims description 10
- 238000013519 translation Methods 0.000 claims description 10
- QHHKKMYHDBRONY-WZZMXTMRSA-N (R)-3-hydroxybutanoyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C[C@H](O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 QHHKKMYHDBRONY-WZZMXTMRSA-N 0.000 claims description 9
- 239000001569 carbon dioxide Substances 0.000 claims description 9
- 229910002092 carbon dioxide Inorganic materials 0.000 claims description 9
- 102000053602 DNA Human genes 0.000 claims description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 8
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 8
- 230000000295 complement effect Effects 0.000 claims description 7
- LVSQXDHWDCMMRJ-UHFFFAOYSA-N 4-hydroxybutan-2-one Chemical compound CC(=O)CCO LVSQXDHWDCMMRJ-UHFFFAOYSA-N 0.000 claims description 6
- 108091035707 Consensus sequence Proteins 0.000 claims description 6
- 239000011942 biocatalyst Substances 0.000 claims description 6
- 239000002537 cosmetic Substances 0.000 claims description 6
- 238000000746 purification Methods 0.000 claims description 6
- QHHKKMYHDBRONY-VKBDFPRVSA-N (S)-3-hydroxybutanoyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C[C@@H](O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 QHHKKMYHDBRONY-VKBDFPRVSA-N 0.000 claims description 4
- 241000233866 Fungi Species 0.000 claims description 4
- 239000012228 culture supernatant Substances 0.000 claims description 4
- 238000004821 distillation Methods 0.000 claims description 4
- KKEYFWRCBNTPAC-UHFFFAOYSA-L terephthalate(2-) Chemical compound [O-]C(=O)C1=CC=C(C([O-])=O)C=C1 KKEYFWRCBNTPAC-UHFFFAOYSA-L 0.000 claims description 4
- 150000002334 glycols Chemical class 0.000 claims description 3
- 238000002955 isolation Methods 0.000 claims description 3
- 235000013373 food additive Nutrition 0.000 claims description 2
- 239000002778 food additive Substances 0.000 claims description 2
- 238000002156 mixing Methods 0.000 claims description 2
- 238000000465 moulding Methods 0.000 claims description 2
- 229920001748 polybutylene Polymers 0.000 claims description 2
- 150000002009 diols Chemical class 0.000 abstract description 2
- 239000001273 butane Substances 0.000 abstract 1
- 108090000623 proteins and genes Proteins 0.000 description 189
- 235000001014 amino acid Nutrition 0.000 description 119
- 102000004169 proteins and genes Human genes 0.000 description 76
- 235000018102 proteins Nutrition 0.000 description 71
- 230000015572 biosynthetic process Effects 0.000 description 53
- 239000000543 intermediate Substances 0.000 description 51
- 230000014509 gene expression Effects 0.000 description 44
- 229920002334 Spandex Polymers 0.000 description 41
- 230000002503 metabolic effect Effects 0.000 description 39
- 241000894007 species Species 0.000 description 39
- 102000004316 Oxidoreductases Human genes 0.000 description 34
- 108090000854 Oxidoreductases Proteins 0.000 description 34
- 150000001413 amino acids Chemical class 0.000 description 33
- 229940024606 amino acid Drugs 0.000 description 32
- 230000001965 increasing effect Effects 0.000 description 32
- 229920001707 polybutylene terephthalate Polymers 0.000 description 30
- 235000019437 butane-1,3-diol Nutrition 0.000 description 28
- 239000004759 spandex Substances 0.000 description 28
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 27
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 26
- 230000035772 mutation Effects 0.000 description 26
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 24
- 239000000126 substance Substances 0.000 description 24
- 101710088194 Dehydrogenase Proteins 0.000 description 20
- 238000000926 separation method Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 239000003208 petroleum Substances 0.000 description 19
- 244000005700 microbiome Species 0.000 description 18
- 150000001299 aldehydes Chemical class 0.000 description 17
- 239000002243 precursor Substances 0.000 description 17
- 230000008569 process Effects 0.000 description 17
- 230000035755 proliferation Effects 0.000 description 17
- 239000000243 solution Substances 0.000 description 17
- 238000012239 gene modification Methods 0.000 description 16
- 230000005017 genetic modification Effects 0.000 description 16
- 235000013617 genetically modified food Nutrition 0.000 description 16
- 231100000350 mutagenesis Toxicity 0.000 description 15
- 238000002703 mutagenesis Methods 0.000 description 14
- 229920003224 poly(trimethylene oxide) Polymers 0.000 description 14
- SJZRECIVHVDYJC-UHFFFAOYSA-M 4-hydroxybutyrate Chemical compound OCCCC([O-])=O SJZRECIVHVDYJC-UHFFFAOYSA-M 0.000 description 13
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 13
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 13
- 239000000463 material Substances 0.000 description 13
- 239000002609 medium Substances 0.000 description 13
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 12
- 230000001851 biosynthetic effect Effects 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 230000000670 limiting effect Effects 0.000 description 11
- 229910052760 oxygen Inorganic materials 0.000 description 11
- 239000001301 oxygen Substances 0.000 description 11
- 239000002904 solvent Substances 0.000 description 11
- 238000012217 deletion Methods 0.000 description 10
- 230000002829 reductive effect Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- SYTBZMRGLBWNTM-SNVBAGLBSA-N (R)-flurbiprofen Chemical compound FC1=CC([C@H](C(O)=O)C)=CC=C1C1=CC=CC=C1 SYTBZMRGLBWNTM-SNVBAGLBSA-N 0.000 description 9
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 9
- 239000002028 Biomass Substances 0.000 description 9
- 241000588724 Escherichia coli Species 0.000 description 9
- 241000589516 Pseudomonas Species 0.000 description 9
- 238000010521 absorption reaction Methods 0.000 description 9
- OJFDKHTZOUZBOS-CITAKDKDSA-N acetoacetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 OJFDKHTZOUZBOS-CITAKDKDSA-N 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 238000001727 in vivo Methods 0.000 description 9
- 230000001939 inductive effect Effects 0.000 description 9
- 235000006408 oxalic acid Nutrition 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- 241000193403 Clostridium Species 0.000 description 8
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 8
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 239000012298 atmosphere Substances 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 150000001720 carbohydrates Chemical class 0.000 description 8
- 235000014633 carbohydrates Nutrition 0.000 description 8
- 239000007789 gas Substances 0.000 description 8
- 230000037353 metabolic pathway Effects 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 230000001603 reducing effect Effects 0.000 description 8
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 7
- 241000282414 Homo sapiens Species 0.000 description 7
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 7
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 7
- 239000002253 acid Substances 0.000 description 7
- 238000000205 computational method Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 230000012010 growth Effects 0.000 description 7
- 230000003834 intracellular effect Effects 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 238000006241 metabolic reaction Methods 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- XGAWKWCCTIEGRI-UHFFFAOYSA-N phosphono 4-hydroxybutanoate Chemical compound OCCCC(=O)OP(O)(O)=O XGAWKWCCTIEGRI-UHFFFAOYSA-N 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- PUPZLCDOIYMWBV-SCSAIBSYSA-N (R)-butane-1,3-diol Chemical compound C[C@@H](O)CCO PUPZLCDOIYMWBV-SCSAIBSYSA-N 0.000 description 6
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 6
- 235000014469 Bacillus subtilis Nutrition 0.000 description 6
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 6
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 6
- 108020002908 Epoxide hydrolase Proteins 0.000 description 6
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- KKEYFWRCBNTPAC-UHFFFAOYSA-N Terephthalic acid Chemical compound OC(=O)C1=CC=C(C(O)=O)C=C1 KKEYFWRCBNTPAC-UHFFFAOYSA-N 0.000 description 6
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 6
- 102000004357 Transferases Human genes 0.000 description 6
- 108090000992 Transferases Proteins 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 238000006911 enzymatic reaction Methods 0.000 description 6
- 230000004907 flux Effects 0.000 description 6
- 235000013305 food Nutrition 0.000 description 6
- 238000012224 gene deletion Methods 0.000 description 6
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 6
- 150000002576 ketones Chemical class 0.000 description 6
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 6
- 239000002357 osmotic agent Substances 0.000 description 6
- 102000040430 polynucleotide Human genes 0.000 description 6
- 108091033319 polynucleotide Proteins 0.000 description 6
- 239000002157 polynucleotide Substances 0.000 description 6
- 239000000376 reactant Substances 0.000 description 6
- UIUJIQZEACWQSV-UHFFFAOYSA-N succinic semialdehyde Chemical compound OC(=O)CCC=O UIUJIQZEACWQSV-UHFFFAOYSA-N 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 241000193830 Bacillus <bacterium> Species 0.000 description 5
- 244000063299 Bacillus subtilis Species 0.000 description 5
- 102000005486 Epoxide hydrolase Human genes 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 241000186660 Lactobacillus Species 0.000 description 5
- 102000003960 Ligases Human genes 0.000 description 5
- 108090000364 Ligases Proteins 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 108091000080 Phosphotransferase Proteins 0.000 description 5
- 108010084086 Succinate-Semialdehyde Dehydrogenase Proteins 0.000 description 5
- 102000005566 Succinate-Semialdehyde Dehydrogenase Human genes 0.000 description 5
- 108091000039 acetoacetyl-CoA reductase Proteins 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000006378 damage Effects 0.000 description 5
- 239000008103 glucose Substances 0.000 description 5
- 235000015097 nutrients Nutrition 0.000 description 5
- 102000020233 phosphotransferase Human genes 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000002864 sequence alignment Methods 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- TZBGSHAFWLGWBO-ABLWVSNPSA-N (2s)-2-[[4-[(2-amino-4-oxo-5,6,7,8-tetrahydro-1h-pteridin-6-yl)methylamino]benzoyl]amino]-5-methoxy-5-oxopentanoic acid Chemical compound C1=CC(C(=O)N[C@@H](CCC(=O)OC)C(O)=O)=CC=C1NCC1NC(C(=O)NC(N)=N2)=C2NC1 TZBGSHAFWLGWBO-ABLWVSNPSA-N 0.000 description 4
- SVTBMSDMJJWYQN-UHFFFAOYSA-N 2-methylpentane-2,4-diol Chemical compound CC(O)CC(C)(C)O SVTBMSDMJJWYQN-UHFFFAOYSA-N 0.000 description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- 241000193155 Clostridium botulinum Species 0.000 description 4
- 241001508458 Clostridium saccharoperbutylacetonicum Species 0.000 description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- 102000005720 Glutathione transferase Human genes 0.000 description 4
- 108010020056 Hydrogenase Proteins 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- 241000194036 Lactococcus Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 4
- 235000010676 Ocimum basilicum Nutrition 0.000 description 4
- 240000007926 Ocimum gratissimum Species 0.000 description 4
- OFBQJSOFQDEBGM-UHFFFAOYSA-N Pentane Chemical compound CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 4
- 241000605862 Porphyromonas gingivalis Species 0.000 description 4
- 229920002472 Starch Polymers 0.000 description 4
- 241000187747 Streptomyces Species 0.000 description 4
- 241000607598 Vibrio Species 0.000 description 4
- 241000588901 Zymomonas Species 0.000 description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 4
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 4
- 229960003237 betaine Drugs 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 239000012467 final product Substances 0.000 description 4
- 239000000796 flavoring agent Substances 0.000 description 4
- 235000013355 food flavoring agent Nutrition 0.000 description 4
- 229930195712 glutamate Natural products 0.000 description 4
- 229940049906 glutamate Drugs 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 238000000126 in silico method Methods 0.000 description 4
- 230000002779 inactivation Effects 0.000 description 4
- 229940039696 lactobacillus Drugs 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 239000013520 petroleum-based product Substances 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 239000003755 preservative agent Substances 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 235000019698 starch Nutrition 0.000 description 4
- 239000008107 starch Substances 0.000 description 4
- VNOYUJKHFWYWIR-ITIYDSSPSA-N succinyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 VNOYUJKHFWYWIR-ITIYDSSPSA-N 0.000 description 4
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 4
- HSJKGGMUJITCBW-SCSAIBSYSA-N (3r)-3-hydroxybutanal Chemical compound C[C@@H](O)CC=O HSJKGGMUJITCBW-SCSAIBSYSA-N 0.000 description 3
- 108010021680 2-oxoglutarate decarboxylase Proteins 0.000 description 3
- 108010093796 4-hydroxybutyrate dehydrogenase Proteins 0.000 description 3
- 102220491082 ADP-ribosylation factor 6_D12A_mutation Human genes 0.000 description 3
- 241000203069 Archaea Species 0.000 description 3
- 241000228212 Aspergillus Species 0.000 description 3
- 241001465318 Aspergillus terreus Species 0.000 description 3
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 3
- 241000193401 Clostridium acetobutylicum Species 0.000 description 3
- 241000186226 Corynebacterium glutamicum Species 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- 108010074122 Ferredoxins Proteins 0.000 description 3
- 241000605986 Fusobacterium nucleatum Species 0.000 description 3
- 241000626621 Geobacillus Species 0.000 description 3
- 108091022930 Glutamate decarboxylase Proteins 0.000 description 3
- 102000008214 Glutamate decarboxylase Human genes 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 241001138401 Kluyveromyces lactis Species 0.000 description 3
- 241000235058 Komagataella pastoris Species 0.000 description 3
- 241000186366 Mycobacterium bovis Species 0.000 description 3
- 241000187654 Nocardia Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 102000016387 Pancreatic elastase Human genes 0.000 description 3
- 108010067372 Pancreatic elastase Proteins 0.000 description 3
- 241000589776 Pseudomonas putida Species 0.000 description 3
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 102000011929 Succinate-CoA Ligases Human genes 0.000 description 3
- 108010075728 Succinate-CoA Ligases Proteins 0.000 description 3
- 102000003929 Transaminases Human genes 0.000 description 3
- 108090000340 Transaminases Proteins 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 229910002091 carbon monoxide Inorganic materials 0.000 description 3
- 108010031234 carbon monoxide dehydrogenase Proteins 0.000 description 3
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 150000007942 carboxylates Chemical class 0.000 description 3
- 230000004663 cell proliferation Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 230000021615 conjugation Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000002425 crystallisation Methods 0.000 description 3
- 230000008025 crystallization Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 229960001484 edetic acid Drugs 0.000 description 3
- 229940096118 ella Drugs 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 239000002803 fossil fuel Substances 0.000 description 3
- 230000002538 fungal effect Effects 0.000 description 3
- 239000003906 humectant Substances 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 230000000155 isotopic effect Effects 0.000 description 3
- 238000000622 liquid--liquid extraction Methods 0.000 description 3
- 239000002417 nutraceutical Substances 0.000 description 3
- 235000021436 nutraceutical agent Nutrition 0.000 description 3
- 230000003647 oxidation Effects 0.000 description 3
- 238000007254 oxidation reaction Methods 0.000 description 3
- 239000002304 perfume Substances 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 102000037983 regulatory factors Human genes 0.000 description 3
- 108091008025 regulatory factors Proteins 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 238000009834 vaporization Methods 0.000 description 3
- 230000008016 vaporization Effects 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- CPNQOBFWHSILHF-SPDVFEMOSA-N (2R,4R)-octane-2,4,7-triol Chemical compound OC(CC[C@H](C[C@@H](C)O)O)C CPNQOBFWHSILHF-SPDVFEMOSA-N 0.000 description 2
- RYHBNJHYFVUHQT-UHFFFAOYSA-N 1,4-Dioxane Chemical compound C1COCCO1 RYHBNJHYFVUHQT-UHFFFAOYSA-N 0.000 description 2
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 2
- PKQIDSVLSKFZQC-UHFFFAOYSA-N 3-oxobutanal Chemical compound CC(=O)CC=O PKQIDSVLSKFZQC-UHFFFAOYSA-N 0.000 description 2
- SJZRECIVHVDYJC-UHFFFAOYSA-N 4-hydroxybutyric acid Chemical compound OCCCC(O)=O SJZRECIVHVDYJC-UHFFFAOYSA-N 0.000 description 2
- IKHGUXGNUITLKF-UHFFFAOYSA-N Acetaldehyde Chemical compound CC=O IKHGUXGNUITLKF-UHFFFAOYSA-N 0.000 description 2
- 241000193451 Acetoanaerobium sticklandii Species 0.000 description 2
- 241000589220 Acetobacter Species 0.000 description 2
- 241001468161 Acetobacterium Species 0.000 description 2
- 102000005345 Acetyl-CoA C-acetyltransferase Human genes 0.000 description 2
- 108010006229 Acetyl-CoA C-acetyltransferase Proteins 0.000 description 2
- 241000589291 Acinetobacter Species 0.000 description 2
- 241001165345 Acinetobacter baylyi Species 0.000 description 2
- 241000588624 Acinetobacter calcoaceticus Species 0.000 description 2
- 241000947856 Aeromonadales Species 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108020004306 Alpha-ketoglutarate dehydrogenase Proteins 0.000 description 2
- 102000006589 Alpha-ketoglutarate dehydrogenase Human genes 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 241001136167 Anaerotignum propionicum Species 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- 241000219195 Arabidopsis thaliana Species 0.000 description 2
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- 241000193409 Bacillus azotoformans Species 0.000 description 2
- 241000193755 Bacillus cereus Species 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 101000695175 Bacillus subtilis (strain 168) Probable phosphate butyryltransferase Proteins 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 108700024126 Butyrate kinases Proteins 0.000 description 2
- 241000220450 Cajanus cajan Species 0.000 description 2
- 241000222122 Candida albicans Species 0.000 description 2
- 241000588923 Citrobacter Species 0.000 description 2
- 241001494522 Citrobacter amalonaticus Species 0.000 description 2
- 241000193163 Clostridioides difficile Species 0.000 description 2
- 241000193454 Clostridium beijerinckii Species 0.000 description 2
- 241000186570 Clostridium kluyveri Species 0.000 description 2
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- 241000252867 Cupriavidus metallidurans Species 0.000 description 2
- 241000414116 Cyanobium Species 0.000 description 2
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 2
- 102000007528 DNA Polymerase III Human genes 0.000 description 2
- 108010071146 DNA Polymerase III Proteins 0.000 description 2
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 2
- 241001053771 Dictyostelium discoideum AX4 Species 0.000 description 2
- LCGLNKUTAGEVQW-UHFFFAOYSA-N Dimethyl ether Chemical group COC LCGLNKUTAGEVQW-UHFFFAOYSA-N 0.000 description 2
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 2
- 241000588921 Enterobacteriaceae Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 102100025413 Formyltetrahydrofolate synthetase Human genes 0.000 description 2
- 229930091371 Fructose Natural products 0.000 description 2
- 239000005715 Fructose Substances 0.000 description 2
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 2
- 241000605909 Fusobacterium Species 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000205063 Haloarcula marismortui Species 0.000 description 2
- 102000004157 Hydrolases Human genes 0.000 description 2
- 108090000604 Hydrolases Proteins 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 241000588749 Klebsiella oxytoca Species 0.000 description 2
- 241000588747 Klebsiella pneumoniae Species 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- 241000858110 Lachancea Species 0.000 description 2
- 241000933069 Lachnoclostridium phytofermentans Species 0.000 description 2
- 240000006024 Lactobacillus plantarum Species 0.000 description 2
- 235000013965 Lactobacillus plantarum Nutrition 0.000 description 2
- 241000192130 Leuconostoc mesenteroides Species 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 241001293415 Mannheimia Species 0.000 description 2
- 101710159527 Maturation protein A Proteins 0.000 description 2
- 101710091157 Maturation protein A2 Proteins 0.000 description 2
- 241000157876 Metallosphaera sedula Species 0.000 description 2
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 2
- 239000004909 Moisturizer Substances 0.000 description 2
- 241000186367 Mycobacterium avium Species 0.000 description 2
- 241000187480 Mycobacterium smegmatis Species 0.000 description 2
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 244000061176 Nicotiana tabacum Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 208000026681 Paratuberculosis Diseases 0.000 description 2
- 241000228150 Penicillium chrysogenum Species 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 102000001938 Plasminogen Activators Human genes 0.000 description 2
- 108010001014 Plasminogen Activators Proteins 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- 241000589540 Pseudomonas fluorescens Species 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 2
- 241000605947 Roseburia Species 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- 102000012479 Serine Proteases Human genes 0.000 description 2
- 108010022999 Serine Proteases Proteins 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 244000057717 Streptococcus lactis Species 0.000 description 2
- 235000014897 Streptococcus lactis Nutrition 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 2
- 241000205091 Sulfolobus solfataricus Species 0.000 description 2
- 241000160715 Sulfolobus tokodaii Species 0.000 description 2
- 241000589499 Thermus thermophilus Species 0.000 description 2
- 241000223105 Trypanosoma brucei Species 0.000 description 2
- 241000607626 Vibrio cholerae Species 0.000 description 2
- 241000235013 Yarrowia Species 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- 239000002250 absorbent Substances 0.000 description 2
- 230000002745 absorbent Effects 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 2
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000000845 anti-microbial effect Effects 0.000 description 2
- 239000004599 antimicrobial Substances 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 229940098773 bovine serum albumin Drugs 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 229940095731 candida albicans Drugs 0.000 description 2
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 2
- 238000012219 cassette mutagenesis Methods 0.000 description 2
- 230000019522 cellular metabolic process Effects 0.000 description 2
- 239000013611 chromosomal DNA Substances 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000003501 co-culture Methods 0.000 description 2
- 239000003245 coal Substances 0.000 description 2
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 2
- 239000005516 coenzyme A Substances 0.000 description 2
- 229940093530 coenzyme a Drugs 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000010924 continuous production Methods 0.000 description 2
- 239000008406 cosmetic ingredient Substances 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 230000009615 deamination Effects 0.000 description 2
- 238000006481 deamination reaction Methods 0.000 description 2
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 150000005690 diesters Chemical class 0.000 description 2
- XXJWXESWEXIICW-UHFFFAOYSA-N diethylene glycol monoethyl ether Chemical compound CCOCCOCCO XXJWXESWEXIICW-UHFFFAOYSA-N 0.000 description 2
- SZXQTJUDPRGNJN-UHFFFAOYSA-N dipropylene glycol Chemical compound OCCCOCCCO SZXQTJUDPRGNJN-UHFFFAOYSA-N 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- NOPFSRXAKWQILS-UHFFFAOYSA-N docosan-1-ol Chemical compound CCCCCCCCCCCCCCCCCCCCCCO NOPFSRXAKWQILS-UHFFFAOYSA-N 0.000 description 2
- 239000003684 drug solvent Substances 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000003974 emollient agent Substances 0.000 description 2
- 239000003995 emulsifying agent Substances 0.000 description 2
- 230000009483 enzymatic pathway Effects 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 2
- 235000012041 food component Nutrition 0.000 description 2
- 239000005417 food ingredient Substances 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 239000003205 fragrance Substances 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 239000008266 hair spray Substances 0.000 description 2
- 150000002366 halogen compounds Chemical class 0.000 description 2
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 2
- 229940051250 hexylene glycol Drugs 0.000 description 2
- 150000002431 hydrogen Chemical class 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000013067 intermediate product Substances 0.000 description 2
- 238000004255 ion exchange chromatography Methods 0.000 description 2
- 229940072205 lactobacillus plantarum Drugs 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 239000006210 lotion Substances 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- OKVJCVWFVRATSG-UHFFFAOYSA-N m-hydroxybenzyl alcohol Natural products OCC1=CC=CC(O)=C1 OKVJCVWFVRATSG-UHFFFAOYSA-N 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 230000001333 moisturizer Effects 0.000 description 2
- 239000006225 natural substrate Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 230000008723 osmotic stress Effects 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 125000001147 pentyl group Chemical group C(CCCC)* 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 229940127126 plasminogen activator Drugs 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000037452 priming Effects 0.000 description 2
- 125000002568 propynyl group Chemical group [*]C#CC([H])([H])[H] 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 230000002797 proteolythic effect Effects 0.000 description 2
- 238000010926 purge Methods 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000010802 sludge Substances 0.000 description 2
- 239000001488 sodium phosphate Substances 0.000 description 2
- 229910000162 sodium phosphate Inorganic materials 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 238000001546 stable isotope ratio mass spectrometry Methods 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 231100000027 toxicology Toxicity 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000004102 tricarboxylic acid cycle Effects 0.000 description 2
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 2
- OOLLAFOLCSJHRE-ZHAKMVSLSA-N ulipristal acetate Chemical compound C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(OC(C)=O)C(C)=O)[C@]2(C)C1 OOLLAFOLCSJHRE-ZHAKMVSLSA-N 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 239000000341 volatile oil Substances 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- XLYOFNOQVPJJNP-NJFSPNSNSA-N ((18)O)water Chemical compound [18OH2] XLYOFNOQVPJJNP-NJFSPNSNSA-N 0.000 description 1
- DNIAPMSPPWPWGF-VKHMYHEASA-N (+)-propylene glycol Chemical compound C[C@H](O)CO DNIAPMSPPWPWGF-VKHMYHEASA-N 0.000 description 1
- UIKQNMXWCYQNCS-SCSAIBSYSA-N (2r)-2-hydroxybutanal Chemical compound CC[C@@H](O)C=O UIKQNMXWCYQNCS-SCSAIBSYSA-N 0.000 description 1
- UIKQNMXWCYQNCS-BYPYZUCNSA-N (2s)-2-hydroxybutanal Chemical compound CC[C@H](O)C=O UIKQNMXWCYQNCS-BYPYZUCNSA-N 0.000 description 1
- AZPQKDMBANNLMJ-AENDTGMFSA-N (3r)-3-hydroxybutanoic acid;propane-1,2,3-triol Chemical compound OCC(O)CO.C[C@@H](O)CC(O)=O AZPQKDMBANNLMJ-AENDTGMFSA-N 0.000 description 1
- HSJKGGMUJITCBW-BYPYZUCNSA-N (3s)-3-hydroxybutanal Chemical compound C[C@H](O)CC=O HSJKGGMUJITCBW-BYPYZUCNSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 1
- PHIQHXFUZVPYII-ZCFIWIBFSA-N (R)-carnitine Chemical compound C[N+](C)(C)C[C@H](O)CC([O-])=O PHIQHXFUZVPYII-ZCFIWIBFSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- YPFDHNVEDLHUCE-UHFFFAOYSA-N 1,3-propanediol Substances OCCCO YPFDHNVEDLHUCE-UHFFFAOYSA-N 0.000 description 1
- GFAZHVHNLUBROE-UHFFFAOYSA-N 1-hydroxybutan-2-one Chemical compound CCC(=O)CO GFAZHVHNLUBROE-UHFFFAOYSA-N 0.000 description 1
- UIKQNMXWCYQNCS-UHFFFAOYSA-N 2-hydroxybutanal Chemical compound CCC(O)C=O UIKQNMXWCYQNCS-UHFFFAOYSA-N 0.000 description 1
- DXJCKZJNLGWSTI-UHFFFAOYSA-N 3-dimethylsulfonio-2-methylpropanoate Chemical compound [O-]C(=O)C(C)C[S+](C)C DXJCKZJNLGWSTI-UHFFFAOYSA-N 0.000 description 1
- AZPQKDMBANNLMJ-UHFFFAOYSA-N 3-hydroxybutanoic acid propane-1,2,3-triol Chemical compound OC(CC(=O)O)C.OCC(O)CO AZPQKDMBANNLMJ-UHFFFAOYSA-N 0.000 description 1
- 108010055682 3-hydroxybutyryl-CoA dehydrogenase Proteins 0.000 description 1
- 108010060511 4-Aminobutyrate Transaminase Proteins 0.000 description 1
- 102100035923 4-aminobutyrate aminotransferase, mitochondrial Human genes 0.000 description 1
- MEANFMOQMXYMCT-OLZOCXBDSA-N 5,10-methenyltetrahydrofolic acid Chemical compound C([C@H]1CNC2=C([N+]1=C1)C(=O)N=C(N2)N)N1C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C([O-])=O)C=C1 MEANFMOQMXYMCT-OLZOCXBDSA-N 0.000 description 1
- MMTYWJNSFWVPPS-UHFFFAOYSA-N 5-hydroxy-2-oxopentanoic acid Chemical compound OCCCC(=O)C(O)=O MMTYWJNSFWVPPS-UHFFFAOYSA-N 0.000 description 1
- 102000004146 ATP citrate synthases Human genes 0.000 description 1
- 108090000662 ATP citrate synthases Proteins 0.000 description 1
- 108010092060 Acetate kinase Proteins 0.000 description 1
- 108010049926 Acetate-CoA ligase Proteins 0.000 description 1
- 241000589218 Acetobacteraceae Species 0.000 description 1
- 241000204392 Acetonema longum Species 0.000 description 1
- 102100035709 Acetyl-coenzyme A synthetase, cytoplasmic Human genes 0.000 description 1
- 241001453369 Achromobacter denitrificans Species 0.000 description 1
- 241000604450 Acidaminococcus fermentans Species 0.000 description 1
- 241000588626 Acinetobacter baumannii Species 0.000 description 1
- 108010009924 Aconitate hydratase Proteins 0.000 description 1
- 241000606750 Actinobacillus Species 0.000 description 1
- 241000948980 Actinobacillus succinogenes Species 0.000 description 1
- 241000203809 Actinomycetales Species 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 241000567139 Aeropyrum pernix Species 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- JPLATTLXZFUKRQ-UHFFFAOYSA-N Agarobiose Natural products OCC1OC(OC2C(O)COC2C(O)C=O)C(O)C(O)C1O JPLATTLXZFUKRQ-UHFFFAOYSA-N 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- QGZKDVFQNNGYKY-OUBTZVSYSA-N Ammonia-15N Chemical compound [15NH3] QGZKDVFQNNGYKY-OUBTZVSYSA-N 0.000 description 1
- 102000004118 Ammonia-Lyases Human genes 0.000 description 1
- 108090000673 Ammonia-Lyases Proteins 0.000 description 1
- 241000722955 Anaerobiospirillum Species 0.000 description 1
- 241000722954 Anaerobiospirillum succiniciproducens Species 0.000 description 1
- 241000428313 Anaerotruncus colihominis Species 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 108010006591 Apoenzymes Proteins 0.000 description 1
- 241000893512 Aquifex aeolicus Species 0.000 description 1
- 241000205042 Archaeoglobus fulgidus Species 0.000 description 1
- 241001112741 Bacillaceae Species 0.000 description 1
- 241000193833 Bacillales Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 description 1
- 241000123777 Blautia obeum Species 0.000 description 1
- 241000131971 Bradyrhizobiaceae Species 0.000 description 1
- 241000589174 Bradyrhizobium japonicum Species 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Natural products CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 241001189169 Caldalkalibacillus thermarum Species 0.000 description 1
- 241000253373 Caldanaerobacter subterraneus subsp. tengcongensis Species 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241000222178 Candida tropicalis Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 1
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- 241000191382 Chlorobaculum tepidum Species 0.000 description 1
- 241000192731 Chloroflexus aurantiacus Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108010036824 Citrate (pro-3S)-lyase Proteins 0.000 description 1
- 241000951471 Citrus junos Species 0.000 description 1
- 241001430149 Clostridiaceae Species 0.000 description 1
- 241001112695 Clostridiales Species 0.000 description 1
- 241001468165 Clostridium aminobutyricum Species 0.000 description 1
- 241001611022 Clostridium carboxidivorans Species 0.000 description 1
- 241001509496 Clostridium celatum Species 0.000 description 1
- 241000193468 Clostridium perfringens Species 0.000 description 1
- 241000186524 Clostridium subterminale Species 0.000 description 1
- 241000193449 Clostridium tetani Species 0.000 description 1
- 241000186520 Clostridium tetanomorphum Species 0.000 description 1
- 241000193452 Clostridium tyrobutyricum Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000010079 Coenzyme A-Transferases Human genes 0.000 description 1
- 108010077385 Coenzyme A-Transferases Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000186031 Corynebacteriaceae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241001440267 Cyclodes Species 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102100039868 Cytoplasmic aconitate hydratase Human genes 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- 241001421462 Desulfatibacillum alkenivorans Species 0.000 description 1
- 241001338026 Desulfosporosinus Species 0.000 description 1
- YZCKVEUIGOORGS-OUBTZVSYSA-N Deuterium Chemical compound [2H] YZCKVEUIGOORGS-OUBTZVSYSA-N 0.000 description 1
- 241000168726 Dictyostelium discoideum Species 0.000 description 1
- 241001480031 Dipodascaceae Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 241001379910 Ephemera danica Species 0.000 description 1
- 241000190844 Erythrobacter Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 241000711944 Eubacteriaceae bacterium Species 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 241000193456 Eubacterium barkeri Species 0.000 description 1
- 241000186398 Eubacterium limosum Species 0.000 description 1
- 241000393498 Eubacterium plexicaudatum Species 0.000 description 1
- 241000195620 Euglena Species 0.000 description 1
- 241000228427 Eurotiales Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 240000008620 Fagopyrum esculentum Species 0.000 description 1
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241001134569 Flavonifractor plautii Species 0.000 description 1
- 108090000698 Formate Dehydrogenases Proteins 0.000 description 1
- 108010080982 Formate-tetrahydrofolate ligase Proteins 0.000 description 1
- 108010036781 Fumarate Hydratase Proteins 0.000 description 1
- 102100036160 Fumarate hydratase, mitochondrial Human genes 0.000 description 1
- 241000605991 Fusobacterium ulcerans Species 0.000 description 1
- 241000968725 Gammaproteobacteria bacterium Species 0.000 description 1
- 241000589236 Gluconobacter Species 0.000 description 1
- 241000589232 Gluconobacter oxydans Species 0.000 description 1
- 102000016901 Glutamate dehydrogenase Human genes 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 241000158363 Halanaerobium saccharolyticum Species 0.000 description 1
- 241000204946 Halobacterium salinarum Species 0.000 description 1
- 241000204991 Haloferax Species 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- 102100039894 Hemoglobin subunit delta Human genes 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 1
- 108090001042 Hydro-Lyases Proteins 0.000 description 1
- 102000004867 Hydro-Lyases Human genes 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 241000605325 Hydrogenobacter thermophilus Species 0.000 description 1
- 208000013016 Hypoglycemia Diseases 0.000 description 1
- 241000411974 Ilyobacter polytropus Species 0.000 description 1
- 229920001202 Inulin Polymers 0.000 description 1
- 108010081409 Iron-Sulfur Proteins Proteins 0.000 description 1
- 102000005298 Iron-Sulfur Proteins Human genes 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 241000204076 Kitasatospora setae Species 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000588915 Klebsiella aerogenes Species 0.000 description 1
- 201000008225 Klebsiella pneumonia Diseases 0.000 description 1
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 1
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 1
- 241001468155 Lactobacillaceae Species 0.000 description 1
- 241001112724 Lactobacillales Species 0.000 description 1
- 240000001929 Lactobacillus brevis Species 0.000 description 1
- 235000013957 Lactobacillus brevis Nutrition 0.000 description 1
- 102100025357 Lipid-phosphate phosphatase Human genes 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 108010026217 Malate Dehydrogenase Proteins 0.000 description 1
- 102000013460 Malate Dehydrogenase Human genes 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000589195 Mesorhizobium loti Species 0.000 description 1
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 description 1
- 108010010685 Methenyltetrahydrofolate cyclohydrolase Proteins 0.000 description 1
- 102000005954 Methylenetetrahydrofolate Reductase (NADPH2) Human genes 0.000 description 1
- 108010030837 Methylenetetrahydrofolate Reductase (NADPH2) Proteins 0.000 description 1
- 241000193459 Moorella thermoacetica Species 0.000 description 1
- 241001480490 Mucoraceae Species 0.000 description 1
- 241000235388 Mucorales Species 0.000 description 1
- 241001531264 Mus musculus musculus Species 0.000 description 1
- 206010049565 Muscle fatigue Diseases 0.000 description 1
- 208000029549 Muscle injury Diseases 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 241000187492 Mycobacterium marinum Species 0.000 description 1
- 241001607431 Mycobacterium marinum M Species 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 241000863422 Myxococcus xanthus Species 0.000 description 1
- 241000167284 Natranaerobius Species 0.000 description 1
- 241001495644 Nicotiana glutinosa Species 0.000 description 1
- 241001503673 Nocardia farcinica Species 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000193390 Parageobacillus thermoglucosidasius Species 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 241000606752 Pasteurellaceae Species 0.000 description 1
- 241000947860 Pasteurellales Species 0.000 description 1
- 241001459585 Pelosinus fermentans Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- OAICVXFJPJFONN-OUBTZVSYSA-N Phosphorus-32 Chemical compound [32P] OAICVXFJPJFONN-OUBTZVSYSA-N 0.000 description 1
- OAICVXFJPJFONN-NJFSPNSNSA-N Phosphorus-33 Chemical compound [33P] OAICVXFJPJFONN-NJFSPNSNSA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 102000013566 Plasminogen Human genes 0.000 description 1
- 108010051456 Plasminogen Proteins 0.000 description 1
- 206010035717 Pneumonia klebsiella Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 241001528479 Pseudoflavonifractor capillosus Species 0.000 description 1
- 241000947836 Pseudomonadaceae Species 0.000 description 1
- 241001248479 Pseudomonadales Species 0.000 description 1
- 241000589614 Pseudomonas stutzeri Species 0.000 description 1
- 241000186336 Pseudopropionibacterium propionicum Species 0.000 description 1
- 241000736843 Pyrobaculum aerophilum Species 0.000 description 1
- 101710182361 Pyruvate:ferredoxin oxidoreductase Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 241000589157 Rhizobiales Species 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241001148115 Rhizobium etli Species 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 240000005384 Rhizopus oryzae Species 0.000 description 1
- 235000013752 Rhizopus oryzae Nutrition 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 241001185316 Rhodospirillales Species 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- 241000516658 Roseiflexus castenholzii Species 0.000 description 1
- 241000192031 Ruminococcus Species 0.000 description 1
- DFPOZTRSOAQFIK-UHFFFAOYSA-N S,S-dimethyl-beta-propiothetin Chemical compound C[S+](C)CCC([O-])=O DFPOZTRSOAQFIK-UHFFFAOYSA-N 0.000 description 1
- FQFRDDVZPBFYST-CITAKDKDSA-N S-[2-[3-[[(2R)-4-[[[(2R,3S,4R,5R)-5-(6-aminopurin-9-yl)-4-hydroxy-3-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-hydroxyphosphoryl]oxy-2-hydroxy-3,3-dimethylbutanoyl]amino]propanoylamino]ethyl] 4-hydroxybut-2-enethioate Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C=CCO)O[C@H]1N1C2=NC=NC(N)=C2N=C1 FQFRDDVZPBFYST-CITAKDKDSA-N 0.000 description 1
- IDJZVKFLJCAQHF-HRXFNJBOSA-N S-[2-[3-[[(2R)-4-[[[(2R,3S,4R,5R)-5-(6-aminopurin-9-yl)-4-hydroxy-3-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-hydroxyphosphoryl]oxy-2-hydroxy-3,3-dimethylbutanoyl]amino]propanoylamino]ethyl] 4-hydroxybutanethioate Chemical group OCCCC(=O)SCCNC(CCNC([C@@H](C(COP(OP(OC[C@@H]1[C@H]([C@H]([C@@H](O1)N1C=NC=2C(N)=NC=NC12)O)OP(=O)(O)O)(=O)O)(=O)O)(C)C)O)=O)=O.OCCCC(=O)SCCNC(CCNC([C@@H](C(COP(OP(OC[C@@H]1[C@H]([C@H]([C@@H](O1)N1C=NC=2C(N)=NC=NC12)O)OP(=O)(O)O)(=O)O)(=O)O)(C)C)O)=O)=O IDJZVKFLJCAQHF-HRXFNJBOSA-N 0.000 description 1
- 244000253911 Saccharomyces fragilis Species 0.000 description 1
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 101710204410 Scaffold protein Proteins 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 241001480130 Schizosaccharomycetales Species 0.000 description 1
- 241000605036 Selenomonas Species 0.000 description 1
- 241000607715 Serratia marcescens Species 0.000 description 1
- 241000763410 Shuttleworthia satelles Species 0.000 description 1
- 244000044822 Simmondsia californica Species 0.000 description 1
- 235000004433 Simmondsia californica Nutrition 0.000 description 1
- FKNQFGJONOIPTF-UHFFFAOYSA-N Sodium cation Chemical compound [Na+] FKNQFGJONOIPTF-UHFFFAOYSA-N 0.000 description 1
- 244000061457 Solanum nigrum Species 0.000 description 1
- 241000131972 Sphingomonadaceae Species 0.000 description 1
- 241001185305 Sphingomonadales Species 0.000 description 1
- 241000194018 Streptococcaceae Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241000187432 Streptomyces coelicolor Species 0.000 description 1
- 241000187392 Streptomyces griseus Species 0.000 description 1
- 241000204060 Streptomycetaceae Species 0.000 description 1
- 102000019259 Succinate Dehydrogenase Human genes 0.000 description 1
- 108010012901 Succinate Dehydrogenase Proteins 0.000 description 1
- 241001648303 Succinivibrionaceae Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-NJFSPNSNSA-N Sulfur-34 Chemical compound [34S] NINIDFKCEFEMDL-NJFSPNSNSA-N 0.000 description 1
- NINIDFKCEFEMDL-AKLPVKDBSA-N Sulfur-35 Chemical compound [35S] NINIDFKCEFEMDL-AKLPVKDBSA-N 0.000 description 1
- 241000282890 Sus Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 241001657755 Thermincola potens Species 0.000 description 1
- 241001147775 Thermoanaerobacter brockii Species 0.000 description 1
- 241000186337 Thermoanaerobacter ethanolicus Species 0.000 description 1
- 241001137870 Thermoanaerobacterium Species 0.000 description 1
- 241001137871 Thermoanaerobacterium saccharolyticum Species 0.000 description 1
- 241000193446 Thermoanaerobacterium thermosaccharolyticum Species 0.000 description 1
- 241001147773 Thermoanaerobacterium xylanolyticum Species 0.000 description 1
- 241001133197 Thermosediminibacter oceani Species 0.000 description 1
- 102000002932 Thiolase Human genes 0.000 description 1
- 108060008225 Thiolase Proteins 0.000 description 1
- 102000004126 Thiolester Hydrolases Human genes 0.000 description 1
- 108010082788 Thiolester Hydrolases Proteins 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 241000589892 Treponema denticola Species 0.000 description 1
- 241001136486 Trichocomaceae Species 0.000 description 1
- 241000224527 Trichomonas vaginalis Species 0.000 description 1
- YZCKVEUIGOORGS-NJFSPNSNSA-N Tritium Chemical compound [3H] YZCKVEUIGOORGS-NJFSPNSNSA-N 0.000 description 1
- 241000204063 Tsukamurella paurometabola Species 0.000 description 1
- 241001034637 Tsukamurella paurometabola DSM 20162 Species 0.000 description 1
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 1
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 1
- 241000607265 Vibrio vulnificus Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 241000589651 Zoogloea Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 241000342876 [Clostridium] asparagiforme Species 0.000 description 1
- 241000186561 [Clostridium] clostridioforme Species 0.000 description 1
- 241001656805 [Clostridium] methylpentosum Species 0.000 description 1
- 241001656794 [Clostridium] saccharolyticum Species 0.000 description 1
- 241001531197 [Eubacterium] hallii Species 0.000 description 1
- 241001531183 [Eubacterium] yurii Species 0.000 description 1
- 241000029538 [Mannheimia] succiniciproducens Species 0.000 description 1
- 241001464867 [Ruminococcus] gnavus Species 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- 125000000218 acetic acid group Chemical group C(C)(=O)* 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 102000045404 acyltransferase activity proteins Human genes 0.000 description 1
- 108700014220 acyltransferase activity proteins Proteins 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 125000001204 arachidyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 229910052788 barium Inorganic materials 0.000 description 1
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 125000004369 butenyl group Chemical group C(=CCC)* 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000003575 carbonaceous material Substances 0.000 description 1
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- VEXZGXHMUGYJMC-OUBTZVSYSA-N chlorane Chemical compound [36ClH] VEXZGXHMUGYJMC-OUBTZVSYSA-N 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 150000001805 chlorine compounds Chemical class 0.000 description 1
- VEXZGXHMUGYJMC-IGMARMGPSA-N chlorine-35 Chemical compound [35ClH] VEXZGXHMUGYJMC-IGMARMGPSA-N 0.000 description 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 1
- 229960001231 choline Drugs 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000003931 cognitive performance Effects 0.000 description 1
- 239000002361 compost Substances 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000001944 continuous distillation Methods 0.000 description 1
- 238000007334 copolymerization reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- KFWWCMJSYSSPSK-PAXLJYGASA-N crotonoyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)/C=C/C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 KFWWCMJSYSSPSK-PAXLJYGASA-N 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 125000002704 decyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 229910052805 deuterium Inorganic materials 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 125000002897 diene group Chemical group 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 229910001882 dioxygen Inorganic materials 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229960000735 docosanol Drugs 0.000 description 1
- 125000003438 dodecyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- WQXNXVUDBPYKBA-YFKPBYRVSA-N ectoine Chemical compound CC1=[NH+][C@H](C([O-])=O)CCN1 WQXNXVUDBPYKBA-YFKPBYRVSA-N 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000000909 electrodialysis Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 229940092559 enterobacter aerogenes Drugs 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 150000002118 epoxides Chemical class 0.000 description 1
- 235000020774 essential nutrients Nutrition 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004136 fatty acid synthesis Effects 0.000 description 1
- 150000002191 fatty alcohols Chemical class 0.000 description 1
- 239000012526 feed medium Substances 0.000 description 1
- 238000005189 flocculation Methods 0.000 description 1
- 230000016615 flocculation Effects 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 238000012246 gene addition Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 235000021472 generally recognized as safe Nutrition 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 230000004110 gluconeogenesis Effects 0.000 description 1
- 230000004190 glucose uptake Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 150000002337 glycosamines Chemical class 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 239000001307 helium Substances 0.000 description 1
- 229910052734 helium Inorganic materials 0.000 description 1
- 125000003187 heptyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 125000006038 hexenyl group Chemical group 0.000 description 1
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 238000005984 hydrogenation reaction Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000002218 hypoglycaemic effect Effects 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000011261 inert gas Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 229940029339 inulin Drugs 0.000 description 1
- JYJIGFIDKWBXDU-MNNPPOADSA-N inulin Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)OC[C@]1(OC[C@]2(OC[C@]3(OC[C@]4(OC[C@]5(OC[C@]6(OC[C@]7(OC[C@]8(OC[C@]9(OC[C@]%10(OC[C@]%11(OC[C@]%12(OC[C@]%13(OC[C@]%14(OC[C@]%15(OC[C@]%16(OC[C@]%17(OC[C@]%18(OC[C@]%19(OC[C@]%20(OC[C@]%21(OC[C@]%22(OC[C@]%23(OC[C@]%24(OC[C@]%25(OC[C@]%26(OC[C@]%27(OC[C@]%28(OC[C@]%29(OC[C@]%30(OC[C@]%31(OC[C@]%32(OC[C@]%33(OC[C@]%34(OC[C@]%35(OC[C@]%36(O[C@@H]%37[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O%37)O)[C@H]([C@H](O)[C@@H](CO)O%36)O)[C@H]([C@H](O)[C@@H](CO)O%35)O)[C@H]([C@H](O)[C@@H](CO)O%34)O)[C@H]([C@H](O)[C@@H](CO)O%33)O)[C@H]([C@H](O)[C@@H](CO)O%32)O)[C@H]([C@H](O)[C@@H](CO)O%31)O)[C@H]([C@H](O)[C@@H](CO)O%30)O)[C@H]([C@H](O)[C@@H](CO)O%29)O)[C@H]([C@H](O)[C@@H](CO)O%28)O)[C@H]([C@H](O)[C@@H](CO)O%27)O)[C@H]([C@H](O)[C@@H](CO)O%26)O)[C@H]([C@H](O)[C@@H](CO)O%25)O)[C@H]([C@H](O)[C@@H](CO)O%24)O)[C@H]([C@H](O)[C@@H](CO)O%23)O)[C@H]([C@H](O)[C@@H](CO)O%22)O)[C@H]([C@H](O)[C@@H](CO)O%21)O)[C@H]([C@H](O)[C@@H](CO)O%20)O)[C@H]([C@H](O)[C@@H](CO)O%19)O)[C@H]([C@H](O)[C@@H](CO)O%18)O)[C@H]([C@H](O)[C@@H](CO)O%17)O)[C@H]([C@H](O)[C@@H](CO)O%16)O)[C@H]([C@H](O)[C@@H](CO)O%15)O)[C@H]([C@H](O)[C@@H](CO)O%14)O)[C@H]([C@H](O)[C@@H](CO)O%13)O)[C@H]([C@H](O)[C@@H](CO)O%12)O)[C@H]([C@H](O)[C@@H](CO)O%11)O)[C@H]([C@H](O)[C@@H](CO)O%10)O)[C@H]([C@H](O)[C@@H](CO)O9)O)[C@H]([C@H](O)[C@@H](CO)O8)O)[C@H]([C@H](O)[C@@H](CO)O7)O)[C@H]([C@H](O)[C@@H](CO)O6)O)[C@H]([C@H](O)[C@@H](CO)O5)O)[C@H]([C@H](O)[C@@H](CO)O4)O)[C@H]([C@H](O)[C@@H](CO)O3)O)[C@H]([C@H](O)[C@@H](CO)O2)O)[C@@H](O)[C@H](O)[C@@H](CO)O1 JYJIGFIDKWBXDU-MNNPPOADSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 1
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 125000002960 margaryl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000005374 membrane filtration Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000004065 mitochondrial dysfunction Effects 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 125000001421 myristyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 125000001196 nonadecyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 125000001400 nonyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000010742 number 1 fuel oil Substances 0.000 description 1
- 235000018343 nutrient deficiency Nutrition 0.000 description 1
- 125000002347 octyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000000065 osmolyte Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 125000000913 palmityl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 125000002958 pentadecyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 238000005373 pervaporation Methods 0.000 description 1
- 239000011846 petroleum-based material Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 229940097886 phosphorus 32 Drugs 0.000 description 1
- 125000005642 phosphothioate group Chemical group 0.000 description 1
- 125000005498 phthalate group Chemical class 0.000 description 1
- 230000036314 physical performance Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920000166 polytrimethylene carbonate Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000001294 propane Substances 0.000 description 1
- 125000004368 propenyl group Chemical group C(=CC)* 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 238000001223 reverse osmosis Methods 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- WJQCDDRZANTJDH-CITAKDKDSA-N s-[2-[3-[[(2r)-4-[[[(2r,3s,4r,5r)-5-(6-aminopurin-9-yl)-4-hydroxy-3-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-hydroxyphosphoryl]oxy-2-hydroxy-3,3-dimethylbutanoyl]amino]propanoylamino]ethyl] 4-oxobutanethioate Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCC=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 WJQCDDRZANTJDH-CITAKDKDSA-N 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 229910001415 sodium ion Inorganic materials 0.000 description 1
- 239000002195 soluble material Substances 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 125000004079 stearyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- IAHFWCOBPZCAEA-UHFFFAOYSA-N succinonitrile Chemical compound N#CCCC#N IAHFWCOBPZCAEA-UHFFFAOYSA-N 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- NINIDFKCEFEMDL-IGMARMGPSA-N sulfur-32 atom Chemical compound [32S] NINIDFKCEFEMDL-IGMARMGPSA-N 0.000 description 1
- NINIDFKCEFEMDL-OUBTZVSYSA-N sulfur-33 atom Chemical compound [33S] NINIDFKCEFEMDL-OUBTZVSYSA-N 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000005809 transesterification reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 125000002889 tridecyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 229910052722 tritium Inorganic materials 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 125000002948 undecyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- UATIGEHITDTAGF-CITAKDKDSA-N vinylacetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC=C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 UATIGEHITDTAGF-CITAKDKDSA-N 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-OUBTZVSYSA-N water-17o Chemical compound [17OH2] XLYOFNOQVPJJNP-OUBTZVSYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01003—Aldehyde dehydrogenase (NAD+) (1.2.1.3)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Cosmetics (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
- Coloring Foods And Improving Nutritive Qualities (AREA)
- Compositions Of Macromolecular Compounds (AREA)
Abstract
본 발명은 알데하이드 데하이드로게나제 변이체의 폴리펩타이드 및 코딩 핵산을 제공한다. 또한, 본 발명은 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 제공한다. 또한, 본 발명은, 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포 용해물을 이용하는 것을 포함하는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 본 발명은 또한 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포 용해물을 이용하는 것을 포함하는, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4- 부탄다이올 (1,4-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다.
Description
본 발명은 2017년 3월 31에 출원한 미국 가출원 번호 62/480,194호의 혜택을 주장하며, 상기 미국 가출원은 원용에 의해 본 명세서에 포함된다.
하기 가출원 및 국제 출원을 참조하며, 이들 출원은 원용에 의해 그 전체가 본 명세서에 포함된다: (1) 2017년 3월 31일자 미국 가출원 번호 62/480,208, "3-하이드록시부티릴-COA 데하이드로게나제 변이체 및 사용 방법" (Attorney Docket No. 12956-409-888); (2) 2017년 3월 31일자 미국 가출원 번호 62/480,270, "발효 브로스로부터 1,3-부탄다이올을 수득하기 위한 방법 및 시스템" (Attorney Docket No. 12956-407-888); (3) 동일자에 출원된 국제 특허 출원번호 , "3-하이드록시부티릴-COA 데하이드로게나제 변이체 및 사용 방법" (Attorney Docket No. 12956-409-228); 및 (4) 동일자에 출원된 국제 특허 출원번호 , "발효 브로스로부터 1,3-부탄다이올을 수득하기 위한 방법 및 시스템" (Attorney Docket No. 12956-407-228).
본 출원은 2018년 3월 27일에 ASCII 텍스트 파일로서 작성된 498,061byte 크기의 파일명 "12956-408-228_Sequence_Listing.txt"의 서열목록을 원용에 의해 본 명세서에 포함한다.
본 발명은 바람직한 생산물을 생산하기 위해 조작된 유기체, 바람직한 생산물의 생산을 촉진하는 조작된 효소에 관한 것이며, 보다 상세하게는 3-하이드록시부티르알데하이드, 1,3-부탄다이올, 4-하이드록시부티르알데하이드, 1,4- 부탄다이올 및 관련 생산물 및 이들로부터 유래된 생산물과 같이 바람직한 생산물을 생산하는 효소 및 세포에 관한 것이다.
다양한 범용 화학제 (commodity chemical)들이 상업적인 용도의 원하는 제품을 제조하는데 사용된다. 다수의 범용 화학제들은 석유로부터 유래한다. 이러한 범용 화학제들은 용매, 수지, 폴리머 전구체 및 특수 화학제로서의 용도를 비롯해 다양한 용도를 가진다. 바람직한 상용 화학제로는 4-탄소 분자, 예를 들어, 1,4-부탄다이올 및 1,3-부탄다이올, 업스트림 전구체 및 다운스트림 생산물 등이 있다. 석유-기재 생산물을 위한 재생가능한 소스를 공급하고 에너지 및 자본 집약적인 공정을 제공하기 위해, 범용 화학제의 제조 방법을 개발할 것이 요망되고 있다.
즉, 바람직한 생산물을 용이하게 제조하는 방법이 요구되고 있다. 본 발명은 이러한 요구를 충족시키며, 물론 관련 이점을 제공한다.
본 발명은 알데하이드 데하이드로게나제 변이체의 폴리펩타이드 및 코딩 핵산을 제공한다. 또한, 본 발명은 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 제공한다. 또한, 본 발명은, 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포용해물 (lysate)을 이용하는 것을 포함하는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 본 발명은 또한 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포용해물을 이용하여, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO), 또는 이의 에스테르 또는 아미드를 제조하는 방법을 제공한다.
도 1은 알데하이드 데하이드로게나제를 포함하는 1,3-부탄다이올 (1,3-BDO) 경로의 예를 나타낸 것이다. 도 1은 아세토아세틸-CoA로부터 1,3-부탄다이올까지의 경로를 나타낸다. 효소는 다음과 같다: (A) 아세토아세틸-CoA 리덕타제 (CoA-의존적, 알데하이드 형성); (B) 3-옥소부티르알데하이드 리덕타제 (케톤 환원); (C) 3-하이드록시부티르알데하이드 리덕타제, 본원에서 1,3-부탄다이올 데하이드로게나제로도 지칭됨; (D) 아세토아세틸-CoA 리덕타제 (CoA-의존적, 알코올 형성); (E) 3-옥소부티르알데하이드 리덕타제 (알데하이드 환원); (F) 4-하이드록시, 2-부타논 리덕타제; (G) 아세토아세틸-CoA 리덕타제 (케톤 환원); (H) 3-하이드록시부티릴-CoA 리덕타제 (알데하이드 형성), 본원에서 3-하이드록시부티르알데하이드 데하이드로게나제로도 언급됨; 및 (I) 3-하이드록시부티릴-CoA 리덕타제 (알코올 형성).
도 2는 알데하이드 데하이드로게나제를 포함하는 1,4-부탄다이올 (1,4-BDO) 경로의 예를 나타낸 것이다. 생합성 반응을 촉매하는 효소는 다음과 같다: (1) 숙시닐-CoA 신테타제; (2) CoA-비의존적인 숙시닉 세미알데하이드 데하이드로게나제; (3) α-케토글루타레이트 데하이드로게나제; (4) 글루타메이트:숙시네이트 세미알데하이드 트랜스아미나제; (5) 글루타메이트 데카르복실라제; (6) CoA-의존적인 숙시닉 세미알데하이드 데하이드로게나제; (7) 4-하이드록시부타노에이트 데하이드로게나제 (4-하이드록시부티레이트 데하이드로게나제로도 지칭됨); (8) α-케토글루타레이트 데카르복실라제; (9) 4-하이드록시부티릴 CoA:아세틸-CoA 트랜스퍼라제; (10) 부티레이트 키나제 (4-하이드록시부티레이트 키나제로도 지칭됨); (11) 포스포트랜스부티릴라제 (포스포-트랜스-4-하이드록시부티릴라제로도 지칭됨); (12) 알데하이드 데하이드로게나제 (4-하이드록시부티릴-CoA 리덕타제로도 지칭됨); (13) 알코올 데하이드로게나제 (4-하이드록시부타날 리덕타제 또는 4-하이드록시부티르알데하이드 리덕타제로도 지칭됨).
도 3은 ALD-1, ALD-2 및 ALD-3의 서열을 정렬한 것이다. 서열은 각각 서열번호 1, 2 및 3이다. 도에서 밑줄 친 부분은 2개의 루프 영역으로, 첫번째는 A로, 두번째는 B로 표시되며, 이 둘다 본원에서 결정된 바와 같이 기질 특이성 및 거울상이성질체 특이성에 관여한다. ALD-1에서 루프 A는 서열 LQKNNETQEYSINKKWVGKD (서열번호 124)이고, ALD-2의 경우 서열 IGPKGAPDRKFVGKD (서열번호 125)이며, ALD-3의 경우 서열 ITPKGLNRNCVGKD (서열번호 126)이다. 루프 B는, ALD-1의 경우 서열 SFAGVGYEAEGFTTFTIA (서열번호 127)이고, ALD-2의 경우 서열 TYCGTGVATNGAHSGASALTIA (서열번호 128)이고, ALD-3의 경우 서열 SYAAIGFGGEGFCTFTIA (서열번호 129)이다. ALD-2의 기질 특이성 루프 A 및 B의 서열과 길이는, ALD-1 및 ALD-3의 것과는 상이하지만; 그럼에도 불구하고, 정렬에서, 특히 도 6에 도시된 바와 같이 3D 모델링과 조합할 경우, 본원에 언급된 치환 대응 위치를 쉽게 동정할 만큼 충분한 보존성이 드러난다. ALD-3는 결정 구조를 모델링하기 위한 주형으로서 사용하였으며; 특히 본원에 기술된 예시적인 치환으로 변환하였을 때, 상호작용하여 기질 특이성 및 거울상이성질체 특이성에 영향을 주는 2개의 루프 영역을 나타낸 도 6을 참조한다. ALD-1과 ALD-3의 동일성은 51.9%이다. ALD-1과 ALD-2의 동일성은 35.9%이다. ALD-3와 ALD-2의 동일성은 40%이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 A에 대한 컨센서스는 IXPKG-----XXNRKXVGKD (서열번호 5)이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 B에 대한 컨센서스는 SYAGXGXXXE----GFXTFTIA (서열번호 6)이다. 컨센서스 서열에서 특이적으로 동정된 아미노산은 보존적인 잔기이고, "X"로 표시된 위치는 가변적이며, 본원에 기술된 바람직한 임의의 아미노산에 해당할 수 있는 것으로, 이해된다. "---"은 아미노산 잔기들이 가변적인 갯수로 존재하거나 또는 존재하는 않는 것에 해당할 수 있는 것으로 추가로 이해된다. 이러한 가변적인 갯수의 아미노산 잔기들의 예를 도 3 및 4a-4c에 나타낸다. 나아가, 컨센서스 서열에서 보존적인 잔기는 예를 들어 본원에 기술된 바와 같이 보존적인 아미노산으로 치환될 수 있는 것으로 이해된다 (예, 도 4a-4c 참조).
도 4a-4c는 예시적인 알데하이드 데하이드로게나제 (ALD)들을 정렬한 것으로, 나타낸 정렬은 본 발명의 치환이 행해질 수 있는 각 주형 ALD 서열 내 위치에 해당되는 ALD 내 위치를 동정하는 것을 보여준다. 도 3에서와 같이, 밑줄 친 부분은 2개의 루프 영역, 즉 A로 명명된 첫번째 것과 B로 명명된 두번째 것으로, 이 둘다 본원에서 결정된 바와 같이 기질 특이성 및 거울상이성질체 특이성에 관여한다. 도 4a는 ALD-1과 비교해 컷오프가 40-55%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4a에 나타낸 바와 같이 서열번호 1 (ALD-1), 13, 20 및 24이다. 도 4b는 ALD-1과 비교해 컷오프가 75-90%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4b에 나타낸 바와 같이 서열번호 1 (ALD-1), 30, 33 및 37이다. 루프 A와 B는 밑줄 표시된다. 도 4c는 ALD-1과 비교해 컷오프가 90%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4c에 나타낸 바와 같이 서열번호 1 (ALD-1), 38, 40 및 44이다. ALD-1은 서열번호 38, 40 및 44와 각각 99%, 97% 및 95% 동일하다. 도 4a-4c는, 본원에 교시된 대응되는 치환 위치를, ALD-1, 특히 루프 A 및 B 영역, 특히 고도로 보존적인 루프 B 영역과의 동일성이 40% 이상인 ALD에서 동정할 수 있음을, 보여준다.
도 5a 및 5b는 다양한 예시적인 알데하이드 데하이드로게나제들의 효소 활성을 나타낸 것이다. 도 5a는 3 하이드록시-(R)-부티르알데하이드 (막대 세트에서 좌측 막대) 및 3 하이드록시-(S)-부티르알데하이드 (막대 세트에서 우측 막대)에 대한 ALD-2, ALD-1 및 ALD-1 변이체의 비활성 (specific activity)을 보여준다. 도 5b는 3-하이드록시부티르알데하이드의 R 대 S 형태의 활성비를 나타낸다.
도 6a-6c는 알데하이드 데하이드로게나제 959의 구조를 나타낸 리본 다이아그램을 도시한 것이다. 다이아그램은 3-하이드록시-(R)-부티르알데하이드 (도 6a) 또는 3-하이드록시-(S)-부티르알데하이드 (도 6b)가 959의 구조에 도킹하는 것을 도시한다. 도 6c는 3-하이드록시-(R)-부티르알데하이드 (R3HB)와 동일한 배향성 (orientation)을 나타낸다.
도 2는 알데하이드 데하이드로게나제를 포함하는 1,4-부탄다이올 (1,4-BDO) 경로의 예를 나타낸 것이다. 생합성 반응을 촉매하는 효소는 다음과 같다: (1) 숙시닐-CoA 신테타제; (2) CoA-비의존적인 숙시닉 세미알데하이드 데하이드로게나제; (3) α-케토글루타레이트 데하이드로게나제; (4) 글루타메이트:숙시네이트 세미알데하이드 트랜스아미나제; (5) 글루타메이트 데카르복실라제; (6) CoA-의존적인 숙시닉 세미알데하이드 데하이드로게나제; (7) 4-하이드록시부타노에이트 데하이드로게나제 (4-하이드록시부티레이트 데하이드로게나제로도 지칭됨); (8) α-케토글루타레이트 데카르복실라제; (9) 4-하이드록시부티릴 CoA:아세틸-CoA 트랜스퍼라제; (10) 부티레이트 키나제 (4-하이드록시부티레이트 키나제로도 지칭됨); (11) 포스포트랜스부티릴라제 (포스포-트랜스-4-하이드록시부티릴라제로도 지칭됨); (12) 알데하이드 데하이드로게나제 (4-하이드록시부티릴-CoA 리덕타제로도 지칭됨); (13) 알코올 데하이드로게나제 (4-하이드록시부타날 리덕타제 또는 4-하이드록시부티르알데하이드 리덕타제로도 지칭됨).
도 3은 ALD-1, ALD-2 및 ALD-3의 서열을 정렬한 것이다. 서열은 각각 서열번호 1, 2 및 3이다. 도에서 밑줄 친 부분은 2개의 루프 영역으로, 첫번째는 A로, 두번째는 B로 표시되며, 이 둘다 본원에서 결정된 바와 같이 기질 특이성 및 거울상이성질체 특이성에 관여한다. ALD-1에서 루프 A는 서열 LQKNNETQEYSINKKWVGKD (서열번호 124)이고, ALD-2의 경우 서열 IGPKGAPDRKFVGKD (서열번호 125)이며, ALD-3의 경우 서열 ITPKGLNRNCVGKD (서열번호 126)이다. 루프 B는, ALD-1의 경우 서열 SFAGVGYEAEGFTTFTIA (서열번호 127)이고, ALD-2의 경우 서열 TYCGTGVATNGAHSGASALTIA (서열번호 128)이고, ALD-3의 경우 서열 SYAAIGFGGEGFCTFTIA (서열번호 129)이다. ALD-2의 기질 특이성 루프 A 및 B의 서열과 길이는, ALD-1 및 ALD-3의 것과는 상이하지만; 그럼에도 불구하고, 정렬에서, 특히 도 6에 도시된 바와 같이 3D 모델링과 조합할 경우, 본원에 언급된 치환 대응 위치를 쉽게 동정할 만큼 충분한 보존성이 드러난다. ALD-3는 결정 구조를 모델링하기 위한 주형으로서 사용하였으며; 특히 본원에 기술된 예시적인 치환으로 변환하였을 때, 상호작용하여 기질 특이성 및 거울상이성질체 특이성에 영향을 주는 2개의 루프 영역을 나타낸 도 6을 참조한다. ALD-1과 ALD-3의 동일성은 51.9%이다. ALD-1과 ALD-2의 동일성은 35.9%이다. ALD-3와 ALD-2의 동일성은 40%이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 A에 대한 컨센서스는 IXPKG-----XXNRKXVGKD (서열번호 5)이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 B에 대한 컨센서스는 SYAGXGXXXE----GFXTFTIA (서열번호 6)이다. 컨센서스 서열에서 특이적으로 동정된 아미노산은 보존적인 잔기이고, "X"로 표시된 위치는 가변적이며, 본원에 기술된 바람직한 임의의 아미노산에 해당할 수 있는 것으로, 이해된다. "---"은 아미노산 잔기들이 가변적인 갯수로 존재하거나 또는 존재하는 않는 것에 해당할 수 있는 것으로 추가로 이해된다. 이러한 가변적인 갯수의 아미노산 잔기들의 예를 도 3 및 4a-4c에 나타낸다. 나아가, 컨센서스 서열에서 보존적인 잔기는 예를 들어 본원에 기술된 바와 같이 보존적인 아미노산으로 치환될 수 있는 것으로 이해된다 (예, 도 4a-4c 참조).
도 4a-4c는 예시적인 알데하이드 데하이드로게나제 (ALD)들을 정렬한 것으로, 나타낸 정렬은 본 발명의 치환이 행해질 수 있는 각 주형 ALD 서열 내 위치에 해당되는 ALD 내 위치를 동정하는 것을 보여준다. 도 3에서와 같이, 밑줄 친 부분은 2개의 루프 영역, 즉 A로 명명된 첫번째 것과 B로 명명된 두번째 것으로, 이 둘다 본원에서 결정된 바와 같이 기질 특이성 및 거울상이성질체 특이성에 관여한다. 도 4a는 ALD-1과 비교해 컷오프가 40-55%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4a에 나타낸 바와 같이 서열번호 1 (ALD-1), 13, 20 및 24이다. 도 4b는 ALD-1과 비교해 컷오프가 75-90%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4b에 나타낸 바와 같이 서열번호 1 (ALD-1), 30, 33 및 37이다. 루프 A와 B는 밑줄 표시된다. 도 4c는 ALD-1과 비교해 컷오프가 90%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4c에 나타낸 바와 같이 서열번호 1 (ALD-1), 38, 40 및 44이다. ALD-1은 서열번호 38, 40 및 44와 각각 99%, 97% 및 95% 동일하다. 도 4a-4c는, 본원에 교시된 대응되는 치환 위치를, ALD-1, 특히 루프 A 및 B 영역, 특히 고도로 보존적인 루프 B 영역과의 동일성이 40% 이상인 ALD에서 동정할 수 있음을, 보여준다.
도 5a 및 5b는 다양한 예시적인 알데하이드 데하이드로게나제들의 효소 활성을 나타낸 것이다. 도 5a는 3 하이드록시-(R)-부티르알데하이드 (막대 세트에서 좌측 막대) 및 3 하이드록시-(S)-부티르알데하이드 (막대 세트에서 우측 막대)에 대한 ALD-2, ALD-1 및 ALD-1 변이체의 비활성 (specific activity)을 보여준다. 도 5b는 3-하이드록시부티르알데하이드의 R 대 S 형태의 활성비를 나타낸다.
도 6a-6c는 알데하이드 데하이드로게나제 959의 구조를 나타낸 리본 다이아그램을 도시한 것이다. 다이아그램은 3-하이드록시-(R)-부티르알데하이드 (도 6a) 또는 3-하이드록시-(S)-부티르알데하이드 (도 6b)가 959의 구조에 도킹하는 것을 도시한다. 도 6c는 3-하이드록시-(R)-부티르알데하이드 (R3HB)와 동일한 배향성 (orientation)을 나타낸다.
본 발명은 바람직한 특성을 가지며 바람직한 생산물을 제조하는데 사용가능한 효소 변이체에 관한 것이다. 특정 구현예에서, 본 발명은, 자연에서 생기는 야생형 효소와 비교해, 특히 다른 구조 및/또는 기능적 특징을 가진, 효소 변이체인, 알데하이드 데하이드로게나제 변이체, 즉, 본 발명의 알데하이드 데하이드로게나제 또는 비-천연성 효소에 관한 것이다. 본 발명의 알데하이드 데하이드로게나제 변이체는, 바람직한 생산물을 생산하도록 조작된, 미생물 유기체와 같은 조작된 세포에서 유용하다. 예를 들어, 본원에 기술된 바와 같이, 대사 경로를 가진 미생물 유기체와 같은 세포는 바람직한 생산물을 생산할 수 있다. 바람직한 특징을 가진 본 발명의 알데하이드 데하이드로게나제는, 바람직한 생산물을 생산하기 위해 알데하이드 데하이드로게나제 효소 활성을 이용하는 대사 경로를 가진, 미생물 유기체와 같은 세포에 도입될 수 있다. 이러한 알데하이드 데하이드로게나제 변이체는 시험관 내에서 바람직한 반응을 수행하기 위한 생체 촉매로서 부가적으로 유용하다. 즉, 본 발명의 알데하이드 데하이드로게나제 변이체는, 바람직한 생산물을 생산하기 위한 시험관 내 생체 촉매로서 또는 바람직한 생산물을 생산하기 위해 미생물 유기체와 같은 조작된 세포에서 이용될 수 있다.
본원에서, 본 발명의 세포, 미생물 유기체 또는 미생물에 대해 사용되는 경우, 용어 "비-천연성"은, 세포가 언급된 종의 야생형 균주를 비롯해, 언급된 종의 천연 균주에서 통상적으로 발견되지 않는 하나 이상의 유전자 변형을 가지는 것을 의미하는 것으로 의도된다. 유전자 변형으로는, 예를 들어, 대사 폴리펩타이드를 코딩하는 발현가능한 핵산을 도입하는 변형, 그외 핵산 부가, 핵산 결손 및/또는 세포 유전 물질의 그외 기능적인 파괴 등이 있다. 이러한 변형은, 예를 들어, 언급된 종들에 대해 이종의 폴리펩타이드, 상동적인 폴리펩타이드 또는 이종의 폴리펩타이드 및 상동적인 폴리펩타이드에 대한, 코딩 영역 및 이의 기능성 단편을 포함한다. 부가적인 변형으로는, 예를 들어, 변형이 유전자 또는 오페론의 발현을 변이시키는, 비-코딩 조절 영역을 포함한다. 대사 폴리펩타이드의 예로는 바람직한 생산물을 생산하기 위한 생합성 경로에 속하는 효소 또는 단백질 등이 있다.
대사 변형은 천연적으로 발생된 상태로부터 변이된 생화학적 반응을 지칭한다. 따라서, 비-천연성 세포는 대사 폴리펩타이드 또는 이의 기능성 단편을 코딩하는 핵산에 유전자 변형을 가질 수 있다. 대사 변형의 예들은 본원에 기술되어 있다.
본원에서, 세포 또는 미생물 유기체를 언급할 때 사용되는 용어 "단리된"은, 언급된 세포가 자연에서 발견되는, 만일 이러한 세포가 자연에서 발견된다면, 하나 이상의 성분이 실질적으로 없는 세포를 의미하는 것으로 의도된다. 이 용어는 자연 환경에서 발견되는 성분들 중 일부 또는 전부가 제거된 세포를 포함한다. 또한, 이 용어는 세포가 비-천연성 환경에서 발견되는 성분들 일부 또는 전부가 제거된 세포를 포함한다. 따라서, 단리된 세포는, 자연에서 발견되거나 또는 비-천연성 환경에서 증식, 보관 또는 유지될 때의 기타 물질들로부터 부분적으로 또는 완전히 분리된다. 단리된 세포에 대한 구체적인 예로는 부분적으로 순수한 세포, 실질적으로 순수한 세포 및 비-천연성 매질에서 배양된 세포 등이 있다.
본원에서, 용어 "미생물 (microbial)", "미생물 유기체" 또는 "미생물 (microorganism)"은 고세균, 박테리아 또는 진핵생물류에 속하는 미시 세포로서 존재하는 모든 유기체를 의미한다. 즉, 이 용어는 미시적인 크기의 원핵생물 또는 진핵생물 세포 또는 유기체를 포괄하며, 모든 종의 박테리아, 고세균류 및 유박테리아 (eubacteria)뿐 아니라 효모 및 진균과 같은 진핵 미생물을 포괄하는 것으로 의도된다. 또한, 이 용어는 생화학적으로 생산하기 위해 배양할 수 있는 임의 종의 세포 배양물을 포함한다.
본원에서, 용어 "CoA" 또는 "코엔자임 A"는, 활성적인 효소 시스템을 만들기 위해 다수 효소 (주효소( apoenzyme))들의 활성에 필요한 유기 조인자 또는 보결기 (효소의 비-단백질 영역)를 의미한다. 코엔자임 A는 특정 축합 효소에 작용하며, 아세틸 또는 기타 아실기를 전달하는 작용을 하고, 지방산 합성 및 산화, 피루베이트 산화 및 기타 아세틸화에 관여한다.
본원에서, 용어 "실질적으로 혐기성"은 배양 또는 생장 조건에 대해 사용되는 경우, 산소의 양이 액체 매질에 용해된 산소 포화도 약 10% 미만인 것을 의미한다. 또한, 이 용어는 약 1% 미만의 산소 분위기로 유지되는 액체 또는 고체 배지가 든 밀폐된 챔버를 포괄하는 것으로 의도된다.
본원에서 "외인성"은 언급된 분자 또는 언급된 활성이 숙주 미생물 유기체로 도입되는 것을 의미한다. 분자는, 예를 들어, 숙주 염색체 또는 플라스미드와 같은 비-염색체성 유전 물질에의 삽입에 의해서와 같이, 코딩 핵산을 숙주 유전 물질에 도입함으로써, 도입될 수 있다. 따라서, 이 용어는, 코딩 핵산의 발현에 대해 사용되는 바와 같이, 코딩 핵산을 발현가능한 형태로 미생물 유기체에 도입하는 것을 의미한다. 생합성 활성에 대해 사용되는 경우, 이 용어는 숙주 참조 유기체에 도입되는 활성을 지칭한다. 그 소스는, 예를 들어 숙주 세포로 도입된 후 언급된 활성을 발현하는 동종의 또는 이종의 코딩 핵산일 수 있다. 따라서, 용어 "내인성"은 숙주에 존재하는 언급된 분자 또는 활성에 대해 사용된다. 마찬가지로, 이 용어는, 코딩 핵산의 발현에 대해 사용되는 경우, 세포에 포함된 코딩 핵산의 발현을 지칭한다. 용어 "이종"은 언급된 종 이외의 소스로부터 유래된 분자 또는 활성을 지칭하며, "동종"은 숙주 세포로부터 유래된 분자 또는 활성을 지칭한다. 즉, 본 발명의 코딩 핵산의 외인성 발현은 이종 또는 동종의 코딩 핵산 중 어느 하나 또는 둘다를 이용할 수 있다.
2 이상의 외인성 핵산이 세포에 함유된 경우, 2 이상의 외인성 핵산은 전술한 바와 같이 언급된 코딩 핵산 또는 생합성 활성을 지칭하는 것으로 이해된다. 또한, 본원에 기술된 바와 같이, 이러한 2 이상의 외인성 핵산은 숙주 세포에 개별 핵산 분자로, 폴리시스트론 핵산 분자로 또는 이의 조합으로 도입될 수 있으며, 여전히 2 이상의 외인성 핵산으로서 간주될 수 있는 것으로 또한 이해된다. 예를 들어, 본원에 기술된 바와 같이, 세포는 경로 효소 또는 단백질 등의 원하는 효소 또는 단백질을 코딩하는 2종 이상의 외인성 핵산을 발현하도록 조작될 수 있다. 원하는 활성을 코딩하는 2개의 외인성 핵산이 숙주 세포에 도입되는 경우, 이들 2개의 외인성 핵산은 단일 핵산으로서, 예를 들어 단일 플라스미드 형태로 또는 분리된 플라스미드 형태로 도입될 수 있으며, 숙주 염색체에서 단일 부위 또는 복수의 부위에 통합될 수 있으며, 여전히 2개의 외인성 핵산으로 간주되는 것으로 이해된다. 마찬가지로, 3개 이상의 외인성 핵산을, 숙주 유기체에 임의의 바람직한 조합으로, 예를 들어 단일 플라스미드로, 각각의 개별 플라스미드로 도입할 수 있으며, 숙주 염색체에 단일 위치 또는 복수 위치에 삽입될 수 있으며, 여전히 2 이상의 외인성 핵산, 예를 들어 3개의 외인성 핵산으로 간주되는 것으로 이해된다. 즉, 언급된 외인성 핵산 또는 생합성 활성의 수는 숙주 유기체에 도입되는 개별 핵산의 수를 지칭하는 것이 아니라, 코딩 핵산의 수 또는 생합성 활성의 수를 지칭한다.
본원에서, 용어 "유전자 파괴" 또는 이의 문법상 동의어는 코딩된 유전자 산물을 불활성화하거나 또는 감쇠시키는 유전자 변형을 의미하는 것으로 의도된다. 유전자 변형은, 예를 들어, 전체 유전자의 결손, 전사 또는 번역에 필수적인 조절 서열의 결손, 절단된 유전자 산물 (truncated gene product)을 만드는 유전자의 일부 결손이거나, 또는 코딩된 유전자 산물을 불활성화 또는 감쇠시키는 임의의 다양한 돌연변이 전략에 의한 것일 수 있다. 유전자를 파괴하기 위해 특히 사용가능한 방법은 완전한 유전자 결손 (complete gene deletion)이며, 이는 본 발명의 비-천연성으로 생성된 세포의 유전자 복귀 (genetic reversion) 발생을 줄이거나 없애기 때문이다. 또한, 유전자 파괴는, 유전자 또는 유전자 함유 영역에서 유전자를 RNA로 전사되지 않거나 및/또는 기능성 유전자 산물로 번역되지 않게 만드는 돌연변이를 의미하는, null 돌연변이를 포함한다. 이러한 null 돌연변이는, 예를 들어, 불활성화 점 돌연변이, 유전자 일부의 결손, 전체 유전자의 결손 또는 염색체 세그먼트의 결손 등의, 여러가지 타입의 돌연변이로부터 생길 수 있다.
본원에서, 용어 "증식-커플링된 (growth-coupled)"은, 생화학적 생산물의 생산에 대해 사용되는 경우, 언급된 생화학적 생산물의 생합성이 미생물의 증식 단계 중에 이루어지는 것을 의미한다. 특정 구현예에서, 증식-커플링된 생산은 필수적일 수 있으며, 이는 언급된 생화학적 생산물의 생합성이 미생물의 증식 단계 동안에 생산되는 필수 생산물 (obligatory product)이라는 것을 의미한다.
본원에서, 용어 "감쇠시킨다 (attenuate)" 또는 이의 문법상 동의어는 효소 또는 단백질의 활성 또는 양을 감쇠, 감소 또는 없애는 것을 의미한다. 효소 또는 단백질의 활성 또는 양적 감쇠는, 감쇠로 활성 또는 양이 소정의 기능에 필요한 임계 수준 미만으로 감소된다면, 완전한 파괴 (complete disruption)처럼 보일 수 있다. 그러나, 완전한 파괴, 예를 들어 하나의 경로에 대한 완전한 파괴처럼 보이는 효소 또는 단백질의 활성 또는 양의 감쇠는, 별개의 경로가 계속 기능하는데에는 여전히 충분할 수 있다. 예를 들어, 내인성 효소 또는 단백질의 감쇠가 본 발명의 바람직한 생산물을 생산하기 위해 동일한 효소 또는 단백질의 완전한 파괴를 모방하기에 충분할 순 있지만, 효소 또는 단백질의 잔류 활성 또는 양은 숙주 세포가 생존, 재생 또는 증식하는데 필수적인 경로와 같은 다른 경로를 유지시키기에는 여전히 충분할 수 있다. 또한, 효소 또는 단백질의 감쇠는 본 발명의 바람직한 생산물의 수율을 증가시키기에 충분한 수준으로 효소 또는 단백질의 활성 또는 양의 약화, 저하 또는 소실일 수 있으나, 효소 또는 단백질의 완전한 파괴를 반드시 모방하는 것은 아니다.
본 발명의 비-천연성 세포는 안정적인 유전자 변형을 포함할 수 있는데, 이는 상기한 변형을 소실하지 않으면서 5 세대를 초과하여 배양가능한 세포임을 의미한다. 일반적으로, 안정적인 유전자 변형은 10 세대를 넘어서까지 유지되는 변형을 포함하며, 특히 안정적인 변형은 약 25 세대 넘게 유지될 것이며, 보다 구체적으로는 안정적인 유전자 변형은 무한정을 비롯하여 50 세대 넘게 유지될 것이다.
유전자 파괴 경우, 특히 유용한 안정적인 변형은 유전자 결손이다. 안정적인 유전자 변형을 도입하기 위해 유전자 결손을 사용하는 것은 특히 유전자 변형 이전의 표현형으로 복구될 가능성을 줄이는데 유용하다. 예를 들어, 안정적인 증식-커플링된 생화합물의 생산은, 예를 들어, 대사 변형 세트에 포함된 하나 이상의 반응을 촉매하는 효소를 코딩하는 유전자를 결손시킴으로써, 달성할 수 있다. 증식-커플링된 생화합물의 생산 안정성은, 각각의 파괴된 활성에 대해 생기는 복수의 보완적인 복구 (compensatory reversion) 가능성을 현저하게 낮추는, 복수의 결손을 통해 추가적으로 강화될 수 있다.
당해 기술 분야의 당업자라면, 본원에 예시된 대사 변형을 포함한 유전자 변형이, E. coli와 같은 적절한 숙주 세포 또는 유기체 및 이의 대응되는 대사 반응 또는 바람직한 대사 경로를 위한 유전자 등의 바람직한 유전 물질에 대해 적합한 소스 세포 또는 유기체를 참조하여 기술됨을, 이해할 것이다. 그러나, 매우 다양한 유기체의 전체 게놈 서열 분석 및 게놈학 분야의 높은 기술 수준을 감안하면, 당해 기술 분야의 당업자는 본원에 기술된 교시 내용 및 지침을 기본적으로 다른 모든 유기체들에도 적용할 수 있음을 쉽게 알 것이다. 예를 들어, 본원에 예시된 E. coli의 대사 변형은 언급된 종이 아닌 다른 종 유래의 동일한 또는 유사한 코딩 핵산을 병합함으로써, 다른 종에도 쉽게 적용할 수 있다. 이러한 유전자 변형으로는, 예를 들어 일반적으로 종 상동체 (species homolog)의 유전자 변형 등이 있으며, 구체적으로 오르소로그 (ortholog), 파라로그 (paralog) 또는 비-오르소로그 유전자 치환 (non-orthologous gene displacement)을 포함한다.
오르소로그는, 수직 직계 (vertical descent) 관계이면서 상이한 유기체들에서 실질적으로 동일하거나 상동한 기능을 담당하는, 유전자 또는 유전자들이다. 예를 들어, 마우스 에폭사이드 하이드롤라제와 인간 에폭사이드 하이드롤라제는 에폭사이드의 가수분해라는 생물학적 기능 측면에서 오르소로그로 간주할 수 있다. 예를 들어, 유전자들이 상동적이거나 또는 공통 조상으로부터 진화적으로 관련있는 것으로 나타내기에 충분한 서열 유사성을 공유하는 경우, 이들 유전자들은 수직 직계 관계이다. 또한, 유전자가, 3차 구조를 공유하지만, 1차 서열 유사성이 확인불가한 수준으로 공통 조상으로부터 진화된 것임을 의미하는 충분한 수준의 서열 유사성을 반드시 가지고 있지 않은 경우에도, 오르소로그로 간주할 수 있다. 오르소로그인 유전자들은 아미노산 서열 아이덴터티 약 25% 내지 100%의 서열 유사성을 가진 단백질을 코딩할 수 있다. 25% 미만의 아미노산 유사성을 공유하는 단백질을 코딩하는 유전자들 역시, 이들의 3차원 구조에 유사성이 있다면, 수직 직계에 의해 생겨난 것으로 간주할 수 있다. 조직 플라스미노겐 활성인자 및 엘라스타제 등의 세린 프로테아제 패밀리 효소에 속하는 구성원들은 공통 조상으로부터 수직 직계에 의해 생겨난 것으로 간주된다.
오르소로그는, 예를 들어, 진화를 통해 구조적으로 또는 전체 활성 측면에서 분화된 유전자 또는 이로 코딩되는 유전자 산물을 포함한다. 예를 들어, 어떤 종이 2가지 기능을 나타내는 유전자 산물을 코딩하고 있으며 이 기능들이 제2의 종에서 별개의 유전자들로 분리되어 있다면, 이들 유전자 3개와 대응되는 산물은 오르소로그로 간주된다. 당해 기술 분야의 당업자라면, 생화학적 산물 제조시, 비-천연성 세포를 구축하기 위해 도입 또는 파괴시킬 대사 활성을 가지고 있는 오르소로그 유전자를 선택해야 함을, 알 것이다. 분리가능한 활성들을 나타내는 오르소로그의 예는, 개개 활성이 2종 이상의 종들에서 또는 하나의 종에서 개별 유전자 산물로 분리되어 있는 경우이다. 구체적인 예는, 세린 프로테아제 활성의 2가지 타입인 엘라스타제 단백질 분해 활성과 플라스미노겐 단백질 분해 활성이, 플라스미노겐 활성인자 및 엘라스타제로서 개별 분자로 분리되는 경우이다. 두 번째 예는, 마이코플라스마 5'-3' 엑소뉴클레아제와 드로소필라 DNA 폴리머라제 III 활성이 분리된 경우이다. 첫 번째 종 유래의 DNA 폴리머라제는, 2번째 종 유래의 엑소뉴클레아제 또는 폴리머라제 중 어느 하나 또는 이들 둘다에 대해 오르소로그인 것으로 간주할 수 있으며, 그 역도 성립할 수 있다.
이와는 반대로, 파라로그는, 예를 들어, 복제 및 이후 진화적 분화 관계에 있는 상동체이며, 기능이 유사하거나 또는 공통적이지만, 동일하진 않다. 파라로그는, 예를 들어, 동일 종 또는 다른 종으로부터 기원하거나 또는 유래할 수 있다. 예를 들어, 마이크로솜 에폭사이드 하이드롤라제 (에폭사이드 하이드롤라제 I)와 용해성 에폭사이드 하이드롤라제 (에폭사이드 하이드롤라제 II)는, 이들이 별개의 반응을 촉매하고 동일 종에서 다른 기능을 가지고 있는, 공통 조상으로부터 함께 진화된 2개 별개의 효소이므로, 파라로그로 간주할 수 있다. 파라로그는 서로 유의미한 수준의 서열 유사성을 보이는 동일한 종으로부터 유래된 단백질들이므로, 이들은 상동적이거나 또는 공통 조상으로부터 함께 진화된 관계임을 시사한다. 파라로그 단백질 패밀리 그룹으로는 HipA 상동체, 루시퍼라제 유전자, 펩티다제 등이 있다.
비-오르소로그 유전자 치환 (nonorthologous gene displacement)은 다른 종에서 언급된 유전자의 기능을 치환할 수 있는 어떤 종 유래의 비-오르소로그 유전자이다. 치환은, 예를 들어 다른 종들에서 언급된 기능과 비교해, 기원 종에서 동일하거나 또는 유사한 작용을 실질적으로 수행할 수 있는 것을 포함한다. 일반적으로, 비-오르소로그 유전자 치환은 언급된 기능을 코딩하는 공지된 유전자와 구조적으로 관련있는 것으로 구분할 수 있지만, 구조적으로 관련성이 낮고 기능적으로 유사한 유전자 및 이의 유전자 산물도 그럼에도 불구하고 여전히 본 발명에 사용되는 용어의 의미에 포함될 것이다. 기능 유사성에는, 예를 들어 치환하고자 하는 기능을 코딩하는 유전자에 대해, 비-오르소로그 유전자 산물의 활성부 또는 결합부에서 어느 정도 이상의 구조 유사성이 요구된다. 따라서, 비-오르소로그 유전자는 예를 들어 파라로그 또는 비-관련 유전자 (unrelated gene)를 포함한다.
이에, 바람직한 생산물의 생합성 능력을 갖춘 본 발명의 비-천연성 세포를 동정하고 구축함에 있어, 당해 기술 분야의 당업자들은, 본 발명에 제공된 교시 내용 및 지침을 특정 종들에 적용하여, 대사 변형의 식별이 오르소로그의 동정 및 이의 함유 또는 불활성화를 포함할 수 있음을 알 것이다. 당해 기술 분야의 당업자라면, 또한, 파라로그 및/또는 비-오르소로그 유전자 치환이, 유사하거나 또는 실질적으로 유사한 대사 반응을 촉매하는 효소를 코딩하는 언급된 미생물에 존재하는 한, 진화적으로 관련있는 유전자들을 이용할 수 있다. 마찬가지로, 유전자를 파괴하는 경우, 진화적으로 관련있는 유전자들도 숙주 세포에서 파괴 또는 결손시켜, 파괴 대상할 효소 활성들의 기능적 중복성 (functional redundancy)을 낮추거나 또는 없앨 수 있다.
오르소로그, 파라로그 및 비-오르소로그 유전자 치환은 당해 기술 분야의 당업자에게 널리 공지된 방법으로 결정할 수 있다. 예를 들어, 2개의 폴리펩타이드에 대해 핵산 또는 아미노산 서열을 조사하여, 비교 서열들 간의 서열 동일성 및 유사성을 확인한다. 이러한 유사성을 토대로, 당해 기술 분야의 당업자는 유사성이 이들 단백질들이 공통 조상으로부터 진화된 관계임을 의미할 만큼 충분히 높은지를 결정할 수 있다. 당해 기술 분야의 당업자들에게 널리 공지된 알고리즘, 예를 들어 Align, BLAST, Clustal W 등으로 원 (raw) 서열의 유사성 또는 동일성을 비교 및 확인하고, 또한, 웨이트 또는 스코어를 할당할 수 있는 서열 내 갭의 존재나 유의 수준을 결정할 수 있다. 이들 알고리즘은 또한 당해 기술 분야에 공지되어 있으며, 뉴클레오타이드 서열 유사성 또는 동일성 결정에 마찬가지로 적용가능하다. 관계 (relatedness)를 정할 만큼 충분한 유사성에 대한 매개변수들은, 널리 공지된 통계학적 유사성 계산법, 또는 랜덤 폴리펩타이드 내에서 유사한 매칭을 발견할 확률, 그리고 확인된 매칭의 유의 수준을 토대로 산출된다. 2 이상 서열들에 대한 컴퓨터 비교는, 또한, 필요한 경우, 당해 기술 분야의 당업자에 의해 가시적으로 최적화될 수 있다. 관련 유전자 산물 또는 단백질은 높은 유사성, 예를 들어 25% 내지 100%의 서열 동일성을 가진 것으로 볼 수 있다. 비-관련 단백질은, 충분한 크기의 데이터베이스를 검색한다면, 우연히 발생할 수 있는 수준과 기본적으로 동일한, 동일성 (약 5%)을 가질 수 있다. 5% 내지 24%의 서열은, 비교 서열들과 관련성 있다고 판단할 만큼 충분한 상동성을 보이거나 또는 그렇지 않을 수 있다. 데이터 세트의 크기를 감안해 이러한 매칭의 유의 수준을 결정하기 위한 추가적인 통계학적 분석을 수행하여, 이들 서열들의 관련성을 결정할 수 있다.
BLAST 알고리즘을 이용하여 2 이상의 서열의 관계를 측정하기 위한 매개변수의 예는, 다음과 같을 수 있다. 간략하게는, 아미노산 서열 정렬은 BLASTP 버전 2.0.8 (1999년 1월 5일) 및 하기의 매개변수들을 사용하여 수행할 수 있다: 매트릭스: 0 BLOSUM62; 갭 오픈 (gap open): 11; 갭 연장 (gap extension): 1; x_드롭오프: 50; 예상: 10.0; 문자 크기: 3; 필터: 온 (on). 핵산 서열 정렬은 BLASTN 버전 2.0.6 (1998년 9월 16일) 및 하기의 매개변수들을 사용하여 수행할 수 있다: 매치: 1; 미스매치: -2; 갭 오픈: 5; 갭 연장: 2; x_드롭오프: 50; 예상: 10.0; 문자 크기: 11; 필터: 오프. 당해 기술 분야의 당업자는, 예를 들어 비교의 부타다이엔-기재 생산물성을 높이거나 낮추고 2 이상 서열의 관계를 정하기 위해, 상기한 매개변수에 어떤 변화를 가할 수 있음을 알 것이다.
일 구현예에서, 본 발명은 야생형 또는 모 (parent) 알데하이드 데하이드로게나제의 변이체인 알데하이드 데하이드로게나제를 제공한다. 본 발명의 알데하이드 데하이드로게나제는 아실-CoA를 이의 대응되는 알데하이드로 변환한다. 또한, 이 효소는 아실-CoA를 이의 대응되는 알데하이드로 변환하는 옥시도리덕타제로도 지칭될 수 있다. 이러한 본 발명의 알데하이드 데하이드로게나제는 반응 1.2.1.b, 옥시도리덕타제 (아실-CoA -> 알데하이드)로서 분류할 수 있는데, 여기서 앞의 숫자 3개는 기질 특이성과 독립적인 일반적인 변환 타입을 나타내는 효소 위원회 번호 (Enzyme Commission number)에서의 앞 숫자 3개이다. 본 발명의 알데하이드 데하이드로게나제의 효소 변환의 예로는, 비-제한적으로, 3-하이드록시부티릴-CoA에서 3-하이드록시부티르알데하이드 (3-HBal로도 지칭됨)로의 변환 (도 1 참조), 및 4-하이드록시부티릴-CoA에서 4-하이드록시부티르알데하이드로의 변환 (도 2 참조) 등이 있다. 본 발명의 알데하이드 데하이드로게나제를 사용해, 3-하이드록시부티르알데하이드 (3-HBal), 1,3-부탄다이올 (1,3-BDO), 4-하이드록시부티르알데하이드 (4-HBal), 1,4-부탄다이올 (1,4-BDO) 또는 다운스트림 산물과 같은 다른 바람직한 생산물, 예를 들어, 이의 에스테르 또는 아미드를, 적합한 대사 경로를 가진 미생물 유기체와 같은 세포에서 또는 시험관 내에서 생산할 수 있다. 예를 들어, 1,3-BDO를 생체 내 또는 시험관 내에서 산과 반응시켜, 예를 들어 리파제를 사용해 에스테르로 변환할 수 있다. 이러한 에스테르 화합물은 뉴트라수티컬 (nutraceutical), 의학적 및 식품 용도를 가질 수 있으며, 1,3-부탄다이올의 R-형태는 에너지원으로서 동물 및 인간에서 최적으로 이용되는 형태이기 때문에 (예, (미국에서 일반적으로 안전하다고 인정되는 물질 (Generally Recognized As Safe, GRAS)로 승인된 (R)-3-하이드록시부틸-R-1,3-부탄다이올 모노에스테르와 같은 케톤 에스테르, 및 (R)-3-하이드록시부티레이트 글리세롤 모노에스테르 또는 다이에스테르), 이 형태가 유용하다. 케톤 에스테르는 경구적으로 전달될 수 있으며, 이 에스테르 화합물은 신체에 의해 이용되는 R-1,3-부탄다이올을 분리한다 (예, WO2013150153 참조). 따라서, 본 발명은 개선된 효소 경로 및 미생물을 제공하여, 고도로 농화된 또는 기본적으로 거울상이성질체적으로 순수하며 추가적으로 부산물과 관련하여 개선된 순도 품질을 가진 1,3-부탄다이올, 즉 R-1,3-부탄다이올의 개선된 조성을 제공하는데, 특히 유용하다.
부틸렌 글리콜로도 지칭되는 1,3-부탄다이올은 식품 소스, 식품 성분, 착향제, 착향제용 용매 또는 용해제, 안정제, 유화제 및 항-미생물제 및 보존제로서 직접 사용하는 등의, 추가적인 식품 관련 용도를 가진다. 1,3-부탄다이올은 비경구 약물 용매로서 제약 산업에 사용된다. 1,3-부탄다이올은, 불용성 물질의 결정화를 방지하는 연화제 (emollient), 보습제 (humectant), 향료와 같은 수-난용성 물질에 대한 용해제, 및 항-미생물제 및 보존제로서 코스메틱스에 유용성을 가진다. 예를 들어, 이는 보습제로서, 특히 헤어 스프레이제 및 세팅 로션에서 보습제로서 사용할 수 있으며; 이는 에센셜 오일로부터 향 감소를 억제하고, 미생물에 의한 부패를 방지하며, 벤조에이트의 용매로서 사용된다. 1,3-부탄다이올은 0.1% 내지 50% 이상의 농도로 사용될 수 있다. 이는 헤어 및 샤워 제품, 눈 및 얼굴 메이크업, 향수, 개인 위생 제품 및 면도 및 피부 케어 제품에 사용된다 (예, the Cosmetic Ingredient Review board's report: "Final Report on the Safety Assessment of Butylene Glycol, Hexylene Glycol, Ethoxydiglycol, and Dipropylene Glycol", Journal of the American College of Toxicology, Volume 4, Number 5, 1985를 참조하며, 이는 원용에 의해 본 명세서에 포함됨). 이 보고서는 코스메틱스에서 1,3-부탄다이올 (부틸렌 글리콜)의 특별한 용도와 농도를 제시하고 있으며; 예를 들어, 이 보고서의 표 2 "제품 제형 데이터"를 참조한다.
일 구현예에서, 본 발명은 다음으로부터 선택되는 단리된 핵산 분자를 제공한다: (a) 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하는, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 기재된 아미노산 서열을 코딩하는 핵산 분자; (b) 고 엄격성 혼성화 조건 (highly stringent hybridization condition)에서 (a)의 핵산에 혼성하며, 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 코딩하는 핵산 서열을 포함하는, 핵산 분자; (c) 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하는, 루프 A (서열번호 5) 및/또는 루프 B (서열번호 6)의 컨센서스 서열을 포함하는 아미노산 서열을 코딩하는, 핵산 분자; 및 (d) (a) 또는 (b)에 상보적인 핵산 분자. 일 구현예에서, 하나 이상의 아미노산 치환 이외에도, 핵산 분자에 의해 코딩되는 아미노산 서열은, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 기재된 아미노산 서열에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 동일하다. 아미노산 서열은 표 1, 2 및/또는 3에 기술된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개 이상, 예를 들어, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 또는 43개를 포함할 수 있으며, 즉, 최대한으로는 치환이 있는 아미노산 위치들을 모두 포함할 수 있다.
또한, 본 발명은 본 발명의 핵산 분자를 포함하는 벡터를 제공한다. 일 구현예에서, 벡터는 발현 벡터이다. 일 구현예에서, 벡터는 이중 가닥 DNA를 포함한다.
또한, 본 발명은 본 발명의 알데하이드 데하이드로게나제 폴리펩타이드를 코딩하는 핵산을 제공한다. 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 분자는 또한 서열번호, GenBank 및/또는 GI 번호로 표시되는 핵산에 혼성하는 핵산 분자, 또는 서열번호, GenBank 및/또는 GI 번호로 표시되는 아미노산 서열을 코딩하는 핵산 분자에 혼성하는 핵산 분자를 포함할 수 있다. 혼성화 조건은 본원에 기술된 바와 같이 당해 기술 분야의 당업자들에게 잘 알려진 고 부타다이엔-기재 생산물성 혼성화 조건, 중간 부타다이엔-기재 생산물성 혼성화 조건 또는 저 부타다이엔-기재 생산물성 혼성화 조건을 포함할 수 있다. 마찬가지로, 본 발명에 사용될 수 있는 핵산 분자는 서열번호, GenBank 및/또는 GI 번호로 표시되는 핵산, 또는 서열번호, GenBank 및/또는 GI 번호로 표시되는 아미노산 서열을 코딩하는 핵산 분자에 혼성하는 핵산 분자에 대해 특정 %의 서열 동일성을 가진 것으로 기술될 수 있다. 예를 들어, 핵산 분자는 본원에 기술된 핵산에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 가질 수 있거나, 또는 동일할 수 있다.
엄격한 혼성화는 혼성된 폴리뉴클레오티드들이 안정적인 조건을 의미한다. 당해 기술 분야의 당업자들에게 공지된 바와 같이, 혼성된 폴리뉴클레오티드의 안정성은 하이브리드의 용융 온도 (Tm)를 반영한다. 일반적으로 혼성된 폴리뉴클레오티드의 안정성은 염 농도, 예를 들어 소듐 이온 농도 및 온도에 따라 달라진다. 혼성화 반응은 저 엄격성 조건에서 수행할 수 있으며, 이후 조건을 달리하여, 그러나 엄격성이 더 높은 조건에서 세척하여 수행할 수 있다. 혼성화의 엄격성에 대한 언급은 세척 조건에 관한 것이다. 고 엄격성 혼성화는 65℃ 및 0.018M NaCl 중에서 안정적으로 혼성된 폴리뉴클레오티드를 형성하는 핵산 서열만 혼성화를 허용하는 조건을 포함하며, 예를 들어, 하이브리드가 65℃, 0.018M NaCl 중에서 안정적이지 않다면, 본원에서 간주하는 바와 같이 고 엄격성 조건에서 안정적이지 않을 것이다. 고 엄격성 조건은, 예를 들어, 50% 포름아미드, 5X 덴하르트 용액, 5X SSPE, 0.2% SDS 및 42℃에서 혼성한 다음 0.1X SSPE 및 0.1% SDS에서 65℃ 하에 세척함으로써, 제공될 수 있다. 본원에 기술된 핵산 서열을 설명하는데 고 엄격성 혼성화 조건 이외의 혼성화 조건도 이용할 수 있다. 예를 들어, 중간 엄격성 혼성화 (moderately stringent hybridization)라는 표현은 50% 포름아미드, 5X 덴하르트 용액, 5X SSPE, 0.2% SDS 및 42℃에서 혼성한 다음 0.2X SSPE 및 0.2% SDS에서 42℃ 하에 세척하는 조건과 균등한 조건을 의미한다. 낮은 엄격성 혼성화라는 표현은 10% 포름아미드, 5X 덴하르트 용액, 6X SSPE, 0.2% SDS 및 22℃에서 혼성한 다음 1X SSPE 및 0.2% SDS에서 37℃ 하에 세척하는 조건과 균등한 조건을 의미한다. 덴하르트 용액은 1% Ficoll, 1% 폴리비닐피롤리돈 및 1% 소 혈청 알부민 (BSA)을 포함한다. 20X SSPE (소듐 클로라이드, 소듐 포스페이트, 에틸렌 다이아민 테트라아세트산 (EDTA))는 3M 소듐 클로라이드, 0.2M 소듐 포스페이트 및 0.025 M (EDTA)를 포함한다. 그외 적합한, 저, 중간 및 고 엄격성 혼성화 완충제 및 조건들은 당해 기술 분야의 당업자들에게 잘 알려져 있으며, 예를 들어, Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); 및 Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)에 기술되어 있다.
본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 분자는 본원에 기술된 뉴클레오티드 서열과 적어도 특정한 서열 동일성을 가질 수 있다. 이에, 본 발명의 일부 측면에서, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 분자는, 서열번호, GenBank 및/또는 GI 번호에 의해 본원에 기술된 핵산 또는 서열번호, GenBank 및/또는 GI 번호에 의해 본원에 기술된 아미노산 서열을 코딩하는 핵산 분자에 혼성하는 핵산 분자에 대해, 적어도 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상 동일한, 뉴클레오티드 서열을 가지거나, 또는 상기한 핵산과 동일하다.
서열 동일성 (상동성 또는 유사성으로도 알려져 있음)은 2종의 핵산 분자들 간의 또는 2종의 폴리펩타이드들 간의 서열 유사성을 의미한다. 동일성은 비교 목적으로 정렬될 수 있는 각 서열에서 위치를 비교함으로써 결정할 수 있다. 비교되는 서열의 한 위치에 동일한 염기 또는 아미노산이 존재한다면, 그 분자는 그 위치에서 동일한 것이다. 서열들 간의 동일성 정도는 서열들에 의해 공유되는 매칭되거나 또는 상동적인 위치의 개수에 대한 함수이다. 서열 동일성 %를 결정하기 위한 서열 2종 간의 정렬은, 예를 들어, Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)에 기술된 바와 같이, 당해 기술 분야에 공지된 소프트웨어 프로그램을 사용해 수행할 수 있다. 바람직하게는, 정렬에 디폴트 파라미터를 사용한다. 사용될 수 있는 당해 기술 분야에 잘 알려진 한가지 정렬 프로그램은 디폴트 파라미터로 설정된 BLAST 세트이다. 구체적으로, 프로그램은, 다음과 같은 디폴트 파라미터가 설정된 BLASTN 및 BLASTP이다: 유전자 코드 = 표준; 필터 = 없음; 가닥 = 양쪽; 컷오프 = 60; 기대 = 10; 매트릭스 = BLOSUM62; 기술 = 서열 50개; 분류 = 높은 점수 (HIGH SCORE); 데이터베이스 = 비-중복 (non-redundant), GenBank + EMBL + DDBJ + PDB + GenBank CDS translations + SwissProtein + SPupdate + PIR. 이들 프로그램들에 대한 상세 내용은 국립 생명공학 정보 센터에서 확인할 수 있다 (Altschul et al., " J. Mol . Biol. 215:403-410 (1990) 참조).
일부 구현예에서, 핵산 분자는 단리된 핵산 분자이다. 일부 구현예에서, 단리된 핵산 분자는 기준 폴리펩타이드의 변이체를 코딩하는 핵산 분자이며, 이때 (i) 기준 폴리펩타이드는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4 (서열번호 7-123)에 열거된 아미노산 서열을 가지며, (ii) 변이체는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4와 비교해, 하나 이상의 아미노산 치환을 포함하며, (iii) 하나 이상의 아미노산 치환은 표 1-3에 나타낸 아미노산 치환들로부터 선택된다. 표 1-3은 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 서열에 대한 비-제한적인 예시적인 변이체 목록을 제공한다. 일 구현예에서, 표 1-3의 각 변이체에서, 표시된 위치(들)를 제외한 위치들은 모두 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 서열과 동일하다. 아미노산 치환들은, 오리지날 아미노산을 나타내는 문자와, 그 다음에 오는 서열번호 1, 2, 3 또는 표 4의 서열에서 치환되는 아미노산의 위치를 나타내는 번호, 그리고 그 뒤에 오는 치환된 아미노산을 나타내는 문자로 표시된다. 예를 들어, "D12A"는, 서열번호 1 또는 2의 12번 위치의 아스파르트산이 알라닌으로 치환된 것을 의미한다. 아미노산을 나타내기 위해 사용된 단문자 코드는 당해 기술 분야에 공지된 표준 코드이다. 표 1-3에서 일부 변이체들은 치환 목록에 표시된 2 이상의 변형을 포함한다. 하나 이상의 아미노산 치환은 표 1-3에 열거된 변이체들 중 임의의 하나 또는 표 1-3에 열거된 2종 이상의 변이체들의 임의 조합으로부터 선택될 수 있다. 표 1-3의 단일한 변이체들로부터 선택되는 경우, 제조되는 변이체는 언급된 치환들 모두 또는 언급된 모든 치환들 보다 적은 수의 치환 등의, 선택된 변이체의 하나 이상의 치환을 포함할 수 있다. 치환이 표 1-3에서의 2 이상의 변이체들로부터 선택되는 경우, 제조되는 변이체는 언급된 모든 치환들 또는 언급된 전체 치환들 보다 적은 수의 치환 등의, 선택된 변이체의 하나 이상의 치환을 임의 조합으로 포함할 수 있으며, 예를 들어, 제조되는 변이체는 표 1-3에서의 단일한 변이체들로부터 유래되는 1, 2, 3 또는 4개의 치환을 포함할 수 있다. 추가적인 예로서, 제조되는 변이체는 표 1-3의 1, 2, 3, 4, 5 또는 그 이상의 선택된 변이체들로부터 선택되는 치환 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25 또는 그 이상을 포함할 수 있다. 일부 구현예에서, 제조되는 변이체는 표 1-3에서 선택된 변이체의 표시된 치환들을 모두 포함한다. 일부 구현예에서, 제조되는 변이체는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 서열과 하나 이상의 아미노산 치환 차이를 가지지만, 아미노산 치환은 25개 미만, 20개 미만, 10개 미만, 5개 미만, 4개 미만 또는 3개 미만이다. 일부 구현예에서, 제조되는 변이체는, 지정된 아미노산 치환에서만 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 서열과 상이한, 표 1-3으로부터 선택되는 변이체에 의해 표시되는 서열을 포함하거나, 그 서열로 필수적으로 구성되거나, 또는 그 서열로 구성된다.
일부 구현예에서, 핵산 분자는 기준 폴리펩타이드의 변이체를 코딩하는 단리된 핵산 분자이며 (기준 폴리펩타이드는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 아미노산 서열을 가짐), 변이체는 (i) 서열번호 1-3으로부터 선택되는 대응되는 변이체의 하나 이상의 아미노산 치환을 포함하며, (ii) 대응되는 변이체와 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상 또는 100%의 서열 동일성을 가진다. 제2 변이체가 대응되는 변이체와 100%의 서열 동일성을 가지는 경우, 제2 변이체는 표 1-3으로부터 선택되는 변이체에 의해 표시되는 서열을 포함하며, 아미노 말단 및 카르복시 말단 중 어느 하나 또는 양쪽에 하나 이상의 부가적인 아미노산을 가지거나 또는 가지지 않을 수 있다. 일부 구현예에서, 제조되는 변이체는 표 1-3으로부터 선택되는 대응되는 변이체에 대해 80% 이상, 85% 이상, 90% 이상 또는 95% 이상의 서열 동일성을 가지며; 일부 경우에, 동일성은 적어도 90% 이상 또는 그 보다 높다. 제조되는 변이체가 표 1-3으로부터 선택되는 대응되는 변이체에 대해 100% 미만으로 동일한 경우, 대응되는 변이체에 표시된 하나 이상의 아미노산 치환의 위치는 쉬프트될 수 있지만 (하나 이상의 아미노산이 삽입 또는 결손된 경우), 제조되는 변이체에 여전히 포함될 수 있다. 예를 들어, "D12A" (서열번호 1 또는 2에서 12번 위치)에 해당되는 아스파르트산에서 알라닌으로의 치환이 제조되는 변이체의 다른 위치에 존재할 수 있다. 아미노산이 비록 다른 위치에 표시된 치환에 해당되는지는 당해 기술 분야에서 잘 알려진 바와 같이 서열 정렬에 의해 확인할 수 있다. 일반적으로, 측면 서열이 다른 폴리펩타이드의 상동적인 서열과 정렬된 것으로 간주되도록, 치환된 아미노산 측면에 위치하는 아미노산의 동일성 또는 유사성을 나타내는 정렬은, 치환된 아미노산을 표 1-3의 대응되는 변이체에 대해 국소적으로 위치시킬 수 있어, 소정의 폴리펩타이드 체인 내 비록 쉬프트된 번호 위치에서 치환을 만들기 위한 대응되는 위치를 정할 수 있을 것이다. 일 구현예에서, 치환된 위치를 포함하여 적어도 3-15개의 아미노산을 포함하는 영역은, 대응되는 변이체 서열에서 치환된 아미노산 위치를 포함하여, 상대적으로 높은 동일성% (예, 90%, 95% 또는 100% 동일성)로 대응되는 변이체 서열과 국소 정렬될 것이다. 일부 구현예에서, 심지어 폴리펩타이드 체인의 다른 물리적 위치에서 발생한다면, 폴리펩타이드의 서열을 디폴트 파라미터를 적용한 BLASTP 정렬 알고리즘을 이용하였을 때 대응되는 변이체 서열의 지정된 위치에서 동일한 매치 또는 유사한 아미노산을 가진 대응되는 변이체와의 정렬을 비교한다면, 유사한 아미노산이 정렬 알고리즘의 디폴트 파라미터를 이용하여 대상 변이체 위치와 정렬하기에 충분한 화학적 특성을 가진 것으로 간주되는 경우, 표 1-3으로부터 선택되는 대응되는 변이체에 의해 표시된 하나 이상의 아미노산 치환 (예, 아미노산 치환들 전부 또는 그 보다는 적은 수의 아미노산 치환)이 소정의 변이체에 존재하는 것으로 간주된다.
일부 구현예에서, 본 발명의 핵산 분자는 본원의 다양한 임의 구현예에서 기술된 핵산에 상보적이다.
본 발명의 핵산 또는 본 발명의 폴리펩타이드는 야생형 모 세포, 예를 들어 서열번호 1, 2 또는 3과 같은 모 서열 또는 표 4에 기술된 서열을 배제할 수 있는 것으로 이해된다. 당해 기술 분야의 당업자라면 당해 기술 분야에 잘 알려진 바를 토대로 야생형 모 서열의 의미를 쉽게 이해할 것이다. 본 발명의 이러한 핵산은 자연에서 발견되는 천연 아미노산 서열을 코딩하는 핵산 서열을 배제할 수 있는 것으로 또한 이해된다. 마찬가지로, 본 발명의 폴리펩타이드는 자연에서 발견되는 아미노산 서열을 배제할 수 있다. 즉, 특정 구현예에서, 본 발명의 핵산 또는 폴리펩타이드는 본원에 기술된 바와 같으며, 단, 코딩된 아미노산 서열은 야생형 모 세포 또는 천연 아미노산 서열이 아니거나 및/또는 핵산 서열은 야생형 또는 천연 핵산 서열이 아니다. 천연 아미노산 또는 핵산 서열은 자연에서 발견되는 바와 같이 천연 유기체에서 발견되는 서열과 관련있는 것으로서 당해 기술 분야의 당업자에게 이해된다. 즉, 동일한 상태로 발견되지 않거나 또는 천연 유기체에서와 동일한 뉴클레오티드 또는 코딩된 아미노산 서열을 가진 것으로 발견되지 않는, 핵산 또는 아미노산 서열은 본 발명의 핵산 및/또는 아미노산 서열의 의미에 포함된다. 예를 들어, 본원에 기술된 변이체를 비롯하여, 모 서열과 하나 이상의 뉴클레오티드 또는 아미노산 위치에서 변형된 핵산 또는 아미노산 서열은, 비-천연성인 본 발명의 핵산 또는 아미노산 서열의 의미에 포함된다. 본 발명의 단리된 핵산 분자는 핵산 서열을 포함하는 천연적인 염색체 (naturally occurring chromosome)를 배제하며, DNA 결합 단백질과 같은 천연 세포에서 발견되는 다른 분자, 예를 들어 진핵생물 세포 내부의 염색체에 결합하는 히스톤 등의 단백질을 또한 배제할 수 있다.
이에, 본 발명의 단리된 핵산 서열은 천연 핵산 서열과 물질적 및 화학적 차이를 가진다. 본 발명의 단리된 또는 비-천연성 핵산은 자연에서 발견되는 천연 핵산 서열의 공유 결합 또는 비-공유 결합과 같은 화학 결합 일부 또는 전체를 포함하지 않거나 또는 필수적으로 가지지 않는다. 본 발명의 단리된 핵산은, 따라서, 예를 들어, 염색체에서 발견되는 천연 핵산 서열과는 다른 화학적 구조를 가짐으로써 천연 핵산과 차이를 가진다. 예를 들어, 천연 염색체로부터 단리된 핵산 서열을 분리시키는 포스포다이에스테르 결합을 절단함으로써, 상이한 화학적 구조가 생길 수 있다. 본 발명의 단리된 핵산은 또한 원핵생물 또는 진핵생물 세포에서 염색체 DNA에 결합하는 단백질로부터 핵산이 단리 또는 분리됨으로써 천연 핵산과 상이할 수 있으며, 따라서 서로 다른 비-공유 결합에 의해 천연 핵산과 상이할 수 있다. 원핵생물 기원의 핵산과 관련하여, 본 발명의 비-천연성 핵산은 염색체의 천연적인 화학 결합들 중 일부 또는 전부, 예를 들어 폴리머라제 또는 염색체 구조 단백질과 같은 DNA 결합 단백질에의 결합을 반드시 가지지 않거나, 또는 슈퍼코일드형과 같은 고차 구조가 아니다. 진핵생물 기원의 핵산과 관련하여, 본 발명의 비-천연성 핵산은 또한 동일한 내부 핵산 화학 결합 또는 염색질에서 발견되는 구조 단백질과의 화학 결합을 포함하지 않는다. 예를 들어, 본 발명의 비-천연성 핵산은 히스톤 또는 스캐폴드 단백질에 화학적으로 결합하지 않으며, 센트로미어 또는 텔로미어 형태로 포함되지 않는다. 즉, 본 발명의 비-천연성 핵산은, 천연적으로 발견되는 핵산 서열과는 다른 반 데르 발스 상호작용, 수소작용, 이온 결합 또는 정전기적 결합 및/또는 공유 결합을 포함하거나 또는 결핍되어 있으므로, 천연 핵산과 화학적으로 구분된다. 이러한 결합 차이는 핵산의 별개 영역 내에서 내부적으로 생길 수 있거나 (즉, cis), 또는 이러한 결합 차이는 트랜스로, 예를 들어, 염색체 단백질과의 상호작용에서 발생할 수 있다. 진핵생물 기원의 핵산의 경우, cDNA 내부 화학 결합이 염색체 DNA 상의 유전자의 서열인 공유 결합과 상이하므로, cDNA는 단리된 또는 비-천연성 핵산인 것으로 간주된다. 이에, 당해 기술 분야의 당업자라면, 단리된 또는 비-천연성 핵산이 천연 핵산과 완전히 다름을 이해한다.
일 구현예에서, 본 발명은 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열을 포함하며, 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하는, 단리된 폴리펩타이드를 제공한다. 일 구현예에서, 본 발명은 루프 A (서열번호 5) 및/또는 루프 B (서열번호 6)의 컨센서스 아미노산 서열을 포함하는 단리된 폴리펩타이드를 제공한다.
다른 구현예에서, 본 발명은, 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열을 포함하며; 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하고; 하나 이상의 아미노산 치환 이외의 다른 아미노산 서열이 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 동일한, 단리된 폴리펩타이드를 제공한다. 일 구현예에서, 아미노산 서열은 아미노산 1-100개의 위치에서 보존적인 아미노산 치환을 더 포함하며, 이들 위치는 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환 이외의 위치이다. 다른 구현예에서, 아미노산 서열은, 모 세포와 비교해 아미노산 2-300개의 위치에서, 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환이 아닌 다른 변형을 포함하지 않으며, 이들 위치는 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열들 2, 3, 4 또는 5개 간에 동일한 위치들로부터 선택된다. 일 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 표시된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개 또는 그 보다 많은 수의 치환을 포함하며, 예를 들어, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 또는 43, 즉, 최대한으로는 이들 아미노산 치환 위치들을 모두 포함한다.
일 구현예에서, 본 발명의 폴리펩타이드는 알데하이드 데하이드로게나제를 코딩한다. 일 구현예에서, 폴리펩타이드는 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환할 수 있다. 일 구현예에서, 폴리펩타이드는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있다. 일 구현예에서, 폴리펩타이드는 모 폴리펩타이드와 비교해 더 높은 활성을 가진다. 일 구현예에서, 폴리펩타이드는 3-하이드록시-(S)-부티릴-CoA와 비교해 3-하이드록시-(R)-부티릴-CoA에 대한 활성이 더 높다. 일 구현예에서, 폴리펩타이드는 아세틸-CoA와 비교해 3-하이드록시부티릴-CoA에 대해 더 높은 특이성을 가진다. 일 구현예에서, 폴리펩타이드는 아세틸-CoA와 비교해 4-하이드록시부티릴-CoA에 대해 더 높은 특이성을 가진다. 일 구현예에서, 폴리펩타이드는 세포 또는 세포 추출물에서 부산물을 적게 형성한다. 특정 구현예에서, 부산물은 에탄올 또는 4-하이드록시-2-부타논이다. 일 구현예에서, 폴리펩타이드는 모 폴리펩타이드와 비교해 더 높은 kcat를 가진다.
일부 구현예에서, 본 발명은, 서열번호 1, 2 또는 3 또는 표 4에 기재된 서열과 같이 본원에 기술된 아미노산 서열을 가지며; 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 변이체 아미노산 위치를 포함하는, 단리된 폴리펩타이드를 제공한다. 특히, 이러한 폴리펩타이드는, 아실-CoA를 대응되는 알데하이드로, 예를 들어, 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 또는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있는, 알데하이드 데하이드로게나제를 코딩한다. 일부 측면에서, 본 발명의 단리된 폴리펩타이드는 표 1, 2 및/또는 3에 표시된 하나 이상의 변이체 아미노산 위치 이외에, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 기재된 아미노산 서열에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 가지는 아미노산 서열을 포함하거나, 또는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 기재된 아미노산 서열과 동일하다. 변이체 아미노산 위치는 20개의 천연 아미노산, 변이체 아미노산 위치에 대응되는 위치에서의 야생형 또는 모 서열의 보존적인 치환 또는 본원에서 표 1, 2 및/또는 3에서 기술된 바와 같은 변이체 아미노산 위치에서의 특정 아미노산 중 임의의 하나를 포함할 수 있는 것으로 이해된다. 변이체 아미노산 위치들 중 임의의 위치를 조합하여 추가적인 변이체를 구축할 수 있는 것으로 또한 이해된다. 2 이상의 변이체 아미노산 위치들의 조합을 가진 변이체는 야생형 보다 높은 활성을 나타낸다. 즉, 본원에 예시된 바와 같이, 활성 변이체 아미노산 위치들을 조합함으로써 효소 변이체를 구축하였을 때, 개선된 특성을 가진 효소 변이체가 제조되었다. 당해 기술 분야의 당업자라면 당해 기술 분야의 당업자에게 잘 알려진 방법을 이용하여 하나의 변이 위치 또는 변이 위치들의 조합을 가진 폴리펩타이드를 쉽게 제조하여, 본원에 기술된 바와 같이, 증가된 활성, S 형태와 비교해 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 R 형태의 증가된 특이성, 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 증가된 특이성, 에탄올 또는 4-하이드록시-2-부타논과 같은 부산물 발생 감소, Kcat 증가, 생체 내 및/또는 시험관 내 안정성 증가 등과 같은 바람직한 특성을 가진 폴리펩타이드를 구축할 수 있다.
"상동성" 또는 "동일성" 또는 "유사성"은 2종의 폴리펩타이드 또는 2종의 핵산 분자들 간의 서열 유사성을 의미한다. 상동성은 비교를 위해 정렬할 수 있는 각 서열 내 위치를 비교함으로써 결정할 수 있다. 비교되는 서열 내 한 위치에 동일한 염기 또는 아미노산이 위치한다면, 그 분자는 그 위치에서 동일한 것이다. 서열들 간의 상동성 정도는 서열들에 공유된 매칭 또는 상동적인 위치들의 갯수에 대한 함수이다. 폴리펩타이드 또는 폴리펩타이드 영역 (또는 폴리뉴클레오티드 또는 폴리뉴클레오티드 영역)이 다른 서열에 대해 특정한 "서열 동일성" % (예, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%)를 가진다는 것은, 정렬하였을 때 아미노산 (또는 뉴클레오티드 염기)의 %로 서열 2개의 비교시 동일하다는 것을 의미한다.
특정 구현예에서, 본 발명은 본원에 기술된 임의의 조합으로 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 그 보다 많은 수의 변이를 포함하는 아미노산 서열을 가진 단리된 폴리펩타이드를 제공한다. 변이체는 표 1, 2 및/또는 3에 표시된 변이체들의 임의 조합을 포함할 수 있다. 일부 구현예에서, 단리된 폴리펩타이드는, 기준 폴리펩타이드가 서열번호 1, 2 또는 3 또는 표 4의 아미노산 서열을 가지고; 폴리펩타이드 변이체가 표 1-3으로부터 선택되고; 서열번호 1, 2 또는 3 또는 표 4의 서열에 대해 하나 이상의 아미노산 치환을 가진, 기준 폴리펩타이드에 대한 변이체이다.
일부 구현예에서, 단리된 폴리펩타이드는, 기준 폴리펩타이드가 서열번호 1, 2 또는 3 또는 표 4의 아미노산 서열을 가지는, 기준 폴리펩타이드에 대한 변이체이며, 폴리펩타이드 변이체는 서열번호 1, 2 또는 3 또는 표 4에 대해 하나 이상의 아미노산 치환을 포함하되 하나 이상의 아미노산 치환이 표 1-3으로부터 선택되며, 폴리펩타이드 변이체는 표 1-3으로부터 선택되는 대응되는 변이체와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가진다. 하나 이상의 아미노산 치환은 표 1-3에 열거된 임의의 하나의 변이체 또는 표 1-3에 열거된 2 이상의 변이체들의 임의 조합으로부터 선택될 수 있다. 표 1-3에서 단일한 변이체로부터 선택되는 경우, 제조되는 변이체는 언급된 치환들 모두 또는 언급된 전체 치환 보다 적은 수의 치환을 비롯하여, 임의 조합으로 하나 이상의 선택된 변이체들의 치환을 포함할 수 있다. 치환이 표 1-3에서 2 이상의 변이체 치환들로부터 선택되는 경우, 제조되는 변이체는 2 이상의 선택된 변이체들 각각으로부터 유래되는 표시된 치환들 모두 또는 그 보다 적은 수의 치환을 포함하여, 하나 이상의 선택된 변이체 치환을 임의 조합으로 포함할 수 있다. 예를 들어, 제조되는 변이체는 표 1-3에서의 단일한 변이체로부터 유래되는 1, 2, 3 또는 4개의 치환을 포함할 수 있다. 추가적인 예로서, 제조되는 변이체는 본원에 기술된 바와 같이, 최대한으로는 모든 위치가 치환되는 등의, 표 1-3의 1, 2, 3, 4, 5 또는 그 보다 많은 수의 선택 변이체들로부터 선택되는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25 또는 그 보다 많은 수의 치환을 포함할 수 있다. 일부 구현예에서, 제조되는 변이체는 표 1-3에 표시된 선택 변이체 치환들을 모두 포함한다. 일부 구현예에서, 제조되는 변이체는 서열번호 1, 2 또는 3 또는 표 4와 1개 이상에서 25개 미만, 20개 미만, 10개 미만, 5개 미만, 4개 미만 또는 3개 미만의 아미노산 치환 차이를 가진다. 일부 구현예에서, 제조되는 변이체는 표 1-3으로부터 선택되는 변이체에 의해 표시되는 서열을 포함하거나, 이로 필수적으로 구성되거나 또는 이로 구성되며, 서열번호 1, 2 또는 3 또는 표 4의 서열과의 표시된 아미노산 치환(들) 차이를 가진다.
일부 구현예에서, 제조되는 변이체는 표 1-3으로부터 선택되는 대응되는 변이체와 적어도 80%, 85%, 90% 또는 95%의 서열 동일성을 가지며; 일부 경우에, 동일성은 적어도 90% 또는 그 보다 높다. 제조되는 변이체가 표 1-3으로부터 선택되는 대응되는 변이체와의 동일성이 100% 미만인 경우, 대응되는 변이체에 대해 표시된 하나 이상의 아미노산 치환 위치가 쉬프트될 순 있지만 (예, 하나 이상의 아미노산이 삽입 또는 결손된 경우), 여전히 제조되는 변이체에 포함될 수 있다. 예를 들어, "D12A" (서열번호 1 또는 2에서 12번 위치)에 대응되는 글리신에서 글루탐산으로의 치환이 제조되는 변이체의 다른 위치에 존재할 수 있다. 아미노산이 비록 다른 위치에서 지정된 치환에 해당되는지는 전술한 바 및 기술 분야에서 잘 알려진 바와 같이 서열 정렬을 통해 결정할 수 있다. 일부 구현예에서, 표 1-3으로부터 선택되는 대응되는 변이체에 의해 표시되는 하나 이상의 아미노산 치환 (예를 들어, 아미노산 치환들 모두 또는 전체 보다 적은 수의 아미노산 치환)은, 심지어 폴리펩타이드 체인의 다른 물리적 위치에서 이루어진다면, 폴리펩타이드의 서열을 디폴트 파라미터를 적용한 BLASTP 정렬 알고리즘을 이용하는 경우 대응되는 변이체 서열의 지정된 위치에 동일한 매치 또는 유사한 아미노산을 가진 대응되는 변이체와의 정렬을 비교한다면, 유사한 아미노산이 정렬 알고리즘의 디폴트 파라미터를 이용하여 대상 변이체 위치와 정렬하기에 충분한 화학적 특성을 가진 것으로 간주되는 경우, 표 1-3으로부터 선택되는 대응되는 변이체로 표시되는 하나 이상의 아미노산 치환 (예, 아미노산 치환 전부 또는 전체 보다 적은 수의 아미노산 치환)이 소정의 변이체에 존재하는 것으로 간주된다.
변이는 단독으로 또는 조합하여 참조 폴리펩타이드, 예를 들어 야생형 (천연) 효소를 기준으로 활성을 개선 또는 유지하는 효소를 생산할 수 있다. 일부 측면에서, 본 발명의 폴리펩타이드는 표 1, 2 및/또는 3에 기술된 변이들의 임의 조합을 가질 수 있다. 표 1, 2 및/또는 3에 기술된 변이들의 임의 조합을 가진 본 발명의 폴리펩타이드는 아실-CoA를 대응되는 알데하이드로, 예를 들어, 3-하이드록시부티릴-CoA를 3- 하이드록시부티르알데하이드로 또는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있다. 이러한 폴리펩타이드의 제조 및 분석 방법들은 당해 기술 분야의 당업자들에게 잘 알려져 있다.
일부 구현예에서, 본 발명의 단리된 폴리펩타이는 1-100개의 아미노산 위치들, 또는 다른 예로 2-100개의 아미노산 위치들, 또는 다른 예로 3-100개의 아미노산 위치들, 또는 다른 예로 4-100개의 아미노산 위치들, 또는 다른 예로 5-100개의 아미노산 위치들, 또는 다른 예로 6-100개의 아미노산 위치들, 또는 다른 예로 7-100개의 아미노산 위치들, 또는 다른 예로 8-100개의 아미노산 위치들, 또는 다른 예로 9-100개의 아미노산 위치들, 또는 다른 예로 10-100개의 아미노산 위치들, 또는 다른 예로 15-100개의 아미노산 위치들, 또는 다른 예로 20-100개의 아미노산 위치들, 또는 다른 예로 30-100개의 아미노산 위치들, 또는 다른 예로 40-100개의 아미노산 위치들, 또는 다른 예로 50-100개의 아미노산 위치들, 또는 이들의 범위 보다 적은 수의 위치에 보존적인 아미노산 치환을 추가로 포함할 수 있으며, 이들 위치는 표 1, 2 및/또는 3에 표시된 변이체 아미노산 위치와는 다른 위치이다. 일부 측면에서, 보존적인 아미노산 서열은 화학적으로 보존적인 또는 진화적으로 보존적인 아미노산 치환이다. 보존적인 아미노산을 식별하는 방법들은 당해 기술 분야의 당업자들에게 널리 공지되어 있으며, 이중 임의의 방법을 사용해 본 발명의 단리된 폴리펩타이드를 구축할 수 있다.
일부 구현예에서, 본 발명의 단리된 폴리펩타이드는, 모 (야생형) 서열과 비교해, 2-300개의 아미노산 위치들, 또는 다른 예로 3-300개의 아미노산 위치들, 또는 다른 예로 4-300개의 아미노산 위치들, 또는 다른 예로 5-300개의 아미노산 위치들, 또는 다른 예로 10-300개의 아미노산 위치들, 또는 다른 예로 20-300개의 아미노산 위치들, 또는 다른 예로 30-300개의 아미노산 위치들, 또는 다른 예로 40-300개의 아미노산 위치들, 또는 다른 예로 50-300개의 아미노산 위치들, 또는 다른 예로 60-300개의 아미노산 위치들, 또는 다른 예로 80-300개의 아미노산 위치들, 또는 다른 예로 100-300개의 아미노산 위치들, 또는 다른 예로 150-300개의 아미노산 위치들, 또는 다른 예로 200-300개의 아미노산 위치들, 또는 다른 예로 250-300개의 아미노산 위치들, 또는 이들의 범위 내 임의 수의 위치에, 변형을 포함하지 않을 수 있으며, 그 위치는 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열 2, 3, 4 또는 5개들 간에 동일한 것으로부터 선택된다.
본원에 기술된 바와 같이, 알데하이드 데하이드로게나제의 폴리펩타이드 변이체 등의 변이체 폴리펩타이드가 모 폴리펩타이드와 비슷한 효소 반응, 예를 들어, 아실-CoA에서 이의 대응되는 알데하이드로의 변환, 예로, 3-하이드록시부티릴-CoA에서 3-하이드록시부티르알데하이드로의 변환 또는 4-하이드록시부티릴-CoA로부터 4-하이드록시부티르알데하이드로의 변환을 수행할 수 있는 것으로 이해된다. 알데하이드 데하이드로게나제 효소의 폴리펩타이드 변이체는, 비-제한적인 예로, 활성 증가, S 형태 대비 R 형태의 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 특이성 증가, 아세틸-CoA에 비해 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 에탄올 또는 4-하이드록시-2-부타논과 같은 부산물 형성 감소, kcat 증가, 생체 내 및/또는 시험관 내 안정성 증가 등 (실시예 참조)의, 폴리펩타이드에 유익한 특징을 제공하는 변이체를 포함할 수 있는 것으로, 또한 이해된다. 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드 보다 높거나 또는 적어도 동일한 활성을 나타낼 수 있으며, 즉 변이체 아미노산 위치(들)가 없는 모 폴리펩타이드와 비교해 더 높은 활성을 나타낼 수 있다. 예를 들어, 본 발명의 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드와 비교해 1.2, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 10 또는 심지어 그 보다 높은 배수의 변이체 폴리펩타이드 활성을 가질 수 있다 (실시예 참조). 그 활성은 본 발명의 알데하이드 데하이드로게나제가 동일한 분석 조건에서 야생형 또는 모 폴리펩타이드에 대한 기질을 생산물로 변환할 수 있는 능력을 지칭하는 것으로 이해된다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 S 형태 대비 R 형태의 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 특이성 증가, 예를 들어, 약 2-40배, 예를 들어, 2-35, 2-30, 2-25, 2-20, 2-15, 2-10 또는 2-5, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40 또는 심지어 더 높은 배수의 활성을 나타낼 수 있다. 이러한 특이성 증가는 예를 들어 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 R 형태/S 형태의 활성 비율에 의해 측정할 수 있다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 예를 들어, 1.5-100, 1.5-95, 1.5-90, 1.5-85, 1.5-80, 1.5-75, 1.5-70, 1.5-65, 1.5-60, 1.5-55, 1.5-50, 1.5-45, 1.5-40, 1.5-35, 1.5-30, 1.5-25, 1.5-20, 1.5-15, 1.5-10 또는 1.5-5, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ,15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100배 증가를 나타낼 수 있다. 이러한 특이성 증가는, 예를 들어, 아세틸-CoA에 대비 3-하이드록시부티릴-CoA 또는 4-하이드록시부티릴-CoA의 활성 비율에 의해 측정할 수 있다. 특이성은 3HB-CoA 또는 4HB-CoA에 대한 활성을 아세틸-CoA에 대한 활성으로 나누어 나타낸다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 에탄올 및/또는 4-하이드록시-2-부타논과 같은 부산물 형성 감소, 예를 들어, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%의 부산물 형성 감소를 나타낼 수 있다. 이러한 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드, 즉 변이체 아미노산 위치가 없는 모 폴리펩타이드와 비교해, 전술한 바와 같이, 부산물 형성 감소 활성을 나타낼 수 있다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는, 야생형 또는 모 폴리펩타이드, 즉 변이체 아미노산 위치(들)가 없는 모 폴리펩타이드와 비교해, kcat 증가, 예를 들어, 1.25, 1.5, 1.75, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 10배 또는 그 보다 높은 수준의 kcat 증가를 나타낼 수 있다. kcat는 효소학에서 널리 공지된 의미, 턴오버수 kcat = Vmax/[ET]를 지칭하는 것으로 이해되며, 이때 Vmax는 포화 기질과의 효소 반응 속도이고, [ET]는 전체 효소 농도이다 (Segel, Enzyme Kinetics: Behavior and Analysis of Rapid Equilibrium and Steady-State Enzyme Kinetics, Wiley-Interscience, New York (1975)). 이러한 알데하이드 데하이드로게나제 변이체는, 야생형 또는 모 폴리펩타이드, 즉 변이체 아미노산 위치(들)가 없는 모 폴리펩타이드에 대해 증가된 kcat 활성을 나타낼 수 있다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드, 즉 변이체 아미노산 위치(들)가 없는 모 폴리펩타이드에 비해 시험관 내 또는 생체 내 또는 둘다에서 안정성 증가를 나타낼 수 있다. 예를 들어, 알데하이드 데하이드로게나제 변이체는 세포 용해물에서 시험관 내 안정성 증가를 나타낼 수 있다.
특정 구현예들에서, 알데하이드 데하이드로게나제 변이체는 전술한 2가지 이상의 특징, 예를 들어, (1) 활성 증가, (2) S 형태 대비 R 형태의 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 특이성 증가, (3) 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, (4) 에탄올 및/또는 4-하이드록시-2-부타논과 같은 부산물 형성 감소, (5) kcat 증가, (6) 생체 내 및/또는 시험관 내 안정성 증가 등 중 2가지 이상의 특징을 임의 조합으로 나타낼 수 있는 것으로 이해된다. 이러한 임의 조합으로는, 예를 들어, 특징 1 및 2; 1 및 3; 1 및 4; 1 및 5; 1 및 6; 2 및 3; 2 및 4; 2 및 5; 2 및 6; 3 및 4; 3 및 5; 3 및 6; 4 및 5; 4 및 6; 5 및 6; 1, 2 및 3; 1, 2 및 4; 1, 2 및 5; 1, 2 및 6; 1, 3 및 4; 1, 3 및 5; 1, 3 및 6; 1, 4 및 5; 1, 4 및 6; 1, 5 및 6; 2, 3 및 4; 2, 3 및 5; 2, 3 및 6; 2, 4 및 5; 2, 4 및 6; 2, 5 및 6; 3, 4 및 5; 3, 4 및 6; 3, 5 및 6; 4, 5 및 6; 1, 2, 3 및 4; 1, 2, 3 및 5; 1, 2, 3 및 6; 1, 2, 4 및 5; 1, 2, 4 및 6; 1, 2, 5 및 6; 1, 3, 4 및 5; 1, 3, 4 및 6; 1, 3, 5 및 6; 1, 4, 5 및 6; 2, 3, 4 및 5; 2, 3, 4 및 6; 2, 3, 5 및 6; 3, 4, 5 및 6; 1, 2, 3, 4 및 5; 1, 3, 4, 5 및 6; 1, 2, 4, 5 및 6; 1, 2, 3, 5 및 6; 1, 2, 3, 4 및 6; 2, 3, 4, 5 및 6; 1, 2, 3, 4, 5 및 6을 포함한다.
본 발명의 폴리펩타이드는 당해 기술 분야에 널리 공지된 다양한 방법에 의해, 예를 들어 재조합 발현 시스템, 석출, 겔 여과, 이온-교환, 역상 및 친화성 크로마토그래피 등에 의해 단리할 수 있다. 그외 널리 공지된 방법들은 Deutscher et al., Guide to Protein Purification: Methods in Enzymology, Vol. 182, (Academic Press, (1990))에 기술되어 있다. 다른 예로, 본 발명의 단리된 폴리펩타이드는 널리 공지된 재조합 방법을 이용해 수득할 수 있다 (예를 들어, Sambrook et al., supra, 1989; Ausubel et al., supra, 1999 참조). 본 발명의 폴리펩타이드를 생화학적으로 정제하는 방법 및 조건은 당해 기술 분야의 당업자들이 선택할 수 있으며, 예를 들어 기능성 분석으로 정제를 모니터링할 수 있다.
본 발명의 폴리펩타이드를 정제하는 방법에 대한 비-제한적인 일 예는 박테리아 세포, 효모 세포 또는 그외 적절한 세포와 같은 적절한 숙주 세포에서 당해 기술 분야에 잘 알려진 방법을 이용해 폴리펩타이드를 코딩하는 핵산을 발현시키고, 발현된 폴리펩타이드를 널리 공지된 정제 방법을 다시 이용해 본원에 기술된 바와 같이 회수하는 것이다. 본 발명의 폴리펩타이드는 본원에 기술된 바와 같이 발현 벡터로 형질전환된 세포로부터 직접 단리할 수 있다. 재조합 방식으로 발현된 본 발명의 폴리펩타이드는 또한 글루타티온 S 트랜스퍼라제 (GST), poly His, 스트렙타비딘 등과 같은 적절한 친화성 태그와의 융합 단백질로서 발현시키고, 필요에 따라 친화성으로 정제할 수 있다. 본 발명의 폴리펩타이드는 필요에 따라 친화성 태그를 유지할 수 있거나, 또는 선택적으로 친화성 태그는 널리 공지된 방법을 이용해 폴리펩타이드로부터 제거하여, 예를 들어 적절한 효소적 또는 화학적 절단을 이용하여 친화성 태그를 제거할 수 있다. 이에, 본 발명은 친화성 태그없이 또는 선택적으로 친화성 태그와 함께 본 발명의 폴리펩타이드를 제공한다. 일부 구현예에서, 본 발명은 본원에 기술된 폴리펩타이드를 발현하는 숙주 세포를 제공한다. 또한, 본 발명의 폴리펩타이드는 당해 기술 분야의 당업자에게 널리 공지된 폴리펩타이드 합성 방법을 이용해 화학 합성으로 제조할 수 있다 (Merrifield, J. Am. Chem. Soc . 85:2149 (1964); Bodansky, M., Principles of Peptide Synthesis (Springer-Verlag, 1984); Houghten, Proc . Natl . Acad . Sci ., USA 82:5131 (1985); Grant Synthetic Peptides: A User Guide. W.H. Freeman and Co., N.Y. (1992); Bodansky M and Trost B., Ed. Principles of Peptide Synthesis. Springer-Verlag Inc., NY (1993)).
일부 구현예에서, 본 발명은 생체 촉매 (biocatalyst)로서 본원에 언급된 폴리펩타이드를 이용하는 것을 제공한다. 본원에서, "생체 촉매"는 화학 반응을 개시 또는 속도를 변형시키는 생물학적 물질을 지칭한다. 본 발명의 폴리펩타이드는 기질을 본원에 기술된 생산물로 변환하는 속도를 증가시키기 위해 사용될 수 있다. 산업적인 반응 (industrial reaction) 맥락에서, 본 발명의 폴리펩타이드는, 반응을 개선하여 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 (downstream product)을, 예를 들어 시험관 내 방법을 이용해 제조하기 위해, 폴리펩타이드를 발현하는 숙주 세포 없이 사용할 수 있다. 일 구현예에서, 본 발명은 생체 촉매로서 본 발명의 폴리펩타이드의 용도를 제공한다.
본 발명의 일부 구현예에서, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 폴리펩타이드는 알데하이드 데하이드로게나제를 발현하는 세포의 세포 용해물로서 제공된다. 이 경우, 세포 용해물은 3-하이드록시부티릴-CoA에서 3-하이드록시부티르알데하이드로의 변환, 또는 4-하이드록시부티릴-CoA로부터 4-하이드록시부티르알데하이드로의 변환, 또는 역 반응을 시험관 내 반응으로 수행하기 위한 알데하이드 데하이드로게나제의 소스로서 사용된다. 다른 구현예에서, 알데하이드 데하이드로게나제는 일부 정제된 형태로, 예를 들어 세포 용해물로부터 일부 정제된 형태로 제공될 수 있다. 다른 구현예에서, 알데하이드 데하이드로게나제는, 알데하이드 데하이드로게나제가 세포 추출물의 성분들과 같은 다른 성분들로부터 실질적으로 정제된, 실질적으로 정제된 형태로 제공될 수 있다. 알데하이드 데하이드로게나제를 코딩하는 폴리펩타이드를 일부 정제하거나 또는 실질적으로 정제하는 방법은 본원에 기술된 바와 같이 당해 기술 분야에 잘 알려져 있다. 일부 구현예에서, 알데하이드 데하이드로게나제는 고체 지지체, 예를 들어, 비드, 플레이트 또는 막에 고정된다. 특정 구현예에서, 알데하이드 데하이드로게나제는 친화성 태그를 포함하며, 친화성 태그를 사용해 알데하이드 데하이드로게나제를 고체 지지체에 고정한다. 이러한 친화성 태그로는, 비-제한적으로, 본원에 기술된 바와 같이, 글루타티온 S 트랜스퍼라제 (GST), poly His, 스트렙타비딘 등을 포함한다.
일부 구현예에서, 본 발명은 본원에 기술된 폴리펩타이드 및 이러한 폴리펩타이드에 대한 하나 이상의 기질을 가진 조성물을 제공한다. 본원에 기술된 각 폴리펩타이드에 대한 기질들이 본원에 기술되어 있으며, 도면에 예시되어 있다. 본 발명의 조성물 내 폴리펩타이드는 시험관 내 또는 생체 내 조건에서 기질과 반응할 수 있다. 이러한 맥락에서, 시험관 내 조건은 본 발명의 세포 등의 세포의 부재 하에 또는 세포 외부에서의 반응을 의미한다.
일 구현예에서, 본 발명은 본 발명의 폴리펩타이드 및 이러한 폴리펩타이드에 대한 하나 이상의 기질을 포함하는 조성물을 제공한다. 일 구현예에서, 폴리펩타이드는 시험관 내 조건에서 기질과 반응할 수 있다. 일 구현예에서, 기질은 3-하이드록시부티릴-CoA이다. 일 구현예에서, 기질은 3-하이드록시-(R)-부티릴-CoA이다. 일 구현예에서, 기질은 4-하이드록시부티릴-CoA이다.
일부 구현예에서, 본 발명은, 다른 단계들 중에서도, 숙주 세포, 예를 들어, 벡터에 의해 코딩된 아미노산 서열을 발현할 수 있거나 및/또는 발효가능한, 숙주 세포에 본원에 기술된 벡터를 도입하는 것을 포함할 수 있는, 숙주 균주를 구축하는 방법을 제공한다. 본 발명의 벡터는, 비-제한적인 예로, 접합, 전기천공, 화학적 형질전환, 형질도입, 형질감염 및 초음파 형질전환 등의, 당해 기술 분야에 널리 공지된 기술을 이용해, 숙주 세포에 안정적으로 또는 일시적으로 도입시킬 수 있다. 본원에 부가적인 방법들이 기술되어 있으며, 이중 임의의 한가지 방법이 본 발명의 방법에 사용될 수 있다.
부가적인 구현예에서, 본 발명은 본 발명의 폴리펩타이드, 즉 본 발명의 알데하이드 데하이드로게나제를 포함하는 세포를 제공한다. 이에, 본 발명은 본 발명의 알데하이드 데하이드로게나제를 코딩하는 폴리펩타이드를 포함하는 비-천연성 세포를 제공한다. 선택적으로, 세포는 3-HBal 또는 1,3-BDO 경로, 또는 4-HBal 또는 1,4-BDO 경로를 포함할 수 있으며, 그리고 부가적으로 선택적으로 이의 에스테르 또는 아미드와 같이 이와 관련된 다운스트림 산물을 생산하기 위한 경로를 포함할 수 있다. 일부 구현예에서, 비-천연성 세포는 아실-CoA를 이의 대응되는 알데하이드로 변환하는 알데하이드 데하이드로게나제를 코딩하는 하나 이상의 외인성 핵산을 포함한다. 당해 기술 분야의 당업자는, 이것이 주로 예이며, 바람직한 생산물을 생산하기에 적합하며 적절한 활성이 기질에서 생산물로의 변환에 이용가능한 본원에 기술된 기질-산물 쌍들 중 임의 쌍은, 본원에 교시된 내용을 토대로 당해 기술 분야의 당업자에 의해 쉽게 결정될 수 있는 것으로 이해될 것이다. 이에, 특정 구현예에서, 본 발명은, 알데하이드 데하이드로게나제가 도 1 및 2에 도시된 바와 같이 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에서 기능하는, 알데하이드 데하이드로게나제를 코딩하는 하나 이상의 외인성 핵산을 포함하는, 세포, 특히 비-천연성 세포를 제공한다.
일 구현예에서, 본 발명은 본 발명의 핵산을 포함하는 본 발명의 벡터를 포함하는 세포를 제공한다. 또한, 본 발명은 본 발명의 핵산을 포함하는 세포를 제공한다. 일 구현예에서, 핵산 분자는 세포의 염색체에 병합된다. 특정 구현예에서, 병합은 부위-특이적이다. 본 발명의 일 구현예에서, 핵산 분자가 발현된다. 일 구현예에서, 본 발명은 본 발명의 폴리펩타이드를 포함하는 세포를 제공한다.
일 구현예에서, 벡터, 핵산 또는 폴리펩타이드를 포함하는 세포는 미생물 유기체이다. 특정 구현예에서, 미생물 유기체는 박테리아, 효모 또는 진균이다. 특정 구현예에서, 세포는 단리된 진핵생물 세포이다.
일 구현예에서, 세포는 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드를 생산하는 경로를 포함한다. 다른 구현예에서, 세포는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO), 또는 이의 에스테르 또는 아미드를 생산하는 경로를 포함한다. 일 구현예에서, 세포는 발효할 수 있다. 일 구현예에서, 세포는 세포에서 발현되는 본 발명의 폴리펩타이드에 대한 하나 이상의 기질을 더 포함한다. 특정 구현예에서, 기질은 3-하이드록시부티릴-CoA이다. 특정 구현예에서, 기질은 3-하이드록시-(R)-부티릴-CoA이다. 일 구현예에서, 세포는 3-하이드록시-(S)-부티릴-CoA에 비해 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가진다. 다른 특정 구현예에서, 기질은 4-하이드록시부티릴-CoA이다. 또한, 본 발명은 본 발명의 세포를 포함하는 배양 배지를 제공한다.
본 발명의 알데하이드 데하이드로게나제는 아실-CoA를 이의 대응되는 알데하이드로 변환하는 경로에 사용될 수 있다. 알데하이드 데하이드로게나제를 포함하는 예시적인 3-HBal 및/또는 1,3-BDO 경로는, 예를 들어, WO 2010/127319, WO 2013/036764, 미국 특허 9,017,983, US 2013/0066035에 기술되어 있으며, 이들 문헌은 각각 원용에 의해 본 명세서에 포함된다.
3-HBal 및/또는 1,3-BDO 경로의 예들은 도 1에 도시되며, WO 2010/127319, WO 2013/036764, 미국 특허 9,017,983 및 US 2013/0066035에 기술되어 있다. 알데하이드 데하이드로게나제를 포함하는 이러한 3-HBal 및/또는 1,3-BDO 경로는, 예를 들어, (G) 아세토아세틸-CoA 리덕타제 (케톤 환원); (H) 3-하이드록시부티릴-CoA 리덕타제 (알데하이드 형성), 본원에서 3-하이드록시부티르알데하이드 데하이드로게나제, 알데하이드 데하이드로게나제 (ALD)로도 지칭됨; 및 (C) 3-하이드록시부티르알데하이드 리덕타제, 본원에서 1,3-BDO 데하이드로게나제로도 지칭됨 (도 1 참조)를 포함한다. 아세토아세틸-CoA는 티올라제를 사용해 아세틸-CoA 2분자를 아세토아세틸-CoA 1분자로 변환함으로써 제조할 수 있다. 아세토아세틸-CoA 티올라제는 아세틸-CoA 2분자를 아세토아세틸-CoA 1분자 및 CoA 1분자로 변환한다 (WO 2013/036764 및 US 2013/0066035 참조).
1,3-BDO 경로의 예는 WO 2010/127319의 도 2에 도시되어 있다. 간략하게는, 아세토아세틸-CoA 리덕타제 (케톤 환원)(EC 1.1.1.a)에 의해 아세토아세틸-CoA를 3-하이드록시부티릴-CoA로 변환할 수 있다 (도 1의 단계 G). 3-하이드록시부티릴-CoA는, 본 발명의 알데하이드 데하이드로게나제 등의, 본원에서 3-하이드록시부티르알데하이드 데하이드로게나제로도 지칭되는, 3-하이드록시부티릴-CoA 리덕타제 (알데하이드 형성)(EC 1.2.1.b)에 의해 3-하이드록시부티르알데하이드로 변환할 수 있다 (도 1의 단계 H). 3-하이드록시부티르알데하이드는, 본원에서 1,3-BDO 데하이드로게나제로도 지칭되는 3-하이드록시부티르알데하이드 리덕타제 (EC 1.1.1.a)에 의해 1,3-부탄다이올로 변환할 수 있다 (도 1의 단계 C).
본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제는 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환하기 위한 경로에서 기능할 수 있다. 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환하는 알데하이드 데하이드로게나제를 포함하는 전술한 경로에서, 이 경로는 아세토아세틸-CoA를 3-하이드록시부티릴-CoA로 변환한다 (도 1 참조). 또한, 본 발명의 알데하이드 데하이드로게나제는, 경로에서 기질/산물로서 3-하이드록시부티릴-CoA를 포함하는, 다른 3-HBal 및/또는 1,3-BDO 경로들에 사용할 수 있다. 당해 기술 분야의 당업자라면, 상기한 반응을 포함하는 임의의 바람직한 경로에서 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환하기 위해 본 발명의 알데하이드 데하이드로게나제를 쉽게 이용할 수 있다.
4-HBal 및/또는 1,4-BDO 경로의 예들은 도 2에 도시되며, WO 2008/115840, WO 2010/030711, WO 2010/141920, WO 2011/047101, WO 2013/184602, WO 2014/176514, 미국 특허 8,067,214, 미국 특허 7,858,350, 미국 특허 8,129,169, 미국 특허 8,377,666, US 2013/0029381, US 2014/0030779, US 2015/0148513 및 US 2014/0371417에 기술되어 있다. 알데하이드 데하이드로게나제를 포함하는 이러한 4-HBal 및/또는 1,4-BDO 경로는, 예를 들어, (1) 숙시닐-CoA 신테타제; (2) CoA-비의존적인 숙시닉 세미알데하이드 데하이드로게나제; (3) α-케토글루타레이트 데하이드로게나제; (4) 글루타메이트:숙시네이트 세미알데하이드 트랜스아미나제; (5) 글루타메이트 데카르복실라제; (6) CoA-의존적인 숙시닉 세미알데하이드 데하이드로게나제; (7) 4-하이드록시부타노에이트 데하이드로게나제; (8) α-케토글루타레이트 데카르복실라제; (9) 4-하이드록시부티릴 CoA:아세틸-CoA 트랜스퍼라제; (10) 부티레이트 키나제 (4-하이드록시부티레이트 키나제로도 지칭됨); (11) 포스포트랜스부티릴라제 (포스포-트랜스-4-하이드록시부티릴라제로도 지칭됨); (12) 알데하이드 데하이드로게나제 (4-하이드록시부티릴-CoA 리덕타제로도 지칭됨); (13) 알코올 데하이드로게나제, 예를 들어 1,4-부탄다이올 데하이드로게나제 (4-하이드록시부타날 리덕타제 또는 4-하이드록시부티르알데하이드 리덕타제로도 지칭됨)(도 2 참조)를 포함한다.
도 2와 마찬가지로, 1,4-BDO 경로의 예는 WO 2010/141920의 도 8a에 도시되어 있다. 간략하게는, 숙시닐-CoA는 숙시닐-CoA 리덕타제 (또는 숙시네이트 세미알데하이드 데하이드로게나제) (EC 1.2.1.b)에 의해 숙시닉 세미알데하이드로 변환할 수 있다. 숙시네이트 세미알데하이드는 4-하이드록시부티레이트 데하이드로게나제 (EC 1.1.1.a)에 의해 4-하이드록시부티레이트로 변환할 수 있다. 다른 예로, 숙시닐-CoA는 숙시닐-CoA 리덕타제 (알코올 형성) (EC 1.1.1.c)에 의해 4-하이드록시부티레이트로 변환할 수 있다. 4-하이드록시부티레이트는 4-하이드록시부티릴-CoA 트랜스퍼라제 (EC 2.8.3.a), 4-하이드록시부티릴-CoA 하이드롤라제 (EC 3.1.2.a) 또는 4-하이드록시부티릴-CoA 리가제 (또는 4-하이드록시부티릴-CoA 신테타제) (EC 6.2.1.a)에 의해 4-하이드록시부티릴-CoA로 변환할 수 있다. 다른 예로, 4-하이드록시부티레이트는 4-하이드록시부티레이트 키나제 (EC 2.7.2.a)에 의해 4-하이드록시부티릴-포스페이트로 변환할 수 있다. 4-하이드록시부티릴-포스페이트는 포스포트랜스-4-하이드록시부티릴라제 (EC 2.3.1.a)에 의해 4-하이드록시부티릴-CoA로 변환할 수 있다. 다른 예로, 4-하이드록시부티릴-포스페이트는 4-하이드록시부타날 데하이드로게나제 (인산화) (EC 1.2.1.d)에 의해 4-하이드록시부타날로 변환할 수 있다. 4-하이드록시부티릴-CoA는 본 발명의 알데하이드 데하이드로게나제 변이체 등의 4-하이드록시부티릴-CoA 리덕타제 (또는 4-하이드록시부타날 데하이드로게나제) (EC 1.2.1.b)에 의해 4-하이드록시부타날로 변환할 수 있다. 다른 예로, 4-하이드록시부티릴-CoA는 4-하이드록시부티릴-CoA 리덕타제 (알코올 형성) (EC 1.1.1.c)에 의해 1,4-부탄다이올로 변환할 수 있다. 4-하이드록시부타날은 1,4-부탄다이올 데하이드로게나제 (EC 1.1.1.a)에 의해 1,4-부탄다이올로 변환할 수 있다.
1,4-BDO 경로의 예들은 WO 2010/141920의 도 8B에 도시되어 있다. 간략하게는, α-케토글루타레이트는 α-케토글루타레이트 데카르복실라제 (EC 4.1.1.a)에 의해 숙시닉 세미알데하이드로 변환할 수 있다. 다른 예로, α-케토글루타레이트는 글루타메이트로 글루타메이트 데하이드로게나제 (EC 1.4.1.a)에 의해 변환될 수 있다. 4-아미노부티레이트는 숙시닉 세미알데하이드로 4-아미노부티레이트 옥시도리덕타제 (탈아민화) (EC 1.4.1.a) 또는 4-아미노부티레이트 트랜스아미나제 (EC 2.6.1.a)에 의해 변환될 수 있다. 글루타메이트는 4-아미노부티레이트로 글루타메이트 데카르복실라제 (EC 4.1.1.a)에 의해 변환될 수 있다. 숙시네이트 세미알데하이드는 4-하이드록시부티레이트로 4-하이드록시부티레이트 데하이드로게나제 (EC 1.1.1.a)에 의해 변환될 수 있다. 4-하이드록시부티레이트는 4-하이드록시부티릴-CoA로 4-하이드록시부티릴-CoA 트랜스퍼라제 (EC 2.8.3.a), 4-하이드록시부티릴-CoA 하이드롤라제 (EC 3.1.2.a) 또는 4-하이드록시부티릴-CoA 리가제 (또는 4-하이드록시부티릴-CoA 신테타제) (EC 6.2.1.a)에 의해 변환될 수 있다. 4-하이드록시부티레이트는 4-하이드록시부티릴-포스페이트로 4-하이드록시부티레이트 키나제 (EC 2.7.2.a)에 의해 변환될 수 있다. 4-하이드록시부티릴-포스페이트는 4-하이드록시부티릴-CoA로 포스포트랜스-4-하이드록시부티릴라제 (EC 2.3.1.a)에 의해 변환될 수 있다. 다른 예로, 4-하이드록시부티릴-포스페이트는 4-하이드록시부타날로 4-하이드록시부타날 데하이드로게나제 (인산화) (EC 1.2.1.d)에 의해 변환될 수 있다. 4-하이드록시부티릴-CoA는 4-하이드록시부타날로 본 발명의 알데하이드 데하이드로게나제 등의 4-하이드록시부티릴-CoA 리덕타제 (또는 4-하이드록시부타날 데하이드로게나제) (EC 1.2.1.b)에 의해 변환될 수 있다. 4-하이드록시부티릴-CoA는 1,4-부탄다이올로 4-하이드록시부티릴-CoA 리덕타제 (알코올 형성) (EC 1.1.1.c)에 의해 변환될 수 있다. 4-하이드록시부타날은 1,4-부탄다이올로 1,4-부탄다이올 데하이드로게나제 (EC 1.1.1.a)에 의해 변환될 수 있다.
본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환하기 위한 경로에서 기능할 수 있다. 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환하는 알데하이드 데하이드로게나제를 포함하는 전술한 경로에서, 이 경로는 4-하이드록시부티레이트를 4-하이드록시부티릴-CoA로 또는 4-하이드록시부티릴 포스페이트를 4-하이드록시부티릴-CoA로 변환한다 (도 2 참조). 또한, 본 발명의 알데하이드 데하이드로게나제는, 경로에서 기질/산물로서 4-하이드록시부티릴-CoA를 포함하는, 다른 4-HBal 및/또는 1,4-BDO 경로들에 사용할 수 있다. 당해 기술 분야의 당업자라면, 이러한 반응을 포함하는 임의의 바람직한 경로에서, 본 발명의 알데하이드 데하이드로게나제를 사용해 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있다. 예를 들어, 4-옥소부티릴-CoA를 WO 2010/141290, 도 9A에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 또한, 5-하이드록시-2-옥소펜탄산을 WO 2010/141290, 도 10 및 11에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 또한, 아세토아세틸-CoA, 3-하이드록시부티릴-CoA, 크로토닐-CoA 및/또는 비닐아세틸-CoA를 WO 2010/141290, 도 12에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 아울러, 4-하이드록시부트-2-에노일-CoA를 WO 2010/141290, 도 13에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 즉, 당해 기술 분야의 당업자라면, 필요에 따라 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환하는 것을 포함하는 4-HBal 및/또는 1,4-BDO 경로에서 본 발명의 알데하이드 데하이드로게나제를 사용하는 방법을 쉽게 이해할 것이다.
공통적인 핵심 대사 중간산물을 1,3-BDO 또는 1,4-BDO로 변환하는데 필요한 효소 타입은 대표적인 EC (Enzyme Commission) 번호와 함께 상기에 기술된다 (WO 2010/127319, WO 2013/036764, WO 2008/115840, WO 2010/030711, WO 2010/141920, WO 2011/047101, WO 2013/184602, WO 2014/176514, 미국 특허 9,017,983, 미국 특허 8,067,214, 미국 특허 7,858,350, 미국 특허 8,129,169, 미국 특허 8,377,666, US 2013/0066035, US 2013/0029381, US 2014/0030779, US 2015/0148513 및 US 2014/0371417을 참조함). 각 라벨의 앞 3개의 숫자는 기질 특이성과 독립적인 일반적인 변환 타입을 나타내는 효소 위원회 번호의 앞 3개의 숫자이다. 효소의 예로는 1.1.1.a, 옥시도리덕타제 (케톤 -> 하이드록실 또는 알데하이드 -> 알코올); 1.1.1.c, 옥시도리덕타제 (2단계, 아실-CoA -> 알코올); 1.2.1.b, 옥시도리덕타제 (아실-CoA -> 알데하이드); 1.2.1.c, 옥시도리덕타제 (2-옥소산 -> 아실-CoA, 데카르복시화); 1.2.1.d, 옥시도리덕타제 (인산화/탈인산화); 1.3.1.a, CH-CH 도너에 작용하는 옥시도리덕타제; 1.4.1.a, 아미노산에 작용하는 옥시도리덕타제 (탈아민화); 2.3.1.a, 아실트랜스퍼라제 (포스페이트 기 전달); 2.6.1.a, 아미노트랜스퍼라제; 2.7.2.a, 포스포트랜스퍼라제, 카르복시기 어셉터; 2.8.3.a, 코엔자임-A 트랜스퍼라제; 3.1.2.a, 티올에스테르 하이드롤라제 (CoA 특이적); 4.1.1.a, 카르브옥시-리아제; 4.2.1.a, 하이드로-리아제; 4.3.1.a, 암모니아-리아제; 5.3.3.a, 이소머라제; 5.4.3.a, 아미노무타제; 및 6.2.1.a, 산-티올 리가제 등이 있다.
본 발명의 알데하이드 데하이드로게나제는 아실-CoA를 이의 대응되는 알데하이드로 변환하기 위해 세포에서 또는 시험관 내에서 이용할 수 있다. 본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제는, 비-제한적인 예로, S 거울상이성질체와 비교해 3-하이드록시부티릴-CoA에 대한 R 거울상이성질체의 특이성 증가, 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 활성 증가, 부산물 형성 감소, kcat 증가 등의, 유익하고 유용한 특성을 가진다. 본 발명의 알데하이드 데하이드로게나제는, 1,3-부탄다이올 데하이드로게나제를 사용해 본 발명의 알데하이드 데하이드로게나제의 생산물, 3-하이드록시-(R)-부티르알데하이드를 (R)-1,3-부탄다이올로 효소적으로 변환함으로써, 1,3-부탄다이올의 R-형태 ((R)-1,3-부탄다이올이라고도 함)를 제조하기 위해, 사용할 수 있다.
1,3-부탄다이올의 생물-유래 R-형태는, R-형태가 바람직한 다운스트림 산물을 생산하는데 사용할 수 있다. 일부 구현예에서, R-형태는 약제 및/또는 뉴트라슈티컬 (nutraceutical)로서 활용할 수 있다 (WO 2014/190251 참조). 예를 들어, (R)-1,3-부탄다이올은, 혈중 케톤체 농도 증가 등의 유익한 효과를 가질 수 있는, (3R)-하이드록시부틸 (3R)-하이드록시부티레이트를 생산하는데 이용할 수 있다. 케톤체 농도 증가는 신체 및 인지 성능 강화 및 심혈관 병태, 당뇨병 및 미토콘드리아 기능부전 장애의 치료 및 근육 피로와 손상 치료 등의, 다양한 임상적인 이점을 유발할 수 있다 (WO 2014/190251 참조). 1,3-부탄다이올의 생물-유래 R-형태는, 예를 들어, 석유-유래 라세메이트 1,3-부탄다이올, 이의 S-형태 또는 R-형태를 생물-유래 R-형태로 치환함으로써, 비-석유계 생산물이 바람직한 다운스트림 산물을 생산하는데 이용할 수 있다.
일 구현예에서, 본 발명은, 화합물의 R 형태에 대해 거울상이성질체적으로 농화된, 3-HBal 또는 1,3-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 제공한다. 일부 구현예에서, 3-HBal 또는 1,3-BDO는 R-거울상이성질체로 농화된 라세메이트이며, 즉 S-거울상이성질체 보다 R-거울상이성질체를 더 많이 포함한다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 55% 이상으로, S-거울상이성질체를 45% 미만으로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 60% 이상의 R-거울상이성질체 및 40% 이하의 S-거울상이성질체를 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 65% 이상의 R-거울상이성질체 및 35% 이하의 S-거울상이성질체를 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 70% 이상의 R-거울상이성질체 및 30% 이하의 S-거울상이성질체를 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 75% 이상의 R-거울상이성질체 및 25% 이하의 S-거울상이성질체를 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 80% 이상의 R-거울상이성질체 및 20% 이하의 S-거울상이성질체를 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 85% 이상의 R-거울상이성질체 및 15% 이하의 S-거울상이성질체를 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 90% 이상의 R-거울상이성질체 및 10% 이하의 S-거울상이성질체를 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 95% 이상의 R-거울상이성질체 및 5% 이하의 S-거울상이성질체를 포함할 수 있다. 일부 구현예에서, 3-HBal 또는 1,3-BDO, 또는 이의 에스테르 또는 아미드와 같이 이와 관련된 다운스트림 산물은 R 형태를 90% 보다 많이, 예를 들어, R 형태를 95% 초과로, 96% 초과로, 97% 초과로, 98% 초과로, 99% 초과로 또는 99.9% 초과로 포함한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO, 또는 이의 에스테르 또는 아미드와 같이 이와 관련된 다운스트림 산물은, ≥55% R-거울상 이성질체, ≥60% R-거울상 이성질체, ≥65% R-거울상 이성질체, ≥70% R-거울상 이성질체, ≥75% R-거울상 이성질체, ≥80% R-거울상 이성질체, ≥85% R-거울상 이성질체, ≥90% R-거울상 이성질체 또는 ≥95% R-거울상 이성질체이며, 화학적으로 고도로 순수할 수 있으며, 예를 들어 ≥99%일 수 있으며, 예로, R-거울상이성질체가 ≥95%, ≥96%, ≥97%, ≥98%, ≥99%, ≥99.1%, ≥99.2%, ≥99.3%, ≥99.4%, ≥99.5%, ≥99.6%, ≥99.7%, ≥99.8% 또는 ≥99.9%일 수 있다.
일 구현예에서, 3-HBal 및/또는 1,3-BDO의 전구체의 석유-유래 라세믹 혼합물, 특히 3-하이드록시부티릴-CoA의 라세믹 혼합물은, R 형태로 거울상이성질체적으로 농화된, 3-HBal 또는 1,3-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 제조하기 위해, S 형태에 비해 R 형태에 대해 증가된 특이성을 나타내는 본 발명의 알데하이드 데하이드로게나제의 기질로서 사용된다. 이러한 반응은 본 발명의 알데하이드 데하이드로게나제를 발현하는 세포, 특히 전구체를 3-하이드록시부티릴-CoA로 변환할 수 있는 세포에 석유-유래 전구체를 공급함으로써 수행할 수 있거나, 또는 석유-유래 전구체를 3-하이드록시부티릴-CoA로 변환하기 위한 하나 이상의 효소를 이용하여 시험관 내에서, 또는 생체 내 반응과 시험관 내 반응의 조합을 이용하여 수행할 수 있다. 본 발명의 알데하이드 데하이드로게나제를 이용해 4-하이드록시부티릴-CoA를 생산하기 위한 반응은, 본 발명의 알데하이드 데하이드로게나제를 발현하는 세포, 특히 전구체를 4-하이드록시부티릴-CoA로 변환할 수 있는 세포에 석유-유래 전구체를 공급함으로써 마찬가지로 수행할 수 있거나, 또는 석유-유래 전구체를 4-하이드록시부티릴-CoA로 변환하는 하나 이상의 효소를 사용해 시험관 내에서 또는 생체 내 반응과 시험관 내 반응의 조합을 이용하여 수행할 수 있다.
본 발명의 알데하이드 데하이드로게나제를 포함하는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로를 가진 세포로서 본원에 일반적으로 기술되었지만, 본 발명은 또한 본 발명의 알데하이드 데하이드로게나제를 코딩하는 하나 이상의 외인성 핵산을 포함하는 세포를 제공하는 것으로 이해된다. 알데하이드 데하이드로게나제는 바람직한 생산물, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 생산물, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산할만큼 충분한 양으로 발현될 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 예들이 도 1 및 2에 도시되며, 본원에 기술된다.
실시예에 기술되고 도 1 및 도 2의 경로 등의 도에 예시된 바와 같이, 본원에 기술된 임의 경로는, 필요에 따라 임의의 경로 중간산물 또는 생산물을 생산하는 세포를 생산하는 세포, 특히 본 발명의 알데하이드 데하이드로게나제를 이용하는 경로를 구축하는데 이용할 수 있는 것으로, 이해된다. 본원에 기술된 바와 같이, 중간산물을 생산하는 상기한 세포는 바람직한 생산물을 생산하기 위해 하나 이상의 업스트림 또는 다운스트림 경로 효소들을 발현하는 다른 세포와 조합하여 사용할 수 있다. 그러나, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 생산하는 세포는 바람직한 생산물로서 중간산물을 생산하는데 이용할 수 있는 것으로 이해된다.
본 발명은 대사 반응, 반응제 또는 이의 생산물을 일반적으로 참조하거나, 또는 참조한 대사 반응, 반응제 또는 생산물과 관련있거나 또는 이를 촉매하거나 또는 이와 관련된 단백질을 코딩하는 하나 이상의 핵산 또는 유전자를 구체적으로 참조하여 본원에 기술된다. 본원에 명확하게 언급되지 않은 한, 당해 기술 분야의 당업자는, 반응에 대한 언급 역시 반응의 반응제 및 생산물에 대한 언급임을 이해할 것이다. 마찬가지로, 본원에 명확하게 언급되지 않은 한, 반응제 또는 생산물에 대한 언급 역시 반응을 언급하는 것이며, 이들 임의의 대사 구성성분에 대한 언급 또한 참조 반응, 반응제 또는 생산물을 촉진하는 효소 또는 이에 참여한 단백질을 코딩하는 유전자 또는 유전자들을 언급하는 것이다. 마찬가지로, 널리 공지된 대사적 생화학, 효소학 및 게놈 분야를 감안하면, 유전자 또는 코딩 핵산에 대한 언급은 대응되는 코딩된 효소 및 이것이 촉매하는 반응 또는 반응과 관련된 단백질뿐 아니라 반응의 반응제 및 생산물을 또한 언급하는 것이다.
본원에서, 생산물 또는 경로 중간산물인 카르복시산은, 완전히 양성자화된 (fully protonated), 부분 양성자화된 및 완전히 탈양성자화된 형태 (fully deprotonated form) 등의, 다양한 이온화된 형태로 만들어질 수 있다. 즉, 접미사 "-에이트" 또는 산 형태는, 특히, 이온화된 형태가 화합물이 발견되는 pH에 의존적인 것으로 공지되어 있으므로, 유리 산 형태뿐 아니라 임의의 탈양성화된 형태 둘다를 기술하기 위해 상호 호환적으로 사용될 수 있다. 카르복실레이트 생산물 또는 중간산물은, O-카르복실레이트 및 S-카르복실레이트 에스테르 등의, 카르복실레이트 생산물의 에스테르 형태 또는 경로 중간산물을 포함하는 것으로 이해된다. O- 및 S-카르복실레이트는 저급 알킬을 포함할 수 있으며, C1 내지 C6의 분지쇄 또는 직쇄 카르복실레이트이다. 이러한 O- 또는 S-카르복실레이트의 일부로는, 비-제한적으로, 메틸, 에틸, n-프로필, n-부틸, i-프로필, sec-부틸 및 tert-부틸, 펜틸, 헥실 O- 또는 S-카르복실레이트 등이 있으며, 이들 중 임의의 것은 불포화를 추가적으로 포함하여, 예를 들어 프로페닐, 부테닐, 펜틸 및 헥세닐 O- 또는 S-카르복실레이트를 제공할 수 있다. O-카르복실레이트는 생합성 경로의 생산물일 수 있다. 그외 생합성에 의해 입수가능한 O-카르복실레이트는, C7-C22인 중간쇄 내지 장쇄 기들, 지방 알코올 유래 O-카르복실레이트 에스테르, 예를 들어, O-카르복실레이트 에스테르, 예를 들어, 헵틸, 옥틸, 노닐, 데실, 운데실, 라우릴, 트리데실, 미리스틸, 펜타데실, 세틸, 팔미톨릴, 헵타데실, 스테아릴, 노나데실, 아라키딜, 헨에이코실 및 베헤닐 알코올을 포함할 수 있으며, 이들 중 임의의 기는 선택적으로 분지화될 수 있으며, 및/또는 불포화를 포함할 수 있다. 또한, O-카르복실레이트 에스테르는 유리 카르복시산 생산물의 에스테르화 또는 O- 또는 S-카르복실레이트의 트랜스에스테르화와 같은, 생화학적 또는 화학적 공정을 통해 입수할 수 있다. S-카르복실레이트는 CoA S-에스테르, 시스테이닐 S-에스테르, 알킬티오에스테르 및 다양한 아릴 및 헤테로아릴 티오에스테르로 예시된다.
본 발명의 세포는, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 발현가능한 핵산, 및 선택적으로 하나 이상의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로에 참여하는 하나 이상의 효소 또는 단백질을 코딩하는 발현가능한 핵산, 및 또한 선택적으로 이의 에스테르 또는 아미드와 같이 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO와 관련된 다운스트림 산물을 생산하는 효소를 코딩하는 핵산을 도입함으로써, 제조할 수 있다. 선택 숙주 세포에 따라, 구체적인 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로 전체 또는 일부를 위한 핵산 또는 다운스트림 산물을 발현시킬 수 있다. 예를 들어, 선택 숙주에서 바람직한 생합성 경로를 위한 하나 이상의 효소 또는 단백질이 결핍되어 있다면, 결핍된 효소(들) 또는 단백질(들)에 대한 발현가능한 핵산을 후속적인 외인성 발현을 위해 숙주에 도입한다. 다른 예로, 선택 숙주가 일부 경로 유전자들의 내인성 발현을 나타내지만 다른 것들은 결핍된 경우에는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성을 달성하기 위해, 결핍 효소(들) 또는 단백질(들)에 대한 코딩 핵산을 포함시키거나, 또는 필요에 따라 경로 효소의 발현을 증가시키기 위해 내인성으로 발현되는 유전자의 외인성 발현을 제공할 수 있다. 이에, 본 발명의 세포는, 본 발명의 알데하이드 데하이드로게나제, 선택적으로 바람직한 생합성 경로를 수득하기 위한 외인성 효소 또는 단백질 활성을 도입하거나, 또는 하나 이상의 내인성 효소 또는 단백질과 더불어 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물과 같은 바람직한 생산물을 생산하는, 본 발명의 알데하이드 데하이드로게나제 등의 하나 이상의 외인성 효소 또는 단백질 활성을 도입함으로써, 제조할 수 있다.
숙주 세포는, 예를 들어, 박테리아, 효모, 진균 또는 발효 공정에 적용가능하거나 또는 적합한 다양한 임의의 미생물에서 생산되는 본 발명의 알데하이드 데하이드로게나제를 발현하는 비-천연성 세포로부터 선택될 수 있다. 박테리아의 예는 속명 에스케리키아 (Escherichia) 및 클렙시엘라 (Klebsiella) 등의, 장내세균목 (Enterobacteriales) 장내세균과 (Enterobacteriaceae); 속명 안에어로바이오스피릴륨 (Anaerobiospirillum) 등의, 과명 숙시니비브리오나시이 (Succinivibrionaceae)의 목명 에어로모나데일스 (Aeromonadales); 속명 액티노바실러스 (Actinobacillus) 및 만하이미아 (Mannheimia) 등의, 과명 파스퇴렐라시이 (Pasteurellaceae)의 목명 파스퇴렐레일스 (Pasteurellales); 속명 리조븀 (Rhizobium) 등의, 과명 브라디리조비아시이 (Bradyrhizobiaceae)의 목명 리조비에일스 (Rhizobiales); 속명 바실러스 (Bacillus) 등의, 과명 바실라시이 (Bacillaceae)의 목명 바실에일스 (Bacillales); 속명 코리네박테리움 (Corynebacterium) 및 스트렙토마이세스 (Streptomyces) 등의, 각각 과명 코리네박테리아시이 (Corynebacteriaceae) 및 스트렙토마이세타시이 (Streptomycetaceae)의목명 액티노바이세테일스 (Actinomycetales); 속명 글루코노박터 (Gluconobacter) 등의, 과명 아세토박테라시이 (Acetobacteraceae)의 목명 로도스피릴레일스 (Rhodospirillales); 속명 지모모나스 (Zymomonas) 등의, 과명 스핑고모나다시이 (Sphingomonadaceae)의 목명 스핑고모나데일스 (Sphingomonadales); 속명 락토바실러스 (Lactobacillus) 및 락토코커스 (Lactococcus) 등의, 각각 과명 락토바실라시이 (Lactobacillaceae) 및 스트렙토코카시이 (Streptococcaceae)의 목명 락토바실레일스 (Lactobacillales); 과명 클로스트리디아시이 (Clostridiaceae)의 목명 클로스트리디에일스 (Clostridiales), 예로 속명 클로스트리듐 (Clostridium); 과명 슈도모나다시이 (Pseudomonadaceae)의 목명 슈도모나데일스 (Pseudomonadales), 예로 속명 슈도모나스 (Pseudomonas)로부터 선택되는 임의의 종을 포함한다. 숙주 박테리아에 대한 비-제한적인 예로는 에스케리키아 콜라이 (Escherichia coli), 클렙시엘라 옥시토카 (Klebsiella oxytoca), 안에어로비오스피릴룸 숙시니시프로두센스 (Anaerobiospirillum succiniciproducens), 액티노바실러스 숙시노게네스 (Actinobacillus succinogenes), 만하이미아 숙시니시프로두센스 (Mannheimia succiniciproducens), 리조븀 에틸리 (Rhizobium etli), 바실러스 섭틸리스 (Bacillus subtilis), 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 클루코노박터 옥시단스 (Gluconobacter oxydans), 자이모모나스 모빌리스 (Zymomonas mobilis), 락토코커스 락티스 (Lactococcus lactis), 락토바실러스 플란타룸 (Lactobacillus plantarum), 스트렙토마이세스 코엘리콜러 (Streptomyces coelicolor), 클로스트리듐 아세토부틸리툼 (Clostridium acetobutylicum), 슈도모나스 플루오레센스 (Pseudomonas fluorescens) 및 슈도모나스 푸티다 (Pseudomonas putida) 등이 있다. E. coli는 유전자 조작에 적합한 잘 규명된 미생물 유기체이므로, 이 균주가 특히 유용한 숙주 미생물이다.
마찬가지로, 효모 또는 진균 종에 대한 예시적인 종으로는, 과 사카로마이세타시이 (Saccaromycetaceae) 목 사카로마이세테일스 (Saccharomycetales), 예를 들어 속 사카로마이세스 (Saccharomyces), 클루이베로마이세스 (Kluyveromyces) 및 피키아 (Pichia); 과 디포다스카시이 (Dipodascaceae) 목 사카로마이세테일스 (Saccharomycetales), 예를 들어 속 야로이와 (Yarrowia); 과 시조사카로마이세타시이 (Schizosaccaromycetaceae) 목 시조사카로마이세일스 (Schizosaccharomycetales), 예를 들어, 속 시조사카로마이세스 (Schizosaccharomyces); 과 트리코코마시이 (Trichocomaceae) 목 유로티에일스 (Eurotiales), 예를 들어 속 아스퍼질러스 (Aspergillus); 및 과 뮤코라시이 (Mucoraceae) 목 뮤코레일스 (Mucorales), 예를 들어 속 리조푸스 (Rhizopus)로부터 선택되는 임의의 종을 포함한다. 숙주 효모 또는 진균에 대한 비-제한적인 종으로는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 시조사카로마이세스 폼베 (Schizosaccharomyces pombe), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 아스퍼질러스 테레우스 (Aspergillus terreus), 아스퍼질러스 나이거 (Aspergillus niger), 피키아 파스토리스 (Pichia pastoris), 리조푸스 아리주스 (Rhizopus arrhizus), 리조부스 오리제 (Rhizobus oryzae), 야로이와 리폴리티카 (Yarrowia lipolytica) 등이 있다. 특히 유용한 숙주 효모 유기체는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)를 포함한다.
숙주 세포로서 미생물 유기체인 세포를 특히 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하기 위해 이용하는 것으로 일반적으로 본원에 기술되어 있지만, 숙주 세포는 포유류 세포주 또는 곤충 세포주와 같은 고등 진핵생물의 세포주일 수 있는 것으로 이해된다. 즉, 미생물 유기체인 숙주 세포에 대한 본원의 언급이 대안적으로 바람직한 생산물을 생산하기 위해 고등 진핵생물 세포를 활용할 수 있는 것으로 이해된다. 예시적인 고등 진핵생물 세포주로는, 비-제한적으로, 중국 햄스터 난소 (CHO), 인간 (Hela, 인간 배아 신장 (HEK) 293, Jurkat), 마우스 (3T3), 영장류 (Vero), 곤충 (Sf9) 등이 있다. 이들 세포주는 상업적으로 구입가능하다 (예, the American Type Culture Collection (ATCC; Manassas VA); Life Technologies, Carlsbad CA). 임의의 적절한 숙주 세포를 이용해 본 발명의 알데하이드 데하이드로게나제를 도입하고, 선택적으로 대사 및/또는 유전자 변형을 도입하여 바람직한 생산물을 생산할 수 있는 것으로 이해된다.
선택 숙주 세포의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로의 구성 요소들에 따라, 본 발명의 비-천연성 세포는 하나 이상의 외인성으로 발현되는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로-코딩 핵산, 그리고 최대한으로는 하나 이상의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 코딩하는 핵산 전부, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 예를 들어 본 발명의 알데하이드 데하이드로게나제를 포함할 것이다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성은, 본 발명의 알데하이드 데하이드로게나제 등의, 대응되는 코딩 핵산을 외인성으로 발현함으로써 경로 효소 또는 단백질이 결핍된 숙주에서 확립할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 모든 효소 또는 단백질, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물이 모두 결핍된 숙주에서, 심지어 숙주가 하나 이상의 경로 효소 또는 단백질을 포함한다면 경로의 모든 효소 또는 단백질을 발현할 수 있는 것으로 이해되지만, 경로의 모든 효소 또는 단백질의 외인성 발현을 포함할 수 있다. 예를 들어, 본 발명의 알데하이드 데하이드로게나제를 비롯하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생산 경로에서의 모든 효소 또는 단백질, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 외인성 발현을 포함할 수 있다.
본원에 제공된 교시 내용 및 지침을 감안하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로가 세포에 포함될 것이라면, 발현가능한 형태로 도입하기 위한 코딩 핵산의 개수는 적어도 선택 숙주 세포의 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO 경로의 결핍과 유사함을, 당해 기술 분야의 당업자라면 이해할 것이다. 따라서, 본 발명의 비-천연성 세포는, 본원에 기술된 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 구성하는 효소 또는 단백질을 코딩하는 핵산들을, 구체적인 경로에 따라, 1, 2, 3, 4, 5, 6, 7, 8종 등, 최대한으로는 이들 전부를 포함할 수 있다. 일부 구현예에서, 비-천연성 세포는 또한 숙주 세포에 다른 유용한 기능을 부여하는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성을 촉진하거나 또는 최적화하는 다른 유전자 변형을 포함할 수 있다. 이러한 다른 기능성으로는, 예를 들어, 아세틸-CoA 또는 아세토아세틸-CoA와 같은 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 전구체들 중 하나 이상의 합성 증가를 포함할 수 있다.
일반적으로, 숙주 세포는, 본 발명의 알데하이드 데하이드로게나제를 발현할 수 있으며, 선택적으로 숙주 세포에 의해 천연적으로 생산되는 전구체의 생산 증가 또는 바람직한 전구체의 데 노보 생산을 제공하는 조작된 생산물로서 또는 천연적으로 생산되는 분자로서 이러한 경로를 함유한 세포에서 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 전구체를 생산할 수 있도록, 선택된다. 숙주 유기체는 본원에 기술된 바와 같이 전구체의 생산을 높이도록 조작할 수 있다. 또한, 바람직한 전구체를 생산하도록 조작된 세포를 숙주 유기체로서 이용할 수 있으며, 필요에 따라, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 효소 또는 단백질, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 발현하도록 추가로 조작할 수 있다.
일부 구현예에서, 본 발명의 비-천연성 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 합성하는 효소 능력을 포함하는 숙주로부터 구축된다. 이러한 특정 구현예에서, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 반응을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하는 방향으로 향하게 하기 위해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 생산물의 합성 또는 축적을 증가시키는 것이 유용할 수 있다. 합성 또는 축적 증가는, 예를 들어, 본 발명의 알데하이드 데하이드로게나제 등의, 전술한 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 효소 또는 단백질들 중 하나 이상을 코딩하는 핵산의 과발현에 의해 달성할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 효소 또는 효소들 및/또는 단백질 또는 단백질들의 과발현은, 예를 들어, 본 발명의 알데하이드 데하이드로게나제의 외인성 발현 등의, 내인성 유전자 또는 유전자들의 외인성 발현을 통해, 또는 이종의 유전자 또는 유전자들의 외인성 발현을 통해 이루어질 수 있다. 따라서, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에 따라, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로 효소 또는 단백질, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하는 효소를 코딩하는 핵산을 1, 2, 3, 4, 5, 6, 7, 8 또는 그 이상, 최대 그 전체를 과발현시킴으로써, 예를 들어 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 발현하는, 비-천연성 세포로 천연성 유기체를 쉽게 변환시킬 수 있다. 또한, 비-천연성 유기체는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로에서 효소의 활성, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 증가시키는, 내인성 유전자의 돌연변이 유발에 통해 구축할 수 있다.
특히 유용한 구현예에서, 인코딩 핵산의 외인성 발현을 이용한다. 외인성 발현은, 사용자에 의해 조절되는 바람직한 발현 수준을 달성하기 위해, 발현 및/또는 조절 요소를 맞춤 조절하는 능력을 숙주 및 어플리케이션에 부여한다. 그러나, 내인성 발현도, 유도성 프로모터 또는 다른 조절 인자와 연계되었을 경우, 유전자의 프로모터의 유도 또는 네거티브 조절 작동인자를 제거함으로써와 같이, 다른 구현예에서 이용될 수 있다. 따라서, 천연적인 유도성 프로모터를 가진 내인성 유전자는 적절한 유도성 물질을 제공함으로써 상향-조절하거나, 또는 내인성 유전자의 조절 영역은 유도성 조절 인자를 병합하도록 조작되어, 바람직한 시점에 내인성 유전자의 발현 증가를 조절할 수 있다. 마찬가지로, 유도성 프로모터는 비-천연성 세포에 도입된 외인성 유전자에 대한 조절 인자로서 포함될 수 있다.
하나 이상의 임의의 외인성 핵산을 세포에 도입하여 본 발명의 비-천연성 세포를 제조할 수 있는 것으로 이해된다. 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산을 도입하는 등의, 예를 들어, 세포에 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 생합성 경로를 부여하기 위해, 핵산을 도입할 수 있다. 다른 예로, 인코딩 핵산을 도입하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성의 중간산물 생산력을 부여하기 위해 필수 반응들 중 일부를 촉매하기 위한 생합성 능력을 가진 세포를 제조할 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 가진 비-천연성 세포는 본 발명의 알데하이드 데하이드로게나제 등의 바람직한 효소 또는 단백질을 코딩하는 2 이상의 외인성 핵산을 포함할 수 있다. 이에, 본 발명의 알데하이드 데하이드로게나제를 포함하여, 생합성 경로의 2 이상의 효소 또는 단백질의 임의 조합이 본 발명의 비-천연성 세포에 포함될 수 있는 것으로 이해된다. 마찬가지로, 생합성 경로의 3가지 이상의 효소 또는 단백질의 임의 조합이, 바람직한 생합성 경로의 효소 및/또는 단백질의 조합으로 대응되는 바람직한 생산물의 생산을 달성하는 한, 필요에 따라, 본 발명의 비-천연성 세포에 포함될 수 있는 것으로 이해된다. 마찬가지로, 본원에 기술된 생합성 경로의 4가지 이상의 효소 또는 단백질의 임의 조합이, 바람직한 생합성 경로의 효소 및/또는 단백질의 조합으로 대응되는 바람직한 생산물의 생산이 달성되는 한, 필요에 따라, 본 발명의 비-천연성 세포에 포함될 수 있다.
본원에 기술된 바와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생합성과 더불어, 본 발명의 비-천연성 세포 및 방법은 또한 다른 경로를 통해 생산물의 생합성을 달성하기 위해 서로 간의 다양한 조합 및/또는 다른 세포 및 당해 기술 분야에 잘 알려진 방법과의 다양한 조합으로 사용될 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생산자를 사용하지 않고 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO를 생산하기 위한 한가지 대안은, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO로 변환할 수 있는 다른 세포의 부가를 통해 이루어진다. 이러한 한가지 방법은, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 생산하는 세포를 발효시키는 것이다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물은 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO로 변환하는 제2 세포의 기질로서 이용할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물은 제2 유기체의 다른 배양물에 직접 첨가되거나, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물 생산자의 오리지날 배양물은, 예를 들어, 세포 분리에 의해 이들 세포를 고갈시킨 다음 발효 브로스에 제2 유기체를 후속적으로 첨가하여 중간산물의 정제 단계없이 최종 생산물을 제조할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 관련 다운스트림 산물, 예를 들어, 이의 에스테르 또는 아미드를 생산하는 세포를, 선택적으로 상기한 다운스트림 산물을 생산하기 위해 포함시킬 수 있다.
다른 예로, 이러한 효소적 변환은, 기질을 바람직한 생산물로 변환하는 결과를 달성하는 효소에 대한 순차적인 기질 노출 또는 효소들의 조합을 이용해, 시험관 내에서 수행할 수 있다. 다른 대안으로서, 세포-기반의 변환 및 시험관 내 효소적 변환의 조합도 필요에 따라 사용될 수 있다.
다른 구현예들에서, 본 발명의 비-천연성 세포 및 방법은, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생합성을 달성하기 위해, 매우 다양한 서브경로들로 조립될 수 있다. 이들 구현예에서, 본 발명의 바람직한 생산물의 생합성 경로들은 서로 다른 세포들에 분할될 수 있으며, 서로 다른 세포들을 공-배양하여 최종 생산물을 생산할 수 있다. 이러한 생합성 공정에서, 하나의 세포의 생산물은 최종 생산물이 합성될 때까지 제2 세포의 기질이다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생합성은 하나의 경로 중간 생산물을 다른 경로 중간산물 또는 생산물로 변환하는 생합성 경로를 포함하는 세포를 구축함으로써, 달성할 수 있다. 다른 예로, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO는 동일 용기에서 2종의 서로 다른 세포를 이용한 공동-배양 또는 공동-발효를 통해 세포로부터 생합성 방식으로 생산할 수 있으며, 이때 제1 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 중간산물을 생산하고, 제2 세포는 이들 중간산물을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물로 변환한다.
본원에 제공된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하기 위해, 다른 세포, 서브경로를 구비한 다른 비-천연성 세포들의 공동-배양 및 당해 기술 분야에 잘 알려진 다른 화학적 및/또는 생화학적 공정들의 조합과 함께, 본 발명의 비-천연성 세포 및 방법에 대해 매우 다양한 조합 및 치환들이 존재한다는 것을, 이해할 것이다.
3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 효소 또는 단백질, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물에 대한 코딩 핵산의 소스는, 예를 들어, 코딩된 유전자 산물이 참조 반응을 촉매할 수 있는 임의 종을 포함할 수 있다. 이러한 종은 원핵생물 및 진핵생물 유기체 둘다를 포함하며, 비-제한적인 예로는 고세균 및 유박테리아 등의 박테리아, 및 효모, 식물, 곤충, 동물 및 포유류, 예로 인간 등의 진핵생물 등이 있다. 이러한 소스에 대한 예시적인 종으로는, 예를 들어, 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 사카로마이세스 클루이베리 (Saccharomyces kluyveri), 클로스트리듐 클루이베리 (Clostridium kluyveri), 클로스트리듐 아세토부틸리컴 (Clostridium acetobutylicum), 클로스트리듐 베이예린키이 (Clostridium beijerinckii), 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 클로스트리듐 퍼프린겐스 (Clostridium perfringens), 클로스트리듐 디피실 (Clostridium difficile), 클로스트리듐 보툴리눔 (Clostridium botulinum), 클로스트리듐 티로부티리컴 (Clostridium tyrobutyricum), 클로스트리듐 테타노모르품 (Clostridium tetanomorphum), 클로스트리듐 테타니 (Clostridium tetani), 클로스트리듐 프로피오니컴 (Clostridium propionicum), 클로스트리듐 아미노부티리컴 (Clostridium aminobutyricum), 클로스트리듐 섭터미날 (Clostridium subterminale), 클로스트리듐 스티클란디이 (Clostridium sticklandii), 랄스토니아 유트로파 (Ralstonia eutropha), 마이코박테리움 보비스 (Mycobacterium bovis), 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 테르무스 써모필러스 (Thermus thermophilus), 슈도모나스 종 (Pseudomonas species), 예를 들어, 슈도모나스 에어루지노사 (Pseudomonas aeruginosa), 슈도모나스 푸티다 (Pseudomonas putida), 슈도모나스 스투체리 (Pseudomonas stutzeri), 슈도모나스 플루오레센스 (Pseudomonas fluorescens), 호모 사피엔스 (Homo sapiens), 오리크톨라구스 쿠니쿨러스 (Oryctolagus cuniculus), 로도박터 스페어로이데스 (Rhodobacter spaeroides), 서모안에어로박터 브록키이 (Thermoanaerobacter brockii), 메탈로스페라 세둘라 (Metallosphaera sedula), 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides), 클로로플렉수스 아우란티아쿠스 (Chloroflexus aurantiacus), 로세이플렉수스 카스텐홀지이 (Roseiflexus castenholzii), 에리트로박터 (Erythrobacter), 심몬드시아 치넨시스 (Simmondsia chinensis), 아시네토박터 종, 예를 들어, 아시네토박터 칼코아세티쿠스 (Acinetobacter calcoaceticus) 및 아시네토박터 베일리이 (Acinetobacter baylyi), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 설폴로부스 토코다이 (Sulfolobus tokodaii), 설폴로부스 솔파타리쿠스 (Sulfolobus solfataricus), 설폴로부스 아시도칼다리우스 (Sulfolobus acidocaldarius), 바실러스 섭틸리스 (Bacillus subtilis), 바실러스 세레우스 (Bacillus cereus), 바실러스 메가테리움 (Bacillus megaterium), 바실러스 브레비스 (Bacillus brevis), 바실러스 푸밀루스 (Bacillus pumilus), 라투스 노르베기쿠스 (Rattus norvegicus), 클렙시엘라 뉴모니아 (Klebsiella pneumonia), 클렙시엘라 옥시토카 (Klebsiella oxytoca), 유클레나 글라실리스 (Euglena gracilis), 트레포네마 덴티콜라 (Treponema denticola), 모렐라 서모아세티카 (Moorella thermoacetica), 서모토가 마리티마 (Thermotoga maritima), 할로박테리움 살리나룸 (Halobacterium salinarum), 지오바실러스 스테아로서모필러스 (Geobacillus stearothermophilus), 에어로피룸 퍼닉스 (Aeropyrum pernix), 수스 스크로파 (Sus scrofa), 케어노라브디티스 엘레강스 (Caenorhabditis elegans), 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 아시다미노코커스 퍼멘탄스 (Acidaminococcus fermentans), 락토코커스 락티스 (Lactococcus lactis), 락토바실러스 플란타룸 (Lactobacillus plantarum), 스트렙토코커스 서모필러스 (Streptococcus thermophilus), 엔테로박터 에어로게네스 (Enterobacter aerogenes), 칸디다 (Candida), 아스퍼질러스 테레우스 (Aspergillus terreus), 페디코커스 펜토사세우스 (Pedicoccus pentosaceus), 자이모모나스 모빌러스 (Zymomonas mobilus), 아세토박터 파스테리안스 (Acetobacter pasteurians), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 유박테리움 바르케리 (Eubacterium barkeri), 박테로이데스 카필로수스 (Bacteroides capillosus), 안에어로트룬쿠스 콜리호미니스 (Anaerotruncus colihominis), 나트란에어로비우스 서모필러스 (Natranaerobius thermophilusm), 캄필로박터 제주니 (Campylobacter jejuni), 헤모필러스 인플루엔자 (Haemophilus influenzae), 세라티아 마르세센스 (Serratia marcescens), 시트로박터 아말로나티쿠스 (Citrobacter amalonaticus), 믹소코커스 크산투스 (Myxococcus xanthus), 푸조박테리움 뉼레아툼 (Fusobacterium nuleatum), 페니실리움 크리소게눔 (Penicillium chrysogenum), 해양 감마 프로테오박테리움 (marine gamma proteobacterium), 부티레이트-생산 박테리암 (butyrate-producing bacterium), 노카르디아 오웬시스 (Nocardia iowensis), 노카르디아 파르시니카 (Nocardia farcinica), 스트렙토마이세스 그리세우스 (Streptomyces griseus), 시조사카로마이세스 품베 (Schizosaccharomyces pombe), 지오바실러스 서모글루코시다시우스 (Geobacillus thermoglucosidasius), 살모넬라 티피무리움 (Salmonella typhimurium), 비브리오 콜레라 (Vibrio cholera), 헬리오박터 필로리 (Heliobacter pylori), 니코티아나 카바쿰 (Nicotiana tabacum), 오리자 사티바 (Oryza sativa), 할로페락스 메디테라네이 (Haloferax mediterranei), 아그로박테리움 투메팍시엔스 (Agrobacterium tumefaciens), 아크로모박터 데니트리피칸스 (Achromobacter denitrificans), 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum), 스트렙토마이세스 클라불리게누스 (Streptomyces clavuligenus), 아시네토박터 바우마니이 (Acinetobacter baumanii), 무스 무스쿨러스 (Mus musculus), 라찬시아 클루이베리 (Lachancea kluyveri), 트리코모나스 바기날리스 (Trichomonas vaginalis), 트리파노소마 브루세이 (Trypanosoma brucei), 슈도모나스 스투체리 (Pseudomonas stutzeri), 브라디리조븀 자포니컴 (Bradyrhizobium japonicum), 메소리조븀 로티 (Mesorhizobium loti), 보스 타우루스 (Bos taurus), 니코티아나 글루티노사 (Nicotiana glutinosa), 비브리오 불니피쿠스 (Vibrio vulnificus), 셀레노모나스 루미난튬 (Selenomonas ruminantium), 비브리오 파라헤몰리티쿠스 (Vibrio parahaemolyticus), 아르케오글로부스 풀기두스 (Archaeoglobus fulgidus), 할로아르쿨라 마리스모르투이 (Haloarcula marismortui), 피로바쿨룸 에어로필럼 (Pyrobaculum aerophilum), 미코박테리움 스메그마티스 (Mycobacterium smegmatis), MC2 155, 미코박테리움 아븀 아종 파라투베르쿨로시스 K-10 (Mycobacterium avium subsp . paratuberculosis K-10), 미코박테리움 마리눔 M (Mycobacterium marinum M), 츠카무렐라 파우로메타볼라 (Tsukamurella paurometabola) DSM 20162, 시아노븀 PCC7001, 딕티오스텔륨 디스코이데움 AX4 (Dictyostelium discoideum AX4), 아시다미노코커스 퍼멘탄스 (Acidaminococcus fermentans), 아시네토박터 베일리이 (Acinetobacter baylyi), 아시네토박터 칼코아세티쿠스 (Acinetobacter calcoaceticus), 아쿠이페스 에어올리쿠스 (Aquifex aeolicus), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 아르케오글로부스 풀기두스 (Archaeoglobus fulgidus), 아스퍼질러스 나이거 (Aspergillus niger), 아스퍼질러스 테레우스 (Aspergillus terreus), 바실러스 섭틸리스 (Bacillus subtilis), 보스 타우루스 (Bos Taurus), 칸디다 알비칸스 (Candida albicans), 칸디다 트로피칼리스 (Candida tropicalis), 클라미도모나스 라인하르드티이 (Chlamydomonas reinhardtii), 클로로븀 테피둠 (Chlorobium tepidum), 시트로박터 코세리 (Citrobacter koseri), 시트러스 주노스 (Citrus junos), 클로스트리듐 아세토부틸리컴 (Clostridium acetobutylicum), 클로스트리듐 클루이베리 (Clostridium kluyveri), 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 시아노븀 PCC7001, 데설파티바실륨 아케니보란스 (Desulfatibacillum alkenivorans), 딕티오스텔리움 디스코이데움 (Dictyostelium discoideum), 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum), 할로아르쿨라 마리스모르투이 (Haloarcula marismortui), 호모 사피엔스 (Homo sapiens), 하이드로게노박터 서모필러스 (Hydrogenobacter thermophilus), 클렙시엘라 뉴모니애 (Klebsiella pneumoniae), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 락토바실러스 브레비스 (Lactobacillus brevis), 루노코스톡 메센테로이데스 (Leuconostoc mesenteroides), 메탈로스페라 세둘라 (Metallosphaera sedula), 메타노서모박터 서마우토트로피쿠스 (Methanothermobacter thermautotrophicus), 무스 무스쿨러스 (Mus musculus), 미코박테리움 아븀 (Mycobacterium avium), 미코박테리움 보비스 (Mycobacterium bovis), 미코박테리움 마리눔 (Mycobacterium marinum), 미코박테리움 스메그마티스 (Mycobacterium smegmatis), 니코티아나 타바쿰 (Nicotiana tabacum), 노카르디아 오웬시스 (Nocardia iowensis), 오릭톨라구스 쿠니쿨러스 (Oryctolagus cuniculus), 페니실리움 크리소게눔 (Penicillium chrysogenum), 피키아 파스토리스 (Pichia pastoris), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 슈도모나스 에어루지노사 (Pseudomonas aeruginosa), 슈도모나스 푸티다 (Pseudomonas putida), 슈도모나스 에어로필럼 (Pyrobaculum aerophilum), 랄스토니아 유트로파 (Ralstonia eutropha), 라투스 노르베기쿠스 (Rattus norvegicus), 로도박터 스페어로이데스 (Rhodobacter sphaeroides), 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 살모넬라 엔테릭 (Salmonella enteric), 살모넬라 티피무리움 (Salmonella typhimurium), 시조사카로마이세스 폼베 (Schizosaccharomyces pombe), 설폴로부스 아시도칼다리우스 (Sulfolobus acidocaldarius), 설폴로부스 솔파타리쿠스 (Sulfolobus solfataricus), 설폴로부스 토코다이 (Sulfolobus tokodaii), 서모안에어로박터 텡콩엔시스 (Thermoanaerobacter tengcongensis), 터무스 서모필러스 (Thermus thermophilus), 트리파노소마 브루세이 (Trypanosoma brucei), 츠카무렐라 파우로메타볼라 (Tsukamurella paurometabola), 야로이야 리폴리티카 (Yarrowia lipolytica), 주글로에아 라미게라 (Zoogloea ramigera), 및 자이모모나스 모빌리스 (Zymomonas mobilis), 클로스트리듐 종, 예를 들어, 비-제한적으로, 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 클로스트리듐 베이예린키이 (Clostridium beijerinckii), 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 클로스트리듐 보툴리눔 (Clostridium botulinum), 클로스트리듐 메틸펜토섬 (Clostridium methylpentosum), 클로스트리듐 스티클란디이 (Clostridium sticklandii), 클로스트리듐 피토퍼멘탄스 (Clostridium phytofermentans), 클로스트리듐 사카로라이티컴 (Clostridium saccharolyticum), 클로스트리듐 아스파라기포르메 (Clostridium asparagiforme), 클로스트리듐 셀라툼 (Clostridium celatum), 클로스트리듐 카르복시디보란스 (Clostridium carboxidivorans), 클로스트리듐 클로스트리디오포르메 (Clostridium clostridioforme), 클로스트리듐 볼테아 (Clostridium bolteae), 칼달칼리바실러스 서마룸 (Caldalkalibacillus thermarum), 클로스트리듐 보툴리눔 (Clostridium botulinum), 펠로시누스 퍼멘탄스 (Pelosinus fermentans), 서모안에어로박테리움 서모사카로라이티컴 (Thermoanaerobacterium thermosaccharolyticum), 데설포스포로시누스 종 (Desulfosporosinus speices), 서모안에어로박테리움 종, 비-제한적인 예로, 서모안에어박테리움 사카로라이티컴 (Thermoanaerobacterium saccharolyticum), 서모안에어로박테리움 크실라놀라이티컴 (Thermoanaerobacterium xylanolyticum), 아세토네마 롱검 (Acetonema longum), 지오바실러스 종, 비-제한적인 예로, 지오바실러스 서모글루코시단스 (Geobacillus thermoglucosidans), 바실러스 아조토포르만스 (Bacillus azotoformans), 서민콜라 포텐스 (Thermincola potens), 푸조박테리움 종, 비-제한적인 예로, 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum), 푸조박테리움 울세란스 (Fusobacterium ulcerans), 푸조박테리움 바륨 (Fusobacterium varium), 루미노코커스 종 (Ruminococcus species), 비-제한적인 예로, 루미노코커스 그나부스 (Ruminococcus gnavus), 루미노코커스 오베움 (Ruminococcus obeum), 라크노스피라시이 박테리움 (Lachnospiraceae bacterium), 플라보니프락토 플라우티이 (Flavonifractor plautii), 로세부리아 이눌린이보란스 (Roseburia inulinivorans), 아세토박테리움 우디이 (Acetobacterium woodii), 유박테리움 종, 비-제한적인 예로, 유박테리움 프렉시카우다툼 (Eubacterium plexicaudatum), 유박테리움 할리이 (Eubacterium hallii), 유박테리움 리모숨 (Eubacterium limosum), 유박테리움 이우리이 (Eubacterium yurii), 유박테리아시이 박테리움 (Eubacteriaceae bacterium), 서모세디미니박터 오세아니 (Thermosediminibacter oceani), 일리오박터 폴리트로푸스 (Ilyobacter polytropus), 셔틀워티아 사텔레스 (Shuttleworthia satelles), 할안에어로븀 사카로라이티컴 (Halanaerobium saccharolyticum), 서모안에어로박터 에타놀리쿠스 (Thermoanaerobacter ethanolicus), 로도스피릴룸 루브룸 (Rhodospirillum rubrum), 비브리오 (Vibrio), 프로피오니박테리움 프로피오니컴 (Propionibacterium propionicum)뿐 아니라 본원에 기술되거나 또는 해당 유전자에 대한 소스 유기체로서 이용가능한 다른 예시 종들, 예를 들어 표 4에 기술된 알데하이드 데하이드로게나제의 소스 유기체 등이 있다. 그러나, 미생물 게놈 395종 및 다양한 효모, 진균, 식물 및 포유류 게놈을 비롯하여, 현재 550종 이상에서 이용가능한 전체 게놈 서열을 이용해 (NCBI와 같은 공공의 데이터베이스에서 이용가능한 데이타의 절반 이상을 이용해), 공지 유전자의 상동체, 오르소로그, 파라로그 및 비-오르소로거스 유전자 치환 등의, 관련 또는 동떨어진 종들에서 하나 이상의 유전자에 대한 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 활성을 코딩하는 유전자의 동정, 및 유기체들 간의 유전자 변형의 상호교환은 일반적이며, 당해 기술 분야에 잘 알려져 있다. 이에, E. coli와 같은 특정 유기체를 참조하여, 본 발명의 알데하이드 데하이드로게나제의 발현 등의, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생합성을 허용하는 대사 변형은, 비슷한 원핵생물 및 진핵생물 유기체 등의, 미생물과 같은 다른 세포에도 쉽게 적용할 수 있다. 본원에 제공된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면 하나의 유기체에서 예시된 대사 변형이 다른 유기체에도 동일하게 적용할 수 있음을 알 것이다.
대안적인 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로가 비-관련 종에서 존재하는 경우에서와 같은 일부 예에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성은, 예를 들어, 참조 반응을 대체하기 위해 유사하지만 동일하진 않은 대사 반응을 촉매하는 비-관련 종들로부터 파라로그 또는 파라로그들의 외인성 발현에 의해, 숙주 종에 부여할 수 있다. 여러가지 유기체들 간에 대사 네트워크에 일부 차이가 존재하기 때문에, 당해 기술 분야의 당업자라면, 서로 다른 유기체들 간의 실제 유전자 용법 (gene usage)이 다를 수 있음을 이해할 것이다. 그러나, 본원에 제공된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자는, 또한 본 발명의 교시 내용 및 방법을, 본 발명의 알데하이드 데하이드로게나제를 도입하는 것을 포함하여, 필요에 따라, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 합성할 세포를 대상 종에서 구축하기 위해 본원에 예시된 내용에 대한 동계 (cognate) 대사 변형을 이용하여 모든 세포에 적용할 수 있음을, 이해할 것이다.
본 발명의 알데하이드 데하이드로게나제를 포함하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하는 비-천연성 숙주를 구축하고 발현 수준을 테스트하는 방법들은, 예를 들어, 당해 기술 분야에 잘 알려진 재조합 및 검출 방법에 의해 수행할 수 있다. 이러한 방법은 예를 들어 Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); 및 Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)에서 찾아볼 수 있다.
본 발명의 알데하이드 데하이드로게나제를 코딩하는 외인성 핵산, 및 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생산 경로에 참여하는 외인성 핵산은, 비-제한적인 예로, 접합, 전기천공, 화학적 형질전환, 형질도입, 형질감염 및 초음파 형질전환 등의 당해 기술 분야에 잘 알려진 기법을 이용해 숙주 세포에 안정적으로 또는 일시적으로 도입시킬 수 있다. E. coli 또는 기타 원핵생물 세포에서 외인성 발현을 위해, 진핵생물 핵산의 유전자 또는 cDNA 내 일부 핵산 서열은, 필요에 따라, 원핵생물 숙주 세포에 형질전환하기 전에 제거될 수 있는, N-말단 미토콘드리아 또는 그외 타겟팅 신호와 같은 타겟팅 신호를 코딩할 수 있다. 예를 들어, 미토콘드리아 리더 서열은 E. coli에서 발현 증가를 유도한다 (Hoffmeister et al., J. Biol . Chem. 280:4329-4338 (2005)). 효모 또는 기타 진핵생물 세포에서 외인성 발현을 위해, 유전자는 리더 서열 부가 없이 세포질에서 발현시키거나, 또는 숙주 세포에 적합한 미토콘드리아 타겟팅 또는 방출 신호와 같은 적합한 타겟팅 서열을 부가함으로써, 미토콘드리아 또는 그외 소기관으로 타겟팅하거나 또는 분비하도록 타겟팅할 수 있다. 따라서, 타겟팅 서열을 제거 또는 포함하기 위한 핵산 서열에의 적절한 변형은 바람직한 특성을 전달하기 위해 외인성 핵산 서열에 포함시킬 수 있는 것으로 이해된다. 또한, 유전자는 단백질의 최적화된 발현을 달성하기 위해 당해 기술 분야에 잘 알려진 기법으로 코돈 최적화를 이행할 수 있다.
발현 벡터 또는 벡터는, 본원에 예시된 바와 같이, 숙주 유기체에서 발현 조절 서열 기능에 작동가능하게 연결된, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산, 및/또는 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 코딩하는 하나 이상의 핵산, 또는 이의 에스테르 또는 아미드와 같이 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO와 관련된 다운스트림 산물을 생산하는 효소를 코딩하는 핵산을 포함하도록 구축할 수 있다. 본 발명의 숙주 세포에서 이용하기 위해 적용가능한 발현 벡터로는, 예를 들어, 벡터 및 숙주 염색체에 안정적으로 삽입하기 위해 작동가능한 선택 서열 또는 마커를 비롯하여, 플라스미드, 파지 벡터, 바이러스 벡터, 에피솜 및 인공 염색체 등이 있다. 또한, 발현 벡터는 하나 이상의 선별가능한 마커 유전자 및 적절한 발현 조절 서열을 포함할 수 있다. 또한, 예를 들어, 항생제 또는 독소에 대한 내성을 제공하거나, 영양요구성 결핍을 보완하거나 또는 배양 배지에 없는 중요한 영양분을 공급하는, 선별가능한 마커 유전자가 포함될 수 있다. 발현 조절 서열은 당해 기술 분야에 잘 공지되어 있는 구성적인 (constitutive) 프로모터, 유도성 프로모터, 전사 인핸서, 전사 종결인자 등을 포함할 수 있다. 2 이상의 외인성 코딩 핵산을 공동-발현시킬 경우, 이들 2종의 핵산은, 예를 들어, 단일한 발현 벡터에 또는 분리된 발현 벡터들에 삽입시킬 수 있다. 단일한 벡터 발현의 경우, 코딩 핵산을 하나의 공통된 발현 조절 서열에 작동가능하게 연결시키거나 또는 유도 프로모터 1개 및 구성적 프로모터 1개 등의 서로 다른 발현 조절 서열에 작동가능하게 연결시킬 수 있다. 본 발명의 알데하이드 데하이드로게나제 또는 대사 또는 합성 경로에 참여하는 폴리펩타이드를 코딩하는 외인성 핵산 서열의 형질전환은 당해 기술 분야에 잘 알려진 방법으로 검증할 수 있다. 이러한 방법으로는, 예를 들어, mRNA의 노던 블롯 또는 폴리머라제 연쇄 반응 (PCR) 증폭과 같은 핵산 분석, 또는 유전자 산물 발현에 대한 면역블롯팅, 또는 도입된 핵산 서열 또는 이의 대응되는 유전자 산물의 발현을 검사하기 위한 그외 적절한 분석 방법 등이 있다. 당해 기술 분야의 당업자라면, 외인성 핵산이 바람직한 생산물을 생산하기에 충분한 양으로 발현되는 것으로 이해하며, 또한 당해 기술 분야에 잘 알려진 방법 및 본원에 기술된 방법을 이용해 충분한 발현을 수득하도록 발현 수준을 최적화할 수 있음을 알 것이다.
벡터 또는 발현 벡터는 또한 코딩 핵산을 발현시켜 시험관 내 전사 및 번역에 의해 코딩된 폴리펩타이드를 생산하는데 이용할 수 있다. 이러한 벡터 또는 발현 벡터는 적어도 프로모터를 포함할 것이며, 전술한 벡터를 포함할 것이다. 시험관 내 전사 및 번역에서 상기한 벡터는 일반적으로 이중 가닥 DNA이다. 시험관 내 전사 및 번역 방법들은 당해 기술 분야의 당업자들에게 공지되어 있다 (Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); 및 Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999) 참조). 시험관 내 전사 및 번역을 위한 키트 역시 상업적으로 구입가능하다 (예, Promega, Madison, WI; New England Biolabs, Ipswich, MA; Thermo Fisher Scientific, Carlsbad, CA).
일 구현예에서, 본 발명은, 본 발명의 세포를 배양하여 3-HBal 및/또는 1,3-BDO 또는 이의 에스테르 또는 아미드를 배양하는 것을 포함하는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO) 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 이러한 세포는 본 발명의 폴리펩타이드를 발현한다. 일 구현예에서, 본 발명은, 본 발명의 세포를 배양하여 4-HBal 및/또는 1,4-BDO 또는 이의 에스테르 또는 아미드를 생산하는 것을 포함하는, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO) 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 일 구현예에서, 세포는 실질적으로 혐기성 배양 배지에 존재한다. 일 구현예에서, 이 방법은 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO, 또는 이의 에스테르 또는 아미드를 단리 또는 정제하는 것을 더 포함할 수 있다. 특정 구현예에서, 단리 또는 정제는 증류를 포함한다.
일 구현예에서, 본 발명은, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 자체와 또는 다른 화합물과 생산물을 생산하는 반응으로 화학적으로 반응시키는 것을 포함하는, 본 발명의 생산물의 제조 방법을 제공한다.
일 구현예에서, 본 발명은, 본 발명의 폴리펩타이드에 기질을 제공하고, 그 기질을 3-HBal 및/또는 1,3-BDO로 변환하는 것을 포함하며, 기질이 1,3-하이드록시부티릴-CoA의 라세믹 혼합물인, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO는 R 형태로 거울상이성질체적으로 농화된다. 일 구현예에서, 본 발명은, 기질을 본 발명의 폴리펩타이드에 제공하고, 그 기질을 4-HBal 및/또는 1,4-BDO로 변환하는 것을 포함하며, 기질이 1,4-하이드록시부티릴-CoA인, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 일 구현예에서, 폴리펩타이드는 세포에, 세포 용해물에 존재하거나 또는 세포 또는 세포 용해물로부터 단리된다.
일 구현예에서, 본 발명은, 본 발명의 세포의 세포 용해물을 인큐베이션하여 3-HBal 및/또는 1,3- BDO, 또는 4-HBal 및/또는 1,4-BDO를 생산하는 것을 포함하는, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO의 제조 방법을 제공한다. 일 구현예에서, 세포 용해물을 제2 세포 용해물과 혼합하며, 제2 세포 용해물은 본 발명의 폴리펩타이드의 기질, 또는 3-HBal 및/또는 1,3-BDO. 또는 4-HBal 및/또는 1,4-BDO의 다운스트림 산물을 생산하기 위한 효소 활성을 포함한다.
또한, 본 발명은, 세포에서 폴리펩타이드를 발현시키는 것을 포함하는, 본 발명의 폴리펩타이드를 제조하는 방법을 제공한다. 본 발명은 부가적으로 본 발명의 핵산 또는 본 발명의 벡터를 시험관 내 전사 및 번역하여 폴리펩타이드를 제조하는 것을 포함하는, 본 발명의 폴리펩타이드의 제조 방법을 제공한다.
본원에 기술된 바와 같이, 세포를 이용해 본 발명의 알데하이드 데하이드로게나제를 발현시킬 수 있으며, 선택적으로 세포는 본 발명의 알데하이드 데하이드로게나제를 이용해 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO와 같은 바람직한 생산물을 생산하는 대사 경로를 포함할 수 있다. 바람직한 생산물을 발현시키는 이러한 방법이 본원에 기술된다. 다른 예로, 본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제는 발현시키거나, 및/또는 바람직한 생산물을 세포 용해물 내에서, 예를 들어 본 발명의 알데하이드 데하이드로게나제를 발현하는 세포 또는 본 발명의 알데하이드 데하이드로게나제와 바람직한 생산물을 생산하기 위한 대사 경로를 발현하는 세포의 용해물 내에서 생산할 수 있다. 다른 구현예에서, 본 발명의 알데하이드 데하이드로게나제는, 알데하이드 데하이드로게나제가 세포 비함유 (cell-free) 시스템에서 제조되는, 시험관 내 전사 및 번역에 의해 발현시킬 수 있다. 시험관 내 전사 및 번역에 의해 발현된 알데하이드 데하이드로게나제는 시험관 내에서 반응을 수행하기 위해 사용될 수 있다. 선택적으로, 기타 효소 또는 이러한 효소를 함유한 세포 용해물(들)을 사용해, 알데하이드 데하이드로게나제 효소 반응의 생산물을 바람직한 다운스트림 산물로 시험관 내에서 변환할 수 있다.
알데하이드 데하이드로게나제의 활성을 검사하기 위한 분석을 포함하여, 알데하이드 데하이드로게나제의 발현, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생산을 테스트하기에 적합한 정제 및/또는 분석은, 잘 알려진 방법을 이용해 수행할 수 있다 (실시예 참조). 트리플리케이트 (triplicate) 배양과 같은 적절한 리플리케이트를 검사할 조작 균주 각각에 대해 배양할 수 있다. 예를 들어, 조작된 생산 숙주에서 생산물 및 부산물의 형성을 모니터링할 수 있다. 최종 생산물 및 중간산물, 및 기타 유기 화합물은 HPLC (고 성능 액체 크로마토그래피), GC-MS (가스 크로마토그래피-질량 분광분석) 및 LC-MS (액체 크로마토그래피-질량 분광분석) 또는 기타 당해 기술 분야에서 잘 알려진 통상적인 공정을 이용한 그외 적합한 분석 방법 등의 방법으로 분석할 수 있다. 발효 브로스 내 생산물의 방출은 또한 배양 상층액을 사용해 검사할 수 있다. 생산물 및 잔류 글루코스는, 예를 들어, 글루코스 및 알코올에 대한 굴절율 검출기, 및 유기산에 대한 UV 검출기를 이용해, HPLC에 의해 또는 당해 기술 분야에 잘 알려진 그외 적합한 분석 및 검출 방법으로 정량할 수 있다 (Lin et al., Biotechnol . Bioeng. 90:775-779 (2005)). 또한, 외인성 DNA 서열로부터 유래되는 개별 효소 또는 단백질의 활성은 당해 기술 분야에 잘 알려진 방법을 이용해 분석할 수 있다 (실시예 참조).
3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 그외 바람직한 생산물, 예를 들어, 이의 에스테르 또는 아미드와 같은 이와 관련있는 다운스트림 산물은, 당해 기술 분야에 잘 알려진 다양한 방법을 이용해 배양물 내 다른 성분들로부터 분리할 수 있다. 이러한 분리 방법으로는, 예를 들어, 추출 공정뿐 아니라 연속적인 액체-액체 추출, 투석증발 (pervaporation), 막 여과, 막 분리, 역 삼투압, 전기 투석, 증류, 결정화, 원심분리, 추출 여과 (extractive filtration), 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 흡착 크로마토그래피 및 초미세여과를 포함하는 방법 등이 있다. 전술한 방법들 모두 당해 기술 분야에 잘 공지되어 있다.
본원에 기술된 본 발명의 알데하이드 데하이드로게나제를 발현하는 임의의 비-천연성 세포를 배양하여 본 발명의 생합성 생산물을 생산 및/또는 분비시킬 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하는 세포는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생합성 생산하기 위해 배양할 수 있다. 즉, 일부 구현예에서, 본 발명은 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 본원에 기술된 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 함유한 배양 배지를 제공한다. 일부 측면에서, 배양 배지는 또한 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 생산하는 본 발명의 비-천연성 세포로부터 분리할 수 있다. 배양 배지로부터 세포를 분리하는 방법은 당해 기술 분야에 잘 공지되어 있다. 예시적인 방법으로는 여과, 응집 (flocculation), 석출, 원심분리, 침강 등이 있다.
본 발명의 알데하이드 데하이드로게나제를 발현하는 세포에서, 본 발명의 알데하이드 데하이드로게나제, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하기 위해, 재조합 균주를 탄소원 및 기타 필수 영양분이 첨가된 배지에서 배양한다. 전 공정의 비용을 줄이기 위해 발효기를 혐기성 상태로 유지시키는 것이 종종 바람직하며, 매우 바람직할 수 있다. 이러한 조건은, 예를 들어, 배지를 질소로 퍼징한 다음 격막 (septum) 및 크림프-캡 (crimp-cap)으로 플라스크를 밀봉함으로써, 달성할 수 있다. 혐기성 상태에서는 증식이 관찰되지 않는 균주의 경우, 격막에 제한적인 호기를 위해 작은 구멍을 뚫어 미세호기 (microaerobic) 또는 실질적으로 혐기 조건을 적용할 수 있다. 예시적인 혐기 조건들은 기존에 기술되어 있으며, 당해 기술 분야에 잘 알려져 있다. 예시적인 호기 및 혐기 조건들은 2007년 8월 10일에 출원된 미국 특허 공개공보 2009/0047719에 기술되어 있다. 발효는 본원에 기술된 바와 같이 배치, 피드-배치 또는 연속적인 방식으로 수행할 수 있다. 또한, 발효는 필요에 따른 2 단계로 수행할 수 있다. 제1 단계는 높은 증식, 즉 높은 생산성을 허용하기 위해 호기성 단계일 수 있으며, 그 후 3-HBal, 1,3-BDO, 4- HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물과 같은 바람직한 생산물의 고 수율을 위한 혐기성 단계가 뒷따를 수 있다.
적절한 경우, 배지의 pH는, 필요에 따라 배양 배지를 바람직한 pH에서 유지시키기 위해, NaOH 또는 기타 염기와 같은 염기 또는 산을 첨가함으로써, 바람직한 pH, 특히 중성 pH, 예를 들어 약 pH 7에서 유지시킬 수 있다. 증식율은 분광광도계 (600 nm)를 이용한 광학 밀도를 측정함으로써 결정할 수 있으며, 글루코스 흡수율 (glucose uptake rate)은 시간 경과에 따른 탄소원 고갈을 모니터링함으로써 결정할 수 있다.
증식 배지는, 예를 들어, 비-천연성 세포에 탄소원을 공급할 수 있는, 임의의 탄수화물 소스를 포함할 수 있다. 이러한 탄수화물 소스로는, 예를 들어, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프럭토스, 슈크로스 및 전분과 같은 당; 또는 글리세롤 등이 있으며, 탄소원은 유일한 탄소원으로서 단독으로 또는 본원에 기술되거나 당해 기술 분야에 공지된 다른 탄소원과의 조합으로 사용될 수 있다. 그외 탄수화물 소스로는 예를 들어 재생가능한 공급원료 (renewable feedstock) 및 바이오매스 (biomass) 등이 있다. 본 발명의 방법에서 공급원료로서 사용될 수 있는 바이오매스의 타입의 예로는 셀룰로스 바이오매스, 헤미셀룰로스 바이오매스 및 리그닌 공급원료 또는 공급원료의 일부 등이 있다. 이러한 바이오매스 공급원료는, 예를 들어, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프럭토스 및 전분과 같은 탄소원으로서 유용한 탄수화물 물질을 포함한다. 본원에 제공된 교시 내용 및 지침을 고려하여, 당해 기술 분야의 당업자라면, 상기에 예시된 것 이외의 재생가능한 공급원료 및 바이오매스 역시 본 발명의 알데하이드 데하이드로게나제를 발현시키고, 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이의 다운스트림 산물을 생산하기 위해, 본 발명의 세포를 배양하는데 사용할 수 있음을, 알 것이다.
상기에 예시된 것과 같은 재생가능한 공급원료 외에도, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이의 다운스트림 산물을 생산하는 본 발명의 세포는, 또한 이의 탄소원으로서 합성가스 (syngas)에서 증식하도록 변형될 수 있다. 이러한 구체적인 구현예에서, 합성가스 또는 기타 기체성 탄소원을 이용하는 대사 경로를 제공하기 위해, 하나 이상의 단백질 또는 효소를 HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생산 유기체에서 발현시킨다.
합성가스 또는 발생로 가스 (producer gas)로도 알려진 합성 가스 (synthesis gas)는, 석탄의 기화와, 농업 작물 및 잔재 (residues) 등의 바이오매스 물질과 같은 탄소질 물질의 주요 산물이다. 합성 가스는 주로 H2 및 CO로 구성된 혼합물이며, 비-제한적인 예로, 석탄, 석탄 오일, 천연 가스, 바이오매스 및 폐기 유기물 등의 임의의 유기 공급원료의 기화로부터 수득할 수 있다. 기화는 일반적으로 높은 연료/산소 비율 하에 수행된다. 합성 가스는 주로 H2 및 CO이지만, CO2 및 다른 기체를 소량으로 포함할 수 있다. 따라서, 합성 가스는 CO, 추가적으로 CO2 등의 가스성 탄소에 대한 비용 효율적인 소스를 제공한다.
우드-룬달 (Wood-Ljungdahl) 경로는 CO와 H2의 아세틸-CoA와 아세테이트 등의 기타 생산물로의 변환을 촉매한다. 또한, CO 및 합성 가스를 이용할 수 있는 유기체는, 일반적으로, 우드-룬달 경로에 포함된 효소 및 변환으로 된 동일한 기본 세트를 통해, CO2 및 CO2/H2 혼합물을 이용할 수 있는 능력을 가지고 있다. 또한, 동일 유기체가 CO를 이용할 수 있으며 동일한 경로가 관여한다는 것이 밝혀지기 이전에는, 오랫동안 미생물이 이산화탄소를 H2-의존적인 방식으로 아세테이트로 변환하는 것으로 인식되었다. 수소가 필요한 환원 당량을 제공하기 위해 존재하는 한, 다수의 아세토젠 (acetogen)이 이산화탄소의 존재 하에 증식하여 아세테이트와 같은 화합물을 생산하는 것으로 확인되었다 (예, Drake, Acetogenesis, pp. 3-60 Chapman and Hall, New York, (1994) 참조). 이를 아래 등식으로 정리할 수 있다:
2CO2 + 4H2 + nADP + nPi → CH3COOH + 2H2O + nATP
그래서, 우르-룬달 경로를 가진 비-천연성 미생물은 CO2 및 H2 혼합물을 이용할 수 있을 뿐만 아니라 아세틸-CoA 및 기타 바람직한 생산물을 생산할 수 있다.
우드-룬달 경로는 당해 기술 분야에 잘 알려져 있으며, 2개의 분지, 즉 (1) 메틸 분지와 (2) 카보닐 분지로 분리될 수 있는 12가지 반응으로 구성되어 있다. 메틸 분지는 합성 가스를 메틸-테트라하이드로폴레이트(메틸-THF)로 변환하고, 카보닐 분지는 메틸-THF를 아세틸-CoA로 변환한다. 메틸 분지에서의 반응들은 다음과 같은 효소 또는 단백질에 의해 순차적으로 촉매된다: 페레독신옥시도리덕타제, 포르메이트 데하이드로게나제, 포르밀테트라하이드로폴레이트 신테타제, 메테닐테트라하이드로폴레이트 사이클로데하이드라타제, 메틸렌테트라하이드로폴레이트 데하이드로게나제 및 메틸렌테트라하이드로폴레이트 리덕타제. 카르보닐 분지에서의 반응들은 다음과 같은 효소 또는 단백질에 의해 순차적으로 촉매된다: 메틸테트라하이드로폴레이트:코리노이드 단백질 메틸트랜스퍼라제 (예, AcsE), 코리노이드 철-황 단백질, 니켈-단백질 어셈블리 단백질 (예, AcsF), 페레독신, 아세틸-CoA 신타제, 카본 모노옥사이드 데하이드로게나제 및 니켈-단백질 어셈블리 단백질 (예, CooC) (WO2009/094485 참조). 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 등의, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 제조하기 위해 충분한 수의 코딩 핵산을 도입하는 것에 대한 본원에 제공된 교시 내용 및 지침에 따라, 당해 기술 분야의 당업자라면, 적어도 숙주 유기체에 존재하지 않는 우드-룬달 효소 또는 단백질을 코딩하는 핵산을 도입하는 것과 관련하여, 동일한 조작 설계를 수행할 수 있음을 이해할 것이다. 즉, 변형된 유기체에 우드-룬달의 전체 경로가 포함되도록 하나 이상의 코딩 핵산을 본 발명의 세포에 도입함으로써, 합성가스의 이용 능력을 부여하게 될 것이다.
또한, 일산화탄소 데하이드로게나제 활성 및/또는 하이드로게나제 활성과 커플링된 환원성(역) 트리카르복시산 사이클은, CO, CO2 및/또는 H2를 아세틸-CoA 및 아세테이트와 같은 기타 생산물로 변환하는데, 이용할 수 있다. 환원성 TCA 경로를 통해 탄소를 고정할 수 있는 유기체는 하나 이상의 다음과 같은 효소를 이용할 수 있다: ATP 사이트레이트-리아제, 사이트레이트 리아제, 아코니타제, 이소사이트레이트 데하이드로게나제, α-케토글루타레이트:페레독신옥시도리덕타제, 숙시닐-CoA 신테타제, 숙시닐-CoA 트랜스퍼라제, 푸마레이트 리덕타제, 푸마라제, 말레이트 데하이드로게나제, NAD(P)H:페레독신옥시도리덕타제, 일산화탄소 데하이드로게나제 및 하이드로게나제. 구체적으로, 일산화탄소 데하이드로게나제 및 하이드로게나제에 의해 CO 및/또는 H2로부터 추출된 환원 당량을 이용하여, 환원성 TCA 사이클을 통해 CO2를 아세틸-CoA 또는 아세테이트에 고정한다. 아세테이트는 아세틸-CoA 트랜스퍼라제, 아세테이트 키나제/포스포트랜스아세틸라제 및 아세틸-CoA 신테타제와 같은 효소에 의해 아세틸-CoA로 변환할 수 있다. 아세틸-CoA는, 피루베이트:페레독신 옥시도리덕타제 및 글루코스 신생 합성 (gluconeogenesis) 효소에 의해 글리세르알데하이드-3-포스페이트, 포스포에놀피루베이트 및 피루베이트로 변환할 수 있다. 또한, 아세틸-CoA는, 예를 들어, 아세토아세틸-CoA 티올라제에 의해 아세토아세틸-CoA로 변환되어, 본원에 기술된 바와 같이 1,3-BDO 경로로 이동할 수 있다 (도 1 참조). 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 제조하기 위한 경로를 구축하기 위해 충분한 수의 코딩 핵산을 도입하는 것에 대한 본원에 제시된 교시된 내용 및 지침에 따라, 당해 기술 분야의 당업자라면, 숙주 유기체에 존재하지 않는 환원성 TCA 경로 효소 또는 단백질을 코딩하는 핵산을 적어도 도입하는 것에 대하여, 동일한 조작 설계를 수행할 수 있음을 이해할 것이다. 따라서, 본 발명의 세포에의 하나 이상의 코딩 핵산의 도입은 변형된 유기체가 환원성 TCA 경로를 포함하도록 수행될 수 있다.
따라서, 본원에 제시된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 탄수화물과 같은 탄소원에서 생육시켰을 때, 본 발명의 생합성 화합물을생산 및/또는 분비하는 비-천연성 세포를 생산할 수 있음을 이해할 것이다. 이러한 화합물로는, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 및 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에서의 임의의 중간 대사산물을 포함한다. 예를 들면, 본 발명의 알데하이드 데하이드로게나제를 비롯하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생합성 경로의 일부 또는 전체를 포함하는 등의, 바람직한 화합물 또는 중간산물의 생합성을 달성하도록 필수 효소 또는 단백질 활성 중 하나 이상을 조작하는 것이 필요한 전부이다. 이에, 본 발명은, 탄수화물 또는 기타 탄소원에서의 생육시 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산 및/또는 분비하며, 탄수화물 또는 기타 탄소원에서의 생육시 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에서 확인되는 임의의 중간 대사산물을 생산 및/또는 분비하는, 비-천연성 세포를 제공한다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하는 본 발명의 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물로부터의 합성을 개시할 수 있다.
본 발명의 비-천연성 세포는, 본원에 예시된 당해 기술 분야에 잘 알려진 방법을 이용하여, 본 발명의 알데하이드 데하이드로게나제, 및 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 효소 또는 단백질, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 코딩하는 하나 이상의 핵산을 외인성으로 발현하도록 구축된다. 효소 또는 단백질은 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하도록 충분한 양으로 발현될 수 있다. 본 발명의 세포는 본 발명의 알데하이드 데하이드로게나제를 발현하거나 또는 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하기에 충분한 조건 하에서 배양되는 것으로 이해된다. 본원에 제시된 교시 내용 및 지침에 따라, 본 발명의 비-천연성 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생합성을 달성하여, 세포내 농도 약 0.1-300 mM 또는 그 이상, 예를 들어, 0.1-1.3 M 이상을 형성할 수 있다. 일반적으로, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 세포내 농도는 약 3 내지 150 mM, 특히 약 5 내지 125 mM, 보다 구체적으로 약 8 내지 100 mM이며, 예를 들어 약 10 mM, 20 mM, 50 mM, 80 mM 또는 그 이상을 포함한다. 또한, 이들 예시 범위 내 및 그 이상의 세포 내 농도 역시 본 발명의 비-천연성 세포로부터 달성될 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 세포 내 농도는, 약 100 mM, 200 mM, 500 mM, 800 mM, 1 M, 1.1 M, 1.2 M, 1.3 M 또는 그 이상 등의 약 100 mM 내지 1.3 M일 수 있다.
본 발명의 세포는 잘 알려진 방법을 이용해 배양한다. 배양 조건은, 예를 들어 액체 배양 공정뿐 아니라 발효 및 기타 대량 배양 공정을 포함할 수 있다. 본원에 기술된 바와 같이, 본 발명의 생합성 생산물의 특히 유익한 수율은 혐기성 또는 실질적으로 혐기성 배양 조건 하에 수득할 수 있다.
일부 구현예에서, 배양 조건은 혐기성 또는 실질적으로 혐기성 배양 또는 유지 조건을 포함한다. 예시적인 혐기성 조건은 종래에 개시되어 있으며, 당해 기술 분야에 잘 알려져 있다. 발효 공정에 대한 예시적인 혐기성 조건은 본원에 기술되어 있으며, 예를 들어 2007년 8월 10일자 미국 공개공보 제2009/0047719호에 기술되어 있다. 이러한 조건들 중 임의의 조건을 비-천연성 세포를 사용해 이용할 수 있으며, 아울러 당해 분야에 잘 알려진 다른 혐기성 조건을 이용할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생산자 (producer)는, 상기한 혐기성 또는 실질적으로 혐기성 조건에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 세포내 농도 5-10 mM 또는 그 이상으로, 뿐만 아니라 본원에 예시된 다른 모든 농도로 합성할 수 있다. 전술한 내용이 세포내 농도를 언급하더라도, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO를 생산하는 세포가 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 세포 내에서 생산하거나, 및/또는 배양 배지로 생산물을 분비할 수 있는 것으로 이해된다.
본원에 기술된 바와 같이, 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생합성을 달성하기 위한 하나의 예시적인 증식 조건은, 혐기성 배양 또는 발현 조건을 포함한다. 특정 구현예에서, 본 발명의 비-천연성 세포는 혐기성 또는 실질적으로 혐기성 조건에서 유지 배양 또는 발효할 수 있다. 간략하게는, 혐기성 조건은 산소가 없는 환경을 의미한다. 실질적으로 혐기성 조건은, 예를 들어, 배지 내 용해 산소 농도가 0-10% 포화도로 유지되는, 배양, 배치 발효 또는 연속 발효를 포함한다. 실질적으로 혐기성 조건은, 또한, 산소가 1% 미만인 분위기로 유지되는 밀폐된 챔버 내에서, 액체 배지 또는 고체 아가에서의 세포 증식 또는 휴지를 포함한다. 산소 %는, 예를 들어, 배양물을 N2/CO2 혼합물 또는 그외 적합한 비-산소 기체 또는 기체들로 퍼징함으로써, 유지시킬 수 있다.
본원에 기술된 배양 조건은, 본 발명의 세포에 의해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하기 위한, 규모 확대 및 연속 배양일 수 있다. 배양 공정의 예로는, 피드-배치 발효 (fed-batch fermentation) 및 배치 분리 (batch separation); 피드-배치 발효 및 연속 분리, 또는 연속 발효 및 연속 분리가 있다. 이들 공정 모두 당해 기술 분야에 잘 공지되어 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 상업적인 양으로 생합성 생산하는데에는 발효 공정이 특히 유용하다. 일반적으로, 그리고 비-연속적인 배양 공정을 이용하는 경우에서와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 연속 생산 및/또는 거의 연속적인 생산은, 본 발명의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하는 비-천연성 유기체를 지수기 (exponential phase) 상태로 증식을 유지시키거나 및/또는 거의 유지시키기에 충분한 영양분 및 배지에서 배양하는 것을 포함할 것이다. 이러한 조건에서의 연속 배양은, 예를 들어 1일, 2일, 3일, 4일, 5일, 6일 또는 7일 이상의 기간 동안의 증식 또는 배양을 포함할 수 있다. 추가적으로, 연속 배양은 1주일, 2주일, 3주일, 4주일 또는 5주일 이상에서, 최대 수 개월까지의 장기간을 포함할 수 있다. 다른 예로, 본 발명의 유기체는 특정 용도에 적합하다면, 수시간 배양할 수 있다. 연속적인 및/또는 거의 연속적인 배양 조건은 이러한 예시적인 기간에 포함된 모든 시간 간격을 포함하는 것으로 이해되어야 한다. 아울러, 본 발명의 세포를 배양하는 시간은 원하는 목적을 위해 생산물을 충분한 양으로 생산하기에 충분한 기간인 것으로 이해된다.
예시적인 발효 공정으로는, 비-제한적으로, 피드-배치 발효 및 배치 분리; 피드-배치 발효 및 연속 분리; 및 연속 발효 및 연속 분리를 포함한다. 예시적인 배치 발효 프로토콜의 경우, 생산 유기체는 적절한 기체가 퍼징되는 적절한 크기의 생물반응조에서 배양된다. 혐기성 조건에서, 배양은 불활성 기체 또는 기체들의 조합, 예를 들어, 질소, N2/CO2 혼합물, 아르곤, 헬륨 등으로 퍼징된다. 세포가 증식하여 탄소원을 이용함에 따라, 생물반응조에 탄소원 및/또는 영양분의 소모와 대략 균형을 유지하는 속도로 추가적인 탄소원(들) 및/또는 기타 영양분이 투입된다. 생물반응조의 온도는 바람직한 온도, 일반적으로 22-37℃ 범위에서 유지되지만, 온도는 생산 유기체의 증식 특징 및 발현 공정의 바람직한 조건에 따라 더 높거나 또는 낮은 온도에서 유지될 수 있다. 발효기에서 배양물의 바람직한 특징, 예를 들어, 세포 밀도, 생산물 농도 등을 달성하기에 바람직한 시간 동안 계속 증식한다. 배치 발효 공정에서, 발효 시간은, 바람직한 배양 조건에 따라, 일반적으로 수 시간에서 수일, 예를 들어 8-24시간 또는 1일, 2일, 3일, 4일 또는 5일, 또는 최대 1주일의 범위이다. pH는 필요에 따라 조절되거나 또는 조절되지 않을 수 있으며, pH가 비-조절 배양의 경우, pH는 운영 종료시까지 전형적으로 pH3-6으로 낮아질 것이다. 배양 기간이 끝나면, 발효기의 내용물을 세포 분리 유닛, 예를 들어 원심분리, 여과유닛 등을 통과시켜 세포 및 세포 파편을 제거할 수 있다. 바람직한 생산물이 세포 내에서 발현되는 경우, 필요에 따라, 발효 브로스로부터 세포를 분리하기 전 또는 분리한 후, 부가적인 생산물을 방출시키기 위해, 세포를 효소적으로 또는 화학적으로 파괴시키거나 또는 세포 용해 처리할 수 있다. 발효 브로스는 생산물 분리 유닛으로 이동될 수 있다. 생산물의 단리는 희석제 수용액으로부터 바람직한 생산물을 분리하기 위해 당해 기술 분야에서 사용되는 표준 분리 공정에 의해 이루어진다. 이러한 방법은, 비-제한적으로, 발효 공정의 생산물의 화학적 특징에 따라, 적절한 경우, 생산물의 유기 용액을 제공하기 위한 수 비-혼화성 유기 용매 (예, 톨루엔 또는 그외 적절한 용매, 비-제한적인 예로, 다이에틸 에테르, 에틸 아세테이트, 테트라하이드로푸란 (THF), 메틸렌 클로라이드, 클로로포름, 벤젠, 펜탄, 헥산, 헵탄, 페트롤륨 에테르, 메틸 터셔리 부틸 에테르 (MTBE), 다이옥산, 다이메틸포름아미드 (DMF), 다이메틸 설폭사이드 (DMSO) 등)를 이용한 액체-액체 추출, 표준 증류 방법 등을 포함한다.
예시적인 완전 연속 발효 프로토콜 (fully continuous fermentation protocol)의 경우, 일반적으로 바람직한 세포 밀도를 달성하기 위해 생산 유기체를 배치 방식으로 먼저 증식시킨다. 탄소원 및/또는 기타 영양분이 고갈되면, 동일한 조성의 공급 배지를 바람직한 속도로 연속적으로 공급하고, 발효액을 동일한 속도로 배출시킨다. 이러한 조건에서, 생물반응조 내 생산물 농도뿐 아니라 세포 밀도는 일반적으로 일정하게 유지된다. 발효기의 온도는 전술한 바와 같이 바람직한 온도에서 유지된다. 연속 발효 단계 동안에, 일반적으로 생산 최적화에 적합한 pH 범위를 유지하는 것이 바람직하다. pH는, 바람직한 pH 범위를 유지하기 위해 적절한 산 또는 염기를 첨가하는 등의, 일반적인 방법으로 유지 및 모니터링할 수 있다. 생물반응조는, 생산물 농도 및/또는 세포 밀도의 일관성을 보장하기 위해, 적절한 바람직한 경우에 따라, 연장된 기간 동안, 일반적으로 1주 이상에서 수주, 그리고 최대 1달 또는 그 이상 동안 연속적으로 운영된다. 연속 모드에서는, 새로운 신선한 배지를 공급하면서 발효기 내용물을 일정하게 배출시킨다. 세포, 배지 및 생산물이 함유된 배출 스트림이 제공된다. 세포, 배지 및 생산물이 함유된 배출 스트림은, 일반적으로, 세포 및 세포 파편을 필요에 따라 제거하면서 또는 제거하지 않으면서, 연속적인 생산물 분리 공정을 거치게 된다. 비-제한적인 예로, 수 비-혼화성 유기 용매를 이용한 연속적인 액체-액체 추출 (예, 톨루엔 또는 기타 적절한 용매, 비-제한적인 예로, 다이에틸 에테르, 에틸 아세테이트, 테트라하이드로푸란 (THF), 메틸렌 클로라이드, 클로로포름, 벤젠, 펜탄, 헥산, 헵탄, 페트롤륨 에테르, 메틸 터셔리 부틸 에테르 (MTBE), 다이옥산, 다이메틸포름아미드 (DMF), 다이메틸 설폭사이드 (DMSO) 등), 표준적인 연속 증류 방법 등 또는 그외 당해 기술 분야에 잘 알려진 방법을 비롯하여, 당해 기술 분야에서 사용되는 연속적인 분리 방법을 이용해, 희석 수용액 (dilute aqueous solution)으로부터 생산물을 분리할 수 있다.
발효 공정은 당해 기술 분야에 잘 공지되어 있다. 간략하게는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생합성 생산하기 위한 발효는, 예를 들어, 피드-배치 발효 및 배치 분리; 피드-배치 발효 및 연속 분리, 또는 연속 발효 및 연속 분리로 수행할 수 있다. 배치 및 연속 발효 공정의 예는 당해 기술 분야에 잘 공지되어 있으며, 본원에 기술되어 있다.
상당량의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 연속적으로 생산하기 위해, 본 발명의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생산체를 이용한 본원에 기술된 발효 공정 외에도, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 생산체는, 또한, 예를 들어, 생산물을 다른 화합물로 변환하는 화학적 합성 및/또는 효소 공정을 동시에 거칠 수 있거나, 또는 생산물을 발효 배양물로부터 분리한 다음 순차적으로 이를 필요에 따라 생산물을 다른 화합물로 변환하는 화학적 및/또는 효소적 변환 공정을 거칠 수 있다.
본원에 기술된 배양 및 발효 조건 외에도, 본 발명의 알데하이드 데하이드로게나제의 발현 또는 3-HBal, 1,3-BDO, 4- HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생합성을 달성하기 위한 생육 조건은, 배양 조건에 내삼투압제 (osmoprotectant)의 첨가를 포함할 수 있다. 특정 구현예에서, 본 발명의 비-천연성 세포는 내삼투압제가 존재하는 조건에서 본원에 기술된 바와 같이 유지, 증식 및 발효할 수 있다. 간략하게는, 내삼투압제는 삼투 물질 (osmolyte)로서 작용하며 본원에 기술된 세포를 삼투 스트레스로부터 생존하는데 일조하는 화합물을 지칭한다. 내삼투압제로는, 베타인, 아미노산 및 당 트레할로스를 포함하지만, 이들로 한정되는 것은 아니다. 이에 대한 비-제한적인 예로는 글리신 베타인, 프랄린 베타인, 디메틸테틴, 다이메틸설포니오프로피오네이트, 3-다이메틸설포니오-2-메틸프로피오네이트, 피페콜산, 다이메틸설포니오아세테이트, 콜린, L-카르니틴 및 엑토인 등이 있다. 일 측면에서, 내삼투압제는 글리신 베타인이다. 당해 기술 분야의 당업자라면, 본원에 기술된 세포를 삼투 스트레스로부터 보호하기에 적합한 내삼투압제의 양과 타입이 사용되는 세포에 따라 결정됨을 알 것이다. 배양 조건에서 내삼투압제의 양은, 예를 들어 약 0.1 mM 이하, 약 0.5 mM 이하, 약 1.0 mM 이하, 약 1.5 mM 이하, 약 2.0 mM 이하, 약 2.5 mM 이하, 약 3.0 mM 이하, 약 5.0 mM 이하, 약 7.0 mM 이하, 약 10 mM 이하, 약 50 mM 이하, 약 100 mM 이하, 또는 약 500 mM 이하일 수 있다.
일부 구현예들에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 임의의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물에 존재하는 원자의 동위원소 분포 (isotopic distribution)를 변경하기 위해, 탄소 공급원료 및 기타 세포 흡수원 (cellular uptake source), 예를 들어 포스페이트, 암모니아, 설페이트, 클로라이드 및 기타 할로겐 화합물들이 선택될 수 있다. 상기에 열거된 다양한 탄소 공급원료 및 기타 흡수원들은 총체적으로 "흡수원"로서 본원에서 지칭될 것이다. 흡수원은 생산물, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물에 존재하는 임의의 원자, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로로부터 분기된 반응들에서 만들어지는 부산물에 대해 동위원소 농화를 제공할 수 있다. 동위원소 농화는, 예를 들어, 탄소, 수소, 산소, 질소, 황, 인, 염소 또는 기타 할로겐 화합물을 비롯한 임의의 타겟 원소에서 달성될 수 있다.
일부 구현예들에서, 탄소-12, 탄소-13 및 탄소-14의 비율이 달라지도록 흡수원이 선택될 수 있다. 일부 구현예들에서, 흡수원은 산소-16, 산소-17 및 산소-18의 비율을 변경하도록 선택될 수 있다. 일부 구현예들에서, 흡수원은 수소, 중수소 및 삼중수소의 비율을 변경하도록 선택될 수 있다. 일부 구현예들에서, 흡수원은 질소-14 및 질소-15의 비율을 변경하도록 선택될 수 있다. 일부 구현예들에서, 흡수원은 황-32, 황-33, 황-34 및 황-35의 비율을 변경하도록 선택될 수 있다. 일부 구현예들에서, 흡수원은 인-31, 인-32 및 인-33의 비율을 변경하도록 선택될 수 있다. 일부 구현예들에서, 흡수원은 염소-35, 염소-36 및 염소-37의 비율을 변경하도록 선택될 수 있다.
일부 구현예들에서, 타겟 원소의 동위원소 비율은 하나 이상의 흡수원을 선택함으로써 원하는 비율로 변경할 수 있다. 흡수원은 자연에서 발견되는 천연 소스로부터 유래되거나 또는 인간이 제조한 소스로부터 유래될 수 있으며, 당해 기술 분야의 당업자는, 타겟 원소의 바람직한 동위원소 비율을 달성하기 위해 천연 소스, 인간이 제조한 소스 또는 이들의 조합을 선택할 수 있다. 인간이 만든 소스의 예로는, 예를 들어, 화학 합성 반응으로부터 적어도 부분적으로 유래되는 흡수원을 포함한다. 이러한 동위원소 농화된 흡수원은 상업적으로 구입하거나 또는 실험실에서 제조하거나, 및/또는 선택적으로 상기 흡수원들의 천연 소스를 혼합하여 원하는 동위원소 비율을 달성할 수 있다. 일부 구현예들에서, 흡수원의 타겟 동위원소 비율은 자연에서 발견되는 바람직한 흡수원 오리진을 선택함으로써 달성할 수 있다. 예를 들어, 본원에 기술된 바와 같이, 천연 소스는 생물학적 유기체로부터 유래되거나 또는 이에 의해 합성되는 생물 기재 (biobase)이거나, 또는 석유계 생산물 또는 대기 등의 소스일 수 있다. 이러한 일부 구현예들에서, 탄소원은, 예를 들어, 탄소-14가 상대적으로 고갈될 수 있는 화석 연료-유래 탄소원, 또는 석유 유래 카운터파트 보다 탄소-14를 더 많이 포함할 수 있는 이산화탄소 등의 환경 또는 대기 탄소원으로부터 선택될 수 있다.
불안정한 탄소 동위원소인 탄소-14 또는 방사성 탄소 (radiocarbon)는 지구 대기에서 탄소 원자 1012개 중 거의 1개이며, 반감기가 약 5700년이다. 탄소 스톡 (stock)은 우주선 (cosmic ray)과 일반 질소 (14N)가 참여하는 핵 반응으로 인해 대기 상층에 풍부하다. 화석 연료는 오래전에 붕괴되어 탄소-14가 없다. 화석 연료의 연소는 대기 중의 탄소-14의 비율 (fraction)을 낮추게 되며, 이를 '수스 효과 (Suess effect)'라 한다.
화합물에서 원소의 동위원소 비율을 확인하는 방법은 당해 기술 분야의 당업자에게 잘 알려져 있다. 동위원소 농화는 AMS (accelerated mass spectrometry), SIRMS (Stable Isotope Ratio Mass Spectrometry) 및 SNIF-NMR (Site-Specific Natural Isotopic Fractionation by Nuclear Magnetic Resonance) 등의 당해 기술 분야에 공지된 기법을 이용한 질량 분광측정으로 쉽게 분석한다. 이러한 질량 분광 기법들은 액체 크로마토그래피 (LC), 고성능 액체 크로마토그래피 (HPLC) 및/또는 기체 크로마토그래피 등의 분리 기법과 통합할 수 있다.
탄소의 경우, 미국에서 국제 ASTM (the American Society for Testing and Materials)의 방사성탄소 연대 측정법을 이용하여 고체, 액체 및 기체 샘플의 생물 기재 함량 (biobased content)을 측정하기 위한 표준화된 분석 방법으로서 ASTM D6866이 개발되어 있다. 이 표준법은 제품의 생물 기재 함량을 측정하기 위한 방사성탄소 연대 측정법을 이용하는데 근간이 된다. ASTM D6866은 2004년에 최초로 공개되었으며, 현재 사용되는 버전은 ASTM D6866-11 (2011년 4월 1일자로 발효됨)이다. 방사성탄소 연대 측정 기법들은 본원에 기술된 내용을 포함하여 당해 기술 분야의 당업자에게 잘 알려져 있다.
화합물의 생물 기재 함량은 탄소-14 (14C) 대 탄소-12 (12C)의 비율에 의해 추정한다. 구체적으로, 프랙션 모던 (Fm: Fraction Modern)은 식: Fm = (S-B)/(M-B)으로부터 계산하며, 이때 B, S 및 M은 각각 블랭크, 샘플 및 모던 레퍼런스 (modern reference)의 14C/12C 비율이다. 프랙션 모던은 "모던"에 대한 샘플의 14C/12C 비율의 편차 측정값이다. 모던은 mil 당 δ13CVPDB=-19에 대해 정규화된 NBS (National Bureau of Standard) 옥살산 I (즉, 표준 레퍼런스 물질 (SRM) 4990b)의 방사성 탄소 농도 (AD 1950)의 95%로서 정의된다 (Olsson, The use of Oxalic acid as a Standard. In, Radiocarbon Variations and Absolute Chronology, Nobel Symposium, 12th Proc., John Wiley & Sons, New York (1970)). 예를 들어, AMS에 의해 측정된 질량 분광측정 결과는 mil 당 δ13CVPDB=-19에 대해 정규화된 NBS 옥살산 I (즉, SRM 4990b)의 비활성 * 0.95라는 국제적으로 합의된 정의를 이용하여 계산한다. 이는 절대 (AD 1950) 14C/12C 비율 1.176 ± 0.010 x 10-12와 등가이다 (Karlen et al., Arkiv Geofysik, 4:465-471 (1968)). 표준 계산은 다른 것에 대한 하나의 동위원소의 차별적인 흡수, 예를 들어, 생물 시스템의 C12 대비 C13 대비 C14의 선호적인 흡수성 (preferential uptake)을 계산에 고려하며, 이들 보정은 δ13에 대해 보정된 Fm으로서 반영된다.
옥살산 표준물질 (SRM 4990b 또는 HOx 1)은 1955년 사탕무 작물로부터 제조되었다. 1000 lbs가 제조되었지만, 이 옥살산 표준물질은 더 이상 시판되지 않는다. 옥살산 II 표준물질 (HOx 2; N.I.S.T designation SRM 4990 C)은 1977년 프랑스 사탕무 당밀로부터 제조되었다. 1980년대 초반에, 12개의 실험실 그룹에서 2가지 표준물질의 비를 측정하였다. 옥살산 II / I의 활성 비율은 1.2933 ± 0.001 (중량 기준)이었다. HOx II의 동위원소 비율은 -17.8 / mil이다. ASTM D6866-11은 모던 표준물질로 이용가능한 옥살산 II 표준물질 SRM 4990 C (Hox2)를 사용할 것을 권고한다 (Mann, Radiocarbon, 25(2):519-527 (1983)에서의, 오리지날 대 현재 시판되는 옥살산 표준물질을 비교한 내용 참조). Fm = 0%는 물질에 탄소-14가 전혀 없으며, 즉 화석 (예, 석유계) 탄소원이라는 것을 의미한다. 1950년대 이후 핵 폭발 실험에 의해 탄소-14가 대기로 발산된 것을 보정한 이후의, Fm = 100%은 전적으로 모던 탄소원이라는 것을 의미한다. 본원에서, "모던" 소스는 생물 기재 소스를 포함한다.
ASTM D6866에 기술된 바와 같이, 모던 탄소의 퍼센트 (pMC)는, 1950년대 핵 실험 프로그램의 효력이 지속되고 소멸되지 않아, 100% 보다 클 수 있으며, 그 결과 ASTM D6866-11에 기술된 바와 같이 대기에서 탄소-14가 상당히 농화되었다. 모든 샘플의 탄소-14 활성은 "폭발 전 (pre-bomb)" 표준을 참조하고, 거의 모든 새로운 생물 기재 제품은 폭발 후 (post-bomb) 환경에서 만들어지기 때문에, 모든 pMC 값들은 (동위원소 분획에 대해 보정 후) 샘플의 실제 생물 기재의 함량을 더 잘 반영하도록 0.95 (2010 현재)를 곱해야 한다. 생물 기재의 함량이 103% 보다 높다는 것은 분석 에러가 발생하였거나 또는 생물 기재의 탄소 소스가 수년 이상 오래되었다는 것을 의미한다.
ASTM D6866은 물질의 총 유기 함량을 기준으로 생물 기재 함량을 정량하며, 존재하는 무기 탄소와 기타 비-탄소 함유 물질은 고려하지 않는다. 예를 들어, 50%가 전분-기재 물질이고 50%가 물인 제품은, ASTM D6866을 토대로, 생물 기재 함량 = 100%인 것으로 간주된다 (100% 생물 기재인 유기 탄소 함량 50%). 다른 예로, 전분-기재 물질 50%, 석유계 물질 25% 및 물 25%로 구성된 제품은, 생물 기재 함량 = 66.7% (유기 탄소 함량이 75%이나, 제품의 50%만 생물 기재임)이다. 다른 예로, 유기 탄소가 50%이고 석유계 생산물인 제품은 생물 기재 함량 = 0% (유기 탄소 함량이 50%이나, 화석 소스로부터 유래됨)인 것으로 간주될 것이다. 즉, 화합물 또는 물질의 생물 기재 함량을 측정하는 잘 알려져 있는 방법 및 공지 표준물질을 기반으로, 당해 기술 분야의 당업자는, 쉽게 화합물 또는 물질의 생물 기재 함량을 측정할 수 있거나, 및/또는 바람직한 생물 기재 함량을 가진 본 발명의 화합물 또는 물질을 이용하는 제조된 다운스트림 산물 (downstream product)을 결정할 수 있다.
탄소-14 연대 측정 기법을 사용하여 물질의 생물 기재 함량을 정량하는 것은 당해 기술 분야에 공지되어 있다 (Currie et al., Nuclear Instruments and Methods in Physics Research B, 172:281-287 (2000)). 예를 들어, 탄소-14 연대 측정법은 테레프탈레이트 함유 물질에서 생물 기재 함량을 정량하는데 사용된다 (Colonna et al., Green Chemistry, 13:2543-2548 (2011)). 특히, 재생가능한 1,3-프로판디올로부터 유래된 폴리프로필렌 테레프탈레이트 (PPT) 폴리머와 석유계 테레프탈산은 Fm 값이 거의 30%이었다 (즉, 폴리머 탄소의 3/11이 재생가능한 1,3-프로판디올로부터 유래되며, 8/11은 화석 최종 멤버 테레프탈산으로부터 유래되므로) (Currie et al., supra, 2000). 반면, 재생가능한 1,4-부타디올 및 재생가능한 테레프탈산으로부터 유래된 폴리부틸렌 테레프탈레이트 폴리머는 생물 기재 함량이 90%를 초과하였다 (Colonna et al., supra, 2011).
이에, 일부 구현예에서, 본 발명은, 환경 탄소 흡수원으로도 지칭되는, 대기 탄소 흡수원 (atmospheric carbon uptake source)을 나타내는 탄소-12, 탄소-13 및 탄소-14 비율을 가진, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 제공한다. 예를 들어, 일부 측면에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은 10% 이상, 15% 이상, 20% 이상, 25% 이상, 30% 이상, 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 98% 이상 또는 많게는 100%의 Fm 값을 가질 수 있다. 이러한 일부 구현예들에서, 흡수원은 CO2이다. 일부 구현예들에서, 본 발명은 석유계 탄소 흡수원 (petroleum-based carbon uptake source)을 나타내는 탄소-12, 탄소-13 및 탄소-14 비율을 가진, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 제공한다. 이러한 측면에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은 95% 미만, 90% 미만, 85% 미만, 80% 미만, 75% 미만, 70% 미만, 65% 미만, 60% 미만, 55% 미만, 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2% 미만 또는 1% 미만의 Fm 값을 가질 수 있다. 일부 구현예에서, 본 발명은 대기 탄소 흡수원과 석유계 탄소 흡수원의 조합에 의해 형성되는 탄소-12, 탄소-13 및 탄소-14 비율을 가진, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 제공한다. 이러한 흡수원들의 조합을 이용하는 것은 탄소-12, 탄소-13 및 탄소-14 비율을 다양하게 할 수 있는 한가지 수단이며, 해당 비율들은 흡수원들의 비율을 나타낼 것이다.
나아가, 본 발명은, 본원에 기술된 생물학적으로 생산된 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물, 및 이로부터 유래된 생산물에 관한 것으로서, 이때 상기 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은 환경에서 생긴 CO2에서와 대략 동일한 수치의 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가진다. 예를 들어, 일부 측면들에서, 본 발명은, 환경에서 발생하는 CO2에서와 대략 동일한 수치의 탄소-12 대 탄소-13 대 탄소-14 동위원소 비율을 가진, 또는 본원에 기술된 다른 임의의 비율을 가진, 생물 유래 (bioderived) 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 중간산물을 제공한다. 본원에 기술된 바와 같이, 생산물은 환경에서 생기는 CO2에서와 대략 동일한 수치의 탄소-12 대 탄소-13 대 탄소-14 동위원소 비율, 또는 본원에 기술된 다른 임의의 비율을 가질 수 있는 것으로 이해되며, 여기서 상기 생산물은, 본원에 기술된 바와 같이, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물로부터 제조되며, 상기 생물 유래 생산물은 화학적으로 변형되어 최종 생산물로 제조된다. 바람직한 생산물을 제조하기 위해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO의 중간산물의 생물 유래 생산물을 화학적으로 변형시키는 방법은, 본원에 기술된 바와 같이, 당해 기술 분야의 당업자에게 잘 알려져 있다. 본 발명은, 3-HBal 및/또는 1,3-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 기재로 할 수 있는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리하이드록시알카노에이트, 나일론, 유기용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제 (hypoglycaemic agent), 부타다이엔 및/또는 부타다이엔-기재의 제품, 그리고 환경에서 생기는 CO2에서와 대략 동일한 수치의 탄소-12 대 탄소-13 대 탄소-14 동위원소 비율을 가진, 4-HBal 및/또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 기재로 할 수 있는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예로 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드라고도 함), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 LycraTM로도 지칭되는 폴리우레탄-폴리우레아 코폴리머 등을 추가로 제공하며, 여기서 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예로, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 독사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 LycraTM로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품은, 본원에 기술된 바와 같이, 직접 제조되거나, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물과 조합하여 제조된다. 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하는 방법은 종래에 개시된 바 있다 (예, WO 2010/127319, WO 2013/036764, 미국 특허 9,017,983, US 2013/0066035, WO/2012/018624, US 2012/0021478, 이들 각각은 원용에 의해 본 명세서에 포함됨). 1,3-BDO는 생체 내 또는 시험관 내에서 산과 반응시켜, 예를 들어 리파제를 이용해 에스테르로 변환할 수 있다. 이러한 에스테르는 뉴크라슈티컬, 약제 및 식품 용도를 가질 수 있으며, 1,3-BDO의 R-형태가 (S-형태 또는 라세믹 혼합물과 비교해) 동물 및 인간에서 에너지원으로서 최상으로 활용되기 때문에, 이 형태가 유용하다 (예를 들어, (미국에서 일반적으로 안정한 것 (GRAS)으로 인정된) (R)-3-하이드록시부틸-R-1,3-부탄다이올 모노에스테르 및 (R)-3-하이드록시부티레이트 글리세롤 모노에스테르 또는 다이에스테르와 같은 케톤 에스테르). 케톤 에스테르는 경구로 전달될 수 있으며, 이 에스테르 화합물은 신체에 사용되는 R-1,3-부탄다이올을 해리한다 (예, WO2013150153). 아미드 제조 방법은 당해 기술 분야에 잘 알려져 있다 (예, Goswami and Van Lanen, Mol . Biosyst . 11(2):338-353 (2015)).
이에, 본 발명은, 고도로 농화된 또는 기본적으로 거울상이성질체적으로 순수하며 추가적으로 부산물에 대해 개선된 순도 품질을 가진, 1,3-BDO, 즉 R-1,3-부탄다이올의 개선된 조성물을 제공하기 위한 개선된 효소 경로 및 미생물을 제공하는데 특히 유용하다. 1,3-BDO는 식품 소스, 식품 성분으로서, 착향제로서, 착향제용 용매 또는 용해제로서, 안정제로서, 유화제로서, 항균제로서 및 보존제로서 직접 사용하는 등의 추가적인 식품 관련 용도를 가진다. 1,3-BDO는 비경구 약물 용매로서 제약 산업에 사용된다. 1,3-BDO는 연화제 (emollient)의 성분으로서, 불용성 성분의 결정화를 방지하는 습윤제 (humectant), 향료와 같은 수-난용성 성분에 대한 용해제, 및 항균제 및 보존제로서 코스메틱스에 사용된다. 예를 들어, 이는 헤어 스프레이 및 세팅 로션에 습윤제로서 사용될 수 있으며; 이는 에센셜 오일로부터 아로마 감소를 억제하고, 미생물에 의한 부패를 방지하고, 벤조에이트의 용매로서 사용된다. 1,3-BDO는 0.1% 내지 50%, 심지어 50% 보다 높은 농도로 사용될 수 있다. 이는 헤어 및 목욕 제품, 눈 및 얼굴 메이크업, 향수, 개인 청결 제품 및 면도 및 피부 케어 제품에 사용된다 (예, the Cosmetic Ingredient Review board's report: "Final Report on the Safety Assessment of Butylene Glycol, Hexylene Glycol, Ethoxydiglycol, and Dipropylene Glycol", Journal of the American College of Toxicology, Volume 4, Number 5, 1985, 이는 원용에 의해 본 명세서에 포함됨). 이 리포트는 코스메틱스에서의 1,3-BDO의 특수 용도 및 농도를 제공하며; 예를 들어, 보고서의 표 2 "제품 제형 데이타"를 참조한다.
일 구현예에서, 본 발명은, 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 대기 이산화탄소 흡수원을 나타내는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며; 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 본 발명의 세포에 의해 또는 세포 용해물 내 또는 본 발명의 방법으로 제조되는, 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는, 배양 배지를 제공한다. 일 구현예에서, 배양 배지는 세포로부터 분리된다.
일 구현예에서, 본 발명은, 대기 이산화탄소 흡수원임을 나타내는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며; 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 본 발명의 세포에 의해 또는 세포 용해물 내 또는 본 발명의 방법으로 제조되는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO)을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO는 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98%의 Fm 값을 가진다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 세포 용해물 내 또는 본 발명의 방법으로 제조된, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3- 부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO)을 제공한다. 일 구현예에서, 본 발명은, 대기 이산화탄소 흡수원임을 나타내는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며, 3-HBal 및/또는 1,3-BDO가 본 발명의 세포에 의해 또는 세포 용해물 내 또는 본 발명의 방법으로 제조되고; 3-HBal 및/또는 1,3-BDO가 R-형태로 거울상이성질체적으로 농화된, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO)을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO는 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98%의 Fm 값을 가진다.
일 구현예에서, 본 발명은, 3-HBal 및/또는 1,3-BDO가 R-형태로 거울상이성질체적으로 농화된, 본 발명의 세포에 의해 또는 세포 용해물 내 또는 본 발명의 방법으로 제조되는 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3- 부탄다이올 (1,3-BDO)을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO에서 R 형태의 비율은 95% 보다 높거나, 96% 보다 높거나, 97% 보다 높거나, 98% 보다 높거나, 99% 보다 높거나, 99.1% 보다 높거나, 99.2% 보다 높거나, 99.3% 보다 높거나, 99.4% 보다 높거나, 99.5% 보다 높거나, 99.6% 보다 높거나, 99.7% 보다 높거나, 99.8% 보다 높거나 또는 99.9% 보다 높다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO는 R-거울상이성질체 비율이 ≥55%, ≥60%, ≥65%, ≥70%, ≥75%, ≥80%, ≥85%, ≥90% 또는 ≥95%이며, 화학적으로 매우 순수할 수 있으며, 예를 들어, R-거울상이성질체는 ≥99%, 예를 들어, ≥95%, ≥96%, ≥97%, ≥98%, ≥99%, ≥99.1%, ≥99.2%, ≥99.3%, ≥99.4%, ≥99.5%, ≥99.6%, ≥99.7%, ≥99.8% 또는 ≥99.9%이다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 세포 용해물 내 또는 본 발명의 방법에 의해 생산된, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO, 및 3-HBal 및/또는 1,3-BDO 또는 4-HBal 또는 1,4-BDO 이외의 화합물을 각각 포함하는 조성물을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO 또는 4-HBal 및/또는 1,4-BDO 이외의 화합물은, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 각각 생산하거나 또는 본 발명의 폴리펩타이드를 발현하는, 세포의 일부이다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 세포 용해물 내 또는 본 발명의 방법에 의해 생산된 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는 조성물, 또는 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 생산하는 세포의 세포 용해물 또는 배양 상층액을 제공한다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 본 발명의 세포 용해물 내 또는 본 발명의 방법에 의해 생산된, 3-HBal 및/또는 1,3-BDO, 또는 4- HBal 및/또는 1,4-BDO를 포함하는 생산물을 제공하며, 이 생산물은 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 폴리하이드록시알카노에이트, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG), 폴리부틸렌 테레프탈레이트 (PBT), 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 또는 부타다이엔-기재의 제품이다. 일 구현예에서, 생산물은 코스메틱 제품 또는 식품 첨가제이다. 일 구현예에서, 생산물은 생물 유래 3-HBal 및/또는 1,3-BDO 또는 생물 유래 4-HBal 및/또는 1,4-BDO를 적어도 0.1%, 적어도 0.5%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50%로 포함한다. 일 구현예에서, 생산물은 제조된 3-HBal 및/또는 1,3-BDO의 일부 또는 제조된 4-HBal 및/또는 1,4-BDO의 일부를 반복 유닛으로서 포함한다. 일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 본 발명의 세포 용해물 내 또는 본 발명의 방법에 의해 생산된 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO로 제조되거나 또는 이로부터 파생된, 생산물을 성형함으로써 수득되는, 성형물 (molded product)을 제공한다.
본 발명은, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물; 및 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 이외의 화합물을 포함하는, 조성물을 또한 제공한다. 생물 유래 생산물 이외의 화합물은, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 생산하는 경로를 구비한 본 발명의 비-천연성 세포의, 세포 일부, 예를 들어, 미량의 세포 일부일 수 있거나, 또는 상기한 비-천연성 세포의 존재 하에 생산된 발효 브로스 또는 배양 배지, 또는 이의 정제된 또는 일부 정제된 일부일 수 있다. 조성물은, 예를 들어, 본원에 기술될 바와 같이, 부산물 생성이 감소된 유기체에 의해 생산하였을 경우, 부산물을 감소된 수준으로 포함할 수 있다. 조성물은 예를 들어, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 또는 본 발명의 세포의 세포 용해물 또는 배양 상층액을 포함할 수 있다.
3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물은 상업적인 용도 및 산업적인 용도로 사용되는 화합물이다. 이러한 용도에 대한 비-제한적인 예로는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 LycraTM로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품의 생산 등이 있다. 또한, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO는 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 포함하여 매우 다양한 생산물을 생산하는 원료로서 사용된다. 이에, 일부 구현예에서, 본 발명은, 예를 들어, 본 발명의 알데하이드 데하이드로게나제를 발현하는 본 발명의 비-천연성 세포에 의해 생산되거나 또는 본원에 개시된 방법을 이용해 생산되는, 하나 이상의 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 포함하는, 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제공한다.
본원에서, 용어 "생물 유래"는 생물 유기체로부터 유래되거나 또는 생물 유기체에 의해 합성되는 것을 의미하며, 생물 유기체에 의해 제조가능하므로 재생가능한 자원으로 간주될 수 있다. 이러한 생물 유기체는, 특히 본원에 기술된 본 발명의 세포는, 공급원료 또는 바이오매스, 예를 들어 농작물, 식물, 박테리아 또는 동물 소스로부터 수득되는 당 또는 탄수화물을 이용할 수 있다. 다른 예로, 생물 유기체는 대기 탄소를 이용할 수 있다. 본원에서, 용어 "생물 기재"는 전술한 바와 같이 본 발명의 생물 유래 화합물로 전체가 또는 일부분이 구성된 생산물을 의미한다. 생물 기재 또는 생물 유래 생산물은 석유 또는 석유화학 공급원료로부터 유래되거나 합성되는, 석유 유래 생산물과는 대비된다.
일부 구현예에서, 본 발명은, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 포함하는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제공하며, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하는데 사용되는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 모두 또는 일부를 포함한다. 예를 들어, 최종 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품은, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품이 제조되도록, 생물 유래 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물, 또는 이의 일부를 함유할 수 있다. 이러한 제조는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을, 최종 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품으로 화학적으로 반응시키는 것을 포함할 수 있다 (예, 화학적 변환, 화학적 기능성화, 화학적 커플링, 산화, 환원, 중합, 공중합 등). 따라서, 일부 측면에서, 본 발명은, 본원에 기술된 바와 같이 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 적어도 2%, 적어도 3%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98% 또는 100% 포함하는, 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재 생산물을 제공한다.
또한, 일부 구현예에서, 본 발명은, 본원에 기술된 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물; 및 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물 이외의 화합물을 포함하는 조성물을 제공한다. 예를 들어, 일부 측면에서, 본 발명은 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제공하며, 여기서 이의 제조시 사용되는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은 생물 유래 및 석유 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물의 조합이다. 예를 들어, 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품은 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 50%; 및 석유 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 50%를 이용해 제조할 수 있거나, 또는 생산물의 적어도 일부가 본원에 기술된 세포에 의해 생산된 생물 유래 생산물을 포함하는 한 생물 유래/석유 유래 전구체 60%/40%, 70%/30%, 80%/20%, 90%/10%, 95%/5%, 100%/0%, 40%/60%, 30%/70%, 20%/80%, 10%/90%와 같은 다른 바람직한 비율을 사용해 제조할 수 있다. 본 발명의 생물 유래 3-HBal, 1,3-BDO, 4- HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 사용해 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하는 방법들은 당해 기술 분야에 잘 공지되어 있는 것으로 이해된다.
우수한 생산체를 구축하기 위해, 대사 모델링을 이용해 생육 조건을 최적화할 수 있다. 또한, 모델링을 이용해 경로의 활용을 부가적으로 최적화하는 유전자 넉아웃을 설계할 수 있다 (예, US 특허 공개공보 2002/0012939, US 2003/0224363, US 2004/0029149, US 2004/0072723, US 2003/0059792, US 2002/0168654 및 US 2004/0009466, 및 미국 특허 7,127,379). 모델링 분석으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물을 보다 효율적으로 생산하는 쪽으로 대사를 쉬프트하는 효과를 세포 증식에서 신뢰할 수 있게 예측할 수 있다.
바람직한 생산물의 생합성에 유익한 대사 변이를 동정 및 설계하기 위한 한가지 전산 방식 (computational method)은 OptKnock 전산 프래임워크이다 (Burgard et al., Biotechnol . Bioeng. 84:647-657 (2003)). OptKnock는 타겟 생산물을 과생산하는 유전적으로 안정한 미생물을 만드는, 유전자 결손 또는 파괴 전략을 제시하는 대사 모델링 및 시뮬레이션 프로그램이다. 구체적으로, 이러한 프래임워크는, 바람직한 생화합물이 세포 생육의 필수 부산물이 되도록 강제하는 유전자 조작을 제안하기 위해, 미생물의 전체 대사 및/또는 생화학적 네트워크를 조사한다. 전략적으로 배치된 유전자 결손 또는 그외 기능성 유전자의 파괴를 통해 생화학적 생산을 세포 증식과 커플링함으로써, 생물반응기에서 장기간 경과 후 조작된 균주에 부과된 증식 선택압은, 필연적인 증식-커플링된 생화학적 생산의 결과로서 성능 개선을 유발한다. 마지막으로, 유전자 결손이 구축되면, OptKnock에 의해 선택된 유전자는 게놈에서 완전히 제거되기 때문에, 설계된 균주가 야생형 형태로 되돌아갈 가능성이 거의 없다. 따라서, 이러한 전산 방법을 이용하여, 바람직한 생산물의 생합성을 도출하는 대안적인 경로를 동정하거나, 또는 바람직한 생산물의 생합성을 추가로 최적화하기 위해 비-천연성 세포와 조합하여 사용할 수 있다.
간략하게는, OptKnock는 세포 대사를 모델링하기 위한 계산 방법 및 시스템을 지칭하기 위해 본원에서 사용하는 용어이다. OptKnock 프로그램은 특정 제약 (particular constraint)을 플럭스 밸런스 분석 (FBA) 모델에 통합하는 방법 및 모델의 프래임워크에 관한 것이다. 이러한 제약으로는, 예를 들어 정성적인 동역학 정보 (qualitative kinetic information), 정성적인 조절 정보, 및/또는 DNA 마이크로어레이 실험 데이터를 포함한다. 또한, OptKnock는, 예를 들어, 플럭스 밸런스 모델로부터 파생되는 플럭스 바운더리를 확고히 한 다음 후속적으로 유전자 부가 또는 결손의 존재 하에 대사 네트워크의 성능 제한을 조사함으로써, 다양한 대사 문제들에 대한 해법을 도출한다. OptKnock 전산 프래임워크는 대사 네트워크의 성능 제한의 유효 쿼리를 허용하는 모델 포뮬레이션을 구축할 수 있으며, 구해진 혼합-정수 선형 프로그래밍 문제점을 해결하는 방법을 제공할 수 있다. 본원에서 OptKnock로 지칭되는 대사 모델링 및 시뮬레이션 방법들은, 예를 들어 2002년 1월 10일자로 출원된 미국 공개공보 2002/016854, 2002년 1월 10일자로 출원된 국제 특허 제 PCT/US02/00660, 및 2007년 8월 10일자로 출원된 미국 공개공보 2009/0047719에 개시되어 있다.
생산물의 생합성 생산에 유리한 대사 변이를 동정 및 설계하기 위한 또 다른 전산 방법은, SimPheny®로 지칭되는 대사 모델링 및 시뮬레이션 시스템이다. 이 전산 방법 및 시스템은, 예를 들어, 2002년 6월 14일자로 출원된 미국 공개공보 2003/0233218 및 2003년 6월 13일자로 출원된 국제 특허 출원 PCT/US03/18838에 개시되어 있다. SimPheny®는 인 실리코 (in silico) 네트워크 모델을 구축하고, 생물 시스템의 화학 반응들을 통해 질량, 에너지 또는 전하의 흐름을 시뮬레이션하여 시스템에서 화학 반응의 임의의 그리고 모든 가능한 작용기를 포괄하는 해법 영역을 규정함으로써, 생물 시스템에서 허용되는 다양한 활성들을 결정하기 위해 사용할 수 있는 전산 시스템이다. 이러한 방식은, 포함된 반응들의 공지된 화학량론 뿐만 아니라 반응을 통한 최대 플럭스와 관련된 반응 열역학적 및 용량 제약 등의 제약에 의해 해법 영역이 규정되므로, 제약 조건 기반의 모델링 (constraints-based modeling)으로 지칭된다. 이러한 제약에 의해 규정되는 영역을 조사하여, 생물 시스템 또는 이의 생화학적 성분들의 표현형 역량 및 거동을 결정할 수 있다.
이러한 전산 방법은, 생물 시스템들이 유연하고 다수의 다른 방식으로도 동일한 결과에 도달할 수 있기 때문에, 생물학적 현실과 부합한다. 생물 시스템은 모든 살아있는 시스템들이 직면하는 근본적인 제약들에 의해 제한되어 온 진화론적 기전을 통해 설계된다. 따라서, 제약 조건 기반의 모델링 전략은 이러한 일반적인 현실을 포괄한다. 더욱이, 제약 조건의 엄격화를 통해 네트워크 모델에 추가적인 제약을 계속적으로 부과하는 능력은 상기 해법 영역의 크기를 줄이게 되고, 그래서 생리학적 성능 또는 표현형을 예견할 수 있는 정확도가 향상된다.
본 발명의 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 숙주 세포에서 원하는 화합물의 생합성을 설계 및 구현하기 위해 대사 모델링 및 시뮬레이션에 다양한 전산 프래임워크를 적용할 수 있을 것이다. 이러한 대사 모델링 및 시뮬레이션 방법은, 예를 들어 SimPheny® 및 OptKnock로 상기에 예시된 전산 시스템을 포함한다. 본 발명을 예시하기 위해, 모델링 및 시뮬레이션을 위한 OptKnock 전산 프래임워크 체계를 참조하여, 일부 방법들이 본원에 기술된다. 당해 기술 분야의 당업자는, 당해 기술 분야에 잘 알려져 있는 임의의 이러한 다른 대사 모델링 및 시뮬레이션 전산 프래임워크 및 방법에, OptKnock를 이용한 대사 변이의 동정, 설계 및 구현을 적용하는 방법을 알 것이다.
전술한 방법은 파괴할 하나 이상의 대사 반응 세트를 제공할 것이다. 이러한 세트 또는 대사 변이에서 각 반응을 제거하면, 바람직한 생산물을 유기체의 증식 단계 동안에 필수 생산물로서 생산할 수 있다. 반응들이 공지되어 있으므로, bilevel OptKnock 문제에 대한 해법은, 또한, 반응 세트의 각 반응을 촉매하는 하나 이상의 효소를 코딩하는 관련 유전자 또는 유전자들을 제공해 줄 것이다. 반응 세트와, 각 반응에 참여하는 효소를 코딩하는 해당 유전자를 동정하는 것은, 일반적으로 효소와 코딩 유전자 간의 관련성이 포함된 반응 데이타베이스를 이용한 반응들의 상관 관계를 통해 달성되는, 자동화 공정이다.
일단 동정되면, 바람직한 생산물의 생산을 달성하기 위해 파괴시킬 반응 세트는, 세트에 포함된 각 대사 반응을 코딩하는 하나 이상의 유전자의 기능적 파괴에 의해, 타겟 세포 또는 유기체에서 구현된다. 반응 세트의 기능적 파괴를 달성하는데 특히 유용한 한가지 수단은, 각 코딩 유전자의 결손이다. 그러나, 일부 경우에, 예를 들어 프로모터 또는 조절 인자에 대한 cis 결합 부위와 같은 조절 영역의 돌연변이, 결손 등의 기타 유전적 변형에 의해, 또는 다수 위치들 중 임의 위치에서의 코딩 서열의 절단 (truncation)에 의해, 상기 반응을 파괴하는 것이 유익할 수 있다. 유전자 세트의 전체 결손까지는 아닌 그 미만의 수준의 결손을 발생시키는 상기한 변형은, 예를 들어 생산물의 커플링을 신속하게 평가하거나 또는 유전자 복원이 이루어질 가능성이 거의 없을 경우에, 유용할 수 있다.
추가적인 반응 세트를 파괴하거나 또는 바람직한 생산물의 증식-커플링된 생합성 등의 생합성을 달성할 수 있는 대사 변형을 유발하는 전술한 bilevel OptKnock 문제점에 대한 추가적인 생산적인 해법을 동정하기 위해, 정수 컷 (integer cut)으로 칭해지는 최적화 방법이 시행될 수 있다. 이 방법은, 상기 예시된 OptKnock 문제를, 각 반복시 정수 컷으로 지칭되는 추가적인 제약을 통합하여, 반복적으로 해결함으로써, 진행된다. 정수 컷 제약은, 해결 과정이, 생산물 생합성을 증식과 필연적으로 커플링시키는, 임의의 이전 반복에서 동정된 실제 동일한 반응 세트를 선택하지 않도록 방지한다. 예를 들어, 만일 앞서 동정된 증식-커플링된 대사 변형으로 파괴시킬 반응 1, 2 및 3개가 정해지면, 후속적인 제약으로 동일한 반응들이 이후 해법에서 동시에 고려되지 않도록 한다. 정수 컷 방법은 당해 기술 분야에 널리 공지되어 있으며, 예를 들어 Burgard et al., Biotechnol . Prog. 17:791-797 (2001)에서 찾아 볼 수 있다. 대사 모델링 및 시뮬레이션을 위해 OptKnock 전산 프래임워크와 조합하여 사용되는 것과 관련하여 본원에 기술된 모든 방법에서와 같이, 반복적인 계산 분석에서 중복을 줄이는 정수 컷 방법을, 또한, 예를 들어, SimPheny® 등의 당해 기술 분야에 널리 공지된 그외 전산 프래임워크를 이용해 적용할 수 있다.
본원에 예시된 방법들로, 타겟 생화학 생산물의 생산을, 동정된 유전자 변이를 가지도록 조작된 세포 또는 유기체의 증식과, 필연적으로 커플링하는 등의, 바람직한 생산물을 생합성으로 생산하는 세포 및 유기체를 구축할 수 있다. 따라서, 본원에 기술된 전산 방법은 OptKnock 및 SimPheny®로부터 선택되는 인 실리코 (in silico) 방법에 의해 동정되는 대사 변형들을 동정 및 구현할 수 있다. 대사 변형 세트는, 예를 들어 하나 이상의 생합성 경로 효소의 부가 및/또는 예를 들어 유전자 결손에 의한 파괴 등의 하나 이상의 대사 반응의 기능적 파괴를 포함할 수 있다.
전술한 바와 같이, OptKnock 방법은 오랜 기간의 증식 선택을 거쳤을 때 미생물 돌연변이 네트워크가 전산적으로 예측되는 최대-증식 표현형 쪽으로 진화할 수 있다는, 전제에서 개발되었다. 즉, 이 방법은 선택압 하에서 유기체의 자기 최적화 능력을 활용한다. OptKnock 프래임워크는 네트워크 화학량론에 근거하여 생화학적 생산과 세포 증식을 인위적로 커플링시키는 유전자 결손의 조합을 철저하게 조사할 수 있다. 최적의 유전자/반응 넉아웃을 확인하는데에는, 형성된 네트워크에 대한 최적의 증식 해법이 대상 생화학적 생산물을 과생산하도록, 활성 반응 세트를 선택하는 2단식 최적화 문제의 해법이 요구된다 (Burgard et al., Biotechnol . Bioeng. 84:647-657 (2003)).
E. coli 대사의 인 실리코 화학량론 모델을 채택하여, 기존에 예시되고, 예를 들어 미국 특허 공개공보 US 2002/0012939, US 2003/0224363, US 2004/0029149, US 2004/0072723, US 2003/0059792, US 2002/0168654 및 US 2004/0009466 및 미국 특허 7,127,379에 기술된 바와 같이, 대사 경로의 필수 유전자들을 동정할 수 있다. 본원에 기술된 바와 같이, OptKnock의 수학적 프래임워크를 이용하여, 바람직한 생산물을 증식과 조합하여 생산시키는 유전자 결손을 정확하게 파악할 수 있다. 나아가, 상기 2단식 OptKnock 문제 해법은 오직 하나의 결손 세트만 제공한다. 모든 의미 있는 해법들, 즉 증식-커플링된 생산 형성을 유도하는 넉아웃 세트들을 모두 열거하기 위해, 정수 컷으로 지칭되는 최적화 기법을 구현할 수 있다. 이는, 전술한 바와 같이, 각 반복에서 정수 컷으로 지칭되는 추가적인 제약을 추가하면서 OptKonck 문제를 반복적으로 해결하는 과정을 수반한다.
본원에 기술된 바와 같이, 본 발명은 알데하이드 데하이드로게나제 변이체에 관한 것이다 (실시예 참조). 이러한 변이체의 제조는 실시예에 기술되어 있다. 다양한 방법들 중 임의의 방법을 이용해, 본원에 기술된 알데하이드 데하이드로게나제 변이체와 같은 알데하이드 데하이드로게나제 변이체를 구축할 수 있다. 이러한 방법으로는, 비-제한적으로, 부위-특이적인 돌연변이 유발, 랜덤 돌연변이 유발, 조합 라이브러리 (combinatorial libraries) 및 그외 후술한 돌연변이 유발 방법 등이 있다 (Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999); Gillman et al., Directed Evolution Library Creation: Methods and Protocols (Methods in Molecular Biology) Springer, 2nd ed (2014).
본원에 기술된 바와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물에 대한 경로의 바람직한 활성을 코딩하는 핵산을 숙주 유기체에 도입할 수 있다. 이 경우, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물의 생산을 증가시키기 위해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물, 경로 효소 또는 단백질의 활성을 변형시키는 것이 바람직할 수 있다. 예를 들어, 단백질 또는 효소의 활성을 증가시키는 공지된 돌연변이를 코딩 핵산 분자에 도입할 수 있다. 또한, 효소 또는 단백질의 활성을 증가시키거나 또는 저해 활성을 낮추기 위해, 예를 들어 음성 조절인자의 활성을 낮추기 위해, 최적화 방법을 적용할 수 있다.
이러한 최적화 방법의 한가지가 방향성 진화 (directed evolution)이다. 방향성 진화는, 효소의 특성을 개선 및/또는 변형하기 위해, 특정 유전자에 표적화된 돌연변이를 도입하는 과정을 수반하는, 강력한 방법이다. 향상된 및/또는 변형된 효소는 다수의 (예, >104) 효소 변이체를 자동 스크리닝할 수 있는 민감한 고-처리 스크리닝 분석을 개발 및 구현함으로써, 동정할 수 있다. 돌연변이 유발 및 스크리닝 라운드를 전형적으로 반복 실시하여, 효소에 최적화된 특성을 부여할 수 있다. 돌연변이를 유발하기 위한 유전자의 영역들을 동정하는데 도움이 될 수 있는 수학적 알고리즘들도 또한 개발되어 있으며, 제조 및 스크리닝하여야 하는 효소 변이체들의 수를 현저하게 줄일 수 있다. 다양한 변이체 라이브러리 제조에 유효한 다수의 방향성 진화 기법들도 개발되어 있으며 (리뷰로서 Hibbert et al., Biomol . Eng 22:11-19 (2005); Huisman and Lalonde, In Biocatalysis in the pharmaceutical and biotechnology industries pgs. 717-742 (2007), Patel (ed.), CRC Press; Otten and Quax. Biomol . Eng 22:1-9 (2005).; 및 Sen et al., Appl . Biochem . Biotechnol 143:212-223 (2007)을 참조함), 다수의 효소 클래스들에서 매우 다양한 특성을 개선하기 위해 이러한 방법들이 성공적으로 적용된 바 있다. 방향성 진화 기법에 의해 향상 및/또는 변형된 효소 특징들로는, 예를 들어, 비-천연성 기질의 변환에 있어서, 선택성/특이성; 확실한 고온 처리를 위한 온도 안정성; 높거나 낮은 pH 조건에서의 생물학적 처리를 위한 pH 안정성; 기질 또는 생산물 관용성 (product tolerance), 이로써 높은 생산 역가를 달성할 수 있음; 비-천연성 기질들을 포괄하기 위한 광범위한 기질 결합성 등의, 결합성 (Km); 생산물, 기질 또는 주요 중간산물에 의한 저해를 없애기 위한, 저해성 (Ki); 원하는 플럭스를 달성하도록 효소 반응 속도를 높이기 위한, 활성 (kcat); 단백질 수율 및 전체 경로 플럭스를 높이기 위한, 발현 수준; 호기 조건에서 공기 민감성 효소의 작용을 위한, 산소 안정성; 및 산소가 존재하지 않는 조건에서 호기성 효소의 작용을 위한, 혐기성 활성 등이 있다.
특정 효소의 원하는 특징을 타겟팅하기 위해 유전자에 돌연변이를 유발하고 다양화하는 다수의 예시적인 방법들이 개발되었다. 이러한 방법들은 당해 기술 분야의 당업자들에게 잘 알려져 있다. 이러한 방법들 중 임의 방법을 이용해 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이와 관련된 다운스트림 산물 또는 본 발명의 알데하이드 데하이드로게나제를 생산하기 위해, 경로 효소 또는 단백질의 활성을 변형 및/또는 최적화할 수 있다. 그러한 방법으로는, 비-제한적인 예로, PCR 반응에 DNA 폴리머라제의 피델리티 (fidelity)를 낮춤으로써 랜덤 포인트 돌연변이를 도입하는 EpPCR (Pritchard et al., J Theor . Biol . 234:497-509 (2005)); 완전한 환형 플라스미드를 주형으로 사용하고, 마지막 뉴클레오티드 2개에 엑소뉴클레아제 내성 티오포스페이트 결합을 구비한 랜덤 6 mer를 이용하여 플라스미드를 증폭시킨 다음, 세포로 형질전환하고, 세포내에서 플라스미드를 탠덤 리피트에서 다시 고리화하는 것을 제외하고는, epPCR과 동일한 에러-유발 롤링 서클 증폭 (Error-prone Rolling Circle Amplification) (epRCA) (Fujii et al., Nucleic Acids Res. 32:e145 (2004); 및 Fujii et al., Nat. Protoc . 1:2493-2497 (2006)); 전형적으로 Dnase I 또는 Endo V와 같은 뉴클레아제로 2개 이상의 변이체 유전자를 절단하여, DNA 폴리머라제의 존재 하에 어닐링 및 연장 사이클에 의해 재조립되는 랜덤 단편 풀을 제조함으로써, 키메라 유전자 라이브러리를 구축하는 과정을 수반하는, DNA 또는 패밀리 셔플링 (Family Shuffling) (Stemmer, Proc Natl Acad Sci USA 91:10747-10751 (1994); 및 Stemmer, Nature 370:389-391 (1994)); 주형을 프라이밍한 후 변성과 매우 짧은 간격 (약 5초)의 어닐링/연장으로 이루어진 2단계 PCR 사이클을 반복하는 과정을 수반하는 스테거드 연장 (Staggered Extension, StEP) (Zhao et al., Nat. Biotechnol . 16:258-261 (1998)); 랜덤 서열 프라이머를 사용하여 주형의 여러가지 세그먼트에 대해 상보적인 복수의 짧은 DNA 단편을 제조하는 랜덤 프라이밍 재조합 (Random Priming Recombination, RPR) (Shao et al., Nucleic Acids Res 26:681-683 (1998)) 등이 있다.
추가적인 방법으로는, 선형화된 플라스미드 DNA를 사용해 미스매치 복원에 의해 복원되는 헤테로두플렉스를 형성하는 헤테로두플렉스 재조합 (Heteroduplex Recombination) (Volkov et al, Nucleic Acids Res. 27:e18 (1999); 및 Volkov et al., Methods Enzymol . 328:456-463 (2000)); Dnase I 단편화와 단일 가닥 DNA (ssDNA)의 크기 분획화를 이용한 RACHITT (Random Chimeragenesis on Transient Templates) (Coco et al., Nat. Biotechnol. 19:354-359 (2001)); 주형의 풀로서 사용되는 단-방향성 ssDNA 단편들의 존재 하에 프라이머로부터 한쪽 방향으로 자라는 가닥들의 주형 스위칭을 수반하는 RETT (Recombined Extension on Truncated templates) (Lee et al., J. Molec . Catalysis 26:119-129 (2003)); 축중 프라이머 (degenerate primer)를 사용하여 분자들 간의 재조합을 제어하는 DOGS (Degenerate Oligonucleotide Gene Shuffling) (Bergquist and Gibbs, Methods Mol . Biol 352:191-204 (2007); Bergquist et al., Biomol . Eng 22:63-72 (2005); Gibbs et al., Gene 271:13-20 (2001)); 대상 유전자 또는 유전자 단편에서 1 bp가 결손된 조합 라이브러리 (combinatorial library)를 구축하는 ITCHY (Incremental Truncation for the Creation of Hybrid Enzyme) (Ostermeier et al., Proc . Natl . Acad. Sci . USA 96:3562-3567 (1999); 및 Ostermeier et al., Nat. Biotechnol . 17:1205-1209 (1999)); 포스포티오에이트 dNTA를 이용하여 절단체 (truncation)를 제조하는 것을 제외하고는 ITCHY와 유사한 THIO-ITCHY (Thio-Incremental Truncation for the Creation of Hybrid Enzyme) (Lutz et al., Nucleic Acids Res 29:E16 (2001)); 재조합 유전자에 대한 ITCHY와 DNA 셔플링 방법 2가지를 조합한 SCRATCHY (Lutz et al., Proc . Natl . Acad . Sci . USA 98:11248-11253 (2001)); epPCR을 통해 제조된 돌연변이를 이후 유용한 활성 보유에 대해 스크리닝/선별하는 RNDM (Random Drift Mutagenesis) (Bergquist et al., Biomol . Eng . 22:63-72 (2005)); 포스포티오에이트 뉴클레오티드의 랜덤 병합 및 절단을 이용하여 랜덤 길이의 단편들의 풀을 제조하고, 이러한 풀을 주형으로 사용하여 이노신 등의 "유니버셜" 염기들의 존재 하에 연장시키고, 이노신-함유 상보체의 복제로 랜덤 염기 병합이 이루어지고, 결과적으로 돌연변이가 유발되는, 랜덤 돌연변이 유발 방법인, SeSaM (Sequence Saturation Mutagenesis) (Wong et al., Biotechnol . J. 3:74-82 (2008); Wong et al., Nucleic Acids Res. 32:e26 (2004); 및 Wong et al., Anal. Biochem. 341:187-189 (2005)); "타겟에서 모든 유전자 다양성"을 코딩하고 셔플링된 후대 (shuffled progeny)에 대해 매우 다양한 다양성을 허용할 수 있도록 설계된 중첩되는 올리고뉴클레오티드를 이용하는 합성 셔플링 (Synthetic Shuffling) (Ness et al., Nat. Biotechnol . 20:1251-1255 (2002)); dUTP를 병합시킨 후 우라실 DNA 글리코실라제와 이후 피페리딘을 처리하여 엔드포인트 DNA 단편화를 수행하는, 뉴클레오티드 교환 및 적출 기법 (Nucleotide Exchange and Excision Technology)인 NexT (Muller et al., Nucleic Acids Res. 33:e117 (2005)) 등이 있다.
추가적인 방법으로, 링커를 사용해 2개의 관련성이 멀거나 관련성이 없는 유전자들이 융합되게 촉진하고, 2종의 유전자들 간에 다양한 키메라를 제조함으로써 단일-교차 하이브리드 라이브러리를 제조하는, 서열 상동성-독립적인 단백질 재조합 (SHIPREC) (Sieber et al., Nat. Biotechnol . 19:456-460 (2001)); 출발 물질이 삽입체를 포함하는 슈퍼코일형의 이중 가닥 DNA (dsDNA) 플라스미드와 원하는 돌연변이 부위에 대해 축중성인 2개의 프라이머를 포함하는, 유전자 부위 포화 돌연변이 유발 (Gene Site Saturation Mutagenesis, GSSM™) (Kretz et al., Methods Enzymol. 388:3-11 (2004)); 제한된 영역을 매우 많은 수의 가능한 아미노산 서열 변이로 치환하는 짧은 올리고뉴클레오티드 카세트의 사용을 수반하는, 조합 카세트 돌연변이 유발 (Combinatorial Cassette Mutagenesis, CCM) (Reidhaar-Olson et al. Methods Enzymol . 208:564-586 (1991); 및 Reidhaar-Olson et al. Science 241:53-57 (1988)); 기본적으로 CCM과 비슷하지만, 높은 돌연변이 유발율로 epPCR을 이용하여 핫 스팟 및 핫 영역을 동정한 다음 CMCM에 의해 연장하여 단백질 서열 스페이스의 한정된 영역을 커버 (cover)하는, 조합형 다중 카세트 돌연변이 유발 (Combinatorial Multiple Cassette Mutagenesis, CMCM) (Reetz et al., Angew . Chem. Int . Ed Engl . 40:3589-3591 (2001)); DNA 폴리머라제 III의 돌연변이 서브유닛을 코딩하는, mutD5 유전자를 이용하여, 조건부 ts 돌연변이 유발 플라스미드가 선택 과정 중에 랜덤 및 천연 돌연변이 빈도를 20 내지 4000 X로 증가시키며, 선택 과정이 필요없을 때에는 유해한 돌연변이가 축적되는 것을 차단할 수 있는 돌연변이 유발 균주 기법 (Mutator Strains technique) (Selifonova et al., Appl . Environ. Microbiol . 67:3645-3649 (2001)); Low et al., J. Mol . Biol . 260:359-3680 (1996)) 등이 있다.
추가적인 방법의 예로는, 선택 아미노산의 조합 돌연변이 (combinatorial mutation)를 분석 및 최적화하는 다향성 돌연변이를 유발하는, LTM (Look-Through Mutagenesis) (Rajpal et al., Proc . Natl . Acad . Sci . USA 102:8466-8471 (2005)); 한번에 복수의 유전자에 적용할 수 있거나, 또는 단일 유전자의 대규모 키메라 (복수의 돌연변이) 라이브러리를 제조할 수 있는 DNA 셔플링 방법인, 유전자 어셈블리 (Tunable GeneReassembly™ (TGR™) Technology supplied by Verenium Corporation); 특정한 폴드를 가진 구조적으로 정의된 단백질 백본을 고정하고, 폴드와 전체 단백질 에너제틱스 (energetics)를 안정시킬 수 있는 아미노산 치환에 대한 서열 스페이스를 검색하는, 일반적으로 3차원 구조가 공지된 단백질에 대해 가장 효과적으로 작용하는 최적화 알고리즘인, PDA (in Silico Protein Design Automation) (Hayes et al., Proc . Natl . Acad . Sci . USA 99:15926-15931 (2002)); 및 구조/기능에 대한 지식을 이용하여 효소 개선이 가능한 부위를 선택하는 단계, Stratagene QuikChange (Stratagene; San Diego CA)와 같은 돌연변이 유발 방법을 이용하여 선택 부위에서의 포화 돌연변이 유발 (saturation mutagenesis)을 수행하는 단계, 원하는 특징을 스크리닝/선별하는 단계, 및 개선된 클론(들)을 이용하여 다른 부위에 대해서도 다시 시작하여 원하는 활성이 달성될 때까지 계속 반복하는 단계를 포함하는, ISM (Iterative Saturation Mutagenesis) (Reetz et al., Nat. Protoc. 2:891-903 (2007); 및 Reetz et al., Angew . Chem . Int . Ed Engl . 45:7745-7751 (2006)) 등이 있다.
돌연변이를 유발하기 위한 임의의 전술한 방법들은 단독으로 또는 임의 조합으로 사용할 수 있다. 아울러, 방향성 진화 방법들 중 임의의 한가지 방법 또는 조합들을 본원에 기술된 후천적인 진화 기법과 함께 사용할 수 있다.
본 발명에 대한 다양한 구현예들의 작동에 실질적으로 영향을 미치지 않은 변형이 본원에 제공된 본 발명의 정의 내에서 제공되는 것으로 이해된다. 따라서, 하기 실시예들은 본 발명을 예시하기 위한 것일 뿐 제한하고자 하는 것은 아니다.
실시예
알데하이드
데하이드로게나제 변이체
본 실시예는 바람직한 특성을 가진 알데하이드 데하이드로게나제 변이체의 제조 방법을 기술한다.
돌연변이 유발 기법을 이용해 주형 ALD-1에 대해 알데하이드 데하이드로게나제 변이체를 구축하였다. 변이체는 에러 유발성 PCR, 부위 특이적인 돌연변이 유발 및 유전자 선택시의 자발적인 돌연변이에 의해 구축하였다. 주형 ALD-1은 아래 제시된 알데하이드 데하이드로게나제이다:
ALD-2 및 ALD-3에 대한 부가적인 ALD 서열들을 아래에 나타낸다:
ALD-1은 3-하이드록시부티릴-CoA의 S 거울상이성질체에 비해 R 거울상이성질체에 대해 약간 더 높은 특이성을 나타낸다. ALD-1을 ALD-2 및 ALD-3와 서열 정렬하여 도 3에 나타낸다. 이들 서열은 각각 서열번호 1, 2 및 3이다. 또한, ALD-3 (PDBID 4C3S)에 대한 결정 구조가 존재하며, ALD-2는 ALD-1 보다 ALD-3와 더 비슷하다. 따라서, ALD-3을 주형으로 사용하였다. 도 3 및 2에 밑줄 친 부분은 A로 표시된 제1 영역과 B로 표시된 제2 영역인 루프 영역으로, 이 둘다 본원에서 확인된 바에 따르면 기질 특이성 및 거울상이성질체 특이성에 관여한다. ALD-1에서 루프 A는 서열 LQKNNETQEYSINKKWVGKD (서열번호 124)이고, ALD-2의 경우에는 서열 IGPKGAPDRKFVGKD (서열번호 125)이고, ALD-3의 경우에는 서열 ITPKGLNRNCVGKD (서열번호 126)이다. 루프 B는 ALD-1에서 서열 SFAGVGYEAEGFTTFTIA (서열번호 127), ALD-2에서 서열 TYCGTGVATNGAHSGASALTIA (서열번호 128), ALD-3에서 서열 SYAAIGFGGEGFCTFTIA (서열번호 129)이다. ALD-2의 기질 특이성 루프 A 및 B의 서열과 길이는 ALD-1 및 ALD-3와 상이하지만; 정렬시 본원에 기술된 치환 위치를 용이하게 동정할 만큼 충분한 보존성이 확인되며, 특히 도 6에 나타낸 바와 같이 3D 모델링과 조합하였을 때, 특히 본원에 기술된 예시적으로 치환으로 변형되었을 때, 기질 특이성 및 거울상이성질체 특이성에 영향을 주는 상호작용하는 2개의 루프 영역들이 확인된다. ALD-1과 ALD-3의 동일성은 51.9%이다. ALD-1와 ALD-2의 동일성은 35.9%이다. ALD-3과 ALD-2의 동일성은 40%이다. 도 3의 정렬에 기반하여 컨센서스 ALD 서열이 구축되었다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 A의 컨센서스 서열은 IXPKGXXNRKXVGKD (서열번호 5)이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 B의 컨센서스 서열은 SYAGXGXXXEGFXTFTIA (서열번호 6)이다.
추가적인 정렬을 수행하였다 (도 4). 도 4a는 컷오프 40-55%로 ALD-1와 비교하여 정렬한 것이다. 도 4b는 컷오프 75-90%로 ALD-1와 비교하여 정렬한 것이다. 도 4c는 컷오프 90%로 ALD-1와 비교하여 정렬한 것이다. 도 4a-4c에 나타낸 예시적인 알데하이드 데하이드로게나제 (ALD) 정렬을 통해, 대표적인 주형 ALD 서열에서 본 발명의 치환을 행할 수 있는 위치에 해당되는 위치들이 ALD에서 동정되는 것으로 확인된다. 밑줄 친 부분은 중요한 2개의 루프 영역, 즉 A로 명명된 첫번째 것과 B로 명명된 두번째 것으로, 이 둘다 본원에서 결정된 바와 같이 기질 특이성 및 거울상이성질체 특이성에 관여한다. 도 4a-4c는, 본원에 기술된 치환 위치들을 ALD-1, 특히 루프 A 및 B 영역과의 동일성이 40% 이상의 ALD들에서 동정할 수 있으며, 특히 루프 B 영역에서 고도로 보존적임을, 보여준다.
변이체 45의, 아세틸-CoA에 비해 3HB-CoA에 대한 특이성을 높이는 돌연변이 유발을 통해, 1,3 BOD 생산이 증가되고 에탄올 생산은 감소된 몇가지 변이체들이 제조되었다. 아세틸-CoA에 비해 3-하이드록시부티릴-CoA에 대한 특이성을 증가시키는 돌연변이는, 아세틸-CoA로부터 제조된 아세트알데하이드가 숙주 세포의 천연적인 효소에 의해 또는 3-하이드록시부티르알데하이드를 1,3-부탄다이올로 변환하는 경로 효소에 의해 제조되므로, 에탄올 감소를 제공한다. 알데하이드 데하이드로게나제의 효소 활성을 높이거나 또는 3-하이드록시부티릴-CoA에 대한 특이성을 높이는 변이체는, 아세토아세틸-CoA를 1,3-부탄다이올을 형성하는 쪽으로 향하게 하는 효소 경로를 통해 1,3-부탄다이올로의 플럭스를 증가시킴으로써 4-하이드록시-2-부타논을 감소시키며, 따라서 천연 효소 또는 특이성이 낮은 경로 효소에 의한 4-하이드록시-2-부타논으로의 2단계 변환에서의 이의 이용가능성을 감소시킨다. 변이체 45의 서열은 다음과 같다:
수행한 분석은 NADK가 NAD로 변환됨에 따른 흡광도 감소를 모니터링함으로써 3HB-CoA에 대한 활성을 조사하기 위한 시험관 내 분석이다. 분석은 또한 기질로서 아세틸-CoA (AcCoA)를 사용하여 수행하였으며, 3HB-CoA vs. AcCoA에 대한 활성 비율 향상으로서 개선된 효소를 동정하였다. 아세틸-CoA로부터 제조되는 아세트알데하이드가 숙주 세포에서 천연 효소에 의해 또는 3-하이드록시부티르알데하이드를 1,3-부탄다이올로 변환하는 경로 효소에 의해 에탄올로 변환될 수 있으므로, 아세틸-CoA 대비 3-하이드록시부티릴-CoA의 특이성을 높이는 돌연변이는 에탄올 감소를 나타낸다.
이들 변이체 서브세트를 (R) 및 (S) 3-하이드록시부티르알데하이드를 사용해 추가로 조사한 결과, 테스트한 변이체들 중 5개 (952, 955, 957, 959, 961)가 모 효소 (변이체 45) 및 야생형 ALD-1과 비교해, R 거울상이성질체에 대해 개선된 선택성을 가진 것으로, 확인되었다 (도 5). 도 5a는 3 하이드록시-(R)-부티르알데하이드 (막대 세트에서 좌측 막대) 및 3 하이드록시-(S)-부티르알데하이드 (막대 세트에서 우측 막대)에 대한 ALD-2, ALD-1 및 ALD-1 변이체들의 비활성을 나타낸다. 정제된 스트렙타비딘-태그된 단백질들을 10 mM R 또는 S 3-하이드록시부티르알데하이드의 존재 하에, IVI 완충제 pH 7.5, 0.5 mM NAD+, 2 mM CoA 중에, 35℃에서 분석하였으며, 340 nm에서 NADH 흡광도 변화에 의해 활성을 모니터링하였다. IVI 완충제는 5 mM 포타슘 포스페이트 모노베이직, 20 mM 포타슘 포스페이트 다이베이직, 10 mM 소듐 글루타메이트, 일수화물, 및 150 mM 포타슘 클로라이드, pH 7.5를 포함한다. 즉, 본 분석에서 효소 반응은 도 1에 나타낸 반응과는 역 방향으로 수행되며, 즉, 반응은 3-하이드록시부티르알데하이드에서 3-하이드록시부티릴-CoA로의 변환을 측정하였다. 도 5b에 나타낸 바와 같이, 특정 알데하이드 데하이드로게나제 변이체는 S-3-하이드록시부티르알데하이드 (S-3HB-알데하이드)에 비해 R-3-하이드록시부티르알데하이드 (R-3HB-알데하이드)에 대해 선택성을 나타내었다.
ALD-1 결정 구조를 이용한 돌연변이 959의 컴퓨터 모델링에서, 아미노산 치환 F442N이 R 이성질체의 3번 탄소 상의 하이드록시 기와 수소 결합 네트워크를 형성할 수 있지만, (S) 이성질체와는 그렇지 않은 것으로, 보였다 (도 6). 도 6a-6c는 알데하이드 데하이드로게나제 959의 구조를 리본 다이아그램으로 도시한 것이다. 다이아그램은 3-하이드록시-(R)-부티르알데하이드 (도 6a) 또는 3- 하이드록시-(S)-부티르알데하이드 (도 6b)가 959의 구조에 도킹하는 것을 도시한다. 도 6c는, 3-하이드록시-(S)-부티르알데하이드가 도 6a에 나타낸 바와 같이 3-하이드록시-(R)-부티르알데하이드의 도킹에 가장 에너지 측면에서 우호적인 동일한 배향성으로 도킹되었을 때, 비-우호적인 상호작용 (원형)이 활성 부위에 위치한 이소루신을 이용해 형성됨을, 보여준다. 이 모델은, 돌연변이 F442N이 단백질과 3-하이드록시-(R)-부티르알데하이드의 하이드록시 간에 수소 결합이 형성되지만 S 거울상이성질체와는 그럴 가능성이 없음을 시사해준다.
예시적인 알데하이드 데하이드로게나제 변이체들은 표 1A-1D에 나타낸다.
ALD 변이체들의 다양한 활성을 측정하여, 표 2에 나타낸다.
1* 다른 다이올 화합물에 대한 활성
2'- = 특이성 < 1'
' += 특이성 1,0-2.0'
'++ = 특이성 2.0-3.0'
'+++ = 특이성 > 3.0
3'- = 상대적인 활성 < 1'
'+ = 상대적인 활성 > 1'
ALD 변이체 예들의 부가적인 활성을 표 3에 나타낸다. 48시간에 1,3-BOD 생산 수준은 ALD 변이체를 이용한 경우 50 g/L 이상, 60 g/L 이상, 70 g/L 이상, 80 g/L 이상 및 90 g/L 이상으로 높게 달성되었다.
전술한 상기한 알데하이드 데하이드로게나제 변이체는, R 형태의 비율이 높은 R 형태와 S 형태의 혼합물 또는 R-3-하이드록시부티르알데하이드 입체이성질체를 생산하기 위해 사용될 수 있다. 이러한 입체이성질체는 R-1,3-부탄다이올과 같은 다운스트림 산물의 입체이성질체를 제조하는데 이용될 수 있다. 이러한 입체이성질체는 약제 또는 뉴트라슈티컬로서 유용성을 가진다.
이들 결과는, 3-하이드록시부티르알데하이드, 1,3-부탄다이올, 4-하이드록시부티르알데하이드 또는 1,4-부탄다이올, 또는 알데하이드 데하이드로게나제를 포함하는 대사 경로에 의해 생산되는 다른 바람직한 생산물을 공업적으로 제조하는데 사용가능한, 바람직한 특성을 가진 알데하이드 데하이드로게나제 변이체를 생산할 수 있음을 입증해준다.
전술한 변이체들은 ALS-1 모 서열을 토대로 한다. 표 1, 2 또는 3에 나타낸 다양한 아미노산 위치들은 상동적인 알데하이드 데하이드로게나제 서열에 적용될 수 있는 것으로 이해된다. 표 4는 상동성에 기반한 ALD 서열들의 예를 제시한다. 당해 기술 분야의 당업자들은, 이들 서열을 일반적으로 널리 공지된 서열 정렬 방법으로 분석할 수 있다 (예, BLAST, blast.ncbi.nlm.nih.gov; Altschul et al., " J. Mol . Biol . 215:403-410 (1990)). 아울러, 국립 생물공학 정보 센터 (NCBI) GenBank 데이터베이스, 유럽 분자 생물학 레보레이토리 (EMBL), ExPasy Prosite 또는 BLAST를 이용한 그외 공개적으로 이용가능한 서열 데이터베이스에서 확인되는 등의 공개적으로 이용가능한 서열 데이터베이스를 검색함으로써, 부가적인 상동적인 ALD 서열들을 동정할 수 있다. 이러한 정렬은 효소 활성을 유지하기 위한 컨센서스 서열 및 추가적인 효소 변이체를 구축하기 위한 위치를 동정하는데에도 이용될 수 있다.
표 4. 알데하이드 데하이드로게나제 (ALD) 서열의 예.
부티르알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴 N1-4(HMT)] | AAP42563.1 GI:31075383 (서열번호 7) |
가정상의 단백질 ROSEINA2194_01708 [로세부리아 이눌린이보란스 DSM 16841] | EEG94445.1 (서열번호 8) |
알데하이드 데하이드로게나제 [바실러스 sp. FJAT-21945] | KOP84001.1 (서열번호 9) |
알데하이드 데하이드로게나제 [바실러스 솔라니] | KQL21940.1 (서열번호 10 |
알데하이드 데하이드로게나제 [테리스포로박터 오티니엔시스] | WP_039679531.1 (서열번호 11) |
알데하이드 데하이드로게나제 [로세부리아 이눌린이보란스 DSM 16841] | ABC25528.1 GI:83596371 (서열번호 12) |
프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. ASF502] | WP_004073235.1 (서열번호 13) |
알데하이드 데하이드로게나제 [[바실러스] 셀레니티레두센스] | WP_013174003.1 (서열번호 14) |
알데하이드 데하이드로게나제 [블라우티아 오베움] | WP_005427729.1 (서열번호 15) |
가정상의 단백질 CLOBOL_07248 [[클로스트리듐] 볼테아 ATCC BAA-613] | EDP12494.1 (서열번호 16) |
알데하이드 데하이드로게나제 [지오트갈리바실러스 알리멘타리우스] | WP_041123321.1 (서열번호 17) |
알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [[클로스트리듐] 히라노니스 DSM 13275] | EEA85935.1 (서열번호 18) |
멀티-종: 알데하이드 데하이드로게나제 [써모안에이로박터] | WP_003870148.1 (서열번호 19) |
멀티-종: 알데하이드 데하이드로게나제 [클로스트리디에일스] | WP_008705584.1 (서열번호 20) |
알데하이드 데하이드로게나제 [세발델라 터미티디스 ATCC 33386] | ACZ07905.1 (서열번호 21) |
프로피온알데하이드 데하이드로게나제 [유박테리움 플렉시카우다툼] | WP_004061597.1 (서열번호 22) |
멀티-종: 알데하이드 데하이드로게나제 [에스케리키아] | WP_000997839.1 (서열번호 23) |
알데하이드 데하이드로게나제 [로도스피릴륨 루브룸] | WP_011388669.1(서열번호 24) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | WP_012060202.1 (서열번호 25) |
알데하이드 데하이드로게나제 [[유박테리움] 할리이] | WP_005344386.1(서열번호 26) |
알데하이드 데하이드로게나제 [비브리오 sp. EJY3] | WP_014232054.1 (서열번호 27) |
알데하이드 데하이드로게나제 [로도슈도모나스 팔루스트리스 BisB18] | ABD86737.1 (서열번호 28) |
알데하이드 데하이드로게나제 EutE [데설파티바실룸 알케니보란스] | WP_015949695.1 (서열번호 29) |
알데하이드 데하이드로게나제 Ald [클로스트리듐 사카로부틸리컴] | WP_022747467.1 (서열번호 30) |
알데하이드 데하이드로게나제 [클로스트리듐 sp. DL-VIII] | WP_009171375.1 (서열번호 31) |
알데하이드 데하이드로게나제 EutE [클로스트리듐 타에니오스포럼] | WP_069679818.1(서열번호 32) |
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] | WP_012425099.1 (서열번호 33) |
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] | WP_035786720.1 (서열번호 34) |
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] | WP_039308447.1 (서열번호 35) |
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] | WP_035792132.1 (서열번호 36) |
알데하이드 데하이드로게나제 [클로스트리듐 파스테리아눔] | WP_023973059.1 (서열번호 37) |
NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴] | WP_015395720.1 (서열번호 38) |
멀티-종: 알데하이드 데하이드로게나제 [클로스트리듐] | WP_023975647.1 (서열번호 39) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | WP_026888070.1(서열번호 40) |
클로스트리듐 베이예린키이 균주 NRRL B593 가정상의 단백질, 코엔자임 A 아실화 알데하이드 데하이드로게나제 (ald), 아세토아세테이트:부티레이트/아세테이트 코엔자임 A 트랜스퍼라제 (ctfA), 아세토아세테이트:부티레이트/아세테이트 코엔자임 A 트랜스퍼라제 (ctfB), 및 아세토아세테이트 데카르복실라제 (adc) 유전자 (AF157306 AF132754) | AF157306.2 (서열번호 41) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | WP_012059995.1 (서열번호 42) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | WP_041898834.1 (서열번호 43) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | WP_017211959.1 (서열번호 44) |
알데하이드 데하이드로게나제 EutE [클로스트리듐 베이예린키이] | WP_065419149.1 (서열번호 45) |
NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴 N1-4(HMT)] >gb|AGF59413.1| NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴 N1-4(HMT)] | YP_007458667.1 GI:451822466 (WP_015395720.1) (서열번호 46) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] >gb|AAQ12068.1| 코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] >gb|AAQ12072.1| 코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] >gb|AAT48939.1| 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] >gb|AAT66436.1| 코엔자임 A- 아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] >gb|ABR35947.1| 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] | YP_001310903.1 GI:150018649 (WP_012059995.1) (서열번호 47) |
코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | AAD31841.1 GI:4884855 (서열번호 48) |
아세트알데하이드 데하이드로게나제 (아세틸화) [클로스트리듐 sp. DL-VIII] >gb|EHJ00721.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [클로스트리듐 sp. DL-VIII] | ZP_09206127.1 GI:359413662 (서열번호 49) |
코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 사카로부틸리컴] | CAQ57983.1 GI:189310620 (서열번호 50) |
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] >gb|ACD24339.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] | YP_001886323.1 GI:187934965 (WP_012425099.1) (서열번호 51) |
알데하이드 데하이드로게나제 [칼달칼리바실러스 서마룸 TA2.A1] >gb|EGL82399.1| 알데하이드 데하이드로게나제 [칼달칼리바실러스 서마룸 TA2.A1] | ZP_08533507.1 GI:335040377 (서열번호 52) |
알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 DSM 17108] >ref|ZP_15517111.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B4] >ref|ZP_15521980.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B3] >ref|ZP_15526533.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A12] >ref|ZP_15534416.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A11]>gb|EIW18982.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B4] >gb|EIW21808.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A11] >gb|EIW29163.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 DSM 17108] >gb|EIW35484.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B3] >gb|EIW36902.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A12] | ZP_10327808.1 GI:392962372 (서열번호 53) |
NAD-의존적인 알데하이드 데하이드로게나제 [써모안에이로박테리움 서모사카롤리티컴 M0795] >gb|AGB19701.1| NAD-의존적인 알데하이드 데하이드로게나제 [써모안에이로박테리움 서모사카롤리티컴 M0795] | YP_007299398.1 GI:433655690 (WP_015312185.1) (서열번호 54) |
알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 JBW45] >gb|EIW48189.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 JBW45] | ZP_15537951.1 GI:421076976 (서열번호 55) |
알데하이드 데하이드로게나제 패밀리 단백질 [데설포스포로시누스 sp. OT] >gb|EGW35902.1| 알데하이드 데하이드로게나제 패밀리 단백질 [데설포스포로시누스 sp. OT] | ZP_08814704.1GI:345862484 (서열번호 56) |
가정상의 단백질 CLOSTMETH_00016 [클로스트리듐 메틸펜토숨 DSM 5476] >gb|EEG32278.1| 가정상의 단백질 CLOSTMETH_00016 [클로스트리듐 메틸펜토숨 DSM 5476] |
ZP_03705305.1 GI:225016072 (서열번호 57) |
알데하이드 데하이드로게나제 [써모안에이로박테리움 사카롤리티컴 JW/SL-YS485] >gb|AFK85255.1| 알데하이드 데하이드로게나제 [써모안에이로박테리움 사카롤리티컴 JW/SL-YS485] | YP_006390854.1 GI:390933349 (WP_014757178.1) (서열번호 58) |
아세트알데하이드 데하이드로게나제 [써모안에이로박테리움 크실라놀리티컴 LX-11] >gb|AEF18105.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [써모안에이로박테리움 크실라놀리티컴 LX-11] | YP_004471777.1 GI:333897903 (WP_013788835.1) (서열번호 59) |
알데하이드 데하이드로게나제 EutE [아세토네마 롱검 DSM 6540] >gb|EGO64744.1| 알데하이드 데하이드로게나제 EutE [아세토네마 롱검 DSM 6540] | ZP_08623980.1 GI:338811775(서열번호 60) |
에탄올아민 이용 단백질 eutE [지오바실러스 서모글루코시단스 TNO-09.020] >gb|EID44455.1| 에탄올아민 이용 단백질 eutE [지오바실러스 서모글루코시단스 TNO-09.020] | ZP_17694107.1 GI:423719925 (서열번호 61) |
알데하이드 데하이드로게나제 [지오바실러스 sp. Y4.1MC1] >gb|ADP74637.1| 알데하이드 데하이드로게나제 [지오바실러스 sp. Y4.1MC1] | YP_003989248.1 GI:312110932 (WP_013400810.1) (서열번호 62) |
아세트알데하이드 데하이드로게나제 [지오바실러스 서모글루코시다시우스 C56-YS93] >gb|AEH47899.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [지오바실러스 서모글루코시다시우스 C56-YS93] | YP_004587980.1 GI:336235364 (WP_013876899.1)(서열번호 63) |
알데하이드 데하이드로게나제 EutE [바실러스 아조토포르만스 LMG 9581] >gb|EKN64472.1| 알데하이드 데하이드로게나제 EutE [바실러스 아조토포르만스 LMG 9581] | ZP_11313951.1 GI:410460269 (서열번호 64) |
추정의 알데하이드 데하이드로게나제, 에탄올아민 이용 단백질 [[클로스트리듐] 스티클란디이] >emb|CBH20800.1| 추정의 알데하이드 데하이드로게나제, 에탄올아민 이용 단백질 [[클로스트리듐] 스티클란디이] | YP_003935705.1 GI:310657984 (WP_013360893.1) (서열번호 65) |
알데하이드 데하이드로게나제 [서민콜라 포텐스 JR] >gb|ADG81503.1| 알데하이드 데하이드로게나제 [서민콜라 포텐스 JR] | YP_003639404.1 GI:296132157 (WP_013119524.1) (서열번호 66) |
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. D5] >gb|EGB92558.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. D5] | ZP_08130302.1 GI:325263568 (서열번호 67) |
아세트알데하이드 데하이드로게나제 (아세틸화) [푸조박테리움 sp. 3_1_33] >gb|EEW94895.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [푸조박테리움 sp. 3_1_33] | ZP_05815063.1 GI:260494934 (서열번호 68) |
에탄올아민 이용 단백질 eutE [푸조박테리움 sp. 7_1] >gb|EEO43449.1| 에탄올아민 이용 단백질 eutE [푸조박테리움 sp. 7_1] | ZP_04573939.1GI:237743458 (서열번호 69) |
NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 sp. SR1/5] >emb|CBL20089.1| NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 sp. SR1/5] | YP_007783752.1 GI:479153977 (WP_015525955.1) (서열번호 70) |
가정상의 단백질 HMPREF9942_01197 [푸조박테리움 뉴클레아툼 subsp. 아니말리스 F0419] >gb|EHO78009.1| 가정상의 단백질 HMPREF9942_01197 [푸조박테리움 뉴클레아툼 subsp. 아니말리스 F0419] | ZP_17125059.1 GI:423137416 (서열번호 71) |
잠재적인 알데하이드 데하이드로게나제 [푸조박테리움 뉴클레아툼 subsp. 폴리모르품 ATCC 10953] >gb|EDK87521.1| 잠재적인 알데하이드 데하이드로게나제 [푸조박테리움 뉴클레아툼 subsp. 폴리모르품 ATCC 10953] | ZP_04969437.1 GI:254302079(서열번호 72) |
에탄올아민 이용 단백질 eutE [푸조박테리움 sp. D11] >gb|EFD80567.1| 에탄올아민 이용 단백질 eutE [푸조박테리움 sp. D11] | ZP_06524378.1 GI:289765000 (서열번호 73) |
알데하이드 데하이드로게나제 EutE [푸조박테리움 뉴클레아툼 ChDC F128] >gb|EJU08233.1| 알데하이드 데하이드로게나제 EutE [푸조박테리움 뉴클레아툼 ChDC F128] | ZP_15972610.1 GI:421526001(서열번호 74) |
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 뉴클레아툼 subsp. 폴리모르품 F0401] >gb|EHG19190.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 뉴클레아툼 subsp. 폴리모르품 F0401] | ZP_16419680.1 GI:422338720 (서열번호 75) |
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 11_3_2] >gb|EGN65750.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 11_3_2] | ZP_08600044.1 GI:336419790 (서열번호 76) |
가정상의 단백질 CLOSTASPAR_02210 [클로스트리듐 아스파라기포르메 DSM 15981] >gb|EEG55710.1| 가정상의 단백질 CLOSTASPAR_02210 [클로스트리듐 아스파라기포르메 DSM 15981] | ZP_03758198.1 GI:225388474 (서열번호 77) |
알데하이드 데하이드로게나제 [클로스트리듐 피토퍼멘탄스 ISDg] >gb|ABX41556.1| 알데하이드 데하이드로게나제_ [클로스트리듐 피토퍼멘탄스 ISDg] | YP_001558295.1 GI:160879327 (WP_012199204.1) (서열번호 78) |
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 1_1_41FAA] >gb|EFG28139.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 1_1_41FAA] | ZP_06748808.1 GI:294783484 (서열번호 79) |
가정상의 단백질 HMPREF0991_01940 [라크노스피라시이 박테리움 2_1_58FAA] >gb|EGN47419.1| 가정상의 단백질 HMPREF0991_01940 [라크노스피라시이 박테리움 2_1_58FAA] | ZP_08612821.1 GI:336432991 (서열번호 80) |
가정상의 단백질 RUMGNA_01022 [루미노코커스 그나부스 ATCC 29149] >gb|EDN78612.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [루미노코커스 그나부스 ATCC 29149] | ZP_02040258.1 GI:154503198 (서열번호 81) |
NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 오베움 A2-162] >emb|CBL23217.1| NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 오베움 A2-162] | YP_007805199.1 GI:479177598 (WP_015542038.1) (서열번호 82) |
알데하이드 데하이드로게나제 [클로스트리듐 사카롤리티컴 WM1] >gb|ADL04402.1| 알데하이드 데하이드로게나제 [클로스트리듐 사카롤리티컴 WM1] | YP_003822025.1 GI:302386203 (WP_013272491.1) (서열번호 83) |
알데하이드 데하이드로게나제 패밀리 단백질 [플라보니프락토 플라우티이 ATCC 29863] >gb|EHM40040.1| 알데하이드 데하이드로게나제 패밀리 단백질 [플라보니프락토 플라우티이 ATCC 29863] | ZP_09385796.1 GI:365844997(서열번호 84) |
가정상의 단백질 RUMOBE_00094 [루미노코커스 오베움 ATCC 29174] >gb|EDM88971.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [루미노코커스 오베움 ATCC 29174] | ZP_01962381.1 GI:153809713 (서열번호 85) |
알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >ref|ZP_06856832.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] >gb|EET88516.1| 알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >gb|EFG86154.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] >gb|ADO12117.1| CoA- 아실화 알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] |
ZP_05391061.1 GI:255524100 (서열번호 86) |
가정상의 단백질 FUAG_00592 [푸조박테리움 울세란스 ATCC 49185] >gb|EFS25077.1| 가정상의 단백질 FUAG_00592 [푸조박테리움 울세란스 ATCC 49185] | ZP_10974295.1 GI:404368948 (서열번호 87) |
가정상의 단백질 HMPREF0402_00608 [푸조박테리움 sp. 12_1B] >gb|EHO83590.1| 가정상의 단백질 HMPREF0402_00608 [푸조박테리움 sp. 12_1B] | ZP_09586735.1 GI:373496187 (서열번호 88) |
알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >ref|ZP_06855343.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] >gb|EET85788.1| 알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7]>gb|EFG87815.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] | ZP_05393779.1 GI:255526882 (서열번호 89) |
NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 cf. 사카롤리티컴 K10] >emb|CBK77787.1| NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 cf. 사카롤리티컴 K10] | YP_007849785.1 GI:479338567 (WP_015574070.1) (서열번호 90) |
에탄올아민 이용 단백질 eutE [푸조박테리움 바리움 ATCC 27725] >gb|EES62817.1| 에탄올아민 이용 단백질 eutE [푸조박테리움 바리움 ATCC 27725] | ZP_08693593.1 GI:340756989 (서열번호 91) |
알데하이드 데하이드로게나제 패밀리 단백질 [클로스트리듐 셀라툼 DSM 1785] >gb|EKY29259.1| 알데하이드 데하이드로게나제 패밀리 단백질 [클로스트리듐 셀라툼 DSM 1785] | ZP_19296595.1 GI:429764274 (서열번호 92) |
프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. ASF502] | EMZ20682.1 GI:476613570 (서열번호 93) |
가정상의 단백질 HMPREF0988_02063 [라크노스피라시이 박테리움 1_4_56FAA] >gb|EGN36620.1| 가정상의 단백질 HMPREF0988_02063 [라크노스피라시이 박테리움 1_4_56FAA] | ZP_08616478.1 GI:336436768(서열번호 94) |
가정상의 단백질 HMPREF0994_03038 [라크노스피라시이 박테리움 3_1_57FAA_CT1] >gb|EGN40215.1| 가정상의 단백질 HMPREF0994_03038 [라크노스피라시이 박테리움 3_1_57FAA_CT1] | ZP_08607032.1 GI:336427027 (서열번호 95) |
알데하이드 데하이드로게나제 [루미노코커스 sp. 5_1_39B_FAA] >gb|EES77009.1| 알데하이드 데하이드로게나제 [루미노코커스 sp. 5_1_39BFAA] | ZP_04856816.1 GI:253579547 (서열번호 96) |
CoA-의존적인 프로프리온알데하이드 데하이드로게나제 PduP [아세토박테리움 우디이 DSM 1030] >gb|AFA49334.1| CoA-의존적인 프로프리온알데하이드 데하이드로게나제 PduP [아세토박테리움 우디이 DSM 1030] | YP_005270223.1 GI:379012411 (WP_014356934.1) (서열번호 97) |
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E1 str. 'BoNT E Beluga'] >gb|EES50221.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E1 str. 'BoNT E Beluga'] | ZP_04822936.1 GI:251780016 (서열번호 98) |
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] >gb|ACD22415.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] | YP_001885942.1 GI:187933041 (WP_012423269.1) (서열번호 99) |
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E3 str. Alaska E43] >gb|ACD53952.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E3 str. Alaska E43] | YP_001921227.1 GI:188590535 (WP_012451752.1) (서열번호 100) |
프로피온알데하이드 데하이드로게나제 [유박테리움 플렉시카우다툼 ASF492] | EMZ27833.1 GI:476621007 (서열번호 101) |
알데하이드 데하이드로게나제 [서모세디미니박터 오세아니 DSM 16646] >gb|ADL07333.1| 알데하이드 데하이드로게나제 [서모세디미니박터 오세아니 DSM 16646] | YP_003824956.1 GI:302389135 (WP_013275382.1)(서열번호 102) |
가정상의 단백질 HMPREF1090_01637 [클로스트리듐 클로스트리디오포르메 90A8] | ENZ17687.1 GI:480674262 (서열번호 103) |
가정상의 단백질 HMPREF9467_03550 [클로스트리듐 클로스트리디오포르메 2_1_49FAA] >gb|EHG29726.1| 가정상의 단백질 HMPREF9467_03550 [클로스트리듐 클로스트리디오포르메 2_1_49FAA] | ZP_09116578.1 GI:357055510 (서열번호 104) |
알데하이드 데하이드로게나제 [일리오박터 폴리트로푸스 DSM 2926] >gb|ADO84118.1| 알데하이드 데하이드로게나제 [일리오박터 폴리트로푸스 DSM 2926] | YP_003968466.1 GI:310780134 (WP_013388777.1) (서열번호 105) |
가정상의 단백질 GCWU000342_00651 [셔틀워티아 사텔레스 DSM 14600] >gb|EEP29295.1| 가정상의 단백질 GCWU000342_00651 [셔틀워티아 사텔레스 DSM 14600] | ZP_04454656.1 GI:229828587 (서열번호 106) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] >gb|ABR36155.1| 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] | YP_001311111.1 GI:150018857 (WP_012060202.1) (서열번호 107) |
프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 CM201] >gb|ENZ04399.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90B1] >gb|ENZ17257.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A8]>gb|ENZ22132.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A3] >gb|ENZ29200.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A1] >gb|ENZ64224.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A4] >gb|ENZ70105.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A6] | ENY83847.1 GI:480639338 (서열번호 108) |
알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [클로스트리듐 sp. MSTE9] >gb|EJF40077.1| 알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [클로스트리듐 sp. MSTE9] | ZP_14663848.1 GI:420157008(서열번호 109) |
프로피온알데하이드 데하이드로게나제 [클로스트리듐 볼테아 90B8] >gb|ENZ57487.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 볼테아 90A5] >gb|ENZ67775.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 볼테아 90B7] | ENZ31577.1 GI:480688660 (서열번호 110) |
가정상의 단백질 EUBHAL_00514 [유박테리움 할리이 DSM 3353] >gb|EEG37590.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [유박테리움 할리이 DSM 3353] | ZP_03715465.1 GI:225026273(서열번호 111) |
CoA-아실화 프로피온알데하이드 데하이드로게나제 [할안에어로븀 사카롤리티컴 subsp. 사카롤리티컴 DSM 6643]>emb|CCU77919.1| CoA-아실화 프로피온알데하이드 데하이드로게나제 [할안에어로븀 사카롤리티컴 subsp. 사카롤리티컴 DSM 6643] | ZP_23773859.1 GI:470960332 (서열번호 112) |
가정상의 단백질 [유박테리움 리모숨 KIST612] >gb|ADO39014.1| 가정상의 단백질 ELI_4072 [유박테리움 리모숨 KIST612] | YP_003961977.1 GI:310829620 (WP_013382321.1) (서열번호 113) |
알데하이드 데하이드로게나제 [써모안에이로박터 sp. X514] >ref|ZP_07131928.1| 알데하이드 데하이드로게나제 [써모안에이로박터 sp. X561] >ref|YP_003903905.1| 알데하이드 데하이드로게나제 [써모안에이로 터 sp. X513] >ref|ZP_08212082.1| 알데하이드 데하이드로게나제 [써모안에이로박터 에탄올리쿠스 JW 200] >gb|ABY93220.1| 알데하이드 데하이드로게나제 [써모안에이로 박터 sp. X514] >gb|EFK84693.1| 알데하이드 데하이드로게나제 [써모안에이로박터 sp. X561] >gb|ADN54614.1| 알데하이드 데하이드로게나제 [써모안에이로박터 sp. X513] >gb|EGD51928.1| 알데하이드 데하이드로게나제 [써모안에이로박터 에탄올리쿠스 JW 200] | YP_001663556.1 GI:167040571 (WP_003870148.1) (서열번호 114) |
알데하이드 데하이드로게나제 [로도스피릴륨 루브룸 ATCC 11170] >ref|YP_006047210.1| 알데하이드 데하이드로게나제 EutE [로도스피릴륨 루브룸 F11] >gb|ABC21715.1| 알데하이드 데하이드로게나제 [로도스피릴륨 루브룸 ATCC 11170] >gb|AEO47413.1| 알데하이드 데하이드로게나제 EutE [로도스피릴륨 루브룸 F11] |
YP_426002.1 GI:83592250 (서열번호 115) |
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [유박테리움 이우리이 subsp. 마르가레티애 ATCC 43715] >gb|EFM39950.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [유박테리움 이우리이 subsp. 마르가레티애 ATCC 43715] | ZP_07453625.1 GI:306819974 (서열번호 116) |
알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [유박테리움 sp. AS15] >gb|EJP26117.1| 알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [유박테리움 sp. AS15] | ZP_10828060.1 GI:402309064(서열번호 117) |
알데하이드 데하이드로게나제 EutE [비브리오 sp. EJY3] >gb|AEX22176.1| 알데하이드 데하이드로게나제 EutE [비브리오 sp. EJY3] | YP_005023154.1 GI:375265711 (WP_014232054.1) (서열번호 118) |
가정상의 단백질 HMPREF9629_00032 [유박테리아시이 박테리움 ACC19a] >gb|EHL16790.1| 가정상의 단백질 HMPREF9629_00032 [유박테리아시이 박테리움 ACC19a] | ZP_09320518.1 GI:363893420 (서열번호 119) |
알데하이드-알코올 데하이드로게나제 도메인 단백질 [프로피오니박테리움 프로피오니컴 F0230a] >gb|AFN47240.1| 알데하이드-알코올 데하이드로게나제 도메인 단백질 [프로피오니박테리움 프로피오니컴 F0230a] | YP_006513121.1 GI:397671586 (WP_014847902.1) (서열번호 120) |
가정상의 단백질 HMPREF9628_01348 [유박테리아시이 박테리움 CM5] >gb|EHL19659.1| 가정상의 단백질 HMPREF9628_01348 [유박테리아시이 박테리움 CM5] | ZP_09316712.1 GI:363889349 (서열번호 121) |
알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [유박테리아시이 박테리움 OBRC8] >gb|EJU23517.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [유박테리아시이 박테리움 OBRC8] | ZP_10886417.1 GI:402837902 (서열번호 122) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | AAT48939.1 (서열번호 123) |
전술한 변이체와 같은 개개 ALD 변이체는 단독으로 사용하거나 또는 본원에 기재된 변이 아미노산 위치들 중 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16곳, 또는 최대한으로는 모든 변이 위치 등의, 임의의 다른 변이 아미노산 위치와 조합하여 (표 1-3), 바람직한 활성을 가진 부가적인 변이체를 구축할 수 있는 것으로, 이해된다. ALD 변이체들의 예로는, 비-제한적으로, 표 1-3의 임의에 언급된 아미노산 위치에서, 예를 들어, ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 12, 19, 33, 44, 65, 72, 73, 107, 122, 129, 139, 143, 145, 155, 163, 167, 174, 189,204, 220, 227, 229, 230, 243, 244, 254, 267, 315, 353, 356, 396, 429, 432, 437, 440, 441, 442, 444, 447, 450, 460, 464 또는 467번 아미노산 위치에서, 단일 치환 또는 하나 이상의 치환의 조합을 포함한다 (표 1-3 참조). 예를 들어, ALD 변이체는, 비-제한적으로, ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 D12, V19, C33, I44, K65, K72, A73, Y107, D122, E129, I139, T143, P145, G155, V163, G167, C174, C189, M204, C220, M227, K229, T230, A243, G244, A254, C267, V315, C353, C356, R396, F429, V432, E437, T440, T441, F442, I444, S447, E450, R460, C464 또는 A467 아미노산 위치에서의, 아미노산 치환, 단일한 치환 또는 하나 이상의 치환들의 조합을 포함한다 (표 1-3 참조). 다른 아미노산 19개 중 임의의 치환은 하나 이상의 바람직한 아미노산 위치에서 수행될 수 있는 것으로 이해된다.
일 구현예에서, 변이체 ALD는 12번 위치에서 아미노산 치환 D12A를 포함한다. 일 구현예에서, 변이체 ALD는 19번 위치에서의 아미노산 치환 V19I를 포함한다. 일 구현예에서, 변이체 ALD는 33번 위치에서의 아미노산 치환 C33R을 포함한다. 일 구현예에서, 변이체 ALD는 44번 위치에서의 아미노산 치환 I44L을 포함한다. 일 구현예에서, 변이체 ALD는 65번 위치에서의 아미노산 치환 K65A를 포함한다. 일 구현예에서, 변이체 ALD는 72번 위치에서의 아미노산 치환 K72N을 포함한다. 일 구현예에서, 변이체 ALD는 A73S, A73D, A73G, A73L, A73Q, A73F, A73E, A73W, A73R, A73C 및 A73M으로부터 선택되는 73번 위치에서의 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 107번 위치에서의 아미노산 치환 Y107K를 포함한다. 일 구현예에서, 변이체 ALD는 122번 위치에서의 아미노산 치환 D122N을 포함한다. 일 구현예에서, 변이체 ALD는 129번 위치에서의 아미노산 치환 E129I를 포함한다. 일 구현예에서, 변이체 ALD는 I139S, I139V 및 I139L로부터 선택되는 139번 위치에서의 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 143번 위치에서의 아미노산 치환 T143N 또는 T143S를 포함한다. 일 구현예에서, 변이체 ALD는 V163C, V163G 및 V163T로부터 선택되는 163번 위치에서의 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 167번 위치에서의 아미노산 치환 G167S를 포함한다. 일 구현예에서, 변이체 ALD는 174번 위치에서의 아미노산 치환 C174S를 포함한다. 일 구현예에서, 변이체 ALD는 189번 위치에서의 아미노산 치환 C189A를 포함한다. 일 구현예에서, 변이체 ALD는 204번 위치에서의 아미노산 치환 M204R을 포함한다. 일 구현예에서, 변이체 ALD는 220번 위치에서의 아미노산 치환 C220V를 포함한다. 일 구현예에서, 변이체 ALD는 M227K, M227Q, M227I, M227V, M227C, M227L 및 M227A로부터 선택되는 227번 위치에서의 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 229번 위치에서의 아미노산 치환 K229S를 포함한다. 일 구현예에서, 변이체 ALD는 T230R, T230K, T230H, T230A, T230M, T230C, T230L, T230S, T230Y, T230G, T230T, T230I, T230W, T230N, T230V 및 T230Q로부터 선택되는 230번 위치에서의 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 A243P, A243Q, A243E, A243S, A243N, A243K, A243L, A243C, A243M 및 A243I로부터 선택되는 243번 위치에서의 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 254번 위치에서의 아미노산 치환 A254T를 포함한다. 일 구현예에서, 변이체 ALD는 267번 위치에서의 아미노산 치환 C267A를 포함한다. 일 구현예에서, 변이체 ALD는 315번 위치에서의 아미노산 치환 V315A를 포함한다. 일 구현예에서, 변이체 ALD는 353번 위치에서의 아미노산 치환 C353A를 포함한다. 일 구현예에서, 변이체 ALD는 356번 위치에서의 아미노산 치환 C356T 또는 C356L을 포함한다. 일 구현예에서, 변이체 ALD는 396번 위치에서의 아미노산 치환 R396H를 포함한다. 일 구현예에서, 변이체 ALD는 F429Y, F429Q, F429H, F429M, F429D 및 F429L로부터 선택되는 429번 위치에서의 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 432번 위치에서의 아미노산 치환 V432V 또는 V432N을 포함한다. 일 구현예에서, 변이체 ALD는 437번 위치에서의 아미노산 치환 E437P를 포함한다. 일 구현예에서, 변이체 ALD는 440번 위치에서의 아미노산 치환 T440H를 포함한다. 일 구현예에서, 변이체 ALD는 441번 위치에서의 아미노산 치환 T441G를 포함한다. 일 구현예에서, 변이체 ALD는 F442T, F442Y, F442H, F442N, F442Q, F442M 및 F442F로부터 선택되는 442번 위치에서의 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 444번 위치에서의 아미노산 치환 I444V를 포함한다. 일 구현예에서, 변이체 ALD는 S447M, S447P, S447H, S447K, S447R, S447T, S447E 및 S447S로부터 선택되는 447번 위치에서의 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 460번 위치에서의 아미노산 치환 R460K를 포함한다. 일 구현예에서, 변이체 ALD는 464번 위치에서의 아미노산 치환 C464V 또는 C464I를 포함한다. 일 구현예에서, 변이체 ALD는 467번 위치에서의 아미노산 치환 A467V를 포함한다. 전술한 임의의 아미노산 위치는 단일한 아미노산 치환 또는 하나 이상의 치환의 조합에 이용하여, 본 발명의 ALD 변이체를 구축할 수 있다.
본원의 교시 내용에 기초하여, 당해 기술 분야의 당업자라면, 상동적인 ALD 서열에서 ALD-1의 아미노산 서열 (서열번호 1)과 대응되는 12, 19, 33, 44, 65, 72, 73, 107, 122, 129, 139, 143, 145, 155, 163, 167, 174, 189, 204, 220, 227, 229, 230, 243, 244, 254, 267, 315, 353, 356, 396, 429, 432, 437, 440, 441, 442, 444, 447, 450, 460, 464 또는 467번 아미노산 위치들 중 임의 위치에 해당되는 아미노산 위치를 쉽게 파악할 수 있을 것이다. 예를 들어, 도 4a의 정렬에 나타낸 바와 같이, ALD-1의 아미노산 I139는 서열번호 13 및 20의 아미노산 I133에 해당한다. 서열번호 24에서, 대응되는 위치는 V199이다. 널리 공지된 아미노산 서열 정렬 방법을 이용해, 일반적으로 본원에 기술된 바와 같이 디폴트 파라미터를 이용해, 당해 기술 분야의 당업자라면 ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 12, 19, 33, 44, 65, 72, 73, 107, 122, 129, 139, 143, 145, 155, 163, 167, 174, 189, 204, 220, 227, 229, 230, 243, 244, 254, 267, 315, 353, 356, 396, 429, 432, 437, 440, 441, 442, 444, 447, 450, 460, 464 또는 467번 아미노산 위치들 중 임의 위치에 해당되는, 다른 ALD 서열에서의 아미노산 위치를 쉽게 결정할 수 있다.
ALD 변이체는, 본원에 기술된, 예를 들어 표 1-3에 기술된 변이 아미노산 위치, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개, 최대한으로는 기술된 모든 변이 아미노산 위치를 포함할 수 있는 것으로 또한 이해된다. 당해 기술 분야의 당업자라면 본원에 기술된 바와 같이 임의의 단일한 아미노산 치환 또는 아미노산 치환들의 조합, 예를 들어 표 1-3 및 전술한 아미노산 변이체 위치를 기반으로 ALD 변이체를 쉽게 구축할 수 있다. 특정 구현예에서, ALD 변이체는 표 1-3에 기술된 변이체이다.
본 명세서 전체에 걸쳐 다양한 간행물들이 참조되어 있다. 유전자은행 등재 버전의 기술 및 GI 번호 공개물을 비롯하여, 이들 간행물의 내용은 그 전체가 본 발명이 속하는 기술 분야의 상황을 보다 충분히 설명하기 위해 본 명세서에 원용에 의해 포함된다. 본 발명은 전술한 실시예를 참조하여 설명되었지만, 본 발명의 사상으로부터 이탈되지 않는 범위 내에서 다양한 변형이 이루어질 수 있는 것으로 이해되어야 한다.
SEQUENCE LISTING
<110> GENOMATICA, INC.
<120> ALDEHYDE DEHYDROGENASE VARIANTS AND METHODS OF USE
<130> 12956-408-228
<140>
<141>
<150> 62/480,194
<151> 2017-03-31
<160> 129
<170> PatentIn version 3.5
<210> 1
<211> 468
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 1
Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 2
<211> 477
<212> PRT
<213> Lactobacillus brevis
<400> 2
Met Asn Thr Glu Asn Ile Glu Gln Ala Ile Arg Lys Ile Leu Ser Glu
1 5 10 15
Glu Leu Ser Asn Pro Gln Ser Ser Thr Ala Thr Asn Thr Thr Val Pro
20 25 30
Gly Lys Asn Gly Ile Phe Lys Thr Val Asn Glu Ala Ile Ala Ala Thr
35 40 45
Lys Ala Ala Gln Glu Asn Tyr Ala Asp Gln Pro Ile Ser Val Arg Asn
50 55 60
Lys Val Ile Asp Ala Ile Arg Glu Gly Phe Arg Pro Tyr Ile Glu Asp
65 70 75 80
Met Ala Lys Arg Ile His Asp Glu Thr Gly Met Gly Thr Val Ser Ala
85 90 95
Lys Ile Ala Lys Leu Asn Asn Ala Leu Tyr Asn Thr Pro Gly Pro Glu
100 105 110
Ile Leu Gln Pro Glu Ala Glu Thr Gly Asp Gly Gly Leu Val Met Tyr
115 120 125
Glu Tyr Ala Pro Phe Gly Val Ile Gly Ala Val Gly Pro Ser Thr Asn
130 135 140
Pro Ser Glu Thr Val Ile Ala Asn Ala Ile Met Met Leu Ala Gly Gly
145 150 155 160
Asn Thr Leu Phe Phe Gly Ala His Pro Gly Ala Lys Asn Ile Thr Arg
165 170 175
Trp Thr Ile Glu Lys Leu Asn Glu Leu Val Ala Asp Ala Thr Gly Leu
180 185 190
His Asn Leu Val Val Ser Leu Glu Thr Pro Ser Ile Glu Ser Val Gln
195 200 205
Glu Val Met Gln His Pro Asp Val Ala Met Leu Ser Ile Thr Gly Gly
210 215 220
Pro Ala Val Val His Gln Ala Leu Ile Ser Gly Lys Lys Ala Val Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Ala Met Val Asp Ala Thr Ala Asn Ile
245 250 255
Ala Leu Ala Ala His Asn Ile Val Asp Ser Ala Ala Phe Asp Asn Asn
260 265 270
Ile Leu Cys Thr Ala Glu Lys Glu Val Val Val Glu Ala Ala Val Lys
275 280 285
Asp Glu Leu Ile Met Arg Met Gln Gln Glu Gly Ala Phe Leu Val Thr
290 295 300
Asp Ser Ala Asp Ile Glu Lys Leu Ala Gln Met Thr Ile Gly Pro Lys
305 310 315 320
Gly Ala Pro Asp Arg Lys Phe Val Gly Lys Asp Ala Thr Tyr Ile Leu
325 330 335
Asp Gln Ala Gly Ile Ser Tyr Thr Gly Thr Pro Thr Leu Ile Ile Leu
340 345 350
Glu Ala Ala Lys Asp His Pro Leu Val Thr Thr Glu Met Leu Met Pro
355 360 365
Ile Leu Pro Val Val Cys Cys Pro Asp Phe Asp Ser Val Leu Ala Thr
370 375 380
Ala Thr Glu Val Glu Gly Gly Leu His His Thr Ala Ser Ile His Ser
385 390 395 400
Glu Asn Leu Pro His Ile Asn Lys Ala Ala His Arg Leu Asn Thr Ser
405 410 415
Ile Phe Val Val Asn Gly Pro Thr Tyr Cys Gly Thr Gly Val Ala Thr
420 425 430
Asn Gly Ala His Ser Gly Ala Ser Ala Leu Thr Ile Ala Thr Pro Thr
435 440 445
Gly Glu Gly Thr Ala Thr Ser Lys Thr Tyr Thr Arg Arg Arg Arg Leu
450 455 460
Asn Ser Pro Glu Gly Phe Ser Leu Arg Thr Trp Glu Ala
465 470 475
<210> 3
<211> 462
<212> PRT
<213> Clostridium phytofermentans
<400> 3
Met Thr Val Asn Glu Gln Leu Val Gln Asp Ile Ile Lys Asn Val Val
1 5 10 15
Ala Ser Met Gln Leu Thr Gln Thr Asn Lys Thr Glu Leu Gly Val Phe
20 25 30
Asp Asp Met Asn Gln Ala Ile Glu Ala Ala Lys Glu Ala Gln Leu Val
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Ala Ile
50 55 60
Arg Lys Lys Thr Ile Glu His Ala Glu Thr Leu Ala Arg Met Ala Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Val Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Ile
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Asn Phe Ala Val Gln Leu Ile
165 170 175
Asn Glu Ala Ser Leu Ser Ala Gly Gly Pro Val Asn Ile Ala Cys Ser
180 185 190
Val Arg Lys Pro Thr Leu Asp Ser Ser Lys Ile Met Met Ser His Gln
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Gln Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Val Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Ile Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Ile Asp Ala Ile Ala Asn Glu Leu Met Asn Tyr
275 280 285
Met Val Lys Glu Gln Gly Cys Tyr Ala Ile Thr Lys Glu Gln Gln Glu
290 295 300
Lys Leu Thr Asn Leu Val Ile Thr Pro Lys Gly Leu Asn Arg Asn Cys
305 310 315 320
Val Gly Lys Asp Ala Arg Thr Leu Leu Gly Met Ile Gly Ile Asp Val
325 330 335
Pro Ser Asn Ile Arg Cys Ile Ile Phe Glu Gly Glu Lys Glu His Pro
340 345 350
Leu Ile Ser Glu Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala
355 360 365
Lys Ser Phe Asp Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Arg Ile Thr
385 390 395 400
Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 4
<211> 468
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 4
Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Ser Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Arg Asp Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Val Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Ala Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys
340 345 350
Cys Ile Ile Thr Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn His Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Pro Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Ile
450 455 460
Val Leu Val Gly
465
<210> 5
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(7)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Any amino acid
<400> 5
Ile Xaa Pro Lys Gly Xaa Xaa Asn Arg Lys Xaa Val Gly Lys Asp
1 5 10 15
<210> 6
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (7)..(9)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (13)..(13)
<223> Any amino acid
<400> 6
Ser Tyr Ala Gly Xaa Gly Xaa Xaa Xaa Glu Gly Phe Xaa Thr Phe Thr
1 5 10 15
Ile Ala
<210> 7
<211> 468
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 7
Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Ser Ala Arg His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 8
<211> 386
<212> PRT
<213> Roseburia inulinivorans
<400> 8
Met Gly Val Asn Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu
1 5 10 15
Lys His His Leu Thr Ala Asp Lys Val Pro Gly Thr Glu Asp Ile Ser
20 25 30
Thr Ile Ala Trp Ser Gly Asp Arg Gly Leu Thr Leu Val Glu Met Gly
35 40 45
Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Ala Thr Asn Pro Ser Glu
50 55 60
Thr Val Ile Cys Asn Cys Ile Gly Met Leu Ala Gly Gly Asn Thr Val
65 70 75 80
Val Phe Asn Pro His Pro Asn Ala Lys Lys Thr Thr Ile Tyr Thr Ile
85 90 95
Asn Met Ile Asn Glu Ala Ser Ile Glu Ala Gly Gly Pro Asp Asn Ile
100 105 110
Ala Val Thr Val Glu Ala Pro Thr Leu Asp Thr Ser Ala Ile Met Met
115 120 125
Lys His Pro Ser Ile His Leu Leu Val Ala Thr Gly Gly Pro Gly Val
130 135 140
Val Thr Ala Val Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala
145 150 155 160
Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala
165 170 175
Ala Gln Asp Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys
180 185 190
Ile Ala Glu Lys Glu Ile Val Ala Val Asp Ser Val Ala Asp Glu Leu
195 200 205
Met Asn Tyr Met Ile Ser Glu Asn Gly Cys Tyr Leu Ala Ser Lys Glu
210 215 220
Ile Gln Asp Lys Leu Val Gln Thr Val Phe Thr Pro Lys Gly Ala Leu
225 230 235 240
Asn Arg Lys Cys Val Gly Arg Ser Ala Gln Thr Leu Leu Ala Met Val
245 250 255
Gly Val Asn Val Gly Pro Glu Ile Arg Cys Ile Val Phe Glu Gly Gln
260 265 270
Lys Glu His Pro Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly
275 280 285
Met Val Arg Val Lys Ser Phe Glu Glu Gly Val Glu Thr Ala Val Trp
290 295 300
Leu Glu His Gly Asn Arg His Ser Ala His Ile His Ser Lys Asn Val
305 310 315 320
Asp His Ile Thr Thr Tyr Ala Arg Ala Leu Asp Thr Ala Ile Leu Val
325 330 335
Lys Asn Gly Pro Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr
340 345 350
Cys Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ala Ala
355 360 365
His Ser Phe Thr Lys Ser Arg Arg Cys Thr Met Ser Asp Ser Leu Cys
370 375 380
Ile Arg
385
<210> 9
<211> 467
<212> PRT
<213> Bacillus sp.
<400> 9
Met Asn Pro Ala Glu Leu Pro His Gln Val His Glu Ser Gly Ala Asn
1 5 10 15
Gly Val Phe Asp Arg Ile Glu Asp Ala Ile Glu Ala Gly Tyr Ile Ala
20 25 30
Gln Leu Asn Tyr Val Lys Gln Phe Gln Leu Lys Asp Arg Glu Lys Ile
35 40 45
Ile Thr Ala Ile Arg Glu Ala Val Ile Glu Asn Lys Glu Lys Leu Ala
50 55 60
Gln Met Val Phe Glu Glu Thr Lys Leu Gly Arg Tyr Glu Asp Lys Ile
65 70 75 80
Ala Lys His Glu Leu Val Ala Arg Lys Thr Pro Gly Thr Glu Asp Ile
85 90 95
Thr Thr Ala Ala Phe Ser Gly Asp Glu Gly Leu Thr Ile Ile Glu Gln
100 105 110
Ala Pro Phe Gly Leu Val Gly Ala Val Thr Pro Val Thr Asn Pro Thr
115 120 125
Glu Thr Ile Ile Asn Asn Ser Ile Ser Leu Leu Ala Ala Gly Asn Ala
130 135 140
Val Val Leu Asn Val His Pro Ser Ser Lys Ala Ser Cys Ala Phe Val
145 150 155 160
Val Asn Leu Ile Asn Gln Ala Ile Lys Asp Thr Gly Gly Pro Glu Asn
165 170 175
Leu Val Ser Met Val Lys Asp Pro Thr Leu Glu Thr Leu Asn Arg Ile
180 185 190
Ile Glu Ser Pro Lys Val Lys Leu Leu Val Gly Thr Gly Gly Leu Gly
195 200 205
Met Val Lys Thr Leu Leu Lys Ser Gly Lys Lys Ala Ile Gly Ala Gly
210 215 220
Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Leu Lys Gln
225 230 235 240
Ala Ala Lys Ser Ile Ile Glu Gly Ala Ser Phe Asp Asn Asn Leu Leu
245 250 255
Cys Ile Ala Glu Lys Glu Leu Phe Val Ile Asp Ser Val Ala Asp Asp
260 265 270
Leu Ile Phe His Met Leu Asn Glu Gly Ala Tyr Met Leu Asp Gln Gln
275 280 285
Gln Leu Ser Lys Leu Met Ser Phe Ala Leu Glu Glu Asn Val His Gln
290 295 300
Glu Ala Gly Gly Cys Ser Leu Asp Asn Lys Arg Glu Tyr His Val Ser
305 310 315 320
Lys Asp Trp Val Gly Lys Asp Ala Val Ser Phe Leu Arg Gln Leu Gly
325 330 335
Ile Ala His Glu Glu Asp Ile Lys Leu Leu Ile Cys Glu Val Asp Phe
340 345 350
Asp His Pro Phe Val Gln Leu Glu Gln Met Met Pro Val Phe Pro Ile
355 360 365
Val Arg Val Gly Asn Leu Asp Glu Ala Ile Glu Met Ala Leu Leu Ala
370 375 380
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp
385 390 395 400
His Leu Thr Lys Phe Ala Arg Ala Ile Glu Thr Thr Ile Phe Val Lys
405 410 415
Asn Ala Ser Ser Leu Ala Gly Val Gly Phe Gly Gly Glu Gly His Thr
420 425 430
Thr Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Ala Lys
435 440 445
Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg
450 455 460
Ile Ile Gly
465
<210> 10
<211> 467
<212> PRT
<213> Bacillus solani
<400> 10
Met Asn Pro Ala Glu Leu Pro His Gln Val His Glu Ser Gly Ala Asn
1 5 10 15
Gly Val Phe Asp Arg Ile Glu Asp Ala Ile Glu Ala Gly Tyr Ile Ala
20 25 30
Gln Leu Asn Tyr Val Lys Gln Phe Gln Leu Lys Asp Arg Glu Lys Ile
35 40 45
Ile Thr Ala Ile Arg Glu Ala Val Ile Glu Asn Lys Glu Lys Leu Ala
50 55 60
Gln Met Val Phe Glu Glu Thr Lys Leu Gly Arg Tyr Glu Asp Lys Ile
65 70 75 80
Ala Lys His Glu Leu Val Ala Arg Lys Thr Pro Gly Thr Glu Asp Ile
85 90 95
Thr Thr Ala Ala Phe Ser Gly Asp Glu Gly Leu Thr Ile Ile Glu Gln
100 105 110
Ala Pro Phe Gly Leu Val Gly Ala Val Thr Pro Val Thr Asn Pro Thr
115 120 125
Glu Thr Ile Ile Asn Asn Ser Ile Ser Leu Leu Ala Ala Gly Asn Ala
130 135 140
Val Val Leu Asn Val His Pro Ser Ser Lys Val Ser Cys Ala Phe Val
145 150 155 160
Val Asn Leu Ile Asn Gln Ala Ile Lys Asp Thr Gly Gly Pro Glu Asn
165 170 175
Leu Val Ser Met Val Lys Asp Pro Thr Leu Glu Thr Leu Asn Arg Ile
180 185 190
Ile Glu Ser Pro Lys Val Lys Leu Leu Val Gly Thr Gly Gly Pro Gly
195 200 205
Met Val Lys Thr Leu Leu Lys Ser Gly Lys Lys Ala Ile Gly Ala Gly
210 215 220
Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Leu Lys Gln
225 230 235 240
Ala Ala Lys Ser Ile Ile Glu Gly Ala Ser Phe Asp Asn Asn Leu Leu
245 250 255
Cys Ile Ala Glu Lys Glu Leu Phe Val Ile Asp Ser Val Ala Asp Asp
260 265 270
Leu Ile Phe His Met Leu Asn Glu Gly Ala Tyr Met Leu Asp Gln Gln
275 280 285
Gln Leu Ser Lys Leu Met Ser Phe Ala Leu Glu Glu Asn Val His Gln
290 295 300
Glu Ala Gly Gly Cys Ser Leu Asp Asn Lys Arg Glu Tyr His Val Ser
305 310 315 320
Lys Asp Trp Val Gly Lys Asp Ala Val Ser Phe Leu Arg Gln Leu Gly
325 330 335
Ile Ala His Glu Glu Asp Ile Lys Leu Leu Ile Cys Glu Val Asp Phe
340 345 350
Asp His Pro Phe Val Gln Leu Glu Gln Met Met Pro Val Phe Pro Ile
355 360 365
Val Arg Val Gly Asn Leu Asp Glu Ala Ile Glu Met Ala Leu Leu Ala
370 375 380
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp
385 390 395 400
His Leu Thr Lys Phe Ala Arg Ala Ile Glu Thr Thr Ile Phe Val Lys
405 410 415
Asn Ala Ser Ser Leu Ala Gly Val Gly Phe Gly Gly Glu Gly His Thr
420 425 430
Thr Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Ala Lys
435 440 445
Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg
450 455 460
Ile Ile Gly
465
<210> 11
<211> 473
<212> PRT
<213> Terrisporobacter othiniensis
<400> 11
Met Asp Ile Asp Val Lys Leu Ile Glu Lys Met Val Ser Asp Ala Leu
1 5 10 15
Lys Glu Ile Lys Ile Glu Asn Ile Thr Gln Glu Val Glu Lys Asn Ser
20 25 30
Ile Glu Asp Asn Tyr Gly Val Phe Lys Thr Ile Glu Gly Ala Ile Asp
35 40 45
Ala Ser Tyr Val Ala Gln Lys Glu Leu Leu Phe Ser Lys Ile Ser Asp
50 55 60
Arg Gln Lys Tyr Val Asp Ala Ile Arg Ser Ala Ile Leu Asn Gln Glu
65 70 75 80
Asn Leu Glu Leu Ile Ser Lys Leu Ala Val Asp Glu Thr Glu Ile Gly
85 90 95
Cys Tyr Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr
100 105 110
Pro Gly Thr Glu Asp Leu Ile Ser Ser Val Lys Thr Gly Asp Asp Gly
115 120 125
Leu Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr
130 135 140
Pro Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met
145 150 155 160
Ile Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Thr
165 170 175
Lys Val Ser Gln Thr Ile Ile Lys Ile Leu Asn Lys Ala Leu Glu Glu
180 185 190
Val Gly Ala Pro Lys Asn Leu Ile Thr Met Val Glu Lys Pro Ser Ile
195 200 205
Glu Asn Thr Asn Lys Met Ile Glu Asn Pro Lys Val Arg Phe Leu Val
210 215 220
Ala Thr Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys
225 230 235 240
Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu
245 250 255
Thr Ala Asp Ile Arg Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys Ser
260 265 270
Phe Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val
275 280 285
Ala Ser Ile Cys Asp Ser Leu Ile Glu Asn Met Lys Leu Asn Gly Ala
290 295 300
Tyr Leu Val Lys Asp Lys Lys Val Ile Glu Gln Leu Leu Ser Val Val
305 310 315 320
Ala Lys Glu Asn Gly Ala Pro Lys Thr Asn Phe Val Gly Lys Ser Ala
325 330 335
Lys Tyr Ile Leu Asp Lys Ile Gly Val Thr Val Asp Asp Asn Ile Lys
340 345 350
Ala Ile Ile Met Glu Val Asp Lys Asp His Thr Phe Val Gln Glu Glu
355 360 365
Met Met Met Pro Ile Leu Pro Ile Val Arg Val Glu Asp Val Asp Lys
370 375 380
Ala Ile Glu Tyr Ala Gln Glu Ala Glu His Gly Asn Arg His Thr Ala
385 390 395 400
Ile Met His Ser Lys Asn Ile Asp Lys Leu Ser Lys Met Ser Lys Ile
405 410 415
Met Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile
420 425 430
Gly Val Gly Gly Glu Gly His Ser Thr Phe Thr Ile Ala Gly Pro Thr
435 440 445
Gly Glu Gly Leu Thr Ser Pro Lys Ser Phe Cys Arg Ile Arg Arg Cys
450 455 460
Val Val Ser Asp Ser Phe Ser Ile Arg
465 470
<210> 12
<211> 457
<212> PRT
<213> Roseburia inulinivorans
<400> 12
Met Val His Asp Ile Val Gln Lys Val Met Ala Asn Met Gln Ile Ser
1 5 10 15
Gly Ser Val Ser Gly Met His Gly Val Phe Lys Asp Met Asn Asp Ala
20 25 30
Ile Asn Ala Ser Ile Glu Ala Gln Lys Lys Val Cys Thr Met Thr Leu
35 40 45
Asp Gln Arg Glu Gln Ile Ile Ser Leu Ile Arg Lys Lys Thr His Glu
50 55 60
Asn Ala Glu Ile Leu Ala Asn Met Gly Val Asn Glu Thr Gly Met Gly
65 70 75 80
Asn Val Gly Asp Lys Ile Leu Lys His His Leu Thr Ala Asp Lys Val
85 90 95
Pro Gly Thr Glu Asp Ile Ser Thr Ile Ala Trp Ser Gly Asp Arg Gly
100 105 110
Leu Thr Leu Val Glu Met Gly Pro Phe Gly Val Ile Gly Ala Ile Thr
115 120 125
Pro Ala Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Cys Ile Gly Met
130 135 140
Leu Ala Gly Gly Asn Thr Val Val Phe Asn Pro His Pro Asn Ala Lys
145 150 155 160
Lys Thr Thr Ile Tyr Thr Ile Asn Met Ile Asn Glu Ala Ser Ile Glu
165 170 175
Ala Gly Gly Pro Asp Asn Ile Ala Val Thr Val Glu Ala Pro Thr Leu
180 185 190
Asp Thr Ser Ala Ile Met Met Lys His Pro Ser Ile His Leu Leu Val
195 200 205
Ala Thr Gly Gly Pro Gly Val Val Thr Ala Val Leu Ser Ser Gly Lys
210 215 220
Arg Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu
225 230 235 240
Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp Ile Val Asn Gly Cys Thr
245 250 255
Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Ile Val Ala Val
260 265 270
Asp Ser Val Ala Asp Glu Leu Met Asn Tyr Met Ile Ser Glu Asn Gly
275 280 285
Cys Tyr Leu Ala Ser Lys Glu Ile Gln Asp Lys Leu Val Gln Thr Val
290 295 300
Phe Thr Pro Lys Gly Ala Leu Asn Arg Lys Cys Val Gly Arg Ser Ala
305 310 315 320
Gln Thr Leu Leu Ala Met Val Gly Val Asn Val Gly Pro Glu Ile Arg
325 330 335
Cys Ile Val Phe Glu Gly Gln Lys Glu His Pro Leu Ile Ala Glu Glu
340 345 350
Leu Met Met Pro Ile Leu Gly Met Val Arg Val Lys Ser Phe Glu Glu
355 360 365
Gly Val Glu Thr Ala Val Trp Leu Glu His Gly Asn Arg His Ser Ala
370 375 380
His Ile His Ser Lys Asn Val Asp His Ile Thr Thr Tyr Ala Arg Ala
385 390 395 400
Leu Asp Thr Ala Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Ala Leu
405 410 415
Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr Ile Ala Ser Arg Thr
420 425 430
Gly Glu Gly Leu Thr Ala Ala His Ser Phe Thr Lys Ser Arg Arg Cys
435 440 445
Thr Met Ser Asp Ser Leu Cys Ile Arg
450 455
<210> 13
<211> 462
<212> PRT
<213> Clostridium sp.
<400> 13
Met Ser Val Asn Glu Arg Met Val Gln Asp Ile Val Gln Glu Val Val
1 5 10 15
Ala Lys Met Gln Ile Ala Ser Asp Val Thr Gly Asn His Gly Val Phe
20 25 30
Gln Asp Met Asn Ala Ala Ile Glu Ala Ala Lys Lys Thr Gln Lys Val
35 40 45
Val Ala Arg Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile
50 55 60
Arg Ala Lys Ile Lys Glu His Ala Glu Ile Phe Ala Arg Met Gly Val
65 70 75 80
Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Gln Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Ile
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu Asn Pro Thr Leu Glu Ser Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr
275 280 285
Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Thr Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg
450 455 460
<210> 14
<211> 509
<212> PRT
<213> Bacillus selenitireducens
<400> 14
Met Ser Ile Ser Glu Asp Met Leu Lys Gln Ile Val Lys Ser Val Met
1 5 10 15
Asn Asn Val Glu Lys Glu Leu Gly Glu Ser Pro Lys Pro Gln Pro Arg
20 25 30
Thr Ile Pro Val Thr Val Leu Asn Glu Val Thr Pro Val Lys Glu Ser
35 40 45
Arg Asp Pro Ser Pro Val His Gln His Val Leu Gly Val Phe Pro Asp
50 55 60
Val Asp Gln Ala Val His Ala Ala Ala Gly Ser Gln Lys Glu Trp Val
65 70 75 80
Lys Arg Pro Val Ser Glu Arg Arg Val Ile Leu Glu Ala Met Lys Gln
85 90 95
Thr Val Asp Ser Gln Lys Glu Arg Tyr Ser Glu Leu Ala Val Glu Glu
100 105 110
Thr Gly Leu Gly Asn Val Ala Asp Lys Ile Ala Lys His Glu Leu Ile
115 120 125
Ile Thr Lys Thr Pro Gly Val Glu Asp Leu Arg Thr Asp Ala Val Ser
130 135 140
Gly Asp His Gly Leu Thr Ile Glu Glu Asp Ala Pro Phe Gly Val Ile
145 150 155 160
Gly Ala Val Thr Pro Val Thr Asn Pro Thr Thr Thr Val Ile His Asn
165 170 175
Ser Leu Val Met Leu Ala Ala Gly Asn Ala Val Val Phe Asn Val His
180 185 190
Pro Ser Ser Lys Ala Thr Cys Gln Arg Val Val Ser Asp Leu Asn Ala
195 200 205
Ala Ile Lys Asp Ala Gly Gly Pro Gln Asn Leu Ile Thr Met Ile Ala
210 215 220
Glu Pro Thr Leu Asp Thr Leu Asn Gln Leu Ala Gly His Gln Glu Ile
225 230 235 240
Arg Leu Leu Val Gly Thr Gly Gly Gln Gly Leu Val Arg Ser Leu Leu
245 250 255
Gln Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val
260 265 270
Ile Val Asp Glu Thr Ala Asp Ile Glu Ala Ala Ala Lys Ala Ile Ile
275 280 285
Leu Gly Ala Ser Phe Asp Asn Asn Ile Leu Cys Ile Ala Glu Lys Glu
290 295 300
Val Phe Ala Leu Asp Val Ile Tyr Asp Asp Leu Ile Tyr His Leu Leu
305 310 315 320
Gln Glu Gly Ala Tyr Met Leu Ser Glu Ser Glu Leu Ser Gln Val Met
325 330 335
Lys Thr Val Leu Val Gly Asp Ala Pro Ile Glu Ala Ala Lys Ser Cys
340 345 350
Ser Val Ser Val Arg Pro Asp Leu His Ile Ala Lys Ala Trp Val Gly
355 360 365
Lys Glu Ala Ser Ala Ile Leu Lys Ala Ala Thr Gly Lys Asp Leu Pro
370 375 380
Val Lys Leu Leu Ile Cys Asp Val Glu Ala Thr His Pro Phe Val Gln
385 390 395 400
Leu Glu Gln Met Met Pro Val Leu Pro Ile Val Arg Met Pro Asp Phe
405 410 415
Asp Ala Ala Val Glu Ala Ala Val Lys Ala Glu Lys Gly Asn Arg His
420 425 430
Thr Ala Val Ile His Ser Lys Asn Val Asp Arg Leu Thr Gln Phe Ala
435 440 445
Arg Arg Ile Glu Thr Thr Ile Phe Val Lys Asn Ala Ser Ser Leu Ala
450 455 460
Gly Val Gly Phe Gly Gly Glu Gly Tyr Ala Thr Met Thr Ile Ala Gly
465 470 475 480
Pro Thr Gly Glu Gly Ile Thr Ser Pro Arg Thr Phe Thr Arg Lys Arg
485 490 495
Arg Cys Val Leu Ala Glu Gly Gly Phe Arg Ile Ile Gly
500 505
<210> 15
<211> 462
<212> PRT
<213> Blautia obeum
<400> 15
Met Pro Ile Ser Glu Ser Met Val Gln Asp Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe
20 25 30
Lys Asp Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Glu Leu Ile
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val
65 70 75 80
Asp Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Val
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Val Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr
275 280 285
Met Leu Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala
325 330 335
Pro Ala Asn Ile Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 16
<211> 478
<212> PRT
<213> Clostridium bolteae
<400> 16
Met Lys Glu Gly Val Ile Arg Leu Asp Met Asp Ile Lys Val Ile Glu
1 5 10 15
Gln Leu Val Glu Gln Ala Leu Lys Glu Ile Lys Ala Glu Gln Pro Leu
20 25 30
Lys Phe Thr Ala Pro Lys Leu Glu Arg Tyr Gly Val Phe Lys Thr Met
35 40 45
Asp Glu Ala Ile Ala Ala Ser Glu Glu Ala Gln Lys Lys Leu Leu Phe
50 55 60
Ser Lys Ile Ser Asp Arg Gln Lys Tyr Val Asp Val Ile Arg Ser Thr
65 70 75 80
Ile Ile Lys Arg Glu Asn Leu Glu Leu Ile Ser Arg Leu Ser Val Glu
85 90 95
Glu Thr Glu Ile Gly Asp Tyr Glu His Lys Leu Ile Lys Asn Arg Leu
100 105 110
Ala Ala Glu Lys Thr Pro Gly Thr Glu Asp Leu Leu Thr Glu Ala Ile
115 120 125
Thr Gly Asp Asn Gly Leu Thr Leu Val Glu Tyr Cys Pro Phe Gly Val
130 135 140
Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile Ile Asn
145 150 155 160
Asn Ser Ile Ser Met Ile Ala Gly Gly Asn Thr Val Val Phe Ser Pro
165 170 175
His Pro Arg Ala Lys Lys Val Ser Gln Met Thr Val Lys Met Leu Asn
180 185 190
Lys Ala Leu Ile Asp Asn Gly Ala Pro Pro Asn Leu Ile Thr Met Val
195 200 205
Glu Glu Pro Ser Ile Glu Asn Thr Asn Lys Met Ile Asp Asn Pro Ser
210 215 220
Val Arg Leu Leu Val Ala Thr Gly Gly Pro Ser Ile Val Lys Lys Val
225 230 235 240
Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro
245 250 255
Val Val Val Asp Glu Thr Ala Asp Ile Asp Lys Ala Ala Lys Asp Ile
260 265 270
Val Asp Gly Cys Ser Phe Asp Asn Asn Val Pro Cys Ile Ala Glu Lys
275 280 285
Glu Val Phe Ala Val Asp Ser Ile Cys Asp Tyr Leu Ile His His Met
290 295 300
Lys Glu Asn Gly Ala Tyr Gln Ile Thr Asp Pro Met Leu Leu Glu Gln
305 310 315 320
Leu Val Ala Leu Val Thr Thr Glu Lys Gly Gly Pro Lys Thr Ser Phe
325 330 335
Val Gly Lys Ser Ala Arg Tyr Ile Leu Asp Lys Leu Gly Ile Thr Val
340 345 350
Asp Ala Ser Val Arg Val Ile Ile Met Glu Val Pro Lys Asp His Leu
355 360 365
Leu Val Gln Glu Glu Met Met Met Pro Ile Leu Pro Val Val Arg Val
370 375 380
Ser Asp Val Asp Thr Ala Ile Glu Tyr Ala His Gln Ala Glu His Gly
385 390 395 400
Asn Arg His Thr Ala Met Met His Ser Lys Asn Val Glu Lys Leu Ser
405 410 415
Lys Met Ala Lys Ile Met Glu Thr Thr Ile Phe Val Lys Asn Ala Pro
420 425 430
Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Thr Thr Phe Thr
435 440 445
Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Pro Arg Thr Phe Cys
450 455 460
Arg Lys Arg Lys Cys Val Met Thr Asp Ala Phe Ser Ile Arg
465 470 475
<210> 17
<211> 515
<212> PRT
<213> Jeotgalibacillus alimentarius
<400> 17
Met Ser Ile Ser Glu Glu Thr Leu Gln Gln Ile Ile Lys Ser Val Val
1 5 10 15
Thr Gln Val Glu Ser Glu Leu Gly His Lys His Ser Ala Pro Ala Thr
20 25 30
Gly Ser Gln Ser Ala Thr Pro Val Ala Pro Val Lys Met Lys Ala Val
35 40 45
Thr Asn Lys Pro Val Phe Lys Glu His Thr Tyr Arg Ser Ser Gly Glu
50 55 60
Gly Ile Tyr Thr Thr Val Asp Glu Ala Val Ser Arg Ser Ala Ala Ala
65 70 75 80
Gln Lys Lys Tyr Val Lys His Phe Thr Met Asn Asp Arg Val Thr Val
85 90 95
Leu Asn Ala Ile Lys Gln Thr Val Leu Ser Ser Lys Asp Thr Leu Ser
100 105 110
Lys Met Ala Val Glu Glu Thr Gly Ile Gly Cys Tyr Glu Asp Lys Ile
115 120 125
Gln Lys His Glu Leu Val Cys Lys Lys Thr Pro Gly Ile Glu Asp Leu
130 135 140
Lys Thr Glu Ala Met Ser Gly Asp Asp Gly Leu Thr Ile Ile Glu Glu
145 150 155 160
Ala Pro Phe Gly Val Ile Gly Ala Val Thr Pro Val Thr Asn Pro Thr
165 170 175
Thr Thr Ile Ile Asn Asn Ser Leu Ser Met Leu Ala Ala Gly Asn Thr
180 185 190
Val Val Phe Asn Val His Pro Ser Ser Lys Lys Val Cys Ser Tyr Leu
195 200 205
Ile Arg Glu Leu His Gln Ser Ile Val Gln Ala Gly Gly Pro Ala Asp
210 215 220
Leu Ile Thr Met Val Ala Asp Pro Thr Leu Asp Thr Leu Asn Glu Leu
225 230 235 240
Ala Ala His Pro Asp Ile Arg Leu Leu Val Gly Thr Gly Gly Pro Gly
245 250 255
Leu Val Lys Ser Leu Leu Gln Ser Gly Lys Lys Ala Ile Gly Ala Gly
260 265 270
Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Leu Val Asn
275 280 285
Ala Ala Lys Ser Ile Ile Leu Gly Ala Ser Phe Asp His Asn Leu Leu
290 295 300
Cys Ile Ala Glu Lys Glu Val Phe Val Leu Glu Glu Ala Ala Asn Glu
305 310 315 320
Leu Ile Tyr Gln Met Leu Asp Gln Gly Ala Tyr Met Leu Asn Asn Glu
325 330 335
Glu Leu Ser Arg Val Met Ser Leu Val Leu Thr Glu Asp Ser Ser Ser
340 345 350
Pro Val Ala Gly Gly Cys Thr Gly Lys Pro Ser Lys Lys Tyr His Val
355 360 365
Lys Lys Glu Trp Ile Gly Gln Ser Ala Ala Ala Ile Ala Arg Ala Ala
370 375 380
Gly Ile Asn Lys Glu Asn Ile Lys Leu Leu Ile Cys Glu Thr Asp Pro
385 390 395 400
Asp His Pro Phe Val Val Leu Glu Gln Met Met Pro Val Leu Pro Ile
405 410 415
Val Lys Thr Gln Ser Phe Glu Glu Ala Val Glu Trp Ala Val Ala Ala
420 425 430
Glu Lys Gly Asn Arg His Thr Ala Val Ile His Ser Thr Asn Val Asp
435 440 445
Arg Met Thr Ala Phe Ala Arg Ala Ile Glu Thr Thr Ile Phe Val Lys
450 455 460
Asn Ala Ser Ser Leu Ala Gly Val Gly Phe Gly Gly Glu Gly His Thr
465 470 475 480
Thr Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Val Thr Ser Ala Arg
485 490 495
Ser Phe Thr Arg Lys Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg
500 505 510
Ile Ile Gly
515
<210> 18
<211> 470
<212> PRT
<213> Clostridium hiranonis
<400> 18
Met Lys Met Glu Leu Asp Leu Ile Gln Glu Met Ile Lys Gln Val Leu
1 5 10 15
Glu Glu Ile Lys Glu Glu Gly Val Glu Val Ser Ser Lys Glu Glu Tyr
20 25 30
Gly Tyr Gly Val Phe Asp Ser Met Val Glu Ala Ile Asp Ala Ser Glu
35 40 45
Lys Ala Gln Lys Glu Leu Phe Glu Cys Ser Val Gln Gln Arg Asp Lys
50 55 60
Phe Val Asp Ala Ile Arg Ala Glu Ile Leu Lys Lys Glu Asn Leu Glu
65 70 75 80
Met Ile Ser Tyr Asp Ala Val Glu Glu Thr Lys Ile Gly Arg Val Glu
85 90 95
Asp Lys Ile Ile Lys Asn Arg Val Ala Ala Glu Asn Thr Pro Gly Thr
100 105 110
Glu Asp Leu Lys Thr Arg Ala Ile Thr Gly Glu Asp Gly Leu Thr Ile
115 120 125
Glu Glu Tyr Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr
130 135 140
Asn Pro Thr Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Ala Gly
145 150 155 160
Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val Ser
165 170 175
Ile Lys Leu Val Lys Met Met Asn Lys Ala Leu Glu Glu Ala Gly Ala
180 185 190
Pro Arg Asn Leu Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Ser
195 200 205
Lys Ile Met Met Glu Ser Pro Lys Val Arg Leu Leu Val Ala Thr Gly
210 215 220
Gly Pro Ala Ile Val Lys Gln Val Leu Ser Ala Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Ala Lys Asp Ile Val Ser Gly Ala Ser Phe Asp Asn
260 265 270
Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Glu Ser Val
275 280 285
Val Asp Gln Leu Ile Tyr Tyr Met Lys Lys Asn Gly Ala Tyr Glu Ile
290 295 300
Thr Ser Pro Glu Val Leu Glu Gln Leu Asp Lys Ala Val Ser Lys Glu
305 310 315 320
Asn Gly Lys Pro Asn Pro Ser Leu Val Gly Lys Ser Ala Lys Glu Leu
325 330 335
Leu Ala Leu Val Gly Ile Asn Val Asp Asp Asp Val Lys Leu Val Ile
340 345 350
Ala Arg Thr Asn Lys Asp His His Leu Val Thr Glu Glu Met Leu Met
355 360 365
Pro Ile Leu Pro Ile Val Ser Val Ser Asp Val Asp Thr Ala Ile Asp
370 375 380
Trp Ala Tyr Glu Ala Glu Ala Gly Asn Arg His Thr Ala Ile Met His
385 390 395 400
Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Lys Lys Leu Glu Ala
405 410 415
Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly
420 425 430
Gly Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Ile Thr Ser Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met Ser
450 455 460
Glu Ala Leu Ser Ile Arg
465 470
<210> 19
<211> 466
<212> PRT
<213> Thermoanaerobacter sp.
<400> 19
Met Ile Asp Glu Asn Leu Val Val Thr Ile Thr Lys Lys Ile Leu Asn
1 5 10 15
Glu Ile Asn Leu Lys Glu Ala Glu Glu Lys Lys Glu Lys Asp Asn Pro
20 25 30
Asp Leu Gly Ile Phe Asn Asp Val Asn Glu Ala Val Glu Cys Ala Lys
35 40 45
Glu Ala Gln Lys Lys Phe Ala Leu Met Asp Leu Glu Lys Arg Glu Glu
50 55 60
Ile Ile Ala Ala Ile Arg Glu Ala Cys Val Asn Asn Ala Arg Leu Leu
65 70 75 80
Ala Glu Ile Ala Cys Ser Glu Thr Gly Arg Gly Arg Val Glu Asp Lys
85 90 95
Val Ala Lys Asn Ile Leu Ala Ala Lys Lys Thr Pro Gly Thr Glu Asp
100 105 110
Leu Lys Pro Thr Ala Trp Thr Gly Asp Arg Gly Leu Thr Leu Val Glu
115 120 125
Met Ala Pro Val Gly Val Ile Ala Ser Ile Thr Pro Val Thr Asn Pro
130 135 140
Thr Ala Thr Ile Ile Asn Asn Thr Ile Ser Met Leu Ala Ala Gly Asn
145 150 155 160
Ala Val Val Phe Asn Pro His Pro Ser Ala Lys Lys Thr Ser Asn Lys
165 170 175
Ala Val Glu Ile Ile Asn Glu Ala Ile Leu Lys Val Gly Ala Pro Asn
180 185 190
Gly Leu Val Cys Ser Ile Asn Asn Pro Thr Ile Gln Thr Ala Gln Lys
195 200 205
Leu Met Glu His Pro Glu Val Asn Met Val Val Val Thr Gly Gly Lys
210 215 220
Ala Val Val Gln Thr Ala Leu Arg Cys Gly Lys Lys Val Ile Gly Ala
225 230 235 240
Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Val
245 250 255
Lys Ala Ala His Asp Ile Ala Cys Gly Ala Ser Phe Asp Asn Asn Leu
260 265 270
Pro Cys Ile Ala Glu Lys Glu Ile Ile Ala Val Glu Arg Ile Ala Asp
275 280 285
Thr Leu Leu Glu Arg Met Lys Arg Glu Gly Ala Tyr Val Leu His Gly
290 295 300
Lys Asp Ile Asp Arg Met Thr Glu Leu Ile Phe Gln Gly Gly Ala Ile
305 310 315 320
Asn Lys Asp Leu Ile Gly Arg Asp Ala His Phe Ile Leu Ser Gln Ile
325 330 335
Gly Ile Glu Thr Gly Lys Asp Ile Arg Leu Val Val Met Pro Val Asp
340 345 350
Val Ser His Pro Leu Val Tyr His Glu Gln Leu Met Pro Val Ile Pro
355 360 365
Phe Val Thr Val Pro Thr Val Glu Glu Ala Ile Asn Leu Ala Val Lys
370 375 380
Ala Glu Gly Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val
385 390 395 400
Glu Asn Met Thr Ala Phe Ala Arg Ala Ile Gln Thr Thr Ile Phe Val
405 410 415
Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala
435 440 445
Arg Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Arg
450 455 460
Ile Val
465
<210> 20
<211> 462
<212> PRT
<213> Clostridiales sp.
<400> 20
Met Pro Ile Asn Glu Asn Met Val Gln Glu Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe
20 25 30
Lys Glu Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Gln Leu Ile
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Val Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Ile Asn Leu Leu
165 170 175
Asn Glu Ala Ser Leu Glu Ser Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Val Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Thr Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Ser Ser Ile Val Asp Glu Leu Met His Tyr
275 280 285
Leu Val Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala
325 330 335
Pro Ala Asn Ile Arg Cys Ile Val Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Arg Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Cys Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ala Asp Ser Leu Cys Ile Arg
450 455 460
<210> 21
<211> 468
<212> PRT
<213> Sebaldella termitidis
<400> 21
Met Leu Asp Gly Leu Gln Leu Glu Asp Ile Ile Lys Lys Val Ile Asn
1 5 10 15
Asp Val Lys Asn Glu Lys Asp Ile Asn Ile Thr Asn Lys Glu Asn Ser
20 25 30
Cys Gly His Gly Ile Phe Thr Asn Ile Glu Thr Ala Val Asp Lys Ala
35 40 45
Tyr Glu Ala Gln Gln Thr Tyr Asn Ser Arg Ser Leu Glu Glu Arg Arg
50 55 60
Asn Ile Ile Ser Asn Ile Arg Lys Glu Leu Leu Lys Tyr Thr Glu Glu
65 70 75 80
Met Ala Glu Lys Thr Val Ala Glu Thr Lys Met Gly Arg Ile Lys Asp
85 90 95
Lys Ile Leu Lys Asn Lys Leu Ala Ile Glu Lys Thr Pro Gly Val Glu
100 105 110
Asp Leu Gly Thr Glu Val Phe Thr Gly Asp Asp Gly Leu Thr Leu Val
115 120 125
Glu Leu Ser Ala Phe Gly Val Leu Gly Ser Val Thr Pro Val Thr Asn
130 135 140
Pro Thr Glu Thr Ile Ile Asn Asn Thr Ile Gly Ala Leu Ala Gly Gly
145 150 155 160
Asn Ser Ile Val Phe Cys Pro His Pro Ser Ala Lys Asn Ile Cys Leu
165 170 175
Trp Leu Ile Lys Lys Leu Asn Gly Ile Ile Thr Glu Ala Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Ser Ala Ser Glu Ala Lys Lys Glu Asn Val Asp
195 200 205
Ile Leu Phe Ser His Glu Lys Ile Asn Met Leu Val Ile Thr Gly Gly
210 215 220
Thr Glu Ile Val Lys Leu Ala Leu Lys Ser Gly Lys Lys Val Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile
245 250 255
Glu Lys Ala Ala Lys Asp Ile Val Asn Gly Ala Gly Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Leu Val Leu Glu Ser Val Ala
275 280 285
Asp Tyr Leu Ile Phe Asn Met Glu Lys Ala Gly Ala Phe His Ile Thr
290 295 300
Asp Lys Glu Asp Ile Lys Lys Leu Glu Asp Thr Val Tyr Lys Asn Gly
305 310 315 320
Met Val Asn Lys Glu Phe Ile Gly Lys Asp Ala Gly Phe Ile Leu Glu
325 330 335
Lys Ser Gly Ile Lys Cys Ser Phe Asp Pro Ala Leu Ile Thr Leu Glu
340 345 350
Thr Asp Ile Asn His Val Phe Val Gln Lys Glu Leu Met Met Pro Val
355 360 365
Leu Ala Val Val Arg Gln Lys Asn Phe Glu Glu Ala Leu Lys Asn Ala
370 375 380
Ile Leu Thr Glu His Gly Leu Lys His Thr Ala Val Met His Ser Gln
385 390 395 400
Asn Val Thr Arg Leu Ser Ile Ala Ala Arg Glu Met Gln Thr Thr Ile
405 410 415
Phe Val Lys Asn Ala Pro Ser Tyr Ala Ala Leu Gly Phe Gln Gly Glu
420 425 430
Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr
435 440 445
Ser Ala Arg Asn Phe Thr Arg Lys Arg Arg Cys Val Leu Gly Gly Ser
450 455 460
Phe Ser Ile Arg
465
<210> 22
<211> 462
<212> PRT
<213> Eubacterium plexicaudatum
<400> 22
Met Ser Val Asn Asp Gln Met Val Gln Asp Ile Val Arg Gln Val Leu
1 5 10 15
Ala Asn Met Arg Ile Ser Ser Asp Ala Ser Gly Ser Arg Gly Val Phe
20 25 30
Ser Asp Met Asn Glu Ala Val Glu Ala Ala Lys Lys Ala Gln Ala Val
35 40 45
Ile Gly Lys Met Pro Met Asp His Arg Glu Lys Ile Ile Ser Ser Ile
50 55 60
Arg Ala Lys Ile Met Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val
65 70 75 80
Lys Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Lys Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Ile Gly Met Val Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Val Asn Leu Val
165 170 175
Asn Glu Ala Ser Val Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu His Pro Thr Leu Asp Thr Ser Ala Ile Met Met Lys His Lys
195 200 205
Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr
275 280 285
Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Ala Lys Glu Gln Glu
290 295 300
Ala Leu Ile Ser Val Val Leu Lys Gly Gly Gln Leu Asn Arg Asp Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Gln Ala
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Asp Ser Phe Glu Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp His Ile Thr
385 390 395 400
Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg
450 455 460
<210> 23
<211> 505
<212> PRT
<213> Escherichia sp.
<400> 23
Met Asn Asp Ile Glu Ile Ala Gln Ala Val Ser Thr Ile Leu Ser Lys
1 5 10 15
Phe Thr Lys Ala Thr Pro Asp Glu Ala Pro Ala Thr Ser Glu Ala Ala
20 25 30
Arg Val Asp Gly Leu Asp Glu Ile Val Ala Lys Ala Leu Ala Gln His
35 40 45
Ser Ser Val Arg Asp Ala Ser Ala Ile Ser Gln Val Ala Lys Val Ala
50 55 60
Asn Ala Ser Thr Gly Ala Phe Asp Thr Met Asp Glu Ala Ile Ser Ala
65 70 75 80
Ala Val Leu Ala Gln Val Gln Tyr Arg His Cys Ser Met Gln Asp Arg
85 90 95
Ala Ser Phe Ile Asn Gly Ile Arg Asp Val Phe Leu Gln Glu Asp Val
100 105 110
Leu Cys Ala Leu Ser Arg Met Ala Val Glu Glu Thr Gly Met Gly Asn
115 120 125
Tyr Glu Asp Lys Leu Ile Lys Asn Arg Val Ala Ala Leu Lys Thr Pro
130 135 140
Gly Ile Glu Asp Leu Thr Thr Ser Ala Val Ser Gly Asp Gly Gly Leu
145 150 155 160
Thr Leu Ile Glu Tyr Ser Ala Phe Gly Val Ile Gly Ser Ile Thr Pro
165 170 175
Thr Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Gly Met Leu
180 185 190
Ala Ala Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ser Arg Lys
195 200 205
Val Ser Leu Tyr Ala Val Glu Leu Ile Asn Asn Lys Leu Ala Gln Leu
210 215 220
Gly Ala Pro Ala Asn Met Val Val Thr Val Thr Lys Pro Ser Ile Asp
225 230 235 240
Asn Thr Asn Val Leu Ile Asn Asp Pro Arg Ile Asn Met Leu Val Ala
245 250 255
Thr Gly Gly Pro Ala Ile Val Lys Thr Val Met Ser Ser Gly Lys Lys
260 265 270
Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Ala Val Val Asp Glu Thr
275 280 285
Ala Asp Ile Glu Lys Ala Ala Arg Asp Ile Ile Lys Gly Cys Ser Phe
290 295 300
Asp Asn Asn Leu Pro Cys Val Ala Glu Lys Glu Val Ile Val Val Asn
305 310 315 320
Gln Val Ala Asp Tyr Leu Ile His Cys Met Lys Lys Ser Gly Ala Tyr
325 330 335
Leu Leu Cys Asp Lys Lys Leu Ser Gln Gln Leu Gln Ser Leu Val Leu
340 345 350
Asn Glu Lys Gly Thr Gly Pro Asn Thr Ala Phe Val Gly Lys Asp Ala
355 360 365
Arg Tyr Ile Leu Gln Gln Leu Gly Ile Gln Val Gly Asp Asp Ile Lys
370 375 380
Val Ile Leu Ile Glu Ala Glu Lys Thr His Pro Phe Val Val His Glu
385 390 395 400
Leu Met Met Pro Val Leu Pro Val Val Arg Val Asp Asn Val Asp Glu
405 410 415
Ala Ile Glu Leu Ala Val Lys Val Glu His Gly Asn Arg His Thr Ala
420 425 430
Val Met His Ser Thr Asn Val Glu Lys Leu Thr Lys Met Ala Arg Leu
435 440 445
Ile Gln Thr Thr Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Leu
450 455 460
Gly Val Gly Gly Glu Gly His Ala Thr Phe Thr Ile Ala Gly Pro Thr
465 470 475 480
Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Ala Arg Arg Arg Arg Cys
485 490 495
Val Met Val Glu Ala Leu Asn Ile Arg
500 505
<210> 24
<211> 529
<212> PRT
<213> Rhodospirillum rubrum
<400> 24
Met Asn Asp Gly Gln Ile Ala Ala Ala Val Ala Lys Val Leu Glu Ala
1 5 10 15
Tyr Gly Val Pro Ala Asp Pro Ser Ala Ala Ala Pro Ala Pro Ala Ala
20 25 30
Pro Val Ala Pro Ala Ala Pro Thr Ala Gly Ser Val Ser Glu Met Ile
35 40 45
Ala Arg Gly Ile Ala Lys Ala Ser Ser Asp Asp Gln Ile Ala Gln Ile
50 55 60
Val Ala Lys Val Val Gly Asp Tyr Ser Ala Gln Ala Ala Lys Pro Ala
65 70 75 80
Val Val Pro Gly Ala Ala Ala Ser Thr Glu Ala Gly Asp Gly Val Phe
85 90 95
Asp Thr Met Asp Ala Ala Val Asp Ala Ala Val Leu Ala Gln Gln Gln
100 105 110
Tyr Leu Leu Cys Ser Met Thr Asp Arg Gln Arg Phe Val Asp Gly Ile
115 120 125
Arg Glu Val Ile Leu Gln Lys Asp Thr Leu Glu Leu Ile Ser Arg Met
130 135 140
Ala Ala Glu Glu Thr Gly Met Gly Asn Tyr Glu His Lys Leu Ile Lys
145 150 155 160
Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly Thr Glu Asp Leu Thr Thr
165 170 175
Glu Ala Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Ser Pro
180 185 190
Phe Gly Ala Ile Gly Ala Val Ala Pro Thr Thr Asn Pro Thr Glu Thr
195 200 205
Ile Ile Cys Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Ser Val Ile
210 215 220
Phe Ser Pro His Pro Arg Ala Thr Lys Val Ser Leu Leu Thr Val Lys
225 230 235 240
Leu Ile Asn Gln Lys Leu Ala Cys Leu Gly Ala Pro Ala Asn Leu Val
245 250 255
Val Thr Val Ser Lys Pro Ser Val Glu Asn Thr Asn Ala Met Met Ala
260 265 270
His Pro Lys Ile Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile Val
275 280 285
Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly
290 295 300
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
305 310 315 320
Leu Asp Ile Ile Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
325 330 335
Ala Glu Lys Glu Ile Ile Ala Val Ala Gln Ile Ala Asp Tyr Leu Ile
340 345 350
Phe Ser Met Lys Lys Gln Gly Ala Tyr Gln Ile Thr Asp Pro Ala Val
355 360 365
Leu Arg Lys Leu Gln Asp Leu Val Leu Thr Ala Lys Gly Gly Pro Gln
370 375 380
Thr Ser Cys Val Gly Lys Ser Ala Val Trp Leu Leu Asn Lys Ile Gly
385 390 395 400
Ile Glu Val Asp Ser Ser Val Lys Val Ile Leu Met Glu Val Pro Lys
405 410 415
Glu His Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Leu
420 425 430
Val Arg Val Ser Asp Val Asp Glu Ala Ile Ala Val Ala Ile Glu Val
435 440 445
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr Asn Val Arg
450 455 460
Lys Leu Thr Lys Met Ala Lys Leu Ile Gln Thr Thr Ile Phe Val Lys
465 470 475 480
Asn Gly Pro Ser Tyr Ala Gly Leu Gly Val Gly Gly Glu Gly Tyr Thr
485 490 495
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys
500 505 510
Ser Phe Ala Arg Lys Arg Lys Cys Val Met Val Glu Ala Leu Asn Ile
515 520 525
Arg
<210> 25
<211> 472
<212> PRT
<213> Clostridium beijerinckii
<400> 25
Met Asp Val Asp Val Val Leu Val Glu Lys Leu Val Arg Gln Ala Ile
1 5 10 15
Glu Glu Val Lys Asn Lys Asn Leu Leu Asn Leu Asp Lys Phe Glu Ser
20 25 30
Val Lys Asn Tyr Gly Ile Phe Gly Thr Met Asp Ala Ala Val Glu Ala
35 40 45
Ser Phe Val Ala Gln Lys Gln Leu Leu Asn Ala Ser Met Thr Asp Lys
50 55 60
Gln Lys Tyr Val Asp Thr Ile Lys Ala Thr Ile Leu Lys Lys Glu Asn
65 70 75 80
Leu Glu Leu Ile Ser Arg Met Ser Val Glu Glu Thr Glu Ile Gly Lys
85 90 95
Tyr Glu His Lys Leu Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro
100 105 110
Gly Ile Glu Asp Leu Thr Thr Glu Ala Met Thr Gly Asp Asn Gly Leu
115 120 125
Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro
130 135 140
Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile
145 150 155 160
Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Asn
165 170 175
Val Ser Ile Lys Leu Val Thr Met Leu Asn Lys Ala Leu Glu Glu Ala
180 185 190
Gly Ala Pro Asp Asn Leu Ile Ala Thr Val Lys Glu Pro Ser Ile Glu
195 200 205
Asn Thr Asn Ile Met Met Glu His Pro Lys Ile Arg Met Leu Val Ala
210 215 220
Thr Gly Gly Pro Ala Ile Val Asn Lys Val Met Ser Thr Gly Lys Lys
225 230 235 240
Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr
245 250 255
Ala Asp Ile Glu Lys Ala Ala Ile Asp Ile Val Asn Gly Cys Ser Phe
260 265 270
Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp
275 280 285
Gln Ile Cys Asp Tyr Leu Ile His Tyr Met Lys Leu Asn Gly Ala Tyr
290 295 300
Glu Ile Lys Asp Arg Asp Leu Ile Gln Lys Leu Leu Asp Leu Val Thr
305 310 315 320
Asn Glu Asn Gly Gly Pro Lys Val Ser Phe Val Gly Lys Ser Ala Pro
325 330 335
Tyr Ile Leu Asn Lys Leu Gly Ile Ser Val Asp Glu Asn Ile Lys Val
340 345 350
Ile Ile Met Glu Val Glu Lys Asn His His Phe Val Leu Glu Glu Met
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Thr Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Tyr Val Ala Glu His Gly Asn Arg His Thr Ala Ile
385 390 395 400
Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Arg Leu Leu
405 410 415
Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly
420 425 430
Val Gly Gly Glu Gly Thr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val
450 455 460
Met Val Asp Ala Phe Asn Ile Arg
465 470
<210> 26
<211> 468
<212> PRT
<213> Eubacterium hallii
<400> 26
Met Asn Ile Asp Val Glu Leu Ile Glu Lys Val Val Lys Lys Val Leu
1 5 10 15
Asn Asp Val Glu Thr Gly Ser Ser Glu Ser Glu Tyr Gly Tyr Gly Ile
20 25 30
Phe Asp Thr Met Asp Glu Ala Ile Glu Ala Ser Ala Lys Ala Gln Lys
35 40 45
Glu Tyr Met Asn His Ser Met Ala Asp Arg Gln Arg Tyr Val Glu Gly
50 55 60
Ile Arg Glu Val Val Cys Thr Lys Glu Asn Leu Glu Tyr Met Ser Lys
65 70 75 80
Leu Ala Val Glu Glu Ser Gly Met Gly Ala Tyr Glu Tyr Lys Val Ile
85 90 95
Lys Asn Arg Leu Ala Ala Val Lys Ser Pro Gly Val Glu Asp Leu Thr
100 105 110
Thr Glu Ala Leu Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Cys
115 120 125
Pro Phe Gly Val Ile Gly Ala Ile Ala Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Ala Met Leu Ala Gly Gly Asn Thr Val
145 150 155 160
Val Phe Ser Pro His Pro Arg Ser Lys Gly Val Ser Ile Trp Leu Ile
165 170 175
Lys Lys Leu Asn Ala Lys Leu Glu Glu Leu Gly Ala Pro Arg Asn Leu
180 185 190
Ile Val Thr Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Ile Met Met
195 200 205
Asn His Pro Lys Val Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile
210 215 220
Val Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Val Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Ile Ala Val Asp Gln Ile Ala Asp Tyr Leu
275 280 285
Ile Phe Asn Met Lys Asn Asn Gly Ala Tyr Glu Val Lys Asp Pro Glu
290 295 300
Ile Ile Glu Lys Met Val Asp Leu Val Thr Lys Asp Arg Lys Lys Pro
305 310 315 320
Ala Val Asn Phe Val Gly Lys Ser Ala Gln Tyr Ile Leu Asp Lys Val
325 330 335
Gly Ile Lys Val Gly Pro Glu Val Lys Cys Ile Ile Met Glu Ala Pro
340 345 350
Lys Asp His Pro Phe Val Gln Ile Glu Leu Met Met Pro Ile Leu Pro
355 360 365
Ile Val Arg Val Pro Asn Val Asp Glu Ala Ile Asp Phe Ala Val Glu
370 375 380
Val Glu His Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val
385 390 395 400
Asp Lys Leu Thr Lys Met Ala Lys Glu Ile Glu Thr Thr Ile Phe Val
405 410 415
Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Met Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala
435 440 445
Lys Ser Phe Cys Arg Lys Arg Arg Cys Val Leu Gln Asp Gly Leu His
450 455 460
Ile Arg Met Lys
465
<210> 27
<211> 532
<212> PRT
<213> Vibrio sp.
<400> 27
Met Asn Glu Gln Glu Ile Ala His Ala Val Glu Asn Val Leu Ser Lys
1 5 10 15
Tyr Thr Asn Val Thr Ala Gln Asn Ala Glu Pro Val Ser Tyr Ser Ser
20 25 30
Asn Ala Ser Leu Glu Asn Ile Val Ser Gln Ala Leu Ala Gly Asn Met
35 40 45
Val Lys Gln Pro Glu Thr Gln Thr Ala Pro Asp Leu Asn Ser Asn Ile
50 55 60
Glu Asn Ile Val Ser Gln Ile Leu Ala Glu Asn Gln Ala Lys Pro Gln
65 70 75 80
Ser Val Gln Cys Gln Ser Ala Asn His Gly Thr Thr Glu Tyr Leu Gly
85 90 95
Cys Phe Ala Ser Met Glu Glu Ala Ile Ser Ala Ala Ser His Ala Gln
100 105 110
Val Gln Tyr Arg His Cys Thr Met Gly Asp Arg Ala Ser Phe Val Lys
115 120 125
Gly Ile Arg Glu Val Phe Thr Gln Asp Asp Val Leu Glu Lys Ile Ser
130 135 140
Arg Met Ala Val Glu Glu Thr Gly Met Gly Asn Tyr Ala Asp Lys Leu
145 150 155 160
Thr Lys Asn Arg Ile Ala Ala Thr Lys Thr Pro Gly Ile Glu Asp Leu
165 170 175
Thr Thr Ser Ala Leu Ser Gly Asp Ser Gly Leu Thr Leu Thr Glu Phe
180 185 190
Ser Ala Tyr Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr
195 200 205
Glu Thr Ile Ile Asn Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Thr
210 215 220
Val Val Tyr Ser Pro His Pro Arg Ser Arg Asn Val Ser Leu Val Ala
225 230 235 240
Val Asp Leu Ile Asn Arg Lys Leu Ala Glu Leu Gly Ala Pro Ala Asn
245 250 255
Leu Val Val Thr Val Leu Glu Pro Ser Ile Asp Asn Thr Asn Ala Met
260 265 270
Met Asn Asp Pro Arg Val Asn Met Leu Val Ala Thr Gly Gly Pro Ser
275 280 285
Ile Val Lys Thr Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly
290 295 300
Ala Gly Asn Pro Pro Ala Val Val Asp Glu Thr Ala Asn Ile Glu Lys
305 310 315 320
Ala Ala Lys Asp Ile Ile Asn Gly Cys Ala Phe Asp Asn Asn Leu Pro
325 330 335
Cys Ile Ala Glu Lys Glu Val Ile Val Val Asn Glu Val Ala Asp Tyr
340 345 350
Leu Ile His Cys Met Lys Lys Ser Gly Ala Tyr Leu Leu Cys Asp Lys
355 360 365
Gln Lys Ile Gln Gln Leu Gln Ser Leu Val Leu Asn Glu Lys Gly Thr
370 375 380
Gly Pro Asn Thr Ser Phe Val Gly Lys Gly Ala Arg Tyr Ile Leu Asp
385 390 395 400
Lys Leu Asn Ile Gln Val Ser Asp Asp Ile Lys Val Ile Leu Ile Glu
405 410 415
Thr Glu Arg Asn His Pro Phe Val Val His Glu Leu Met Met Pro Ile
420 425 430
Leu Pro Val Val Arg Val Glu Asn Val Asp Glu Ala Ile Asp Leu Ala
435 440 445
Ile Lys Val Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr
450 455 460
Asn Val Glu Lys Leu Ser Lys Met Ala Arg Leu Ile Gln Thr Thr Ile
465 470 475 480
Phe Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu
485 490 495
Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr
500 505 510
Ser Ala Arg Ser Phe Ala Arg Tyr Arg Arg Cys Val Met Val Glu Ala
515 520 525
Leu Asn Ile Arg
530
<210> 28
<211> 464
<212> PRT
<213> Rhodopseudomonas palustris
<400> 28
Met Val Ala Lys Ala Ile Arg Asp His Ala Gly Thr Ala Gln Pro Ser
1 5 10 15
Gly Asn Ala Ala Thr Ser Ser Ala Ala Val Ser Asp Gly Val Phe Glu
20 25 30
Thr Met Asp Ala Ala Val Glu Ala Ala Ala Leu Ala Gln Gln Gln Tyr
35 40 45
Leu Leu Cys Ser Met Ser Asp Arg Ala Arg Phe Val Gln Gly Ile Arg
50 55 60
Asp Val Ile Leu Asn Gln Asp Thr Leu Glu Lys Met Ser Arg Met Ala
65 70 75 80
Val Glu Glu Thr Gly Met Gly Asn Tyr Glu His Lys Leu Ile Lys Asn
85 90 95
Arg Leu Ala Gly Glu Lys Thr Pro Gly Ile Glu Asp Leu Thr Thr Asp
100 105 110
Ala Phe Ser Gly Asp Asn Gly Leu Thr Leu Val Glu Tyr Ser Pro Phe
115 120 125
Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile
130 135 140
Val Cys Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Ser Val Val Phe
145 150 155 160
Ser Pro His Pro Arg Ala Arg Gln Val Ser Leu Leu Leu Val Arg Leu
165 170 175
Ile Asn Gln Lys Leu Ala Ala Leu Gly Ala Pro Glu Asn Leu Val Val
180 185 190
Thr Val Glu Lys Pro Ser Ile Glu Asn Thr Asn Ala Met Met Ala His
195 200 205
Pro Lys Val Arg Met Leu Val Ala Thr Gly Gly Pro Ala Ile Val Lys
210 215 220
Ala Val Leu Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Val Val Val Asp Glu Thr Ala Asn Ile Glu Lys Ala Ala Cys
245 250 255
Asp Ile Val Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Val Ala
260 265 270
Glu Lys Glu Ile Ile Ala Val Ala Gln Ile Ala Asp Tyr Leu Ile Phe
275 280 285
Asn Leu Lys Lys Asn Gly Ala Tyr Glu Ile Lys Asp Pro Ala Val Leu
290 295 300
Gln Gln Leu Gln Asp Leu Val Leu Thr Ala Lys Gly Gly Pro Gln Thr
305 310 315 320
Lys Cys Val Gly Lys Ser Ala Val Trp Leu Leu Ser Gln Ile Gly Ile
325 330 335
Ser Val Asp Ala Ser Ile Lys Ile Ile Leu Met Glu Val Pro Arg Glu
340 345 350
His Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Leu Val
355 360 365
Arg Val Glu Thr Val Asp Asp Ala Ile Asp Leu Ala Ile Glu Val Glu
370 375 380
His Asp Asn Arg His Thr Ala Ile Met His Ser Thr Asp Val Arg Lys
385 390 395 400
Leu Thr Lys Met Ala Lys Leu Ile Gln Thr Thr Ile Phe Val Lys Asn
405 410 415
Gly Pro Ser Tyr Ala Gly Leu Gly Ala Gly Gly Glu Gly Tyr Ser Thr
420 425 430
Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Ser
435 440 445
Phe Ala Arg Arg Arg Lys Cys Val Met Val Glu Ala Leu Asn Ile Arg
450 455 460
<210> 29
<211> 468
<212> PRT
<213> Desulfatibacillum alkenivorans
<400> 29
Met Ser Val Lys Glu Phe Ala Leu Glu Asp Met Val Ala Ser Val Ile
1 5 10 15
Met Glu Met Met Asn Lys Asp Asp Asp Ser Cys Gln Pro Thr Gly Asp
20 25 30
Gly Ile Tyr Glu Thr Ile Asp Glu Ala Val Ala Lys Ala Lys Ala Ala
35 40 45
Gln Pro Arg Leu Ile Ser Leu Ser Leu Glu Lys Arg Glu Ala Ile Leu
50 55 60
Thr Ala Ile Arg Lys Ile Ser Leu Glu Lys Asn Glu Glu Trp Ala Lys
65 70 75 80
Ala Thr Val Ala Glu Thr Gly Leu Gly Arg Val Glu Asp Lys Ile Ala
85 90 95
Glu Asn Ile Leu Ala Ala Thr Lys Thr Pro Gly Thr Glu Asp Leu Asp
100 105 110
Ala Lys Ala Leu Ser Gly Asp Ala Gly Leu Thr Leu Ile Glu Tyr Ala
115 120 125
Pro Phe Gly Val Ile Gly Ser Leu Thr Pro Val Thr Asn Ala Thr Gly
130 135 140
Thr Leu Ile Asn Asn Thr Ile Ser Met Leu Ala Gly Gly Asn Thr Val
145 150 155 160
Val Tyr Asn Val His Pro Ser Ala Leu Lys Ile Ser Thr Glu Val Ile
165 170 175
Arg Thr Phe His Lys Val Ile Val Glu Asn Gly Gly Pro Glu Gly Cys
180 185 190
Val Gly Met Val Ala Thr Pro Thr Met Glu Thr Ala Gly Glu Ile Met
195 200 205
Ala His Pro Asp Ile Asn Val Leu Val Ala Thr Gly Gly Ala Gly Val
210 215 220
Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Cys Ile Arg Lys Ala
245 250 255
Ala Glu Glu Ile Ile Ala Gly His Ser Ile Asn Asn Asn Ile Phe Cys
260 265 270
Ile Ser Glu Lys Glu Val Ile Ala Val Asp Glu Val Ala Asp Asn Leu
275 280 285
Leu Lys Phe Met Glu Glu Thr Gly Lys Ala Ala Ile Leu Thr Pro Glu
290 295 300
Glu Ala Gln Lys Val Thr Glu Thr Val Ile His Asp Asn His Val Val
305 310 315 320
Lys Asp Tyr Val Gly Lys Asn Ala Ser Val Ile Ile Glu Gly Ala Gly
325 330 335
Leu Thr Arg Leu Ala Gly Lys Lys Asp Leu Arg Cys Leu Val Phe Glu
340 345 350
Ala Asp Cys Lys His Pro Met Val Trp Ile Glu Gln Met Met Pro Val
355 360 365
Leu Pro Met Val Arg Val Lys Asp Val Trp Glu Gly Ile Asp Leu Ala
370 375 380
Val Lys Val Glu Gln Gly Asn Arg His Thr Ala Met Met His Ser Thr
385 390 395 400
Asn Val Glu His Leu Thr Ala Leu Ala Arg Ala Ile Gln Thr Thr Ile
405 410 415
Phe Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly Leu Asn Gly Glu
420 425 430
Gly His Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr
435 440 445
Ser Ala Lys Ser Phe Cys Arg Gln Arg Arg Cys Val Leu Ile Asp Ser
450 455 460
Phe Arg Ile Val
465
<210> 30
<211> 469
<212> PRT
<213> Clostridium saccharobutylicum
<400> 30
Met Asn Asn Asn Leu Phe Val Ser Pro Glu Thr Lys Asp Leu Lys Leu
1 5 10 15
Arg Thr Asn Val Glu Asn Leu Lys Phe Lys Gly Cys Glu Gly Gly Ser
20 25 30
Thr Tyr Ile Gly Val Phe Glu Asn Ala Glu Thr Ala Ile Asp Glu Ala
35 40 45
Val Asn Ala Gln Lys Arg Leu Ser Leu Tyr Tyr Thr Lys Glu Gln Arg
50 55 60
Glu Lys Ile Ile Thr Glu Ile Arg Lys Val Thr Leu Lys Asn Lys Glu
65 70 75 80
Ile Leu Ala Gln Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu
85 90 95
Asp Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr
100 105 110
Glu Asp Leu Ala Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val
115 120 125
Val Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ala Ser
145 150 155 160
Gly Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val
165 170 175
Ala Phe Ala Val Asp Met Ile Asn Arg Ala Ile Ile Ser Cys Gly Gly
180 185 190
Pro Arg Asn Leu Val Thr Ala Ile Lys Asn Pro Thr Met Glu Ser Leu
195 200 205
Asp Ala Ile Ile Lys His Pro Ala Ile Lys Leu Leu Cys Gly Thr Gly
210 215 220
Gly Pro Gly Met Val Lys Thr Leu Leu Ser Ser Gly Lys Lys Ser Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp
245 250 255
Ile Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val
275 280 285
Ala Asp Asp Leu Ile Lys Asn Met Leu Lys Asn Asn Ala Val Ile Ile
290 295 300
Asn Lys Asp Gln Val Ser Arg Leu Val Asn Leu Val Leu Gln Lys Asn
305 310 315 320
Asn Glu Thr Ser Glu Tyr Thr Ile Asn Lys Lys Trp Val Gly Lys Asp
325 330 335
Ala Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Ser Ser Asp Val
340 345 350
Arg Cys Ile Ile Cys Glu Val Asp Ala Asp His Pro Phe Val Met Thr
355 360 365
Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp
370 375 380
Glu Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser
385 390 395 400
Ala Tyr Ile Tyr Ser Lys Asn Ile Glu Asn Leu Asn Arg Phe Glu Lys
405 410 415
Glu Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly
420 425 430
Val Gly Tyr Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys
435 440 445
Thr Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg
450 455 460
Cys Val Phe Val Gly
465
<210> 31
<211> 468
<212> PRT
<213> Clostridium sp.
<400> 31
Met Asn Lys Asp Thr Thr Ile Ser Glu Thr Glu Asn Leu Lys Phe Lys
1 5 10 15
Thr Asn Ile Lys Asn Ala Asp Leu Lys Asn Tyr Glu Asn Ser Thr Ser
20 25 30
Tyr Ser Gly Val Phe Glu Asp Val Glu Val Ala Ile Asn Lys Ala Ile
35 40 45
Thr Ala Gln Lys Glu Phe Ser Leu Tyr Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Leu Thr Glu Ile Arg Lys Ala Thr Leu Lys Asn Lys Lys Ile
65 70 75 80
Leu Ala Lys Met Ile Leu Asp Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Ile Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ala Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Ser Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Asp Met Ile Asn Lys Ala Ile Val Ser Cys Gly Gly Pro
180 185 190
Lys Asn Leu Ile Thr Ala Val Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Glu Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Asp Asn Val Ala
275 280 285
Asp Asn Leu Ile Asp Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Lys Asp Lys Ile Thr Lys Leu Leu Asn Leu Ile Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Asn Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asn Glu Ile Asp Val Glu Ala Pro Ser Ser Val Arg
340 345 350
Cys Ile Ile Cys Glu Val Glu Pro Asp His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asn Ile Asp Asp
370 375 380
Ala Ile Gln Tyr Ala Lys Ile Ala Glu Gln Ser Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Asn Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 32
<211> 467
<212> PRT
<213> Clostridium taeniosporum
<400> 32
Met Glu Arg Asn Leu Ser Val Leu Ser Gln Lys Lys Asn Leu Lys Ile
1 5 10 15
Thr Arg Lys Val Glu Gly Asn Lys Ser Ile Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Glu Lys Val Asp Asn Ala Ile Thr Lys Ala Ile Tyr Ala
35 40 45
Gln Arg Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Glu Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Ile Ile Lys Cys Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Asp Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Val Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Lys His
245 250 255
Ala Ala Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Leu Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asp Asp
275 280 285
Leu Ile Gln Asn Met Leu Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Glu Val Ser Lys Leu Leu Asp Leu Val Leu Ile Glu Lys Lys Asp Glu
305 310 315 320
Pro Ser Gly Tyr Val Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Lys Lys Val Ser Asp Asp Val Lys Cys
340 345 350
Ile Ile Cys Glu Val Asp Val Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Ala Ile Ala Arg Val Lys Asp Ile Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Gly Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 33
<211> 467
<212> PRT
<213> Clostridium botulinum
<400> 33
Met Glu Arg Asn Leu Ser Val Leu Ser Gln Thr Asn Asp Leu Lys Ile
1 5 10 15
Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ala
35 40 45
Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Lys Ser Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Val Ile Arg Glu Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asp Lys
245 250 255
Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Leu Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp
275 280 285
Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu
305 310 315 320
Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Ile Lys Ala Ser Asp Asn Val Arg Cys
340 345 350
Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 34
<211> 467
<212> PRT
<213> Clostridium botulinum
<400> 34
Met Lys Arg Asn Leu Ser Val Leu Leu Gln Thr Asn Asp Leu Lys Ile
1 5 10 15
Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ala
35 40 45
Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Lys Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Val Ile Lys Ala Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asn Lys
245 250 255
Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Ser Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp
275 280 285
Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu
305 310 315 320
Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Ile Lys Ser Ser Asp Asn Val Arg Cys
340 345 350
Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 35
<211> 467
<212> PRT
<213> Clostridium botulinum
<400> 35
Met Lys Arg Asn Leu Ser Val Leu Leu Gln Thr Asn Asp Leu Lys Ile
1 5 10 15
Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Glu Ala Ile Tyr Ala
35 40 45
Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Lys Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Val Ile Lys Ala Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asn Lys
245 250 255
Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Ser Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp
275 280 285
Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu
305 310 315 320
Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Ile Lys Ser Ser Asp Asn Val Arg Cys
340 345 350
Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 36
<211> 467
<212> PRT
<213> Clostridium botulinum
<400> 36
Met Lys Arg Asn Leu Ser Val Leu Leu Gln Thr Asn Asp Leu Lys Ile
1 5 10 15
Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ser
35 40 45
Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Lys Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Val Ile Lys Ala Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asn Lys
245 250 255
Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Ser Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp
275 280 285
Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu
305 310 315 320
Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Ile Lys Ser Ser Asp Asn Val Arg Cys
340 345 350
Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 37
<211> 472
<212> PRT
<213> Clostridium beijerinckii
<400> 37
Met Asp Val Asp Val Val Leu Val Glu Lys Leu Val Arg Gln Ala Ile
1 5 10 15
Glu Glu Val Lys Asn Lys Asn Leu Leu Asn Leu Asp Lys Phe Glu Ser
20 25 30
Val Lys Asn Tyr Gly Ile Phe Gly Thr Met Asp Ala Ala Val Glu Ala
35 40 45
Ser Phe Val Ala Gln Lys Gln Leu Leu Asn Ala Ser Met Thr Asp Lys
50 55 60
Gln Lys Tyr Val Asp Thr Ile Lys Ala Thr Ile Leu Lys Lys Glu Asn
65 70 75 80
Leu Glu Leu Ile Ser Arg Met Ser Val Glu Glu Thr Glu Ile Gly Lys
85 90 95
Tyr Glu His Lys Leu Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro
100 105 110
Gly Ile Glu Asp Leu Thr Thr Glu Ala Met Thr Gly Asp Asn Gly Leu
115 120 125
Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro
130 135 140
Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile
145 150 155 160
Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Asn
165 170 175
Val Ser Ile Lys Leu Val Thr Met Leu Asn Lys Ala Leu Glu Glu Ala
180 185 190
Gly Ala Pro Asp Asn Leu Ile Ala Thr Val Lys Glu Pro Ser Ile Glu
195 200 205
Asn Thr Asn Ile Met Met Glu His Pro Lys Ile Arg Met Leu Val Ala
210 215 220
Thr Gly Gly Pro Ala Ile Val Asn Lys Val Met Ser Thr Gly Lys Lys
225 230 235 240
Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr
245 250 255
Ala Asp Ile Glu Lys Ala Ala Ile Asp Ile Val Asn Gly Cys Ser Phe
260 265 270
Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp
275 280 285
Gln Val Cys Asp Tyr Leu Ile His Tyr Met Lys Leu Asn Gly Ala Tyr
290 295 300
Glu Ile Lys Asp Arg Asp Leu Ile Gln Lys Leu Leu Asp Leu Val Thr
305 310 315 320
Asn Glu Asn Gly Gly Pro Lys Val Ser Phe Val Gly Lys Ser Ala Pro
325 330 335
Tyr Ile Leu Asn Lys Leu Gly Ile Ser Val Asp Glu Asn Ile Lys Val
340 345 350
Ile Ile Met Glu Val Glu Lys Asn His His Phe Val Leu Glu Glu Met
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Thr Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Tyr Val Ala Glu His Gly Asn Arg His Thr Ala Ile
385 390 395 400
Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Arg Leu Leu
405 410 415
Glu Thr Thr Ile Phe Val Lys Asn Ser Pro Ser Tyr Ala Gly Ile Gly
420 425 430
Val Gly Gly Glu Gly Thr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val
450 455 460
Met Val Asp Ala Phe Asn Ile Arg
465 470
<210> 38
<211> 468
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 38
Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 39
<211> 468
<212> PRT
<213> Clostridium sp.
<400> 39
Met Ile Lys Asp Thr Leu Val Ser Val Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Cys Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 40
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 40
Met Ile Lys Asp Thr Leu Val Ser Val Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Thr Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Ala Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Asn Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Leu Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Val Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asn
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Glu Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Ile Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 41
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 41
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Asn Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Ile Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Leu Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Ser Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Ile Lys
340 345 350
Cys Ile Val Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Val Lys Tyr Thr Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 42
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 42
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 43
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 43
Met Ile Lys Asp Thr Leu Val Ser Val Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
Gln Ala Gln Lys Ile Leu Ser Ile His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 44
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 44
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Ile Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Ile Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Glu Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Arg Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 45
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 45
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Asp Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Ile His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Ala
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Ser Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 46
<211> 468
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 46
Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 47
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 47
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 48
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 48
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Asn Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Ile Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Leu Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Ser Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Ile Lys
340 345 350
Cys Ile Val Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Val Lys Tyr Thr Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 49
<211> 468
<212> PRT
<213> Clostridium sp.
<400> 49
Met Asn Lys Asp Thr Thr Ile Ser Glu Thr Glu Asn Leu Lys Phe Lys
1 5 10 15
Thr Asn Ile Lys Asn Ala Asp Leu Lys Asn Tyr Glu Asn Ser Thr Ser
20 25 30
Tyr Ser Gly Val Phe Glu Asp Val Glu Val Ala Ile Asn Lys Ala Ile
35 40 45
Thr Ala Gln Lys Glu Phe Ser Leu Tyr Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Leu Thr Glu Ile Arg Lys Ala Thr Leu Lys Asn Lys Lys Ile
65 70 75 80
Leu Ala Lys Met Ile Leu Asp Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Ile Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ala Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Ser Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Asp Met Ile Asn Lys Ala Ile Val Ser Cys Gly Gly Pro
180 185 190
Lys Asn Leu Ile Thr Ala Val Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Glu Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Asp Asn Val Ala
275 280 285
Asp Asn Leu Ile Asp Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Lys Asp Lys Ile Thr Lys Leu Leu Asn Leu Ile Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Asn Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asn Glu Ile Asp Val Glu Ala Pro Ser Ser Val Arg
340 345 350
Cys Ile Ile Cys Glu Val Glu Pro Asp His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asn Ile Asp Asp
370 375 380
Ala Ile Gln Tyr Ala Lys Ile Ala Glu Gln Ser Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Asn Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 50
<211> 469
<212> PRT
<213> Clostridium saccharobutylicum
<400> 50
Met Asn Asn Asn Leu Phe Val Ser Pro Glu Thr Lys Asp Leu Lys Leu
1 5 10 15
Arg Thr Asn Val Glu Asn Leu Lys Phe Lys Gly Cys Glu Gly Gly Ser
20 25 30
Thr Tyr Ile Gly Val Phe Glu Asn Ala Glu Thr Ala Ile Asp Glu Ala
35 40 45
Val Asn Ala Gln Lys Arg Leu Ser Leu Tyr Tyr Thr Lys Glu Gln Arg
50 55 60
Glu Lys Ile Ile Thr Glu Ile Arg Lys Val Thr Leu Lys Asn Lys Glu
65 70 75 80
Ile Leu Ala Gln Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu
85 90 95
Asp Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr
100 105 110
Glu Asp Leu Ala Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val
115 120 125
Val Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ala Ser
145 150 155 160
Gly Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val
165 170 175
Ala Phe Ala Val Asp Met Ile Asn Arg Ala Ile Ile Ser Cys Gly Gly
180 185 190
Pro Arg Asn Leu Val Thr Ala Ile Lys Asn Pro Thr Met Glu Ser Leu
195 200 205
Asp Ala Ile Ile Lys His Pro Ala Ile Lys Leu Leu Cys Gly Thr Gly
210 215 220
Gly Pro Gly Met Val Lys Thr Leu Leu Ser Ser Gly Lys Lys Ser Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp
245 250 255
Ile Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val
275 280 285
Ala Asp Asp Leu Ile Lys Asn Met Leu Lys Asn Asn Ala Val Ile Ile
290 295 300
Asn Lys Asp Gln Val Ser Arg Leu Val Asn Leu Val Leu Gln Lys Asn
305 310 315 320
Asn Glu Thr Ser Glu Tyr Thr Ile Asn Lys Lys Trp Val Gly Lys Asp
325 330 335
Ala Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Ser Ser Asp Val
340 345 350
Arg Cys Ile Ile Cys Glu Val Asp Ala Asp His Pro Phe Val Met Thr
355 360 365
Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp
370 375 380
Glu Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser
385 390 395 400
Ala Tyr Ile Tyr Ser Lys Asn Ile Glu Asn Leu Asn Arg Phe Glu Lys
405 410 415
Glu Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly
420 425 430
Val Gly Tyr Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys
435 440 445
Thr Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg
450 455 460
Cys Val Phe Val Gly
465
<210> 51
<211> 467
<212> PRT
<213> Clostridium botulinum
<400> 51
Met Glu Arg Asn Leu Ser Val Leu Ser Gln Thr Asn Asp Leu Lys Ile
1 5 10 15
Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ala
35 40 45
Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Lys Ser Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Val Ile Arg Glu Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asp Lys
245 250 255
Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Leu Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp
275 280 285
Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu
305 310 315 320
Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Ile Lys Ala Ser Asp Asn Val Arg Cys
340 345 350
Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 52
<211> 527
<212> PRT
<213> Caldalkalibacillus thermarum
<400> 52
Met Asn Met Thr Glu Lys Asp Ile Glu Lys Ile Val Gln Ser Val Leu
1 5 10 15
His Asn Val Glu Ser Ala Leu Gly Lys Ser Ala Ser Ala Ser Pro Ser
20 25 30
Val Ser Ala Val Ser Val Ala Ser Gly Glu Gly Ile Lys Pro Val Gln
35 40 45
Phe Lys Gln Val Pro Val Phe Gln Gln Glu Thr Val Lys Ser Pro Asn
50 55 60
Arg Asn Arg Asn Leu Gly Gly Ala Glu Glu Lys Trp Gly Val Phe Asn
65 70 75 80
His Met Glu Asp Ala Ile Glu Ala Ser Tyr Arg Ala Gln Met Glu Phe
85 90 95
Val Lys His Phe Gln Leu Lys Asp Arg Glu Lys Ile Ile Thr Ala Ile
100 105 110
Arg Glu Ala Val Leu Arg Glu Lys Glu Val Leu Ala Arg Lys Val Tyr
115 120 125
Glu Glu Thr Lys Ile Gly Arg Tyr Glu Asp Lys Val Ala Lys His Glu
130 135 140
Leu Ala Ala Leu Lys Thr Pro Gly Thr Glu Asp Leu Lys Thr Glu Ala
145 150 155 160
Phe Ser Gly Asp Asn Gly Leu Thr Ile Val Glu Arg Ala Pro Tyr Gly
165 170 175
Leu Ile Gly Ala Val Thr Pro Val Thr Asn Pro Thr Glu Thr Ile Ile
180 185 190
Asn Asn Ala Ile Gly Met Leu Ala Ala Gly Asn Ala Val Val Phe Asn
195 200 205
Val His Pro Ser Ser Lys Arg Ser Cys Ala Tyr Ala Val Gln Leu Ile
210 215 220
Asn Lys Ala Ile Thr Glu Ala Gly Gly Pro His His Leu Val Thr Met
225 230 235 240
Val Lys Glu Pro Thr Leu Asp Thr Leu Gln Thr Leu Ile Asp Ser Pro
245 250 255
Lys Val Lys Leu Leu Val Gly Thr Gly Gly Pro Gly Leu Val Gln Thr
260 265 270
Leu Leu Lys Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro
275 280 285
Pro Val Ile Val Asp Asp Thr Ala Asp Leu Glu His Ala Ala Arg Ser
290 295 300
Ile Ile Glu Gly Ala Ala Phe Asp Asn Asn Leu Leu Cys Ile Ala Glu
305 310 315 320
Lys Glu Val Phe Val Leu Glu Ser Val Ala Asp Asp Leu Ile Phe His
325 330 335
Met Leu Asn His Gly Ala Tyr Met Leu Gly Gln His Glu Val Glu Gln
340 345 350
Val Met Ala Phe Ala Leu Glu Glu Gln Gly Asn Glu Gln Asn Arg Gly
355 360 365
Cys Gly Phe Asn Pro Gln Arg His Tyr Gln Val Ser Lys Asp Trp Ile
370 375 380
Gly Gln Asp Ala Arg Leu Phe Leu Glu His Ile Gly Val Gln Pro Pro
385 390 395 400
Thr Glu Val Lys Leu Leu Ile Cys Asp Val Glu Phe Asp His Pro Phe
405 410 415
Val Gln Leu Glu Gln Met Met Pro Val Leu Pro Ile Val Arg Val Lys
420 425 430
Thr Leu Asp Glu Ala Ile Glu Lys Ala Val Met Ala Glu His Gly Asn
435 440 445
Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp His Leu Thr Lys
450 455 460
Phe Ala Arg Ala Ile Gln Thr Thr Leu Phe Val Lys Asn Ala Ser Ser
465 470 475 480
Leu Ala Gly Val Gly Tyr Gly Gly Glu Gly His Thr Thr Met Thr Ile
485 490 495
Ala Gly Pro Thr Gly Glu Gly Val Thr Ser Ala Lys Thr Phe Thr Arg
500 505 510
Glu Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg Ile Ile Gly
515 520 525
<210> 53
<211> 480
<212> PRT
<213> Pelosinus fermentans
<400> 53
Met Ser Ile Asp Gln Ala Leu Ile Glu Lys Ile Thr Leu Glu Ile Leu
1 5 10 15
Thr Lys Met Gln Thr Gly Ala Lys Ala Ala Pro Ala Gly Tyr Gly Asp
20 25 30
Gly Ile Phe Glu Thr Val Asp Glu Ala Val Ala Ala Ala Arg Lys Ala
35 40 45
Tyr Gln Glu Leu Lys Thr Leu Ser Leu Glu Lys Arg Glu Val Leu Ile
50 55 60
Lys Ala Met Arg Asp Val Ala Tyr Glu Asn Ala Thr Ile Leu Ala Gln
65 70 75 80
Met Ala Val Asp Glu Ser Gly Met Gly Arg Val Ser Asp Lys Ile Ile
85 90 95
Lys Asn Gln Val Ala Ala Leu Lys Thr Pro Gly Thr Glu Asp Leu Thr
100 105 110
Thr Gln Ala Trp Ser Gly Asp Asn Gly Leu Thr Leu Ile Glu Met Gly
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Val Ile Cys Asn Gly Ile Gly Met Ile Ala Ala Gly Asn Thr Val
145 150 155 160
Phe Phe Ser Pro His Pro Thr Ala Lys Asn Thr Ser Met Lys Ile Ile
165 170 175
Thr Leu Leu Asn Gln Ala Ile Val Lys Ala Gly Gly Pro Asn Asn Leu
180 185 190
Leu Thr Ser Val Ala Asn Pro Ser Ile Lys Ala Ala Asn Glu Met Met
195 200 205
Lys His Pro Gly Ile Asn Met Leu Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Ile Ala Ile Gly Ser Ile Ala Asp Arg Leu
275 280 285
Ile Thr Tyr Met Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Ser Asn
290 295 300
Ile Asp Arg Leu Leu Asp Val Ile Met Thr Val Gln Glu Glu Lys Ile
305 310 315 320
Ala Glu Gly Cys Thr Asp Lys Pro Lys Arg Ser Tyr Gly Ile Asn Lys
325 330 335
Asp Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Ser Lys Ile Gly Ile
340 345 350
Asp Val Pro Asp Ser Val Arg Val Val Leu Cys Glu Thr Pro Ala Asp
355 360 365
His Pro Phe Val Ile Glu Glu Leu Met Met Pro Val Leu Pro Val Val
370 375 380
Gln Val Lys Asp Ile Asp Glu Ala Ile Glu Val Ala Val Arg Val Glu
385 390 395 400
His Gly Asn Arg His Thr Ala Ala Met His Ser Lys Asn Val Asp His
405 410 415
Leu Thr Arg Phe Ala Arg Ala Val Glu Thr Thr Ile Phe Val Lys Asn
420 425 430
Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Ser
435 440 445
Phe Thr Leu Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Pro Arg Ser
450 455 460
Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Ser Ile Val
465 470 475 480
<210> 54
<211> 479
<212> PRT
<213> Thermoanaerobacterium thermosaccharolyticum
<400> 54
Met Glu Ile Asn Asp Asn Met Ile Ser Glu Ile Ile Glu Arg Val Leu
1 5 10 15
Lys Glu Val Gln Lys Lys Ser Ile Asn Asp Arg Tyr Gln Asn Gly Ile
20 25 30
Tyr Asp Arg Met Glu Asp Ala Ile Glu Ala Ala Tyr Glu Ala Gln Lys
35 40 45
Lys Leu Met Lys Met Ser Ile Glu Gln Arg Glu Arg Leu Ile Ser Ala
50 55 60
Met Arg Lys Ala Ile Leu Asp Asn Ala Lys Ser Cys Ala Lys Leu Ser
65 70 75 80
Val Glu Glu Thr Gly Met Gly Arg Val Asp His Lys Tyr Leu Lys Leu
85 90 95
Lys Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Val Leu Thr Thr Lys
100 105 110
Ala Tyr Ser Gly Asp Lys Gly Leu Thr Leu Val Glu Met Ala Pro Phe
115 120 125
Gly Val Ile Gly Ser Ile Thr Pro Ser Thr Asn Pro Ala Glu Thr Val
130 135 140
Cys Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Thr Val Val Phe
145 150 155 160
Ser Pro His Pro Gly Ala Ile Lys Ser Ser Leu Met Ala Val Glu Phe
165 170 175
Leu Asn Lys Ala Ile Ile Glu Ala Gly Gly Pro Glu Asn Leu Ile Thr
180 185 190
Ser Val Arg Lys Pro Ser Ile Glu Phe Thr Asp Val Met Ile Asn His
195 200 205
Pro Lys Ile Asn Leu Leu Val Ala Thr Gly Gly Pro Ala Ile Val Lys
210 215 220
Lys Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Cys Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala Arg
245 250 255
Asp Ile Ile Leu Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala
260 265 270
Glu Lys Glu Val Ile Ala Val Glu Ser Ile Tyr Glu Glu Leu Ile Glu
275 280 285
Asn Met Lys Lys Asn Gly Ala Tyr Glu Ile Thr Asp Asp Glu Ala Glu
290 295 300
Lys Leu Ala Asp Ile Val Leu Thr Lys Lys Glu Glu Leu Lys Ala Glu
305 310 315 320
Gly Cys Ser Ile Asn Arg Pro Lys Phe Glu Tyr Ser Val Asn Lys Lys
325 330 335
Trp Val Gly Lys Asp Ala Lys Val Leu Leu Glu Gln Ile Gly Ile Asn
340 345 350
Val Gly Asp Asp Ile Val Cys Ile Ile Tyr Arg Cys Asp Lys Gln His
355 360 365
Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Ile Val Lys
370 375 380
Val Lys Asn Ile Asp Glu Ala Ile Asn Val Ala Val Glu Val Glu His
385 390 395 400
Gly Asn His His Thr Ala Glu Met His Ser Lys Asn Ile Asp Asn Leu
405 410 415
Thr Arg Phe Ala Lys Ala Ile Asn Thr Thr Ile Phe Val Lys Asn Ala
420 425 430
Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly Tyr Thr Thr Phe
435 440 445
Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Cys Ala Ala Thr Phe
450 455 460
Thr Arg Gln Arg Arg Cys Val Met Val Asp Ser Phe Arg Ile Val
465 470 475
<210> 55
<211> 480
<212> PRT
<213> Pelosinus fermentans
<400> 55
Met Ser Ile Asp Gln Ala Leu Ile Glu Lys Ile Thr Leu Glu Ile Leu
1 5 10 15
Thr Lys Met Gln Thr Gly Ala Lys Ala Ala Pro Ala Gly Tyr Gly Asp
20 25 30
Gly Ile Phe Glu Thr Val Asp Glu Ala Val Ala Ala Ala Arg Lys Ala
35 40 45
Tyr Gln Glu Leu Lys Thr Leu Ser Leu Glu Lys Arg Glu Val Leu Ile
50 55 60
Lys Ala Met Arg Asp Val Ala Tyr Glu Asn Ala Thr Ile Leu Ala Gln
65 70 75 80
Met Ala Val Asp Glu Ser Gly Met Gly Arg Val Ser Asp Lys Ile Ile
85 90 95
Lys Asn Gln Val Ala Ala Leu Lys Thr Pro Gly Thr Glu Asp Leu Thr
100 105 110
Thr Gln Ala Trp Ser Gly Asp Asn Gly Leu Thr Leu Ile Glu Met Gly
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Val Ile Cys Asn Gly Ile Gly Met Ile Ala Ala Gly Asn Thr Val
145 150 155 160
Phe Phe Ser Pro His Pro Thr Ala Lys Asn Thr Ser Met Lys Ile Ile
165 170 175
Thr Leu Leu Asn Gln Ala Ile Val Lys Ala Gly Gly Pro Asn Asn Leu
180 185 190
Leu Thr Ser Val Ala Asn Pro Ser Ile Lys Ala Ala Asn Glu Met Met
195 200 205
Lys His Pro Gly Ile Asn Met Leu Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Ile Ala Ile Gly Ser Ile Ala Asp Arg Leu
275 280 285
Ile Thr Tyr Met Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Ser Asn
290 295 300
Ile Asp Arg Leu Leu Asn Val Ile Met Thr Val Gln Glu Glu Lys Ile
305 310 315 320
Ala Glu Gly Cys Thr Asp Lys Pro Lys Arg Ser Tyr Gly Ile Asn Lys
325 330 335
Asp Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Ser Lys Ile Gly Ile
340 345 350
Asp Val Pro Asp Ser Val Arg Val Val Leu Cys Glu Thr Pro Ala Asp
355 360 365
His Pro Phe Val Ile Glu Glu Leu Met Met Pro Val Leu Pro Val Val
370 375 380
Gln Val Lys Asp Ile Asp Glu Ala Ile Glu Val Ala Val Arg Val Glu
385 390 395 400
His Gly Asn Arg His Thr Ala Ala Met His Ser Lys Asn Val Asp His
405 410 415
Leu Thr Arg Phe Ala Arg Ala Val Glu Thr Thr Ile Phe Val Lys Asn
420 425 430
Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Ser
435 440 445
Phe Thr Leu Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Pro Arg Ser
450 455 460
Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Ser Ile Val
465 470 475 480
<210> 56
<211> 479
<212> PRT
<213> Desulfosporosinus sp.
<400> 56
Met Ser Val Asp Gln Ala Leu Ile Arg Lys Ile Thr Ser Glu Ile Leu
1 5 10 15
Ala Lys Met Gln Asn Arg Thr Val Ser Ala Cys Gln Asp Cys Asn Gly
20 25 30
Ile Phe Thr Thr Val Asp Glu Ala Val Ala Ala Ala Arg Ile Ala Tyr
35 40 45
Gln Glu Leu Arg Thr Leu Ser Leu Glu Lys Arg Glu Glu Leu Ile Lys
50 55 60
Ala Met Arg Asn Val Ala Leu Glu Asn Ala Thr Met Leu Ala Glu Met
65 70 75 80
Ala Val Lys Glu Ser Gly Met Gly Arg Val Glu Asp Lys Ile Ile Lys
85 90 95
His Lys Leu Val Ala Val Lys Thr Pro Gly Thr Glu Asp Leu Arg Thr
100 105 110
Glu Ala Trp Ser Gly Asp Ser Gly Leu Thr Leu Val Glu Met Gly Pro
115 120 125
Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Val Ala Thr
130 135 140
Ile Ile Cys Asn Gly Ile Gly Met Ile Ala Ala Gly Asn Ala Val Phe
145 150 155 160
Phe Ser Pro His Pro Thr Ala Lys Asn Thr Ser Ile Lys Thr Ile Thr
165 170 175
Leu Leu Asn Glu Ala Ile Val Lys Ala Gly Gly Pro Met Asn Leu Leu
180 185 190
Thr Ser Val Ala Asp Pro Ser Ile Ser Ala Ala Asn Ala Met Met Lys
195 200 205
His Ala Gly Ile Asn Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val
210 215 220
Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly
225 230 235 240
Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
245 250 255
Arg Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
260 265 270
Ala Glu Lys Glu Val Ile Ala Val Gly Cys Ile Ala Asp Arg Leu Ile
275 280 285
Ser Asn Met Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Ser Lys Ile
290 295 300
Asp Gln Met Leu Asp Val Val Met Thr Ala Thr Glu Glu Lys Met Ala
305 310 315 320
Glu Gly Cys Thr Ala Lys Pro Ile Lys Arg Tyr Gly Ile Asn Lys Asp
325 330 335
Phe Val Gly Lys Asp Ala Lys Tyr Ile Leu Thr Gln Ile Gly Leu Asp
340 345 350
Val Pro Asp Thr Ile Lys Val Ile Leu Cys Glu Thr Pro Ala Asp His
355 360 365
Pro Phe Val Ile Glu Glu Leu Met Met Pro Ile Leu Pro Val Val Gln
370 375 380
Val Lys Asp Ile Asp Ala Ala Ile Glu Leu Ala Val Lys Val Glu His
385 390 395 400
Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val Asp Asn Met
405 410 415
Thr Arg Phe Ala Lys Ala Ile Glu Thr Thr Ile Phe Val Lys Asn Ala
420 425 430
Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Cys Thr Phe
435 440 445
Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Thr Ala Arg Ser Phe
450 455 460
Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ser Phe Ser Ile Ile
465 470 475
<210> 57
<211> 482
<212> PRT
<213> Clostridium methylpentosum
<400> 57
Met Glu Ile Thr Pro Asn Gln Ile Asp Gln Ile Val Ala Asn Val Met
1 5 10 15
Ala Gln Leu Gly Gly Ser Ala Ala Pro Ala Ala Ser Tyr Asp Ser Thr
20 25 30
Gln Tyr Ser Gly Arg Lys Tyr Ile Gly Ile Tyr Ala Thr Met Thr Glu
35 40 45
Ala Ile Asp Ala Val Ala Asp Ala Tyr Lys Val Leu Arg Ser Met Thr
50 55 60
Val Asp Gln Arg Glu Lys Ile Ile Glu Lys Ile Arg Glu Phe Thr Arg
65 70 75 80
Ala Glu Ala Glu Ile Met Ala Lys Met Gly Val Glu Glu Thr Gly Met
85 90 95
Gly Lys Val Glu His Lys Thr Leu Lys His His Leu Val Ala Asp Lys
100 105 110
Thr Pro Gly Thr Glu Asp Ile Gln Thr Glu Ala Met Ser Gly Asp Gly
115 120 125
Gly Leu Thr Leu Leu Glu Met Ala Pro Phe Gly Ile Ile Gly Ala Ile
130 135 140
Ser Pro Ser Thr Asn Pro Ser Glu Thr Val Leu Cys Asn Ser Met Gly
145 150 155 160
Met Ile Ala Gly Ala Asn Ala Val Val Phe Asn Pro His Pro Ser Ala
165 170 175
Ile Cys Thr Ser Asn Tyr Ala Val Asp Leu Val Asn Arg Ala Ser Leu
180 185 190
Ala Ala Gly Gly Pro Ala Asn Leu Cys Cys Ser Val Val Lys Pro Thr
195 200 205
Met Gln Ser Ala Asp Asp Met Val Lys Asp Pro Arg Val Lys Met Leu
210 215 220
Val Cys Thr Gly Gly Pro Gly Val Val Arg Ala Met Leu Ser Ser Gly
225 230 235 240
Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp
245 250 255
Asp Thr Ala Asp Ile Arg Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys
260 265 270
Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Ala
275 280 285
Phe Ser Asn Ile Ala Asp Glu Leu Met Tyr Tyr Met Gln Gln Asn Gly
290 295 300
Ala Tyr Phe Ile Ser Gly Glu Met Ala Asp Arg Leu Ala Lys Ile Val
305 310 315 320
Leu Val Glu Lys Lys Asn Glu Lys Thr Gly Lys Ile Ser Tyr Ser Val
325 330 335
Ser Arg Asp Trp Val Gly Arg Asp Ala Lys Lys Phe Leu Ala Ala Leu
340 345 350
Asp Ile Glu Val Gly Asp Asp Val Arg Cys Val Ile Cys Glu Thr Asp
355 360 365
Glu Asn His Leu Phe Val Gln Thr Glu Leu Met Met Pro Ile Leu Pro
370 375 380
Ile Val Arg Val Asn Asn Ile Asp Glu Ala Val Arg Met Ala Val Arg
385 390 395 400
Ala Glu His Gly Asn Arg His Thr Ala His Met His Ser Lys Asn Ile
405 410 415
Asp Asn Leu Thr Lys Phe Ala Arg Ala Val Glu Thr Thr Ile Phe Val
420 425 430
Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Ser Glu Gly His
435 440 445
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala
450 455 460
Arg Ser Phe Thr Arg Lys Arg Arg Cys Val Met Ser Asp Ser Phe Asn
465 470 475 480
Ile Val
<210> 58
<211> 467
<212> PRT
<213> Thermoanaerobacterium saccharolyticum
<400> 58
Met Lys Val Lys Glu Glu Asp Ile Glu Ala Ile Val Lys Lys Val Leu
1 5 10 15
Ser Glu Phe Asn Phe Glu Lys Asn Thr Lys Ser Phe Arg Asp Phe Gly
20 25 30
Val Phe Gln Asp Met Asn Asp Ala Ile Arg Ala Ala Lys Asp Ala Gln
35 40 45
Lys Lys Leu Arg Asn Met Ser Met Glu Ser Arg Glu Lys Ile Ile Gln
50 55 60
Asn Ile Arg Lys Lys Ile Met Glu Asn Lys Lys Ile Leu Ala Glu Met
65 70 75 80
Gly Val Ser Glu Thr Gly Met Gly Lys Val Glu His Lys Ile Ile Lys
85 90 95
His Glu Leu Val Ala Leu Lys Thr Pro Gly Thr Glu Asp Ile Val Thr
100 105 110
Thr Ala Trp Ser Gly Asp Lys Gly Leu Thr Leu Val Glu Met Gly Pro
115 120 125
Phe Gly Val Ile Gly Thr Ile Thr Pro Ser Thr Asn Pro Ser Glu Thr
130 135 140
Val Leu Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Val Val
145 150 155 160
Phe Asn Pro His Pro Gly Ala Val Asn Val Ser Asn Tyr Ala Val Lys
165 170 175
Leu Val Asn Glu Ala Val Met Glu Ala Gly Gly Pro Glu Asn Leu Val
180 185 190
Ala Ser Val Glu Lys Pro Thr Leu Glu Thr Gly Asn Ile Met Phe Lys
195 200 205
Ser Pro Asp Val Ser Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val
210 215 220
Thr Ser Val Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly
225 230 235 240
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala
245 250 255
Lys Asp Ile Val Asp Gly Ala Thr Phe Asp Asn Asn Leu Pro Cys Ile
260 265 270
Ala Glu Lys Glu Val Val Ser Val Asp Lys Ile Thr Asp Glu Leu Ile
275 280 285
Tyr Tyr Met Gln Gln Asn Gly Cys Tyr Lys Ile Glu Gly Arg Glu Ile
290 295 300
Glu Lys Leu Ile Glu Leu Val Leu Asp His Lys Gly Gly Lys Ile Thr
305 310 315 320
Leu Asn Arg Lys Trp Val Gly Lys Asp Ala His Leu Ile Leu Lys Ala
325 330 335
Ile Gly Ile Asp Ala Asp Glu Ser Val Arg Cys Ile Ile Phe Glu Ala
340 345 350
Glu Lys Asp Asn Pro Leu Val Val Glu Glu Leu Met Met Pro Ile Leu
355 360 365
Gly Ile Val Arg Ala Lys Asn Val Asp Glu Ala Ile Met Ile Ala Thr
370 375 380
Glu Leu Glu His Gly Asn Arg His Ser Ala His Met His Ser Lys Asn
385 390 395 400
Val Asp Asn Leu Thr Lys Phe Gly Lys Ile Ile Asp Thr Ala Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ala Ala Leu Gly Tyr Gly Gly Glu Gly
420 425 430
Tyr Cys Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser
435 440 445
Ala Arg Thr Phe Thr Lys Ser Arg Arg Cys Val Leu Ala Asp Gly Leu
450 455 460
Ser Ile Arg
465
<210> 59
<211> 467
<212> PRT
<213> Thermoanaerobacterium xylanolyticum
<400> 59
Met Lys Val Lys Glu Glu Asp Ile Glu Ala Ile Val Lys Lys Val Leu
1 5 10 15
Ser Glu Phe Asn Leu Glu Lys Thr Thr Ser Lys Tyr Gly Asp Val Gly
20 25 30
Ile Phe Gln Asp Met Asn Asp Ala Ile Ser Ala Ala Lys Asp Ala Gln
35 40 45
Lys Lys Leu Arg Asn Met Pro Met Glu Ser Arg Glu Lys Ile Ile Gln
50 55 60
Asn Ile Arg Lys Lys Ile Met Glu Asn Lys Lys Ile Leu Ala Glu Met
65 70 75 80
Gly Val Arg Glu Thr Gly Met Gly Arg Val Glu His Lys Ile Val Lys
85 90 95
His Glu Leu Val Ala Leu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr
100 105 110
Thr Ala Trp Ser Gly Asp Lys Gly Leu Thr Leu Val Glu Met Gly Pro
115 120 125
Phe Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu Thr
130 135 140
Val Leu Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Val Val
145 150 155 160
Phe Asn Pro His Pro Gly Ala Val Asn Val Ser Asn Tyr Ala Val Lys
165 170 175
Leu Val Asn Glu Ala Ala Met Glu Ala Gly Gly Pro Glu Asn Leu Val
180 185 190
Val Ser Val Glu Lys Pro Thr Leu Glu Thr Gly Asn Val Met Phe Lys
195 200 205
Ser Ser Asp Val Ser Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val
210 215 220
Thr Ala Val Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly
225 230 235 240
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala
245 250 255
Lys Asp Ile Ile Asp Gly Ala Thr Phe Asp Asn Asn Leu Pro Cys Ile
260 265 270
Ala Glu Lys Glu Val Val Ser Val Asp Lys Ile Thr Asp Glu Leu Ile
275 280 285
Tyr Tyr Met Gln Lys Asn Gly Cys Tyr Lys Ile Glu Gly Arg Glu Ile
290 295 300
Glu Lys Leu Ile Glu Leu Val Leu Asp His Glu Gly Gly Lys Thr Thr
305 310 315 320
Leu Asn Arg Lys Trp Val Gly Lys Asp Ala His Leu Ile Leu Lys Ala
325 330 335
Ile Gly Ile Asp Ala Asp Glu Ser Val Arg Cys Ile Ile Phe Glu Ala
340 345 350
Glu Lys Asp Asn Pro Leu Val Val Glu Glu Leu Met Met Pro Ile Leu
355 360 365
Gly Ile Val Arg Ala Lys Asn Val Asp Glu Ala Ile Met Ile Ala Thr
370 375 380
Glu Leu Glu His Gly Asn Arg His Ser Ala His Met His Ser Lys Asn
385 390 395 400
Ile Asp Asn Leu Thr Lys Phe Gly Lys Ile Ile Asp Thr Ala Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ala Ala Leu Gly Tyr Gly Gly Glu Gly
420 425 430
Tyr Cys Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser
435 440 445
Ala Arg Thr Phe Thr Lys Ser Arg Arg Cys Val Leu Ala Asp Gly Leu
450 455 460
Ser Ile Arg
465
<210> 60
<211> 477
<212> PRT
<213> Acetonema longum
<400> 60
Met Val Asp Gln Thr Leu Ile Glu Gln Ile Thr Arg Ala Val Leu Thr
1 5 10 15
Gln Met Lys Ala Gly Lys Asp Ala Ala Val Ser Gly Asp Gly Ile Phe
20 25 30
Ala Thr Val Asp Gln Ala Val Ala Ala Ala Arg Gln Ala Tyr Gln Glu
35 40 45
Leu Arg Leu Leu Thr Leu Glu Lys Arg Glu Thr Leu Ile Arg Ala Ile
50 55 60
Arg Asp Ala Ala Phe Ala Asn Ala Ala Val Ile Ala Gln Met Ala Val
65 70 75 80
Gln Glu Ser Gly Met Gly Arg Val Glu Asp Lys Ile Leu Lys Asn Gln
85 90 95
Leu Ala Ala Arg Lys Thr Pro Gly Thr Glu Asp Leu Thr Ser Arg Ala
100 105 110
Trp Ser Gly Asp His Gly Leu Thr Leu Val Glu Met Ala Pro Tyr Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Ser Glu Thr Val Ile
130 135 140
Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Ile Val Phe Ser
145 150 155 160
Pro His Pro Thr Ala Gln Asn Thr Ser Leu Thr Thr Ile Arg Leu Leu
165 170 175
Asn Glu Ala Ile Val Lys Ala Gly Gly Pro Asp Asn Leu Leu Thr Ala
180 185 190
Val Ala Glu Pro Ser Ile Glu Ala Ala Asn Ala Met Met Arg His Pro
195 200 205
Gly Ile Gln Met Leu Val Ala Thr Gly Gly Pro Ala Val Val Lys Ala
210 215 220
Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Val Val Asp Glu Thr Ala Asp Ile Ala Lys Ala Ala Lys Asp
245 250 255
Ile Val Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Ile Ala Val Gly Arg Ile Ala Asp Glu Leu Ile Ser Tyr
275 280 285
Leu Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Arg Asp Ile Glu Arg
290 295 300
Leu Met Glu Val Val Leu Thr Glu Arg Thr Glu Glu Met Ala Pro Gly
305 310 315 320
Cys Val Gly Lys Pro Arg Arg Val Tyr Gly Val Asn Lys Asp Tyr Ile
325 330 335
Gly Lys Asp Ala Lys Phe Ile Leu Ser Lys Ile Asn Ile Gln Ala Pro
340 345 350
Asp His Ile Arg Val Ile Leu Cys Glu Thr Pro Ala Asp His Pro Phe
355 360 365
Val Leu Glu Glu Leu Met Met Pro Val Leu Pro Leu Val Ser Val Arg
370 375 380
Asp Ile Asp Ala Ala Ile Asp Leu Ala Val Lys Val Glu His Gly Asn
385 390 395 400
Arg His Thr Ala Val Met His Ser Lys Asn Val Asp Tyr Met Thr Arg
405 410 415
Leu Ala Lys Ala Ile Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser
420 425 430
Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Thr Phe Thr Ile
435 440 445
Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Thr Arg
450 455 460
Gln Arg Arg Cys Ala Leu Val Asp Ala Phe Ser Ile Val
465 470 475
<210> 61
<211> 465
<212> PRT
<213> Geobacillus thermoglucosidans
<400> 61
Met Ser Val Asp Ala Gln Lys Ile Glu Lys Leu Val Arg Lys Ile Leu
1 5 10 15
Glu Glu Met Glu Glu Lys Lys Lys Pro Ala Glu Thr Glu Cys Glu Trp
20 25 30
Gly Ile Phe Asp His Met Asn Gln Ala Ile Glu Ala Ala Glu Ile Ala
35 40 45
Gln Lys Glu Leu Val Gln Leu Ser Leu Gly Gln Arg Gly Lys Leu Ile
50 55 60
Glu Ala Ile Arg Lys Ala Ala Lys Glu Asn Ala Glu Lys Phe Ala Arg
65 70 75 80
Met Ala Val Asp Glu Thr Gly Met Gly Lys Tyr Glu Asp Lys Ile Val
85 90 95
Lys Asn Leu Leu Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Arg
100 105 110
Thr Glu Val Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Leu Ser
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val
145 150 155 160
Val Phe Ser Pro His Pro Arg Ala Lys Asn Thr Ser Leu Tyr Ala Ile
165 170 175
Lys Ile Phe Asn Gln Ala Ile Val Glu Ala Gly Gly Pro Lys Asn Leu
180 185 190
Ile Thr Thr Val Ala Asn Pro Ser Ile Glu Gln Ala Glu Ile Met Met
195 200 205
Lys His Lys Thr Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Val Ala Glu Lys Glu Val Ile Ala Val Glu Ser Ile Ala Asp Arg Leu
275 280 285
Ile Asp Tyr Met Lys Lys His Gly Ala Tyr Glu Ile Thr Asn Lys Glu
290 295 300
Gln Ile Gln Gln Leu Thr Asp Leu Val Val Glu Asn Gly His Ala Asn
305 310 315 320
Lys Glu Phe Val Gly Lys Asp Ala Ala Tyr Ile Leu Lys His Ile Gly
325 330 335
Ile Asn Val Pro Pro Asp Ile Arg Val Ala Ile Met Glu Val Asp Gly
340 345 350
Lys His Pro Leu Val Thr Val Glu Leu Met Met Pro Ile Leu Pro Ile
355 360 365
Val Arg Val Lys Asn Val Asp Gln Ala Ile Glu Leu Ala Val Glu Val
370 375 380
Glu His Gly Phe Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp
385 390 395 400
His Leu Thr Lys Phe Ala Lys Ala Ile Gln Thr Thr Ile Phe Val Lys
405 410 415
Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Ala
420 425 430
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys
435 440 445
Asp Phe Ala Arg Lys Arg Lys Cys Val Leu Val Asp Ala Leu Ser Ile
450 455 460
Arg
465
<210> 62
<211> 463
<212> PRT
<213> Geobacillus sp.
<400> 62
Met Asp Ala Gln Lys Ile Glu Lys Leu Val Arg Lys Ile Leu Glu Glu
1 5 10 15
Met Glu Glu Lys Lys Lys Pro Ala Glu Thr Glu Cys Glu Trp Gly Ile
20 25 30
Phe Asp His Met Asn Gln Ala Ile Glu Ala Ala Glu Ile Ala Gln Lys
35 40 45
Glu Leu Val Gln Leu Ser Leu Gly Gln Arg Gly Lys Leu Ile Glu Ala
50 55 60
Ile Arg Lys Ala Ala Lys Glu Asn Ala Glu Lys Phe Ala Arg Met Ala
65 70 75 80
Val Asp Glu Thr Gly Met Gly Lys Tyr Glu Asp Lys Ile Val Lys Asn
85 90 95
Leu Leu Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Arg Thr Glu
100 105 110
Val Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Leu Ser Pro Tyr
115 120 125
Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile
130 135 140
Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val Val Phe
145 150 155 160
Ser Pro His Pro Arg Ala Lys Asn Thr Ser Leu Tyr Ala Ile Lys Ile
165 170 175
Phe Asn Gln Ala Ile Val Glu Ala Gly Gly Pro Lys Asn Leu Ile Thr
180 185 190
Thr Val Ala Asn Pro Ser Ile Glu Gln Ala Glu Ile Met Met Lys His
195 200 205
Lys Thr Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val Val Lys
210 215 220
Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala Lys
245 250 255
Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Val Ala
260 265 270
Glu Lys Glu Val Ile Ala Val Glu Ser Ile Ala Asp Arg Leu Ile Asp
275 280 285
Tyr Met Lys Lys His Gly Ala Tyr Glu Ile Thr Asn Lys Glu Gln Ile
290 295 300
Gln Gln Leu Thr Asp Leu Val Val Glu Asn Gly His Ala Asn Lys Glu
305 310 315 320
Phe Val Gly Lys Asp Ala Ala Tyr Ile Leu Lys His Ile Gly Ile Asn
325 330 335
Val Pro Pro Asp Thr Arg Val Ala Ile Met Glu Val Asp Gly Lys His
340 345 350
Pro Leu Val Thr Val Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg
355 360 365
Val Lys Asn Val Asp Gln Ala Ile Glu Leu Ala Val Glu Val Glu His
370 375 380
Gly Phe Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp His Leu
385 390 395 400
Thr Lys Phe Ala Lys Ala Ile Gln Thr Thr Ile Phe Val Lys Asn Ala
405 410 415
Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Ala Thr Phe
420 425 430
Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Asp Phe
435 440 445
Ala Arg Lys Arg Lys Cys Val Leu Val Asp Ala Leu Ser Ile Arg
450 455 460
<210> 63
<211> 463
<212> PRT
<213> Geobacillus thermoglucosidasius
<400> 63
Met Asp Ala Gln Lys Ile Glu Lys Leu Val Arg Lys Ile Leu Glu Glu
1 5 10 15
Met Glu Glu Lys Lys Lys Pro Ala Glu Thr Glu Cys Glu Trp Gly Ile
20 25 30
Phe Asp His Met Asn Gln Ala Ile Glu Ala Ala Glu Ile Ala Gln Lys
35 40 45
Glu Phe Val Gln Leu Ser Leu Gly Gln Arg Gly Lys Leu Ile Glu Ala
50 55 60
Ile Arg Lys Ala Ala Lys Glu Asn Ala Glu Lys Phe Ala Arg Met Ala
65 70 75 80
Val Asp Glu Thr Gly Met Gly Lys Tyr Glu Asp Lys Ile Val Lys Asn
85 90 95
Leu Leu Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Arg Thr Glu
100 105 110
Val Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Leu Ser Pro Tyr
115 120 125
Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile
130 135 140
Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val Val Phe
145 150 155 160
Ser Pro His Pro Arg Ala Lys Asn Thr Ser Leu Tyr Ala Ile Lys Ile
165 170 175
Phe Asn Gln Ala Ile Val Glu Ala Gly Gly Pro Lys Asn Leu Ile Thr
180 185 190
Thr Val Ala Asn Pro Ser Ile Glu Gln Ala Glu Ile Met Met Lys His
195 200 205
Lys Thr Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val Val Lys
210 215 220
Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala Lys
245 250 255
Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Val Ala
260 265 270
Glu Lys Glu Val Ile Ala Val Glu Ser Ile Ala Asp Arg Leu Ile Asp
275 280 285
Tyr Met Lys Lys His Gly Ala Tyr Glu Ile Thr Asn Lys Glu Gln Ile
290 295 300
Gln Gln Leu Thr Asp Leu Val Val Glu Asn Gly His Ala Asn Lys Glu
305 310 315 320
Phe Val Gly Lys Asp Ala Ala Tyr Ile Leu Lys His Ile Gly Ile Asn
325 330 335
Val Pro Pro Asp Ile Arg Val Ala Ile Met Glu Val Asp Gly Lys His
340 345 350
Pro Leu Val Thr Val Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg
355 360 365
Val Lys Asn Val Asp Gln Ala Ile Glu Leu Ala Val Glu Val Glu His
370 375 380
Gly Phe Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp His Leu
385 390 395 400
Thr Lys Phe Ala Lys Ala Ile Gln Thr Thr Ile Phe Val Lys Asn Ala
405 410 415
Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Ala Thr Phe
420 425 430
Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Asp Phe
435 440 445
Ala Arg Lys Arg Lys Cys Val Leu Val Asp Ala Leu Ser Ile Arg
450 455 460
<210> 64
<211> 463
<212> PRT
<213> Bacillus azotoformans
<400> 64
Met Ala Val Glu Ala Lys Ala Ile Glu Glu Ile Val Lys Lys Ile Leu
1 5 10 15
Glu Glu Met Met Ile Lys Lys Asp Ala Cys Ile Thr Gly Tyr Gly Ile
20 25 30
Phe Glu Asp Met Asn Glu Ala Ile Glu Ala Ala Thr Ile Ala Gln Lys
35 40 45
Glu Leu Leu Lys Leu Ser Leu Glu Gln Arg Gly Asn Leu Ile Thr Ala
50 55 60
Ile Arg Lys Ala Ala Lys Asp Asn Ala Glu Thr Phe Ala Gln Met Ala
65 70 75 80
Val Asp Glu Thr Gly Met Gly Asn Tyr Gly Asp Lys Val Ile Lys Asn
85 90 95
Leu Ile Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Thr Thr Glu
100 105 110
Ala Phe Ser Gly Asp His Gly Leu Thr Leu Val Glu Leu Ser Pro Tyr
115 120 125
Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Val
130 135 140
Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val Val Phe
145 150 155 160
Ser Pro His Pro Thr Ala Lys Asn Thr Ser Leu Lys Ala Ile Glu Val
165 170 175
Ile Asn Lys Ala Ile Ile Lys Ala Gly Gly Pro Pro Asn Leu Ile Thr
180 185 190
Ser Val Ala Asn Pro Thr Ile Asp Gln Ala Asn Ile Met Met Lys His
195 200 205
Lys Lys Ile Lys Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val Lys
210 215 220
Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Ala Val Val Asp Glu Thr Ala Asn Leu Glu Lys Ala Ala Arg
245 250 255
Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Thr Ala
260 265 270
Glu Lys Glu Val Ile Val Val Asp Ser Val Ala Asp Tyr Leu Val Ser
275 280 285
Tyr Met Lys Lys His Gly Ala Phe Leu Ile Thr Asp Lys Glu Gln Ile
290 295 300
Gln Lys Leu Thr Glu Leu Val Val Asp Asn Gly His Ala Asn Lys Glu
305 310 315 320
Leu Val Gly Lys Ser Val Ala His Ile Leu Gln Arg Ile Gly Ile Glu
325 330 335
Val Pro Ser Asp Ala Arg Val Ala Ile Leu Asn Val Glu Arg Asn His
340 345 350
Pro Leu Val Lys Ala Glu Leu Met Met Pro Ile Leu Pro Val Val Arg
355 360 365
Val Glu Asn Val Asp Ala Ala Ile Glu Leu Ala Val Glu Ala Glu Gln
370 375 380
Gly Phe Arg His Thr Ala Ile Met His Ser Thr Asn Ile Asp Asn Leu
385 390 395 400
Thr Lys Phe Ser Lys Glu Ile Gln Thr Thr Ile Phe Val Lys Asn Gly
405 410 415
Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly Tyr Ala Thr Phe
420 425 430
Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Asp Phe
435 440 445
Ala Arg Arg Arg Lys Cys Val Leu Val Asp Gly Leu Ser Ile Arg
450 455 460
<210> 65
<211> 503
<212> PRT
<213> Clostridium sticklandii
<400> 65
Met Lys Ala Gly Asp Ile Val Gln Asp Phe Ile Thr Glu Arg Asp Val
1 5 10 15
Glu Lys Ile Ile Glu Gln Val Leu Ser Lys Leu Glu Pro Val Ile Glu
20 25 30
Gln Val Lys Pro Lys Glu Ile Asn Met Leu Pro Asn Lys Thr Asn Ile
35 40 45
Asp Phe Ser Gln Asn Ala Asn Gly Ile Phe Glu Ser Ile Asp Leu Ala
50 55 60
Val Glu Ser Ala Leu Glu Ala His Ile Ile Leu Thr Ser Tyr Lys Leu
65 70 75 80
Glu Asp Arg Glu Lys Met Ile Gln Ser Ile Arg Lys Glu Val Leu Gly
85 90 95
Asp Ile Glu Asn Ile Ala Arg Leu Val Tyr Glu Glu Thr Lys Leu Gly
100 105 110
Lys Tyr Glu Asp Lys Ile Ala Lys Ile Asn Leu Ala Ala Ser Lys Thr
115 120 125
Pro Gly Thr Glu Asp Ile Lys Thr Ser Ala Ile Ser Gly Asp Tyr Gly
130 135 140
Leu Thr Ile Glu Glu Met Ala Pro Phe Gly Val Ile Gly Ala Val Thr
145 150 155 160
Pro Val Thr Asn Pro Val Glu Thr Leu Ile Asn Asn Ala Ile Ser Met
165 170 175
Ile Ser Gly Gly Asn Ser Val Val Phe Asn Val His Pro Ser Ser Lys
180 185 190
Lys Ser Ser Ala Tyr Thr Val Glu Leu Ile Asn Lys Ala Val Leu Lys
195 200 205
Ala Gly Gly Pro Gln Asn Leu Val Thr Met Val Lys Glu Pro Thr Ile
210 215 220
Glu Thr Val Asn Gln Leu Ser Ser His Pro Arg Ile Ser Met Met Val
225 230 235 240
Gly Thr Gly Gly Pro Gly Leu Val Lys Ser Leu Leu Lys Ser Gly Lys
245 250 255
Lys Thr Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu
260 265 270
Thr Ala Asp Met Asn Leu Ala Ala Lys Gly Ile Ile Glu Gly Ala Ser
275 280 285
Phe Asp Asn Asn Ile Leu Cys Ile Ala Glu Lys Glu Val Phe Val Val
290 295 300
Asn Glu Val Ala Asp Asp Leu Ile Tyr Asn Met Leu Ser Ser Gly Ala
305 310 315 320
Tyr Met Leu Asn Gln Glu Glu Leu Glu Lys Val Met Lys Leu Thr Leu
325 330 335
Val Glu Asp Glu Asp Leu Gly Ala Lys Ser Cys Thr Leu Ser Pro Lys
340 345 350
Lys Lys Tyr His Val His Lys Asn Trp Val Gly Lys Asp Ala Ser Lys
355 360 365
Ile Leu Ser Glu Ile Gly Ile Thr Lys Gln Asp Val Lys Leu Leu Ile
370 375 380
Cys Glu Val Asp Ser Asp His Pro Tyr Val Thr Leu Glu Gln Met Met
385 390 395 400
Pro Ile Leu Pro Leu Val Arg Cys Ser Asp Val Asp Glu Ala Ile Lys
405 410 415
Leu Ala Val Lys Ala Glu Gly Thr Asn Lys His Thr Ala Ser Ile Phe
420 425 430
Ser Arg Asn Val Asp Asn Met Thr Lys Phe Ala Arg Ala Ile Asn Thr
435 440 445
Thr Ile Phe Val Lys Asn Ala Pro Thr Leu Ala Gly Val Gly Tyr Lys
450 455 460
Gly Glu Gly Asn Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
465 470 475 480
Ile Thr Ser Ala Lys Thr Phe Thr Arg Val Arg Arg Cys Val Leu Ala
485 490 495
Glu Gly Gly Phe Arg Ile Val
500
<210> 66
<211> 482
<212> PRT
<213> Thermincola potens
<400> 66
Met Ala Ile Glu Ala Tyr Gln Ile Glu Lys Ile Val Glu Glu Val Met
1 5 10 15
Arg Lys Met Val Ser Gly Gly Ser Gly Asp Ser Phe Ala Gly Lys Ala
20 25 30
Lys Gly Ile Phe Glu Ser Val Asp Glu Ala Val Lys Ala Ala Lys Ala
35 40 45
Ala Gln Lys Glu Leu Val Ala Met Arg Ile Glu Lys Arg Glu Met Leu
50 55 60
Leu Lys Ala Met Arg Glu Ala Ala Ile Ala His Ala Glu Glu Leu Ala
65 70 75 80
Arg Leu Ala Val Glu Glu Thr Gly Met Gly Arg Val Thr Asp Lys Ile
85 90 95
Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro Gly Thr Glu Asn Leu
100 105 110
Gln Pro Ser Ala Val Thr Gly Asp Arg Gly Leu Thr Leu Ile Glu Arg
115 120 125
Ala Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Cys
130 135 140
Ala Thr Val Ile Asn Asn Ser Ile Ser Met Val Ala Ala Gly Asn Ser
145 150 155 160
Val Val Phe Ser Val His Pro Gly Ala Lys Lys Ala Ser Leu Leu Thr
165 170 175
Val Glu Ile Leu Asn Glu Ala Ile Glu Lys Ala Gly Gly Pro Ala Asn
180 185 190
Val Leu Thr Ala Val Ala Ser Pro Ser Leu Glu Asn Thr Asn Ala Leu
195 200 205
Met Lys His Pro Asp Ile Lys Leu Leu Val Ala Thr Gly Gly Pro Gly
210 215 220
Leu Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp Leu Glu Arg
245 250 255
Ala Ala Lys Ser Ile Val Ala Gly Ala Ser Phe Asp Asn Asn Leu Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Ile Val Val Asp Tyr Val Ala Asn Gln
275 280 285
Leu Ile Ser Tyr Met Lys Gln Asn Gly Ala Tyr Leu Ala Asn Asp Arg
290 295 300
Glu Ile Lys Ala Leu Met Asp Leu Val Leu Thr Lys Asn Glu Asn Leu
305 310 315 320
Lys Ala Glu Gly Cys Thr Val Lys Pro Glu Lys Leu Tyr Gly Gly Ile
325 330 335
Asn Lys Glu Tyr Val Gly Lys Asp Ala Ala Tyr Ile Met Lys Lys Ile
340 345 350
Gly Val Asp Ile Pro Glu Asp Thr Lys Leu Ile Ile Cys Glu Val Asp
355 360 365
Glu Asp His Pro Phe Val Leu Glu Glu Leu Met Met Pro Ile Leu Pro
370 375 380
Ile Val Arg Val Pro Asn Val Gln Lys Ala Ile Glu Val Gly Val Arg
385 390 395 400
Val Glu His Gly Asn Arg His Thr Ala Val Met His Ser Gln Asn Ile
405 410 415
Asp Asn Leu Ser Ala Phe Ala Arg Ala Val Gln Thr Thr Ile Phe Val
420 425 430
Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly Tyr
435 440 445
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ala Ala
450 455 460
Ser Ser Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Gly Phe Ser
465 470 475 480
Ile Val
<210> 67
<211> 462
<212> PRT
<213> Clostridium sp.
<400> 67
Met Ser Val Asn Glu Gln Met Ile Gln Asp Ile Val Ser Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Ser Glu Val Ser Asp Asn His Gly Ile Phe
20 25 30
Ala Asp Met Asn Glu Ala Ile Glu Ala Ala Lys Lys Ala Gln Lys Ile
35 40 45
Val Gly Arg Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile
50 55 60
Arg Lys Lys Thr Val Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val
65 70 75 80
Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Gly Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Met Ile
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Ser Ser Asn Ile Met Met Lys His Lys
195 200 205
Ala Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Val Ala Asp Glu Leu Met His Tyr
275 280 285
Met Val Ser Glu Gln Gly Cys Tyr Leu Ala Ser Lys Glu Glu Gln Glu
290 295 300
Ala Leu Thr Ala Val Val Leu Lys Asp Gly Arg Leu Asn Arg Asn Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Ser Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ser Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 68
<211> 470
<212> PRT
<213> Fusobacterium sp.
<400> 68
Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Lys Ile
1 5 10 15
Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala
20 25 30
Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu
35 40 45
Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu
50 55 60
Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Ser His Val
65 70 75 80
Thr Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val
85 90 95
Ser Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly
100 105 110
Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr
115 120 125
Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser
130 135 140
Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala
145 150 155 160
Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr
165 170 175
Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly
180 185 190
Gly Pro Asp Asn Leu Val Val Thr Ile Arg Glu Pro Ser Ile Glu Asn
195 200 205
Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser
275 280 285
Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu
290 295 300
Leu Lys Asp Lys Lys Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys
305 310 315 320
Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu
325 330 335
Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile
340 345 350
Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met
355 360 365
Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys
370 375 380
Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His
385 390 395 400
Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr
405 410 415
Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly
420 425 430
Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val
450 455 460
Gly Gly Phe Ser Ile Lys
465 470
<210> 69
<211> 470
<212> PRT
<213> Fusobacterium sp.
<400> 69
Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile
1 5 10 15
Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala
20 25 30
Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu
35 40 45
Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu
50 55 60
Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val
65 70 75 80
Ser Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val
85 90 95
Ala Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly
100 105 110
Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr
115 120 125
Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser
130 135 140
Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala
145 150 155 160
Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr
165 170 175
Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly
180 185 190
Gly Pro Asp Asn Leu Val Val Thr Ile Arg Glu Pro Ser Ile Glu Asn
195 200 205
Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser
275 280 285
Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu
290 295 300
Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys
305 310 315 320
Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu
325 330 335
Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile
340 345 350
Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met
355 360 365
Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys
370 375 380
Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His
385 390 395 400
Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr
405 410 415
Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly
420 425 430
Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val
450 455 460
Gly Gly Phe Ser Ile Lys
465 470
<210> 70
<211> 462
<212> PRT
<213> Ruminococcus sp.
<400> 70
Met Pro Ile Ser Glu Asn Met Val Gln Glu Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Ala Gly Lys His Gly Val Phe
20 25 30
Lys Asp Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ala Gln Leu Val
35 40 45
Val Lys Thr Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Leu Ala Arg Met Gly Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Val Lys Thr Ser Ile Tyr Ala Ile Asn Leu Leu
165 170 175
Asn Glu Ala Ser Leu Glu Ser Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Asp Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr
275 280 285
Met Ile Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Val Glu Thr Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Ser Met Ile Gly Val Gln Ala
325 330 335
Pro Ala Asn Thr Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg
450 455 460
<210> 71
<211> 465
<212> PRT
<213> Fusobacterium nucleatum
<400> 71
Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile Val Glu Leu Ile Met
1 5 10 15
Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala Gly Asn Ser Lys Asn
20 25 30
Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu Glu Ala Lys Lys Ala
35 40 45
Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Lys Ile Ile
50 55 60
Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val Thr Glu Leu Ala Glu
65 70 75 80
Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ala Asp Lys Glu Leu
85 90 95
Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys
100 105 110
Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val
145 150 155 160
Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Thr Val
165 170 175
Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly Gly Pro Asp Asn Leu
180 185 190
Val Val Thr Ile Arg Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile
195 200 205
Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile Val Asn Tyr Leu
275 280 285
Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Glu
290 295 300
Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys Asn Asn Ser Pro Asp
305 310 315 320
Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly
325 330 335
Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile Val Glu Thr Asp Lys
340 345 350
Asn His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile
355 360 365
Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu
370 375 380
Glu Arg Gly Leu Arg His Thr Ala Val Ile His Ser Lys Asn Ile Asp
385 390 395 400
Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys
405 410 415
Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val
420 425 430
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys
435 440 445
Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile
450 455 460
Lys
465
<210> 72
<211> 465
<212> PRT
<213> Fusobacterium nucleatum
<400> 72
Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile Val Glu Leu Ile Met
1 5 10 15
Lys Lys Met Thr Glu Gly Gly Val Ser Thr Ser Asn Asn Ser Thr Asn
20 25 30
Gly Val Phe Lys Asn Val Asp Glu Ala Ile Ala Glu Ala Lys Lys Ala
35 40 45
Gln Thr Val Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Arg Ile Ile
50 55 60
Ala Ser Ile Arg Asp Thr Leu Lys Ser His Ile Thr Glu Leu Ser Glu
65 70 75 80
Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ala Asp Lys Glu Leu
85 90 95
Lys Asn Arg Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys
100 105 110
Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val
145 150 155 160
Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Ala Val
165 170 175
Glu Leu Ile Asn Glu Ala Ile Lys Lys Ala Gly Gly Pro Asp Asn Leu
180 185 190
Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile
195 200 205
Ala Asn Pro Asn Ile Lys Met Val Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser Ile Val Asn Tyr Leu
275 280 285
Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Glu
290 295 300
Leu Ile Glu Lys Leu Leu Ser Ile Val Leu Lys Asn Asn Ser Pro Asp
305 310 315 320
Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly
325 330 335
Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile Val Glu Thr Asp Lys
340 345 350
Asn His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile
355 360 365
Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu
370 375 380
Glu Lys Gly Leu Arg His Thr Ala Val Ile His Ser Lys Asn Ile Asp
385 390 395 400
Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys
405 410 415
Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val
420 425 430
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
435 440 445
Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile
450 455 460
Lys
465
<210> 73
<211> 470
<212> PRT
<213> Fusobacterium sp.
<400> 73
Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile
1 5 10 15
Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala
20 25 30
Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Gly Ala Ile Glu
35 40 45
Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu
50 55 60
Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val
65 70 75 80
Thr Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val
85 90 95
Ala Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly
100 105 110
Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr
115 120 125
Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser
130 135 140
Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala
145 150 155 160
Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr
165 170 175
Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly
180 185 190
Gly Pro Asp Asn Leu Ile Val Thr Ile Arg Glu Pro Ser Ile Glu Asn
195 200 205
Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser
275 280 285
Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu
290 295 300
Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys
305 310 315 320
Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu
325 330 335
Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile
340 345 350
Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met
355 360 365
Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys
370 375 380
Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His
385 390 395 400
Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr
405 410 415
Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly
420 425 430
Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val
450 455 460
Gly Gly Phe Ser Ile Lys
465 470
<210> 74
<211> 465
<212> PRT
<213> Fusobacterium nucleatum
<400> 74
Met Glu Phe Glu Val Asn Asn Leu Glu Glu Ile Val Glu Leu Ile Met
1 5 10 15
Lys Lys Met Ser Glu Ser Ser Ile Ser Thr Ser Ser Asn Ser Lys Asn
20 25 30
Gly Val Phe Glu Asn Val Asp Glu Ala Ile Ala Glu Ala Lys Lys Ala
35 40 45
Gln Thr Ile Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Arg Ile Ile
50 55 60
Ala Ser Ile Arg Asp Thr Leu Lys Pro Tyr Ile Thr Glu Leu Ser Glu
65 70 75 80
Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ser Asp Lys Glu Ile
85 90 95
Lys Asn Arg Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys
100 105 110
Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val
145 150 155 160
Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Ala Val
165 170 175
Glu Leu Ile Asn Glu Ala Ile Lys Lys Val Gly Gly Pro Asp Asn Leu
180 185 190
Ile Val Thr Ile Thr Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile
195 200 205
Ala Asn Pro Asn Ile Lys Met Val Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser Ile Val Asn Tyr Leu
275 280 285
Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Asp
290 295 300
Leu Ile Glu Lys Leu Leu Ser Ile Val Leu Lys Asn Asn Ser Pro Asp
305 310 315 320
Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly
325 330 335
Ile Glu Val Gly Asp Glu Ile Arg Val Ile Ile Val Glu Thr Ser Lys
340 345 350
Asp His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile
355 360 365
Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu
370 375 380
Glu Lys Gly Leu Arg His Thr Ala Ile Ile His Ser Lys Asn Ile Asp
385 390 395 400
Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys
405 410 415
Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val
420 425 430
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
435 440 445
Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile
450 455 460
Lys
465
<210> 75
<211> 465
<212> PRT
<213> Fusobacterium nucleatum
<400> 75
Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile Val Glu Leu Ile Met
1 5 10 15
Lys Lys Met Ser Glu Ser Gly Val Ser Thr Ser Asn Asn Ser Thr Asn
20 25 30
Gly Val Phe Glu Asn Val Asp Glu Ala Ile Ala Glu Ala Lys Lys Ala
35 40 45
Gln Thr Val Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Arg Ile Ile
50 55 60
Ala Ser Ile Arg Asp Thr Leu Lys Thr His Ile Thr Glu Leu Ser Glu
65 70 75 80
Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ala Asp Lys Glu Leu
85 90 95
Lys Asn Arg Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys
100 105 110
Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val
145 150 155 160
Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Ala Val
165 170 175
Glu Leu Ile Asn Glu Ala Ile Lys Lys Ala Gly Gly Pro Asp Asn Leu
180 185 190
Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile
195 200 205
Ala Asn Pro Asn Ile Lys Met Val Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser Ile Val Asn Tyr Leu
275 280 285
Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Glu
290 295 300
Leu Ile Glu Lys Leu Leu Ser Ile Val Leu Lys Asn Asn Ser Pro Asp
305 310 315 320
Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly
325 330 335
Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile Val Glu Thr Asp Lys
340 345 350
Asn His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile
355 360 365
Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu
370 375 380
Glu Lys Gly Leu Arg His Thr Ala Val Ile His Ser Lys Asn Ile Asp
385 390 395 400
Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys
405 410 415
Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val
420 425 430
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
435 440 445
Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile
450 455 460
Lys
465
<210> 76
<211> 470
<212> PRT
<213> Fusobacterium sp.
<400> 76
Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile
1 5 10 15
Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala
20 25 30
Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu
35 40 45
Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu
50 55 60
Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val
65 70 75 80
Thr Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val
85 90 95
Ala Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly
100 105 110
Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr
115 120 125
Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser
130 135 140
Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala
145 150 155 160
Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr
165 170 175
Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly
180 185 190
Gly Pro Asp Asn Leu Ile Val Thr Ile Arg Glu Pro Ser Ile Glu Asn
195 200 205
Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser
275 280 285
Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu
290 295 300
Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys
305 310 315 320
Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu
325 330 335
Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile
340 345 350
Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met
355 360 365
Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys
370 375 380
Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His
385 390 395 400
Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr
405 410 415
Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly
420 425 430
Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val
450 455 460
Gly Gly Phe Ser Ile Lys
465 470
<210> 77
<211> 481
<212> PRT
<213> Clostridium asparagiforme
<400> 77
Met Glu Ile Glu Thr Arg Asp Ile Glu Arg Ile Val Arg Gln Val Met
1 5 10 15
Ala Ala Met Glu Gln Gln Gly Thr Ile Ala Gly Gly Ala Tyr Pro Pro
20 25 30
Ala Pro Gly Ile Thr Ala Pro Arg Gly Asp Asn Gly Val Phe Glu Arg
35 40 45
Val Glu Asp Ala Ile Asp Ala Ala Trp Ala Ala Gly Arg Val Trp Ala
50 55 60
Phe His Tyr Lys Val Glu Asp Arg Arg Arg Val Ile Glu Ala Ile Arg
65 70 75 80
Val Met Ala Arg Glu Asn Ala Arg Thr Leu Ala Gln Met Val Arg Asp
85 90 95
Glu Thr Gly Met Gly Arg Val Glu Asp Lys Val Glu Lys His Leu Ala
100 105 110
Val Ala Asp Lys Thr Pro Gly Val Glu Cys Leu Thr Thr Asp Ala Ile
115 120 125
Ser Gly Asp Gly Gly Leu Met Ile Glu Glu Tyr Ala Pro Phe Gly Val
130 135 140
Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr Glu Thr Val Ile His
145 150 155 160
Asn Thr Ile Ser Met Ile Ala Gly Gly Asn Ser Val Val Phe Asn Val
165 170 175
His Pro Gly Ala Lys Lys Cys Cys Ala Phe Cys Leu Gln Leu Leu Asn
180 185 190
Lys Thr Ile Val Glu Asn Gly Gly Pro Ala Asn Leu Ile Thr Met Gln
195 200 205
Arg Asp Pro Thr Met Asp Ala Val Asn Lys Met Thr Ser Ser Pro Lys
210 215 220
Ile Arg Leu Met Val Gly Thr Gly Gly Met Gly Met Val Asn Ala Leu
225 230 235 240
Leu Arg Ser Gly Lys Lys Thr Ile Gly Ala Gly Ala Gly Asn Pro Pro
245 250 255
Val Ile Val Asp Asp Thr Ala Asp Val Lys Leu Ala Ala Arg Glu Leu
260 265 270
Tyr Trp Gly Ala Ser Phe Asp Asn Asn Leu Phe Cys Phe Ala Glu Lys
275 280 285
Glu Val Phe Val Met Glu Ala Ser Ala Asp Gly Leu Ile Arg Gly Leu
290 295 300
Val Glu Gln Gly Ala Tyr Leu Leu Thr Pro Ala Glu Thr Glu Ala Ile
305 310 315 320
Val Lys Leu Ala Leu Ile Gln Lys Asp Gly Lys Tyr Glu Val Asn Lys
325 330 335
Lys Trp Val Gly Lys Asp Ala Gly Leu Phe Leu Gln Ala Ile Gly Val
340 345 350
Ser Gly His Glu Asn Thr Arg Leu Leu Ile Cys Asp Val Pro Lys Cys
355 360 365
His Pro Tyr Val Met Val Glu Gln Leu Met Pro Val Leu Pro Ile Val
370 375 380
Arg Cys Arg Thr Phe Asp Glu Cys Ile Gln Cys Ser Val Glu Ala Glu
385 390 395 400
Gln Gly Asn Arg His Thr Ser Ser Ile Phe Ser Thr Asn Val Tyr Asn
405 410 415
Met Thr Lys Phe Gly Lys Glu Ile Glu Thr Thr Ile Tyr Val Lys Asn
420 425 430
Gly Ala Thr Leu Arg Gly Leu Gly Ile Gly Gly Glu Gly His Thr Thr
435 440 445
Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Cys Ala Arg Ser
450 455 460
Phe Thr Arg Arg Arg Arg Cys Met Leu Ala Glu Gly Gly Leu Arg Ile
465 470 475 480
Ile
<210> 78
<211> 462
<212> PRT
<213> Clostridium phytofermentans
<400> 78
Met Thr Val Asn Glu Gln Leu Val Gln Asp Ile Ile Lys Asn Val Val
1 5 10 15
Ala Ser Met Gln Leu Thr Gln Thr Asn Lys Thr Glu Leu Gly Val Phe
20 25 30
Asp Asp Met Asn Gln Ala Ile Glu Ala Ala Lys Glu Ala Gln Leu Val
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Ala Ile
50 55 60
Arg Lys Lys Thr Ile Glu His Ala Glu Thr Leu Ala Arg Met Ala Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Val Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Ile
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Asn Phe Ala Val Gln Leu Ile
165 170 175
Asn Glu Ala Ser Leu Ser Ala Gly Gly Pro Val Asn Ile Ala Cys Ser
180 185 190
Val Arg Lys Pro Thr Leu Asp Ser Ser Lys Ile Met Met Ser His Gln
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Gln Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Val Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Ile Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Ile Asp Ala Ile Ala Asn Glu Leu Met Asn Tyr
275 280 285
Met Val Lys Glu Gln Gly Cys Tyr Ala Ile Thr Lys Glu Gln Gln Glu
290 295 300
Lys Leu Thr Asn Leu Val Ile Thr Pro Lys Gly Leu Asn Arg Asn Cys
305 310 315 320
Val Gly Lys Asp Ala Arg Thr Leu Leu Gly Met Ile Gly Ile Asp Val
325 330 335
Pro Ser Asn Ile Arg Cys Ile Ile Phe Glu Gly Glu Lys Glu His Pro
340 345 350
Leu Ile Ser Glu Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala
355 360 365
Lys Ser Phe Asp Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Arg Ile Thr
385 390 395 400
Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 79
<211> 470
<212> PRT
<213> Fusobacterium sp.
<400> 79
Met Arg Gly Glu Leu Met Glu Leu Glu Val Lys Asn Ile Glu Glu Ile
1 5 10 15
Val Asp Leu Ile Met Lys Lys Met Thr Glu Ser Asn Val Ala Val Ser
20 25 30
Tyr Asp Ser Lys Asn Gly Val Phe Asp Asp Val Asp Val Ala Ile Ala
35 40 45
Glu Ala Lys Lys Ala Gln Thr Val Leu Phe Ser Ser Lys Leu Glu Leu
50 55 60
Arg Glu Arg Ile Ile Ala Ser Ile Arg Glu Thr Met Arg Ala His Ile
65 70 75 80
Thr Glu Leu Ser Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val
85 90 95
Lys Asp Lys Glu Gln Lys Asn Arg Val Ala Ile Asp Arg Thr Pro Gly
100 105 110
Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr
115 120 125
Val Met Glu Phe Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser
130 135 140
Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala
145 150 155 160
Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr
165 170 175
Ser Ile Arg Ala Val Glu Leu Ile Asn Glu Ala Ile Lys Lys Val Gly
180 185 190
Gly Pro Glu Asn Leu Val Val Thr Ile Ser Glu Pro Ser Ile Glu Asn
195 200 205
Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser
275 280 285
Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu
290 295 300
Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Val Ser Leu Val Leu Lys
305 310 315 320
Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Ile
325 330 335
Leu Lys Gln Leu Gly Ile Glu Val Gly Asp Glu Ile Arg Val Ile Ile
340 345 350
Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met
355 360 365
Pro Val Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys
370 375 380
Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Ile Ile His
385 390 395 400
Ser Lys Asn Ile Asp Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr
405 410 415
Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly
420 425 430
Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Leu Thr Ser Ala Arg Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val
450 455 460
Gly Gly Phe Ser Ile Lys
465 470
<210> 80
<211> 462
<212> PRT
<213> Lachnospiraceae bacterium
<400> 80
Met Ser Val Asn Glu Lys Met Val Gln Asp Ile Val Gln Glu Val Val
1 5 10 15
Ala Lys Met Gln Ile Ser Ser Asp Val Ser Gly Lys Lys Gly Val Phe
20 25 30
Ser Asp Met Asn Glu Ala Ile Glu Ala Ser Lys Lys Ala Gln Lys Ile
35 40 45
Val Ala Lys Met Ser Met Asp Gln Arg Glu Ala Ile Ile Ser Lys Ile
50 55 60
Arg Glu Lys Ile Lys Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Leu
165 170 175
Asn Glu Ala Ser Val Glu Val Gly Gly Pro Glu Asn Ile Ala Val Thr
180 185 190
Val Glu His Pro Thr Met Glu Thr Ser Asp Val Met Met Lys His Lys
195 200 205
Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Leu His Tyr
275 280 285
Met Val Asn Glu Gln Gly Cys Tyr Met Ile Ser Lys Glu Glu Gln Asp
290 295 300
Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Ile Thr Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg
450 455 460
<210> 81
<211> 462
<212> PRT
<213> Ruminococcus gnavus
<400> 81
Met Ser Val Asn Glu Lys Met Val Gln Asp Ile Val Gln Glu Val Val
1 5 10 15
Ala Lys Met Gln Ile Ser Ser Asp Val Ser Gly Lys Lys Gly Val Phe
20 25 30
Ser Asp Met Asn Glu Ala Ile Glu Ala Ser Lys Lys Ala Gln Lys Ile
35 40 45
Val Ala Lys Met Ser Met Asp Gln Arg Glu Ala Ile Ile Ser Lys Ile
50 55 60
Arg Glu Lys Ile Lys Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Leu
165 170 175
Asn Glu Ala Ser Val Glu Val Gly Gly Pro Glu Asn Ile Ala Val Thr
180 185 190
Val Glu His Pro Thr Met Glu Thr Ser Asp Ile Met Met Lys His Lys
195 200 205
Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Leu His Tyr
275 280 285
Met Val Ser Glu Gln Gly Cys Tyr Met Ile Ser Lys Glu Glu Gln Asp
290 295 300
Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Ile Thr Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg
450 455 460
<210> 82
<211> 462
<212> PRT
<213> Ruminococcus obeum
<400> 82
Met Pro Ile Ser Glu Ser Met Val Gln Asp Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Val Phe
20 25 30
Lys Glu Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ala Glu Leu Ile
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val
65 70 75 80
Asp Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Val
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Val Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr
275 280 285
Met Leu Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Ser Met Ile Gly Val Asn Ala
325 330 335
Pro Ala Asn Thr Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Arg Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 83
<211> 473
<212> PRT
<213> Clostridium saccharolyticum
<400> 83
Met Glu Ile Gly Ala Lys Glu Ile Glu Leu Ile Val Arg Glu Val Leu
1 5 10 15
Ala Gly Ile Glu Ser Arg Gly Pro Lys Leu Ser Tyr Ile Pro Ala Gln
20 25 30
Ser Asp Asn Gly Val Phe Glu Arg Val Glu Asp Ala Ile Gly Ala Ala
35 40 45
His Thr Ala Gln Arg Glu Trp Val Glu His Tyr Arg Val Glu Asp Arg
50 55 60
Arg Arg Ile Ile Glu Ala Ile Arg Met Thr Ala Lys Ser His Ala Lys
65 70 75 80
Thr Leu Ala Lys Leu Val Trp Glu Glu Thr Gly Met Gly Arg Phe Glu
85 90 95
Asp Lys Ile Gln Lys His Met Ala Val Ile Glu Lys Thr Pro Gly Val
100 105 110
Glu Cys Leu Thr Thr Asp Ala Ile Ser Gly Asp Glu Gly Leu Met Ile
115 120 125
Glu Glu Tyr Ala Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Thr Glu Thr Ile Ile Asn Asn Thr Ile Ser Met Ile Ala Gly
145 150 155 160
Gly Asn Ala Val Val Phe Asn Val His Pro Gly Ala Lys Lys Cys Cys
165 170 175
Ala His Cys Leu Lys Leu Leu His Gln Ala Ile Val Glu Asn Gly Gly
180 185 190
Pro Ala Asn Leu Ile Thr Met Gln Lys Glu Pro Thr Met Glu Ala Val
195 200 205
Thr Lys Met Thr Ser Asp Pro Arg Ile Arg Leu Met Val Gly Thr Gly
210 215 220
Gly Met Pro Met Val Asn Ala Leu Leu Arg Ser Gly Lys Lys Thr Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp
245 250 255
Val Ser Leu Ala Ala Arg Glu Ile Tyr Arg Gly Ala Ser Phe Asp Asn
260 265 270
Asn Ile Leu Cys Leu Ala Glu Lys Glu Val Phe Val Met Glu Lys Ala
275 280 285
Ala Asp Glu Leu Val Asn Asn Leu Val Lys Glu Gly Ala Tyr Leu Leu
290 295 300
Asn Pro Met Glu Leu Asn Glu Ile Leu Lys Phe Ala Met Ile Glu Lys
305 310 315 320
Asn Gly Ser Cys Glu Val Asn Lys Lys Trp Val Gly Lys Asp Ala Gly
325 330 335
Leu Phe Leu Glu Ala Ile Gly Val Ser Gly His Lys Asp Val Arg Leu
340 345 350
Leu Ile Cys Glu Thr Asp Arg Asn His Pro Phe Val Met Val Glu Gln
355 360 365
Leu Met Pro Ile Leu Pro Ile Val Arg Leu Arg Thr Phe Glu Glu Cys
370 375 380
Val Glu Ser Ala Val Ala Ala Glu Ser Gly Asn Arg His Thr Ala Ser
385 390 395 400
Met Phe Ser Arg Asn Val Glu Asn Met Thr Arg Phe Gly Lys Val Ile
405 410 415
Glu Thr Thr Ile Phe Thr Lys Asn Gly Ser Thr Leu Lys Gly Val Gly
420 425 430
Ile Gly Gly Glu Gly His Thr Thr Met Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Leu Thr Cys Ala Arg Ser Phe Thr Arg Arg Arg Arg Cys Met
450 455 460
Leu Ala Glu Gly Gly Leu Arg Ile Ile
465 470
<210> 84
<211> 471
<212> PRT
<213> Flavonifractor plautii
<400> 84
Met Asn Ile Asp Glu Asn Val Val Glu Ser Ile Val Lys Arg Val Val
1 5 10 15
Ser Gln Leu Ser Thr Glu Thr Ala Ser Ala Gln Thr Cys Pro Ser Gly
20 25 30
Gly Asp Trp Gly Val Phe Glu Ser Met Asn Asp Ala Val Asp Ala Ala
35 40 45
Val Glu Ala Gln Arg Glu Tyr Leu Asn Arg Ser Met His Asp Arg Ala
50 55 60
Cys Tyr Val Gln Ala Ile Arg Asp Val Val Leu Asp Gln Glu Asn Leu
65 70 75 80
Glu Tyr Ile Ser Arg Leu Ala Val Glu Glu Thr Gly Met Gly Gly Tyr
85 90 95
Glu Tyr Lys Leu Ile Lys Asn Arg Leu Ala Ala Val Lys Thr Pro Gly
100 105 110
Ile Glu Asp Leu Thr Thr Asp Ala Met Ser Gly Asp Asp Gly Leu Thr
115 120 125
Leu Val Glu Tyr Ser Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr
130 135 140
Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Leu Ala
145 150 155 160
Ala Gly Asn Ala Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val
165 170 175
Ser Leu His Leu Ile Gln Leu Ile Asn Lys Ala Leu Cys Lys Ala Gly
180 185 190
Ala Pro Ala Asn Leu Val Val Thr Val Ser Ala Pro Ser Ile Glu Asn
195 200 205
Thr Asn Ala Met Met Ser His Pro Lys Ile Arg Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Ala Ile Val Lys Thr Val Leu Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Ile Ala Val Asp Ser
275 280 285
Val Ala Asp Tyr Leu Ile Phe Asn Met Lys Lys Asn Gly Ala Tyr Glu
290 295 300
Val Lys Asp Pro Ala Val Ile Ser Gln Leu Val Glu Leu Val Thr Lys
305 310 315 320
Glu Gly Lys Ser Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr
325 330 335
Ile Leu Asp Lys Ile Gly Ile Thr Val Gly Asp Asp Val Lys Val Ile
340 345 350
Leu Met Glu Ala Lys Glu Asp His Pro Phe Val Gln Val Glu Leu Met
355 360 365
Met Pro Ile Leu Pro Leu Val Arg Val Pro Asp Val Asp Gln Ala Ile
370 375 380
Glu Met Ala Val Arg Val Glu His Gly Asn Arg His Thr Ala Met Met
385 390 395 400
His Ser Arg Asn Val Glu Lys Leu Thr Lys Met Ala Lys Leu Ile Gln
405 410 415
Thr Thr Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val
420 425 430
Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu
435 440 445
Gly Leu Thr Ser Ala Lys Ser Phe Ala Arg Arg Arg Arg Cys Val Leu
450 455 460
Val Gly Gly Met Asp Val Arg
465 470
<210> 85
<211> 462
<212> PRT
<213> Ruminococcus obeum
<400> 85
Met Pro Ile Ser Glu Ser Met Val Gln Asp Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe
20 25 30
Lys Asp Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Glu Leu Ile
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val
65 70 75 80
Asp Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Val
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Val Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr
275 280 285
Met Leu Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala
325 330 335
Pro Ala Asn Ile Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 86
<211> 469
<212> PRT
<213> Clostridium carboxidivorans
<400> 86
Met Glu Leu Gln Ser Asn Glu Leu Ser Leu Ile Ile Glu Lys Val Leu
1 5 10 15
Lys Glu Met Asn Lys Lys Glu Leu Lys Glu Glu Val Ser Asp Gly Val
20 25 30
Phe Asp Thr Met Glu Glu Ala Ile Glu Ala Ala Tyr Glu Ala Gln Lys
35 40 45
Lys Phe Ser Ser Tyr Thr Ile Glu Gln Arg Glu Lys Leu Ile Ala Ala
50 55 60
Met Arg Lys Ala Ile Ile Asp Asn Ala Met Glu Ile Ala Asn Leu Cys
65 70 75 80
Val Asn Glu Ser Gly Met Gly Arg Val Asp His Lys Tyr Leu Lys Leu
85 90 95
Lys Leu Thr Ala Glu Lys Thr Pro Gly Thr Glu Val Leu Gln Thr Thr
100 105 110
Ala Phe Thr Gly Asp Lys Gly Leu Thr Leu Val Glu Asn Gly Ala Phe
115 120 125
Gly Val Ile Gly Ser Ile Thr Pro Ser Thr Asn Pro Ala Ala Thr Val
130 135 140
Ala Cys Asn Gly Ile Gly Met Leu Ala Gly Gly Asn Thr Ala Val Phe
145 150 155 160
Ser Pro His Pro Gly Ala Phe Arg Ser Ser Leu Ala Met Leu Arg Ala
165 170 175
Leu Asn Lys Ala Ile Lys Glu Ala Gly Gly Pro Asp Asn Leu Leu Thr
180 185 190
Ser Val Lys Lys Pro Ser Ile Glu Ser Thr Asn Ser Met Met Lys Asn
195 200 205
Asp Lys Ile Arg Met Val Val Ala Thr Gly Gly Pro Gly Ile Val Lys
210 215 220
Met Val Leu Ser Ser Gly Arg Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala Arg
245 250 255
Asp Ile Ile Ala Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala
260 265 270
Glu Lys Glu Ala Leu Val Val Glu Ala Val Tyr Glu Glu Leu Ile Lys
275 280 285
Glu Met Lys Asn Asn Arg Ala Val Tyr Glu Leu Asn Asp Glu Glu Ala
290 295 300
Ala Lys Val Ala Glu Leu Val Leu Val His Asn Lys Glu Lys Asn Thr
305 310 315 320
Tyr Ser Ile Asn Lys Ala Phe Val Gly Lys Asp Ala Lys Tyr Ile Leu
325 330 335
Gln Asn Ile Gly Lys Asn Asp Ala Glu Gly Val Glu Cys Leu Ile Tyr
340 345 350
Arg Ala Glu Asn Ser His Pro Phe Val Gln Glu Glu Leu Met Met Pro
355 360 365
Ile Leu Pro Ile Val Lys Thr Lys Asp Phe Glu Glu Ala Leu Lys Leu
370 375 380
Ala Val Gln Asp Glu His Gly Asn Arg His Thr Ala Ile Met His Ser
385 390 395 400
Lys Asn Val Asp Asn Leu Thr Lys Met Ala Arg Ala Ile Asp Thr Thr
405 410 415
Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly
420 425 430
Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Asn Ala Val Ser Phe Thr Arg Lys Arg Arg Cys Thr Met Ala Glu
450 455 460
Ser Phe Arg Ile Val
465
<210> 87
<211> 469
<212> PRT
<213> Fusobacterium ulcerans
<400> 87
Met Asn Leu Glu Ala Asn Asn Met Asp Glu Ile Val Ala Leu Ile Met
1 5 10 15
Lys Glu Leu Lys Lys Thr Asp Ile Lys Ala Gly Cys Gln Ser Cys Glu
20 25 30
Ser Pro Lys Asn Gly Val Phe Ser Ser Met Asp Glu Ala Ile Ala Ala
35 40 45
Ala Lys Lys Ala Gln Glu Ile Leu Phe Ser Ser Arg Leu Glu Met Arg
50 55 60
Glu Lys Ile Val Ala Ser Ile Arg Glu Val Met Lys Asp Tyr Val Val
65 70 75 80
Glu Leu Ala Glu Leu Gly Val Lys Glu Thr Gly Met Gly Arg Ala Ala
85 90 95
Asp Lys Ala Leu Lys His Gln Val Thr Ile Glu Lys Thr Pro Gly Val
100 105 110
Glu Asp Leu Arg Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val
115 120 125
Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Ser Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ser Ala
145 150 155 160
Gly Asn Ser Val Val Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser
165 170 175
Ile Lys Thr Val Glu Ile Ile Asn Glu Ala Val Arg Lys Ala Gly Gly
180 185 190
Pro Glu Asn Leu Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr
195 200 205
Asn Arg Met Met Glu Asn Pro Asp Ile Lys Met Leu Val Ala Thr Gly
210 215 220
Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile
275 280 285
Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Ile
290 295 300
Lys Asp Lys Ser Val Ile Asp Arg Leu Val Ala Met Val Leu Lys Asn
305 310 315 320
Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asp Ala Ser Tyr Ile Leu
325 330 335
Lys Asp Leu Gly Ile Asn Val Gly Gly Glu Ile Arg Val Ile Ile Thr
340 345 350
Glu Ala Asp Lys Asp His Pro Phe Ala Val Glu Glu Leu Leu Met Pro
355 360 365
Ile Leu Pro Ile Ile Arg Val Lys Asn Ala Leu Glu Gly Ile Glu Val
370 375 380
Ser Lys Lys Leu Glu His Gly Leu Arg His Thr Ala Met Ile His Ser
385 390 395 400
Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Asp Met Glu Thr Thr
405 410 415
Ile Leu Val Lys Asn Gly Pro Ser Phe Ala Gly Ile Gly Val Gly Gly
420 425 430
Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly
450 455 460
Gly Leu Ser Ile Lys
465
<210> 88
<211> 469
<212> PRT
<213> Fusobacterium sp.
<400> 88
Met Asn Leu Glu Ala Asn Asn Met Asp Glu Ile Val Ala Leu Ile Met
1 5 10 15
Lys Glu Leu Lys Lys Thr Asp Ile Lys Ala Gly Cys Gln Ser Cys Glu
20 25 30
Ser Leu Lys Asn Gly Val Phe Ser Ser Met Asp Glu Ala Ile Ala Ala
35 40 45
Ala Lys Lys Ala Gln Glu Ile Leu Phe Ser Ser Arg Leu Glu Met Arg
50 55 60
Glu Lys Ile Val Ala Ser Ile Arg Glu Val Met Lys Asp Tyr Val Val
65 70 75 80
Glu Leu Ala Glu Leu Gly Val Lys Glu Thr Gly Met Gly Arg Ala Ala
85 90 95
Asp Lys Ala Leu Lys His Gln Val Thr Ile Glu Lys Thr Pro Gly Val
100 105 110
Glu Asp Leu Arg Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val
115 120 125
Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Ser Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ser Ala
145 150 155 160
Gly Asn Ser Val Val Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser
165 170 175
Ile Lys Thr Val Glu Ile Ile Asn Glu Ala Val Arg Arg Ala Gly Gly
180 185 190
Pro Glu Asn Leu Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr
195 200 205
Asn Arg Met Met Glu Asn Pro Asp Ile Lys Met Leu Val Ala Thr Gly
210 215 220
Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile
275 280 285
Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Ile
290 295 300
Lys Asp Lys Ser Val Ile Asp Arg Leu Val Ala Met Val Leu Lys Asn
305 310 315 320
Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asp Ala Ser Tyr Ile Leu
325 330 335
Lys Asp Leu Gly Ile Asn Val Gly Asp Glu Ile Arg Val Ile Ile Thr
340 345 350
Glu Thr Asp Lys Asp His Pro Phe Ala Val Glu Glu Leu Leu Met Pro
355 360 365
Ile Leu Pro Ile Ile Arg Val Lys Asn Ala Leu Glu Gly Ile Glu Val
370 375 380
Ser Lys Lys Leu Glu His Gly Leu Arg His Thr Ala Met Ile His Ser
385 390 395 400
Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Asp Met Glu Thr Thr
405 410 415
Ile Leu Val Lys Asn Gly Pro Ser Phe Ala Gly Ile Gly Val Gly Gly
420 425 430
Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly
450 455 460
Gly Leu Ser Ile Lys
465
<210> 89
<211> 469
<212> PRT
<213> Clostridium carboxidivorans
<400> 89
Met Glu Leu Glu Ser Asn Glu Leu Ser Val Ile Ile Glu Lys Val Leu
1 5 10 15
Lys Glu Met Asn Lys Lys Glu Phe Gly Lys Lys Glu Ser Asp Gly Ile
20 25 30
Phe Asp Thr Met Asp Glu Ala Val Glu Ala Ser Tyr Glu Ala Gln Lys
35 40 45
Lys Tyr Ser Ser Tyr Ser Leu Glu Gln Arg Glu Lys Leu Ile Gln Ala
50 55 60
Met Arg Lys Ala Ile Met Asp Asn Ala Met Glu Val Ala Asn Leu Cys
65 70 75 80
Val Lys Glu Ser Gly Met Gly Arg Val Asp His Lys Tyr Leu Lys Leu
85 90 95
Lys Leu Ile Val Glu Lys Thr Gln Gly Thr Glu Ile Leu Arg Pro Glu
100 105 110
Val Tyr Thr Gly Asp Asn Gly Leu Thr Leu Ile Glu His Gly Ala Phe
115 120 125
Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ala Ala Thr Val
130 135 140
Ala Cys Asn Ser Ile Cys Met Leu Ala Gly Gly Asn Thr Val Val Phe
145 150 155 160
Ser Pro His Pro Gly Ala Leu Asn Ser Cys Leu Thr Met Ile Arg Ile
165 170 175
Leu Asn Lys Ala Ile Lys Glu Ala Gly Gly Pro Glu Asn Leu Ile Thr
180 185 190
Ser Val Lys Ala Pro Ser Ile Glu Asn Thr Asn Ile Met Ile Asn His
195 200 205
Lys Arg Ile Arg Leu Val Val Ala Thr Gly Gly Pro Gly Ile Val Lys
210 215 220
Leu Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Pro Lys Ala Ala Arg
245 250 255
Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile Ala
260 265 270
Glu Lys Glu Ala Ile Val Val Glu Ser Val Tyr Glu Glu Leu Ile Lys
275 280 285
Glu Phe Lys Lys Asn Arg Val Val Tyr Glu Leu Thr Asp Glu Glu Ala
290 295 300
Glu Lys Leu Val Gly Lys Val Leu Asn Tyr Asp Glu Lys Asn Lys Lys
305 310 315 320
Tyr Ser Ile Asn Lys Lys Phe Val Gly Lys Asp Ala Lys Tyr Leu Leu
325 330 335
Glu Ser Ile Gly Lys Asp Ala Gly Thr Gly Val Glu Cys Leu Ile Tyr
340 345 350
Arg Ala Glu Asn Ser His Pro Phe Val Gln Glu Glu Leu Met Met Pro
355 360 365
Ile Leu Pro Ile Val Lys Val Lys Asn Val Asp Glu Ala Ile Glu Thr
370 375 380
Ala Val Glu Asp Glu His Gly Asn Arg His Thr Ala Met Met His Ser
385 390 395 400
Lys Asn Val Val Asn Leu Thr Lys Met Ala Arg Ala Ile Asp Thr Thr
405 410 415
Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly
420 425 430
Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile
435 440 445
Thr Asn Ala Val Thr Phe Thr Arg Gln Arg Arg Cys Thr Met Val Asp
450 455 460
Ser Phe Arg Ile Val
465
<210> 90
<211> 471
<212> PRT
<213> Clostridium sp.
<400> 90
Met Glu Met Asp Met Lys Val Ile Glu Gln Leu Val Ala Gln Ala Leu
1 5 10 15
Lys Glu Met Lys Ala Glu Glu Pro Ala Ala Phe Ala Glu Lys Lys Glu
20 25 30
Glu Asn Tyr Gly Val Phe Ser Thr Met Asp Glu Ala Ile Glu Ala Ser
35 40 45
Glu Lys Ala Gln Lys Ala Leu Leu Phe Ser Lys Ile Gln Asp Arg Gln
50 55 60
Lys Tyr Val Asp Ile Ile Arg Ala Ala Ile Leu Lys Arg Glu Asn Leu
65 70 75 80
Glu Leu Ile Ser Arg Met Ala Val Glu Glu Thr Glu Ile Gly Lys Tyr
85 90 95
Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly
100 105 110
Thr Glu Asp Leu Thr Thr Glu Ala Gln Thr Gly Asp His Gly Leu Thr
115 120 125
Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr
130 135 140
Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile Ala
145 150 155 160
Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val
165 170 175
Ser Gln Leu Leu Val Lys Met Leu Asn Lys Ala Leu Met Glu Gly Gly
180 185 190
Ala Pro Ala Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn
195 200 205
Thr Asn Lys Met Ile Glu His Pro Gly Val Arg Leu Leu Val Ala Thr
210 215 220
Gly Gly Pro Ala Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Arg Asp Ile Val Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser
275 280 285
Ile Cys Asp Tyr Leu Ile Gln Asn Met Lys Leu Asn Gly Ala Tyr Glu
290 295 300
Ile Arg Asp Ala Glu Thr Ile Glu Arg Leu Asp Ala Leu Val Thr Asn
305 310 315 320
Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Lys Tyr
325 330 335
Ile Leu Asp Lys Met Gly Ile Pro Ala Asp Asp Ser Val Lys Val Ile
340 345 350
Ile Met Glu Val Arg Arg Asp His His Leu Val Thr Glu Glu Met Met
355 360 365
Met Pro Ile Leu Pro Ile Val Arg Val Ser Asp Val Asp Thr Ala Ile
370 375 380
Glu Tyr Ala His Asp Ala Glu His Gly Asn Arg His Thr Ala Met Met
385 390 395 400
His Ser Lys Asn Val Glu Lys Leu Ser Lys Met Ala Lys Leu Leu Glu
405 410 415
Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Ala
420 425 430
Gly Gly Glu Gly His Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu
435 440 445
Gly Leu Thr Ser Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val Met
450 455 460
Ser Asp Ala Phe Ser Ile Arg
465 470
<210> 91
<211> 469
<212> PRT
<213> Fusobacterium varium
<400> 91
Met Asn Leu Glu Ala Asn Asn Met Asp Glu Ile Val Ala Leu Ile Met
1 5 10 15
Lys Glu Leu Lys Lys Thr Asp Ile Lys Thr Val Cys Gln Ser Cys Glu
20 25 30
Asn Pro Lys Asn Gly Val Phe Ser Ser Met Asp Glu Ala Ile Thr Ala
35 40 45
Ala Lys Lys Ala Gln Glu Ile Leu Phe Ser Ser Arg Leu Glu Met Arg
50 55 60
Glu Lys Ile Val Ala Ser Ile Arg Glu Val Met Lys Asp Tyr Val Leu
65 70 75 80
Glu Leu Ala Glu Leu Gly Val Lys Glu Thr Gly Met Gly Arg Val Ala
85 90 95
Asp Lys Ala Leu Lys His Gln Val Thr Ile Glu Lys Thr Pro Gly Val
100 105 110
Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val
115 120 125
Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Ser Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ser Ala
145 150 155 160
Gly Asn Ser Ile Val Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser
165 170 175
Ile Lys Thr Val Glu Ile Ile Asn Glu Ala Val Arg Lys Val Gly Gly
180 185 190
Pro Glu Asn Leu Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr
195 200 205
Asn Lys Met Met Ala Asn Pro Asp Ile Lys Met Leu Val Ala Thr Gly
210 215 220
Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Ala Lys Asp Ile Val Ala Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile
275 280 285
Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Ile
290 295 300
Lys Asp Lys Ala Val Ile Glu Arg Leu Ala Gly Met Val Leu Lys Asn
305 310 315 320
Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asp Ala Ser Tyr Ile Leu
325 330 335
Lys Asp Leu Gly Ile Asn Val Gly Asp Glu Ile Arg Val Ile Ile Ala
340 345 350
Glu Thr Asp Lys Glu His Pro Phe Ala Val Glu Glu Leu Leu Met Pro
355 360 365
Ile Leu Pro Ile Ile Arg Val Lys Asn Ala Leu Glu Gly Ile Glu Val
370 375 380
Ser Lys Lys Leu Glu His Gly Leu Arg His Thr Ala Met Ile His Ser
385 390 395 400
Lys Asn Ile Asp Val Leu Thr Lys Tyr Ala Arg Asp Met Glu Thr Thr
405 410 415
Ile Leu Val Lys Asn Gly Pro Ser Phe Ala Gly Ile Gly Val Gly Gly
420 425 430
Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly
450 455 460
Gly Leu Ser Ile Lys
465
<210> 92
<211> 482
<212> PRT
<213> Clostridium celatum
<400> 92
Met Asp Asp Asn Thr Lys Leu Ile Gln Asp Ile Val Ala Lys Val Ile
1 5 10 15
Ser Glu Ile Gly Thr Lys Glu Ile Glu Glu Glu Ala Cys Cys Gly Asn
20 25 30
Gly Ser Cys Gly Gly Ser Cys Gly Cys Asn Lys Glu Lys Tyr Val Phe
35 40 45
Glu Asp Val Asp Ser Ala Val Ala Ala Ala Lys Lys Ala Tyr Lys Glu
50 55 60
Leu Lys Gln Leu Thr Ile Lys Asp Arg Glu Asn Ile Ile Thr Lys Ile
65 70 75 80
Arg Glu Lys Cys Leu Thr Tyr Ser Glu Arg Leu Ser Ile Met Ala Val
85 90 95
Asp Glu Thr Gly Met Gly Lys Val Glu Asp Lys Ile Thr Lys His Val
100 105 110
Leu Val Ala Arg Lys Thr Pro Gly Thr Glu Asp Leu Thr Thr Thr Ala
115 120 125
Trp Ser Gly Asp Gly Gly Leu Thr Leu Val Glu Arg Gly Ala Phe Gly
130 135 140
Val Ile Ala Ala Ile Thr Pro Ser Thr Asn Pro Thr Ala Thr Ile Phe
145 150 155 160
Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Val Val Phe Ala
165 170 175
Pro His Pro Ala Ala Lys Ser Cys Ser Lys Phe Ala Val Lys Leu Ile
180 185 190
Asn Glu Ala Ser Ile Glu Val Gly Gly Pro Glu Asn Ile Val Val Thr
195 200 205
Phe Glu Asn Pro Ser Ile Glu Ile Thr Ser Ala Leu Met Lys His Lys
210 215 220
Asp Ile Pro Phe Ile Ser Ala Thr Gly Gly Pro Gly Val Val Thr Gln
225 230 235 240
Ala Cys Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly Asn Pro
245 250 255
Pro Val Leu Val Asp Glu Thr Ala Asp Ile Lys His Ala Ala Lys Ser
260 265 270
Ile Ile Ala Gly Ala Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
275 280 285
Lys Glu Val Val Ala Leu Asp Ser Ile Cys Asp Glu Leu Ile Glu Asp
290 295 300
Met Gln Lys Glu Gly Ala Tyr Phe Leu Asn Ser Thr Glu Leu Ile Asn
305 310 315 320
Arg Leu Ile Asp Thr Val Leu Ile Arg Lys Asp Gly Lys Val Thr Leu
325 330 335
Asn Arg Asn Phe Val Gly Arg Asp Ala Lys Ile Ile Leu Asp Ala Ile
340 345 350
Gly Val Tyr Ala Asp Asp Ser Val Lys Cys Ile Ile Phe Glu Gly Cys
355 360 365
Lys Ser Asn Leu Leu Ile Val Glu Glu Leu Met Met Pro Ile Leu Gly
370 375 380
Ile Val Arg Val Lys Asp Phe Asn Thr Ala Val Asp Val Ala Val Glu
385 390 395 400
Leu Glu His Gly Asn Arg His Ser Ala His Ile His Ser Lys Arg Ile
405 410 415
Asp Arg Leu Thr Tyr Phe Ala Arg Glu Ile Asp Thr Ala Ile Phe Val
420 425 430
Lys Asn Ala Pro Ser Tyr Ser Ala Leu Gly Val Glu Ala Glu Gly Tyr
435 440 445
Pro Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Ser Ser Ala
450 455 460
Lys Thr Phe Ser Lys Ser Arg Arg Cys Ile Met Lys Asp Ala Leu Ser
465 470 475 480
Ile Lys
<210> 93
<211> 462
<212> PRT
<213> Clostridium sp.
<400> 93
Met Ser Val Asn Glu Arg Met Val Gln Asp Ile Val Gln Glu Val Val
1 5 10 15
Ala Lys Met Gln Ile Ala Ser Asp Val Thr Gly Asn His Gly Val Phe
20 25 30
Gln Asp Met Asn Ala Ala Ile Glu Ala Ala Lys Lys Thr Gln Lys Val
35 40 45
Val Ala Arg Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile
50 55 60
Arg Ala Lys Ile Lys Glu His Ala Glu Ile Phe Ala Arg Met Gly Val
65 70 75 80
Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Gln Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Ile
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu Asn Pro Thr Leu Glu Ser Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr
275 280 285
Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Thr Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg
450 455 460
<210> 94
<211> 462
<212> PRT
<213> Lachnospiraceae bacterium
<400> 94
Met Ser Val Asn Glu Gln Met Val Gln Asp Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Thr Ser Asp Val Ser Gly Ser His Gly Val Phe
20 25 30
Lys Asp Met Asn Glu Ala Ile Ala Ala Ala Lys Lys Thr Gln Lys Ile
35 40 45
Val Gly Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile
50 55 60
Arg Thr Lys Ile Lys Glu Asn Ala Glu Ile Met Ala Arg Met Gly Val
65 70 75 80
Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Val
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Leu
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu Lys Pro Thr Leu Ala Ser Ser Asp Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met Tyr Tyr
275 280 285
Met Val Ser Glu Gln Gly Cys Tyr Lys Ile Thr Lys Glu Glu Gln Asp
290 295 300
Ala Leu Thr Ala Val Val Leu Lys Asp Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Thr Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg
450 455 460
<210> 95
<211> 463
<212> PRT
<213> Lachnospiraceae bacterium
<400> 95
Met Pro Val Ser Glu Ser Met Val Gln Asp Ile Val Lys Glu Val Val
1 5 10 15
Ala Arg Met Gln Leu Ser Gly Ser Ala Gly Thr Ala Gln His Gly Val
20 25 30
Phe Thr Asp Met Asn Gln Ala Ile Glu Ala Ala Lys Glu Ala Glu Ala
35 40 45
Lys Val Arg Cys Met Thr Met Asp Gln Arg Glu Gln Ile Val Ser Asn
50 55 60
Ile Arg Arg Lys Thr His Glu Asn Ala Glu Leu Leu Ala Arg Met Gly
65 70 75 80
Val Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His
85 90 95
His Leu Leu Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr
100 105 110
Ala Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe
115 120 125
Gly Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val
130 135 140
Leu Cys Asn Ser Met Gly Met Ile Ala Ala Gly Asn Thr Val Val Phe
145 150 155 160
Asn Pro His Pro Gln Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Met
165 170 175
Val Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Val Ala Cys
180 185 190
Thr Val Ser Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His
195 200 205
Lys Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr
210 215 220
Ala Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Ala Leu Val Asp Glu Thr Ala Asp Val Arg Lys Ala Ala Ala
245 250 255
Asp Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala
260 265 270
Glu Lys Glu Ile Val Ala Val Asp Ser Val Ala Asp Glu Leu Met Asn
275 280 285
Tyr Met Ile Ser Glu Gln Gly Cys Tyr Leu Ile Ser Lys Glu Glu Gln
290 295 300
Asp Lys Leu Thr Ala Thr Val Ile Thr Pro Lys Gly Leu Asn Arg Lys
305 310 315 320
Cys Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Ile Gln
325 330 335
Ala Pro Glu Asn Ile Arg Cys Ile Val Phe Glu Gly Glu Lys Glu His
340 345 350
Pro Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Leu Val Arg
355 360 365
Ala Lys Asp Phe Asp Asp Ala Val Glu Lys Ala Val Trp Leu Glu His
370 375 380
Gly Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile
385 390 395 400
Thr Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala
405 410 415
Pro Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe
420 425 430
Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe
435 440 445
Thr Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 96
<211> 462
<212> PRT
<213> Ruminococcus sp.
<400> 96
Met Pro Ile Asn Glu Asn Met Val Gln Glu Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe
20 25 30
Lys Glu Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Gln Leu Ile
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Val Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Ile Asn Leu Leu
165 170 175
Asn Glu Ala Ser Leu Glu Ser Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Val Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Thr Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Ser Ser Ile Val Asp Glu Leu Met His Tyr
275 280 285
Leu Val Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala
325 330 335
Pro Ala Asn Ile Arg Cys Ile Val Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Arg Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Cys Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ala Asp Ser Leu Cys Ile Arg
450 455 460
<210> 97
<211> 469
<212> PRT
<213> Acetobacterium woodii
<400> 97
Met Asn Ile Asp Thr Thr Gly Ile Glu Tyr Ile Val Lys Lys Val Met
1 5 10 15
Ala Glu Ile Asp Cys Ala Glu Glu Gly Gly Lys Pro Leu Lys Asp Gly
20 25 30
Glu Leu Gly Ile Phe Asn Asp Met Glu Asn Ala Ile Asp Ala Ala Phe
35 40 45
Ile Ala Gln Lys Ser Phe Met Arg Ala Ser Met Ala Phe Arg Ser Lys
50 55 60
Ile Ile Ala Ala Met Arg Ala Glu Met Leu Lys Lys Glu Asn Met Glu
65 70 75 80
Met Ile Cys Gln Met Ala Val Glu Glu Thr Gly Met Gly Asn Tyr Glu
85 90 95
His Lys Leu Leu Lys His Glu Leu Ala Ala Thr Lys Thr Pro Gly Val
100 105 110
Glu Asp Leu Val Ala Asp Ala Phe Thr Gly Asp Asp Gly Leu Thr Leu
115 120 125
Ile Glu Gln Ser Pro Phe Gly Val Ile Gly Ala Val Ser Pro Ser Thr
130 135 140
Asn Pro Ser Glu Thr Ile Ile Cys Asn Gly Ile Gly Met Leu Ala Gly
145 150 155 160
Gly Asn Thr Val Val Phe Ala Pro His Pro Ser Ala Lys Lys Thr Ser
165 170 175
Ala Leu Val Val Lys Leu Leu Asn Lys Ala Ile Leu Glu Ala Gly Gly
180 185 190
Pro Glu Asn Leu Ile Val Thr Thr Val Lys Pro Thr Ile Asp Ser Ala
195 200 205
Asn Thr Met Phe Ala Ser Pro Lys Ile Thr Met Leu Cys Ala Thr Gly
210 215 220
Gly Pro Gly Val Val Lys Ser Val Leu Gln Ser Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Gly Lys Asp Ile Ile Asp Gly Cys Cys Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Val Val Glu Gln Val
275 280 285
Ala Asp Tyr Leu Ile Phe Asn Met Lys Lys Asn Gly Ala Tyr Glu Leu
290 295 300
Lys Asp Ala Gln Lys Ile Lys Glu Leu Glu Glu Leu Val Ile Pro Gly
305 310 315 320
Gly Arg Leu Ser Arg Asp Tyr Val Gly Arg Ser Ala Lys Val Ile Leu
325 330 335
Lys Gly Ile Gly Ile Glu Val Asp Asp Ser Val Arg Val Val Ile Ile
340 345 350
Glu Thr Ser Lys Asp His Ile Phe Ala Val Glu Glu Leu Met Met Pro
355 360 365
Ile Leu Ala Ile Val Arg Val Lys Asp Val Ala Glu Gly Ile Asp Leu
370 375 380
Ala Val Ser Leu Glu His Gly Asn Arg His Thr Ala Ile Met His Ser
385 390 395 400
Thr Asn Ile Asn Asn Leu Thr Glu Met Ala Lys Arg Val Gln Thr Thr
405 410 415
Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly
420 425 430
Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Ser Ala Lys Thr Phe Thr Arg Lys Arg Arg Cys Val Leu Val Gly
450 455 460
Gly Phe Thr Ile Lys
465
<210> 98
<211> 497
<212> PRT
<213> Clostridium botulinum
<400> 98
Met Asn Asp Phe Asn Met Ile Asp Ile Glu Ser Ile Val Lys Asn Ile
1 5 10 15
Val Lys Glu Leu Thr Gly Asn Glu Lys Gly Gln Gly Ala Ile Thr Thr
20 25 30
Ala Thr Ala Pro Lys Glu Ala Asn Pro Leu Val Asp Ile Glu Lys Lys
35 40 45
Ile Met Gly Phe Met Asn Thr Pro Thr Met Pro Val Gly Glu Tyr Gly
50 55 60
Val Phe Glu Asp Ile Asn Asp Ala Ile Glu Gln Ala Trp Leu Ala Glu
65 70 75 80
Gln Glu Tyr Arg Lys Val Gly Leu Asp Lys Arg Thr Glu Ile Ile Glu
85 90 95
Ala Phe Lys Ala Glu Val Arg Lys Asn Val Glu Glu Ile Ser Arg Arg
100 105 110
Thr Phe Glu Glu Thr Gly Met Gly Arg Tyr Glu Asp Lys Ile Leu Lys
115 120 125
Asn Asn Leu Ala Leu Asp Lys Thr Pro Gly Val Glu Asp Leu Glu Ala
130 135 140
Gly Val Lys Thr Gly Asp Gly Gly Leu Thr Leu Tyr Glu Met Ser Pro
145 150 155 160
Phe Gly Val Ile Gly Ala Ile Ala Pro Ser Thr Asn Pro Thr Glu Thr
165 170 175
Ile Ile Asn Asn Gly Ile Ser Met Leu Ala Gly Gly Asn Thr Val Val
180 185 190
Phe Ser Pro His Pro Gly Ala Lys Asp Val Ser Val Phe Ile Val Gln
195 200 205
Leu Ile Asn Lys Ala Ile Glu Arg Ile Asn Gly Pro Lys Asn Leu Ile
210 215 220
Val Thr Val Lys Asn Pro Asn Ile Glu Ser Thr Asn Ile Met Leu Ala
225 230 235 240
His Pro Lys Val Asn Met Ile Cys Ala Thr Gly Gly Pro Gly Ile Val
245 250 255
Lys Val Ala Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly
260 265 270
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
275 280 285
Val Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
290 295 300
Cys Glu Lys Glu Val Ile Val Val Asp Lys Val Ala Asp Tyr Leu Lys
305 310 315 320
Thr Cys Met Ser Lys Tyr Cys Ala Leu Glu Ile Thr Asp Lys Asn Met
325 330 335
Leu Ala Gln Leu Glu Lys Leu Val Leu Thr Glu Asn Gly Thr Ile Asn
340 345 350
Lys Gln Phe Val Gly Lys Asn Ala Asp Tyr Ile Met Ser Lys Leu Gly
355 360 365
Val Asn Ile Asp Pro Ser Ile Arg Val Ile Phe Ala Glu Val Glu Ala
370 375 380
Asn His Pro Phe Ala Val Glu Glu Leu Met Met Pro Ile Leu Pro Val
385 390 395 400
Ile Arg Val Arg Asn Val Asp Glu Ala Ile Asp Leu Gly Val Glu Leu
405 410 415
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys His Ile Asp
420 425 430
Asn Leu Ser Lys Phe Ala Lys Ala Val Gln Thr Thr Ile Phe Val Lys
435 440 445
Asn Ala Pro Ser Tyr Ala Gly Ile Gly Tyr Gly Ala Glu Gly His Gly
450 455 460
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
465 470 475 480
Thr Phe Thr Arg Lys Arg Arg Cys Val Met Val Asp Asn Phe Ser Ile
485 490 495
Lys
<210> 99
<211> 497
<212> PRT
<213> Clostridium botulinum
<400> 99
Met Asn Asp Phe Asn Met Ile Asp Ile Glu Ser Ile Val Lys Asn Ile
1 5 10 15
Val Lys Glu Leu Thr Gly Asn Glu Lys Glu Gln Gly Ala Ile Ile Thr
20 25 30
Ala Thr Ala Pro Lys Glu Val Asn Pro Leu Val Asp Ile Glu Lys Lys
35 40 45
Ile Met Gly Phe Met Asn Thr Pro Thr Met Gln Ala Gly Glu Tyr Gly
50 55 60
Val Phe Glu Asp Ile Asn Asp Ala Ile Glu Gln Ala Trp Leu Ala Glu
65 70 75 80
Gln Glu Tyr Arg Lys Val Gly Leu Asp Lys Arg Thr Glu Ile Ile Glu
85 90 95
Val Phe Lys Ala Glu Val Arg Lys Asn Val Glu Glu Ile Ser Arg Arg
100 105 110
Thr Phe Glu Glu Thr Gly Met Gly Arg Tyr Glu Asp Lys Ile Leu Lys
115 120 125
Asn Asn Leu Ala Leu Asp Lys Thr Pro Gly Val Glu Asp Leu Glu Ala
130 135 140
Gly Val Lys Thr Gly Asp Gly Gly Leu Thr Leu Tyr Glu Met Ser Pro
145 150 155 160
Phe Gly Val Ile Gly Ala Ile Ala Pro Ser Thr Asn Pro Thr Glu Thr
165 170 175
Ile Ile Asn Asn Gly Ile Ser Met Leu Ala Gly Gly Asn Thr Val Val
180 185 190
Phe Ser Pro His Pro Gly Ala Lys Asp Val Ser Val Phe Ile Ile Gln
195 200 205
Leu Ile Asn Lys Ala Ile Glu Arg Val Asn Gly Pro Lys Asn Leu Ile
210 215 220
Val Thr Val Arg Asn Pro Asn Ile Glu Ser Thr Asn Ile Met Leu Ser
225 230 235 240
His Pro Lys Val Asn Met Ile Cys Ala Thr Gly Gly Pro Gly Ile Val
245 250 255
Lys Val Ala Leu Ser Ser Gly Lys Lys Ala Val Gly Ala Gly Ala Gly
260 265 270
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
275 280 285
Val Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
290 295 300
Cys Glu Lys Glu Val Ile Val Val Asp Lys Val Thr Asp Tyr Leu Lys
305 310 315 320
Thr Cys Met Ser Lys Tyr Cys Ala Leu Glu Ile Thr Asp Lys Asn Met
325 330 335
Leu Ala Gln Leu Glu Lys Leu Val Leu Thr Glu Asn Gly Thr Ile Asn
340 345 350
Lys Lys Phe Val Gly Lys Asn Ala Asp Tyr Ile Met Ser Lys Leu Gly
355 360 365
Ile Asn Ile Asp Pro Ser Ile Arg Val Ile Phe Ala Glu Val Gly Ala
370 375 380
Asn His Pro Phe Ala Val Glu Glu Leu Met Met Pro Ile Leu Pro Ile
385 390 395 400
Ile Arg Val Arg Asn Val Asp Glu Ala Ile Glu Leu Gly Val Glu Leu
405 410 415
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys His Ile Asp
420 425 430
Asn Leu Ser Lys Phe Ala Lys Ala Val Gln Thr Thr Ile Phe Val Lys
435 440 445
Asn Ala Pro Ser Tyr Ala Gly Ile Gly Tyr Gly Ala Glu Gly His Gly
450 455 460
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
465 470 475 480
Thr Phe Thr Arg Lys Arg Arg Cys Val Met Val Asp Asn Phe Ser Ile
485 490 495
Lys
<210> 100
<211> 497
<212> PRT
<213> Clostridium botulinum
<400> 100
Met Asn Asp Phe Asn Met Ile Asp Ile Glu Ser Ile Val Lys Asn Ile
1 5 10 15
Val Lys Glu Leu Thr Gly Asn Glu Lys Glu Gln Gly Thr Ile Thr Thr
20 25 30
Ala Ala Val Pro Lys Glu Val Asn Pro Leu Val Asp Ile Glu Lys Lys
35 40 45
Ile Met Gly Phe Val Asn Thr Pro Thr Met Pro Ile Gly Glu His Gly
50 55 60
Val Phe Glu Asp Ile Asn Asp Ala Ile Glu Gln Ala Trp Ile Ala Glu
65 70 75 80
Gln Glu Tyr Arg Lys Val Gly Leu Asp Lys Arg Thr Glu Ile Ile Glu
85 90 95
Ala Phe Lys Ala Glu Val Arg Lys Asn Val Glu Glu Ile Ser Arg Arg
100 105 110
Thr Phe Glu Glu Thr Gly Met Gly Arg Tyr Glu Asp Lys Ile Leu Lys
115 120 125
Asn Asn Leu Ala Leu Asp Lys Thr Pro Gly Val Glu Asp Leu Glu Ala
130 135 140
Gly Val Lys Thr Gly Asp Gly Gly Leu Thr Leu Tyr Glu Met Ser Pro
145 150 155 160
Phe Gly Val Ile Gly Ala Ile Ala Pro Ser Thr Asn Pro Thr Glu Thr
165 170 175
Ile Ile Asn Asn Gly Ile Ser Met Leu Ala Gly Gly Asn Thr Val Val
180 185 190
Phe Ser Pro His Pro Gly Ala Lys Asp Val Ser Val Phe Ile Ile Gln
195 200 205
Leu Ile Asn Lys Ala Ile Glu Arg Val Asn Gly Pro Lys Asn Leu Ile
210 215 220
Val Thr Val Arg Asn Pro Asn Ile Glu Ser Thr Asn Ile Met Leu Ala
225 230 235 240
His Pro Lys Val Asn Met Ile Cys Ala Thr Gly Gly Pro Gly Ile Val
245 250 255
Lys Val Ala Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly
260 265 270
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
275 280 285
Val Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
290 295 300
Cys Glu Lys Glu Val Ile Val Val Asp Lys Val Ala Asp Tyr Leu Lys
305 310 315 320
Thr Cys Met Ser Lys Tyr Cys Ala Leu Glu Ile Thr Asp Lys Asn Met
325 330 335
Leu Ala Gln Leu Glu Lys Leu Val Leu Thr Glu Asn Gly Thr Ile Asn
340 345 350
Lys Lys Phe Val Gly Lys Asn Ala Asp Tyr Ile Met Ser Lys Leu Gly
355 360 365
Val Asn Ile Asp Pro Ser Ile Arg Val Ile Phe Ala Glu Val Glu Ala
370 375 380
Asn His Pro Phe Ala Val Glu Glu Leu Met Met Pro Ile Leu Pro Val
385 390 395 400
Ile Arg Val Arg Asn Val Asp Glu Ala Ile Asp Leu Gly Val Glu Leu
405 410 415
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys His Ile Asp
420 425 430
Asn Leu Ser Lys Phe Ala Lys Ala Val Gln Thr Thr Ile Phe Val Lys
435 440 445
Asn Ala Pro Ser Tyr Ala Gly Ile Gly Tyr Gly Ala Glu Gly His Gly
450 455 460
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
465 470 475 480
Thr Phe Thr Arg Lys Arg Arg Cys Val Met Val Asp Asn Phe Ser Ile
485 490 495
Lys
<210> 101
<211> 462
<212> PRT
<213> Eubacterium plexicaudatum
<400> 101
Met Ser Val Asn Asp Gln Met Val Gln Asp Ile Val Arg Gln Val Leu
1 5 10 15
Ala Asn Met Arg Ile Ser Ser Asp Ala Ser Gly Ser Arg Gly Val Phe
20 25 30
Ser Asp Met Asn Glu Ala Val Glu Ala Ala Lys Lys Ala Gln Ala Val
35 40 45
Ile Gly Lys Met Pro Met Asp His Arg Glu Lys Ile Ile Ser Ser Ile
50 55 60
Arg Ala Lys Ile Met Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val
65 70 75 80
Lys Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Lys Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Ile Gly Met Val Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Val Asn Leu Val
165 170 175
Asn Glu Ala Ser Val Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu His Pro Thr Leu Asp Thr Ser Ala Ile Met Met Lys His Lys
195 200 205
Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr
275 280 285
Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Ala Lys Glu Gln Glu
290 295 300
Ala Leu Ile Ser Val Val Leu Lys Gly Gly Gln Leu Asn Arg Asp Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Gln Ala
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Asp Ser Phe Glu Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp His Ile Thr
385 390 395 400
Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg
450 455 460
<210> 102
<211> 467
<212> PRT
<213> Thermosediminibacter oceani
<400> 102
Met Val Asp Glu Lys Val Val Glu Ala Ile Ala Lys Arg Ile Ile Glu
1 5 10 15
Glu Leu Asn Leu Cys Glu Ser Gly Ser Ser Gly Gly Glu Ser Arg Glu
20 25 30
Glu Leu Gly Ile Phe Asp Asn Leu Asp Asp Ala Val Glu Ala Ala Ser
35 40 45
Gln Ala Gln Lys Arg Phe Ala Ala Leu Asp Leu Glu Lys Arg Glu Glu
50 55 60
Ile Ile Gln Ala Ile Arg Glu Ala Cys Leu Asn Asn Ala Arg Tyr Leu
65 70 75 80
Ala Glu Leu Thr Val Asn Glu Thr Gly Ile Gly Arg Val Glu Asp Lys
85 90 95
Ile Val Lys Asn Ile Leu Ala Ala Lys Lys Thr Pro Gly Thr Glu Asp
100 105 110
Leu Arg Pro Ser Cys Trp Thr Gly Asp His Gly Leu Thr Leu Val Glu
115 120 125
Met Ala Pro Val Gly Val Ile Gly Ser Ile Thr Pro Val Thr Asn Pro
130 135 140
Val Ala Thr Val Ile Asn Asn Ser Ile Ser Met Leu Ala Ala Gly Asn
145 150 155 160
Ala Val Val Phe Asn Pro His Pro Ser Ala Lys Arg Ser Ser Asn Lys
165 170 175
Ala Val Glu Ile Ile Asn Glu Ala Ile Met Lys Val Gly Gly Pro Arg
180 185 190
His Leu Val Asn Ser Val Ala Glu Pro Thr Ile Glu Thr Ala Lys Ala
195 200 205
Leu Met Ala His Pro Lys Val Asn Leu Val Ser Val Thr Gly Gly Lys
210 215 220
Ala Val Val Ser Glu Ala Leu Arg Ser Gly Lys Lys Val Ile Gly Ala
225 230 235 240
Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Val
245 250 255
Lys Ala Ala His Asp Ile Tyr Cys Gly Ala Ser Phe Asp Asn Asn Leu
260 265 270
Pro Cys Ile Ala Glu Lys Glu Leu Ile Ala Val Glu Ala Val Ala Asp
275 280 285
Met Leu Leu Glu Arg Leu Ala Arg Glu Gly Ala Tyr Ile Leu Arg Gly
290 295 300
Lys Asp Val Glu Lys Ile Thr Glu Val Val Phe Asp Glu Asn His Arg
305 310 315 320
Ile Asn Lys Lys Leu Val Gly Lys Asp Ala Ser Phe Ile Leu Glu Gln
325 330 335
Ile Gly Ile Gln Val Gly Lys Asp Val Arg Leu Val Val Val Pro Val
340 345 350
Asn Pro Glu His Pro Leu Val His His Glu Gln Leu Met Pro Val Leu
355 360 365
Pro Phe Val Arg Val Pro Asn Ile Gln Glu Ala Val Glu Leu Ala Val
370 375 380
Arg Ala Glu Gly Gly Asn Arg His Thr Ala Val Met His Ser Lys Asn
385 390 395 400
Val Asp Asn Met Thr Asn Phe Ala Arg Ala Ile Gln Thr Thr Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly
420 425 430
Tyr Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser
435 440 445
Ala Arg Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe
450 455 460
Arg Ile Ile
465
<210> 103
<211> 479
<212> PRT
<213> Clostridium clostridioforme
<400> 103
Met Glu Ile Ser Glu Lys Glu Val Glu Ala Ile Val Arg Ser Val Leu
1 5 10 15
Ser Gly Leu Gly Gln Lys Ser Phe Gln Ala Glu Ala Leu His Val Lys
20 25 30
Asp Lys Met Cys Ser Asp Gly Glu Asp Gly Ile Phe Glu Leu Val Glu
35 40 45
Asp Ala Ile Glu Ala Ala Ser Lys Ala Gln Lys Glu Trp Val His Arg
50 55 60
Tyr Lys Leu Lys Asp Arg Lys Arg Ile Ile Glu Ala Ile Arg Val Thr
65 70 75 80
Ser Arg Ala His Ala Glu Ser Leu Ala Arg Met Val His Glu Glu Thr
85 90 95
Gly Met Gly Arg Tyr Glu Asp Lys Ile Thr Lys His Met Ala Val Ile
100 105 110
Asp Lys Thr Pro Gly Val Glu Cys Leu Val Thr Asp Ala Ile Ser Gly
115 120 125
Asp Glu Gly Leu Met Ile Glu Glu Pro Ala Pro Phe Gly Val Ile Gly
130 135 140
Ala Ile Thr Pro Ser Thr Asn Pro Thr Glu Thr Met Ile Asn Asn Thr
145 150 155 160
Ile Ser Met Ile Ala Gly Gly Asn Ala Val Val Phe Asn Val His Pro
165 170 175
Gly Ala Lys Lys Cys Cys Ala Tyr Cys Leu Gln Ile Leu His Arg Ala
180 185 190
Ile Val Glu Asn Gly Gly Pro Lys Asn Leu Ile Thr Met Gln Arg Glu
195 200 205
Pro Asp Met Asp Ala Val His Lys Leu Thr Ser Ser Pro His Ile Arg
210 215 220
Leu Met Val Gly Thr Gly Gly Met Gly Met Val His Ala Leu Leu Cys
225 230 235 240
Ser Gly Lys Arg Thr Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val
245 250 255
Val Asp Asp Thr Ala Asp Leu Ser Leu Ala Ala Arg Glu Leu Tyr Arg
260 265 270
Gly Ala Ser Phe Asp Asn Asn Leu Leu Cys Leu Ala Glu Lys Glu Val
275 280 285
Phe Val Met Asp Asn Val Ala Glu Glu Leu Val Asp Arg Leu Val Gly
290 295 300
Glu Gly Ala Tyr Leu Leu Asp Asp Leu Gln Leu Lys Lys Ile Thr Glu
305 310 315 320
Leu Ala Met Val Asn Lys Asp Gly Lys Tyr Glu Val Asn Lys Lys Trp
325 330 335
Val Gly Lys Asp Ala Gly Lys Phe Leu Glu Ala Ile Gly Ile Gln Glu
340 345 350
His Arg Glu Pro Arg Leu Leu Ile Cys Val Thr Asp Arg Ser His Pro
355 360 365
Phe Val Lys Val Glu Gln Leu Met Pro Val Leu Pro Ile Val Arg Cys
370 375 380
Gly Ser Phe Glu Lys Cys Val Glu Trp Ala Val Asp Thr Glu Ala Gly
385 390 395 400
Asn Arg His Thr Ala Ser Ile Phe Ser Lys Asn Val Glu His Met Thr
405 410 415
Leu Phe Gly Lys Glu Ile Glu Thr Thr Ile Tyr Thr Lys Asn Gly Ala
420 425 430
Thr Leu Lys Gly Ile Gly Ile Gly Gly Glu Gly His Thr Thr Met Thr
435 440 445
Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Cys Ala Arg Ser Phe Thr
450 455 460
Arg Arg Arg Arg Cys Met Leu Ala Glu Gly Gly Leu Arg Ile Ile
465 470 475
<210> 104
<211> 471
<212> PRT
<213> Clostridium clostridioforme
<400> 104
Met Asp Met Asp Ile Lys Val Ile Glu Gln Met Val Glu Gln Ala Leu
1 5 10 15
Lys Glu Ile Lys Ala Glu Gln Pro Gln Lys Phe Thr Met Pro Lys Ala
20 25 30
Glu Leu Tyr Gly Val Phe Lys Thr Met Asp Glu Ala Ile Ala Ala Ser
35 40 45
Glu Glu Ala Gln Lys Lys Leu Leu Phe Ser Lys Ile Ser Asp Arg Gln
50 55 60
Lys Tyr Val Asp Val Ile Arg Arg Thr Ile Leu Lys Arg Glu Asn Leu
65 70 75 80
Glu Met Ile Ser Arg Leu Ser Val Glu Glu Thr Glu Ile Gly Asp Tyr
85 90 95
Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly
100 105 110
Thr Glu Asp Leu Leu Thr Glu Ala Met Thr Gly Asp Asn Gly Leu Thr
115 120 125
Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr
130 135 140
Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Ser Met Ile Ala
145 150 155 160
Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val
165 170 175
Ser Gln Met Thr Val Lys Leu Leu Asn Lys Ala Leu Thr Glu Ser Gly
180 185 190
Ala Pro Glu Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn
195 200 205
Thr Asn Lys Met Ile Glu Asn Pro Ser Val Arg Leu Leu Val Ala Thr
210 215 220
Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
245 250 255
Asp Ile Val Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser
275 280 285
Ile Cys Asp Tyr Leu Ile His Asn Met Lys Glu Asn Gly Ala Tyr Gln
290 295 300
Ile Thr Asp Pro Ala Leu Leu Glu Lys Leu Val Thr Leu Val Thr Asn
305 310 315 320
Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Arg Tyr
325 330 335
Ile Leu Asp Lys Leu Gly Ile Thr Ala Asp Ala Ser Val Arg Val Ile
340 345 350
Ile Met Glu Val Pro Lys Glu His Leu Leu Val Gln Glu Glu Met Met
355 360 365
Met Pro Ile Leu Pro Val Val Arg Val Cys Asp Val Asp Thr Ala Ile
370 375 380
Glu Tyr Ala Arg Gln Ala Glu His Gly Asn Arg His Thr Ala Met Met
385 390 395 400
His Ser Arg Asn Val Glu Lys Leu Ser Lys Met Ala Lys Ile Met Glu
405 410 415
Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val
420 425 430
Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu
435 440 445
Gly Leu Thr Ser Pro Arg Ala Phe Cys Arg Lys Arg Lys Cys Val Met
450 455 460
Thr Asp Ala Phe Ser Ile Arg
465 470
<210> 105
<211> 472
<212> PRT
<213> Ilyobacter polytropus
<400> 105
Met Asn Leu Asp Ala Asn Asn Leu Asn Asn Ile Val Ser Leu Ile Met
1 5 10 15
Lys Glu Leu Asp Lys Asn Asn Asn Ile Asp Asp Thr Gly Gln Gly Cys
20 25 30
Gly Gly Glu Glu Gly Lys Asn Gly Ile Phe Ser Ser Met Asp Thr Ala
35 40 45
Val Ser Lys Ala Lys Glu Ala Gln Val Thr Leu Phe Ala Ser Lys Leu
50 55 60
Glu Leu Arg Glu Arg Ile Ile Lys Ala Ile Arg Glu Asp Val Arg Glu
65 70 75 80
Ala Ala Ala Glu Leu Ala Glu Ile Ala Val Glu Glu Thr Gly Met Gly
85 90 95
Arg Val Asp Asp Lys Thr Leu Lys His Tyr Val Thr Val Asp Lys Thr
100 105 110
Pro Gly Val Glu Asp Leu Arg Ala Phe Ala Tyr Ser Gly Asp Asn Gly
115 120 125
Leu Thr Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ser Ile Thr
130 135 140
Pro Ser Thr Asn Pro Ser Glu Thr Ile Val Cys Asn Ala Ile Gly Met
145 150 155 160
Ile Ala Ala Gly Asn Ser Val Val Phe Ala Pro His Pro Gly Ala Lys
165 170 175
Lys Thr Ser Leu Arg Ala Val Glu Ile Leu Asn Lys Ala Val Ala Arg
180 185 190
Ala Gly Gly Pro Asn Asn Leu Val Val Thr Ile Phe Glu Pro Ser Ile
195 200 205
Glu Asn Thr Asn Lys Met Val Lys Asn Pro Asp Ile Lys Met Val Val
210 215 220
Ala Thr Gly Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys
225 230 235 240
Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu
245 250 255
Thr Ala Asp Ile Glu Lys Ala Ala Lys Asp Ile Val Asn Gly Cys Ser
260 265 270
Phe Asp Asn Asn Leu Pro Cys Ile Thr Glu Lys Glu Val Val Ala Val
275 280 285
Asp Ser Ile Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala
290 295 300
Tyr Leu Val Gln Asp Ser Lys Thr Ile Lys Lys Leu Cys Glu Met Val
305 310 315 320
Ile Asn Asp Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asn Ala Ser
325 330 335
Tyr Ile Leu Lys Asp Leu Gly Ile Asp Val Gly Asp Glu Ile Lys Val
340 345 350
Ile Ile Val Glu Thr Asp Ala Gly His Pro Leu Ala Val Leu Glu Met
355 360 365
Leu Met Pro Val Leu Pro Ile Val Arg Val Lys Asp Ala Leu Glu Gly
370 375 380
Ile Lys Val Cys Lys Lys Leu Glu Asp Gly Leu Arg His Thr Ala Met
385 390 395 400
Ile His Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Asp Met
405 410 415
Glu Thr Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly
420 425 430
Val Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Ala
450 455 460
Leu Val Gly Gly Leu Ser Ile Lys
465 470
<210> 106
<211> 462
<212> PRT
<213> Shuttleworthia satelles
<400> 106
Met Ala Asp Glu Gln Leu Val Gln Asn Val Val Arg Glu Val Val Ala
1 5 10 15
Arg Met Gln Ile Ser Ala Pro Ala Arg Gly Met His Gly Val Phe Ser
20 25 30
Asp Met Glu Glu Ala Ile Glu Ala Ala Arg Thr Ala Gln Gln Thr Val
35 40 45
Arg Leu Leu Pro Met Asp Gln Arg Glu Lys Ile Ile Gly Ala Ile Arg
50 55 60
Arg Lys Thr Arg Glu Asn Ala Glu Ile Leu Ala Arg Met Ala Val Asn
65 70 75 80
Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His Leu Leu
85 90 95
Val Ala Asp Lys Val Pro Gly Thr Glu Asp Ile Ser Thr Arg Ala Phe
100 105 110
Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly Val
115 120 125
Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu Cys
130 135 140
Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn Pro
145 150 155 160
His Pro Gln Ala Ile Lys Thr Thr Leu Phe Thr Ile Gln Met Val Asn
165 170 175
Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr Val
180 185 190
Asp Ala Pro Thr Leu Ala Thr Ser Glu Ile Met Met Lys Ser Pro His
195 200 205
Ile Lys Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val Thr Ala Val
210 215 220
Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro
225 230 235 240
Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp Ile
245 250 255
Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys
260 265 270
Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Leu His Tyr Met
275 280 285
Leu Thr Glu Gln Gly Cys Tyr Gln Ala Ser Glu Glu Glu Leu Asp Arg
290 295 300
Leu Thr Lys Ala Val Met Asp Glu Lys Gly Arg Leu Asn Arg Lys Ala
305 310 315 320
Val Gly Arg Ser Ala Arg Lys Leu Leu Ser Met Ile Gly Val Glu Val
325 330 335
Asp Ala Asn Ile Arg Cys Ile Thr Phe Phe Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Val
355 360 365
Lys Asp Phe Ala Glu Gly Leu Glu Thr Ala Ala Trp Leu Glu His Gly
370 375 380
Asn Lys His Ser Ala His Ile His Ser Lys Asn Val Asp Arg Ile Thr
385 390 395 400
Glu Tyr Ala Arg Arg Leu Asp Thr Thr Ile Thr Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Ser Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Ile
435 440 445
Lys Ser Arg His Cys Val Met Thr Asp Ser Leu Cys Val Arg
450 455 460
<210> 107
<211> 472
<212> PRT
<213> Clostridium beijerinckii
<400> 107
Met Asp Val Asp Val Val Leu Val Glu Lys Leu Val Arg Gln Ala Ile
1 5 10 15
Glu Glu Val Lys Asn Lys Asn Leu Leu Asn Leu Asp Lys Phe Glu Ser
20 25 30
Val Lys Asn Tyr Gly Ile Phe Gly Thr Met Asp Ala Ala Val Glu Ala
35 40 45
Ser Phe Val Ala Gln Lys Gln Leu Leu Asn Ala Ser Met Thr Asp Lys
50 55 60
Gln Lys Tyr Val Asp Thr Ile Lys Ala Thr Ile Leu Lys Lys Glu Asn
65 70 75 80
Leu Glu Leu Ile Ser Arg Met Ser Val Glu Glu Thr Glu Ile Gly Lys
85 90 95
Tyr Glu His Lys Leu Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro
100 105 110
Gly Ile Glu Asp Leu Thr Thr Glu Ala Met Thr Gly Asp Asn Gly Leu
115 120 125
Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro
130 135 140
Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile
145 150 155 160
Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Asn
165 170 175
Val Ser Ile Lys Leu Val Thr Met Leu Asn Lys Ala Leu Glu Glu Ala
180 185 190
Gly Ala Pro Asp Asn Leu Ile Ala Thr Val Lys Glu Pro Ser Ile Glu
195 200 205
Asn Thr Asn Ile Met Met Glu His Pro Lys Ile Arg Met Leu Val Ala
210 215 220
Thr Gly Gly Pro Ala Ile Val Asn Lys Val Met Ser Thr Gly Lys Lys
225 230 235 240
Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr
245 250 255
Ala Asp Ile Glu Lys Ala Ala Ile Asp Ile Val Asn Gly Cys Ser Phe
260 265 270
Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp
275 280 285
Gln Ile Cys Asp Tyr Leu Ile His Tyr Met Lys Leu Asn Gly Ala Tyr
290 295 300
Glu Ile Lys Asp Arg Asp Leu Ile Gln Lys Leu Leu Asp Leu Val Thr
305 310 315 320
Asn Glu Asn Gly Gly Pro Lys Val Ser Phe Val Gly Lys Ser Ala Pro
325 330 335
Tyr Ile Leu Asn Lys Leu Gly Ile Ser Val Asp Glu Asn Ile Lys Val
340 345 350
Ile Ile Met Glu Val Glu Lys Asn His His Phe Val Leu Glu Glu Met
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Thr Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Tyr Val Ala Glu His Gly Asn Arg His Thr Ala Ile
385 390 395 400
Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Arg Leu Leu
405 410 415
Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly
420 425 430
Val Gly Gly Glu Gly Thr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val
450 455 460
Met Val Asp Ala Phe Asn Ile Arg
465 470
<210> 108
<211> 471
<212> PRT
<213> Clostridium clostridioforme
<400> 108
Met Asp Met Asp Ile Lys Val Ile Glu Gln Met Val Glu Gln Ala Leu
1 5 10 15
Lys Glu Ile Lys Ala Glu Gln Pro Gln Lys Phe Thr Met Pro Lys Ala
20 25 30
Glu Leu Tyr Gly Val Phe Lys Thr Met Asp Glu Ala Ile Ala Ala Ser
35 40 45
Glu Glu Ala Gln Lys Lys Leu Leu Phe Ser Lys Ile Ser Asp Arg Gln
50 55 60
Lys Tyr Val Asp Val Ile Arg Arg Thr Ile Leu Lys Arg Glu Asn Leu
65 70 75 80
Glu Met Ile Ser Arg Leu Ser Val Glu Glu Thr Glu Ile Gly Asp Tyr
85 90 95
Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly
100 105 110
Thr Glu Asp Leu Leu Thr Glu Ala Met Thr Gly Asp Asn Gly Leu Thr
115 120 125
Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr
130 135 140
Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Ser Met Ile Ala
145 150 155 160
Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val
165 170 175
Ser Gln Met Thr Val Lys Leu Leu Asn Lys Ala Leu Thr Glu Ser Gly
180 185 190
Ala Pro Glu Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn
195 200 205
Thr Asn Lys Met Ile Glu Asn Pro Ser Val Arg Leu Leu Val Ala Thr
210 215 220
Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
245 250 255
Asp Ile Val Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser
275 280 285
Ile Cys Asp Tyr Leu Ile His Asn Met Lys Glu Asn Gly Ala Tyr Gln
290 295 300
Ile Thr Asp Pro Ala Leu Leu Glu Lys Leu Val Thr Leu Val Thr Asn
305 310 315 320
Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Arg Tyr
325 330 335
Ile Leu Asp Lys Leu Gly Ile Thr Ala Asp Ala Ser Val Arg Val Ile
340 345 350
Ile Met Glu Val Pro Lys Glu His Leu Leu Val Gln Glu Glu Met Met
355 360 365
Met Pro Ile Leu Pro Val Val Arg Val Cys Asp Val Asp Thr Ala Ile
370 375 380
Glu Tyr Ala Arg Gln Ala Glu His Gly Asn Arg His Thr Ala Met Met
385 390 395 400
His Ser Arg Asn Val Glu Lys Leu Ser Lys Met Ala Lys Ile Met Glu
405 410 415
Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val
420 425 430
Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu
435 440 445
Gly Leu Thr Ser Pro Lys Ala Phe Cys Arg Lys Arg Lys Cys Val Met
450 455 460
Thr Asp Ala Phe Ser Ile Arg
465 470
<210> 109
<211> 473
<212> PRT
<213> Clostridium sp.
<400> 109
Met Lys Leu Asp Asp Lys Leu Ile Glu Gln Val Ala Arg Leu Val Met
1 5 10 15
Glu Glu Met Lys Ser Gly Ser Ala Ala Ala Cys Glu Glu Asn Gly Thr
20 25 30
Cys Gly Asp Ser Tyr Gly Ile Phe Asp Ser Met Asp Asp Ala Val Gln
35 40 45
Ala Ser Glu Ala Ala Gln Arg Lys Tyr Leu Phe Ser Thr Met Glu Asp
50 55 60
Arg Gln Lys Tyr Val Asp Val Ile Arg Gln Thr Val Leu Glu Pro Glu
65 70 75 80
Met Leu Gln Lys Ile Ser Arg Met Ala Val Glu Glu Thr Gly Met Gly
85 90 95
Asn Tyr Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Ser
100 105 110
Pro Gly Thr Glu Asp Leu Val Thr Glu Ala Met Thr Gly Asp Arg Gly
115 120 125
Leu Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Val Thr
130 135 140
Pro Ala Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ala Met
145 150 155 160
Leu Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys
165 170 175
Asn Val Thr His Val Leu Val Thr Ala Leu Asn Gln Ala Leu Glu Lys
180 185 190
Val Gly Ala Pro Thr Asn Leu Ile Val Thr Val Arg Glu Pro Ser Val
195 200 205
Glu Asn Thr Asn Leu Met Ile Lys His Pro Lys Ile Arg Val Leu Val
210 215 220
Ala Thr Gly Gly Pro Gly Ile Val Lys Met Val Met Ser Thr Gly Lys
225 230 235 240
Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu
245 250 255
Thr Ala Asp Ile Glu Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser
260 265 270
Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Ile Ala Val
275 280 285
Asp Thr Ile Ala Asp Cys Leu Ile Trp His Met Lys Arg Val Gly Ala
290 295 300
Phe Glu Leu Lys Glu Glu Ser Ala Ile Ser Arg Leu Leu Gln Leu Val
305 310 315 320
Thr Asn Glu Lys Gly Gly Pro Lys Val Glu Phe Val Gly Lys Ser Ala
325 330 335
Pro Tyr Ile Leu Asn Lys Leu Gly Ile Ser Gly Gly Glu Asn Ala Arg
340 345 350
Val Ile Leu Met Glu Thr Gln Lys Asp His Pro Phe Val Met Glu Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Ala Ala Asp Val Asp Glu
370 375 380
Ala Ile Glu Ile Ala Leu Val Ala Glu Arg Gly Asn Arg His Thr Ala
385 390 395 400
Met Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Lys Leu
405 410 415
Leu Gln Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile
420 425 430
Gly Val Gly Gly Glu Gly Cys Thr Thr Phe Thr Ile Ala Gly Pro Thr
435 440 445
Gly Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys
450 455 460
Val Met Ser Asp Ala Leu His Ile Arg
465 470
<210> 110
<211> 471
<212> PRT
<213> Clostridium bolteae
<400> 110
Met Asp Met Asp Ile Lys Val Ile Glu Gln Leu Val Glu Gln Ala Leu
1 5 10 15
Lys Glu Ile Lys Ala Glu Gln Pro Leu Lys Phe Thr Ala Pro Lys Leu
20 25 30
Glu Arg Tyr Gly Val Phe Lys Thr Met Asp Glu Ala Ile Ala Ala Ser
35 40 45
Glu Glu Ala Gln Lys Lys Leu Leu Phe Ser Lys Ile Ser Asp Arg Gln
50 55 60
Lys Tyr Val Asp Val Ile Arg Ser Thr Ile Ile Lys Arg Glu Asn Leu
65 70 75 80
Glu Leu Ile Ser Arg Leu Ser Val Glu Glu Thr Glu Ile Gly Asp Tyr
85 90 95
Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly
100 105 110
Thr Glu Asp Leu Leu Thr Glu Ala Ile Thr Gly Asp Asn Gly Leu Thr
115 120 125
Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr
130 135 140
Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Ser Met Ile Ala
145 150 155 160
Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val
165 170 175
Ser Gln Met Thr Val Lys Met Leu Asn Lys Ala Leu Ile Asp Asn Gly
180 185 190
Ala Pro Pro Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn
195 200 205
Thr Asn Lys Met Ile Asp Asn Pro Ser Val Arg Leu Leu Val Ala Thr
210 215 220
Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
245 250 255
Asp Ile Asp Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser
275 280 285
Ile Cys Asp Tyr Leu Ile His His Met Lys Glu Asn Gly Ala Tyr Gln
290 295 300
Ile Thr Asp Pro Met Leu Leu Glu Gln Leu Val Ala Leu Val Thr Thr
305 310 315 320
Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Arg Tyr
325 330 335
Ile Leu Asp Lys Leu Gly Ile Thr Val Asp Ala Ser Val Arg Val Ile
340 345 350
Ile Met Glu Val Pro Lys Asp His Leu Leu Val Gln Glu Glu Met Met
355 360 365
Met Pro Ile Leu Pro Val Val Arg Val Ser Asp Val Asp Thr Ala Ile
370 375 380
Glu Tyr Ala His Gln Ala Glu His Gly Asn Arg His Thr Ala Met Met
385 390 395 400
His Ser Lys Asn Val Glu Lys Leu Ser Lys Met Ala Lys Ile Met Glu
405 410 415
Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val
420 425 430
Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu
435 440 445
Gly Leu Thr Ser Pro Arg Thr Phe Cys Arg Lys Arg Lys Cys Val Met
450 455 460
Thr Asp Ala Phe Ser Ile Arg
465 470
<210> 111
<211> 468
<212> PRT
<213> Eubacterium hallii
<400> 111
Met Asn Ile Asp Val Glu Leu Ile Glu Lys Val Val Lys Lys Val Leu
1 5 10 15
Asn Asp Val Glu Thr Gly Ser Ser Glu Ser Glu Tyr Gly Tyr Gly Ile
20 25 30
Phe Asp Thr Met Asp Glu Ala Ile Glu Ala Ser Ala Lys Ala Gln Lys
35 40 45
Glu Tyr Met Asn His Ser Met Ala Asp Arg Gln Arg Tyr Val Glu Gly
50 55 60
Ile Arg Glu Val Val Cys Thr Lys Glu Asn Leu Glu Tyr Met Ser Lys
65 70 75 80
Leu Ala Val Glu Glu Ser Gly Met Gly Ala Tyr Glu Tyr Lys Val Ile
85 90 95
Lys Asn Arg Leu Ala Ala Val Lys Ser Pro Gly Val Glu Asp Leu Thr
100 105 110
Thr Glu Ala Leu Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Cys
115 120 125
Pro Phe Gly Val Ile Gly Ala Ile Ala Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Ala Met Leu Ala Gly Gly Asn Thr Val
145 150 155 160
Val Phe Ser Pro His Pro Arg Ser Lys Gly Val Ser Ile Trp Leu Ile
165 170 175
Lys Lys Leu Asn Ala Lys Leu Glu Glu Leu Gly Ala Pro Arg Asn Leu
180 185 190
Ile Val Thr Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Ile Met Met
195 200 205
Asn His Pro Lys Val Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile
210 215 220
Val Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Val Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Ile Ala Val Asp Gln Ile Ala Asp Tyr Leu
275 280 285
Ile Phe Asn Met Lys Asn Asn Gly Ala Tyr Glu Val Lys Asp Pro Glu
290 295 300
Ile Ile Glu Lys Met Val Asp Leu Val Thr Lys Asp Arg Lys Lys Pro
305 310 315 320
Ala Val Asn Phe Val Gly Lys Ser Ala Gln Tyr Ile Leu Asp Lys Val
325 330 335
Gly Ile Lys Val Gly Pro Glu Val Lys Cys Ile Ile Met Glu Ala Pro
340 345 350
Lys Asp His Pro Phe Val Gln Ile Glu Leu Met Met Pro Ile Leu Pro
355 360 365
Ile Val Arg Val Pro Asn Val Asp Glu Ala Ile Asp Phe Ala Val Glu
370 375 380
Val Glu His Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val
385 390 395 400
Asp Lys Leu Thr Lys Met Ala Lys Glu Ile Glu Thr Thr Ile Phe Val
405 410 415
Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Met Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala
435 440 445
Lys Ser Phe Cys Arg Lys Arg Arg Cys Val Leu Gln Asp Gly Leu His
450 455 460
Ile Arg Met Lys
465
<210> 112
<211> 467
<212> PRT
<213> Halanaerobium saccharolyticum
<400> 112
Met Lys Ile Lys Glu Asn Glu Leu Asp Lys Ile Val Asn Gln Val Ile
1 5 10 15
Ser Ser Leu Asn Asn Lys Gln Asn Ser Asn Asp Phe Asn Thr Lys Ile
20 25 30
Asn Tyr Gly Ile Phe Ser Thr Met Asp Glu Ala Ile Ala Glu Ala Val
35 40 45
Lys Ala Gln Ala Cys Leu Gln Leu Asn Tyr Ser Thr Glu Ala Arg Glu
50 55 60
Lys Ile Ile Lys Ser Ile Arg Lys Asn Val Ser Lys His Val Glu Lys
65 70 75 80
Ile Ser Glu Met Ala Val Glu Glu Thr Asp Met Gly Arg Ile Glu Asp
85 90 95
Lys Ile Ile Lys Asn Asn Leu Ala Ile Asn Lys Thr Pro Gly Thr Glu
100 105 110
Asp Leu Arg Thr Glu Ala Phe Ser Gly Lys Lys Gly Leu Thr Ile Val
115 120 125
Glu Glu Ala Pro Phe Gly Val Ile Cys Ser Ile Ala Pro Val Thr Asn
130 135 140
Pro Thr Glu Thr Ile Ile Ser Asn Ala Ile Ser Met Ile Ala Ser Cys
145 150 155 160
Asn Gly Val Val Phe Asn Ser His Pro Gly Ala Lys Lys Val Ser Lys
165 170 175
Tyr Ile Ile Glu Val Leu Asn Lys Val Ile Met Glu Ala Gly Gly Pro
180 185 190
Glu Asn Leu Leu Thr Ala Val Asn Glu Pro Thr Leu Gln Thr Val Glu
195 200 205
Ser Cys Met Arg Asp Asp Arg Ile Ala Met Ile Val Ala Thr Gly Gly
210 215 220
Pro Gly Val Val Asn Ala Ala Leu Ser Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Asp Thr Val Asp Leu
245 250 255
Lys Arg Val Ala Lys Asp Ile Ile Asn Gly Ala Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Thr Ser Glu Lys Ala Ile Val Ala Leu Glu Ser Ile Ala
275 280 285
Asp Ser Leu Leu Asn Glu Met Thr Asn Gln Asn Ala Gln Leu Val His
290 295 300
Asp Ile Lys Ala Leu Glu Arg Val Ile Leu Asn Asp Asp Gly Ser Ile
305 310 315 320
Asn Lys Ala Leu Val Gly Lys Asp Ala Ala Phe Ile Leu Asn Lys Ala
325 330 335
Gly Leu Lys Ala Lys Ser Glu Asp Leu Arg Leu Val Ile Val Asp Val
340 345 350
Asp Leu Arg His Pro Phe Val Gln Lys Glu Gln Leu Met Pro Val Ile
355 360 365
Pro Leu Val Arg Ala Lys Asn Phe Asn Glu Ala Met Glu Met Gly Val
370 375 380
Asp Ile Glu Glu Gly Asn Arg His Thr Ala Ile Ile His Ser Lys Asn
385 390 395 400
Val Asp Asn Leu Thr Lys Phe Ala Lys Lys Ile Glu Thr Thr Ile Tyr
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Ala Gly Gly Glu Gly
420 425 430
Tyr Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser
435 440 445
Ala Arg Ser Phe Thr Arg Lys Arg Arg Cys Val Leu Val Asp Gly Phe
450 455 460
Ser Ile Ile
465
<210> 113
<211> 469
<212> PRT
<213> Eubacterium limosum
<400> 113
Met Asn Ile Asp Thr Thr Gly Ile Glu Tyr Ile Val Lys Lys Val Met
1 5 10 15
Asp Gln Ile Asp Tyr Ala Glu Glu Thr Gly Ala Pro Val Val Asp Gly
20 25 30
Lys Asp Gly Val Phe Gln Thr Met Asp Ala Ala Ile Glu Ala Ala Ala
35 40 45
Val Ala Gln Lys Glu Tyr Met Lys Lys Pro Leu Ala Leu Arg Arg Gln
50 55 60
Met Ile Ala Ala Met Arg Glu Ile Met Leu Lys Lys Glu Asn Ile Glu
65 70 75 80
Thr Ile Cys Ala Met Val Val Glu Glu Ser Gly Met Gly Asn Tyr Glu
85 90 95
His Lys Leu Ala Lys His Arg Leu Ala Thr Thr Gly Thr Pro Gly Val
100 105 110
Glu Asp Leu Leu Thr Glu Ala Trp Ala Gly Asp Asp Gly Cys Thr Leu
115 120 125
Leu Glu Leu Ser Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr Thr
130 135 140
Asn Pro Asn Glu Thr Ile Val Asn Asn Ser Ile Gly Met Leu Ala Ala
145 150 155 160
Gly Asn Ala Val Val Phe Ser Pro His Pro Lys Ala Leu Lys Thr Ser
165 170 175
Phe Leu Cys Ile Lys Leu Leu Asn Glu Ala Ile Val Ser Val Gly Gly
180 185 190
Pro Arg Asn Leu Ile Val Thr Cys Ala Asn Pro Thr Ile Glu Ala Ala
195 200 205
Asn Glu Met Met Val His Pro Lys Ile Arg Met Leu Val Ala Thr Gly
210 215 220
Gly Pro Gly Val Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Val Val Asp Gln Val
275 280 285
Ala Asp Tyr Leu Ile Phe Asn Met Lys Lys Asn Gly Ala Tyr Glu Ile
290 295 300
Thr Asp Lys Lys Ala Ile Asp Ala Leu Ala Asp Leu Val Cys Pro Glu
305 310 315 320
Gly Arg Leu Ser Arg Asp Phe Val Gly Lys Ser Ala Lys Tyr Ile Ala
325 330 335
Ala Ala Ala Gly Leu Asp Val Pro Glu Asp Thr Arg Val Leu Ile Cys
340 345 350
Glu Thr Ser Lys Asp His Leu Leu Ala Val Glu Glu Leu Met Met Pro
355 360 365
Ile Leu Pro Ile Val Arg Val Ala Asn Val Asp Glu Gly Ile Asp Val
370 375 380
Ala Val Glu Leu Glu His Gly Asn Arg His Thr Ala Ile Met His Ser
385 390 395 400
Lys Asn Val Asp Lys Leu Thr Glu Met Ala Lys Arg Ile Gln Thr Thr
405 410 415
Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly
420 425 430
Glu Gly Tyr Pro Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Ser Ala Lys Ser Phe Ala Arg Arg Arg Arg Cys Val Leu Val Gly
450 455 460
Gly Phe Asp Ile Lys
465
<210> 114
<211> 466
<212> PRT
<213> Thermoanaerobacter sp.
<400> 114
Met Ile Asp Glu Asn Leu Val Val Thr Ile Thr Lys Lys Ile Leu Asn
1 5 10 15
Glu Ile Asn Leu Lys Glu Ala Glu Glu Lys Lys Glu Lys Asp Asn Pro
20 25 30
Asp Leu Gly Ile Phe Asn Asp Val Asn Glu Ala Val Glu Cys Ala Lys
35 40 45
Glu Ala Gln Lys Lys Phe Ala Leu Met Asp Leu Glu Lys Arg Glu Glu
50 55 60
Ile Ile Ala Ala Ile Arg Glu Ala Cys Val Asn Asn Ala Arg Leu Leu
65 70 75 80
Ala Glu Ile Ala Cys Ser Glu Thr Gly Arg Gly Arg Val Glu Asp Lys
85 90 95
Val Ala Lys Asn Ile Leu Ala Ala Lys Lys Thr Pro Gly Thr Glu Asp
100 105 110
Leu Lys Pro Thr Ala Trp Thr Gly Asp Arg Gly Leu Thr Leu Val Glu
115 120 125
Met Ala Pro Val Gly Val Ile Ala Ser Ile Thr Pro Val Thr Asn Pro
130 135 140
Thr Ala Thr Ile Ile Asn Asn Thr Ile Ser Met Leu Ala Ala Gly Asn
145 150 155 160
Ala Val Val Phe Asn Pro His Pro Ser Ala Lys Lys Thr Ser Asn Lys
165 170 175
Ala Val Glu Ile Ile Asn Glu Ala Ile Leu Lys Val Gly Ala Pro Asn
180 185 190
Gly Leu Val Cys Ser Ile Asn Asn Pro Thr Ile Gln Thr Ala Gln Lys
195 200 205
Leu Met Glu His Pro Glu Val Asn Met Val Val Val Thr Gly Gly Lys
210 215 220
Ala Val Val Gln Thr Ala Leu Arg Cys Gly Lys Lys Val Ile Gly Ala
225 230 235 240
Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Val
245 250 255
Lys Ala Ala His Asp Ile Ala Cys Gly Ala Ser Phe Asp Asn Asn Leu
260 265 270
Pro Cys Ile Ala Glu Lys Glu Ile Ile Ala Val Glu Arg Ile Ala Asp
275 280 285
Thr Leu Leu Glu Arg Met Lys Arg Glu Gly Ala Tyr Val Leu His Gly
290 295 300
Lys Asp Ile Asp Arg Met Thr Glu Leu Ile Phe Gln Gly Gly Ala Ile
305 310 315 320
Asn Lys Asp Leu Ile Gly Arg Asp Ala His Phe Ile Leu Ser Gln Ile
325 330 335
Gly Ile Glu Thr Gly Lys Asp Ile Arg Leu Val Val Met Pro Val Asp
340 345 350
Val Ser His Pro Leu Val Tyr His Glu Gln Leu Met Pro Val Ile Pro
355 360 365
Phe Val Thr Val Pro Thr Val Glu Glu Ala Ile Asn Leu Ala Val Lys
370 375 380
Ala Glu Gly Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val
385 390 395 400
Glu Asn Met Thr Ala Phe Ala Arg Ala Ile Gln Thr Thr Ile Phe Val
405 410 415
Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala
435 440 445
Arg Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Arg
450 455 460
Ile Val
465
<210> 115
<211> 529
<212> PRT
<213> Rhodospirillum rubrum
<400> 115
Met Asn Asp Gly Gln Ile Ala Ala Ala Val Ala Lys Val Leu Glu Ala
1 5 10 15
Tyr Gly Val Pro Ala Asp Pro Ser Ala Ala Ala Pro Ala Pro Ala Ala
20 25 30
Pro Val Ala Pro Ala Ala Pro Thr Ala Gly Ser Val Ser Glu Met Ile
35 40 45
Ala Arg Gly Ile Ala Lys Ala Ser Ser Asp Asp Gln Ile Ala Gln Ile
50 55 60
Val Ala Lys Val Val Gly Asp Tyr Ser Ala Gln Ala Ala Lys Pro Ala
65 70 75 80
Val Val Pro Gly Ala Ala Ala Ser Thr Glu Ala Gly Asp Gly Val Phe
85 90 95
Asp Thr Met Asp Ala Ala Val Asp Ala Ala Val Leu Ala Gln Gln Gln
100 105 110
Tyr Leu Leu Cys Ser Met Thr Asp Arg Gln Arg Phe Val Asp Gly Ile
115 120 125
Arg Glu Val Ile Leu Gln Lys Asp Thr Leu Glu Leu Ile Ser Arg Met
130 135 140
Ala Ala Glu Glu Thr Gly Met Gly Asn Tyr Glu His Lys Leu Ile Lys
145 150 155 160
Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly Thr Glu Asp Leu Thr Thr
165 170 175
Glu Ala Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Ser Pro
180 185 190
Phe Gly Ala Ile Gly Ala Val Ala Pro Thr Thr Asn Pro Thr Glu Thr
195 200 205
Ile Ile Cys Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Ser Val Ile
210 215 220
Phe Ser Pro His Pro Arg Ala Thr Lys Val Ser Leu Leu Thr Val Lys
225 230 235 240
Leu Ile Asn Gln Lys Leu Ala Cys Leu Gly Ala Pro Ala Asn Leu Val
245 250 255
Val Thr Val Ser Lys Pro Ser Val Glu Asn Thr Asn Ala Met Met Ala
260 265 270
His Pro Lys Ile Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile Val
275 280 285
Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly
290 295 300
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
305 310 315 320
Leu Asp Ile Ile Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
325 330 335
Ala Glu Lys Glu Ile Ile Ala Val Ala Gln Ile Ala Asp Tyr Leu Ile
340 345 350
Phe Ser Met Lys Lys Gln Gly Ala Tyr Gln Ile Thr Asp Pro Ala Val
355 360 365
Leu Arg Lys Leu Gln Asp Leu Val Leu Thr Ala Lys Gly Gly Pro Gln
370 375 380
Thr Ser Cys Val Gly Lys Ser Ala Val Trp Leu Leu Asn Lys Ile Gly
385 390 395 400
Ile Glu Val Asp Ser Ser Val Lys Val Ile Leu Met Glu Val Pro Lys
405 410 415
Glu His Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Leu
420 425 430
Val Arg Val Ser Asp Val Asp Glu Ala Ile Ala Val Ala Ile Glu Val
435 440 445
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr Asn Val Arg
450 455 460
Lys Leu Thr Lys Met Ala Lys Leu Ile Gln Thr Thr Ile Phe Val Lys
465 470 475 480
Asn Gly Pro Ser Tyr Ala Gly Leu Gly Val Gly Gly Glu Gly Tyr Thr
485 490 495
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys
500 505 510
Ser Phe Ala Arg Lys Arg Lys Cys Val Met Val Glu Ala Leu Asn Ile
515 520 525
Arg
<210> 116
<211> 466
<212> PRT
<213> Eubacterium yurii
<400> 116
Met Asn Pro Glu Leu Leu Glu Asp Val Val Arg Gln Val Leu Ser Glu
1 5 10 15
Met Lys Leu Glu Ser Ser Lys Met Val Asp Ile Tyr Asn Tyr Gly Ile
20 25 30
Phe Asp Ser Val Asp Asp Ala Ile Asn Ala Ser Glu Ile Ala Gln Arg
35 40 45
Gln Leu Phe Glu Cys Ser Val Gln Lys Arg Asn Glu Tyr Val Asn Ala
50 55 60
Ile Arg Gln Ile Ile Leu Lys Lys Asp Asn Leu Glu Met Met Ser Arg
65 70 75 80
Asp Ala Val Glu Glu Thr Gly Ile Gly Arg Tyr Glu Asp Lys Ile Leu
85 90 95
Lys Asn Lys Leu Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu Ile
100 105 110
Thr Arg Ala Val Ser Gly Gln Asp Gly Leu Thr Leu Glu Glu Tyr Cys
115 120 125
Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Phe Ile Ser Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr Val
145 150 155 160
Val Phe Ser Pro His Pro Arg Ala Lys Asn Thr Ser Ile Lys Leu Val
165 170 175
Lys Leu Met Asn Lys Ala Leu Glu Gln Val Gly Ala Pro Arg Asn Leu
180 185 190
Ile Ser Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met Met
195 200 205
Asn His Pro Lys Ile Lys Met Leu Val Ala Thr Gly Gly Pro Ala Ile
210 215 220
Val Lys Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Val Ala Gly Ser Ser Phe Asp Asn Asn Val Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Phe Ala Val Glu Ser Ile Cys Asp Gln Leu
275 280 285
Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Thr Ser Tyr Glu
290 295 300
Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys Pro
305 310 315 320
Asn Thr Asp Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys Leu
325 330 335
Gly Ile Ser Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr Asn
340 345 350
Lys Asp His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu Pro
355 360 365
Ile Val Ser Val Ser Asp Val Asp Val Ala Ile Glu Tyr Ala Tyr Glu
370 375 380
Ala Glu His Arg Asn Arg His Thr Ala Ile Met His Ser Arg Asn Val
385 390 395 400
Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe Val
405 410 415
Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Pro
435 440 445
Lys Ser Phe Cys Arg Val Arg Arg Cys Thr Met Ser Asp Ser Phe Ser
450 455 460
Ile Arg
465
<210> 117
<211> 466
<212> PRT
<213> Eubacterium sp.
<400> 117
Met Asn Pro Glu Leu Leu Glu Asp Val Val Arg Gln Val Leu Ser Glu
1 5 10 15
Met Lys Leu Glu Ser Ser Lys Met Val Asp Ile Tyr Asn Tyr Gly Ile
20 25 30
Phe Asp Ser Val Asp Asp Ala Ile Asn Ala Ser Glu Ile Ala Gln Arg
35 40 45
Gln Leu Phe Glu Cys Ser Val Gln Lys Arg Asn Glu Tyr Val Asn Ala
50 55 60
Ile Arg Gln Ile Ile Leu Lys Lys Asp Asn Leu Glu Met Met Ser Arg
65 70 75 80
Asp Ala Val Glu Glu Thr Gly Ile Gly Arg Tyr Glu Asp Lys Ile Leu
85 90 95
Lys Asn Lys Leu Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu Ile
100 105 110
Thr Arg Ala Val Ser Gly Gln Asp Gly Leu Thr Leu Glu Glu Tyr Cys
115 120 125
Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Phe Ile Ser Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr Val
145 150 155 160
Val Phe Ser Pro His Pro Arg Ala Lys Asn Thr Ser Ile Lys Leu Val
165 170 175
Lys Leu Met Asn Lys Ala Leu Glu Gln Val Gly Ala Pro Arg Asn Leu
180 185 190
Ile Ser Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met Met
195 200 205
Asn His Pro Lys Ile Lys Met Leu Val Ala Thr Gly Gly Pro Ala Ile
210 215 220
Val Lys Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Val Ala Gly Ser Ser Phe Asp Asn Asn Val Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Phe Ala Val Glu Ser Ile Cys Asp Gln Leu
275 280 285
Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Thr Ser Tyr Glu
290 295 300
Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys Pro
305 310 315 320
Asn Thr Asp Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys Leu
325 330 335
Gly Ile Asn Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr Asn
340 345 350
Lys Asp His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu Pro
355 360 365
Ile Val Ser Val Ser Asp Val Asp Val Ala Ile Glu Tyr Ala Tyr Glu
370 375 380
Ala Glu His Arg Asn Arg His Thr Ala Ile Met His Ser Arg Asn Val
385 390 395 400
Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe Val
405 410 415
Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Pro
435 440 445
Lys Ser Phe Cys Arg Val Arg Arg Cys Thr Met Ser Asp Ser Phe Ser
450 455 460
Ile Arg
465
<210> 118
<211> 532
<212> PRT
<213> Vibrio sp.
<400> 118
Met Asn Glu Gln Glu Ile Ala His Ala Val Glu Asn Val Leu Ser Lys
1 5 10 15
Tyr Thr Asn Val Thr Ala Gln Asn Ala Glu Pro Val Ser Tyr Ser Ser
20 25 30
Asn Ala Ser Leu Glu Asn Ile Val Ser Gln Ala Leu Ala Gly Asn Met
35 40 45
Val Lys Gln Pro Glu Thr Gln Thr Ala Pro Asp Leu Asn Ser Asn Ile
50 55 60
Glu Asn Ile Val Ser Gln Ile Leu Ala Glu Asn Gln Ala Lys Pro Gln
65 70 75 80
Ser Val Gln Cys Gln Ser Ala Asn His Gly Thr Thr Glu Tyr Leu Gly
85 90 95
Cys Phe Ala Ser Met Glu Glu Ala Ile Ser Ala Ala Ser His Ala Gln
100 105 110
Val Gln Tyr Arg His Cys Thr Met Gly Asp Arg Ala Ser Phe Val Lys
115 120 125
Gly Ile Arg Glu Val Phe Thr Gln Asp Asp Val Leu Glu Lys Ile Ser
130 135 140
Arg Met Ala Val Glu Glu Thr Gly Met Gly Asn Tyr Ala Asp Lys Leu
145 150 155 160
Thr Lys Asn Arg Ile Ala Ala Thr Lys Thr Pro Gly Ile Glu Asp Leu
165 170 175
Thr Thr Ser Ala Leu Ser Gly Asp Ser Gly Leu Thr Leu Thr Glu Phe
180 185 190
Ser Ala Tyr Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr
195 200 205
Glu Thr Ile Ile Asn Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Thr
210 215 220
Val Val Tyr Ser Pro His Pro Arg Ser Arg Asn Val Ser Leu Val Ala
225 230 235 240
Val Asp Leu Ile Asn Arg Lys Leu Ala Glu Leu Gly Ala Pro Ala Asn
245 250 255
Leu Val Val Thr Val Leu Glu Pro Ser Ile Asp Asn Thr Asn Ala Met
260 265 270
Met Asn Asp Pro Arg Val Asn Met Leu Val Ala Thr Gly Gly Pro Ser
275 280 285
Ile Val Lys Thr Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly
290 295 300
Ala Gly Asn Pro Pro Ala Val Val Asp Glu Thr Ala Asn Ile Glu Lys
305 310 315 320
Ala Ala Lys Asp Ile Ile Asn Gly Cys Ala Phe Asp Asn Asn Leu Pro
325 330 335
Cys Ile Ala Glu Lys Glu Val Ile Val Val Asn Glu Val Ala Asp Tyr
340 345 350
Leu Ile His Cys Met Lys Lys Ser Gly Ala Tyr Leu Leu Cys Asp Lys
355 360 365
Gln Lys Ile Gln Gln Leu Gln Ser Leu Val Leu Asn Glu Lys Gly Thr
370 375 380
Gly Pro Asn Thr Ser Phe Val Gly Lys Gly Ala Arg Tyr Ile Leu Asp
385 390 395 400
Lys Leu Asn Ile Gln Val Ser Asp Asp Ile Lys Val Ile Leu Ile Glu
405 410 415
Thr Glu Arg Asn His Pro Phe Val Val His Glu Leu Met Met Pro Ile
420 425 430
Leu Pro Val Val Arg Val Glu Asn Val Asp Glu Ala Ile Asp Leu Ala
435 440 445
Ile Lys Val Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr
450 455 460
Asn Val Glu Lys Leu Ser Lys Met Ala Arg Leu Ile Gln Thr Thr Ile
465 470 475 480
Phe Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu
485 490 495
Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr
500 505 510
Ser Ala Arg Ser Phe Ala Arg Tyr Arg Arg Cys Val Met Val Glu Ala
515 520 525
Leu Asn Ile Arg
530
<210> 119
<211> 467
<212> PRT
<213> Eubacteriaceae bacterium
<400> 119
Met Asn Ala Glu Leu Leu Gln Asp Val Val Arg Gln Val Leu Ser Glu
1 5 10 15
Met Lys Leu Glu Ser Ser Asn Ile Leu Ser Asn Glu Tyr Asn Tyr Gly
20 25 30
Ile Phe Asp Asp Met Glu Ala Ala Ile Asn Ala Ser Glu Thr Ala Gln
35 40 45
Arg Lys Leu Phe Glu Cys Ser Val Gln Gln Arg Asn Glu Phe Ala Asn
50 55 60
Val Ile Arg Lys Glu Ile Leu Lys Lys Asp Asn Leu Glu Met Ile Ser
65 70 75 80
Arg Asp Ala Val Glu Glu Thr Glu Ile Gly Arg Phe Glu Asp Lys Ile
85 90 95
Leu Lys Asn Lys Val Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu
100 105 110
Thr Thr Arg Ala Ile Ser Gly Lys Asp Gly Leu Met Ile Glu Glu Tyr
115 120 125
Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr
130 135 140
Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr
145 150 155 160
Val Val Phe Ser Pro His Pro Arg Ala Lys Asn Val Ser Ile Lys Leu
165 170 175
Val Lys Met Met Asn Lys Ala Leu Glu Glu His Gly Ala Pro Arg Asn
180 185 190
Met Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met
195 200 205
Met Ser Asn Pro Lys Val Lys Leu Leu Val Ala Thr Gly Gly Pro Phe
210 215 220
Ile Val Asn Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys
245 250 255
Ala Ala Ile Asp Ile Val Ser Gly Ala Ser Phe Asp Asn Asn Val Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser Ile Ser Asp Met
275 280 285
Leu Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Val Ser Gln
290 295 300
Asp Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys
305 310 315 320
Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys
325 330 335
Leu Gly Ile Tyr Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr
340 345 350
Ser Lys Asn His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu
355 360 365
Pro Ile Val Ser Val Ser Asp Val Asp Ile Ala Ile Glu Tyr Ala Tyr
370 375 380
Glu Ala Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn
385 390 395 400
Val Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu Gly
420 425 430
His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser
435 440 445
Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met His Asp Ser Phe
450 455 460
Ser Ile Arg
465
<210> 120
<211> 473
<212> PRT
<213> Propionibacterium propionicum
<400> 120
Met Lys Ile Asp Pro Ala Gln Leu Glu Ala Thr Ile Arg Glu Val Leu
1 5 10 15
Ala Ala Met Leu Pro Gly Asn Asp Asn Gln Thr Glu Ala Pro Ala Thr
20 25 30
Gln Gln Glu Ala Pro Gly Asp Gly Val Phe Ala Asp Met Asp Ser Ala
35 40 45
Val Glu Ala Ala His Leu Ala Gln Arg Glu Tyr Leu Ser His Pro Met
50 55 60
Ala Asp Arg Arg Arg Tyr Val Ala Ala Ile Arg Glu Ala Met Leu Ala
65 70 75 80
Pro Glu Ala Leu Asp Tyr Met Ser Glu Gln Ala Val Ala Gln Ser Gly
85 90 95
Met Gly Asp Val Gly His Lys Tyr Leu Lys Asn Lys Val Ala Ala Ala
100 105 110
Glu Thr Pro Gly Val Glu Asp Leu Val Thr Glu Ala Trp Ser Gly Asp
115 120 125
Asp Gly Leu Thr Thr Ile Glu Tyr Ser Pro Tyr Gly Val Ile Gly Ala
130 135 140
Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile Thr Cys Asn Ser Ile
145 150 155 160
Gly Met Leu Ala Ala Gly Asn Ala Val Val Phe Ser Pro His Pro Arg
165 170 175
Val Ala Lys Leu Ser Cys Trp Gln Val Arg Arg Ile Asn Arg Ala Leu
180 185 190
Arg Ala Ala Gly Ala Pro Asp Asn Leu Val Val Thr Val Thr Ala Pro
195 200 205
Ser Leu Glu Asn Thr Asn Ala Met Met Ala His Pro Lys Val Arg Met
210 215 220
Leu Val Ala Thr Gly Gly Pro Gly Ile Val Lys Ala Val Leu Ser Ser
225 230 235 240
Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Ala Val Val
245 250 255
Asp Glu Thr Ala Asp Ile Glu His Ala Ala Lys Cys Ile Val Asp Gly
260 265 270
Ala Ser Phe Asp Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Ile Ile
275 280 285
Ala Val Asp Ser Ile Ala Asp Met Leu Lys Phe Cys Met Ile Lys His
290 295 300
Gly Ala Tyr Glu Ala Thr Ala Ser Glu Val Ala Glu Leu Glu Lys Leu
305 310 315 320
Leu Val Asn Gly Asp Lys Pro Arg Thr Glu Trp Val Gly Lys Pro Ala
325 330 335
Ala Lys Ile Leu Glu Ala Ile Gly Val Thr Pro Pro Pro Gly Val Arg
340 345 350
Leu Ile Val Cys Glu Ala Ser Ala Thr His Pro Phe Val Val His Glu
355 360 365
Leu Met Met Pro Val Leu Gly Leu Val Arg Val Pro Asp Val Asp Ala
370 375 380
Ala Ile Asp Leu Ala Val Glu Leu Glu His Gly Asn Arg His Thr Ala
385 390 395 400
Val Met His Ser Leu Asn Val Ser Lys Leu Thr Lys Met Gly Lys Leu
405 410 415
Ile Gln Thr Thr Ile Phe Val Lys Asn Gly Pro Ser Tyr Asn Gly Ile
420 425 430
Gly Ile Gly Gly Glu Gly Tyr Pro Thr Phe Thr Ile Ala Gly Pro Thr
435 440 445
Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Thr Arg Lys Arg Arg Cys
450 455 460
Val Leu Val Gly Asp Leu Asn Val Arg
465 470
<210> 121
<211> 467
<212> PRT
<213> Eubacteriaceae bacterium
<400> 121
Met Asn Ala Glu Leu Leu Gln Asp Val Val Arg Gln Val Leu Ser Glu
1 5 10 15
Met Lys Leu Glu Ser Ser Asn Ile Leu Ser Asn Glu Tyr Asn Tyr Gly
20 25 30
Ile Phe Asp Asp Met Glu Ala Ala Ile Asn Ala Ser Glu Thr Ala Gln
35 40 45
Arg Lys Leu Phe Glu Cys Ser Val Gln Gln Arg Asn Glu Phe Ala Asn
50 55 60
Val Ile Arg Lys Glu Ile Leu Lys Lys Asp Asn Leu Glu Met Ile Ser
65 70 75 80
Arg Asp Ala Val Glu Glu Thr Glu Ile Gly Arg Phe Glu Asp Lys Ile
85 90 95
Leu Lys Asn Lys Val Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu
100 105 110
Thr Thr Arg Ala Leu Thr Gly Lys Asp Gly Leu Met Ile Glu Glu Tyr
115 120 125
Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr
130 135 140
Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr
145 150 155 160
Val Val Phe Ser Pro His Pro Arg Ala Lys Asn Val Ser Ile Lys Leu
165 170 175
Val Lys Met Met Asn Lys Ala Leu Glu Glu Tyr Gly Ala Pro Arg Asn
180 185 190
Met Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met
195 200 205
Met Ser Asn Pro Lys Val Lys Leu Leu Val Ala Thr Gly Gly Pro Phe
210 215 220
Ile Val Asn Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys
245 250 255
Ala Ala Ile Asp Ile Val Ser Gly Ala Ser Phe Asp Asn Asn Val Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser Ile Ser Asp Met
275 280 285
Leu Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Val Ser Gln
290 295 300
Asp Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys
305 310 315 320
Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys
325 330 335
Leu Gly Ile Tyr Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr
340 345 350
Ser Lys Asn His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu
355 360 365
Pro Ile Val Ser Val Ser Asp Val Asp Ile Ala Ile Glu Tyr Ala Tyr
370 375 380
Glu Ala Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn
385 390 395 400
Val Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu Gly
420 425 430
His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser
435 440 445
Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met His Asp Ser Phe
450 455 460
Ser Ile Arg
465
<210> 122
<211> 467
<212> PRT
<213> Eubacteriaceae bacterium
<400> 122
Met Asn Ala Glu Leu Leu Gln Asp Val Val Arg Gln Val Leu Ser Glu
1 5 10 15
Met Lys Leu Glu Ser Ser Asn Ile Leu Ser Asn Glu Tyr Asn Tyr Gly
20 25 30
Ile Phe Asp Asp Met Glu Ala Ala Ile Asn Ala Ser Glu Thr Ala Gln
35 40 45
Arg Lys Leu Phe Glu Cys Ser Val Gln Gln Arg Asn Glu Phe Ala Asn
50 55 60
Val Ile Arg Arg Glu Val Leu Lys Lys Asp Asn Leu Glu Met Ile Ser
65 70 75 80
Arg Asp Ala Val Glu Glu Thr Glu Ile Gly Arg Phe Glu Asp Lys Ile
85 90 95
Leu Lys Asn Lys Val Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu
100 105 110
Thr Thr Arg Ala Leu Thr Gly Lys Asp Gly Leu Met Ile Glu Glu Tyr
115 120 125
Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr
130 135 140
Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr
145 150 155 160
Val Val Phe Ser Pro His Pro Arg Ala Lys Asn Val Ser Ile Lys Leu
165 170 175
Val Lys Met Met Asn Lys Ala Leu Glu Glu Tyr Gly Ala Pro Arg Asn
180 185 190
Met Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met
195 200 205
Met Ser Asn Pro Lys Val Lys Leu Leu Val Ala Thr Gly Gly Pro Phe
210 215 220
Ile Val Asn Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys
245 250 255
Ala Ala Ile Asp Ile Val Ser Gly Ala Ser Phe Asp Asn Asn Val Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser Ile Ser Asp Met
275 280 285
Leu Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Val Ser Gln
290 295 300
Asp Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys
305 310 315 320
Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys
325 330 335
Leu Gly Ile Tyr Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr
340 345 350
Ser Lys Asn His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu
355 360 365
Pro Ile Val Ser Val Ser Asp Val Asp Ile Ala Ile Glu Tyr Ala Tyr
370 375 380
Glu Ala Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn
385 390 395 400
Val Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu Gly
420 425 430
His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser
435 440 445
Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met His Asp Ser Phe
450 455 460
Ser Ile Arg
465
<210> 123
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 123
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 124
<211> 20
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 124
Leu Gln Lys Asn Asn Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp
1 5 10 15
Val Gly Lys Asp
20
<210> 125
<211> 15
<212> PRT
<213> Lactobacillus brevis
<400> 125
Ile Gly Pro Lys Gly Ala Pro Asp Arg Lys Phe Val Gly Lys Asp
1 5 10 15
<210> 126
<211> 14
<212> PRT
<213> Clostridium phytofermentans
<400> 126
Ile Thr Pro Lys Gly Leu Asn Arg Asn Cys Val Gly Lys Asp
1 5 10
<210> 127
<211> 18
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 127
Ser Phe Ala Gly Val Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr
1 5 10 15
Ile Ala
<210> 128
<211> 22
<212> PRT
<213> Lactobacillus brevis
<400> 128
Thr Tyr Cys Gly Thr Gly Val Ala Thr Asn Gly Ala His Ser Gly Ala
1 5 10 15
Ser Ala Leu Thr Ile Ala
20
<210> 129
<211> 18
<212> PRT
<213> Clostridium phytofermentans
<400> 129
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
1 5 10 15
Ile Ala
Claims (79)
- 하기 (a) 내지 (d)로부터 선택되는 단리된 핵산 분자:
(a) 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열을 코딩하며, 상기 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하는, 핵산 분자;
(b) 고 엄격성 혼성화 조건에서 (a)의 핵산에 혼성하며, 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 코딩하는 핵산 서열을 포함하는, 핵산 분자;
(c) 루프 A (서열번호 5) 및/또는 루프 B (서열번호 6)의 컨센서스 서열을 포함하는 아미노산 서열을 코딩하며, 상기 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하는, 핵산 분자; 및
(d) (a) 또는 (b)에 상보적인 핵산 분자. - 제1항에 있어서,
상기 하나 이상의 아미노산 치환을 제외한, 아미노산 서열이, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 기재된 아미노산 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 기재된 아미노산 서열과 동일한, 단리된 핵산 분자. - 제1항 또는 제2항에 있어서,
상기 아미노산 서열이 표 1, 2 및/또는 3에 표시된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 포함하는, 단리된 핵산 분자. - 제1항 내지 제3항 중 어느 한 항에 따른 핵산 분자를 포함하는 벡터.
- 제4항에 있어서,
상기 벡터가 발현 벡터인, 벡터. - 제4항 또는 제5항에 있어서,
상기 벡터가 이중 가닥 DNA를 포함하는, 벡터. - 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열을 포함하며, 상기 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하는 단리된 폴리펩타이드.
- 루프 A (서열번호 5) 및/또는 루프 B (서열번호 6)의 컨센서스 아미노산 서열을 포함하는, 단리된 폴리펩타이드.
- 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열을 포함하며;
상기 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하고;
상기 아미노산 서열이, 상기 하나 이상의 아미노산 치환을 제외하고는, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 기재된 아미노산 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 가지거나 또는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 기재된 아미노산 서열과 동일한,
단리된 폴리펩타이드. - 제9항에 있어서,
상기 아미노산 서열이, 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 제외한 1-100개의 아미노산 위치들에서 보존적인 아미노산 치환을 더 포함하는, 단리된 폴리펩타이드. - 제7항 내지 제10항 중 어느 한 항에 있어서,
상기 아미노산 서열이, 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환 아닌 2-300개의 아미노산 위치들에서 모 서열 (parent sequence)과 비교해 변형을 포함하지 않으며, 상기 위치가 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열들 중 2개, 3개, 4개 또는 5개의 서열 간에 동일한 위치들로부터 선택되는, 단리된 폴리펩타이드. - 제7항 내지 제11항 중 어느 한 항에 있어서,
상기 아미노산 서열이 표 1, 2 및/또는 3에 표시된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 포함하는, 단리된 폴리펩타이드. - 제7항 내지 제12항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 알데하이드 데하이드로게나제 (aldehyde dehydrogenase)를 코딩하는, 단리된 폴리펩타이드. - 제7항 내지 제13항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환할 수 있는, 단리된 폴리펩타이드. - 제7항 내지 제13항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있는, 단리된 폴리펩타이드. - 제7항 내지 제15항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 모 폴펩타이드에 비해 높은 활성을 가지는, 단리된 폴리펩타이드. - 제7항 내지 제14항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 3-하이드록시-(S)-부티릴-CoA 보다 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가지는, 단리된 폴리펩타이드. - 제7항 내지 제14항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 아세틸-CoA 보다 3-하이드록시부티릴-CoA에 대해 더 높은 특이성을 가지는, 단리된 폴리펩타이드. - 제7항 내지 제13항 또는 제15항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 아세틸-CoA에 비해 4-하이드록시부티릴-CoA에 대해 더 높은 특이성을 가지는, 단리된 폴리펩타이드. - 제7항 내지 제15항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 세포 또는 세포 추출물 내 부산물 감소를 유발하는, 단리된 폴리펩타이드. - 제20항에 있어서,
상기 부산물이 에탄올 또는 4-하이드록시-2-부타논인, 단리된 폴리펩타이드. - 제7항 내지 제15항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 모 폴리펩타이드 보다 높은 kcat를 가지는, 단리된 폴리펩타이드. - 제4항 내지 제6항 중 어느 한 항에 따른 벡터를 포함하는 세포.
- 제1항 내지 제3항 중 어느 한 항에 따른 핵산을 포함하는 세포.
- 제24항에 있어서,
상기 핵산 분자가 세포의 염색체에 병합 (integration)되는, 세포. - 제25항에 있어서,
상기 병합이 부위-특이적인, 세포. - 제23항 내지 제26항 중 어느 한 항에 있어서,
상기 핵산 분자가 발현되는, 세포. - 제7항 내지 제22항 중 어느 한 항에 따른 폴리펩타이드를 포함하는 세포.
- 제23항 내지 제28항 중 어느 한 항에 있어서,
상기 세포가 미생물 유기체인, 세포. - 제29항에 있어서,
상기 미생물 유기체가 박테리아, 효모 또는 진균인, 세포. - 제23항 내지 제28항 중 어느 한 항에 있어서,
상기 세포가 단리된 진핵생물 세포인, 세포. - 제23항 내지 제31항 중 어느 한 항에 있어서,
상기 세포가 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO) 또는 이의 에스테르 또는 아미드를 생산하는 경로를 포함하는, 세포. - 제23항 내지 제31항 중 어느 한 항에 있어서,
상기 세포가 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO) 또는 이의 에스테르 또는 아미드를 생산하는 경로를 포함하는, 세포. - 제23항 내지 제33항 중 어느 한 항에 있어서,
상기 세포가 발효할 수 있는, 세포. - 제23항 내지 제34항 중 어느 한 항에 있어서,
상기 폴리펩타이드에 대한 하나 이상의 기질을 더 포함하는, 세포. - 제35항에 있어서,
상기 기질이 3-하이드록시부티릴-CoA인, 세포. - 제36항에 있어서,
상기 기질이 3-하이드록시-(R)-부티릴-CoA인, 세포. - 제36항 또는 제37항에 있어서,
상기 세포가 3- 하이드록시-(S)-부티릴-CoA에 비해 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가지는, 세포. - 제35항에 있어서,
상기 기질이 4-하이드록시부티릴-CoA인, 세포. - 제7항 내지 제22항 중 어느 한 항에 따른 폴리펩타이드의 생체 촉매 (biocatalyst)로서의 용도.
- 제7항 내지 제22항 중 어느 한 항에 따른 폴리펩타이드; 및 상기 폴리펩타이드에 대한 하나 이상의 기질을 포함하는, 조성물.
- 제41항에 있어서,
상기 폴리펩타이드가 시험관 내 조건에서 상기 기질과 반응할 수 있는, 조성물. - 제41항 또는 제42항에 있어서,
상기 기질이 3-하이드록시부티릴-CoA인, 조성물. - 제43항에 있어서,
상기 기질이 3-하이드록시-(R)-부티릴-CoA인, 조성물. - 제41항 또는 제42항에 있어서,
상기 기질이 4-하이드록시부티릴-CoA인, 조성물. - 제23항 내지 제39항 중 어느 한 항에 따른 세포를 포함하는 배양 배지 (culture medium).
- 제4항 내지 제6항 중 어느 한 항에 따른 벡터를 발효할 수 있는 세포에 도입하는 것을 포함하는, 숙주 균주를 구축하는 방법.
- 제23항 내지 제39항 중 어느 한 항에 따른 세포를 배양하여, 3-HBal 및/또는 1,3-BDO, 또는 이의 에스테르 또는 아미드를 생산하는 것을 포함하는,
3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO) 또는 이의 에스테르 또는 아미드의 제조 방법. - 제23항 내지 제39항 중 어느 한 항에 따른 세포를 배양하여, 4-HBal 및/또는 1,4-BDO 또는 이의 에스테르 또는 아미드를 생산하는 것을 포함하는,
4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO) 또는 이의 에스테르 또는 아미드의 제조 방법. - 제48항 또는 제49항에 있어서,
상기 세포는 실질적으로 혐기성 배양 배지에 존재하는, 방법. - 제48항 내지 제50항 중 어느 한 항에 있어서,
3-HBal 및/또는 1,3- BDO, 또는 4-HBal 및/또는 1,4-BDO 또는 이의 에스테르 또는 아미드를 단리 또는 정제하는 것을 더 포함하는, 방법. - 제51항에 있어서,
상기 단리 또는 정제가 증류를 포함하는, 방법. - 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는 배양 배지로서,
상기 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 대기 이산화탄소 흡수원 (atmospheric carbon dioxide uptake source)임을 의미하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며;
상기 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 제23항 내지 제39항 중 어느 한 항에 따른 세포 또는 제48항 내지 제52항 중 어느 한 항에 따른 방법에 의해 생산된 것인, 배양 배지. - 제53항에 있어서,
상기 배양 배지가 세포로부터 분리된, 배양 배지. - 제23항 내지 제39항 중 어느 한 항에 따른 세포 또는 제48항 내지 제52항 중 어느 한 항에 따른 방법에 의해 생산되며; 대기 이산화탄소 흡수원임을 나타내는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가진, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO).
- 제55항에 있어서,
상기 3-HBal 및/또는 1,3-BDO, 또는 상기 4-HBal 및/또는 1,4-BDO가 80% 이상, 85% 이상, 90% 이상, 95% 이상 또는 98% 이상의 Fm 값을 가지는, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO. - 제23항 내지 제39항 중 어느 한 항에 따른 세포 또는 제48항 내지 제52항 중 어느 한 항에 따른 방법에 의해 생산된, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO).
- 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO)로서,
대기 이산화탄소 흡수원임을 나타내는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며,
3-HBal 및/또는 1,3-BDO가 제23항 내지 제39항 중 어느 한 항에 따른 세포 또는 제48항 내지 제52항 중 어느 한 항에 따른 방법에 의해 생산된 것이고,
상기 3-HBal 및/또는 1,3-BDO가 R 형태에 대해 거울상이성질체적으로 농화된 것인, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO). - 제58항에 있어서,
상기 3-HBal 및/또는 1,3-BDO가 80% 이상, 85% 이상, 90% 이상, 95% 이상 또는 98% 이상의 Fm 값을 가진, 3-HBal 및/또는 1,3-BDO. - 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO)로서,
상기 제23항 내지 제39항 중 어느 한 항에 따른 세포 또는 제48항 내지 제52항 중 어느 한 항에 따른 방법에 의해 생산된 것이며,
상기 3-HBal 및/또는 1,3-BDO가 R 형태에 대해 거울상이성질체적으로 농화된 것인, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO). - 제60항에 있어서,
상기 R 형태가 3-HBal 및/또는 1,3-BDO의 95% 보다 높은, 96% 보다 높은, 97% 보다 높은, 98% 보다 높은, 99% 보다 높은, 99.5% 보다 높은 또는 99.9% 보다 높은 비율인, 3-HBal 및/또는 1,3-BDO. - 제58항 내지 제61항 중 어느 한 항에 따른 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO; 및
3-HBal 및/또는 1,3-BDO, 또는 4-HBal 또는 1,4-BDO를 제외한 다른 화합물
을 각각 포함하는 조성물. - 제62항에 있어서,
상기 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 제외한 다른 화합물이, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 각각 생산하거나 또는 제7항 내지 제22항 중 어느 한 항에 따른 폴리펩타이드를 발현하는 세포의 일부인, 조성물. - 제55항 내지 제61항 중 어느 한 항에 따른 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO, 또는 상기 3-HBal 및/또는 1,3-BDO, 또는 4- HBal 및/또는 1,4-BDO를 생산하는 세포의 세포 용해물 (cell lysate) 또는 배양 상층액을 포함하는, 조성물.
- 제55항 내지 제61항 중 어느 한 항에 따른 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는 생산물 (product)로서,
상기 생산물이 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 폴리하이드록시알카노에이트, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG), 폴리부틸렌 테레프탈레이트 (PBT), 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 또는 부타다이엔-기재 생산물인, 생산물. - 제65항에 있어서,
상기 생산물이 코스메틱 제품 (cosmetic product) 또는 식품 첨가제인, 생산물. - 제65항 또는 제66항에 있어서,
생물 유래 3-HBal 및/또는 1,3-BDO 또는 생물 유래 4-HBal 및/또는 1,4-BDO를 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50%로 포함하는, 생산물. - 제65항 내지 제67항 중 어느 한 항에 있어서,
상기 생산물이 생산된 3-HBal 및/또는 1,3-BDO 또는 생산된 4-HBal 및/또는 1,4-BDO의 일부를 반복 유닛 (repeating unit)으로서 포함하는, 생산물. - 제65항, 제67항 또는 제68항 중 어느 한 항에 따른 생산물을 성형함으로써 수득되는 성형물 (molded product).
- 제65항 내지 제68항 중 어느 한 항에 따른 생산물을 제조하는 반응으로 3-HBal 및/또는 1,3-BDO 또는 4-HBal 및/또는 1,4-BDO를 자체적으로 또는 다른 화합물과 화학적으로 반응시키는 것을 포함하는,
제65항 내지 제68항 중 어느 한 항에 따른 생산물의 제조 방법. - 제69항에 따른 생산물을 제조하는 반응으로 3-HBal 및/또는 1,3-BDO 또는 4-HBal 및/또는 1,4-BDO를 자체적으로 또는 다른 화합물과 화학적으로 반응시키는 것을 포함하는,
제69항에 따른 생산물의 제조 방법. - 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법으로서,
제7항 내지 제22항 중 어느 한 항에 따른 폴리펩타이드에 기질을 제공하고,
상기 기질을 3-HBal 및/또는 1,3-BDO로 변환하는 것을 포함하며,
상기 기질이 1,3-하이드록시부티릴-CoA의 라세믹 혼합물인, 제조 방법. - 제72항에 있어서,
상기 3-HBal 및/또는 1,3-BDO가 R 형태에 대해 거울상이성질체적으로 농화된, 제조 방법. - 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO) 또는 이의 에스테르 또는 아미드의 제조 방법으로서,
제7항 내지 제22항 중 어느 한 항에 따른 폴리펩타이드에 기질을 제공하고,
상기 기질을 4-HBal 및/또는 1,4-BDO로 변환하는 것을 포함하며,
상기 기질이 1,4-하이드록시부티릴-CoA인, 방법. - 제72항 내지 제74항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 세포 내 또는 세포 용해물 내에 존재하거나, 또는 세포 또는 세포 용해물로부터 단리되는, 방법. - 3-HBal 및/또는 1,3-BDO 또는 4-HBal 및/또는 1,4-BDO의 제조 방법으로서,
제23항 내지 제39항 중 어느 한 항에 따른 세포의 세포 용해물을 인큐베이션하여, 3-HBal 및/또는 1,3-BDO 또는 4-HBal 및/또는 1,4-BDO를 제조하는 것을 포함하는, 제조 방법. - 제76항에 있어서,
상기 세포 용해물을 제2 세포 용해물과 혼합하고,
상기 제2 세포 용해물이 제7항 내지 제22항 중 어느 한 항에 따른 폴리펩타이드의 기질 또는 3-HBal 및/또는 1,3-BDO 또는 4-HBal 및/또는 1,4-BDO의 다운스트림 산물 (downstream product)을 생산하기 위한 효소 활성을 포함하는 것인, 제조 방법. - 세포에서 폴리펩타이드를 발현시키는 것을 포함하는, 제7항 내지 제22항 중 어느 한 항에 따른 폴리펩타이드의 제조 방법.
- 제1항 내지 제3항 중 어느 한 항에 따른 핵산 또는 제4항 내지 제6항에 따른 벡터를 시험관 내 전사 및 번역하여 폴리펩타이드를 제조하는 것을 포함하는,
제7항 내지 제22항 중 어느 한 항에 따른 폴리펩타이드의 제조 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020247007426A KR20240033193A (ko) | 2017-03-31 | 2018-03-29 | 알데하이드 데하이드로게나제 변이체 및 사용 방법 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762480194P | 2017-03-31 | 2017-03-31 | |
US62/480,194 | 2017-03-31 | ||
PCT/US2018/025122 WO2018183664A1 (en) | 2017-03-31 | 2018-03-29 | Aldehyde dehydrogenase variants and methods of use |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247007426A Division KR20240033193A (ko) | 2017-03-31 | 2018-03-29 | 알데하이드 데하이드로게나제 변이체 및 사용 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190134706A true KR20190134706A (ko) | 2019-12-04 |
KR102645531B1 KR102645531B1 (ko) | 2024-03-11 |
Family
ID=62002473
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247007426A KR20240033193A (ko) | 2017-03-31 | 2018-03-29 | 알데하이드 데하이드로게나제 변이체 및 사용 방법 |
KR1020197032015A KR102645531B1 (ko) | 2017-03-31 | 2018-03-29 | 알데하이드 데하이드로게나제 변이체 및 사용 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247007426A KR20240033193A (ko) | 2017-03-31 | 2018-03-29 | 알데하이드 데하이드로게나제 변이체 및 사용 방법 |
Country Status (9)
Country | Link |
---|---|
US (2) | US11299716B2 (ko) |
EP (1) | EP3601546A1 (ko) |
JP (2) | JP2020515255A (ko) |
KR (2) | KR20240033193A (ko) |
CN (1) | CN110730820A (ko) |
AU (1) | AU2018244459A1 (ko) |
BR (1) | BR112019020461A2 (ko) |
CA (1) | CA3058219A1 (ko) |
WO (1) | WO2018183664A1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109136161A (zh) * | 2009-12-10 | 2019-01-04 | 基因组股份公司 | 合成气或其他气态碳源和甲醇转化为1,3-丁二醇的方法和有机体 |
WO2018183640A1 (en) | 2017-03-31 | 2018-10-04 | Genomatica, Inc. | 3-hydroxybutyryl-coa dehydrogenase variants and methods of use |
WO2020068900A1 (en) * | 2018-09-26 | 2020-04-02 | Genomatica, Inc. | Aldehyde dehydrogenase variants and methods of using same |
CN112280722B (zh) * | 2019-07-23 | 2022-03-08 | 清华大学 | 用于生产光学纯1,3-丁二醇的重组菌及其应用 |
US20210403841A1 (en) * | 2020-03-12 | 2021-12-30 | Poet Research, Inc. | Enzymatic degradation of mycotoxins during grain processing |
CN112481229B (zh) * | 2020-11-25 | 2022-12-30 | 华东理工大学 | 一种ω转氨酶及其突变体、重组质粒、基因工程菌及其应用 |
WO2023069952A1 (en) * | 2021-10-20 | 2023-04-27 | Genomatica, Inc. | Aldehyde dehydrogenase variants and methods of use |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150115289A (ko) * | 2014-04-03 | 2015-10-14 | 삼성전자주식회사 | 알데히드 데히드로게나제 변이체, 상기 변이체를 코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를 포함하는 벡터 및 미생물, 및 이를 이용한 1,4-부탄디올의 생산방법 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1147229A2 (en) | 1999-02-02 | 2001-10-24 | Bernhard O. Palsson | Methods for identifying drug targets based on genomic sequence data |
US7711490B2 (en) | 2001-01-10 | 2010-05-04 | The Penn State Research Foundation | Method and system for modeling cellular metabolism |
US7127379B2 (en) | 2001-01-31 | 2006-10-24 | The Regents Of The University Of California | Method for the evolutionary design of biochemical reaction networks |
EP1381860A4 (en) | 2001-03-01 | 2008-10-15 | Univ California | MODELS AND METHOD FOR DETERMINING SYSTEMIC PROPERTIES OF REGULATED RESPONSE NETWORKS |
US20030224363A1 (en) | 2002-03-19 | 2003-12-04 | Park Sung M. | Compositions and methods for modeling bacillus subtilis metabolism |
AU2003222128A1 (en) | 2002-03-29 | 2003-10-13 | Genomatica, Inc. | Human metabolic models and methods |
US7856317B2 (en) | 2002-06-14 | 2010-12-21 | Genomatica, Inc. | Systems and methods for constructing genomic-based phenotypic models |
US8027821B2 (en) | 2002-07-10 | 2011-09-27 | The Penn State Research Foundation | Method for determining gene knockouts |
US7734420B2 (en) | 2002-10-15 | 2010-06-08 | The Regents Of The University Of California | Methods and systems to identify operational reaction pathways |
JP5551448B2 (ja) | 2007-03-16 | 2014-07-16 | ジェノマティカ・インコーポレイテッド | 1,4−ブタンジオールおよびその前駆体の生合成のための組成物および方法 |
US7947483B2 (en) | 2007-08-10 | 2011-05-24 | Genomatica, Inc. | Methods and organisms for the growth-coupled production of 1,4-butanediol |
US20090044719A1 (en) | 2007-08-14 | 2009-02-19 | Frost, Inc. | Trolley assembly with non-rotatable axle |
US8691553B2 (en) | 2008-01-22 | 2014-04-08 | Genomatica, Inc. | Methods and organisms for utilizing synthesis gas or other gaseous carbon sources and methanol |
WO2010030711A2 (en) | 2008-09-10 | 2010-03-18 | Genomatica, Inc. | Microorganisms for the production of 1,4-butanediol |
CN106119113A (zh) | 2009-04-30 | 2016-11-16 | 基因组股份公司 | 用于生产 1,3‑丁二醇的生物 |
US20100305519A1 (en) | 2009-06-02 | 2010-12-02 | Becton, Dickinson And Company | Cannula having an overlapping cannula feature and notch feature |
CN107384846B (zh) | 2009-06-04 | 2021-08-10 | 基因组股份公司 | 生产1,4-丁二醇的微生物和相关方法 |
MX2012004291A (es) | 2009-10-13 | 2012-08-17 | Genomatica Inc | Microorganismos para la produccion de 1,4-butanoidol, 4-hidroxibutanal, 4-hidroxibutiril-coa, putrescina y compuestos y metodos relacionados con los mismos. |
EP3312284A3 (en) | 2010-07-26 | 2018-05-30 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of aromatics, 2,4-pentadienoate and 1,3-butadiene |
WO2012177619A2 (en) * | 2011-06-22 | 2012-12-27 | Genomatica, Inc. | Microorganisms for producing 1,3-butanediol and methods related thereto |
AU2012272856A1 (en) * | 2011-06-22 | 2013-05-02 | Genomatica, Inc. | Microorganisms for producing 1,4-butanediol and methods related thereto |
BR112014005352A2 (pt) | 2011-09-08 | 2017-03-28 | Genomatica Inc | organismos eucarióticos e métodos para aumentar a disponibilidade de acetil-coa citosólico e para produzir 1,3-butanodiol |
GB201206192D0 (en) | 2012-04-05 | 2012-05-23 | Tdeltas Ltd | Ketone bodies and ketone body esters and for maintaining or improving muscle power output |
TW201410865A (zh) | 2012-06-04 | 2014-03-16 | Genomatica Inc | 製造4-羥基丁酸酯、1,4-丁二醇及相關化合物之微生物及方法 |
CN102965401B (zh) | 2012-11-14 | 2014-01-01 | 中国科学院微生物研究所 | 1,2,4-丁三醇的生物合成方法 |
EP2989113B1 (en) | 2013-04-26 | 2024-04-10 | Genomatica, Inc. | Microorganisms and methods for production of 4-hydroxybutyrate, 1,4-butanediol and related compounds |
US11814664B2 (en) | 2013-05-24 | 2023-11-14 | Genomatica, Inc. | Microorganisms and methods for producing (3R)-hydroxybutyl (3R)-hydroxybutyrate |
WO2014207099A1 (en) | 2013-06-26 | 2014-12-31 | Abengoa Bioenergia Nuevas Tecnologias S.A. | Anoxic biological production of fuels and of bulk chemicals from second generation feedstocks |
JP2020512351A (ja) | 2017-03-31 | 2020-04-23 | ジェノマティカ, インコーポレイテッド | 発酵ブロスから1,3−ブタンジオールを取得するためのプロセスおよびシステム |
WO2018183640A1 (en) | 2017-03-31 | 2018-10-04 | Genomatica, Inc. | 3-hydroxybutyryl-coa dehydrogenase variants and methods of use |
-
2018
- 2018-03-29 BR BR112019020461A patent/BR112019020461A2/pt unknown
- 2018-03-29 KR KR1020247007426A patent/KR20240033193A/ko active Search and Examination
- 2018-03-29 AU AU2018244459A patent/AU2018244459A1/en active Pending
- 2018-03-29 JP JP2019553009A patent/JP2020515255A/ja active Pending
- 2018-03-29 WO PCT/US2018/025122 patent/WO2018183664A1/en active Application Filing
- 2018-03-29 CN CN201880036524.2A patent/CN110730820A/zh active Pending
- 2018-03-29 US US16/499,531 patent/US11299716B2/en active Active
- 2018-03-29 KR KR1020197032015A patent/KR102645531B1/ko active IP Right Grant
- 2018-03-29 CA CA3058219A patent/CA3058219A1/en active Pending
- 2018-03-29 EP EP18718343.9A patent/EP3601546A1/en active Pending
-
2022
- 2022-03-17 US US17/697,504 patent/US20220325254A1/en active Pending
- 2022-08-10 JP JP2022127874A patent/JP2022159411A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150115289A (ko) * | 2014-04-03 | 2015-10-14 | 삼성전자주식회사 | 알데히드 데히드로게나제 변이체, 상기 변이체를 코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를 포함하는 벡터 및 미생물, 및 이를 이용한 1,4-부탄디올의 생산방법 |
Also Published As
Publication number | Publication date |
---|---|
JP2020515255A (ja) | 2020-05-28 |
US20200040312A1 (en) | 2020-02-06 |
CA3058219A1 (en) | 2018-10-04 |
WO2018183664A1 (en) | 2018-10-04 |
KR102645531B1 (ko) | 2024-03-11 |
BR112019020461A2 (pt) | 2020-06-09 |
AU2018244459A1 (en) | 2019-10-10 |
KR20240033193A (ko) | 2024-03-12 |
EP3601546A1 (en) | 2020-02-05 |
US11299716B2 (en) | 2022-04-12 |
US20220325254A1 (en) | 2022-10-13 |
CN110730820A (zh) | 2020-01-24 |
JP2022159411A (ja) | 2022-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102645531B1 (ko) | 알데하이드 데하이드로게나제 변이체 및 사용 방법 | |
US9657316B2 (en) | Microorganisms and methods for enhancing the availability of reducing equivalents in the presence of methanol, and for producing 1,4-butanediol related thereto | |
US20230416698A1 (en) | Aldehyde dehydrogenase variants and methods of using same | |
KR20120036851A (ko) | 사이클로헥사논의 제조를 위한 유기체 | |
US20230139515A1 (en) | 3-hydroxybutyryl-coa dehydrogenase variants and methods of use | |
US20230265397A1 (en) | Methanol dehydrogenase fusion proteins | |
US20140302575A1 (en) | MICROORGANISMS AND METHODS FOR ENHANCING THE AVAILABILITY OF REDUCING EQUIVALENTS IN THE PRESENCE OF METHANOL, AND FOR PRODUCING 1,2-PROPANEDIOL, n-PROPANOL, 1,3-PROPANEDIOL, OR GLYCEROL RELATED THERETO | |
US20220403420A1 (en) | Microorganisms and methods for increasing co-factors | |
KR20230003072A (ko) | 조작된 효소 및 이의 이용 및 제조 방법 | |
WO2023069957A1 (en) | Aldehyde dehydrogenase variants and methods of use | |
WO2023069952A1 (en) | Aldehyde dehydrogenase variants and methods of use | |
US20230287435A1 (en) | Microorganisms and methods for reducing by-products | |
WO2023034745A2 (en) | Formate dehydrogenase variants and methods of use | |
WO2022217064A2 (en) | Phosphoketolase variants and methods of use |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
A107 | Divisional application of patent | ||
GRNT | Written decision to grant |