KR20230134558A - 숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산 - Google Patents
숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산 Download PDFInfo
- Publication number
- KR20230134558A KR20230134558A KR1020237028215A KR20237028215A KR20230134558A KR 20230134558 A KR20230134558 A KR 20230134558A KR 1020237028215 A KR1020237028215 A KR 1020237028215A KR 20237028215 A KR20237028215 A KR 20237028215A KR 20230134558 A KR20230134558 A KR 20230134558A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- membrane protein
- lacto
- mdfa
- sequence
- Prior art date
Links
- 229920001542 oligosaccharide Polymers 0.000 title claims abstract description 351
- 150000002482 oligosaccharides Chemical class 0.000 title claims abstract description 350
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 83
- 108010052285 Membrane Proteins Proteins 0.000 claims abstract description 407
- 102000018697 Membrane Proteins Human genes 0.000 claims abstract description 264
- 238000000034 method Methods 0.000 claims abstract description 173
- 150000004043 trisaccharides Chemical class 0.000 claims abstract description 149
- 108700023372 Glycosyltransferases Proteins 0.000 claims abstract description 52
- 102000051366 Glycosyltransferases Human genes 0.000 claims abstract description 42
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 41
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 38
- RJTOFDPWCJDYFZ-UHFFFAOYSA-N lacto-N-triose Natural products CC(=O)NC1C(O)C(O)C(CO)OC1OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1O RJTOFDPWCJDYFZ-UHFFFAOYSA-N 0.000 claims abstract description 35
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 32
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 22
- 238000000746 purification Methods 0.000 claims abstract description 20
- 150000008195 galaktosides Chemical class 0.000 claims abstract description 12
- 238000012258 culturing Methods 0.000 claims abstract description 9
- 210000004027 cell Anatomy 0.000 claims description 387
- 108090000623 proteins and genes Proteins 0.000 claims description 218
- 108010078791 Carrier Proteins Proteins 0.000 claims description 154
- 102000004169 proteins and genes Human genes 0.000 claims description 141
- 239000012634 fragment Substances 0.000 claims description 106
- 241000588724 Escherichia coli Species 0.000 claims description 95
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 claims description 79
- 239000008101 lactose Substances 0.000 claims description 79
- 239000000203 mixture Substances 0.000 claims description 75
- 230000014509 gene expression Effects 0.000 claims description 72
- 241001608472 Bifidobacterium longum Species 0.000 claims description 68
- 238000006460 hydrolysis reaction Methods 0.000 claims description 67
- 229940009291 bifidobacterium longum Drugs 0.000 claims description 66
- 108010013381 Porins Proteins 0.000 claims description 54
- IEQCXFNWPAHHQR-UHFFFAOYSA-N lacto-N-neotetraose Natural products OCC1OC(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)C(NC(=O)C)C(O)C1OC1OC(CO)C(O)C(O)C1O IEQCXFNWPAHHQR-UHFFFAOYSA-N 0.000 claims description 54
- AXQLFFDZXPOFPO-UHFFFAOYSA-N UNPD216 Natural products O1C(CO)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(=O)C)C1OC(C1O)C(O)C(CO)OC1OC1C(O)C(O)C(O)OC1CO AXQLFFDZXPOFPO-UHFFFAOYSA-N 0.000 claims description 53
- 102000017033 Porins Human genes 0.000 claims description 52
- 239000001963 growth medium Substances 0.000 claims description 51
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 50
- 229940062780 lacto-n-neotetraose Drugs 0.000 claims description 47
- AXQLFFDZXPOFPO-UNTPKZLMSA-N beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O([C@@H]1O[C@H](CO)[C@H](O)[C@@H]([C@H]1O)O[C@H]1[C@@H]([C@H]([C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)NC(=O)C)[C@H]1[C@H](O)[C@@H](O)[C@H](O)O[C@@H]1CO AXQLFFDZXPOFPO-UNTPKZLMSA-N 0.000 claims description 46
- USIPEGYTBGEPJN-UHFFFAOYSA-N lacto-N-tetraose Natural products O1C(CO)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(=O)C)C1OC1C(O)C(CO)OC(OC(C(O)CO)C(O)C(O)C=O)C1O USIPEGYTBGEPJN-UHFFFAOYSA-N 0.000 claims description 46
- 239000002609 medium Substances 0.000 claims description 43
- 239000006228 supernatant Substances 0.000 claims description 43
- 241001646716 Escherichia coli K-12 Species 0.000 claims description 40
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 claims description 39
- 238000012546 transfer Methods 0.000 claims description 35
- LFTYTUAZOPRMMI-UHFFFAOYSA-N UNPD164450 Natural products O1C(CO)C(O)C(O)C(NC(=O)C)C1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-UHFFFAOYSA-N 0.000 claims description 33
- 229930006000 Sucrose Natural products 0.000 claims description 32
- 239000005720 sucrose Substances 0.000 claims description 32
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 31
- 229910052799 carbon Inorganic materials 0.000 claims description 29
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 28
- 150000002772 monosaccharides Chemical class 0.000 claims description 27
- 125000003729 nucleotide group Chemical group 0.000 claims description 26
- 239000002773 nucleotide Substances 0.000 claims description 25
- LQEBEXMHBLQMDB-UHFFFAOYSA-N GDP-L-fucose Natural products OC1C(O)C(O)C(C)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C3=C(C(N=C(N)N3)=O)N=C2)O1 LQEBEXMHBLQMDB-UHFFFAOYSA-N 0.000 claims description 23
- LQEBEXMHBLQMDB-JGQUBWHWSA-N GDP-beta-L-fucose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C3=C(C(NC(N)=N3)=O)N=C2)O1 LQEBEXMHBLQMDB-JGQUBWHWSA-N 0.000 claims description 23
- 230000002018 overexpression Effects 0.000 claims description 23
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 22
- 235000000346 sugar Nutrition 0.000 claims description 22
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 21
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 claims description 21
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 claims description 21
- 229950006780 n-acetylglucosamine Drugs 0.000 claims description 21
- 241000588917 Citrobacter koseri Species 0.000 claims description 20
- LFTYTUAZOPRMMI-CFRASDGPSA-N UDP-N-acetyl-alpha-D-glucosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](O)[C@@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-CFRASDGPSA-N 0.000 claims description 20
- 241000043489 Yokenella regensburgei Species 0.000 claims description 19
- 244000005700 microbiome Species 0.000 claims description 19
- 239000002243 precursor Substances 0.000 claims description 19
- TXCIAUNLDRJGJZ-UHFFFAOYSA-N CMP-N-acetyl neuraminic acid Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-UHFFFAOYSA-N 0.000 claims description 18
- TXCIAUNLDRJGJZ-BILDWYJOSA-N CMP-N-acetyl-beta-neuraminic acid Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@]1(C(O)=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-BILDWYJOSA-N 0.000 claims description 18
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 18
- 241000881813 Pluralibacter gergoviae Species 0.000 claims description 18
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 18
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 claims description 17
- 239000007788 liquid Substances 0.000 claims description 17
- 241000894006 Bacteria Species 0.000 claims description 16
- 239000005715 Fructose Substances 0.000 claims description 16
- 241001138501 Salmonella enterica Species 0.000 claims description 16
- 241000607762 Shigella flexneri Species 0.000 claims description 16
- 239000012527 feed solution Substances 0.000 claims description 16
- MVMSCBBUIHUTGJ-UHFFFAOYSA-N 10108-97-1 Natural products C1=2NC(N)=NC(=O)C=2N=CN1C(C(C1O)O)OC1COP(O)(=O)OP(O)(=O)OC1OC(CO)C(O)C(O)C1O MVMSCBBUIHUTGJ-UHFFFAOYSA-N 0.000 claims description 15
- MVMSCBBUIHUTGJ-GDJBGNAASA-N GDP-alpha-D-mannose Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H]1O)O)N1C=2N=C(NC(=O)C=2N=C1)N)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@@H]1O MVMSCBBUIHUTGJ-GDJBGNAASA-N 0.000 claims description 15
- 241000282414 Homo sapiens Species 0.000 claims description 15
- 241000588747 Klebsiella pneumoniae Species 0.000 claims description 15
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 claims description 15
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 claims description 15
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 claims description 15
- 150000002016 disaccharides Chemical class 0.000 claims description 15
- 229930182830 galactose Natural products 0.000 claims description 15
- 239000008103 glucose Substances 0.000 claims description 15
- 235000020256 human milk Nutrition 0.000 claims description 15
- 239000000243 solution Substances 0.000 claims description 15
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 claims description 14
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 14
- 239000002253 acid Substances 0.000 claims description 14
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 14
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 14
- LFTYTUAZOPRMMI-NESSUJCYSA-N UDP-N-acetyl-alpha-D-galactosamine Chemical group O1[C@H](CO)[C@H](O)[C@H](O)[C@@H](NC(=O)C)[C@H]1O[P@](O)(=O)O[P@](O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-NESSUJCYSA-N 0.000 claims description 13
- 239000012528 membrane Substances 0.000 claims description 13
- 238000000108 ultra-filtration Methods 0.000 claims description 13
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 claims description 12
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 claims description 12
- LFTYTUAZOPRMMI-ZYQOOJPVSA-N UDP-N-acetyl-alpha-D-mannosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](O)[C@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-ZYQOOJPVSA-N 0.000 claims description 12
- 230000012010 growth Effects 0.000 claims description 12
- 229930091371 Fructose Natural products 0.000 claims description 11
- 240000008042 Zea mays Species 0.000 claims description 11
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 11
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 11
- PDWGIAAFQACISG-QZBWVFMZSA-N beta-D-Gal-(1->3)-beta-D-GlcNAc-(1->3)-[beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->6)]-beta-D-Gal-(1->4)-D-Glc Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)OC[C@@H]1[C@@H]([C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](O)[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O1)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O PDWGIAAFQACISG-QZBWVFMZSA-N 0.000 claims description 11
- NPPRJALWPIXIHO-PNCMPRLYSA-N beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->3)-[beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->6)]-beta-D-Gal-(1->4)-D-Glc Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)OC[C@@H]1[C@@H]([C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O[C@H]3[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O3)O)[C@@H](CO)O2)NC(C)=O)[C@@H](O)[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O1)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O NPPRJALWPIXIHO-PNCMPRLYSA-N 0.000 claims description 11
- IEQCXFNWPAHHQR-YKLSGRGUSA-N beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->3)-beta-D-Gal-(1->4)-D-Glc Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O IEQCXFNWPAHHQR-YKLSGRGUSA-N 0.000 claims description 11
- 235000005822 corn Nutrition 0.000 claims description 11
- 230000002068 genetic effect Effects 0.000 claims description 11
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 claims description 11
- 210000004251 human milk Anatomy 0.000 claims description 11
- 238000001728 nano-filtration Methods 0.000 claims description 11
- 239000000758 substrate Substances 0.000 claims description 11
- 150000008163 sugars Chemical class 0.000 claims description 11
- 239000002028 Biomass Substances 0.000 claims description 10
- 241000588923 Citrobacter Species 0.000 claims description 10
- 241000920610 Citrobacter youngae Species 0.000 claims description 10
- 241000988643 Cronobacter muytjensii Species 0.000 claims description 10
- 241001135265 Cronobacter sakazakii Species 0.000 claims description 10
- 241000196324 Embryophyta Species 0.000 claims description 10
- 241000043309 Enterobacter hormaechei Species 0.000 claims description 10
- 241000341934 Franconibacter pulveris LMG 24059 Species 0.000 claims description 10
- 241000697618 Klebsiella michiganensis Species 0.000 claims description 10
- 241000588749 Klebsiella oxytoca Species 0.000 claims description 10
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 claims description 10
- 101150071725 SMDT1 gene Proteins 0.000 claims description 10
- INJACODUUNZJCO-NAGKVERXSA-N UDP-N-acetyl-beta-L-fucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 INJACODUUNZJCO-NAGKVERXSA-N 0.000 claims description 10
- 238000007792 addition Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 10
- ZDZMLVPSYYRJNI-CYQYEHMMSA-N p-lacto-n-hexaose Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1N=C(C)O)O[C@@H]1[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)OC([C@@H]1O)CO[C@H]1[C@@H]([C@H](C(O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)O1)O)N=C(O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O ZDZMLVPSYYRJNI-CYQYEHMMSA-N 0.000 claims description 10
- 241000274790 Bradyrhizobium diazoefficiens USDA 110 Species 0.000 claims description 9
- HMFHBZSHGGEWLO-IOVATXLUSA-N D-xylofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@H]1O HMFHBZSHGGEWLO-IOVATXLUSA-N 0.000 claims description 9
- 108010019236 Fucosyltransferases Proteins 0.000 claims description 9
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 claims description 9
- 108090000141 Sialyltransferases Proteins 0.000 claims description 9
- 102000003838 Sialyltransferases Human genes 0.000 claims description 9
- 210000004102 animal cell Anatomy 0.000 claims description 9
- UTVHXMGRNOOVTB-IXBJWXGWSA-N beta-D-Galp-(1->4)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)[C@H](NC(C)=O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O UTVHXMGRNOOVTB-IXBJWXGWSA-N 0.000 claims description 9
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 claims description 9
- 150000001875 compounds Chemical class 0.000 claims description 9
- 101150010108 xylF gene Proteins 0.000 claims description 9
- 102000006471 Fucosyltransferases Human genes 0.000 claims description 8
- 108060003306 Galactosyltransferase Proteins 0.000 claims description 8
- 102000030902 Galactosyltransferase Human genes 0.000 claims description 8
- 108010055629 Glucosyltransferases Proteins 0.000 claims description 8
- 102000000340 Glucosyltransferases Human genes 0.000 claims description 8
- 108010087568 Mannosyltransferases Proteins 0.000 claims description 8
- 102000006722 Mannosyltransferases Human genes 0.000 claims description 8
- 230000001976 improved effect Effects 0.000 claims description 8
- 238000000926 separation method Methods 0.000 claims description 8
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 claims description 7
- 108010092364 Glucuronosyltransferase Proteins 0.000 claims description 7
- 102000016354 Glucuronosyltransferase Human genes 0.000 claims description 7
- 241000498833 Kluyvera ascorbata Species 0.000 claims description 7
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 claims description 7
- QUOQJNYANJQSDA-MHQSSNGYSA-N Sialyllacto-N-tetraose a Chemical compound O1C([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)O[C@@H]1[C@@H](O)[C@H](OC2[C@H]([C@H](OC3[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]3O)O)O[C@H](CO)[C@H]2O)NC(C)=O)O[C@H](CO)[C@@H]1O QUOQJNYANJQSDA-MHQSSNGYSA-N 0.000 claims description 7
- SFMRPVLZMVJKGZ-JRZQLMJNSA-N Sialyllacto-N-tetraose b Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)OC[C@@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]2O)O)O1 SFMRPVLZMVJKGZ-JRZQLMJNSA-N 0.000 claims description 7
- DQQDLYVHOTZLOR-OCIMBMBZSA-N UDP-alpha-D-xylose Chemical compound C([C@@H]1[C@H]([C@H]([C@@H](O1)N1C(NC(=O)C=C1)=O)O)O)OP(O)(=O)OP(O)(=O)O[C@H]1OC[C@@H](O)[C@H](O)[C@H]1O DQQDLYVHOTZLOR-OCIMBMBZSA-N 0.000 claims description 7
- DQQDLYVHOTZLOR-UHFFFAOYSA-N UDP-alpha-D-xylose Natural products O1C(N2C(NC(=O)C=C2)=O)C(O)C(O)C1COP(O)(=O)OP(O)(=O)OC1OCC(O)C(O)C1O DQQDLYVHOTZLOR-UHFFFAOYSA-N 0.000 claims description 7
- 102000010199 Xylosyltransferases Human genes 0.000 claims description 7
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 claims description 7
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 7
- 229920005862 polyol Polymers 0.000 claims description 7
- 150000003077 polyols Chemical class 0.000 claims description 7
- MSWZFWKMSRAUBD-IVMDWMLBSA-N 2-amino-2-deoxy-D-glucopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-IVMDWMLBSA-N 0.000 claims description 6
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 claims description 6
- 241000588919 Citrobacter freundii Species 0.000 claims description 6
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 claims description 6
- 241001245440 Enterobacter kobei Species 0.000 claims description 6
- 241000238631 Hexapoda Species 0.000 claims description 6
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 claims description 6
- 102000007524 N-Acetylgalactosaminyltransferases Human genes 0.000 claims description 6
- 108010046220 N-Acetylgalactosaminyltransferases Proteins 0.000 claims description 6
- 108010042871 N-acetylmannosaminyltransferase Proteins 0.000 claims description 6
- 108010065282 UDP xylose-protein xylosyltransferase Proteins 0.000 claims description 6
- HDYANYHVCAPMJV-GXNRKQDOSA-N UDP-alpha-D-galacturonic acid Chemical compound C([C@@H]1[C@H]([C@H]([C@@H](O1)N1C(NC(=O)C=C1)=O)O)O)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](C(O)=O)[C@H](O)[C@H](O)[C@H]1O HDYANYHVCAPMJV-GXNRKQDOSA-N 0.000 claims description 6
- HDYANYHVCAPMJV-LXQIFKJMSA-N UDP-alpha-D-glucuronic acid Chemical compound C([C@@H]1[C@H]([C@H]([C@@H](O1)N1C(NC(=O)C=C1)=O)O)O)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O HDYANYHVCAPMJV-LXQIFKJMSA-N 0.000 claims description 6
- 210000002421 cell wall Anatomy 0.000 claims description 6
- 229930193965 lacto-N-fucopentaose Natural products 0.000 claims description 6
- 235000013336 milk Nutrition 0.000 claims description 6
- 239000008267 milk Substances 0.000 claims description 6
- 210000004080 milk Anatomy 0.000 claims description 6
- SXMGGNXBTZBGLU-UHFFFAOYSA-N sialyllacto-n-tetraose c Chemical compound OCC1OC(OC2C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C2O)O)C(NC(=O)C)C(O)C1OC(C(C(O)C1O)O)OC1COC1(C(O)=O)CC(O)C(NC(C)=O)C(C(O)C(O)CO)O1 SXMGGNXBTZBGLU-UHFFFAOYSA-N 0.000 claims description 6
- 150000004044 tetrasaccharides Chemical class 0.000 claims description 6
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 claims description 5
- HOEWKBQADMRCLO-YKNQQZBYSA-N (2r,4s,5r,6r)-2-[[(2r,3s,4r)-5-(4-amino-2-oxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-4-hydroxy-5-[(2-hydroxyacetyl)amino]-6-[(1r,2r)-1,2,3-trihydroxypropyl]oxane-2-carboxylic acid Chemical compound O=C1N=C(N)C=CN1C1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)O[C@@]2(O[C@H]([C@H](NC(=O)CO)[C@@H](O)C2)[C@H](O)[C@H](O)CO)C(O)=O)O1 HOEWKBQADMRCLO-YKNQQZBYSA-N 0.000 claims description 5
- DBTMGCOVALSLOR-UHFFFAOYSA-N 32-alpha-galactosyl-3-alpha-galactosyl-galactose Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(OC2C(C(CO)OC(O)C2O)O)OC(CO)C1O DBTMGCOVALSLOR-UHFFFAOYSA-N 0.000 claims description 5
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 claims description 5
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 claims description 5
- RXVWSYJTUUKTEA-UHFFFAOYSA-N D-maltotriose Natural products OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1OC1C(O)C(O)C(O)C(CO)O1 RXVWSYJTUUKTEA-UHFFFAOYSA-N 0.000 claims description 5
- 241000588914 Enterobacter Species 0.000 claims description 5
- 241000147019 Enterobacter sp. Species 0.000 claims description 5
- 241000233866 Fungi Species 0.000 claims description 5
- 102100021700 Glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1 Human genes 0.000 claims description 5
- 229920002488 Hemicellulose Polymers 0.000 claims description 5
- 101000896564 Homo sapiens Glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1 Proteins 0.000 claims description 5
- TVVLIFCVJJSLBL-SEHWTJTBSA-N Lacto-N-fucopentaose V Chemical compound O[C@H]1C(O)C(O)[C@H](C)O[C@H]1OC([C@@H](O)C=O)[C@@H](C(O)CO)O[C@H]1[C@H](O)[C@@H](OC2[C@@H](C(OC3[C@@H](C(O)C(O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](O)[C@@H](CO)O1 TVVLIFCVJJSLBL-SEHWTJTBSA-N 0.000 claims description 5
- 241000906159 Lelliottia sp. Species 0.000 claims description 5
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 claims description 5
- 229920002472 Starch Polymers 0.000 claims description 5
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 claims description 5
- 108090000636 UDP-4-amino-4,6-dideoxy-N-acetyl-beta-L-altrosamine transaminases Proteins 0.000 claims description 5
- NQBRVZNDBBMBLJ-MQTLHLSBSA-N UDP-N-acetyl-alpha-D-muramic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O[C@H](C)C(O)=O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 NQBRVZNDBBMBLJ-MQTLHLSBSA-N 0.000 claims description 5
- NQBRVZNDBBMBLJ-UHFFFAOYSA-N UDP-N-acetylmuramic acid alpha-anomer Natural products CC(=O)NC1C(OC(C)C(O)=O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 NQBRVZNDBBMBLJ-UHFFFAOYSA-N 0.000 claims description 5
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 claims description 5
- FZIVHOUANIQOMU-YIHIYSSUSA-N alpha-L-Fucp-(1->2)-beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)O[C@H](CO)[C@H]2O)NC(C)=O)O[C@H](CO)[C@H](O)[C@@H]1O FZIVHOUANIQOMU-YIHIYSSUSA-N 0.000 claims description 5
- CMQZRJBJDCVIEY-JEOLMMCMSA-N alpha-L-Fucp-(1->3)-[beta-D-Galp-(1->4)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)O[C@@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO)[C@@H]2O)O)[C@@H]1NC(C)=O CMQZRJBJDCVIEY-JEOLMMCMSA-N 0.000 claims description 5
- RQNFGIWYOACERD-OCQMRBNYSA-N alpha-L-Fucp-(1->4)-[alpha-L-Fucp-(1->2)-beta-D-Galp-(1->3)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](CO)O[C@@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)[C@@H]2NC(C)=O)O[C@H]2[C@H]([C@H](O)[C@H](O)[C@H](C)O2)O)O[C@H](CO)[C@H](O)[C@@H]1O RQNFGIWYOACERD-OCQMRBNYSA-N 0.000 claims description 5
- 239000000427 antigen Substances 0.000 claims description 5
- 108091007433 antigens Proteins 0.000 claims description 5
- 102000036639 antigens Human genes 0.000 claims description 5
- 239000001913 cellulose Substances 0.000 claims description 5
- 229920002678 cellulose Polymers 0.000 claims description 5
- 238000012262 fermentative production Methods 0.000 claims description 5
- 229960002442 glucosamine Drugs 0.000 claims description 5
- 238000004191 hydrophobic interaction chromatography Methods 0.000 claims description 5
- 238000005342 ion exchange Methods 0.000 claims description 5
- 238000004255 ion exchange chromatography Methods 0.000 claims description 5
- RQNFGIWYOACERD-UHFFFAOYSA-N lacto-N-Difucosylhexaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(CO)OC(OC3C(C(OC4C(OC(O)C(O)C4O)CO)OC(CO)C3O)O)C2NC(C)=O)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O RQNFGIWYOACERD-UHFFFAOYSA-N 0.000 claims description 5
- OQIUPKPUOLIHHS-UHFFFAOYSA-N lacto-N-difucohexaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(CO)OC(OC3C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C3O)O)C2NC(C)=O)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O OQIUPKPUOLIHHS-UHFFFAOYSA-N 0.000 claims description 5
- FZIVHOUANIQOMU-UHFFFAOYSA-N lacto-N-fucopentaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(OC3C(C(OC4C(OC(O)C(O)C4O)CO)OC(CO)C3O)O)OC(CO)C2O)NC(C)=O)OC(CO)C(O)C1O FZIVHOUANIQOMU-UHFFFAOYSA-N 0.000 claims description 5
- CMQZRJBJDCVIEY-UHFFFAOYSA-N lacto-N-fucopentaose III Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(CO)OC(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)C1NC(C)=O CMQZRJBJDCVIEY-UHFFFAOYSA-N 0.000 claims description 5
- FYGDTMLNYKFZSV-UHFFFAOYSA-N mannotriose Natural products OC1C(O)C(O)C(CO)OC1OC1C(CO)OC(OC2C(OC(O)C(O)C2O)CO)C(O)C1O FYGDTMLNYKFZSV-UHFFFAOYSA-N 0.000 claims description 5
- 239000000600 sorbitol Substances 0.000 claims description 5
- 238000001694 spray drying Methods 0.000 claims description 5
- 239000008107 starch Substances 0.000 claims description 5
- 235000019698 starch Nutrition 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 239000006188 syrup Substances 0.000 claims description 5
- 235000020357 syrup Nutrition 0.000 claims description 5
- FYGDTMLNYKFZSV-BYLHFPJWSA-N β-1,4-galactotrioside Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@H](CO)O[C@@H](O[C@@H]2[C@@H](O[C@@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-BYLHFPJWSA-N 0.000 claims description 5
- 241000251468 Actinopterygii Species 0.000 claims description 4
- 240000002791 Brassica napus Species 0.000 claims description 4
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 4
- 229920000742 Cotton Polymers 0.000 claims description 4
- 241000660147 Escherichia coli str. K-12 substr. MG1655 Species 0.000 claims description 4
- 244000068988 Glycine max Species 0.000 claims description 4
- 235000010469 Glycine max Nutrition 0.000 claims description 4
- 239000005913 Maltodextrin Substances 0.000 claims description 4
- 229920002774 Maltodextrin Polymers 0.000 claims description 4
- 240000007594 Oryza sativa Species 0.000 claims description 4
- 235000007164 Oryza sativa Nutrition 0.000 claims description 4
- 238000010521 absorption reaction Methods 0.000 claims description 4
- 238000001042 affinity chromatography Methods 0.000 claims description 4
- FYGDTMLNYKFZSV-DZOUCCHMSA-N alpha-D-Glcp-(1->4)-alpha-D-Glcp-(1->4)-D-Glcp Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)O[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-DZOUCCHMSA-N 0.000 claims description 4
- DMYPRRDPOMGEAK-XWDFSUOISA-N beta-D-Galp-(1->3)-[alpha-L-Fucp-(1->4)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-[alpha-L-Fucp-(1->3)]-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O4)O)[C@H](O[C@H]4[C@H]([C@H](O)[C@H](O)[C@H](C)O4)O)[C@@H](CO)O3)NC(C)=O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)OC(O)[C@@H]1O DMYPRRDPOMGEAK-XWDFSUOISA-N 0.000 claims description 4
- 230000006652 catabolic pathway Effects 0.000 claims description 4
- 230000010261 cell growth Effects 0.000 claims description 4
- 239000003610 charcoal Substances 0.000 claims description 4
- 238000002425 crystallisation Methods 0.000 claims description 4
- 230000008025 crystallization Effects 0.000 claims description 4
- SUSQQDGHFAOUBW-PVLJGHBYSA-N difucosyllacto-n-hexaose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](C)O[C@@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO[C@H]3[C@@H]([C@@H](O[C@@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](C)O4)O)[C@H](O[C@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O4)O)[C@@H](CO)O3)NC(C)=O)[C@@H]2O)O)O[C@@H]1CO SUSQQDGHFAOUBW-PVLJGHBYSA-N 0.000 claims description 4
- 238000001035 drying Methods 0.000 claims description 4
- 238000001704 evaporation Methods 0.000 claims description 4
- 230000008020 evaporation Effects 0.000 claims description 4
- 238000004108 freeze drying Methods 0.000 claims description 4
- 238000002523 gelfiltration Methods 0.000 claims description 4
- DMYPRRDPOMGEAK-UHFFFAOYSA-N lacto-N-difucohexaose II Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(OC3C(C(OC4C(C(O)C(O)C(CO)O4)O)C(OC4C(C(O)C(O)C(C)O4)O)C(CO)O3)NC(C)=O)C(O)C(CO)O2)O)C(CO)OC(O)C1O DMYPRRDPOMGEAK-UHFFFAOYSA-N 0.000 claims description 4
- 238000004246 ligand exchange chromatography Methods 0.000 claims description 4
- 229940049920 malate Drugs 0.000 claims description 4
- 229940035034 maltodextrin Drugs 0.000 claims description 4
- 238000001471 micro-filtration Methods 0.000 claims description 4
- 238000001556 precipitation Methods 0.000 claims description 4
- 238000001223 reverse osmosis Methods 0.000 claims description 4
- 235000009566 rice Nutrition 0.000 claims description 4
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 claims description 4
- 241000270322 Lepidosauria Species 0.000 claims description 3
- 240000004658 Medicago sativa Species 0.000 claims description 3
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims description 3
- 244000061176 Nicotiana tabacum Species 0.000 claims description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 3
- 108010085193 UDP-N-acetylglucosamine 1-carboxyvinyltransferase Proteins 0.000 claims description 3
- DUKURNFHYQXCJG-JEOLMMCMSA-N alpha-L-Fucp-(1->4)-[beta-D-Galp-(1->3)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO)[C@@H]2O)O)O[C@@H]1CO DUKURNFHYQXCJG-JEOLMMCMSA-N 0.000 claims description 3
- 235000013339 cereals Nutrition 0.000 claims description 3
- 210000001671 embryonic stem cell Anatomy 0.000 claims description 3
- 210000005260 human cell Anatomy 0.000 claims description 3
- FKADDOYBRRMBPP-UHFFFAOYSA-N lacto-N-fucopentaose II Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(C)=O)C(OC2C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C2O)O)OC1CO FKADDOYBRRMBPP-UHFFFAOYSA-N 0.000 claims description 3
- 230000007935 neutral effect Effects 0.000 claims description 3
- 101710202061 N-acetyltransferase Proteins 0.000 claims description 2
- AXQLFFDZXPOFPO-FSGZUBPKSA-N beta-D-Gal-(1->3)-beta-D-GlcNAc-(1->3)-beta-D-Gal-(1->4)-D-Glc Chemical compound O([C@@H]1O[C@H](CO)[C@H](O)[C@@H]([C@H]1O)O[C@H]1[C@@H]([C@H]([C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)NC(=O)C)[C@H]1[C@H](O)[C@@H](O)C(O)O[C@@H]1CO AXQLFFDZXPOFPO-FSGZUBPKSA-N 0.000 claims 7
- HSCJRCZFDFQWRP-ABVWGUQPSA-N UDP-alpha-D-galactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-ABVWGUQPSA-N 0.000 claims 3
- 102100039847 Globoside alpha-1,3-N-acetylgalactosaminyltransferase 1 Human genes 0.000 claims 1
- 241000219146 Gossypium Species 0.000 claims 1
- 101000887519 Homo sapiens Globoside alpha-1,3-N-acetylgalactosaminyltransferase 1 Proteins 0.000 claims 1
- 125000003047 N-acetyl group Chemical group 0.000 claims 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 claims 1
- BJEPYKJPYRNKOW-UHFFFAOYSA-N malic acid Chemical compound OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 claims 1
- 238000004113 cell culture Methods 0.000 abstract description 3
- 238000012269 metabolic engineering Methods 0.000 abstract description 2
- RJTOFDPWCJDYFZ-SPVZFZGWSA-N Lacto-N-triaose Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O RJTOFDPWCJDYFZ-SPVZFZGWSA-N 0.000 description 172
- 235000018102 proteins Nutrition 0.000 description 117
- 108090000765 processed proteins & peptides Proteins 0.000 description 92
- 102000004196 processed proteins & peptides Human genes 0.000 description 88
- 229920001184 polypeptide Polymers 0.000 description 86
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 63
- RBMYDHMFFAVMMM-PLQWBNBWSA-N neolactotetraose Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O RBMYDHMFFAVMMM-PLQWBNBWSA-N 0.000 description 45
- 102000040430 polynucleotide Human genes 0.000 description 43
- 108091033319 polynucleotide Proteins 0.000 description 43
- 239000002157 polynucleotide Substances 0.000 description 42
- 102000004190 Enzymes Human genes 0.000 description 34
- 108090000790 Enzymes Proteins 0.000 description 34
- 239000000370 acceptor Substances 0.000 description 32
- 125000003275 alpha amino acid group Chemical group 0.000 description 32
- 150000004676 glycans Chemical class 0.000 description 27
- 108020004414 DNA Proteins 0.000 description 22
- USAZACJQJDHAJH-KDEXOMDGSA-N [[(2r,3s,4r,5s)-5-(2,4-dioxo-1h-pyrimidin-6-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2r,3r,4s,5r,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl] hydrogen phosphate Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](C=2NC(=O)NC(=O)C=2)O1 USAZACJQJDHAJH-KDEXOMDGSA-N 0.000 description 22
- 102000039446 nucleic acids Human genes 0.000 description 22
- 108020004707 nucleic acids Proteins 0.000 description 22
- -1 GT23 Proteins 0.000 description 20
- 238000013518 transcription Methods 0.000 description 20
- 230000035897 transcription Effects 0.000 description 20
- 230000037361 pathway Effects 0.000 description 18
- 230000032258 transport Effects 0.000 description 17
- 150000001720 carbohydrates Chemical class 0.000 description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 14
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 13
- 229960003082 galactose Drugs 0.000 description 13
- 229960001031 glucose Drugs 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 12
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical group CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 12
- 238000002869 basic local alignment search tool Methods 0.000 description 12
- 241000894007 species Species 0.000 description 12
- 229940024606 amino acid Drugs 0.000 description 11
- 150000001413 amino acids Chemical class 0.000 description 11
- 230000003284 homeostatic effect Effects 0.000 description 11
- 239000004615 ingredient Substances 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- 229910001868 water Inorganic materials 0.000 description 11
- 235000013350 formula milk Nutrition 0.000 description 10
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 10
- 238000006467 substitution reaction Methods 0.000 description 10
- 239000000126 substance Substances 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 108010084034 glucosamine-1-phosphate acetyltransferase Proteins 0.000 description 8
- 235000013406 prebiotics Nutrition 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 108090000340 Transaminases Proteins 0.000 description 7
- 102000003929 Transaminases Human genes 0.000 description 7
- 238000000855 fermentation Methods 0.000 description 7
- 230000004151 fermentation Effects 0.000 description 7
- 230000007062 hydrolysis Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 238000004977 Hueckel calculation Methods 0.000 description 6
- 102000003939 Membrane transport proteins Human genes 0.000 description 6
- 108090000301 Membrane transport proteins Proteins 0.000 description 6
- 108010069483 N-acetylglucosamine-6-phosphate deacetylase Proteins 0.000 description 6
- 102100031324 N-acetylglucosamine-6-phosphate deacetylase Human genes 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 102100021436 UDP-glucose 4-epimerase Human genes 0.000 description 6
- 108010061048 UDPacetylglucosamine pyrophosphorylase Proteins 0.000 description 6
- 239000002585 base Substances 0.000 description 6
- 230000008238 biochemical pathway Effects 0.000 description 6
- 235000015872 dietary supplement Nutrition 0.000 description 6
- 238000004128 high performance liquid chromatography Methods 0.000 description 6
- 108010060845 lactose permease Proteins 0.000 description 6
- 108010032867 phosphoglucosamine mutase Proteins 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- 239000011782 vitamin Substances 0.000 description 6
- 235000013343 vitamin Nutrition 0.000 description 6
- 229940088594 vitamin Drugs 0.000 description 6
- 229930003231 vitamin Natural products 0.000 description 6
- 241000559358 Klebsiella pneumoniae VAKPC309 Species 0.000 description 5
- 229910019142 PO4 Inorganic materials 0.000 description 5
- 108091023040 Transcription factor Proteins 0.000 description 5
- 102000040945 Transcription factor Human genes 0.000 description 5
- 108010075202 UDP-glucose 4-epimerase Proteins 0.000 description 5
- 229960000723 ampicillin Drugs 0.000 description 5
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 230000003115 biocidal effect Effects 0.000 description 5
- 230000019522 cellular metabolic process Effects 0.000 description 5
- 230000021615 conjugation Effects 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- 235000013305 food Nutrition 0.000 description 5
- 238000005755 formation reaction Methods 0.000 description 5
- 239000012535 impurity Substances 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000002887 multiple sequence alignment Methods 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- LJJBSCMJXPZTOP-VBBGBFMKSA-N (2s)-2,5-diamino-5-oxopentanoic acid;[(2r,3r,4s)-2,3,4,6-tetrahydroxy-5-oxohexyl] dihydrogen phosphate Chemical compound OC(=O)[C@@H](N)CCC(N)=O.OCC(=O)[C@@H](O)[C@H](O)[C@H](O)COP(O)(O)=O LJJBSCMJXPZTOP-VBBGBFMKSA-N 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 102100041034 Glucosamine-6-phosphate isomerase 1 Human genes 0.000 description 4
- 239000006137 Luria-Bertani broth Substances 0.000 description 4
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical group CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 4
- OVRNDRQMDRJTHS-OZRXBMAMSA-N N-acetyl-beta-D-mannosamine Chemical group CC(=O)N[C@@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-OZRXBMAMSA-N 0.000 description 4
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 description 4
- 108010056664 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyltransferase Proteins 0.000 description 4
- FDJKUWYYUZCUJX-UHFFFAOYSA-N N-glycolyl-beta-neuraminic acid Natural products OCC(O)C(O)C1OC(O)(C(O)=O)CC(O)C1NC(=O)CO FDJKUWYYUZCUJX-UHFFFAOYSA-N 0.000 description 4
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 4
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 4
- 150000007513 acids Chemical class 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 210000000170 cell membrane Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 229960005091 chloramphenicol Drugs 0.000 description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 4
- 239000002158 endotoxin Substances 0.000 description 4
- 238000001030 gas--liquid chromatography Methods 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 4
- 239000002777 nucleoside Substances 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- 229920001282 polysaccharide Polymers 0.000 description 4
- 241000283690 Bos taurus Species 0.000 description 3
- 241000282828 Camelus bactrianus Species 0.000 description 3
- AEMOLEFTQBMNLQ-AQKNRBDQSA-N D-glucopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-AQKNRBDQSA-N 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 241000238557 Decapoda Species 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 241000192125 Firmicutes Species 0.000 description 3
- 108010045674 Fucose-1-phosphate guanylyltransferase Proteins 0.000 description 3
- 244000299507 Gossypium hirsutum Species 0.000 description 3
- 239000007836 KH2PO4 Substances 0.000 description 3
- 241001557695 Kluyvera ascorbata ATCC 33433 Species 0.000 description 3
- 108091022912 Mannose-6-Phosphate Isomerase Proteins 0.000 description 3
- 102000048193 Mannose-6-phosphate isomerases Human genes 0.000 description 3
- XOCCAGJZGBCJME-IANFNVNHSA-N N-Acetyl-D-fucosamine Chemical group C[C@H]1OC(O)[C@H](NC(C)=O)[C@@H](O)[C@H]1O XOCCAGJZGBCJME-IANFNVNHSA-N 0.000 description 3
- XOCCAGJZGBCJME-DYYUQQNFSA-N N-Acetyl-L-Rhamnosamine Chemical group C[C@@H]1OC(O)[C@H](NC(C)=O)[C@H](O)[C@H]1O XOCCAGJZGBCJME-DYYUQQNFSA-N 0.000 description 3
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 241001494479 Pecora Species 0.000 description 3
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 244000052616 bacterial pathogen Species 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 239000006227 byproduct Substances 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 150000001768 cations Chemical class 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 238000005352 clarification Methods 0.000 description 3
- 238000004440 column chromatography Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 239000003792 electrolyte Substances 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 235000019688 fish Nutrition 0.000 description 3
- XHMJOUIAFHJHBW-VFUOTHLCSA-N glucosamine 6-phosphate Chemical compound N[C@H]1[C@H](O)O[C@H](COP(O)(O)=O)[C@H](O)[C@@H]1O XHMJOUIAFHJHBW-VFUOTHLCSA-N 0.000 description 3
- 108010022717 glucosamine-6-phosphate isomerase Proteins 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- BJEPYKJPYRNKOW-UHFFFAOYSA-L malate(2-) Chemical compound [O-]C(=O)C(O)CC([O-])=O BJEPYKJPYRNKOW-UHFFFAOYSA-L 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- MEFBJEMVZONFCJ-UHFFFAOYSA-N molybdate Chemical compound [O-][Mo]([O-])(=O)=O MEFBJEMVZONFCJ-UHFFFAOYSA-N 0.000 description 3
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 3
- 235000019796 monopotassium phosphate Nutrition 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 239000005017 polysaccharide Substances 0.000 description 3
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 229910052711 selenium Inorganic materials 0.000 description 3
- 239000011669 selenium Substances 0.000 description 3
- 125000005630 sialyl group Chemical group 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 150000003722 vitamin derivatives Chemical class 0.000 description 3
- BGWQRWREUZVRGI-NNPWBXLPSA-N (3s,4s,5s,6r)-6-[(1r)-1,2-dihydroxyethyl]oxane-2,3,4,5-tetrol Chemical compound OC[C@@H](O)[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O BGWQRWREUZVRGI-NNPWBXLPSA-N 0.000 description 2
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 2
- MSWZFWKMSRAUBD-GASJEMHNSA-N 2-amino-2-deoxy-D-galactopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O MSWZFWKMSRAUBD-GASJEMHNSA-N 0.000 description 2
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 2
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 2
- 230000005730 ADP ribosylation Effects 0.000 description 2
- 101710098620 Alpha-1,2-fucosyltransferase Proteins 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- 241000180579 Arca Species 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 101100427060 Bacillus spizizenii (strain ATCC 23059 / NRRL B-14472 / W23) thyA1 gene Proteins 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 241000283254 Balaenoptera acutorostrata Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 241001517048 Corynebacterium afermentans Species 0.000 description 2
- GSXOAOHZAIYLCY-UHFFFAOYSA-N D-F6P Natural products OCC(=O)C(O)C(O)C(O)COP(O)(O)=O GSXOAOHZAIYLCY-UHFFFAOYSA-N 0.000 description 2
- BGWQRWREUZVRGI-OLLRPPRZSA-N D-glucoheptopyranose Chemical compound OC[C@H](O)[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O BGWQRWREUZVRGI-OLLRPPRZSA-N 0.000 description 2
- RGHNJXZEOKUKBD-SQOUGZDYSA-N D-gluconic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O RGHNJXZEOKUKBD-SQOUGZDYSA-N 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 101100447530 Dictyostelium discoideum gpi gene Proteins 0.000 description 2
- 241000283095 Elephas maximus Species 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 101100153154 Escherichia phage T5 thy gene Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 2
- 102100037047 Fucose-1-phosphate guanylyltransferase Human genes 0.000 description 2
- 102100024515 GDP-L-fucose synthase Human genes 0.000 description 2
- 108030006298 GDP-L-fucose synthases Proteins 0.000 description 2
- 101710090046 Galactose-1-phosphate uridylyltransferase Proteins 0.000 description 2
- 102100036291 Galactose-1-phosphate uridylyltransferase Human genes 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 2
- 101001010029 Lactobacillus helveticus Putative phosphotransferase enzyme IIA component Proteins 0.000 description 2
- DUKURNFHYQXCJG-UHFFFAOYSA-N Lewis A pentasaccharide Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(C)=O)C(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)OC1CO DUKURNFHYQXCJG-UHFFFAOYSA-N 0.000 description 2
- 239000006142 Luria-Bertani Agar Substances 0.000 description 2
- 241000289584 Macropus rufus Species 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241001416166 Mephitis mephitis Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241001232569 Myrmecophaga tridactyla Species 0.000 description 2
- BRGMHAYQAZFZDJ-PVFLNQBWSA-N N-Acetylglucosamine 6-phosphate Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BRGMHAYQAZFZDJ-PVFLNQBWSA-N 0.000 description 2
- OVRNDRQMDRJTHS-ZTVVOAFPSA-N N-acetyl-D-mannosamine Chemical compound CC(=O)N[C@@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-ZTVVOAFPSA-N 0.000 description 2
- BRGMHAYQAZFZDJ-ZTVVOAFPSA-N N-acetyl-D-mannosamine 6-phosphate Chemical compound CC(=O)N[C@@H]1C(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BRGMHAYQAZFZDJ-ZTVVOAFPSA-N 0.000 description 2
- FZLJPEPAYPUMMR-FMDGEEDCSA-N N-acetyl-alpha-D-glucosamine 1-phosphate Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(O)=O FZLJPEPAYPUMMR-FMDGEEDCSA-N 0.000 description 2
- 102100033341 N-acetylmannosamine kinase Human genes 0.000 description 2
- 101710179749 N-acetylmannosamine kinase Proteins 0.000 description 2
- 108010081778 N-acylneuraminate cytidylyltransferase Proteins 0.000 description 2
- SUHQNCLNRUAGOO-UHFFFAOYSA-N N-glycoloyl-neuraminic acid Natural products OCC(O)C(O)C(O)C(NC(=O)CO)C(O)CC(=O)C(O)=O SUHQNCLNRUAGOO-UHFFFAOYSA-N 0.000 description 2
- FDJKUWYYUZCUJX-KVNVFURPSA-N N-glycolylneuraminic acid Chemical group OC[C@H](O)[C@H](O)[C@@H]1O[C@](O)(C(O)=O)C[C@H](O)[C@H]1NC(=O)CO FDJKUWYYUZCUJX-KVNVFURPSA-N 0.000 description 2
- 241000289565 Notamacropus eugenii Species 0.000 description 2
- 239000005642 Oleic acid Substances 0.000 description 2
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 2
- 241000289371 Ornithorhynchus anatinus Species 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- 241001520299 Phascolarctos cinereus Species 0.000 description 2
- 241000286209 Phasianidae Species 0.000 description 2
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 2
- 102000030605 Phosphomannomutase Human genes 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000192142 Proteobacteria Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 101100313751 Rickettsia conorii (strain ATCC VR-613 / Malish 7) thyX gene Proteins 0.000 description 2
- 101000604870 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Glycolipid 2-alpha-mannosyltransferase Proteins 0.000 description 2
- 235000019485 Safflower oil Nutrition 0.000 description 2
- SXMGGNXBTZBGLU-IBUUTZGMSA-N Sialyllacto-N-neotetraose c Chemical compound O([C@H]([C@@H]([C@@H](O)[C@H]1O)O)O[C@H]2[C@H](O)[C@H]([C@@H](O[C@@H]2CO)O[C@@H]2[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]2O)O)NC(=O)C)C1CO[C@]1(C(O)=O)C[C@H](O)[C@@H](NC(C)=O)[C@H]([C@H](O)[C@H](O)CO)O1 SXMGGNXBTZBGLU-IBUUTZGMSA-N 0.000 description 2
- 241001278026 Starmerella bombicola Species 0.000 description 2
- 101100120969 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) pgi1 gene Proteins 0.000 description 2
- 241000187392 Streptomyces griseus Species 0.000 description 2
- 241000282890 Sus Species 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 101710091363 UDP-N-acetylglucosamine 2-epimerase Proteins 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- 241000282454 Ursus arctos Species 0.000 description 2
- 241001147416 Ursus maritimus Species 0.000 description 2
- 241000196831 Ursus thibetanus japonicus Species 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 108010046377 Whey Proteins Proteins 0.000 description 2
- 102000007544 Whey Proteins Human genes 0.000 description 2
- 241000235015 Yarrowia lipolytica Species 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 150000001298 alcohols Chemical class 0.000 description 2
- DLRVVLDZNNYCBX-CAPXFGMSSA-N allolactose Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@@H]1OC[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](O)O1 DLRVVLDZNNYCBX-CAPXFGMSSA-N 0.000 description 2
- 235000019270 ammonium chloride Nutrition 0.000 description 2
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 2
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 2
- 235000011130 ammonium sulphate Nutrition 0.000 description 2
- 235000008452 baby food Nutrition 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- BGWGXPAPYGQALX-ARQDHWQXSA-N beta-D-fructofuranose 6-phosphate Chemical compound OC[C@@]1(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BGWGXPAPYGQALX-ARQDHWQXSA-N 0.000 description 2
- 230000001588 bifunctional effect Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 235000008504 concentrate Nutrition 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000008406 cosmetic ingredient Substances 0.000 description 2
- 238000011026 diafiltration Methods 0.000 description 2
- RXKJFZQQPQGTFL-UHFFFAOYSA-N dihydroxyacetone Chemical compound OCC(=O)CO RXKJFZQQPQGTFL-UHFFFAOYSA-N 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 235000013861 fat-free Nutrition 0.000 description 2
- 235000019197 fats Nutrition 0.000 description 2
- 229960002737 fructose Drugs 0.000 description 2
- 230000033581 fucosylation Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 108010001671 galactoside 3-fucosyltransferase Proteins 0.000 description 2
- 230000006251 gamma-carboxylation Effects 0.000 description 2
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 238000003209 gene knockout Methods 0.000 description 2
- 101150117187 glmS gene Proteins 0.000 description 2
- 229960005150 glycerol Drugs 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000033444 hydroxylation Effects 0.000 description 2
- 238000005805 hydroxylation reaction Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 101150001899 lacY gene Proteins 0.000 description 2
- 229920006008 lipopolysaccharide Polymers 0.000 description 2
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000005621 mannosylation reaction Methods 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 101150070589 nagB gene Proteins 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 2
- 238000002888 pairwise sequence alignment Methods 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 101150053253 pgi gene Proteins 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 108091000115 phosphomannomutase Proteins 0.000 description 2
- 239000000049 pigment Substances 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000006041 probiotic Substances 0.000 description 2
- 230000000529 probiotic effect Effects 0.000 description 2
- 235000018291 probiotics Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000012465 retentate Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000003813 safflower oil Substances 0.000 description 2
- 235000005713 safflower oil Nutrition 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 230000009450 sialylation Effects 0.000 description 2
- 235000021309 simple sugar Nutrition 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000012607 strong cation exchange resin Substances 0.000 description 2
- 101150072314 thyA gene Proteins 0.000 description 2
- 239000012137 tryptone Substances 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 235000021119 whey protein Nutrition 0.000 description 2
- 238000004736 wide-angle X-ray diffraction Methods 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- WQZGKKKJIJFFOK-SVZMEOIVSA-N (+)-Galactose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-SVZMEOIVSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-GPGIQTIDSA-N (2R,3S,4S,5S)-3,4,5,6-Tetrahydroxyoxane-2-carboxylic acid Chemical compound OC1O[C@@H](C(O)=O)[C@@H](O)[C@H](O)[C@@H]1O AEMOLEFTQBMNLQ-GPGIQTIDSA-N 0.000 description 1
- MPQBLCRFUYGBHE-XZBKPIIZSA-N (2r,3s,4r,5r)-2,4,5-trihydroxy-3-methoxyhexanal Chemical compound O=C[C@H](O)[C@@H](OC)[C@H](O)[C@@H](C)O MPQBLCRFUYGBHE-XZBKPIIZSA-N 0.000 description 1
- PNIWLNAGKUGXDO-LNCRCTFVSA-N (2s,3r,4s,5r,6r)-2-[(2r,3s,4r,5r)-5-amino-4,6-dihydroxy-2-(hydroxymethyl)oxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical group O[C@@H]1[C@@H](N)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 PNIWLNAGKUGXDO-LNCRCTFVSA-N 0.000 description 1
- MPQBLCRFUYGBHE-DBRKOABJSA-N (2s,3s,4r,5r)-2,4,5-trihydroxy-3-methoxyhexanal Chemical compound O=C[C@@H](O)[C@@H](OC)[C@H](O)[C@@H](C)O MPQBLCRFUYGBHE-DBRKOABJSA-N 0.000 description 1
- FMAORJIQYMIRHF-HERZVMAMSA-N (3R,4R)-Oxolane-2,3,4-triol Chemical compound O[C@@H]1COC(O)[C@@H]1O FMAORJIQYMIRHF-HERZVMAMSA-N 0.000 description 1
- FMAORJIQYMIRHF-BCDHYOAOSA-N (3S,4R)-Oxolane-2,3,4-triol Chemical compound O[C@@H]1COC(O)[C@H]1O FMAORJIQYMIRHF-BCDHYOAOSA-N 0.000 description 1
- SHZGCJCMOBCMKK-CBPJZXOFSA-N (3r,4r,5r,6r)-6-methyloxane-2,3,4,5-tetrol Chemical compound C[C@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-CBPJZXOFSA-N 0.000 description 1
- VRYALKFFQXWPIH-PBXRRBTRSA-N (3r,4s,5r)-3,4,5,6-tetrahydroxyhexanal Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)CC=O VRYALKFFQXWPIH-PBXRRBTRSA-N 0.000 description 1
- MSWZFWKMSRAUBD-QTVWNMPRSA-N (3r,4s,5r,6r)-3-amino-6-(hydroxymethyl)oxane-2,4,5-triol Chemical compound N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@H]1O MSWZFWKMSRAUBD-QTVWNMPRSA-N 0.000 description 1
- LEJHBBPEPOZERQ-RSVSWTKNSA-N (3r,4s,5s,6r)-3,5-diamino-6-methyloxane-2,4-diol Chemical compound C[C@H]1OC(O)[C@H](N)[C@@H](O)[C@@H]1N LEJHBBPEPOZERQ-RSVSWTKNSA-N 0.000 description 1
- MSWZFWKMSRAUBD-RSVSWTKNSA-N (3r,4s,5s,6r)-3-amino-6-(hydroxymethyl)oxane-2,4,5-triol Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@H]1O MSWZFWKMSRAUBD-RSVSWTKNSA-N 0.000 description 1
- SHZGCJCMOBCMKK-GASJEMHNSA-N (3r,4s,5s,6r)-6-methyloxane-2,3,4,5-tetrol Chemical compound C[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O SHZGCJCMOBCMKK-GASJEMHNSA-N 0.000 description 1
- KYPWIZMAJMNPMJ-JDJSBBGDSA-N (3r,5r,6r)-6-methyloxane-2,3,5-triol Chemical compound C[C@H]1OC(O)[C@H](O)C[C@H]1O KYPWIZMAJMNPMJ-JDJSBBGDSA-N 0.000 description 1
- KYPWIZMAJMNPMJ-IANNHFEVSA-N (3r,5s,6r)-6-methyloxane-2,3,5-triol Chemical compound C[C@H]1OC(O)[C@H](O)C[C@@H]1O KYPWIZMAJMNPMJ-IANNHFEVSA-N 0.000 description 1
- JYAQWANEOPJVEY-QYNIQEEDSA-N (3s,4r,5r)-3,4,5-trihydroxy-3-methylhexanal Chemical compound C[C@@H](O)[C@@H](O)[C@@](C)(O)CC=O JYAQWANEOPJVEY-QYNIQEEDSA-N 0.000 description 1
- SHZGCJCMOBCMKK-WHZQZERISA-N (3s,4s,5r,6r)-6-methyloxane-2,3,4,5-tetrol Chemical compound C[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@H]1O SHZGCJCMOBCMKK-WHZQZERISA-N 0.000 description 1
- KYPWIZMAJMNPMJ-OEXCPVAWSA-N (3s,5s,6r)-6-methyloxane-2,3,5-triol Chemical compound C[C@H]1OC(O)[C@@H](O)C[C@@H]1O KYPWIZMAJMNPMJ-OEXCPVAWSA-N 0.000 description 1
- NNLZBVFSCVTSLA-XMABDTGBSA-N (4r,5r,6r)-6-[(1r)-1,2-dihydroxyethyl]-2,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound OC[C@@H](O)[C@H]1OC(O)(C(O)=O)C[C@@H](O)[C@H]1O NNLZBVFSCVTSLA-XMABDTGBSA-N 0.000 description 1
- FDWRIIDFYSUTDP-WGDKFINWSA-N (4s,5s,6r)-6-methyloxane-2,4,5-triol Chemical compound C[C@H]1OC(O)C[C@H](O)[C@@H]1O FDWRIIDFYSUTDP-WGDKFINWSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- VUDQSRFCCHQIIU-UHFFFAOYSA-N 1-(3,5-dichloro-2,6-dihydroxy-4-methoxyphenyl)hexan-1-one Chemical compound CCCCCC(=O)C1=C(O)C(Cl)=C(OC)C(Cl)=C1O VUDQSRFCCHQIIU-UHFFFAOYSA-N 0.000 description 1
- FDWRIIDFYSUTDP-UHFFFAOYSA-N 102850-49-7 Natural products CC1OC(O)CC(O)C1O FDWRIIDFYSUTDP-UHFFFAOYSA-N 0.000 description 1
- WIIZWVCIJKGZOK-IUCAKERBSA-N 2,2-dichloro-n-[(1s,2s)-1,3-dihydroxy-1-(4-nitrophenyl)propan-2-yl]acetamide Chemical compound ClC(Cl)C(=O)N[C@@H](CO)[C@@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-IUCAKERBSA-N 0.000 description 1
- MSWZFWKMSRAUBD-CBPJZXOFSA-N 2-amino-2-deoxy-D-mannopyranose Chemical compound N[C@@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-CBPJZXOFSA-N 0.000 description 1
- MSFSPUZXLOGKHJ-PGYHGBPZSA-N 2-amino-3-O-[(R)-1-carboxyethyl]-2-deoxy-D-glucopyranose Chemical compound OC(=O)[C@@H](C)O[C@@H]1[C@@H](N)C(O)O[C@H](CO)[C@H]1O MSFSPUZXLOGKHJ-PGYHGBPZSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- ODDPRQJTYDIWJU-UHFFFAOYSA-N 3'-beta-D-galactopyranosyl-lactose Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(OC2C(OC(O)C(O)C2O)CO)OC(CO)C1O ODDPRQJTYDIWJU-UHFFFAOYSA-N 0.000 description 1
- 108010083651 3-galactosyl-N-acetylglucosaminide 4-alpha-L-fucosyltransferase Proteins 0.000 description 1
- 108700004024 5'-Nucleotidase Proteins 0.000 description 1
- 102100022464 5'-nucleotidase Human genes 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- HOSGXJWQVBHGLT-UHFFFAOYSA-N 6-hydroxy-3,4-dihydro-1h-quinolin-2-one Chemical group N1C(=O)CCC2=CC(O)=CC=C21 HOSGXJWQVBHGLT-UHFFFAOYSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241000272517 Anseriformes Species 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 241000269350 Anura Species 0.000 description 1
- 101100001956 Arabidopsis thaliana APTG1 gene Proteins 0.000 description 1
- 101100393868 Arabidopsis thaliana GT11 gene Proteins 0.000 description 1
- 101100393871 Arabidopsis thaliana GT12 gene Proteins 0.000 description 1
- 101100393877 Arabidopsis thaliana GT14 gene Proteins 0.000 description 1
- 101100134896 Arabidopsis thaliana OFUT14 gene Proteins 0.000 description 1
- 101100134902 Arabidopsis thaliana OFUT23 gene Proteins 0.000 description 1
- 101100406353 Arabidopsis thaliana OFUT36 gene Proteins 0.000 description 1
- 101100350231 Arabidopsis thaliana OFUT5 gene Proteins 0.000 description 1
- 241000235349 Ascomycota Species 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 101100075927 Aspergillus aculeatus mndA gene Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 241000606124 Bacteroides fragilis Species 0.000 description 1
- 241001235572 Balantioides coli Species 0.000 description 1
- 241000221198 Basidiomycota Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 229920002498 Beta-glucan Polymers 0.000 description 1
- 241000186000 Bifidobacterium Species 0.000 description 1
- 241000186018 Bifidobacterium adolescentis Species 0.000 description 1
- 241001134770 Bifidobacterium animalis Species 0.000 description 1
- 241000186015 Bifidobacterium longum subsp. infantis Species 0.000 description 1
- 241000237519 Bivalvia Species 0.000 description 1
- 241000255789 Bombyx mori Species 0.000 description 1
- 241000589174 Bradyrhizobium japonicum Species 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000283705 Capra hircus Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000186031 Corynebacteriaceae Species 0.000 description 1
- 241000186226 Corynebacterium glutamicum Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000270722 Crocodylidae Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 241001530054 Cystophora cristata Species 0.000 description 1
- AEMOLEFTQBMNLQ-PKKLWIBTSA-N D-Alluronic Acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@@H](O)[C@H]1O AEMOLEFTQBMNLQ-PKKLWIBTSA-N 0.000 description 1
- NBSCHQHZLSJFNQ-GASJEMHNSA-N D-Glucose 6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@H]1O NBSCHQHZLSJFNQ-GASJEMHNSA-N 0.000 description 1
- WQZGKKKJIJFFOK-CBPJZXOFSA-N D-Gulose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O WQZGKKKJIJFFOK-CBPJZXOFSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-BZINKQHNSA-N D-Guluronic Acid Chemical compound OC1O[C@H](C(O)=O)[C@H](O)[C@@H](O)[C@H]1O AEMOLEFTQBMNLQ-BZINKQHNSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- NBSCHQHZLSJFNQ-QTVWNMPRSA-N D-Mannose-6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@@H]1O NBSCHQHZLSJFNQ-QTVWNMPRSA-N 0.000 description 1
- WQZGKKKJIJFFOK-IVMDWMLBSA-N D-allopyranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@H](O)[C@@H]1O WQZGKKKJIJFFOK-IVMDWMLBSA-N 0.000 description 1
- HEBKCHPVOIAQTA-QWWZWVQMSA-N D-arabinitol Chemical compound OC[C@@H](O)C(O)[C@H](O)CO HEBKCHPVOIAQTA-QWWZWVQMSA-N 0.000 description 1
- HMFHBZSHGGEWLO-ZRMNMSDTSA-N D-arabinofuranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H]1O HMFHBZSHGGEWLO-ZRMNMSDTSA-N 0.000 description 1
- SRBFZHDQGSBBOR-ZRMNMSDTSA-N D-arabinopyranose Chemical compound O[C@@H]1COC(O)[C@@H](O)[C@@H]1O SRBFZHDQGSBBOR-ZRMNMSDTSA-N 0.000 description 1
- XPYBSIWDXQFNMH-UHFFFAOYSA-N D-fructose 1,6-bisphosphate Natural products OP(=O)(O)OCC(O)C(O)C(O)C(=O)COP(O)(O)=O XPYBSIWDXQFNMH-UHFFFAOYSA-N 0.000 description 1
- SHZGCJCMOBCMKK-SVZMEOIVSA-N D-fucopyranose Chemical compound C[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O SHZGCJCMOBCMKK-SVZMEOIVSA-N 0.000 description 1
- AVVWPBAENSWJCB-RSVSWTKNSA-N D-galactofuranose Chemical compound OC[C@@H](O)[C@@H]1OC(O)[C@H](O)[C@H]1O AVVWPBAENSWJCB-RSVSWTKNSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-YMDCURPLSA-N D-galactopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-YMDCURPLSA-N 0.000 description 1
- RGHNJXZEOKUKBD-UHFFFAOYSA-N D-gluconic acid Natural products OCC(O)C(O)C(O)C(O)C(O)=O RGHNJXZEOKUKBD-UHFFFAOYSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 1
- SRBFZHDQGSBBOR-AGQMPKSLSA-N D-lyxopyranose Chemical compound O[C@@H]1COC(O)[C@@H](O)[C@H]1O SRBFZHDQGSBBOR-AGQMPKSLSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-VANFPWTGSA-N D-mannopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@@H]1O AEMOLEFTQBMNLQ-VANFPWTGSA-N 0.000 description 1
- FDWRIIDFYSUTDP-DUVQVXGLSA-N D-olivose Chemical compound C[C@H]1OC(O)C[C@@H](O)[C@@H]1O FDWRIIDFYSUTDP-DUVQVXGLSA-N 0.000 description 1
- SHZGCJCMOBCMKK-QTVWNMPRSA-N D-rhamnopyranose Chemical compound C[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O SHZGCJCMOBCMKK-QTVWNMPRSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- SRBFZHDQGSBBOR-SOOFDHNKSA-N D-ribopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@@H]1O SRBFZHDQGSBBOR-SOOFDHNKSA-N 0.000 description 1
- LKDRXBCSQODPBY-OEXCPVAWSA-N D-tagatose Chemical compound OCC1(O)OC[C@@H](O)[C@H](O)[C@@H]1O LKDRXBCSQODPBY-OEXCPVAWSA-N 0.000 description 1
- 241000289338 Dasyurus viverrinus Species 0.000 description 1
- 241000192095 Deinococcus-Thermus Species 0.000 description 1
- 241000723298 Dicentrarchus labrax Species 0.000 description 1
- 241000224495 Dictyostelium Species 0.000 description 1
- 101100190555 Dictyostelium discoideum pkgB gene Proteins 0.000 description 1
- GNGACRATGGDKBX-UHFFFAOYSA-N Dihydroxyacetone phosphate Natural products OCC(=O)COP(O)(O)=O GNGACRATGGDKBX-UHFFFAOYSA-N 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- ZGTMUACCHSMWAC-UHFFFAOYSA-L EDTA disodium salt (anhydrous) Chemical compound [Na+].[Na+].OC(=O)CN(CC([O-])=O)CCN(CC(O)=O)CC([O-])=O ZGTMUACCHSMWAC-UHFFFAOYSA-L 0.000 description 1
- 239000004267 EU approved acidity regulator Substances 0.000 description 1
- 241000257465 Echinoidea Species 0.000 description 1
- 102000034574 Electrochemical potential-driven transporters Human genes 0.000 description 1
- 108091006148 Electrochemical potential-driven transporters Proteins 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 241001465321 Eremothecium Species 0.000 description 1
- 239000004386 Erythritol Substances 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- 101100156625 Escherichia coli (strain K12) wcaJ gene Proteins 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241000644323 Escherichia coli C Species 0.000 description 1
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 1
- 101100022282 Escherichia coli O157:H7 manC2 gene Proteins 0.000 description 1
- 241001014021 Escherichia coli O55:H7 Species 0.000 description 1
- 241000901842 Escherichia coli W Species 0.000 description 1
- 244000165918 Eucalyptus papuana Species 0.000 description 1
- 108010046276 FLP recombinase Proteins 0.000 description 1
- 102000018711 Facilitative Glucose Transport Proteins Human genes 0.000 description 1
- 108010040721 Flagellin Proteins 0.000 description 1
- PNHLMHWWFOPQLK-BKUUWRAGSA-N GDP-4-dehydro-6-deoxy-alpha-D-mannose Chemical compound O[C@H]1[C@@H](O)C(=O)[C@@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C3=C(C(NC(N)=N3)=O)N=C2)O1 PNHLMHWWFOPQLK-BKUUWRAGSA-N 0.000 description 1
- 108010062427 GDP-mannose 4,6-dehydratase Proteins 0.000 description 1
- 102000002312 GDPmannose 4,6-dehydratase Human genes 0.000 description 1
- 108700023157 Galactokinases Proteins 0.000 description 1
- 102000048120 Galactokinases Human genes 0.000 description 1
- 102100031687 Galactose mutarotase Human genes 0.000 description 1
- 101710193897 Galactose transporter Proteins 0.000 description 1
- 101710103223 Galactose-proton symporter Proteins 0.000 description 1
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 101150102398 Galt gene Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- VFRROHXSMXFLSN-UHFFFAOYSA-N Glc6P Natural products OP(=O)(O)OCC(O)C(O)C(O)C(O)C=O VFRROHXSMXFLSN-UHFFFAOYSA-N 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 108010021582 Glucokinase Proteins 0.000 description 1
- 108010043841 Glucosamine 6-Phosphate N-Acetyltransferase Proteins 0.000 description 1
- 102100023951 Glucosamine 6-phosphate N-acetyltransferase Human genes 0.000 description 1
- 108091052347 Glucose transporter family Proteins 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 229920000084 Gum arabic Polymers 0.000 description 1
- 244000286779 Hansenula anomala Species 0.000 description 1
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 1
- 102100029237 Hexokinase-4 Human genes 0.000 description 1
- 238000011993 High Performance Size Exclusion Chromatography Methods 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001066315 Homo sapiens Galactose mutarotase Proteins 0.000 description 1
- 101001135738 Homo sapiens Parathyroid hormone-related protein Proteins 0.000 description 1
- 101000589873 Homo sapiens Parathyroid hormone/parathyroid hormone-related peptide receptor Proteins 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229920001202 Inulin Polymers 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 208000007976 Ketosis Diseases 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241001099157 Komagataella Species 0.000 description 1
- LKDRXBCSQODPBY-AMVSKUEXSA-N L-(-)-Sorbose Chemical compound OCC1(O)OC[C@H](O)[C@@H](O)[C@@H]1O LKDRXBCSQODPBY-AMVSKUEXSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-DOTFUZMJSA-N L-Alturonic Acid Chemical compound OC1O[C@@H](C(O)=O)[C@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-DOTFUZMJSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VSOAQEOCSA-N L-altropyranose Chemical compound OC[C@@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-VSOAQEOCSA-N 0.000 description 1
- HMFHBZSHGGEWLO-HWQSCIPKSA-N L-arabinofuranose Chemical compound OC[C@@H]1OC(O)[C@H](O)[C@H]1O HMFHBZSHGGEWLO-HWQSCIPKSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- 102100040648 L-fucose kinase Human genes 0.000 description 1
- WQZGKKKJIJFFOK-DHVFOXMCSA-N L-galactose Chemical compound OC[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O WQZGKKKJIJFFOK-DHVFOXMCSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- WQZGKKKJIJFFOK-ZNVMLXAYSA-N L-idopyranose Chemical compound OC[C@@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-ZNVMLXAYSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-HNFCZKTMSA-N L-idopyranuronic acid Chemical compound OC1O[C@@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-HNFCZKTMSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000481961 Lachancea thermotolerans Species 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 240000001046 Lactobacillus acidophilus Species 0.000 description 1
- 244000199885 Lactobacillus bulgaricus Species 0.000 description 1
- 102100035838 Lactosylceramide 4-alpha-galactosyltransferase Human genes 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000222702 Leishmania tarentolae Species 0.000 description 1
- 241000033241 Lelliottia Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 101150043276 Lon gene Proteins 0.000 description 1
- 241000283092 Loxodonta Species 0.000 description 1
- 241000283093 Loxodonta africana Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000289572 Macropus Species 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 241000555303 Mamestra brassicae Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 101710144007 Mannose-1-phosphate guanyltransferase Proteins 0.000 description 1
- 108010038016 Mannose-1-phosphate guanylyltransferase Proteins 0.000 description 1
- 241001416168 Mephitis Species 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000237536 Mytilus edulis Species 0.000 description 1
- 101100301239 Myxococcus xanthus recA1 gene Proteins 0.000 description 1
- XOCCAGJZGBCJME-QALBOBFASA-N N-Acetyl-6-deoxy-L-altrosamine Chemical compound C[C@@H]1OC(O)[C@H](NC(C)=O)[C@@H](O)[C@H]1O XOCCAGJZGBCJME-QALBOBFASA-N 0.000 description 1
- OVRNDRQMDRJTHS-WZPXOXCRSA-N N-Acetyl-D-Gulosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@H]1O OVRNDRQMDRJTHS-WZPXOXCRSA-N 0.000 description 1
- OVRNDRQMDRJTHS-XLSKCSLXSA-N N-Acetyl-D-Talosamine Chemical compound CC(=O)N[C@@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-XLSKCSLXSA-N 0.000 description 1
- XOCCAGJZGBCJME-VAYLDTTESA-N N-Acetyl-L-Fucosamine Chemical compound C[C@@H]1OC(O)[C@@H](NC(C)=O)[C@H](O)[C@@H]1O XOCCAGJZGBCJME-VAYLDTTESA-N 0.000 description 1
- OVRNDRQMDRJTHS-IQMFPIFPSA-N N-Acetyl-L-Idosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-IQMFPIFPSA-N 0.000 description 1
- 108010093077 N-Acetylglucosaminyltransferases Proteins 0.000 description 1
- 102000002493 N-Acetylglucosaminyltransferases Human genes 0.000 description 1
- 108010046068 N-Acetyllactosamine Synthase Proteins 0.000 description 1
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 description 1
- BRGMHAYQAZFZDJ-RTRLPJTCSA-N N-acetyl-D-glucosamine 6-phosphate Chemical compound CC(=O)N[C@H]1C(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BRGMHAYQAZFZDJ-RTRLPJTCSA-N 0.000 description 1
- 102100035286 N-acetyl-D-glucosamine kinase Human genes 0.000 description 1
- XOCCAGJZGBCJME-ZQLGFOCFSA-N N-acetyl-D-quinovosamine Chemical compound C[C@H]1OC(O)[C@H](NC(C)=O)[C@@H](O)[C@@H]1O XOCCAGJZGBCJME-ZQLGFOCFSA-N 0.000 description 1
- MNLRQHMNZILYPY-MDMHTWEWSA-N N-acetyl-alpha-D-muramic acid Chemical compound OC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)O[C@H](O)[C@@H]1NC(C)=O MNLRQHMNZILYPY-MDMHTWEWSA-N 0.000 description 1
- SQVRNKJHWKZAKO-PFQGKNLYSA-N N-acetyl-beta-neuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-PFQGKNLYSA-N 0.000 description 1
- 102100037774 N-acetylgalactosamine kinase Human genes 0.000 description 1
- 108030003719 N-acetylgalactosamine kinases Proteins 0.000 description 1
- 108010032040 N-acetylglucosamine kinase Proteins 0.000 description 1
- 102000048245 N-acetylneuraminate lyases Human genes 0.000 description 1
- 108700023220 N-acetylneuraminate lyases Proteins 0.000 description 1
- 108010035265 N-acetylneuraminate synthase Proteins 0.000 description 1
- SQVRNKJHWKZAKO-LUWBGTNYSA-N N-acetylneuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-LUWBGTNYSA-N 0.000 description 1
- SQMNIXJSBCSNCI-LUWBGTNYSA-N N-acetylneuraminic acid 9-phosphate Chemical compound CC(=O)N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)COP(O)(O)=O SQMNIXJSBCSNCI-LUWBGTNYSA-N 0.000 description 1
- 108010029147 N-acylmannosamine kinase Proteins 0.000 description 1
- 108010069465 N-acylneuraminate-9-phosphate synthase Proteins 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 101100176068 Oryza sativa subsp. japonica GLUA3 gene Proteins 0.000 description 1
- 241000237502 Ostreidae Species 0.000 description 1
- 101710116435 Outer membrane protein Proteins 0.000 description 1
- 235000019482 Palm oil Nutrition 0.000 description 1
- 102100032256 Parathyroid hormone/parathyroid hormone-related peptide receptor Human genes 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 108010074307 Phosphoacetylglucosamine mutase Proteins 0.000 description 1
- 102100024440 Phosphoacetylglucosamine mutase Human genes 0.000 description 1
- 241001674048 Phthiraptera Species 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 241001489192 Pichia kluyveri Species 0.000 description 1
- 241000270285 Pituophis Species 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 101710178100 Probable UDP-N-acetylglucosamine 2-epimerase Proteins 0.000 description 1
- 102220543868 Protocadherin-10_A39T_mutation Human genes 0.000 description 1
- 101100084022 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) lapA gene Proteins 0.000 description 1
- 101710086464 Putative UDP-N-acetylglucosamine 2-epimerase Proteins 0.000 description 1
- 101100453320 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) pfkC gene Proteins 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 102000004879 Racemases and epimerases Human genes 0.000 description 1
- MUPFEKGTMRGPLJ-RMMQSMQOSA-N Raffinose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 MUPFEKGTMRGPLJ-RMMQSMQOSA-N 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 235000019484 Rapeseed oil Nutrition 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 101100235786 Rattus norvegicus Lonp1 gene Proteins 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- JVWLUVNSQYXYBE-UHFFFAOYSA-N Ribitol Natural products OCC(C)C(O)C(O)CO JVWLUVNSQYXYBE-UHFFFAOYSA-N 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000235072 Saccharomyces bayanus Species 0.000 description 1
- 244000253911 Saccharomyces fragilis Species 0.000 description 1
- 241000277331 Salmonidae Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 101710150619 Sialic acid TRAP transporter permease protein SiaT Proteins 0.000 description 1
- 102100029954 Sialic acid synthase Human genes 0.000 description 1
- 239000000589 Siderophore Substances 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 241001278052 Starmerella Species 0.000 description 1
- 241000187438 Streptomyces fradiae Species 0.000 description 1
- 241000204060 Streptomycetaceae Species 0.000 description 1
- 241000271567 Struthioniformes Species 0.000 description 1
- 102100027918 Sucrase-isomaltase, intestinal Human genes 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 101000693115 Sulfurisphaera tokodaii (strain DSM 16993 / JCM 10545 / NBRC 100140 / 7) Sugar-1-phosphate acetyltransferase Proteins 0.000 description 1
- 235000019486 Sunflower oil Nutrition 0.000 description 1
- 108090000088 Symporters Proteins 0.000 description 1
- 102000003673 Symporters Human genes 0.000 description 1
- 101100029403 Synechocystis sp. (strain PCC 6803 / Kazusa) pfkA2 gene Proteins 0.000 description 1
- 241000270666 Testudines Species 0.000 description 1
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000255993 Trichoplusia ni Species 0.000 description 1
- 241000289672 Trichosurus vulpecula Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 241000283293 Tursiops Species 0.000 description 1
- 241000283311 Tursiops truncatus Species 0.000 description 1
- 108010070691 UDP-N-acetylglucosamine 4-epimerase Proteins 0.000 description 1
- 108010070808 UDP-galactose-lactosylceramide alpha 1-4-galactosyltransferase Proteins 0.000 description 1
- 101710196080 UDP-glucose:undecaprenyl-phosphate glucose-1-phosphate transferase Proteins 0.000 description 1
- MUPFEKGTMRGPLJ-UHFFFAOYSA-N UNPD196149 Natural products OC1C(O)C(CO)OC1(CO)OC1C(O)C(O)C(O)C(COC2C(C(O)C(O)C(CO)O2)O)O1 MUPFEKGTMRGPLJ-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 101000649206 Xanthomonas campestris pv. campestris (strain 8004) Uridine 5'-monophosphate transferase Proteins 0.000 description 1
- 241000269959 Xiphias gladius Species 0.000 description 1
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 1
- 108050001741 Xylosyltransferases Proteins 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235017 Zygosaccharomyces Species 0.000 description 1
- 241000588902 Zymomonas mobilis Species 0.000 description 1
- YMJBYRVFGYXULK-IVMDWMLBSA-N [(3r,4r,5s,6r)-3-amino-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl] dihydrogen phosphate Chemical compound N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)OC1OP(O)(O)=O YMJBYRVFGYXULK-IVMDWMLBSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000000205 acacia gum Substances 0.000 description 1
- 235000010489 acacia gum Nutrition 0.000 description 1
- KBGAYAKRZNYFFG-BOHATCBPSA-N aceneuramic acid Chemical compound OC(=O)C(=O)C[C@H](O)[C@@H](NC(=O)C)[C@@H](O)[C@H](O)[C@H](O)CO KBGAYAKRZNYFFG-BOHATCBPSA-N 0.000 description 1
- 238000005903 acid hydrolysis reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010042381 alpha 1,3-mannosyltransferase Proteins 0.000 description 1
- PMMURAAUARKVCB-UHFFFAOYSA-N alpha-D-ara-dHexp Natural products OCC1OC(O)CC(O)C1O PMMURAAUARKVCB-UHFFFAOYSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-BKBMJHBISA-N alpha-D-galacturonic acid Chemical compound O[C@H]1O[C@H](C(O)=O)[C@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-BKBMJHBISA-N 0.000 description 1
- WQZGKKKJIJFFOK-UHFFFAOYSA-N alpha-D-glucopyranose Natural products OCC1OC(O)C(O)C(O)C1O WQZGKKKJIJFFOK-UHFFFAOYSA-N 0.000 description 1
- HXXFSFRBOHSIMQ-VFUOTHLCSA-N alpha-D-glucose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-VFUOTHLCSA-N 0.000 description 1
- HXXFSFRBOHSIMQ-RWOPYEJCSA-L alpha-D-mannose 1-phosphate(2-) Chemical compound OC[C@H]1O[C@H](OP([O-])([O-])=O)[C@@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-RWOPYEJCSA-L 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 235000020244 animal milk Nutrition 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 150000001449 anionic compounds Chemical class 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 101150117498 arcA gene Proteins 0.000 description 1
- 230000010516 arginylation Effects 0.000 description 1
- KYPWIZMAJMNPMJ-JMSAOHGTSA-N ascarylopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)C[C@H]1O KYPWIZMAJMNPMJ-JMSAOHGTSA-N 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- HMQPEDMEOBLSQB-RCBHQUQDSA-N beta-D-Galp-(1->3)-alpha-D-GlcpNAc Chemical group CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HMQPEDMEOBLSQB-RCBHQUQDSA-N 0.000 description 1
- ODDPRQJTYDIWJU-OAUIKNEUSA-N beta-D-Galp-(1->3)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@H](O[C@@H](O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O ODDPRQJTYDIWJU-OAUIKNEUSA-N 0.000 description 1
- RNBGYGVWRKECFJ-ARQDHWQXSA-J beta-D-fructofuranose 1,6-bisphosphate(4-) Chemical compound O[C@H]1[C@H](O)[C@@](O)(COP([O-])([O-])=O)O[C@@H]1COP([O-])([O-])=O RNBGYGVWRKECFJ-ARQDHWQXSA-J 0.000 description 1
- AEMOLEFTQBMNLQ-UHFFFAOYSA-N beta-D-galactopyranuronic acid Natural products OC1OC(C(O)=O)C(O)C(O)C1O AEMOLEFTQBMNLQ-UHFFFAOYSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000005422 blasting Methods 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- LLSDKQJKOVVTOJ-UHFFFAOYSA-L calcium chloride dihydrate Chemical compound O.O.[Cl-].[Cl-].[Ca+2] LLSDKQJKOVVTOJ-UHFFFAOYSA-L 0.000 description 1
- FNAQSUUGMSOBHW-UHFFFAOYSA-H calcium citrate Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O.[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O FNAQSUUGMSOBHW-UHFFFAOYSA-H 0.000 description 1
- 239000001354 calcium citrate Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 229960003669 carbenicillin Drugs 0.000 description 1
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 241001233037 catfish Species 0.000 description 1
- 238000005341 cation exchange Methods 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000007073 chemical hydrolysis Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 239000012501 chromatography medium Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 235000020639 clam Nutrition 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 239000003240 coconut oil Substances 0.000 description 1
- 235000019864 coconut oil Nutrition 0.000 description 1
- 210000003022 colostrum Anatomy 0.000 description 1
- 235000021277 colostrum Nutrition 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- MPTQRFCYZCXJFQ-UHFFFAOYSA-L copper(II) chloride dihydrate Chemical compound O.O.[Cl-].[Cl-].[Cu+2] MPTQRFCYZCXJFQ-UHFFFAOYSA-L 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- CLRLHXKNIYJWAW-QBTAGHCHSA-N deaminoneuraminic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@@H]1OC(O)(C(O)=O)C[C@H](O)[C@H]1O CLRLHXKNIYJWAW-QBTAGHCHSA-N 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 101150106284 deoR gene Proteins 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 229940120503 dihydroxyacetone Drugs 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000000909 electrodialysis Methods 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- UNXHWFMMPAWVPI-ZXZARUISSA-N erythritol Chemical compound OC[C@H](O)[C@H](O)CO UNXHWFMMPAWVPI-ZXZARUISSA-N 0.000 description 1
- 235000019414 erythritol Nutrition 0.000 description 1
- 229940009714 erythritol Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 235000021323 fish oil Nutrition 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- RNBGYGVWRKECFJ-UHFFFAOYSA-N fructose-1,6-phosphate Natural products OC1C(O)C(O)(COP(O)(O)=O)OC1COP(O)(O)=O RNBGYGVWRKECFJ-UHFFFAOYSA-N 0.000 description 1
- 101150015731 fucI gene Proteins 0.000 description 1
- 108010083136 fucokinase Proteins 0.000 description 1
- 125000002446 fucosyl group Chemical group C1([C@@H](O)[C@H](O)[C@H](O)[C@@H](O1)C)* 0.000 description 1
- 150000002243 furanoses Chemical group 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- FBPFZTCFMRRESA-GUCUJZIJSA-N galactitol Chemical compound OC[C@H](O)[C@@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-GUCUJZIJSA-N 0.000 description 1
- 125000002519 galactosyl group Chemical group C1([C@H](O)[C@@H](O)[C@@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 101150013858 glgC gene Proteins 0.000 description 1
- 101150073660 glmM gene Proteins 0.000 description 1
- 101150111330 glmU gene Proteins 0.000 description 1
- 239000000174 gluconic acid Substances 0.000 description 1
- 235000012208 gluconic acid Nutrition 0.000 description 1
- 229950010772 glucose-1-phosphate Drugs 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229940097042 glucuronate Drugs 0.000 description 1
- 229940097043 glucuronic acid Drugs 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- MNQZXJOMYWMBOU-UHFFFAOYSA-N glyceraldehyde Chemical compound OCC(O)C=O MNQZXJOMYWMBOU-UHFFFAOYSA-N 0.000 description 1
- GNGACRATGGDKBX-UHFFFAOYSA-L glycerone phosphate(2-) Chemical compound OCC(=O)COP([O-])([O-])=O GNGACRATGGDKBX-UHFFFAOYSA-L 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 108010064833 guanylyltransferase Proteins 0.000 description 1
- 244000005709 gut microbiome Species 0.000 description 1
- 101150070420 gyrA gene Proteins 0.000 description 1
- 150000003278 haem Chemical group 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 150000002386 heptoses Chemical class 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 101150067967 iclR gene Proteins 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 229910001412 inorganic anion Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- JYJIGFIDKWBXDU-MNNPPOADSA-N inulin Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)OC[C@]1(OC[C@]2(OC[C@]3(OC[C@]4(OC[C@]5(OC[C@]6(OC[C@]7(OC[C@]8(OC[C@]9(OC[C@]%10(OC[C@]%11(OC[C@]%12(OC[C@]%13(OC[C@]%14(OC[C@]%15(OC[C@]%16(OC[C@]%17(OC[C@]%18(OC[C@]%19(OC[C@]%20(OC[C@]%21(OC[C@]%22(OC[C@]%23(OC[C@]%24(OC[C@]%25(OC[C@]%26(OC[C@]%27(OC[C@]%28(OC[C@]%29(OC[C@]%30(OC[C@]%31(OC[C@]%32(OC[C@]%33(OC[C@]%34(OC[C@]%35(OC[C@]%36(O[C@@H]%37[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O%37)O)[C@H]([C@H](O)[C@@H](CO)O%36)O)[C@H]([C@H](O)[C@@H](CO)O%35)O)[C@H]([C@H](O)[C@@H](CO)O%34)O)[C@H]([C@H](O)[C@@H](CO)O%33)O)[C@H]([C@H](O)[C@@H](CO)O%32)O)[C@H]([C@H](O)[C@@H](CO)O%31)O)[C@H]([C@H](O)[C@@H](CO)O%30)O)[C@H]([C@H](O)[C@@H](CO)O%29)O)[C@H]([C@H](O)[C@@H](CO)O%28)O)[C@H]([C@H](O)[C@@H](CO)O%27)O)[C@H]([C@H](O)[C@@H](CO)O%26)O)[C@H]([C@H](O)[C@@H](CO)O%25)O)[C@H]([C@H](O)[C@@H](CO)O%24)O)[C@H]([C@H](O)[C@@H](CO)O%23)O)[C@H]([C@H](O)[C@@H](CO)O%22)O)[C@H]([C@H](O)[C@@H](CO)O%21)O)[C@H]([C@H](O)[C@@H](CO)O%20)O)[C@H]([C@H](O)[C@@H](CO)O%19)O)[C@H]([C@H](O)[C@@H](CO)O%18)O)[C@H]([C@H](O)[C@@H](CO)O%17)O)[C@H]([C@H](O)[C@@H](CO)O%16)O)[C@H]([C@H](O)[C@@H](CO)O%15)O)[C@H]([C@H](O)[C@@H](CO)O%14)O)[C@H]([C@H](O)[C@@H](CO)O%13)O)[C@H]([C@H](O)[C@@H](CO)O%12)O)[C@H]([C@H](O)[C@@H](CO)O%11)O)[C@H]([C@H](O)[C@@H](CO)O%10)O)[C@H]([C@H](O)[C@@H](CO)O9)O)[C@H]([C@H](O)[C@@H](CO)O8)O)[C@H]([C@H](O)[C@@H](CO)O7)O)[C@H]([C@H](O)[C@@H](CO)O6)O)[C@H]([C@H](O)[C@@H](CO)O5)O)[C@H]([C@H](O)[C@@H](CO)O4)O)[C@H]([C@H](O)[C@@H](CO)O3)O)[C@H]([C@H](O)[C@@H](CO)O2)O)[C@@H](O)[C@H](O)[C@@H](CO)O1 JYJIGFIDKWBXDU-MNNPPOADSA-N 0.000 description 1
- 229940029339 inulin Drugs 0.000 description 1
- 230000026045 iodination Effects 0.000 description 1
- 238000006192 iodination reaction Methods 0.000 description 1
- INQOMBQAUSQDDS-UHFFFAOYSA-N iodomethane Chemical compound IC INQOMBQAUSQDDS-UHFFFAOYSA-N 0.000 description 1
- WSSMOXHYUFMBLS-UHFFFAOYSA-L iron dichloride tetrahydrate Chemical compound O.O.O.O.[Cl-].[Cl-].[Fe+2] WSSMOXHYUFMBLS-UHFFFAOYSA-L 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 150000002584 ketoses Chemical class 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000002865 local sequence alignment Methods 0.000 description 1
- ILRKELAUAFUGGJ-XLXDPAEISA-N ls tetrasaccharide d Chemical compound C1([C@@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O)O)NC(=O)C)O[C@]1(C(O)=O)C[C@H](O)[C@@H](NC(C)=O)[C@H]([C@H](O)[C@H](O)CO)O1 ILRKELAUAFUGGJ-XLXDPAEISA-N 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 235000011147 magnesium chloride Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 101150088678 manB gene Proteins 0.000 description 1
- 101150032120 manC gene Proteins 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 229940041290 mannose Drugs 0.000 description 1
- 125000000311 mannosyl group Chemical group C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 238000005374 membrane filtration Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005706 microflora Species 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 235000020638 mussel Nutrition 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- OVRNDRQMDRJTHS-IYWGXSQHSA-N n-[(3r,4s,5s,6r)-2,4,5-trihydroxy-6-(hydroxymethyl)oxan-3-yl]acetamide Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@H]1O OVRNDRQMDRJTHS-IYWGXSQHSA-N 0.000 description 1
- 230000024121 nodulation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002891 organic anions Chemical class 0.000 description 1
- 230000000065 osmolyte Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 235000020636 oyster Nutrition 0.000 description 1
- 239000002540 palm oil Substances 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 101150038284 pfkA gene Proteins 0.000 description 1
- 101150004013 pfkA1 gene Proteins 0.000 description 1
- 101150100557 pfkB gene Proteins 0.000 description 1
- 101150060387 pfp gene Proteins 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229940127557 pharmaceutical product Drugs 0.000 description 1
- 101150009573 phoA gene Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 125000001095 phosphatidyl group Chemical group 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000001508 potassium citrate Substances 0.000 description 1
- 229960002635 potassium citrate Drugs 0.000 description 1
- QEEAPRPFLLJWCF-UHFFFAOYSA-K potassium citrate (anhydrous) Chemical compound [K+].[K+].[K+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O QEEAPRPFLLJWCF-UHFFFAOYSA-K 0.000 description 1
- 235000011082 potassium citrates Nutrition 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 108010043671 prostatic acid phosphatase Proteins 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 150000003214 pyranose derivatives Chemical group 0.000 description 1
- 229940043131 pyroglutamate Drugs 0.000 description 1
- 230000006340 racemization Effects 0.000 description 1
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006894 reductive elimination reaction Methods 0.000 description 1
- 238000001448 refractive index detection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- HEBKCHPVOIAQTA-ZXFHETKHSA-N ribitol Chemical compound OC[C@H](O)[C@H](O)[C@H](O)CO HEBKCHPVOIAQTA-ZXFHETKHSA-N 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 229960002181 saccharomyces boulardii Drugs 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000003998 size exclusion chromatography high performance liquid chromatography Methods 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 235000015424 sodium Nutrition 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 238000000371 solid-state nuclear magnetic resonance spectroscopy Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 239000002600 sunflower oil Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 235000021335 sword fish Nutrition 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 235000019157 thiamine Nutrition 0.000 description 1
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- 239000011721 thiamine Substances 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 238000004809 thin layer chromatography Methods 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 235000013337 tricalcium citrate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000000825 ultraviolet detection Methods 0.000 description 1
- 101150047507 ushA gene Proteins 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 229960004295 valine Drugs 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000000196 viscometry Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 235000019155 vitamin A Nutrition 0.000 description 1
- 239000011719 vitamin A Substances 0.000 description 1
- 239000012610 weak anion exchange resin Substances 0.000 description 1
- 239000012608 weak cation exchange resin Substances 0.000 description 1
- 239000000811 xylitol Substances 0.000 description 1
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 1
- 235000010447 xylitol Nutrition 0.000 description 1
- 229960002675 xylitol Drugs 0.000 description 1
- 229960003487 xylose Drugs 0.000 description 1
- 125000000969 xylosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)CO1)* 0.000 description 1
- 239000011592 zinc chloride Substances 0.000 description 1
- 235000005074 zinc chloride Nutrition 0.000 description 1
- JIAARYAFYJHUJI-UHFFFAOYSA-L zinc dichloride Chemical compound [Cl-].[Cl-].[Zn+2] JIAARYAFYJHUJI-UHFFFAOYSA-L 0.000 description 1
- 150000008495 β-glucosides Chemical class 0.000 description 1
- HAIWUXASLYEWLM-QTSLKERKSA-N β‐D‐sedoheptulose Chemical compound OC[C@H]1OC(O)(CO)[C@@H](O)[C@H](O)[C@@H]1O HAIWUXASLYEWLM-QTSLKERKSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/18—Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01094—Protein N-acetylglucosaminyltransferase (2.4.1.94)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Saccharide Compounds (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 합성 생물학 및 대사 공학의 기술 분야이다. 보다 특히, 본 발명은 대사적으로 조작된 숙주 세포 배양의 기술 분야이다. 본 발명은 유전자 조작된 세포와 배양에 의한 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 제조하는 방법을 비롯하여, 방법에서 사용되는 유전자 조작된 세포를 기술한다. 유전자 조작된 세포는 코어 삼당류로서 LN3을 포함하는 올리고당의 합성에 관여되는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열 및 막 단백질을 발현하는 적어도 하나의 핵산 서열을 포함한다. 더 나아가서, 본 발명은 배양으로부터 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 정제를 제공한다.
Description
본 발명은 합성 생물학 및 대사 공학의 기술 분야이다. 보다 특히, 본 발명은 대사적으로 조작된 숙주 세포 배양의 기술 분야이다. 본 발명은 유전자 조작된 세포와 배양에 의해서 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 제조하는 방법을 비롯하여, 방법에서 사용되는 유전자 조작된 세포를 기술한다. 유전자 조작된 세포는 코어 삼당류로서 LN3을 포함하는 올리고당의 합성에 관여되는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열 및 막 단백질을 발현하는 적어도 하나의 핵산 서열을 포함한다. 더 나아가서, 본 발명은 배양으로부터 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 정제를 제공한다.
오늘날, 인간 모유 올리고당 (HMO) 패밀리에 속하는 80개 초과의 화합물이 구조적으로 특징규명되었다. 이들 HMO는 프리바이오틱으로서 기능하는 복합 올리고당 클래스를 나타낸다. 추가적으로, 상피 에피토프에 대한 HMO의 구조적 상동성은 박테리아 병원체에 대한 보호 성질을 설명한다. 유아 위장관 내에서, HMO는 선택된 박테리아 균주의 성장에 선택적으로 영양분을 공급하고, 따라서 모유-수유된 유아에서 고유한 장내 마이크로바이오타의 발달에 대비한다. 일부 이들 HMO는 특정 생물학적 활성을 나타낼 가능성이 가장 큰 GlcNAc-베타1,3-Gal-베타1,4-Glc (락토-N-트리오스, LN3)의 코어 구조를 갖는 특정 올리고당 구조의 존재를 요구한다. 이들 올리고당의 생산은 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여서 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제의 작용 및 LN3 코어 삼당류를 추가로 변형시키는 다른 글리코실트랜스퍼라제의 추가 작용을 필요로 한다. 미생물의 발효적 생산에서, 코어 삼당류로서 LN3을 갖는 올리고당은 많은 경우에 산업적 생산 숙주의 세포내에서 생산된다. 세포에서 올리고당 생산의 진정한 어려움으로서 당분야에서 확인된 한가지 문제는 생산된 올리고당의 세포내 농후화 및 그들 추출이다. 세포내 농후화는 원하는 올리고당의 생산에 대한 생산물-억제 효과의 원인이 되는 것으로 여겨진다. 합성은 느려질 수 있거나 또는 원하는 올리고당이 세포독성 농도에 도달하여 물질대사 정지 또는 심지어 세포 용해를 일으킬 수 있다.
본 발명의 목적은 코어 삼당류로서 LN3을 갖는 올리고당을 효율적으로, 시간 및 비용 효율적인 방식으로 생산할 수 있고, 높은 양의 원하는 생산물을 산출하는 도구 및 방법을 제공하는 것이다.
본 발명에 따라서, 이러한 목적 및 다른 목적은 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 위한 방법 및 세포를 제공하여 달성되고, 세포는 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 위해서 유전자 변형되고 코어 삼당류로서 LN3을 갖는 올리고당의 합성에 관여되는 효소를 코딩하는 적어도 하나의 핵산 서열을 포함하고, 보다 특히 세포는 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 코어 삼당류로서 LN3을 갖는 올리고당을 합성하는 적어도 하나의 다른 글리코실트랜스퍼라제를 코딩하는 핵산 서열을 포함한다. 더 나아가서 세포는 또한 막 단백질을 발현하고, 보다 특히 세포는 더 나아가서 또한 본 발명에 따른 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 개선시키고/시키거나 유출을 가능하게 하고/하거나 증강시키는 것으로 이전에 알려지지 않은 막 단백질을 발현한다.
놀랍게도, 본 발명에서 사용되는 막 단백질은 새롭게 확인된 막 단백질을 제공하고, 보다 특히 본 발명은 코어 삼당류로서 LN3을 갖는 올리고당의 수송을 가능하게 하고, 상기 코어 삼당류로서 LN3을 갖는 올리고당의 발효적 생산에 대해 긍정적인 효과를 가지며, 상기 코어 삼당류로서 LN3을 갖는 올리고당을 생산하는 숙주 세포를 유전자 조작하는데 사용될 때 더 양호한 수율, 생산성, 비생산성 및/또는 성장 속도를 제공하는 것으로 이전에 알려지지 않은 새롭게 확인된 막 단백질을 제공한다는 것을 이제 확인하였다.
본 발명은 또한 코어 삼당류로서 LN3을 갖는 올리고당을 제조하기 위한 방법을 제공한다. 코어 삼당류로서 LN3을 갖는 올리고당은 본 발명의 막 단백질을 포함하는 숙주 세포에 의해 수득된다.
정의
본 발명 및 이의 다양한 구현예를 설명하기 위해서 본 명세서에서 사용되는 단어는 그들의 일반적으로 정의된 뜻의 의미에서 이해되어야 할뿐만 아니라, 본 명세서 구조에서 특별한 정의를 통해서 일반적으로 정의되는 뜻의 범위를 벗어나는 물질 또는 행위를 포함하는 것으로 이해되어야 한다. 따라서, 본 명세서의 상황에서 성분이 하나 초과의 뜻을 포함하는 것으로 이해될 수 있으면, 청구항에서 이의 사용은 명세서 및 단어 그 자체에 의해 뒷받침되는 모든 가능한 뜻에 대해 포괄적인 것으로 이해되어야만 한다.
본 명세서에 개시되는 본 발명의 다양한 양태 및 양태의 구현예는 본 명세서에서 특별히 설명되는 순서 및 상황을 비롯하여, 임의 순서 및 이의 임의 조합을 포함하는 것으로 이해해야 한다. 상황에서 요구할 때마다, 단수로 사용되는 모든 단어는 복수를 포함하는 것으로 간주되고 그 반대도 마찬가지이다. 달리 정의하지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 일반적으로 본 발명이 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용되는 명명법 및 본 명세서에 기술된 세포 배양, 분자 유전학, 유기 화학 및 핵산 화학 및 혼성화에서의 실험 절차는 당분야에서 충분히 공지되어서 일반적으로 적용된다. 표준 기술이 핵산 및 펩티드 합성에 사용된다. 일반적으로, 효소 반응 및 정제 단계는 제조사 사양에 따라서 수행된다.
도면 및 명세서에서, 본 발명의 구현예들이 개시되어 있고, 특정한 용어가 적용되지만, 용어들은 설명적인 의미로만 사용되고 제한의 목적이 아니고, 본 발명의 범주는 하기 청구항에 기재된다. 예시된 구현예는 예시의 목적으로만 기재되었고 본 발명을 제한하는 것으로 간주해서는 안된다는 것을 이해해야 한다. 변경, 다른 구현예, 개선, 상세사항, 및 사용은 균등론을 포함하여, 특허법에 따라서 해석되는, 청구항에 의해서만 제한되는, 본 발명의 범주 내에서 본 발명의 문자 및 정신과 일관되게 이루어질 수 있다는 것은 당업자에게 자명할 것이다. 하기의 청구항에서, 청구 범위 단계를 지정하는데 사용되는 참조 부호는 단지 설명의 편이를 위해 제공되고, 단계를 수행하기 위한 임의의 특정 순서를 의미하려는 의도가 아니다.
이 문헌 및 이의 청구항에서, 동사 "포함하다", "가지다" 및 "함유하다", 및 그들 활용형은 그 단어 뒤에 오는 항목을 포함하지만, 특별히 언급되지 않은 항목을 배제하지는 않는다는 것을 의미하기 위해 그들의 비제한적인 의미로 사용된다. 동사 "본질적으로 이루어진다"는 특별히 확인되지 않은 것 이외에 추가 성분(들)이 존재할 수 있다는 것을 의미하고, 상기 추가 성분(들)은 본 발명의 고유한 특징을 변경시키지 않는다. 본 출원 및 청구항 전반에서, 특별히 달리 명시하지 않으면, 동사 "포함하다", "가지다" 및 "함유하다" 및 그들 활용형은 바람직하게 "이루어지다" (및 이의 활용형) 또는 "본질적으로 이루어지다" (및 이의 활용형)으로 대체될 수 있고, 그 반대도 마찬가지이다. 또한, 부정 관사 "한" 또는 "하나"에 의한 성분에 대한 참조는 하나 및 오직 하나의 성분이 존재하는 것을 문맥에서 명확하게 요구하지 않으면, 하나 초과의 성분이 존재할 가능성을 배제하지 않는다. 따라서, 부정 관사 "한" 또는 "하나"는 일반적으로 "적어도 하나"를 의미한다.
본 발명에 따라서, 용어 "폴리뉴클레오티드(들)"는 일반적으로 비변형된 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있는, 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 의미한다. "폴리뉴클레오티드(들)"는 제한없이, 단일-가닥 및 이중-가닥 DNA, 단일-가닥 및 이중-가닥 영역 또는 단일-가닥, 이중-가닥 및 삼중-가닥 영역의 혼합물인 DNA, 단일-가닥 및 이중-가닥 RNA, 및 단일-가닥 및 이중-가닥 영역의 혼합물인 RNA, 단일-가닥일 수 있거나, 또는 보다 전형적으로 이중-가닥, 또는 삼중-가닥 영역, 또는 단일-가닥 및 이중-가닥 영역의 혼합물일 수 있는 DNA 및 RNA를 포함하는 하이브리드 분자를 포함한다. 또한, 본 명세서에서 사용되는, "폴리뉴클레오티드"는 RNA 또는 DNA 또는 RNA 및 DNA 둘 모두를 포함하는 삼중-가닥 영역을 의미한다. 이러한 영역에서 가닥은 동일한 분자 또는 상이한 분자 유래일 수 있다. 영역은 하나 이상의 분자 모두를 포함할 수 있지만, 보다 전형적으로 분자 중 일부의 영역만을 포함한다. 삼중-나선 영역의 분자 중 하나는 종종 올리고뉴클레오티드이다. 본 명세서에서 사용되는, 용어 "폴리뉴클레오티드(들)"는 또한 하나 이상의 변형된 염기를 함유하는 상기 기술된 바와 같은 DNA 또는 RNA를 포함한다. 따라서, 안정성 또는 다른 이유로 변형된 골격을 갖는 DNA 또는 RNA는 본 발명에 따른 "폴리뉴클레오티드(들)"이다. 또한, 특정한 염기, 예컨대, 이노신, 또는 변형된 염기, 예컨대 트리틸화된 염기를 포함하는 DNA 또는 RNA는 용어 "폴리뉴클레오티드"에 포괄되는 것으로 이해한다. 매우 다양한 변형이 DNA 및 RNA에 만들어져서 당업자에게 공지된 많은 유용한 목적을 제공한다는 것을 이해할 것이다. 본 명세서에서 적용되는 바와 같은 용어 "폴리뉴클레오티드(들)"는 예를 들어, 단순 및 복합 세포를 포함한, 세포 및 바이러스의 특징적인 DNA 및 RNA의 화학적 형태를 비롯하여, 폴리뉴클레오티드의 화학적, 효소적, 또는 대사적으로 변형된 형태를 포괄한다. 용어 "폴리뉴클레오티드(들)"는 또한 종종 올리고뉴클레오티드(들)라고 하는 짧은 폴리뉴클레오티드를 포괄한다.
"폴리펩티드(들)"는 펩티드 결합 또는 변형된 펩티드 결합을 통해서 서로에게 연결된 둘 이상의 아미노산을 포함하는 임의의 펩티드 또는 단백질을 의미한다. "폴리펩티드(들)"는 일반적으로 펩티드, 올리고펩티드 및 올리고머라고 하는, 짧은 사슬과, 일반적으로 단백질이라고 하는 보다 긴 사슬을 의미한다. 폴리펩티드는 20개 유전자 코딩되는 아미노산 이외의 아미노산을 함유할 수 있다. "폴리펩티드(들)"는 천연 과정, 예컨대 프로세싱 및 다른 번역후 변형에 의해서 뿐만 아니라, 또한 화학적 변형 기술에 의해서 변형된 것들을 포함한다. 이러한 변형은 기초 교재 및 보다 상세한 논문을 비롯하여, 방대한 연구 문헌에서 충분히 설명되고, 당업자에게 충분히 공지되어 있다. 동일 유형의 변형이 소정 폴리펩티드의 몇개 부위에서 동일하거나 또는 다양한 정도로 존재할 수 있다. 더 나아가서, 소정 펩티드는 많은 유형의 변형을 함유할 수 있다. 변형은 펩티드 골격, 아미노산 측쇄, 및 아미노 또는 카르복실 말단을 포함하여, 폴리펩티드의 어느 곳에서도 발생될 수 있다. 변형은 예를 들어, 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 부착, 헴 모이어티의 공유 부착, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 부착, 지질 또는 지질 유도체의 공유 부착, 포스파티딜이노시톨의 공유 부착, 가교 결합, 고리화, 디술피드 결합 형성, 탈메틸화, 공유 가교 결합의 형성, 파이로글루타메이트의 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 단백질분해 프로세싱, 인산화, 프레닐화, 라세미화, 지질 부착, 술페이트화, 글루탐산 잔기의 감마-카르복실화, 히드록실화 및 ADP-리보실화, 헬레노일화, 단백질에 아미노산의 전달-RNA 매개 첨가, 예컨대, 아르기닐화, 및 유비퀴틴화를 포함한다. 폴리펩티드는 분지되거나 또는 분지되지 않은, 환형 또는 분지형일 수 있다. 환형, 분지형 및 분지된 원형 폴리펩티드는 번역 후 천연 과정에 의할 수 있고, 또한 완전 합성 방법으로도 만들어질 수 있다.
"단리된"은 이의 천연 상태로부터 "인간의 손에 의해" 변경된 것을 의미하는데, 다시 말해서, 자연에서 발생된 경우에, 이의 본래 환경으로부터 변화 또는 제거되었거나, 또는 둘 모두이다. 예를 들어, 살아있는 유기체에 천연적으로 존재하는 폴리뉴클레오티드 또는 폴리펩티드는 "단리된" 것이 아니지만, 본 명세서에서 이 용어가 적용되는 바와 같이, 이의 천연 상태의 공존 물질로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 "단리된" 것이다. 유사하게, "합성"은 본 명세서에서 이 용어가 사용되는 바와 같이, 천연 공급원으로부터 직접적으로 단리된 것이 아니라 합성적으로 생성된 임의 서열을 의미한다. "합성된"은, 본 명세서에서 이 용어가 사용되는 바와 같이, 천연 공급원으로부터 직접적으로 단리된 것이 아니라 임의의 합성적으로 생성된 서열을 의미한다.
"재조합"은 한 종으로부터 유래한 유전자를 상이한 종의 숙주 유기체의 세포로 이식하거나 또는 스플라이싱하여서 제조된 유전자 조작된 DNA를 의미한다. 이러한 DNA는 숙주의 유전적 구성의 일부가 되어서 복제된다.
본 발명의 상황 내에서 용어 "내생성"은 세포의 천연 부분이고 세포 염색체 내 이의 천연 위치에서 발생되는 임의의 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열을 의미한다.
폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소에 대해서 사용될 때 "이종성"은 공급원 유래이거나 또는 숙주 유기체 종 이외의 공급원으로부터 유래되는 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소를 의미한다. 대조적으로, "상동성" 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소는 숙주 유기체 종으로부터 유래되는 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소를 의미하고자 본 명세서에서 사용된다. 유전자 서열을 유지하거나 또는 조작하는데 사용되는 유전자 조절 서열 또는 보조 핵산 서열 (예를 들어, 프로모터, 5' 비번역 영역, 3' 비번역 영역, 폴리A 첨가 서열, 인트론 서열, 스플라이스 부위, 리보솜 결합 부위, 내부 리보솜 진입 서열, 게놈 상동성 영역, 재조합 부위 등)에 대해 언급될 때, "이종성"은 조절 또는 보조 핵산 서열이 구성체, 게놈, 염색체, 또는 에피솜에서 병치되는 유전자와 천연적으로 연관되지 않은 것을 의미한다. 따라서, 이의 천연 상태 (즉, 비-유전자 조작된 유기체의 게놈)에서 작동적으로 연결되지 않은 유전자에 작동적으로 연결된 프로모터는 프로모터가 연결되는 유전자와 동일한 종 (또는 일부 경우에, 동일한 유기체)으로부터 유래될 수 있더라도, 본 명세서에서 "이종성 프로모터"라고 한다.
본 명세서에서 사용되는 용어 "폴리펩티드를 코딩하는 폴리뉴클레오티드"는 본 발명의 폴리펩티드를 코딩하는 서열을 포함하는 폴리뉴클레오티드를 포괄한다. 용어는 또한 코딩 및/또는 비-코딩 서열을 함유할 수도 있는 추가 영역과 함께, (예를 들어, 통합된 파지 또는 삽입 서열 또는 편집에 의해 개재됨) 폴리펩티드를 코딩하는 단일 연속 영역 또는 불연속 영역을 포함하는 폴리뉴클레오티드를 포괄한다.
용어 유전자의 "변형된 발현"은 코어 삼당류로서 LN3을 갖는 올리고당의 생산 과정의 임의 단계에서 상기 유전자의 애샹형 발현과 비교하여 발현의 변화와 관련된다. 상기 변형된 발현은 야생형과 비교하여 더 낮거나 또는 더 높은 발현으로서, 용어 "더 높은 발현"은 또한 내생성 유전자의 경우에 상기 유전자의 "과발현" 또는 야생형 균주에 존재하지 않는 이종성 유전자의 경우에 "발현"으로 정의된다. 더 낮은 발현은 기능성 최종 생산물을 생산하기 위해 "부족한-능력" (즉, 기능성 야생형 유전자와 비교하여 통계적으로 유의하게 '부족한-능력')이 되거나 또는 완전하게 불능 (예컨대, 유전자 녹-아웃)이 되는 방식으로 유전자를 변화시키는데 사용되는 당업자에게 일반적으로 충분히 공지된 기술 (예컨대, siRNA, CrispR, CrispRi, 리콤비니어링, 상동성 재조합, ssDNA 돌연변이유발법, RNAi, miRNA, asRNA, 유전자 돌연변이, 유전자 녹-아웃, 트랜스포존 돌연변이유발법 등의 사용)을 통해서 수득된다. 과발현 또는 발현는 당업자에게 일반적으로 충분히 공지된 기술을 통해서 수득되고, 상기 유전자는 프로모터 서열, 비번역 영역 서열 (리보솜 결합 서열 또는 코작 서열을 함유), 코딩 서열 (예를 들어, 막 단백질 유전자 서열) 및 임의로 전사 종결자가 존재하여, 기능성 활성 단백질의 발현을 일으키는 임의 서열과 관련된 "발현 카세트"의 일부이다. 상기 발현은 항상성이거나 또는 조건적이거나 또는 조절되거나 또는 조율가능하다.
용어 "항상성 발현"은 일정 성장 조건 하에서 RNA 폴리머라제의 서브유닛 (예를 들어, 박테리아 시그마 인자) 이외의 전사 인자에 의해 조절되지 않는 발현으로서 정의된다. 이러한 전사 인자의 비제한적인 예에는 이. 콜라이의 CRP, LacI, ArcA, Cra, IclR, 또는 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae)의 Aft2p, Crz1p, Skn7, 또는 비. 서브틸리스 (B. subtilis)의 DeoR, GntR이 있다. 이들 전사 인자는 특이적 서열에 결합하여서 일정 성장 조건 하에서 발현을 차단할 수 있거나 또는 증강시킬 수 있다. RNA 폴리머라제는 예를 들어 원핵생물 숙주에서 시그마 인자를 통해서, 전사를 개시하기 위한 특이적 서열에 결합한다.
용어 "조절된 발현"은 일정 성장 조건 하에서 RNA 폴리머라제의 서브유닛 (예를 들어, 박테리아 시그마 인자) 이외의 전사 인자에 의해 조절되는 발현으로서 정의된다. 이러한 전사 인자의 예는 상기에 기술되어 있다. 일반적으로 발현 조적은 유도제, 예컨대 제한되지 않지만, IPTG, 아라비노스, 람노스, 푸코스, 알로-락토스 또는 pH 이동, 또는 온도 이동 또는 탄소 고갈 또는 기질 또는 생산된 생성물에 의해 수득된다.
용어 "제어 서열"은 폴리펩티드로 폴리뉴클레오티드 서열의 전사 및 번역을 허용하는, 숙주 세포 전사 및 번역 시스템에 의해 인식되는 서열을 의미한다. 따라서 이러한 DNA 서열은 특정 세포 또는 유기체에서 작동적으로 연결된 코딩 서열의 발현에 필수적이다. 이러한 제어 서열은 프로모터 서열, 리보솜 결합 서열, 샤인 달가르노 서열, 코작 서열, 전사 종결자 서열일 수 있지만, 이에 제한되지 않는다. 예를 들어, 원핵생물에 적합한 제어 서열은 프로모터, 임의로 오퍼레이터 서열, 및 리보솜 결합 부위를 포함한다. 진핵생물 세포는 프로모터, 폴리아데닐화 신호, 및 인핸서를 이용하는 것으로 알려져 있다. 전서열 또는 분비 리더에 대한 DNA는 폴리펩티드의 분비에 관여하는 전단백질로서 발현되는 경우에 폴리펩티드에 대한 DNA에 작동적으로 연결될 수 있고; 프로모터 또는 인핸서는 서열의 전사에 영향을 미치는 경우에 코딩 서열에 작동적으로 연결되거나; 또는 리보솜 결합 부위는 서열의 전사에 미치는 경우에 코딩 서열에 작동적으로 연결되거나; 또는 리보솜 결합 부위는 번역을 촉진하도록 위치되는 경우에 코딩 서열에 작동적으로 연결된다. 상기 제어 서열은 더 나아가서 폴리펩티드로 상기 폴리뉴클레오티드의 전사 또는 번역을 유도하거나 또는 억제하는 유전자 회로를 통해서 또는 유도성 프로모터를 통해서 외부 화학물, 예컨대, 제한없이, IPTG, 아라비노스, 락토스, 알로-락토스, 람노스 또는 푸코스를 사용해 제어될 수 있다.
일반적으로, "작동적으로 연결된"은 연결되는 DNA 서열이 연속적이고, 분비 리더의 경우에, 연속적이고, 판독 상으로 존재한다는 것을 의미한다. 그러나, 인핸서는 연속적일 필요는 없다.
용어 "야생형"은 자연계에서 발생되는 바와 같은 일반적으로 공지된 유전자 또는 표현형 상태를 의미한다.
본 명세서에서 사용되는 용어로서 "변이체(들)"는 기준 폴리뉴클레오티드 또는 폴리펩티드와 각각 상이하지만 필수 성질은 보유하는 폴리뉴클레오티드 또는 폴리펩티드이다. 폴리뉴클레오티드의 전형적인 변이체는 다른, 기준 폴리뉴클레오티드와 뉴클레오티드 서열이 상이하다. 변이체의 뉴클레오티드 서열에서 변화는 기준 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드의 아미노산 서열은 변경시킬 수 있거나 또는 변경시키지 않을 수 있다. 뉴클레오티드 변화는 하기에 논의되는 바와 같이, 기준 서열에 의해 코딩되는 폴리펩티드에 아미노산 치환, 부가, 결실, 융합 및 절두를 일으킬 수 있다. 폴리펩티드의 전형적인 변이체는 다른, 기준 폴리펩티드와 아미노산 서열이 상이하다. 일반적으로, 차이는 기준 폴리펩티드와 변이체의 서열이 전체적으로 밀접하게 유사하고, 많은 영역에서, 동일하도록 제한적이다. 변이체 및 기준 폴리펩티드는 임의 조합의 하나 이상의 치환, 부가, 결실이 아미노산 서열에서 상이할 수 있다. 치환되거나 또는 삽입된 아미노산 잔기는 유전자 코드에 의해 코딩되는 것일 수 있거나 또는 아닐 수도 있다. 폴리뉴클레오티드 또는 폴리펩티드의 변이체는 천연 발생 예컨대 대립유전자 변이체일 수 있거나, 또는 천연적으로 발생되는 것으로 알려지지 않은 변이체일 수 있다. 폴리뉴클레오티드 및 폴리펩티드의 비천연 발생 변이체는 돌연변이유발법 기술에 의해서, 직접 합성에 의해서, 그리고 당업자에게 공지된 다른 재조합 방법에 의해서 만들어질 수 있다.
일부 구현예에서, 본 발명은 본 발명에서 사용되는 막 단백질의 구조를 변형시켜서 기능성 변이체를 만드는 것을 고려한다. 변이체는 아미노산 치환, 결실, 부가, 또는 이의 조합에 의해 제조될 수 있다. 예를 들어, 류신을 이소류신 또는 발린으로, 아스파테이트를 글루타메이트로, 트레오닌을 세린으로 단리된 치환, 또는 아미노산을 구조적으로 관련된 아미노산으로의 유사한 치환 (예를 들어, 보존성 돌연변이)은 최종 분자의 생물학적 활성에 대해 주요한 효과를 갖지 않을 것으로 예상하는 것이 타당하다. 보존성 치환은 그들 측쇄와 관련된 아미노산 패밀리 내에서 일어나는 것이다. 본 발명의 폴리펩티드의 아미노산 서열 변화가 기능성 상동체를 생성시키는지 여부는 변이체없는 세포에 비해서 더 양호한 수율, 생산성, 및/또는 성장 속도를 제공하기 위한 본 발명의 경우에, 야생형 폴리펩티드와 유사한 방식으로 세포에서 반응을 일으키는 변이체 폴리펩티드의 능력을 평가하여 쉽게 결정할 수 있다.
본 명세서에서 사용되는 용어 "기능성 상동체"는 서열 유사성을 갖고 또한 적어도 하나의 기능적 특징, 예컨대, 생화학적 활성을 공유하는 분자를 설명한다. 본 발명의 상황에서, 본 발명에 따른 막 단백질 'Z'의 기능성 상동체 (일반적으로 SEQ ID NO로 표시됨)는 본 발명에 기술된 바와 같은 코어 당류로서 LN3을 갖는 올리고당을 수송할 수 있는 막 단백질을 의미하며, 다시 말해서, 기능성 상동체는 코어 당류로서 LN3을 갖는 올리고당을 수송하는 막 단백질 'Z'의 기능성 특징을 보유한다. 보다 특히, 본 명세서에서 사용되는 "기능성 상동체"는 서열 유사성 (다른 말로, 상동성)을 갖고, 동시에 적어도 하나의 기능적 유사성, 예컨대, 생화학적 활성을 갖는 단백질을 설명한다 (Altenhoff et al., PLoS Comput. Biol. 8 (2012) e1002514).
때때로 기능성 상동체는 오솔로그라고 하며, 여기서 "오솔로그"는 다른 종에서 기준이 되는 유전자 또는 단백질의 기능적으로 동등한 상동성 유전자 또는 단백질을 의미한다. 기능성 상동체는 전형적으로 유사하지만, 반드시 동일하지는 않은 정도로 동일한 특징을 일으키게 된다. 기능적으로 상동성인 단백질은 한 상동체에 의해 생성되는 정량적 측정이 다른 것의 적어도 10%; 보다 전형적으로, 적어도 20%, 약 30%와 약 40% 사이; 예를 들어, 약 50%와 약 60% 사이; 약 70%와 약 80% 사이; 또는 약 90%와 약 95% 사이; 약 98%와 약 100% 사이, 또는 본래 분자에 의해 생성되는 것의 100% 초과인 동일한 특징을 제공한다. 따라서, 분자가 효소적 활성을 갖는 경우에, 기능성 상동체는 본래 효소와 비교하여 상기-언급된 %의 효소적 활성을 갖게 된다. 분자가 DNA-결합 분자 (예를 들어, 폴리펩티드)인 경우에, 상동체는 본래 분자와 비교하여 결합된 분자의 중량으로 측정하여 상기-언급된 %의 결합 친화성을 갖게 된다.
기능성 상동체 및 기준 폴리펩티드는 천연 발생 폴리펩티드일 수 있고, 서열 유사성은 수렴 또는 분기 진화적 사건에 기인할 수 있다.
기능성 상동체는 뉴클레오티드 및 폴리펩티드 서열 정렬의 분석으로 확인될 수 있다. 예를 들어, 뉴클레오티드 또는 폴리펩티드 서열의 데이터베이스 상에서 문의의 수행은 생물량-조절 폴리펩티드의 상동체를 확인할 수 있다. 서열 분석은 기준 서열로서 생물랑-조절 폴리펩티드의 아미노산 서열을 사용하여 비-중복 데이터베이스의 BLAST, 상호 BLAST, 또는 PSI-BLAST 주석을 포함할 수 있다. 아미노산 서열은 일부 예에서, 뉴클레오티드 서열로부터 추론된다. 전형적으로, 40% 초과의 서열 동일성을 갖는 데이터베이스의 폴리펩티드는 생물량-조절 폴리펩티드로서 적합성에 대한 추가 평가를 위한 후보이다. 아미노산 서열 유사성은 보존성 아미노산 치환, 예컨대, 한 소수성 잔기의 다른 것으로의 치환 또는 한 극성 잔기의 다른 것으로의 치환을 허용한다. 원하는 경우에, 이러한 후보의 수동 검사가 추가 평가하려는 후보의 수를 줄이기 위해 수행될 수 있다. 수동 검사는 생산성-조절 폴리펩티드에 존재하는 도메인, 예를 들어, 보존된 기능성 도메인을 갖는 것으로 보이는 후보를 선택하여 수행될 수 있다.
폴리뉴클레오티드에 대한, "단편"은 폴리뉴클레오티드 분자의 클론 또는 임의 부분, 특히 이용가능한, 기능성 특징을 보유하는 폴리뉴클레오티드의 일부를 의미한다. 유용한 단편은 복제, 전사 또는 번역의 조절에서 또는 혼성화 또는 증폭 기술에서 사용될 수 있는 올리고뉴클레오티드 및 폴리뉴클레오티드를 포함한다. "폴리뉴클레오티드 단편"은 폴리뉴클레오티드의 임의의 하위서열, 전형적으로 본 명세서에 제공되는 임의 서열의, 적어도 약 9 연속 뉴클레오티드, 예를 들어, 적어도 약 30 뉴클레오티드 또는 적어도 약 50 뉴클레오티드를 의미한다. 예시적인 단편은 추가적으로 또는 대안적으로 폴리펩티드의 보존된 패밀리 도메인을 코딩하는 영역을 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지는 단편을 포함할 수 있다.
예시적인 단편은 추가적으로 또는 대안적으로 폴리펩티드의 보존된 도메인을 포함하는 단편을 포함할 수 있다.
단편은 추가적으로 또는 대안적으로 폴리펩티드 및 단백질 분자의 하위서열, 또는 폴리펩티드의 하위서열을 포함할 수 있다. 일부 경우에, 단편 또는 도메인은 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 또는 유사한 정도까지, 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드의 하위서열이다. 예를 들어, 폴리펩티드 단편은 인식가능한 구조적 모티프 또는 기능적 도메인 예컨대, DNA-결합 부위 또는 DNA 프로모터 영역에 결합하는 도메인, 활성화 도메인, 또는 단백질-단백질 상호작용을 위한 도메인을 포함할 수 있고, 전사를 개시할 수 있다. 단편은 3 아미노산 잔기만큼 작은 크기부터 온전한 폴리펩티드의 전체 길이까지, 예를 들어, 적어도 약 20 아미노산 잔기 길이, 예를 들어, 적어도 약 30 아미노산 잔기 길이로 다양할 수 있다. 우선적으로, 단편은 유래되는 폴리펩티드의 적어도 하나의 성질 또는 활성을 갖는 기능성 단편이고, 예컨대, 예를 들어, 단편은 폴리펩티드의 기능성 도메인 또는 보존성 도메인을 포함할 수 있다. 따라서, 본 발명의 상황에서, 본 발명에 따른 막 단백질 'Z'의 기능성 단편 (일반적으로, SEQ ID NO로 표시됨)은 코어 당류로서 LN3을 갖는 올리고당을 수송하는 막 단백질 'Z'의 기능적 특징을 보유하는 단편을 의미한다. 도메인은 예를 들어 Pfam (El-Gebali et al., Nucleic Acids Res. 47 (2019) D427-D432), IPR (InterPro 도메인) (Mitchell et al., Nucleic Acids Res. 47 (2019) D351-D360), 단백질 핑거프린트 도메인 (PRINTS) (Attwood et al., Nucleic Acids Res. 31 (2003) 400-402), SUBFAM 도메인 (Gough et al., J. Mol. Biol. 313 (2001) 903-919), TIGRFAM 도메인 (Selengut et al., Nucleic Acids Res. 35 (2007) D260-D264), 보존된 도메인 데이터베이스 (CDD) 지정 (https://www.ncbi.nlm.nih.gov/cdd) (Lu et al., Nucleic Acids Res. 48 (2020) D265-D268), 또는 PTHR 도메인 (http://www.pantherdb.org) (Mi et al., Nucleic Acids. Res. 41 (2013) D377-D386; Thomas et al., Genome Research 13 (2003) 2129-2141)에 의해 특징규명될 수 있다. Pfam 32.0 (2018년 9월 배포), CDD v3.17 (2019년 4월 3일 배포), eggnogdb 4.5.1 (2016년 9월 배포), InterPro 75.0 (2019년 7월 4일 배포) 및 TCDB (2019년 6월 17일 배포)를 포함하는 본 명세서에서 사용되는 데이터베이스 경우에, 각 데이터베이스는 각 배포시에 고정되고 변화되지 않는다는 것을 당업자는 이해해야 한다. 특정 데이터베이스의 내용이 변화되면, 이러한 특정 데이터베이스는 새로운 배포일과 새로운 배포 형태를 받는다. 그들 해당 배포일 및 이들 특정 배포일에 주석달린 특정 내용을 갖는 각 데이터베이스에 대한 모든 배포 형태가 입수가능하고 당업자에게 공지되어 있다.
이와 같이, 폴리펩티드 SEQ ID NO의 단편은 바람직하게 상기 폴리펩티드 SEQ ID NO로부터의 연속 아미노산 잔기의 양을 포함하거나 또는 그로 이루어지고, 당업자가 통상적으로 평가할 수 있는 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 바람직하게 유사하거나 또는 더 큰 정도까지, 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드를 의미하고, 연속 아미노산 잔기의 상기 양은 바람직하게 상기 폴리펩티드 SEQ ID NO의 적어도 50.0%, 60.0%, 70.0%, 80.0%, 81.0 %, 82.0%, 83.0%, 84.0%, 85.0%, 86.0%, 87.0%, 88.0%, 89.0%, 90.0%, 91.0%, 92.0%, 93.0%, 94.0%, 95.0%, 95.5%, 96.0%, 96.5%, 97.0%, 97.5%, 98.0%, 98.5%, 99.0%, 99.5%, 100%, 바람직하게 적어도 80.0%, 보다 바람직하게 적어도 87.0%, 보다 더 바람직하게 적어도 90.0%, 보다 더 바람직하게 적어도 95.0%, 가장 바람직하게 적어도 97.0%이다. 본 발명의 상황에서, 본 발명에 따른 단백질 'Z'의 기능성 단편 (일반적으로 SEQ ID NO로 표시됨)은 코어 당류로서 LN3을 갖는 올리고당을 수송하는 막 단백질 'Z'의 기능적 특징을 보유하는 단편을 의미한다. 이와 같이, 폴리펩티드 SEQ ID NO의 단편은 바람직하게 상기 폴리펩티드 SEQ ID NO를 포함하거나 또는 그로 이루어지고, 당업자가 통상적으로 평가할 수 있는 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 바람직하게 유사하거나 또는 더 큰 정도까지, 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드 서열을 의미하고, 연속 아미노산 잔기의 양은 누락되며, 상기 양은 상기 폴리펩티드 SEQ ID NO의 전체 길이의 50.0%, 40.0%, 30.0% 이하, 바람직하게 상기 폴리펩티드 SEQ ID NO의 전체 길이의 20.0%, 15.0%, 10.0%, 9.0%, 8.0%, 7.0%, 6.0%, 5.0%, 4.5%, 4.0%, 3.5%, 3.0%, 2.5%, 2.0%, 1.5%, 1.0%, 0.5% 이하, 보다 바람직하게 15.0% 이하, 보다 더 바람직하게 10.0% 이하, 보다 더 바람직하게 5.0% 이하, 가장 바람직하게 2.5% 이하이다. 둘 이상의 핵산 또는 폴리펩티드 서열의 상황에서 용어 "동일한" 또는 "퍼센트 동일성" 또는 "% 동일성"은 서열 비교 알고리즘을 사용하거나 또는 육안 검사를 통해서 측정하여, 최대 상응도에 대해 비교 및 정렬했을 때, 동일한 뉴클레오티드 또는 아미노산 잔기의 명시된 %를 갖는 둘 이상의 서열 또는 하위서열을 의미한다. 서열 비교를 위해서, 한 서열은 시험 서열이 비교되는 기준 서열로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열은 컴퓨터에 입력되고, 하위서열 좌표가 필요한 경우 지정되고, 서열 알고리즘 프로그램 매개변수가 지정된다. 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로, 기준 서열에 대해서 시험 서열(들)에 대한 서열 동일성%를 계산한다. 퍼센트 동일성은 기준 서열의 전체 길이 상에서 전체적으로 계산되어서, 전체 퍼센트 동일성 점수를 생성시킬 수 있다. 대안적으로, 퍼센트 동일성은 기준 서열의 부분 서열에 대해서 계산되어서, 국소 퍼센트 동일성 점수를 생성시킬 수 있다. 국소 서열 정렬에서 기준 서열의 전체 길이 사용은 시험 서열과 기준 서열 간 전체 퍼센터 동일성 점수를 생성시킨다.
퍼센트 동일성은 예를 들어, BLAST 및 PSI-BLAST (Altschul et al., 1990, J Mol Biol 215:3, 403-410; Altschul et al., 1997, Nucleic Acid Res 25: 17, 3389-402), Clustal Omega 방법 (Sievers et al., 2011, Mol. Syst. Biol. 7:539), MatGAT 방법 (Campanella et al., 2003, BMC Bioinformatics, 4:29) 또는 EMBOSS Needle (https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html) 같은 상이한 알고리즘을 사용해 결정될 수 있다.
BLAST (Basic Local Alignment Search Tool) 정렬 방법은 디폴트 매개변수를 사용해 서열을 비교하기 위해 NCBI (National Center for Biotechnology Information)가 제공하는 알고리즘이다. 이 프로그램은 뉴클레오티드 또는 단백질 서열을 서열 데이터베이스와 비교하여 통계적 유의성을 계산한다. PSI-BLAST (Position-Specific Iterative Basic Local Alignment Search Tool)는 단백질-단백질 BLAST (BLASTp)를 사용해 상기 소정 점수 한계치 이상에서 검출되는 서열의 다수 서열 정렬로부터 위치-특이적 채점 매트릭스 (PSSM) 또는 프로파일을 유도시킨다. BLAST 방법은 쌍별 또는 다수 서열 정렬에 사용될 수 있다. 쌍별 서열 정렬은 2개 생물학적 서열 (단백질 또는 핵산) 간에 기능적, 구조적 및/또는 진화적 관계를 의미할 수 있는 유사성의 영역을 확인하는데 사용된다. BLAST에 대한 웹 인터페이스는 https://blast.ncbi.nlm.nih.gov/Blast.cgi에서 입수가능하다.
Clustal Omega (Clustal Ω)는 3개 이상의 서열 간에 정렬을 생성시키기 위해서 씨딩된 가이드 트리 및 HMM 프로파일-프로파일 기술을 사용하는 다수 서열 정렬 프로그램이다. 분기 서열의 생물학적으로 의미있는 다수 서열 정렬을 생성시킨다. Clustal Ω에 대한 웹 인터페이스는 https://www.ebi.ac.uk/Tools/msa/clustalo/에서 입수가능하다. Clustal Ω를 사용하는 다수 서열 정렬에 대한 디폴트 매개변수 및 단백질 서열의 % 동일성의 계산은 다음과 같다: 입력 서열의 탈-정렬 활성화: FALSE; mbed-유사 클러스터링 가이드-트리 활성화: TRUE; mbed-유사 클러스터링 반복 활성화: TRUE; (조합된 가이드-트리/HMM) 반복 횟수: 디폴트(0); 최대 가이드 트리 반복: 디폴트 [-1]; 최대 HMM 반복: 디폴트 [-1]; 순서: 정렬됨.
MatGAT (Matrix Global Alignment Tool)는 데이터의 사전 정렬 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 매트릭스를 생성하는 컴퓨터 어플리케이션이다. 프로그램은 Myers 및 Miller 글로벌 정렬 알고리즘을 사용하여 일련의 쌍별 정렬을 수행하고, 유사성 및 동일성을 계산한 다음에, 그 결과를 거리 매트릭스에 배치한다. 사용자는 그들 단백질 서열 검사에 사용하기 위한 정렬 매트릭스 (예를 들어, BLOSUM50, BLOSUM62, 및 PAM250) 유형을 지정할 수 있다.
EMBOSS Needle (https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)은 그들의 전체 길이를 고려했을 때 2개 서열의 최적 정렬 (갭 포함)를 찾기 위해 Needleman-Wunsch 글로벌 정렬 알고리즘을 사용한다. 최적 정렬은 모든 가능한 정렬을 탐색하고 최상을 선택하여서 동적 프로그래밍 방법으로 보장된다. Needleman-Wunsch 알고리즘은 최상의 점수를 계산하고 mn 단계 (여기서 'n' 및 'm'은 2개 서열의 길이임)의 순서로 정렬할 수 있는 알고리즘 클래스의 구성원이다. 갭 개방 패널티 (디폴트 10.0)는 갭이 생성될 때 제거되는 점수이다. 디폴트 값은 단백질 서열에 대해 EBLOSUM62 매트릭스를 사용하는 것으로 가정한다. 갭 연장 (디폴트 0.5) 패널티는 갭에서 각각의 염기 또는 잔기에 대한 표준 갭 패널티에 첨가된다. 이것은 얼마나 긴 갭이 패널티를 받는가이다.
본 명세서에서 사용되는, 기준 폴리펩티드 서열의 전체 길이에 대해 적어도 80% 전체 서열 동일성을 갖는 아미노산 서열 (또는 적어도 80% 전체 서열 동일성을 갖는 단백질 서열)을 갖는 폴리펩티드는 서열이 기준 폴리펩티드 서열의 아미노산 서열의 전체 길이에 대해서 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100% 전체 서열 동일성을 갖는다는 것으로 이해해야 한다. 출원 전반에서, 달리 명확하게 명시하지 않으면, 기준 폴리펩티드의 전체 길이 아미노산 서열에 대해 적어도 80% 서열 전체 서열 동일성을 갖는 아미노산 서열을 포함/이루어지는/갖는/그로 표시되는 폴리펩티드는 일반적으로, SEQ ID NO로 표시되고, 바람직하게 전체 길이 기준 서열에 대해서 적어도 85%, 90%, 91%, 92.00%, 93.00%, 94.00%, 95.00%, 96.00%, 97.00%, 98.00% 또는 99.00% 전체 서열 동일성을 갖고, 보다 바람직하게 적어도 85% 전체 서열 동일성을 갖고, 보다 더 바람직하게 적어도 90% 전체 서열 동일성을 갖고, 보다 더 바람직하게 적어도 95.00% 전체 서열 동일성을 갖고, 보다 더 바람직하게 적어도 97.00%,가장 바람직하게 적어도 99.00% 전체 서열 동일성을 갖는다. 본 발명의 상황에서, 기준 막 단백질 'Z'의 전체 서열 길이 (일반적으로 SEQ ID NO로 표시됨)에 대해 예를 들어, 적어도 80% 전체 서열 동일성을 갖는 아미노산 서열 (또는 예를 들어, 적어도 80% 전체 서열 동일성을 갖는 단백질 서열)을 갖는 폴리펩티드는 본 명세서에 기술된 바와 같은 코어 당류로서 LN3을 갖는 올리고당을 수송할 수 있는 폴리펩티드 (즉, 막 단백질)를 의미하고, 다시 말해서, 폴리펩티드는 코어 당류로서 LN3을 갖는 올리고당을 수송하는 기준 막 단백질 'Z'의 기능적 특징을 보유한다.
본 발명의 목적을 위해서, 폴리펩티드의 전체 서열 동일성은 바람직하게 디폴트 매개변수 (치환 매트릭스 EBLOSUM62, 갭 개방 패널티 10, 및 갭 연장 패널티 0.5) 및 바람직하게 성숙한 단백질의 서열 (즉, 분비 신호 또는 수송 펩티드를 고려하지 않음)을 사용한 프로그램 EMBOSS Needle 5.0 (https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)에 의해 결정된다.
본 명세서에서 사용되는 용어 "글리코실트랜스퍼라제"는 활성화된 도너 분자로부터 특이적 억셉터 분자로 당 모이어티의 전달을 촉매할 수 있어서, 글리코시드 결합을 형성하는 효소를 의미한다. 이와 같이 합성된 올리고당은 선형 또는 분지형일 수 있고, 다수의 단당류 빌딩 블록을 함유할 수 있다. 뉴클레오티드 디포스포-당, 뉴클레오티드 모노포스포-당 및 당 포스페이트를 사용하는 글리코실트랜스퍼라제 및 관련 단백질의 별개 서열-기반 패밀리로의 분류가 기술되어 있고 (Campbell et al., Biochem. J. 326, 929-939 (1997)) CAZy (CArbohydrate-Active EnZymes) 웹사이트 (www.cazy.org)에서 입수가능하다.
본 명세서에서 사용되는 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제 및 푸코사미닐트랜스퍼라제를 포함하지만, 이에 제한되지 않은 목록으로부터 선택될 수 있다.
푸코실트랜스퍼라제는 GDP-푸코스 (GDP-Fuc) 도너로부터 글리칸 억셉터로 푸코스 잔기 (Fuc)를 전달하는 글리코실트랜스퍼라제이다. 푸코실트랜스퍼라제는 알파-글리코시드 결합을 통해서 GDP-Fuc로부터 글리칸 억셉터로 Fuc 잔기의 전달을 촉매하는 알파-1,2-푸코실트랜스퍼라제, 알파-1,3-푸코실트랜스퍼라제, 알파-1,4-푸코실트랜스퍼라제 및 알파-1,6-푸코실트랜스퍼라제를 포함한다. 푸코실트랜스퍼라제는 GT10, GT11, GT23, GT65 및 GT68 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 시알릴트랜스퍼라제는 시알릴 기 (예컨대 Neu5Ac 또는 Neu5Gc)를 도너 (예컨대 CMP-Neu5Ac 또는 CMP-Neu5Gc)로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. 시알릴트랜스퍼라제는 알파-글리코시드 결합을 통해서 글리칸 억셉터로 시알릴 기의 전달을 촉매하는 알파-2,3-시알릴트랜스퍼라제 및 알파-2,6-시알릴트랜스퍼라제를 포함한다. 시알릴트랜스퍼라제는 GT29, GT42, GT80 및 GT97 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 갈락토실트랜스퍼라제는 갈락토실 기 (Gal)를 UDP-갈락토스 (UDP-Gal) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 갈락토실트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해서 글리칸 억셉터로 UDP-Gal로부터 Gal 잔기를 전달하는 베타-1,3-갈락토실트랜스퍼라제, 베타-1,4-갈락토실트랜스퍼라제, 알파-1,3-갈락토실트랜스퍼라제 및 알파-1,4-갈락토실트랜스퍼라제를 포함한다. 갈락토실트랜스퍼라제는 GT2, GT6, GT8, GT25 및 GT92 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 글루코실트랜스퍼라제는 글루코실 기 (Glc)를 UDP-글루코스 (UDP-Glc) 도너로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. 글루코실트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해서 글리칸 억셉터로 UDP-Glu로부터 Glc 잔기를 전달하는 알파-글루코실트랜스퍼라제, 베타-1,2-글루코실트랜스퍼라제, 베타-1,3-글루코실트랜스퍼라제 및 베타-1,4-글루코실트랜스퍼라제를 포함한다. 글루코실트랜스퍼라제는 GT1, GT4 및 GT25 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 만노실트랜스퍼라제는 만노스 기 (Man)를 GDP-만노스 (GDP-Man) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 만노실트랜스퍼라제는 알파-글리코시드 결합을 통해서 글리칸 억셉터로 GDP-Man으로부터 Man 잔기를 전달하는 알파-1,2-만노실트랜스퍼라제, 알파-1,3-만노실트랜스퍼라제 및 알파-1,6-만노실트랜스퍼라제를 포함한다. 만노실트랜스퍼라제는 GT22, GT39, GT62 및 GT69 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸글루코사미닐트랜스퍼라제는 N-아세틸글루코사민 기 (GlcNAc)를 UDP-N-아세틸글루코사민 (UDP-GlcNAc) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. N-아세틸글루코사미닐트랜스퍼라제는 GT2 및 GT4 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸갈락토사미닐트랜스퍼라제는 N-아세틸갈락토사민 기 (GalNAc)를 UDP-N-아세틸갈락토사민 (UDP-GalNAc) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. N-아세틸갈락토사미닐트랜스퍼라제는 GT7, GT12 및 GT27 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸만노사미닐트랜스퍼라제는 N-아세틸만노사민 기 (ManNAc)를 UDP-N-아세틸만노사민 (UDP-ManNAc) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 자일로실트랜스퍼라제는 자일로스 잔기 (Xyl)를 UDP-자일로스 (UDP-Xyl) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 자일로실트랜스퍼라제는 GT14, GT61 및 GT77 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 글루쿠로닐트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해서 글리칸 억셉터로 UDP-글루쿠로네이트 도너로부터 글루쿠로네이트를 전달하는 글리코실트랜스퍼라제이다. 글루쿠로닐트랜스퍼라제는 GT4, GT43 및 GT93 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 갈락투로닐트랜스퍼라제는 갈락투로네이트를 UDP-갈락투로네이트 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. N-글리코릴뉴라미닐트랜스퍼라제는 N-글리코릴뉴라민산 기 (Neu5Gc)를 CMP-Neu5Gc 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 람노실트랜스퍼라제는 람노스 잔기를 GDP-람노스 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 람노실트랜스퍼라제는 GT1, GT2 및 GT102 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸람노실트랜스퍼라제는 N-아세틸람노사민 잔기를 UDP-N-아세틸-L-람노사민 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제는 플라젤린을 변형시키는데 사용되는 시알산-유사 당인, 슈다민산의 생합성에서 UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스를 사용하는 글리코실트랜스퍼라제이다. 푸코사미닐트랜스퍼라제는 N-아세틸푸코사민 잔기를 dTDP-N-아세틸푸코사민 또는 UDP-N-아세틸푸코사민 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다.
용어 "갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제"는 베타-1,3 연결로 락토스의 말단 갈락토스 잔기로 UDP-GlcNAc로부터 N-아세틸글루코사민 (GlcNAc) 잔기을 전달할 수 있는 글리코실트랜스퍼라제를 의미한다.
용어 "뉴클레오티드-당" 또는 "활성화된 당" 또는 "뉴클레오시드"는 본 명세서에서 상호교환적으로 사용되고, 단당류의 활성화된 형태를 의미한다. 활성화된 단당류의 예는 UDP-N-아세틸글루코사민 (UDP-GlcNAc), UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), GDP-L-퀴노보스, CMP-시알산 (CMP-Neu5Ac 또는 CMP-N-아세틸뉴라민산), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하지만, 이에 제한되지 않는다. 뉴클레오티드-당은 글리코실화 반응에서 글리코실 도너로서 작용한다. 글리코실화 반응은 글리코실트랜스퍼라제에 의해 촉매되는 반응이다.
본 명세서에서 사용되는 용어 "단당류"는 가수분해에 의해서 더 단순한 당으로 분해될 수 없고, 알도스 또는 케토스로 분류되며, 분자 당 하나 이상의 히드록실 기를 함유하는 당을 의미한다. 단당류는 오직 하나의 단순 당을 함유하는 당류이다. 단당류의 예는 헥소스, D-글루코피라노스, D-갈락토푸라노스, D-갈락토피라노스, L-갈락토피라노스, D-만노피라노스, D-알로피라노스, L-알트로피라노스, D-굴로피라노스, L-이도피라노스, D-탈로피라노스, D-리보푸라노스, D-리보피라노스, D-아라비노푸라노스, D-아라비노피라노스, L-아라비노푸라노스, L-아라비노피라노스, D-자일로피라노스, D-릭소피라노스, D-에리트로푸라노스, D-트레오푸라노스, 헵토스, L-글리세로-D-만노-헵토피라노스 (LDmanHep), D-글리세로-D-만노-헵토피라노스 (DDmanHep), 6-데옥시-L-알트로피라노스, 6-데옥시-D-굴로피라노스, 6-데옥시-D-탈로피라노스, 6-데옥시-D-갈락토피라노스, 6-데옥시-L-갈락토피라노스, 6-데옥시-D-만노피라노스, 6-데옥시-L-만노피라노스, 6-데옥시-D-글루코피라노스, 2-데옥시-D-아라비노-헥소스, 2-데옥시-D-에리트로-펜토스, 2,6-디데옥시-D-아라비노-헥소피라노스, 3,6-디데옥시-D-아라비노-헥소피라노스, 3,6-디데옥시-L-아라비노-헥소피라노스, 3,6-디데옥시-D-자일로-헥소피라노스, 3,6-디데옥시-D-리보-헥소피라노스, 2,6-디데옥시-D-리보-헥소피라노스, 3,6-디데옥시-L-자일로-헥소피라노스, 2-아미노-2-데옥시-D-글루코피라노스, 2-아미노-2-데옥시-D-갈락토피라노스, 2-아미노-2-데옥시-D-만노피라노스, 2-아미노-2-데옥시-D-알로피라노스, 2-아미노-2-데옥시-L-알트로피라노스, 2-아미노-2-데옥시-D-굴로피라노스, 2-아미노-2-데옥시-L-이도피라노스, 2-아미노-2-데옥시-D-탈로피라노스, 2-아세타미도-2-데옥시-D-글루코피라노스, 2-아세타미도-2-데옥시-D-갈락토피라노스, 2-아세타미도-2-데옥시-D-만노피라노스, 2-아세타미도-2-데옥시-D-알로피라노스, 2-아세타미도-2-데옥시-L-알트로피라노스, 2-아세타미도-2-데옥시-D-굴로피라노스, 2-아세타미도-2-데옥시-L-이도피라노스, 2-아세타미도-2-데옥시-D-탈로피라노스, 2-아세타미도-2,6-디데옥시-D-갈락토피라노스, 2-아세타미도-2,6-디데옥시-L-갈락토피라노스, 2-아세타미도-2,6-디데옥시-L-만노피라노스, 2-아세타미도-2,6-디데옥시-D-글루코피라노스, 2-아세타미도-2,6-디데옥시-L-알트로피라노스, 2-아세타미도-2,6-디데옥시-D-탈로피라노스, D-글루코피라누론산, D-갈락토피라누론산, D-만노피라누론산, D-알로피라누론산, L-알트로피라누론산, D-굴로피라누론산, L-굴로피라누론산, L-이도피라누론산, D-탈로피라누론산, 시알산, 5-아미노-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 5-아세타미도-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 5-글리콜릴라미도-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 에리트리톨, 아라비니톨, 자일리톨, 리비톨, 글루시톨, 갈락티톨, 만니톨, D-리보-헥스-2-울로피라노스, D-아라비노-헥스-2-울로푸라노스 (D-프룩토푸라노스), D-아라비노-헥스-2-울로피라노스, L-자일로-헥스-2-울로피라노스, D-릭소-헥스-2-울로피라노스, D-트레오-펜트-2-울로피라노스, D-알트로-헵트-2-울로피라노스, 3-C-(히드록시메틸)-D-에리토푸라노스, 2,4,6-트리데옥시-2,4-디아미노-D-글루코피라노스, 6-데옥시-3-O-메틸-D-글루코스, 3-O-메틸-D-람노스, 2,6-디데옥시-3-메틸-D-리보-헥소스, 2-아미노-3-O-[(R)-1-카르복시에틸]-2-데옥시-D-글루코피라노스, 2-아세타미도-3-O-[(R)-카르복시에틸]-2-데옥시-D-글루코피라노스, 2-글리콜릴라미도-3-O-[(R)-1-카르복시에틸]-2-데옥시-D-글루코피라노스, 3-데옥시-D-릭소-헵트-2-울로피라노사르산, 3-데옥시-D-만노-옥트-2-울로피라노손산, 3-데옥시-D-글리세로-D-갈락토-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-L-글리세로-L-만노-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-L-글리세로-L-알트로-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-D-글리세로-D-갈락토-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-D-글리세로-D-탈로-논-2-울로피라노손산, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, 글루코스, 갈락토스, N-아세틸글루코사민, 글루코사민, 만노스, 자일로스, N-아세틸만노사민, N-아세틸뉴라민산, N-글리코릴뉴라민산, N-아세틸갈락토사민, 갈락토사민, 푸코스, 람노스, 글루쿠론산, 글루콘산, 프룩토스 및 폴리올을 포함한다.
용어 "올리고당"은 본 명세서에서 사용되고, 일반적으로 당분야에서 이해되는 바와 같으며, 작은 개수, 전형적으로 3개 내지 20개의 단순당, 즉, 단당류를 함유하는 당류 중합체를 의미한다. 본 발명에서 사용되는 올리고당은 선형 구조일 수 있거나 또는 분지를 포함할 수 있다. 2개 당 단위 사이의 연결 (예를 들어, 글리코시드 연결, 갈락토시드 연결, 글루코시드 연결 등)은 예를 들어, 1,4, 1->4, 또는 (1-4)로서 표현될 수 있고, 본 명세서에서 상호교환적으로 사용된다. 각각의 단당류는 환형 형태 (예를 들어, 피라노스 또는 푸라노스 형태)일 수 있다. 올리고당은 알파- 및 베타-글리코시드 결합 둘 모두를 함유할 수 있거나 또는 오직 베타-글리코시드 결합만을 함유할 수 있다. 용어 "글리칸" 및 "다당류"는 상호교환적으로 사용되고, 글리코시드로 연결된 다수의 단당류로 이루어지는 화합물을 의미한다. 용어 글리칸은 10개 초과의 단당류 잔기를 함유하는 화합물에 대해 일반적으로 사용된다.
본 명세서에서 사용되는 용어 "코어 삼당류로서 LN3을 갖는 올리고당"은 추가로 글리코실화되는 락토-N-트리오스를 함유하거나 또는 락토-N-트리오스인 올리고당을 의미한다. 바람직하게, 본 명세서에 기술되는 바와 같은 올리고당은 상기 본 명세서에서 사용되는 바와 같은 목록으로부터 선택되는 단당류를 함유한다. 본 발명의 올리고당의 예는 코어 삼당류로서 LN3을 함유하는, 루이스-유형 항원 올리고당 및 포유동물 모유 올리고당 (MMO), 바람직하게 인간 모유 올리고당 (HMO)을 포함하지만, 이에 제한되지 않는다. 예에는 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-푸코펜타오스 VI, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라-락토-N-헥사오스 (pLNnH), 파라-락토-N-네오헥사오스 (pLNH), 디푸코실-락토-N-헥사오스, 디푸코실-락토-N-네오헥사오스, 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 시알릴-락토-N-테트라오스 a, 시알릴-락토-N-테트라오스 b, 시알릴-락토-N-테트라오스 c, 시알릴-락토-N-테트라오스 d가 포함된다. 바람직하게, 본 발명의 올리고당 (즉, 본 명세서에 정의된 바와 같은 코어 삼당류로서 LN3을 갖는 올리고당)은 포유동물 모유 올리고당 (MMO), 보다 바람직하게 인간 모유 올리고당, 보다 더 바람직하게 코어 사당류로서 LNT 또는 LNnT를 갖는 HMO 또는 MMO, 보다 더 바람직하게 코어 사당류로서 LNT 또는 LNnT, 가장 바람직하게 LNT 또는 LNnT를 갖는 MMO이다. 본 발명의 상기 올리고당은 중성 올리고당 (즉, 상기 올리고당은 카르복실 기로부터 기원하는 음전하를 갖지 않음)인 것이 본 발명의 상황에서 또한 바람직하다.
본 명세서에서 사용되는 용어 "LNT II", "LNT-II", "LN3", "락토-N-트리오스 II", "락토-N-트리오스 II", "락토-N-트리오스", "락토-N-트리오스" 또는 "GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LNT", "락토-N-테트라오스", "락토-N-테트라오스" 또는 "Galβ1-3GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LNnT", "락토-N-네오테트라오스", "락토-N-네오테트라오스", "네오-LNT" 또는 "Galβ1-4GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LSTa", "LS-사당류 a", "시알릴-락토-N-테트라오스 a", "시알릴락토-N-테트라오스 a" 또는 "Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc"는 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LSTb", "LS-사당류 b", "시알릴-락토-N-테트라오스 b", "시알릴락토-N-테트라오스 b" 또는 "Gal-b1,3-(Neu5Ac-a2,6)-GlcNAc-b1,3-Gal-b1,4-Glc"는 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LSTc", "LS-사당류 c", "시알릴-락토-N-테트라오스 c", "시알릴락토-N-테트라오스 c", "시알릴락토-N-네오테트라오스 c" 또는 "Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc"는 상호교환적으로 사용된다.
용어 "LSTd", "LS-사당류 d", "시알릴-락토-N-테트라오스 d", "시알릴락토-N-테트라오스 d", "시알릴락토-N-네오테트라오스 d" 또는 "Neu5Ac-a2,3-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc".
포유동물 모유 올리고당은 인간, 및 소 (보스 타우루스 (Bos Taurus)), 양 (오비스 아리에스 (Ovis aries)), 염소 (카프라 애가그루스 히르쿠스 (Capra aegagrus hircus)), 쌍봉 낙타 (카멜루스 박트리아누스 (Camelus bactrianus)), 말 (에쿠우스 페루스 카발루스 (Equus ferus caballus)), 돼지 (수스 스크로파 (Sus scropha)), 개 (카니스 루푸스 파밀리아리스 (Canis lupus familiaris)), 에조불곰 (우르수스 아르크토스 에소엔시스 (Ursus arctos yesoensis)), 북극곰 (우르수스 마리티무스 (Ursus maritimus)), 일본 흑곰 (우르수스 티베타누스 자포니쿠스 (Ursus thibetanus japonicus)), 등줄무늬 스컹크 (메피티스 메피티스 (Mephitis mephitis)), 두건 물범 (시스토포라 크리스타타 (Cystophora cristata)), 아시아 코끼리 (엘레파스 막시무스 (Elephas maximus)), 아프리카 코끼리 (록소돈타 아프리카나 (Loxodonta africana)), 큰개미핥기 (미르메코파가 트리닥틸라 (Myrmecophaga tridactyla)), 병코돌고래 (투르시옵스 트룬카테스 (Tursiops truncates)), 북방 밍크 고래 (발라에놉테라 아쿠토로스트라타 (Balaenoptera acutorostrata)), 타마 왈라비 (마크로푸스 유게니 (Macropus eugenii)), 붉은 캥거루 (마크로푸스 루푸스 (Macropus rufus)), 주머니 여우 (트리코수루스 불페쿨라 (Trichosurus Vulpecula)), 코알라 (파스콜라르크토스 시네레우스 (Phascolarctos cinereus)), 동부 주머니 고양이 (다시우루스 비베리누스 (Dasyurus viverrinus)), 오리너구리 (오르니토린쿠스 아나티누스 (Ornithorhynchus anatinus))를 포함하지만, 이에 제한되지 않는 포유동물로부터의 초유를 포함하여 수유 중 임의 단계에서 발견되는 모유에 존재하는 올리고당을 포함한다.
본 명세서에서 사용되는 용어 "경로"는 본 명세서에 정의된 바와 같은 올리고당의 합성에 관여되는 효소 및 그들 개별 유전자로 이루어지는 생화학적 경로이다. 올리고당의 생산을 위한 상기 경로는 본 발명의 올리고당을 생성시키기 위한 뉴클레오티드-활성화된 당의 합성 및 억셉터로 상기 뉴클레오티드-활성화된 당의 전달에 관여되는 경로를 포함하지만, 이에 제한되지 않는다. 이러한 경로의 예는푸코실화, 시알릴화, 갈락토실화, N-아세틸글루코사미닐화, N-아세틸갈락토실화, 만노실화, N-아세틸만노시닐화 경로를 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 '푸코실화 경로'는 α 1,2; α 1,3 α 1,4 또는 α 1,6 푸코실화 올리고당을 생성시키는 프코실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, 만노스-6-포스페이트 이소머라제, 포스포만노뮤타제, 만노스-1-포스페이트 구아닐릴트랜스퍼라제, GDP-만노스 4,6-데히드라타제, GDP-L-푸코스 신타제 및/또는 회수 경로 L-푸코티나제/GDP-푸코스 파이로포스포릴라제로 이루어진 생화학적 경로이다.
'시알릴화 경로'는 α 2,3; α 2,6 α 2,8 시알릴화 올리고당을 생성시키는 시알릴트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제, 글루코사민-6-포스페이트 데아미나제, 포스포글루코사민 뮤타제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, N-아세틸글루코사민 에피머라제, UDP-N-아세틸글루코사민 2-에피머라제, N-아세틸글루코사민-6P 2-에피머라제, 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, N-아세틸글루코사민-6-포스페이트 포스파타제, N-아세틸만노사민-6-포스페이트 포스파타제, N-아세틸만노사민 키나제, 포스포아세틸글루코사민 뮤타제, N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제, 글루코사민-1-포스페이트 아세틸트랜스퍼라제, 시알산 신타제, N-아세틸뉴라미네이트 리아제, N-아실뉴라미네이트-9-포스페이트 신타제, N-아실뉴라미네이트-9-포스페이트 포스파타제, 및/또는 CMP-시알산 신타제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 '갈락토실화 경로'는 단당류, 이당류, 또는 올리고당의 2, 3, 4, 6개 히드록실 기에 알파 또는 베타 결합된 갈락토스를 생성시키는 갈락토실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, 갈락토스-1-에피머라제, 갈락토키나제, 글루코키나제, 갈락토스-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 4-에피머라제, 글루코스-1-포스페이트 우리딜릴트랜스퍼라제, 및/또는 글루코포스포뮤타제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 'N-아세틸글루코사미닐화 경로'는 단당류, 이당류 또는 올리고당의 3, 4, 6개 히드록실 기에 알파 또는 베타 결합된 N-아세틸글루코사민을 생성시키는 글리코실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제, 글루코사민-6-포스페이트 데아미나제, 포스포글루코사민 뮤타제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제, 글루코사민-1-포스페이트 아세틸트랜스퍼라제, 및/또는 글루코사민-1-포스페이트 아세틸트랜스퍼라제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 'N-아세틸갈락토실화 경로'는 단당류, 이당류 또는 올리고당에 알파 또는 베타 결합된 N-아세틸갈락토사민을 생성시키는 글리코실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제, 포스포글루코사민 뮤타제, N-아세틸글루코사민 1-포스페이트 우리딜릴트랜스퍼라제, UDP-N-아세틸글루코사민 4-에피머라제, UDP-갈락토스 4-에피머라제, N-아세틸갈락토사민 키나제 및/또는 UDP-GalNAc 파이로포스포릴라제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 '만노실화 경로'는 단당류, 이당류 또는 올리고당에 알파 또는 베타 결합된 만노스를 생성시키는 글리코실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, 만노스-6-포스페이트 이소머라제, 포스포만노뮤타제 및/또는 만노스-1-포스페이트 구아닐트랜스퍼라제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 'N-아세틸만노시닐화 경로'는 단당류, 이당류 또는 올리고당에 알파 또는 베타 결합된 N-아세틸만노사민을 생성시키는 글리코실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제, 글루코사민-6-포스페이트 데아미나제, 포스포글루코사민 뮤타제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제, 글루코사민-1-포스페이트 아세틸트랜스퍼라제, 글루코사민-1-포스페이트 아세틸트랜스퍼라제, UDP-GlcNAc 2-에피머라제 및/또는 ManNAc 키나제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 용어 "막 단백질"은 세포 막의 일부이거나 또는 세포막과 상호작용하여 세포를 가로지르는 분자 및 정보의 흐름을 제어하는 단백질이다. 따라서, 막 단백질은 세포 안으로 유입 또는 세포 밖으로 유출시키는 수송에 관여된다.
이러한 단백질은 www.tcdb.org 를 통해서 입수가능한 Saier Lab Bioinformatics Group이 운영하고 선별하여 막 수송체 단백질의 기능적 및 계통학적 분류를 제공하는 수송체 분류 데이터베이스에 의해 정의되는 바와 같이, 운송체, P-P-결합-가수분해-구동 수송체 또는 β-배럴 포린일 수 있다. 이 수송체 분류 데이터베이서는 수송체 분류 (TC) 체계로서 알려진 막 수송체 단백질에 대한 종합적인 IUBMB 승인 분류 체계를 상술한다. 본 명세서에 기술되는 TCDB 분류 검색은 2019년 6월 17일자에 배포된 공개된 TCDB. org를 기반으로 정의된다.
운송체는 캐리어-매개 과정을 이용하는 단일수송체, 동반수송체, 및 역수송체의 집합 명칭이다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 그들은 전기화학 전위-구동 수송체에 속하고, 또한 2차 캐리어-유형 촉진제라고도 한다. 막 단백질은 그들이 촉진 확산에 의해서 또는 용질이 하전된 경우 막 전위-의존적 과정에 의해 수송될 때 단일수송; 2개 이상의 종이 화학삼투 에너지이외의 에너지의 직접 형태와 결합되지 않고, 밀접하게 결합된 과정으로 반대 방향으로 수송될 때 역수송; 및/또는 2개 이상의 종이, 2차 캐리어의, 화학 삼투 에너지 이외의 에너지의 직접 형태와 결합되지 않고, 밀접하게 결합된 과정으로 동일한 방향으로 함께 수송될 때 동반수송을 촉매하는 캐리어-매개된 과정을 이용할 때 이러한 부류에 포함된다 (Forrest et al., Biochim. Biophys. Acta 1807 (2011) 167-188). 이들 시스템은 일반적으로 입체특이적이다. 용질:용질 역수송은 2차 캐리어의 특징적인 특성이다. 운송체 및 효소의 동적 회합은 전형적으로 세포외 구획으로부터 수득되는 기질을 직접적으로 그들 세포 물질대사에 전달하는 기능성 막 수송체 메타볼론을 생성한다 (Moraes and Reithmeier, Biochim. Biophys. Acta 1818 (2012), 2687-2706). 이러한 운송체 시스템을 통해서 수송되는 용질은 양이온, 유기 음이온, 무기 음이온, 뉴클레오시드, 아미노산, 폴리올, 인산화 당분해 중간체, 삼투질, 시데로포어를 포함하지만, 이에 제한되지 않는다.
막 단백질은 용질 또는 용질들의 능동 흡수 및/또는 압출을 구동시키기 위해서, 무기 파이로포스페이트, ATP, 또는 다른 뉴클레오시드 트리포스페이트의 디포스페이트 결합을 가수분해한다면 P-P-결합 가수분해-구동 수송체의 부류에 포함된다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 막 단백질은 일시적으로 일시적으로 인산화될 수 있거나 또는 그렇지 않을 수 있지만, 기질은 인산화되지 않는다. P-P-결합 가수분해-구동 수송체의 부류를 통해 수송되는 기질은 양이온, 중금속, 베타-글루칸, UDP-글루코스, 지질다당류, 테이코산을 포함하지만, 이에 제한되지 않는다.
β-배럴 포린 막 단백질은 일반적으로 막을 가로질러스 용질의 에너지 독립적 통과를 허용하는 경막 포어를 형성한다. 이들 단백질의 경막 부분은 β-배럴을 형성하는 β-가닥으로만 이루어진다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 이들 포린-유형 단백질은 그람-음성 박테리아, 미토콘드리아, 색소체, 및 가능하게 항산성 그람-양성 박테리아의 외막에서 발견된다. 이들 β-배럴 포린 막 단백질을 통해 수송되는 용질은 뉴클레오시드, 라피노스, 글루코스, 베타-글루코시드, 올리고당을 포함하지만, 이에 제한되지 않는다.
용어 "가능한 유출"은 세포질 막 및/또는 세포벽에 걸쳐 용질의 수송 활성을 도입시키는 것을 의미한다. 상기 수송은 본 발명에 기술된 바와 같은 수송체 단백질의 발현을 도입시키고/시키거나 증가시켜서 가능할 수 있다. 용어 "증강된 유출"은 세포질 막 및/또는 세포벽에 걸쳐서 용질의 수송 활성을 개선시키는 것을 의미한다. 상기 수송은 본 발명에 기술된 바와 같은 수송체 단백질이 발현을 도입시키고/시키거나 증가시켜서 증강될 수 있다. 수송체 단백질의 "발현"은 상기 유전자가 내생성 유전자인 경우에 상기 수송체 단백질을 코딩하는 유전자의 "과발현" 또는 상기 수송체 단백질을 코딩하는 유전자가 야생형 균주에 존재하지 않는 이종성 유전자인 경우에 "발현"으로서 정의된다.
본 명세서에서 사용되는, 용어 "세포 생산성 지수 (CPI)"는 배양에서 생산되는 재조합 세포의 질량으로 재조합 세포에 의해 생산된 생산물의 질량을 나눈 것을 의미한다.
코어 삼당류로서 LN3을 갖는 올리고당에 대해서 본 명세서에서 사용되는 용어 "비-천연"은 올리고당이 i) 천연적으로 생산되지 않거나 또는 ii) 세포에 의해 동일한 양으로 천연적으로 생산되지 않을 때; 및 세포가 상기 올리고당을 생산할 수 있거나 또는 올리고당의 더 높은 생산을 갖도록 유전자 변형된 것을 의미한다.
용어 "정제된"은 생물학적 분자의 활성을 방해하는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다. 세포, 당류, 핵산, 및 폴리펩티드 경우에, 용어 "정제된"은 이의 천연 상태에서 발견되는 물질을 정상적으로 수반하는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다. 전형적으로, 본 발명의 정제된 당류, 올리고당, 단백질 또는 핵산은 은-염색 겔 상에서 밴드 강도를 통해서 또는 순도 결정을 위한 다른 방법으로 측정하여 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80% 또는 85% 순수하거나, 일반적으로 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 순수하다. 순도 또는 균질성은 당분야에 충분히 공지된 많은 수단, 예컨대, 단백질 또는 핵산 샘플의 폴리아크릴아미드 겔 전기영동에 이어서 염색 시 가시화를 통해서 표시될 수 있다. 일정 목적을 위해서 고해상도가 필요할 것이고 HPLC 또는 정제를 위한 유사한 수단이 이용될 것이다. 올리고당 경우에, 순도는 제한없이, 박층 크로마토그래피, 가스 크로마토그래피, NMR, HPLC, 모세관 전기영동 또는 질량 분광법같은 방법을 사용해 결정된다.
용어 "배양"은 세포가 배양되거나 또는 발효배양되는 배양 배지, 세포 그 자체, 및 전체 액체배지, 즉 세포의 내부 (세포내)를 비롯하여 외부 (세포외)에서 세포에 의해 생산된 코어 삼당류로서 LN3을 갖는 올리고당을 의미한다.
본 명세서에서 사용되는 용어 "전구체"는 본 발명에 따른 올리고당의 특별한 생산을 위해 세포가 흡수하거나 또는 합성하는 물질을 의미한다. 이러한 의미에서 전구체는 본 명세서에 정의된 바와 같은 억셉터일 수 있고, 또한 올리고당의 생화학적 합성 경로의 일부로서 세포 내에서 먼저 변형된, 다른 기질일 수도 있다. 이러한 전구체의 예는 본 명세서에 정의된 바와 같은 억셉터, 및/또는 글루코스, 갈락토스, 프룩토스, 글리세롤, 시알산, 푸코스, 만노스, 말토스, 수크로스, 락토스, 글루코스-1-포스페이트, 갈락토스-1-포스페이트, UDP-글루코스, UDP-갈락토스, 글루코스-6-포스페이트, 프룩토스-6-포스페이트, 프룩토스-1,6-비스포스페이트, 글리세롤-3-포스페이트, 디히드록시아세톤, 글리세르알데히드-3-포스페이트, 디히드록시아세톤-포스페이트, 글루코사민-6-포스페이트, 글루코사민, N-아세틸-글루코사민-6-포스페이트, N-아세틸-글루코사민, N-아세틸-만노사민, N-아세틸만노사민-6-포스페이트, UDP-N-아세틸글루코사민, N-아세틸글루코사민-1-포스페이트, N-아세틸뉴라민산 (시알산), N-아세틸-뉴라민산-9-포스페이트, CMP-시알산, 만노스-6-포스페이트, 만노스-1-포스페이트, GDP-만노스, GDP-4-데히드로-6-데옥시-α-D-만노스, 및/또는 GDP-푸코스를 포함한다.
임의로, 세포는 락토스 수송체, N-아세틸뉴라민산 수송체, 푸코스 수송체, 뉴클레오티드-활성화된 당을 위한 수송체로 이루어진 군으로부터 선택되는 단백질을 코딩하는 적어도 하나의 핵산 서열을 포함하도록 형질전환되고, 상기 수송체는 본 발명의 올리고당의 합성을 위해 배지에 첨가된 전구체에 내재화된다.
본 명세서에서 사용되는 용어 "억셉터"는 글리코실트랜스퍼라제에 의해 변형될 수 있는 단당류, 이당류 또는 올리고당을 의미한다. 이러한 억셉터의 예는 글루코스, 갈락토스, 프룩토스, 글리세롤, 시알산, 푸코스, 만노스, 말토스, 수크로스, 락토스, 락토-N-트리오스, 락토-N-테트라오스 (LNT), 락토-N-네오테트라오스 (LNnT), 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라 락토-N-네오헥사오스 (pLNnH), 파라 락토-N-헥사오스 (pLNH), 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 및 1 이상의 N-아세틸락토사민 단위 및/또는 1 이상 락토-N-비오스 단위를 함유하는 올리고당 또는 올리고당으로의 중간체, 이의 푸코실화 및 시알릴화 형태를 포함한다.
제1 양태에서, 본 발명은 본 명세서에 정의된 바와 같은 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 대사적으로 조작된 세포를 제공한다. 본 명세서에서, 대사적으로 조작된 세포는 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제에 대한 적어도 하나의 핵산 서열을 포함하고, i) 내생성 막 단백질의 과발현 및/또는 ii) 이종성 막 단백질의 발현을 더 포함하여서 코어 삼당류로서 LN3을 포함하는 올리고당의 개선된 생산 및/또는 가능 및/또는 증강된 유출을 제공하는 것이 제공된다. 상기 세포는 코어 삼당류로서 LN3을 포함하는 올리고당으로 상기 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열을 더 포함할 수 있다.
제2 양태에 따라서, 본 발명은 유전자 조작된 세포에 의해서 코어 삼당류로서 LN3을 갖는 올리고당을 제조하기 위한 방법을 제공한다. 방법은 하기 단계를 포함한다:
1) 코어 삼당류로서 LN3을 갖는 올리고당을 생산할 수 있는 세포를 제공하는 단계로서, 상기 세포는 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여서 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제에 대한 적어도 하나의 핵산 서열을 포함하고, 상기 세포는 i) 내생성 막 단백질, 보다 특히 코어 삼당류로서 LN3을 갖는 올리고당의 생산 및/또는 유출에 관여되는 내생성 막 단백질, 보다 더 특히 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 가능하게 하고/하거나 증강시키고/시키거나 유출을 가능하게 하고/하거나 증강시키는 내생성 막 단백질의 과발현, 및/또는 ii) 이종성 막 단백질, 보다 특히 코어 삼당류로서 LN3을 갖는 올리고당의 생산 및/또는 유출에 관여되는 이종성 막 단백질, 보다 더 특히 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 가능하게 하고/하거나 증강시키고/시키거나 유출을 가능하게 하고/하거나 증강시키는 이종성 막 단백질의 발현을 더 포함하는 것인, 단계, 및
2) 코어 삼당류로서 LN3을 갖는 바람직한 올리고당의 생산을 허용하는 조건 하에 배지 중에서 세포를 배양하는 단계.
본 출원 전반에서, 달리 명시하지 않으면, "배양하다" (및 이의 활용형)" 및 "배양"은 본 발명의 상황에서 상호교환적으로 사용된다.
본 발명의 상황에서, 본 발명의 상기 내생성 막 단백질 및/또는 상기 이종성 막 단백질은 락토스 퍼미아제 (예를 들어, lacy 유전자 또는 lac12 유전자에 의해 코딩됨)가 아닌것이 바람직하고, 바람직하게 상기 락토스 퍼미아제는 SEQ ID NO 52로 표시된다. 그러나, 이러한 바람직한 구현예는 본 발명의 세포에서 락토스 퍼미아제의 존재를 배제하지 않는다. 당업자는 본 발명에 따른 상기 세포 (내생성 막 단백질 과발현 및/또는 이종성 막 단백질 발현)가 본 명세서에 추가로 기술되는 바와 같은 락토스 퍼미아제 (예를 들어, SEQ ID NO 52)의 도입 및/또는 과발현에 의해서, 세포에 락토스를 유입시키도록 추가적으로 유전자 변형될 수 있다는 것을 이해한다.
바람직하게 상기 세포는 상기 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열을 더 포함한다.
바람직하게, 코어 삼당류로서 LN3을 갖는 올리고당은 본 명세서에 설명되는 바와 같이 배양으로부터 분리된다.
본 발명의 범주에서, 허용하는 조건은 온도, pH, 압력, 삼투압 및 생산물/전구체/억셉터 농도를 포함하지만, 이에 제한되지 않는 물리적 또는 화학적 매개변수에 관한 조건으로 이해한다.
특정 구현예에서, 허용하는 조건은 30 +/- 20℃의 온도 범위, 7 +/- 3의 pH-범위를 포함할 수 있다.
본 발명의 방법 및/또는 세포의 바람직한 구현예에서, 대사적으로 조작된 세포는 유전자 발현 모듈로 변형되고, 상기 발현 모듈 중 어느 하나로부터의 발현은 항상성이거나 또는 조율가능하다. 상기 발현 모듈은 또한 전사 유닛으로도 알려져 있고, 코딩 유전자 서열 및 코딩 유전자에 작동적으로 연결된 적절한 전사 및/또는 번역 제어 신호를 포함하는 재조합 유전자의 발현을 위한 폴리뉴클레오티드를 포함한다. 상기 제어 신호는 프로모터 서열, 비번역 영역, 리보솜 결합 부위, 종결자 서열을 포함한다. 상기 발현 모듈은 하나의 단일 재조합 유전자의 발현을 위한 성분을 함유할 수 있고 또한 더 많은 재조합 유전자의 발현을 위한 성분을 함유할 수 있거나 또는 둘 이상의 재조합 유전자의 통합된 발현을 위한 오페론 구조로 구성될 수 있다. 상기 폴리뉴클레오티드는 당분야에 충분히 공지된 기술을 사용하는 재조합 DNA 기술에 의해 생산될 수 있다. 발현 모듈을 구축하기 위한 당업자에게 충분히 공지된 방법은 예를 들어, 시험관내 재조합 DNA 기술, 합성 기술, 및 생체내 유전자 재조합을 포함한다. 예를 들어, 기술들은 하기 문헌에 기술된다: Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York 또는 Current Protocols in Molecular Biology, John Wiley and Sons, N.Y. (1989 및 연간 업데이트).
본 발명의 바람직한 구현예에 따라서, 세포는 하나 이상의 발현 모듈에 의해 변형된다. 발현 모듈은 상기 세포의 게놈에 통합될 수 있거나 또는 벡터 상에서 상기 세포에게 제시될 수 있다. 상기 벡터는 상기 대사적으로 조작된 세포로 안정하게 형질전환/형질감염시키려는, 플라스미드, 코스미드, 파지, 리포솜, 또는 바이러스의 형태로 존재할 수 있다. 이러한 벡터는 특히, 염색체, 에피솜 및 바이러스-유래 벡터, 예를 들어, 플라스미드, 박테리오파지, 트랜스포존, 효모 에피솜, 삽입 성분, 효모 염색체 성분, 바이러스로부터 유래되는 벡터, 및 이의 조합으로부터 유래되는 벡터, 예컨대, 플라스미드 및 박테리오파지 유전자 성분으로부터 유래되는 것들, 예컨대, 코스미드 및 파지미드를 포함한다. 이들 벡터는 선택 마커 예컨대, 항생제 마커, 영양요구성 마커, 독소-항독소 마커, RNA 센서/안티센스 마커를 함유할 수 있지만, 이에 제한되지 않는다. 발현 시스템 구성체는 발현을 일으킬뿐만 아니라 조절하는 제어 영역을 함유할 수 있다. 일반적으로, 숙주에서 폴리뉴클레오티드를 유지, 전파 또는 발현시키고/시키거나 폴리펩티드를 발현시키는데 적합한 임의의 시스템 또는 벡터는 이와 관련하여 발현에 사용될 수 있다. 적절한 DNA 서열은 임의의 다양한 충분히 공지된 통상의 기술, 예컨대, 예를 들어, Sambrook et al. 등에 기재된 것들을 통해서 발현 시스템으로 삽입될 수 있고, 상기를 참조한다. 재조합 생산을 위해서, 세포는 본 발명의 발현 시스템 또는 이의 일부 또는 폴리뉴클레오티드를 도입하도록 유전자 조작될 수 있다. 세포로 폴리뉴클레오티드의 도입은 많은 표준 실험실 매뉴얼, 예컨대, [Davis et al., Basic Methods in Molecular Biology, (1986)], 및 [Sambrook et al., 1989, supra]에 기술된 방법을 통해 실시될 수 있다.
본 명세서에서 사용되는 발현 모듈은 적어도 하나의 재조합 유전자의 발현을 위한 폴리뉴클레오티드를 포함한다. 상기 재조합 유전자은 상기 글리코실화된 생산물의 합성에서 작용하는 폴리펩티드의 발현에 관여되거나; 또는 상기 재조합 유전자는 상기 글리코실화된 생산물의 합성에 관여되지 않는 상기 숙주 세포의 다른 경로와 연결된다. 상기 재조합 유전자는 발현 또는 활성이 변형된 내생성 단백질을 코딩하고, 바람직하게 상기 내생성 단백질은 과발현되거나; 또는 상기 재조합 유전자는 상기 변형된 세포에서 이종으로 도입되어 발현되는, 바람직하게 과발현되는 이종성 단백질을 코딩한다. 내생성 단백질은 이종성 단백질을 또한 발현하는 세포에서 변형된 발현을 가질 수 있다.
본 발명의 바람직한 구현예에 따라서, 상기 발현 모듈의 각각의 발현은 본 명세서에 정의된 바와 같이 항상성이거나 또는 조율가능하다.
본 발명의 방법 및/또는 세포의 바람직한 구현예에 따라서, 세포는 본 명세서에 정의된 바와 같은 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 위한 경로를 포함하도록 대사적으로 조작된다. 추가의 바람직한 구현예에서, 세포는 LN3으로 락토서 또는 중간체를 변형시킬 수 있는 재조합 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제를 포함한다. 보다 추가로 바람직한 구현예에서, 세포는 코어 삼당류로서 LN3을 갖는 올리고당으로 LN3 또는 LN3의 유도체를 변형시킬 수 있는 다른 재조합 글리코실트랜스퍼라제를 포함한다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 UDP-GlcNAc의 신규 합성을 발현하도록 유전자 변형된다. UDP-GlcNAc는 세포에서 발현되는 효소에 의해서 또는 세포의 물질대사에 의해서 제공될 수 있다. UDP-GlcNAc를 생산하는 이러한 세포는 예를 들어, 세포에 첨가하려는, GlcNAc를 UDP-GlcNAc로 전환시키는 효소를 발현할 수 있다. 이들 효소는 호모 사피엔스 (Homo sapiens), 에스케리치아 콜라이 (Escherichia coli)를 포함한, 몇몇 종 유래의 N-아세틸-D-글루코사민 키나제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, 포스포글루코사민 뮤타제, 및 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제일 수 있다. 바람직하게, 세포는 UDP-GlcNAc를 생산하도록 변형된다. 보다 바람직하게, 세포는 증강된 UDP-GlcNAc 생산을 위해 변형된다. 상기 변형은 N-아세틸글루코사민-6-포스페이트 데아세틸라제의 녹-아웃, L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제의 과-발현, 포스포글루코사민 뮤타제의 과-발현, 및 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제의 과-발현을 포함하는 군으로부터 선택되는 어느 하나 이상일 수 있다.
추가적으로, 또는 대안적으로, 본 명세서에서 사용되는 숙주 세포는 락토스 퍼미아제의 도입 및/또는 과발현에 의해서, 세포에서 락토스를 유입시키도록 임의로 유전자 변형된다. 상기 락토스 퍼미아제는 예를 들어, lacY 유전자 또는 lac12 유전자에 의해 코딩된다.
본 발명의 방법 및/또는 세포에 따라서, 세포는 막 단백질을 발현한다. 막 단백질은 발현이 변형된 내생성 단백질로서, 바람직하게 상기 내생성 단백질은 과발현되거나; 또는 막 단백질은 세포에 의해 이종적으로 발현될 수 있는, 이종성 단백질이다. 이종적으로 발현되는 막 단백질은 도입되어서 발현될 것이고, 바람직하게 과발현될 것이다. 다른 구현예에서, 내생성 단백질은 이종성 막 단백질을 또한 발현하는 세포에서 변형된 발현을 가질 수 있다. 다른 구현예에서, 내생성 막 단백질의 변형된 발현은 상기 내생성 막 단백질의 동일 오페론에서 지도화되고/되거나 발현을 위한 공통 제어 서열을 공유하는 다른 단백질의 변형된 발현을 포함한다. 다른 구현예에서, 막 단백질은 동일 레귤론을 공유하는 인접한 단백질과 함께 발현된다. 다른 구현예에서, 막 단백질이 내막 수송체 (복합체)일 때, 막 단백질은 하나 이상의 외막 수송체(들)와 함께 발현된다. 대안적인 구현예에서, 막 단백질이 외막 수송체일 때, 막 단백질은 하나 이상의 내막 단백질(들)과 함께 발현된다. 대안적인 구현예에서, 막 단백질은 하나 이상의 내막 단백질 및/또는 하나 이상의 외막 단백질과 발현된다. 본 발명의 추가 구현예에 따라서, 막 단백질을 코딩하는 폴리뉴클레오티드는 개별 세포 또는 발현 시스템의 코돈 용법에 적합화된다.
본 발명의 방법 및/또는 세포의 추가의 바람직한 구현예에서, 막 단백질은 운송체, P-P-결합-가수분해-구동 수송체, 및 β-배럴 포린의 군으로부터 선택된다.
방법 및/또는 세포의 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 TCDB 클래스 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1 및 2.A.66의 군으로부터 선택된다.
방법 및/또는 세포의 대안적인 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 eggnog 패밀리 05E8G, 05EGZ, 05JHE, 07QF7 07QRN, 07RBJ, 0814C 및 08N8A의 군으로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 PFAM 목록 PF00893, PF01943, PF05977, PF07690 및 PF13347로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 interpro 목록 IPR000390, IPR001411, IPR001927, IPR002797, IPR004638, IPR005829, IPR010290, IPR011701, IPR020846, IPR023721, IPR023722, IPR032896, IPR036259 및 IPR039672로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03를 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06를 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 subsp. 살라마에 (Salamae) 유래 MdfA 또는 SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열과 적어도 80% 서열 동일성을 갖는 단백질 서열로부터 선택된다. 설명 및 청구항 전반에서, 용어 "적어도 80% 서열 동일성을 갖는 단백질 서열"은 바람직하게 용어 "적어도 80% 서열 동일성을 갖는 단백질" 또는 "적어도 80% 서열 동일성을 갖는 폴리펩티드"로 대체된다.
방법 및/또는 세포의 보다 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해서 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 보다 더 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
- 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
- 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90% 서열 동일성,
- 각각 SEQ ID NO 05, 06, 56, 57 또는 68을 갖는 상기 막 단백질의 전체 길이 서열과 적어도 95.00% 서열 동일성, 또는
- 각각 SEQ ID NO 58, 60 또는 70을 갖는 상기 막 단백질의 전체 길이 서열과 적어도 99.00% 서열 동일성
을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 대안적인 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열과 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열로부터 선택된다. 보다 바람직하게, 막 단백질은 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열에 의해 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA 또는 SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 보다 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 간는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 보다 더 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
- 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
- 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90% 서열 동일성,
- 각각 SEQ ID NO 05, 06, 56 또는 57을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 95.00% 서열 동일성, 또는
- 각각 SEQ ID NO 58 또는 60을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 99.00% 서열 동일성
을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 대안적인 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열로부터 선택된다. 보다 바람직하게, 막 단백질은 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열로부터 선택된다.
이러한 운송체 막 단백질의 아미노산 서열은 첨부된 서열 목록의 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로부터 선택되고, 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로부터 선택되고, 보다 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 55, 59, 66 또는 68로부터 선택되고, 가장 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 55 또는 59로부터 선택되는 서열일 수 있거나, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67 ,68, 69 또는 70 중 어느 하나의 전체 길이 아미노산 서열에 대해 적어도 80% 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95.50%, 96.00%, 96.50%, 97.00%, 97.50%, 98.00%, 98.50%, 99.00%, 99.50%, 99,60%, 99,70%, 99,80%, 99,90%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 보다 더 바람직하게 적어도 97.00%, 가장 바람직하게 적어도 99.00%, 서열 동일성을 갖는 아미노산 서열일 수 있다.
대안적으로, 이러한 운송체 막 단백질의 아미노산 서열은 첨부된 서열 목록의 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69로부터 선택되고, 보다 바람직하게 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 55, 59, 66 또는 68로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 55 또는 59로부터 선택되고, 가장 바람직하게 SEQ ID NO 01, 02 또는 04로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01 또는 02로부터 선택되고, 가장 바람직하게 SEQ ID NO 01인 서열일 수 있거나, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69 중 어느 하나의 전체 길이 아미노산 서열에 대해서 적어도 80% 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95.50%, 96.00%, 96.50%, 97.00%, 97.50%, 98.00%, 98.50%, 99.00%, 99.50%, 99,60%, 99,70%, 99,80%, 99,90%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 보다 더 바람직하게 적어도 97.00%, 가장 바람직하게 적어도 99.00%, 서열 동일성을 갖는 아미노산 서열일 수 있다.
SEQ ID NO 01, 02, 04, 05, 06, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열을 갖는 예시적이고 바람직한 막 단백질이 표 1에 제공된다.
방법 및/또는 세포의 바람직한 구현예에서, 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 막 단백질은 TCDB 클래스 3.A.1.1 및 3.A.1.2의 군으로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 막 단백질은 eggnog 패밀리 05CJ1, 05DFW, 05EZD, 05I1K, 07HR3 및 08IJ9의 군으로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 막 단백질은 PFAM 목록 PF00005, PF00528, PF13407 및 PF17912로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 막 단백질은 interpro 목록 IPR000515, IPR003439, IPR003593, IPR005978, IPR008995, IPR013456, IPR015851, IPR017871, IPR025997, IPR027417, IPR028082, IPR035906, 및 IPR040582로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 막 단백질은 TCDB 클래스 1.B.18로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 막 단백질은 eggnog 패밀리 05DAY로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 막 단백질은 PFAM 목록 PF02563, PF10531 및 PF18412로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 막 단백질은 interpro 목록 IPR003715, IPR019554 및 IPR040716으로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열이다.
방법 및/또는 세포의 대안적인 바람직한 구현예에서, 막 단백질은 TCDB 클래스 1.B.18, 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1, 2.A.66, 3.A.1.1 및 3.A.1.2의 군; eggnog 패밀리 05CJ1, 05DAY, 05DFW, 05E8G, 05EGZ, 05EZD, 05I1K, 05JHE, 07HR3, 07QF7 07QRN, 07RBJ, 0814C, 08IJ9 및 08N8A의 군; PFAM 목록 PF00005, PF00528, PF00893, PF01943, PF02563, PF05977, PF07690, PF10531, PF13347, PF13407, PF17912 및 PF18412; interpro 목록 IPR000390, IPR000515, IPR001411, IPR001927, IPR002797, IPR003439, IPR003593, IPR003715, IPR004638, IPR005829, IPR005978, IPR008995, IPR010290, IPR011701, IPR013456, IPR015851, IPR017871, IPR019554, IPR020846, IPR023721, IPR023722, IPR025997, IPR027417, IPR028082, IPR032896, IPR035906, IPR036259, IPR039672, IPR040582 및 IPR040716; SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 살라마에 (Salamae) 유래 MdfA, SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291 또는 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza; 또는 상기 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편; 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 15, 16, 17, 18, 19, 20 또는 21을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 대안적인 바람직한 구현예에서, 막 단백질은 TCDB 클래스 1.B.18, 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1, 2.A.66, 3.A.1.1 및 3.A.1.2의 군; eggnog 패밀리 05CJ1, 05DAY, 05DFW, 05E8G, 05EGZ, 05EZD, 05I1K, 05JHE, 07HR3, 07QF7 07QRN, 07RBJ, 0814C, 08IJ9 및 08N8A; PFAM 목록 PF00005, PF00528, PF00893, PF01943, PF02563, PF05977, PF07690, PF10531, PF13347, PF13407, PF17912 및 PF18412의 군; interpro 목록 IPR000390, IPR000515, IPR001411, IPR001927, IPR002797, IPR003439, IPR003593, IPR003715, IPR004638, IPR005829, IPR005978, IPR008995, IPR010290, IPR011701, IPR013456, IPR015851, IPR017871, IPR019554, IPR020846, IPR023721, IPR023722, IPR025997, IPR027417, IPR028082, IPR032896, IPR035906, IPR036259, IPR039672, IPR040582 및 IPR040716; SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291 또는 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza; 또는 상기 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편; 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 15, 16, 17, 18, 19, 20 또는 21을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성, 바람직하게 적어도 90% 서열 동일성을 갖는 단백질 서열로부터 선택된다.
상기 TCDB 클래스는 2019년 6월 17일 자에 배포된 TCDB.org 에 정의된 바와 같이 분류된다. 상기 eggnog 패밀리는 2016년 9월 배포된 eggnogdb 4.5.1에 정의된 바와 같이 분류된다. 상기 PFAM 목록은 2018년 9월 배포된 Pfam 32.0에 정의된 바와 같이 분류된다. 상기 interpro 목록은 2019년 7월 4일 배포된 InterPro 75.0에 의해 정의된다.
본 명세서에서 사용되는, 임의의 열거된 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질은 서열이 각각의 막 단백질의 아미노산 서열의 전체 길이에 대해 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95.50%, 96.00%, 96.50%, 97.00%, 97.50%, 98.00%, 98.50%, 99.00%, 99.50%, 99.60%, 99.70%, 99.80%, 99.90% 서열 동일성을 갖는 것으로 이해한다. 본 발명의 상황에서, 기준 막 단백질 'Z'의 전체 길이 서열 (일반적으로 SEQ ID NO로 표시)과 예를 들어 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질/폴리펩티드 (예를 들어, 설명 및 청구항 전반에 개시된 바와 같은 단백질 서열을 갖는 막 단백질)는 본 명세서에 기술된 바와 같이 코어 당류로서 LN3을 갖는 올리고당을 수송할 수 있는 단백질 (즉, 막 단백질)을 의미하고, 다시 마래, 단백질은 코어 당류로서 LN3을 갖는 올리고당을 수송하는 기준 막 단백질 'Z'의 기능적 특징을 보유한다. 유사하게, 기준 막 단백질 'Z'의 전체 길이 서열 (일반적으로 SEQ ID NO로 표시)과 예를 들어 적어도 80% 서열 동일성을 갖는 단백질 서열은 본 명세서에 기술된 바와 같은 코어 당류로서 LN3을 갖는 올리고당을 수송할 수 있는 단백질 (즉, 막 단백질)을 의미하고, 다시 말해, 단백질은 코어 당류로서 LN3을 갖는 올리고당을 수송하는 기준 막 단백질 'Z'의 기능적 특징을 보유한다. 본 명세서에 기술된 바와 같은 코어 당류로서 올리고당을 수송하는 막 단백질의 능력은 예를 들어, 본 발명의 실시예에 기술된 바와 같이, 당업자가 평가할 수 있다.
이러한 막 단백질의 아미노산 서열은 첨부된 서열 목록의 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로부터 선택되고, 바람직하게 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로부터 선택되고, 보다 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 55, 59, 66 또는 68로부터 선택되고, 가장 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 55 또는 59로부터 선택되는 서열, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67 ,68, 69 또는 70 중 어느 하나의 전체 길이 아미노산 서열에 대해 적어도 80% 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95.50%, 96.00%, 96.50%, 97.00%, 97.50%, 98.00%, 98.50%, 99.00%, 99.50%, 99,60%, 99,70%, 99,80%, 99,90%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 보다 더 바람직하게 적어도 97.00%, 가장 바람직하게 적어도 99.00%, 서열 동일성을 갖는 아미노산 서열일 수 있다.
대안적으로, 이러한 막 단백질의 아미노산 서열은 첨부된 서열 목록의 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69로부터 선택되고, 바람직하게 SEQ ID NO SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69로부터 선택되고, 보다 바람직하게 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 55, 59, 66 또는 68로부터 선택되거, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 55 또는 59로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02 또는 04로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01 또는 02로부터 선택되고, 가장 바람직하게 SEQ ID NO 01인 서열일 수 있거나, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69 중 어느 하나의 전체 길이 아미노산 서열에 대해 적어도 80% 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95.50%, 96.00%, 96.50%, 97.00%, 97.50%, 98.00%, 98.50%, 99.00%, 99.50%, 99,60%, 99,70%, 99,80%, 99,90%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 보다 더 바람직하게 적어도 97.00%, 가장 바람직하게 적어도 99.00%, 서열 동일성을 갖는 아미노산 서열일 수 있다.
본 발명의 방법 및/또는 세포의 추가 구현예에서, 숙주 세포는 세포벽의 외막을 가로지르는 화합물의 수송에 관여되는 수송체 단백질인 막 단백질을 발현한다. 바람직하게 세포는 락토스 수송체, 글루코스 수송체, 갈락토스 수송체 또는 뉴클레오티드-활성화된 당에 대한 수송체, 예컨대, 예를 들어, UDP-GlcNAc에 대한 수송체를 포함하는 군으로부터 선택되는 단백질을 코딩하는 적어도 하나의 핵산 서열을 포함하도록 형질전환된다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 세포는 하나 초과의 막 단백질을 발현한다.
보다 바람직한 대안적인 구현예에서, 상기 막 단백질이 SEQ ID NO 10을 갖는 비. 롱검 (B. longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_0247일 때, 상기 Blon_0247는 비. 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0245와 함께 발현된다.
보다 바람직한 대안적인 구현예에서, 상기 막 단백질이 SEQ ID NO 9를 갖는 비. 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon2331일 때, 상기 Blon2331은 Blon2332와 함께 발현된다.
보다 바람직한 대안적인 구현예에서, 상기 막 단백질이 SEQ ID NO 15를 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 Bjnodi일 때, 상기 Bjnodi는 결절형성 인자 nodj와 함께 발현된다.
보다 바람직한 대안적인 구현예에서, 상기 막 단백질이 SEQ ID NO 20을 갖는 이.콜라이 K-12 MG1655 유래 wza일 때, 상기 wza는 wzx, wzb 및/또는 wzc 중 어느 하나 이상과 함께 발현된다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 세포는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되는 글리코실트랜스퍼라제를 발현한다.
본 발명의 방법 및/또는 세포의 바람직한 구현예에서, 세포는 상기 글리코실트랜스퍼라제 중 적어도 하나의 발현 또는 활성이 변형된다. 바람직한 구현예에서, 상기 글리코실트랜스퍼라제는 변형된 발현 또는 활성을 갖는 세포의 내생성 단백질이고, 바람직하게 상기 내생성 글리코실트랜스퍼라제는 과발현되고; 대안적으로 상기 글리코실트랜스퍼라제는 상기 세포에서 이종적으로 도입되어 발현되는, 바람직하게 과발현되는 이종성 단백질이다. 상기 내생성 글리코실트랜스퍼라제는 이종성 글리코실트랜스퍼라제를 또한 발현하는 세포에서 변형된 발현을 가질 수 있다.
본 발명의 방법 및/또는 세포의 추가의 바람직한 구현예에서, 세포는 베타-1,3 연결로 LN3의 말단 GlcNAc 잔기로 UDP-Gal로부터 갈락토스 (Gal)를 전달하여서 락토-N-테트라오스 (LNT; Gal-베타1,3-GlcNAc-베타1,3-Gal-베타1,4-Glc)를 생산하는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제를 발현한다.
본 발명의 방법 및/또는 세포의 추가의 바람직한 구현예에서, 세포는 전체 액체배지 및/또는 상청액에서 90 g/L 이상의 LNT를 생산하고/하거나 전체 액체배지 및/또는 상청액 중 상기 LNT는 각각 전체 액체배지 및/또는 상청액 중 상기 세포에 의해 생산된 LNT 및 NL3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다. 바람직하게, 세포는 상청액에서 90 g/L 이상의 LNT를 생산하고, 상기 LNT는 상청액 중 상기 세포에 의해 생산되는 LNT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다. 본 발명의 방법 및/또는 세포의 보다 바람직한 구현예에서, 전체 액체배지 및/또는 상청액 중 상기 90 g/L 이상의 LNT는 배양 과정, 바람직하게 발효배양 과정으로 배양된 상기 세포에 의해 수득된다. 본 발명의 방법 및/또는 세포의 다른 보다 바람직한 구현예에서, 전체 액체배지 및/또는 상청액 중 상기 세포에 의해 생산된 LNT 및 LN3의 총량에 대해 측정된 적어도 80%의 전체 액체배지 및/또는 상청액 중 LNT의 상기 순도는 배양 과정, 바람직하게 발효배양 과정으로 배양된 상기 세포에 의해 수득된다.
전체 액체배지 또는 상청액 중 LNT 및 LN3의 총량에 대한 적어도 80%의 LNT의 순도는 각각 전체 액체배지 또는 상청액 중 세포에 의해 생산된 LNT 및 LN3의 총량에 대해 측정된 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95.5, 96, 96.5, 97, 97.5, 98, 98.5, 99 또는 99.5%의 LNT를 포함하는, 80% 이상의, 각각 전체 액체배지 또는 상청액 중 LNT 및 LN3의 혼합물 내 상기 LNT의 양으로서 이해해야 한다.
본 발명의 방법 및/또는 세포의 추가 및/또는 대안적인 추가의 바람직한 구현예에서, 세포는 베타-1,4 연결로 LN3의 말단 GlcNAc 잔기로 UDP-Gal 도너로부터 갈락토스 (Gal)를 전달하여서, 락토-N-네오테트라오스 (LNnT; Gal-베타1,4-GlcNAc-베타1,3-Gal-베타1,4-Glc)를 생산하는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제를 발현한다.
본 발명의 방법 및/또는 세포의 추가의 바람직한 구현예에서, 세포는 전체 액체배지 및/또는 상청액에서 70 g/L 이상, 바람직하게 90 g/L 이상의 LNnT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNnT는 각각 전체 액체배지 및/또는 상청액 중에서 상기 세포에 의해 생산되는 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다. 바람직하게, 세포는 상청액에서 70 g/L 이상, 바람직하게 90 g/L 이상의 LNnT를 생산하고, 상기 LNnT는 상청액 중에서 상기 세포에 의해 생산되는 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다. 본 발명의 방법 및/또는 세포의 보다 바람직한 구현예에서, 전체 액체 배지 및/또는 상청액 중 상기 70 g/L 이상, 바람직하게 90 g/L 이상의 LNnT는 배양 과정, 바람직하게 발효배양 과정으로 배양된 상기 세포에 의해 수득된다. 본 발명의 방법 및/또는 세포의 다른 보다 바람직한 구현예에서, 전체 액체배지 및/또는 상청액 중에서 상기 세포에 의해 생산된 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 전체 액체배지 및/또는 상청액 중 LNnT의 상기 순도는 배양 과정, 바람직하게 발효배양 과정으로 배양된 상기 세포에 의해 수득된다.
전체 액체배지 또는 상청액 중 LNnT 및 LN3의 총량에 대한 적어도 80%의 LNnT의 순도는 각각 전체 액체배지 또는 상청액 중에서 세포에 의해 생산된 LNnT 및 LN3의 총량에 대해 측정된 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95.5, 96, 96.5, 97, 97.5, 98, 98.5, 99 또는 99.5%의 LNnT를 포함하여, 80% 이상의, 각각 전체 액체배지 또는 상청액 중 LNnT 및 LN3의 혼합물 중 상기 LNnT의 양으로 이해해야 한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 세포는 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당의 생산에서 사용하려는 뉴클레오티드-활성화된 당을 합성할 수 있다. 본 발명의 방법 및/또는 세포의 바람직한 구현예에서, 뉴클레오티드-활성화된 당은 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택된다.
추가적으로, 또는 대안적으로, 본 명세서에서 사용되는 숙주 세포는 GDP-푸코스의 신규 합성을 발현하도록 임의로 유전자 변형된다. GDP-푸코스는 세포에서 발현되는 효소에 의해서 또는 세포의 물질대사에 의해서 제공될 수 있다. GDP-푸코스를 생산하는 이러한 세포는 예를 들어, 세포에 첨가되는, 푸코스를 GDP-푸코스로 전환시키는 효소를 발현할 수 있다. 이러한 효소는 예를 들어, 이기능성 푸코스 키나제/푸코스-1-포스페이트 구아닐릴트랜스퍼라제, 예컨대 테로이데스 프라질리스 (Bacteroides fragilis) 유래 Fkp, 또는 호모 사피엔스 (Homo sapiens), 수스 스크로파 (Sus scrofa) 및 라투스 노르베지쿠스 (Rattus norvegicus)를 포함한 몇개 종에서 알려진 바와 같은 하나의 별개 푸코스-1-포스페이트 구아닐릴트랜스퍼라제와 함께 하나의 별개 푸코실 키나제의 조합일 수 있다. 바람직하게, 세포는 GDP-푸코스를 생산하도록 변형된다. 보다 바람직하게, 세포는 증강된 GDP-푸코스 생산을 위해 변형된다. 상기 변형은 UDP-글루코스:운데카프레닐-포스페이트 글루코스-1-포스페이트 트랜스퍼라제 코딩 유전자의 녹-아웃, GDP-L-푸코스 신타제 코딩 유전자의 과-발현, GDP-만노스 4,6-데히드라타제 코딩 유전자의 과-발현, 만노스-1-포스페이트 구아닐릴트랜스퍼라제 코딩 유전자의 과-발현, 포스포만노뮤타제 코딩 유전자의 과-발현 및 만노스-6-포스페이트 이소머라제 코딩 유전자의 과-발현을 포함하는 군으로부터 선틱되는 어느 하나 이상일 수 있다.
추가적으로, 또는 대안적으로, 본 명세서에서 사용되는 숙주 세포는 CMP-Neu5Ac의 신규 합성을 발현하도록 임의로 유전자 변형된다. CMP-Neu5Ac는 세포에서 발현되는 효소에 의해 또는 세포의 물질대사에 의해 제공될 수 있다. CMP-Neu5Ac를 생산하는 이러한 세포는 예를 들어, 세포에 첨가되는 시알산을 CMP-Neu5Ac로 전환시키는 효소를 발현할 수 있다. 이러한 효소는 CMP-시알산 신써타제, 예컨대 호모 사피엔스 (Homo sapiens), 네이세리아 메닌지티디스 (Neisseria meningitidis), 및 파스퇴렐라 멀토시다 (Pasteurella multocida)를 포함하는 몇몇 종 유래의 N-아실뉴라미네이트 시티딜릴트랜스퍼라제일 수 있다. 바람직하게, 세포는 CMP-Neu5Ac를 생산하도록 변형된다. 보다 바람직하게, 세포는 증강된 CMP-Neu5Ac 생산을 위해 변형된다. 상기 변형은 N-아세틸글루코사민-6-포스페이트 데아세틸라제의 녹-아웃, 글루코사민-6-포스페이트 데아미나제의 녹-아웃, 시알레이트 신타제 코딩 유전자의 과-발현, 및 N-아세틸-D-글루코사민-2-에피머라제 코딩 유전자의 과-발현을 포함하는 군으로부터 선택되는 어느 하나 이상일 수 있다.
추가적으로, 또는 대안적으로, 본 명세서에서 사용되는 숙주 세포는 UDP-Gal의 신규 합성을 발현하도록 임의로 유전자 변형된다. UDP-Gal은 세포에서 발현되는 효소에 의해서 또는 세포의 물질대사에 의해서 제공될 수 있다. UDP-Gal을 생산하는 이러한 세포는 예를 들어, UDP-글루코스를 UDP-Gal로 전환시키는 효소를 발현할 수 있다. 이러한 효소는 호모 사피엔스, 에스케리치아 콜라이, 및 라투스 노르베지쿠스를 포함한 몇몇 종에서 알려진 바와 같은 예를 들어 UDP-글루코스-4-에피머라제 GalE일 수 있다. 바람직하게, 세포는 UDP-Gal을 생산하도록 변형된다. 보다 바람직하게, 세포는 증강된 UDP-Gal 생산을 위해 변형된다. 상기 변형은 이기능성 5'-뉴클레오티다제/UDP-당 히드롤라제 코딩 유전자의 녹-아웃, 갈락토스-1-포스페이트 우리딜릴트랜스퍼라제 코딩 유전자의 녹-아웃 및 UDP-글루코스-4-에피머라제 코딩 유전자의 과-발현을 포함하는 군으로부터 선택되는 어느 하나 이상일 수 있다.
선택된 단당류, 이당류 또는 올리고당에 대한 세포의 이화 경로는 적어도 부분적으로 불활성화된 것이 일반적으로 바람직하고, 단당류, 이당류 또는 올리고당은 코어 삼당류로서 LN3을 갖는 올리고당의 합성에 관여되고/되거나 필요하다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 코어 삼당류로서 LN3을 포함하는 올리고당은 코어 삼당류로서 LN3을 포함하는 포유동물 모유 올리고당 또는 루이스-유형 항원 올리고당이다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 세포는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물을 합성할 수 있다.
특정 예시적인 구현예에서, 본 발명의 방법은 고수율로 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 제공한다. 방법은 락토스를 함유하는 수성 배양 또는 발효배양 배지에서, 유전자 조작된 세포, 바람직하게 이.콜라이, 보다 바람직하게 LacZ 유전자 및 nagB 유전자를 녹-아웃시켜서 변형된 이. 콜라이 세포를 배양 또는 발효배양하는 단계를 포함한다. 보다 더 바람직하게, 추가적으로 이.콜라이 lacY 유전자, 자이모모나스 모빌리스 (Zymomonas mobilis)로부터 기원하는 프룩토스 키나제 유전자 (frk) 및 비피도박테리움 아돌레센티스 (Bifidobacterium adolescentis)로부터 기원하는 수크로스 포스포릴라제 (SP)는 게놈으로 녹-인되어서 항상적으로 발현될 수 있다. 항상성 프로모터는 De Mey et al. (BMC Biotechnology, 2007) 및 Mutalik et al. (Nat. Methods 2013, No. 10, 354-360)에 의해 기술된 프로모터 라이브러리로부터 기원된다. 추가적으로, 변형된 이. 콜라이 세포는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제를 코딩하는 재조합 유전자 및 본 발명의 올리고당을 합성하는 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 다른 재조합 유전자를 갖는다. 세포는 또한 본 명세서에 기술된 바와 같은 막 단백질 중 어느 하나의 발현을 코딩하는 재조합 유전자를 포함한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위해서 전구체를 사용한다. 방법 및/또는 세포의 바람직한 구현예에서, 막 단백질은 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체의 흡수에 관여된다. 다른 바람직한 구현예에서, 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체를 생산한다.
본 발명의 다른 구현예는 글리코실화된 생산물이 박테리아, 효모 또는 진균, 또는 식물 세포, 동물 세포, 비-인간 포유동물 세포, 곤충 세포 또는 원충으로 이루어진 목록으로부터 선택되는 미생물에서 및/또는 미생물에 의해서 생산되는 방법 및 세포를 제공한다. 후자의 박테리아는 바람직하게 프로테오박테리아 (Proteobacteria) 문 또는 피르미큐테스 (Firmicutes) 문 또는 시아노박테리아 (Cyanobacteria) 문 또는 데이노코쿠스-써무스 (Deinococcus-Thermus) 문에 속한다. 프로테오박테리아 문에 속하는 후자의 박테리아는 바람직하게 엔테로박테리아세아에 과, 바람직하게 에스케리치아 콜라이 (Escherichia coli) 종에 속한다. 후자의 박테리아는 바람직하게 에스케리치아 콜라이 종 예컨대, 제한없이 에스케리치아 콜라이 B, 에스케리치아 콜라이 C, 에스케리치아 콜라이 W, 에스케리치아 콜라이 K12, 에스케리치아 콜라이 니슬 (Nissle)에 속하는 임의 균주와 관련된다. 보다 특히,후자의 용어는 실험실 환경에 충분히 적합화되고, 야생형 균주와 달리, 장에서 생존하는 그들 능력을 상실한 - 이. 콜라이 K12 균주로서 명명된 - 배양된 에스케리치아 콜라이 균주에 관한 것이다. 이.콜라이 K12 균주의 잘 알려진 예는 K12 야생형, W3110, MG1655, M182, MC1000, MC1060, MC1061, MC4100, JM101, NZN111 및 AA200이다. 따라서, 바람직하게 본 발명은 특히 상기 표시된 바와 같은 돌연변이되고/되거나 형질전환된 에스케리치아 콜라이 균주에 관한 것으로서, 상기 이.콜라이 균주는 K12 균주이다. 보다 특히, 본 발명은 상기 표시된 바와 같은 돌연변이되고/되거나 형질전환된 에스케리치아 콜라이 균주에 관한 것으로서, 상기 K12 균주는 이.콜라이 MG1655이다. 피르미큐테스 문에 속하는 후자의 박테리아는 바람직하게 바실리 (Bacilli), 바람직하게 바실러스 (Bacillus) 종, 예컨대, 바실러스 서브틸리스 (Bacillus subtilis) 또는 비. 아밀로리케파시엔스 (B. amyloliquefaciens)에 속한다. 아시네토박테리아 문에 속하는 후자의 박테리아는 바람직하게, 코리네박테리아세아에 (Corynebacteriaceae) 과에 속하는 것으로서, 이의 구성원인 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) 또는 씨. 아페르멘탄스 (C. afermentans)가 있거나, 또는 스트렙토마이세타세아에 (Streptomycetaceae) 과에 속하는 것으로서, 이의 구성원인 스트렙토마이세스 그리세우스 (Streptomyces griseus) 또는 에스. 프라디아에 (S. fradiae)가 있다. 후자의 효모는 바람직하게 아스코마이코타 (Ascomycota) 문 또는 바시디오마이코타 (Basidiomycota) 문 또는 듀테로마이코타 (Deuteromycota) 문 또는 자이고마이세테스 (Zygomycetes) 문에 속한다. 후자의 효모는 바람직하게 사카로마이세스 (Saccharomyces) (예컨대, 예를 들어, 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae), 에스. 바야누스 (S. bayanus), 에스. 보울라르디 (S. boulardii)) 같은 구성원), 피키아 (Pichia) (예컨대, 예를 들어, 피키아 파스토리스 (Pichia pastoris), 피. 아노말라 (P. anomala), 피. 클루이베리 (P. kluyveri)) 같은 구성원), 코마가타엘라 (Komagataella), 한수넬라 (Hansunella), 클루이베로마이세스 (Kluyveromyces) (예컨대, 예를 들어, 클루이베로마이세스 락티스 (Kluyveromyces lactis), 케이. 마르시아누스 (K. marxianus), 케이. 써모톨레란스 (K. thermotolerans) 같은 구성원), 야로위아 (Yarrowia) (예컨대, 예를 들어, 야로위아 리폴리티카 (Yarrowia lipolytica)), 에레모테시움 (Eremothecium), 자이고사카로마이세스 (Zygosaccharomyces), 스타르메렐라 (Starmerella) (예컨대, 예를 들어, 스타르메렐라 봄비콜라 (Starmerella bombicola)) 또는 데바로마이세스 (Debaromyces)의 속에 속한다. 후자의 효모는 바람직하게피키아 파스토리스, 야로위아 리폴리티카, 사카로마이세스 세레비지아에 , 및 클루이베로마이세스 락티스로부터 선택된다. 후자의 진균은 바람직하게 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium), 페니실리움 (Penicillium), 무코르 (Mucor) 또는 아스퍼질러스 (Aspergillus)의 속에 속한다. "식물 세포"는 개화 및 비-개화 식물의 세포를 비롯한, 조류 세포, 예를 들어, 클라미도모나스 (Chlamydomonas), 클로렐라 (Chlorella) 등을 포함한다. 바람직하게, 상기 식물 세포는 담배, 알파파, 벼, 목화, 유채, 토마토, 곡물, 옥수수 또는 대두 세포를 포함한다. 후자의 동물 세포는 바람직하게 비-인간 포유동물 (예를 들어, 소, 물소, 돼지, 양, 마우스, 래트), 조류 (예를 들어, 닭, 오리, 타조, 칠면조, 꿩), 어류 (예를 들어, 황새치, 연어, 참치, 농어, 송어, 메기), 무척추동물 (예를 들어, 바닷가재, 게, 새우, 조개, 굴, 홍합, 성게), 파충류 (예를 들어, 뱀, 악어, 거북이), 양서류 (예를 들어, 개구리) 또는 곤충 (예를 들어, 파리, 선충)으로부터 유래되거나 또는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주이다. 인간 및 비-인간 포유동물 세포는 바람직하게 WO21067641에 기술된 바와 같이, 상피 세포 예컨대, 예를 들어, 유선 상피 세포, 배아 신장 세포 (예를 들어, HEK293 또는 HEK 293T 세포), 섬유아세포, COS 세포, 중국 햄스터 난소 (CHO) 세포, 쥐 골수종 세포 예컨대, 예를 들어, N20, SP2/0 또는 YB2/0 세포, NIH-3T3 세포, 비-유선 성체 줄기 세포 또는 이의 유도체를 포함하는 목록으로부터 선택된다. 상기 곤충 세포는 바람직하게 스포돕테라 프루기페르다 (Spodoptera frugiperda) 예컨대, 예를 들어 Sf9 또는 Sf21 세포, 봄빅스 모리 (Bombyx mori), 마메스트라 브라시카에 (Mamestra brassicae), 트리코플루시아 니 (Trichoplusia ni) 예컨대, 예를 들어 BTI-TN-5B1-4 세포 또는 드로소필라 멜라노가스터 (Drosophila melanogaster) 예컨대, 예를 들어, 드로소필라 (Drosophila) S2 세포로부터 유래된다. 후자의 원충 세포는 바람직하게 리슈마니아 타렌톨라에 (Leishmania tarentolae) 세포이다.
바람직한 구현예에서 세포는 미생물의 세포이고, 보다 바람직하게 상기 미생물은 박테리아 또는 효모이다. 보다 바람직한 구현예에서, 미생물은 박테리아, 가장 바람직하게 에스케리치아 콜라이이다. 이러한 이. 콜라이의 사용 예는 본 명세서에 기술된다.
다른 보다 바람직한 구현예에서, 세포는 효모이다.
다른 구현예는 배지에서 안정하게 배양되는 세포를 제공하는 것이고, 상기 배지는 최소 배지, 복합 배지, 또는 예컨대 예를 들어 제한없이 비타민, 미량 원소, 아미노산같은 일정 화합물이 농후화된 성장 배지를 포함한 임의 유형의 성장 배지일 수 있다.
본 명세서에서 사용되는 미생물 또는 세포는 주요 탄소 공급원으로서 단당류, 이당류, 올리고당, 다당류, 폴리올, 복합 배지 또는 이의 혼합물에서 성장할 수 있다. 용어 주요는 관심 올리고당, 생물량 형성, 이산화탄소 및/또는 부산물 형성 (예컨대, 산 및/또는 알콜, 예컨대, 아세테이트, 락테이트, 및/또는 에탄올)를 위해 가장 중요한 탄소 공급원을 의미하고, 다시 말해서, 모든 필요한 탄소의 20, 30, 40, 50, 60, 70, 75, 80, 85, 90, 95, 98, 99%가 상기 표시된 탄소 공급원으로부터 유래된다. 본 발명의 일 구현예에서, 상기 탄소 공급원은 상기 유기체에 대한 유일한 탄소 공급원이고, 다시 말해서, 모든 필요한 탄소의 100%는 상기 표시된 탄소 공급원으로부터 유래된다. 일반적인 주요 탄소 공급원은 글루코스, 글리세롤, 프룩토스, 말토스, 락토스, 아라비노스, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 옥수수 침지액, 고-프룩토스 시럽, 아세테이트, 시트레이트, 락테이트 및 피루베이트를 포함하지만, 이에 제한되지 않는다. 용어 복합 배지는 정확한 성분이 결정되지 않은 배지를 의미한다. 예에는 당밀, 옥수수 침지액, 펩톤, 트립톤 또는 효모 추출물이 있다.
추가의 바람직한 구현예에서, 본 명세서에 기술된 미생물 또는 세포는 본 명세서에 참조로 편입되는, WO2012/007481에 기술된 바와 같이 생산 경로 및 생물량 경로를 갖는 분할 물질대사를 사용한다. 상기 유기체는 예를 들어, 포스포글루코이소머라제 유전자, 포스포프룩토키나제 유전자, 프룩토스-6-포스페이트 알돌라제 유전자, 프룩토스 이소머라제 유전자, 및/또는 프룩토스:PEP 포스포트랜스퍼라제 유전자로부터 선택되는 유전자를 변경시켜서 프룩토스-6-포스페이트를 축적하도록 유전자 변형될 수 있다.
추가의 바람직한 구현예에서, 본 명세서에 기술된 바와 같은 코어 삼당류로서 LN3을 갖는 올리고당을 제조하기 위한 방법은 하기 단계 중 적어도 하나를 포함한다:
i) 배양 배지에 초기 반응기 부피 리터 당 적어도 50, 보다 바람직하게 적어도 75, 보다 바람직하게 적어도 100, 보다 바람직하게 적어도 120, 보다 바람직하게 적어도 150 그램의 락토스를 포함하는 락토스 공급물을, 바람직하게 연속 방식으로, 바람직하게 배양 배지의 최종 부피가 상기 락토스 공급물 첨가 전 배양 배지의 3배 이하, 바람직하게 2배 이하, 보다 바람직하게 2배 미만이 되도록 첨가하는 단계로서, 전체 반응기 부피는 250 mL (밀리리터) 내지 10.000 ㎥ (입방 미터) 범위인, 단계;
ii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해 첨가하는 단계;
iii)
락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해 첨가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게 75 g/L, 보다 바람직하게 100 g/L, 보다 바람직하게 125 g/L, 보다 바람직하게 150 g/L, 보다 바람직하게 175 g/L, 보다 바람직하게 200 g/L, 보다 바람직하게 225 g/L, 보다 바람직하게 250 g/L, 보다 바람직하게 275 g/L, 보다 바람직하게 300 g/L, 보다 바람직하게 325 g/L, 보다 바람직하게 350 g/L, 보다 바람직하게 375 g/L, 보다 바람직하게, 400 g/L, 보다 바람직하게 450 g/L, 보다 바람직하게 500 g/L, 보다 더 바람직하게, 550 g/L, 가장 바람직하게 600 g/L이고; 바람직하게 상기 용액의 pH는 3과 7 사이로 설정되고,
바람직하게 상기 공급 용액의 온도는 20℃와 80℃ 사이로 유지되는 것인 단계.
상기 방법은 상기 배양 배지의 최종 부피 중에서 적어도 50 g/L, 바람직하게 적어도 75 g/L, 보다 바람직하게 적어도 90 g/L, 보다 바람직하게 적어도 100 g/L, 보다 바람직하게 적어도 125 g/L, 보다 바람직하게 적어도 150 g/L, 보다 바람직하게 적어도 175 g/L, 보다 바람직하게 적어도 200 g/L의 농도로, 코어 삼당류로서 LN3을 갖는 상기 올리고당을 생성시킨다.
바람직하게, 락토스 공급은 배양의 시작 부터 락토스를 적어도 5 mM의 농도, 바람직하게 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 보다 바람직하게 > 300 mM의 농도로 첨가하여 수행된다.
다른 구현예에서 락토스 공급은 배양의 생산 단계 전반에서 적어도 5 mM, 바람직하게 10 mM 또는 30 mM의 락토스 농도가 수득되는, 농도로 배양 배지에 락토스를 첨가하여 수행된다.
본 명세서에 기술된 방법의 추가 구현예에서, 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안 또는 연속 방식으로 배양된다.
본 명세서에 기술된 방법의 다른 구현예에서, 탄소 및 에너지 공급원, 바람직하게 글루코스, 글리세롤, 프룩토스, 말토스, 아라비노스, 말토덱스트린, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 폴리올, 옥수수 침지액, 고-프룩토스 시럽, 숙시네이트, 말레이트, 아세테이트, 시트레이트, 락테이트, 피루베이트 및/또는 락토스가 또한, 바람직하게 연속으로 배양 배지에, 바람직하게 락토스와 첨가된다.
바람직한 구현예에서, 탄소-기반 기질, 바람직하게 수크로스는 배양 배지에 3일 이상 동안, 바람직하게 7일 까지 제공되고/되거나, 배양 배지에, 초기 배양 리터 당 적어도 100, 유리하게 적어도 105, 보다 유리하게 적어도 110, 보다 더 유리하게 적어도 120 그램의 수크로스를, 연속 방식으로, 배양 배지의 최종 부피가 배양 전 배양 배지 부피의 3배 이하, 유리하게 2배 이하, 보다 유리하게 2배 미만이도록 제공된다.
바람직하게, 본 명세서에 기술된 대로 방법을 수행할 때, 지수적 세포 성장의 제1 단계는 락토스가 배양 배지에 제2 단계에서 첨가되기 전에, 탄소-기반 기질, 바람직하게 글루코스 또는 수크로스를 배양 배지에 첨가하여 제공된다.
대안적인 바람직한 구현예에서, 본 명세서에 기술된 바와 같은 방법에서, 락토스는 탄소-기반 기질과 함께 지수 성장의 제1 단계에서 이미 첨가된다.
본 발명에 따라서, 본 명세서에 기술된 바와 같은 방법은 바람직하게 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 상기 배양으로부터 분리시키는 단계를 포함한다.
용어 "상기 배양으로부터 분리"는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 상기 올리고당 또는 상기 올리고당 혼합물을 세포 및/또는 이의 성장 배지로부터 수확, 수집, 또는 회수하는 것을 의미한다.
코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물은 세포가 성장된, 수성 배양 배지로부터 통상의 방식으로 분리될 수 있다. 상기 올리고당 또는 상기 올리고당 혼합물이 올리고당 또는 상기 올리고당 혼합물을 생산하는 세포에 여전히 존재하는 경우에, 상기 올리고당 또는 상기 올리고당 혼합물을 세포 밖으로 유리시키거나 또는 추출하기 위한 통상의 방식, 예컨대, 높은 pH, 열충격, 초음파 처리, 프렌치 프레스, 균질화, 효소적 가수분해, 화학적 가수분해, 용매 가수분해, 세제, 가수분해 등을 사용한 세포 파괴가 사용될 수 있다. 배양 배지 및/또는 세포 추출물은 함께 및 분리하여 상기 올리고당 또는 상기 올리고당 혼합물을 분리하기 위해서 추가로 사용될 수 있다.
이것은 바람직하게 현탁 미립자 및 오염물, 특히 유전자 조작된 세포를 배양하여 생산된 세포, 세포 성분, 불용성 대사산물 및 찌꺼기를 제거하기 위해 상기 올리고당 또는 상기 올리고당 혼합물을 청징화시키는 단계를 포함한다. 이 단계에서, 상기 올리고당 또는 상기 올리고당 혼합물은 통상의 방식으로 청징화될 수 있다. 바람직하게, 상기 올리고당 또는 상기 올리고당 혼합물은 원심분리, 응결, 경사법 및/또는 여과에 의해 청징화된다. 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 상기 올리고당 또는 올리고당 혼합물을 분리시키는 제2 단계는 바람직하게 실질적으로 모든 단백질을 비롯하여, 후속 분리 단계를 방해할 수 있는 펩티드, 아미노산, RNA 및 DNA 및 임의의 내독소 및 당지질을, 바람직하게 청징화된 이후에, 상기 올리고당 또는 상기 올리고당 혼합물로부터 분리시키는 단계를 포함한다. 이 단계에서, 단백질 및 관련 불순물은 통상의 방식으로 상기 올리고당 또는 상기 올리고당 혼합물로부터 제거될 수 있다. 바람직하게, 단백질, 염, 부산물, 색소 및 다른 관련 불순물은 상기 올리고당 또는 상기 올리고당 혼합물로부터 한외여과, 나노여과, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피 (예컨대, 제한없이 양이온 교환, 음이온 교환, 혼합층 이온 교환), 소수성 상호작용 크로마토그래피 및/또는 겔 여과 (특, 크기 배제 크로마토그래피), 특히 크로마토그래피, 보다 특히 이온 교환 크로마토그래피 또는 소수성 상호작용 크로마토그래피 또는 리간드 교환 크로마토그래피에 의해서 제거된다. 크기 배제 크로마토그래피를 제외하고, 단백질 및 관련 불순물은 크로마토그래피 매질 또는 선택된 막에 유지된다.
추가의 바람직한 구현예에서, 본 명세서에 기술된 바와 같은 방법은 또한 본 발명의 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 추가 정제를 제공한다. 상기 올리고당 또는 상기 올리고당 혼합물의 추가 정제는 예를 들어 임의의 잔류 DNA, 단백질, LPS, 내독소, 또는 다른 불순물을 제거하기 위해 (활성화된) 차콜 또는 탄소, 나노여과, 한외여과 또는 이온 교환의 사용을 통해 수행될 수 있다. 알콜, 예컨대, 에탄올, 및 수성 알콜 혼합물이 또한 사용될 수 있다. 다른 정제 단계는 상기 올리고당 또는 상기 올리고당 혼합물의 결정화, 증발 또는 침전에 의해 수행된다. 다른 정제 단계는 생산된 올리고당 또는 올리고당 혼합물을 건조, 예를 들어 분무 건조 또는 동결건조하는 것이다.
예시적인 구현예에서, 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 분리 및 정제는 하기 단계를 임의 순서로 포함하는 방법으로 수행된다:
a) 배양 또는 이의 청징화된 형태를 생산된 올리고당 또는 올리고당 혼합물의 체류를 보장하고, 단백질, 염, 부산물, 색소 및 다른 관련 불순물의 적어도 일부가 통과하도록 허용하는 600-3500 Da의 분자량 컷-오프 (MWCO)를 갖는 나노여과 막과 접촉시키는 단계,
b) 상기 막과 무기 전해질의 수용액을 사용하여, 단계 a)의 체류물에 대해 투석여과를 수행한 이후에, 과량의 전해질을 제거하도록 순수를 사용해 임의적인 투석여과를 수행하는 단계,
c) 및 상기 전해질의 양이온으로부터 염의 형태로 상기 올리고당 또는 상기 올리고당 혼합물로 농후화된 체류물을 수집하는 단계.
대안적인 예시적인 구현예에서, 상기 올리고당 또는 상기 올리고당 혼합물의 분리 및 정제는 임의 순서로 하기 단계를 포함하는 방법으로 수행된다: 배양 또는 이의 청징화된 형태에 대해서 상이한 막을 사용하여 2개 막 여과 단계를 수행하는 단계로서,
- 하나의 막은 약 300 달톤과 약 500 달톤 사이의 분자량 컷-오프를 갖고,
- 다른 막은 약 600 달톤과 약 800 달톤 사이의 분자량 컷-오프를 갖는다.
대안적인 예시적인 구현예에서, 상기 올리고당 또는 상기 올리고당 혼합물의 분리 및 정제는 배양 또는 이의 청징화된 형태를 H+-형태의 강한 양이온 교환 수지 및 유리 염기 형태의 약한 음이온 교환 수지로 처리하는 단계를 포함하는 임의 순서의 하기 단계를 포함하는 방법으로 수행된다.
대안적인 예시적인 구현예에서, 상기 올리고당 또는 상기 올리고당 혼합물의 분리 및 정제는 하기 방식으로 수행된다. 생산된 올리고당, 생물량, 배지 성분 및 오염물을 포함하는 배양으로서, 배양 중 생산된 올리고당 또는 올리고당 혼합물의 순도가 < 80%인 것인, 배양은 하기 정제 단계에 적용된다:
i) 배양으로부터 생물량의 분리 단계,
ii) 양으로 하전된 물질의 제거를 위한 양이온성 이온 교환기 처리 단계,
iii) 음으로 하전된 물질의 제거를 위한 음이온성 이온 교환기 처리 단계,
iv) 나노여과 단계 및/또는 전기투석 단계,
80% 이상의 순도로 생산된 올리고당 또는 올리고당 혼합물을 포함하는 정제된 용액이 제공된다. 임의로 정제된 용액은 분무 건조된다.
대안적인 예시적인 구현예에서, 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 분리 및 정제는 임의 순서로 하기 단계를 포함하는 방법으로 수행된다: 배양의 효소 처리 단계; 배양으로부터 생물량의 제거 단계; 한외여과 단계; 나노여과 단계; 및 컬럼 크로마토그래피 단계. 바람직하게 이러한 컬럼 크로마토그래피는 단일 컬럼 또는 다수 컬럼이다. 추가로 바람직하게, 컬럼 크로마토그래피 단계는 모의 이동층 크로마토그래피이다. 이러한 모의 이동층 크로마토그래피는 바람직하게 i) 적어도 4개 컬럼으로서, 적어도 하나의 컬럼은 약하거나 또는 강한 양이온 교환 수지를 포함하는 것인 컬럼; 및/또는 ii) 상이한 유속을 갖는 4개 구역 I, II, III 및 IV; 및/또는 iii) 물을 포함하는 용리액; 및/또는 iv) 15℃ 내지 60℃의 작업 온도를 포함한다.
특별한 구현예에서, 본 발명은 분말로 분무-건조된 생산된 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 제공하고, 분무-건조된 분말은 < 15% -wt.의 물, 바람직하게 < 10% -wt.의 물, 보다 바람직하게 < 7% -wt.의 물, 가장 바람직하게 < 5% -wt.의 물을 함유한다.
본 발명의 다른 양태는 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 발효적 생산에서 본 명세서에 정의된 바와 같은 막 단백질의 군으로부터 선택되는 막 단백질의 용도를 제공한다.
추가 양태에서, 본 발명은 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 제조를 위한 방법에서, 본 명세서에 정의된 바와 같은 세포의 용도를 제공한다
더 나아가서, 본 발명은 또한 본 발명에 따른 방법을 통해 수득된 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 비롯하여, 상기 올리고당 또는 상기 올리고당 혼합물의 생산을 위한 상기 기술된 바와 같은 폴리뉴클레오티드, 벡터, 숙주 세포, 미생물 또는 폴리펩티드의 용도에 관한 것이다. 상기 올리고당 또는 상기 올리고당 혼합물은 이유식, 성인 식품 또는 사료의 보충을 위한, 식품 첨가제, 프리바이오틱, 심바이오틱으로서, 또는 치료적 또는 약학적 활성 화합물로서 사용될 수 있다. 신규 방법을 사용하여, 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물은 복잡한, 시간 및 비용 소모적인 합성 과정의 필요없이, 쉽게 효율적으로 제공될 수 있다.
본 명세서에 기술된 바와 같은 세포에서 생산되는 올리고당의 확인을 위해서, 단량체 빌딩 블록 (예를 들어, 단당류 또는 글리칸 단위 조성물), 측쇄의 아노머 구성, 치환 기의 존재 및 위치, 중합도/분자량, 및 연결 패턴은 당분야에 공지된 표준 방법, 예컨대, 예를 들어, 메틸화 분석, 환원 절단, 가수분해, GC-MS (가스 크로마토그래피-질량 분광법), MALDI-MS (매트릭스-보조 레이저 탈착/이온화-질량 분광법), ESI-MS (전자분무 이온화-질량 분광법), HPLC (자외선 또는 굴절률 검출 동반 고성능 액상 크로마토그래피), HPAEC-PAD (펄스식 전류측정 검출 동반 고성능 음이온-교환 크로마토그래피), CE (모세관 전기영동), IR (적외선)/라만 분광법, 및 NMR (핵 자기 공명) 분광법 기술에 의해 확인될 수 있다. 결정 구조는 예를 들어, 고체 NMR, FT-IR (퓨리에 변환 적외선 분광법), 및 WAXS (광각 X-선 산란)을 사용하여 해석될 수 있다. 중합도 (DP), DP 분포 및 다분산도는 예를 들어, 점도계 및 SEC (SEC-HPLC, 고성능 크기-배제 크로마토그래피)를 통해 결정될 수 있다. 올리고당의 단량체 성분을 확인하기 위해서, 방법 예컨대, 예를 들어, 산-촉매 가수분해, HPLC (고성능 액상 크로마토그래피) 또는 GLC (기체-액체 크로마토그래피) (알디톨 아세테이트로 전환 이후)가 사용될 수 있다. 글리코시드 연결을 결정하기 위해서, 올리고당은 DMSO 중 요오드화메틸 및 강염기에 의해 메틸화되고, 가수분해가 수행되고, 부분적으로 메틸화된 알디톨로 환원이 달성되며, 메틸화된 알디톨 아세테이트로의 아세틸화가 수행되며, 분석은 GLC/MS (질량 분광법과 결합된 기체-액체 크로마토그래피)에 의해 수행된다. 글리칸 서열을 결정하기 위해서, 부분 해중합이 산 또는 효소를 사용해 수행되어서 구조가 결정된다. 아노머 구성을 확인하기 위해서, 올리고당에 대해서 효소적 분석을 수행하고, 예를 들어, 특정 유형의 연결에 특이적인 효소, 예를 들어 베타-갈락토시다제, 또는 알파-글루코시다제 등과 접촉되고, NMR을 사용해 생산물을 분석할 수 있다.
본 명세서에 기술된 바와 같은 분리되고, 바람직하게 또한 정제된, 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 갖는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물은 식품 (예를 들어, 인간 식품 또는 사류), 식이 보충물, 약학 성분, 미용 성분 또는 의약품에 혼합된다. 일부 구현예에서, 올리고당 또는 올리고당 혼합물은 식품, 사료, 식이 보충물, 약학 성분, 미용 성분 또는 의약품에 적합한 하나 이상의 성분과 혼합된다.
일부 구현예에서, 식이 보충물은 적어도 하나의 프리바이오틱 성분 및/또는 적어도 하나의 프로바이오틱 성분을 포함한다.
"프리바이오틱"은 숙주에 유익한 미생물, 특히 위장관의 미생물의 성장을 촉진하는 물질이다. 일부 구현예에서, 식이 보충물은 하나 이상의 유익한 미생물의 성장을 촉진하기 위해서, 본 명세서에 개시된 방법으로 생산 및/또는 정제된 프리바이오틱인 올리고당 또는 올리고당 혼합물을 포함하는, 다수의 프리바이오틱을 제공한다. 식이 보충물을 위한 프리바이오틱 성분의 예는 다른 프리바이오틱 분자 (예컨대, HMO) 및 식물 다당류 (예컨대, 이눌린, 펙틴, b-글루칸 및 자일로올리고당)를 포함한다. "프로바이오틱" 생산물은 전형적으로 수용자의 이익을 위해서, 위장관 미생물총에 첨가되거나 또는 대체되는 살아있는 미생물을 함유한다. 이러한 미생물의 예는 락토바실러스 (Lactobacillus) 종 (예를 들어, 엘. 악시도필루스 (L. acidophilus) 및 엘. 불가리쿠스 (L. bulgaricus)), 비피도박테리움 종 (예를 들어, 비. 아니말리스 (B. animalis), 비. 롱검 (B. longum) 및 비. 인판티스 (B. Infantis) (예를 들어, Bi-26)), 및 사카로마이세스 보울라르디 (Saccharomyces boulardii)를 포함한다. 일부 구현예에서, 본 명세서의 방법으로 생산 및/또는 정제된 올리고당 또는 올리고당 혼합물은 이러한 미생물과 조합하여 경구로 투여된다.
식이 보충물을 위한 추가 성분의 예는 이당류 (예컨대, 락토스), 단당류 (예컨대, 글루코스 및 갈락토스), 증점제 (예컨대, 검 아라빅), 산도 조절제 (예컨대, 트리소듐 시트레이트), 물, 탈지유, 및 풍미제를 포함한다.
일부 구현예에서, 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물은 인간 이유식 (예를 들어, 영아용 조제식)에 혼입된다. 영아용 조제식은 일반적으로 인간 모유에 대한 완전 또는 부분 대체물로서 영아에게 먹이기 위해 제조된 식품이다. 일부 구현예에서, 영아용 조제식은 분말로서 판매되고, 물과 혼합하여 영아에게 젖병 또는 컵으로 먹이기 위해 제조된다. 영아용 조제식의 조성물은 전형적으로 인간 모유를 대략적으로 모방하도록 디자인된다. 일부 구현예에서, 본 명세서의 방법으로 생산 및/또는 정제된 올리고당 또는 올리고당 혼합물은 인간 모유의 올리고당이 제공하는 것과 유사한 영양적 이득을 제공하기 위해 영아용 조제식에 포함된다. 일부 구현예에서, 올리고당 또는 올리고당 혼합물은 아용 조제식의 하나 이상의 성분과 혼합된다. 영아용 조제식 성분의 예는 무지방유, 탄수화물 공급원 (예를 들어, 락토스), 단백질 공급원 (예를 들어, 농축 유청 단백질 및 카세인), 지방 공급원 (예를 들어, 식물성 오일 - 예컨대, 야자유, 고올레산 홍화유, 유채씨유, 코코넛유 및/또는 해바라기유; 및 어유), 비타민 (예컨대, 비타민 A, Bb, Bi2, C 및 D), 미네랄 (예컨대, 포타슘 시트레이트, 칼슘 시트레이트, 마그네슘 클로라이드, 소듐 클로라이드, 소듐 시트레이트 및 칼슘 포스페이트) 및 가능하게 인간 모유 올리고당 (HMO)을 포함한다. 이러한 HMO는 예를 들어, DiFL, 락토-N-트리오스 II, LNT, LNnT, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스, 락토-N-푸코펜타오스 II, 락토-N- 푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 6'-갈락토실락토스, 3'-갈락토실락토스, 락토-N-헥사오스 및 락토- N-네오헥사오스를 포함할 수 있다.
일부 구현예에서, 하나 이상의 영아용 조제식 성분은 무지방유, 탄수화물 공급원, 단백질 공급원, 지방 공급원, 및/또는 비타민 및 미네랄을 포함한다.
일부 구현예에서, 하나 이상의 영아용 조제식 성분은 락토스, 농축 유청 단백질 및/또는 고올레산 홍화유를 포함한다.
일부 구현예에서, 영아용 조제식 중 올리고당 또는 올리고당 혼합물의 농도는 일반적으로 인간 모유에 존재하는 올리고당의 농도와 대략 동일한 농도이다.
일부 구현예에서, 올리고당 또는 올리고당 혼합물은 사료 조제물에 혼힙되고, 상기 사료는 반려 동물, 사료, 동물 우유 대체제, 수의학 제품, 이유후 사료, 또는 이유기 보조 사료를 포함하는 목록으로부터 선택된다.
본 명세서의 실시예에 표시되는 바와 같이, 본 발명의 방법 및 세포는
동일한 유전적 배경을 갖지만 이종성 막 단백질의 발현 또는 내생성 막 단백질의 조절된 발현이 결여된 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물에 대한 생산 균주와 비교했을 때, 본 명세서에 정의된 바와 같은 막 단백질을 사용할 때 하기의 놀라운 장점 중 적어도 하나를 제공한다:
- 코어 삼당류로서 LN3을 갖는 올리고당의 더 나은 적정가 (증강) (g/L),
- 더 나은 생산율 r (g 올리고당 / L/h),
- 더 나은 세포 성능 지수 CPI (g 올리고당 / g X),
- 더 나은 비생산성 Qp (g 올리고당 /g X /h),
- 수크로스에 대한 더 나은 수율 Ys (g 올리고당 / g 수크로스),
- 더 나은 수크로스 흡수/전환율 Qs (g 수크로스 / g X /h),
- 더 나은 락토스 전환/소비율 rs (g 락토스/h),
- 코어 삼당류로서 LN3을 갖는 올리고당의 증강된 분비, 및/또는
- 생산 숙주의 증강된 성장 속도.
본 문맥에서, "X"는 생물량을 의미하고, "g"은 그램을 의미하고, "L"은 리터를 의미하고, "h"는 시간을 의미한다. 상기 "g 올리고당"은 전체 액체배지 및/또는 상청액에서 측정될 수 있다.
바람직하게, 본 발명의 방법 및 세포는 동일한 유전적 배경을 갖지만 이종성 막 단백질의 발현 또는 내생성 막 단백질의 조절된 발현이 결여된 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물에 대한 생산 숙주와 비교했을 때 본 명세서에 정의된 바와 같은 막 단백질을 사용할 때 하기의 놀라운 장점 중 적어도 하나를 제공한다:
- 코어 삼당류로서 LN3을 갖는 올리고당의 더 나은 적정가 (증강) (g/L),
- 더 나은 생산율 r (g 올리고당 / L/h),
- 더 나은 세포 성능 지수 CPI (g 올리고당 / g X),
- 더 나은 비생산성 Qp (g 올리고당 /g X /h),
- 수크로스에 대한 더 나은 수율 Ys (g 올리고당 / g 수크로스),
- 더 나은 수크로스 흡수/전환율 Qs (g 수크로스 / g X /h),
- 더 나은 락토스 전환/소비율 rs (g 락토스/h), 및/또는
- 코어 삼당류로서 LN3을 갖는 올리고당의 증강된 분비.
또한, 본 발명은 하기 특정 구현예에 관한 것이다:
1. 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당의 생산을 위해 유전자 변형된 숙주 세포로서, 숙주 세포는 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제에 대한 적어도 하나의 핵산 서열을 포함하고 발현하고,
- 상기 세포는 i) 내생성 막 단백질의 과발현 및/또는 ii) 이종성 막 단백질의 발현을 더 포함하여 a) 개선된 생산, 및/또는 b) 코어 삼당류로서 LN3을 포함하는 올리고당의 가능하고/하거나 증강된 유출을 제공하고,
- 바람직하게 상기 세포는 상기 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열을 더 포함하고 발현한다.
2. 구현예 1에 따른 세포에 있어서, 상기 막 단백질은 운송체, P-P-결합-가수분해-구동 수송체, 및 β-배럴 포린의 군으로부터 선택되고,
a) 상기 막 단백질이 운송체의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1 및 2.A.66의 군, 또는
- eggnog 패밀리 05E8G, 05EGZ, 05JHE, 07QF7 07QRN, 07RBJ, 0814C 및 08N8A의 군,
- PFAM 목록 PF00893, PF01943, PF05977, PF07690 및 PF13347, 또는
- interpro 목록 IPR000390, IPR001411, IPR001927, IPR002797, IPR004638, IPR005829, IPR010290, IPR011701, IPR020846, IPR023721, IPR023722, IPR032896, IPR036259 및 IPR039672, 또는
- SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA 또는 SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열
로부터 선택되거나;
b) 상기 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 3.A.1.1 및 3.A.1.2의 군, 또는
- eggnog 패밀리 05CJ1, 05DFW, 05EZD, 05I1K, 07HR3 및 08IJ9의 군, 또는
- PFAM 목록 PF00005, PF00528, PF13407 및 PF17912, 또는
- interpro 목록 IPR000515, IPR003439, IPR003593, IPR005978, IPR008995, IPR013456, IPR015851, IPR017871, IPR025997, IPR027417, IPR028082, IPR035906, 및 IPR040582, 또는
- SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열
로부터 선택되거나; 또는
c) 상기 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 1.B.18, 또는
- eggnog 패밀리 05DAY, 또는
- PFAM 목록 PF02563, PF10531 및 PF18412, 또는
- interpro 목록 IPR003715, IPR019554 및 IPR040716, 또는
- SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza 또는 이의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열
로부터 선택되고;
TCDB 클래스는 2019년 6월 17일 배포된 TCDB.org 에 의해 정의되는 바와 같고, eggnog 패밀리는 2016년 9월 배포된 eggnogdb 4.5.1에 의해 정의되는 바와 같고, PFAM 목록은 2018년 9월에 배포된 Pfam 32.0에 의해 정의되는 바와 같고, interpro 목록은 2019년 7월 4일 배포된 InterPro 75.0에 의해 정의되는 바와 같다.
3. 구현예 1 또는 2 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) 운송체 막 단백질로서 SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA 또는 SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열; 및
b) P-P-결합-가수분해-구동 수송체로서 SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열; 및
c) β-배럴 포린 막 단백질로서 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 상기 Wza 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열.
4. 구현예 1 내지 3 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 세포벽의 외막을 가로지르는 화합물의 수송에 관여되는 수송체 단백질이다.
5. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,
바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제 중 적어도 하나의 발현 또는 활성이 변형된다.
6. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당은 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-푸코펜타오스 VI, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라-락토-N-헥사오스 (pLNnH), 파라-락토-N-네오헥사오스 (pLNH), 디푸코실-락토-N-헥사오스, 디푸코실-락토-N-네오헥사오스, 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 시알릴-락토-N-테트라오스 a, 시알릴-락토-N-테트라오스 b, 시알릴-락토-N-테트라오스 c, 시알릴-락토-N-테트라오스 d를 포함하는 목록으로부터 선택된다.
7. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 베타-1,3 또는 베타-1,4 연결로 LN3의 말단 GlcNAc 잔기로 UDP-Gal 도너로부터 갈락토스 (Gal)를 전달하여서, 각각 락토-N-테트라오스 (LNT; Gal-베타1,3-GlcNAc-베타1,3-Gal-베타1,4-Glc) 또는 락토-N-네오테트라오스 (LNnT; Gal-베타1,4-GlcNAc-베타1,3-Gal-베타1,4-Glc)를 생산하는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제이다.
8. 구현예 7에 따른 세포에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 90 g/L 이상의 LNT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다.
9. 구현예 7에 따른 세포에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 90 g/L 이상의 LNnT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNnT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다.
10. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당의 생산에서 사용하려는 뉴클레오티드-활성화된 당을 추가로 합성할 수 있다.
11. 구현예 10에 따른 세포에 있어서, 상기 뉴클레오티드-활성화된 당은 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택된다.
12. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 세포는 적어도 부분적으로 불활성화된 선택된 단당류, 이당류 또는 올리고당에 대한 이화 경로를 포함하고, 단당류, 이당류, 또는 올리고당는 코어 삼당류로서 LN3을 포함하는 올리고당의 합성에 관여되고/되거나 필요하다.
13. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체를 사용한다.
14. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체의 흡수에 관여된다.
15. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체를 생산한다.
16. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 세포는 배지에서 안정하게 배양된다.
17. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 미생물, 식물, 또는 동물 세포로 이루어진 군으로부터 선택되고, 바람직하게 상기 미생물은 박테리아, 진균 또는 효모이고, 바람직하게 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 행운목이고, 바람직하게 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물이다.
18. 구현예 17에 따른 세포에 있어서, 상기 세포는 박테리아, 바람직하게 에스케리치아 콜라이 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이 균주의 세포이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655이다.
19. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 LN3을 포함하는 상기 올리고당은 포유동물 모유 올리고당 또는 루이스-유형 항원 올리고당이다.
20. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 세포는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물을 합성할 수 있다.
21. 유전자 조작된 세포에 의한 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당의 제조를 위한 방법으로서, 하기 단계를 포함한다:
a) 구현예 1 내지 20 중 어느 하나에 따른 세포를 제공하는 단계, 및
b) 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 생산을 허용하는 조건 하에 배지에서 세포를 배양하는 단계,
c) 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 배양으로부터 분리시키는 단계.
22. 구현예 21에 따른 방법에 있어서, 방법은 하기 단계 중 적어도 하나를 더 포함한다:
i) 배양 배지에 초기 반응기 부피의 리터 당 적어도 50, 보다 바람직하게 적어도 75, 보다 바람직하게 적어도 100, 보다 바람직하게 적어도 120, 보다 바람직하게 적어도 150 그램을 포함하는 락토스 공급물을, 바람직하게 연속 방식으로, 바람직하게 배양 배지의 최종 부피가 상기 락토스 공급물의 첨가 전 배양 배지의 부피의 3배 이하, 바람직하게 2배 이하, 보다 바람직하게 2배 미만이도록 첨가하는 단계로서, 반응기 부피는 250 mL 내지 10.000 m3 (입방 미터) 범위인 단계;
ii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해 첨가하는 단계;
iii)
락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해 첨가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게 75 g/L, 보다 바람직하게 100 g/L, 보다 바람직하게 125 g/L, 보다 바람직하게 150 g/L, 보다 바람직하게 175 g/L, 보다 바람직하게 200 g/L, 보다 바람직하게 225 g/L, 보다 바람직하게 250 g/L, 보다 바람직하게 275 g/L, 보다 바람직하게 300 g/L, 보다 바람직하게 325 g/L, 보다 바람직하게 350 g/L, 보다 바람직하게 375 g/L, 보다 바람직하게, 400 g/L, 보다 바람직하게 450 g/L, 보다 바람직하게 500 g/L, 보다 더 바람직하게, 550 g/L, 가장 바람직하게 600 g/L 이고; 바람직하게 상기 용액의 pH는 3과 7 사이로 설정되고, 바람직하게 상기 공급 용액의 온도는 20℃와 80℃ 사이로 유지되는 것인 단계;
상기 방법은 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게 적어도 75 g/L, 보다 바람직하게 적어도 90 g/L, 보다 바람직하게 적어도 100 g/L, 보다 바람직하게 적어도 125 g/L, 보다 바람직하게 적어도 150 g/L, 보다 바람직하게 적어도 175 g/L, 보다 바람직하게 적어도 200 g/L의 농도로 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 생성시킨다.
23. 구현예 22에 따른 방법에 있어서, 락토스 공급은 락토스를 배양 시작부터, 적어도 5 mM의 농도, 바람직하게 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 보다 바람직하게 > 300 mM의 농도로 첨가하여 수행된다.
24. 구현예 22 또는 23 중 어느 하나에 따른 방법에 있어서, 상기 락토스 공급은, 배양의 생산 단계 전반에서, 적어도 5 mM, 바람직하게 10 mM 또는 30 mM의 락토스 농도가 수득되는, 농도로 배양 배지에 락토스를 첨가하여 수행된다.
25. 구현예 21 내지 24 중 어느 하나에 따른 방법에 있어서, 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안 또는 연속 방식으로 배양된다.
26.
구현예 21 내지 25 중 어느 하나에 따른 방법에 있어서, 탄소 및 에너지 공급원, 바람직하게 글루코스, 글리세롤, 프룩토스, 말토스, 아라비노스, 말토덱스트린, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 폴리올, 옥수수 침지액, 고-프룩토스 시럽, 숙시네이트, 말레이트, 아세테이트, 시트레이트, 락테이트 및 피루베이트가 또한, 바람직하게 연속적으로, 배양 배지에, 바람직하게 락토스와 첨가된다.
27. 구현예 21 내지 26 중 어느 하나에 따른 방법에 있어서, 지수적 세포 성장의 제1 단계는 락토스가 제2 단계에서 배양 배지에 첨가되기 전에, 탄소-기반 기질, 바람직하게 글루코스 또는 수크로스를 배양 배지에 첨가하여 제공된다.
28. 구현예 21 내지 27 중 어느 하나에 따른 방법에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함한다: 청징화, 한외여과, 나노여과, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피.
29. 구현예 21 내지 28 중 어느 하나에 따른 방법에 있어서, 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 상기 세포로부터 정제하는 단계를 더 포함한다.
30. 구현예 21 내지 29 중 어느 하나에 따른 방법에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함한다: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과 또는 이온 교환, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조 또는 동결건조.
31. 코어 삼당류로서 LN3을 포함하는 올리고당의 발효적 생산에서 구현예 1 내지 4 중 어느 하나에 정의된 바와 같은 막 단백질의 군으로부터 선택되는 막 단백질의 용도.
32. 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 구현예 1 내지 19 중 어느 하나에 따른 세포의 용도.
33. 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물의 생산을 위한 구현예 20에 따른 세포의 용도.
34. 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 구현예 21 내지 30 중 어느 하나에 따른 방법의 용도.
또한, 본 발명은 하기 바람직한 특정 구현예와 관련된다:
1. 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당의 생산을 위해 유전자 변형된 숙주 세포로서, 숙주 세포는 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제에 대한 적어도 하나의 핵산 서열을 포함하고, 발현하며,
- 상기 세포는 i) 내생성 막 단백질의 과발현 및/또는 ii) 이종성 막 단백질의 발현을 더 포함하여서 코어 삼당류로서 LN3을 포함하는 올리고당의 a) 개선된 생산, 및/또는 b) 가능하고/하거나 증강된 유출을 제공하고, 바람직하게 상기 개선된 생산 및 상기 증강된 유출은 동일한 유전적 배경을 갖지만 내생성 막 단백질의 상기 과발현 및 이종성 막 단백질의 상기 발현이 결여된 숙주 세포와 비교되고,
- 바람직하게 상기 세포는 상기 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열을 더 포함하고 발현하며,
임의로 상기 개선된 생산은
- 상기 올리고당의 더 나은 적정가 (리터 당 그램 올리고당),
- 더 나은 생산율 r (시간 당 리터 당 그램 올리고당),
- 더 나은 세포 성능 지수 (그램 생물량 당 그램 올리고당),
- 더 나은 비생산성 (시간 당 그램 생물량 당 그램 올리고당),
- 수크로스에 대한 더 나은 수율 (그램 수크로스 당 그램 올리고당), 및/또는
- 더 나은 수크로스 흡수/전환율 (시간 당 그램 당 그램 수크로스),
- 더 나은 락토스 전환/소비율 (시간 당 그램 락토스), 및/또는
- 숙주 세포의 증강된 성장 속도
를 포함한다.
2. 제1항에 따른 세포에 있어서, 상기 막 단백질은 운송체, P-P-결합-가수분해-구동 수송체, 및 β-배럴 포린의 군으로부터 선택되고,
a) 상기 막 단백질이 운송체의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1 및 2.A.66의 군, 또는
- eggnog 패밀리 05E8G, 05EGZ, 05JHE, 07QF7 07QRN, 07RBJ, 0814C 및 08N8A의 군, 또는
- PFAM 목록 PF00893, PF01943, PF05977, PF07690 및 PF13347, 또는
- interpro 목록 IPR000390, IPR001411, IPR001927, IPR002797, IPR004638, IPR005829, IPR010290, IPR011701, IPR020846, IPR023721, IPR023722, IPR032896, IPR036259 및 IPR039672, 또는
- SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 살라마에 (Salamae) 유래 MdfA 또는 SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해서 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
로부터 선택되거나;
b) 상기 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 3.A.1.1 및 3.A.1.2의 군, 또는
- eggnog 패밀리 05CJ1, 05DFW, 05EZD, 05I1K, 07HR3 및 08IJ9의 군, 또는
- PFAM 목록 PF00005, PF00528, PF13407 및 PF17912, 또는
- interpro 목록 IPR000515, IPR003439, IPR003593, IPR005978, IPR008995, IPR013456, IPR015851, IPR017871, IPR025997, IPR027417, IPR028082, IPR035906, 및 IPR040582, 또는
- SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
로부터 선택되거나; 또는
c) 상기 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 1.B.18, 또는
- eggnog 패밀리 05DAY, 또는
- PFAM 목록 PF02563, PF10531 및 PF18412, 또는
- interpro 목록 IPR003715, IPR019554 및 IPR040716, 또는
- SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
로부터 선택되고;
TCDB 클래스는 2019년 6월 17일 배포된 TCDB.org 에 의해 정의되는 바와 같고, eggnog 패밀리는 2016년 9월 배포된 eggnogdb 4.5.1에 의해 정의되는 바와 같고, PFAM 목록은 2018년 9월에 배포된 Pfam 32.0에 의해 정의되는 바와 같고, interpro 목록은 2019년 7월 4일 배포된 InterPro 75.0에 의해 정의되는 바와 같다.
3. 제1항 또는 제2항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) 운송체 막 단백질로서 SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 살라마에 (Salamae) 유래 MdfA 또는 SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해서 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) P-P-결합-가수분해-구동 수송체로서 SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) β-배럴 포린 막 단백질로서 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 상기 Wza 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
4. 제1항 내지 제3항 중 어느 하나의 항에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
5. 제1항 내지 제4항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
- 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
- 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69를 갖는 상기 막 단백질의 ㅈ언체 길이 서열에 대해 적어도 90% 서열 동일성,
- 각각 SEQ ID NO 05, 06, 56, 57 또는 68을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 95.00% 서열 동일성, 또는
- 각각 SEQ ID NO 58, 60 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 99.00% 서열 동일성
을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열, 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
6. 제1항 내지 제4항 중 어느 하나의 항에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
7. 제1항 내지 제4항 또는 제6항 중 어느 하나의 항에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
8. 제1항 내지 제3항 중 어느 하나의 항에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어지는 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
9. 제1항 내지 제3항 또는 제8항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
10. 제1항 내지 제3항, 제8항 또는 제9항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
- 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
- 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90% 서열 동일성,
- 각각 SEQ ID NO 05, 06, 56 또는 57을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 95.00% 서열 동일성, 또는
- 각각 SEQ ID NO 58 또는 60을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 99.00% 서열 동일성
을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
11. 제1항 내지 제3항, 제8항 또는 제9항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
12. 제1항 내지 제3항, 제8항, 제9항 또는 제11항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
13. 제1항 내지 제12항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 세포벽의 외막에 걸쳐 화합물의 수송에 관여되는 수송체 단백질이다.
14. 제1항 내지 제13항 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,
바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제 중 적어도 하나의 발현 또는 활성이 변형된다.
15. 제1항 내지 제14항 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당은 포유동물 모유 올리고당 또는 루이스-유형 항원 올리고당이다.
16. 제1항 내지 제15항 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당은 포유동물 모유 올리고당 (MMO), 바람직하게 인간 모유 올리고당 (HMO), 보다 바람직하게 코어 사당류로서 LNT 또는 LNnT를 갖는 MMO 또는 HMO, 보다 더 바람직하게 코어 사당류로서 LNT 또는 LNnT를 갖는 HMO, 가장 바람직하게 LNT 또는 LNnT이다.
17. 제1항 내지 제16항 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당은 중성 올리고당이다.
18. 제1항 내지 제17항 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당은 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-푸코펜타오스 VI, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라-락토-N-헥사오스 (pLNnH), 파라-락토-N-네오헥사오스 (pLNH), 디푸코실-락토-N-헥사오스, 디푸코실-락토-N-네오헥사오스, 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 시알릴-락토-N-테트라오스 a, 시알릴-락토-N-테트라오스 b, 시알릴-락토-N-테트라오스 c, 시알릴-락토-N-테트라오스 d를 포함하는 목록으로부터 선택된다.
19. 제1항 내지 제18항 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 베타-1,3 또는 베타-1,4 연결로 LN3의 말단 GlcNAc 잔기로 UDP-Gal 도너로부터 갈락토스 (Gal)를 전달하여서, 각각 락토-N-테트라오스 (LNT; Gal-베타1,3-GlcNAc-베타1,3-Gal-베타1,4-Glc) 또는 락토-N-네오테트라오스 (LNnT; Gal-베타1,4-GlcNAc-베타1,3-Gal-베타1,4-Glc)를 생산하는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제이다.
20. 제19항에 따른 세포에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 90 g/L 이상의 LNT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다.
21. 제19항에 따른 세포에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 70 g/L 이상, 바람직하게 90 g/L 이상의 LNnT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNnT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다.
22. 제1항 내지 제12항 중 어느 하나의 항에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당의 생산에서 사용되는 뉴클레오티드-활성화된 당을 추가로 합성할 수 있다.
23. 제22항에 따른 세포에 있어서, 상기 뉴클레오티드-활성화된 당은 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택된다.
24. 제1항 내지 제23항 중 어느 하나에 따른 세포에 있어서, 세포는 적어도 부분적으로 불활성화된 선택된 단당류, 이당류 또는 올리고당에 대한 이화 경로를 포함하고, 단당류, 이당류, 또는 올리고당은 코어 삼당류로서 LN3을 포함하는 올리고당의 합성에 관여되고/되거나 필요한 것이다.
25. 제1항 내지 제24항 중 어느 하나에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체를 사용한다.
26. 제1항 내지 제25항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체의 흡수에 관여된다.
27. 제1항 내지 제26항 중 어느 하나에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체를 생산한다.
28. 제1항 내지 제27항 중 어느 하나에 따른 세포에 있어서, 세포는 배지에서 안정하게 배양된다.
29. 제1항 내지 제28항 중 어느 하나에 따른 세포에 있어서, 상기 세포는 미생물, 식물 세포, 동물 세포, 곤충 세포 또는 원충 세포이고, 바람직하게
- 상기 미생물은 박테리아, 진균 또는 효모이고,
- 상기 식물 세포는 담배, 알파파, 벼, 목화, 유채, 대두, 옥수수 또는 곡물, 및/또는 세포이고,
- 상기 동물 세포는 비-인간 포유동물, 조류, 어류, 무척추동물, 파충류, 또는 양서류로부터 유래되거나, 또는 상기 동물 세포는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주이다.
30. 제29항에 따른 세포에 있어서, 상기 세포는 박테리아, 바람직하게 에스케리치아 콜라이 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이 균주의 세포이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655이다.
31. 제1항 내지 제30항 중 어느 하나에 따른 세포에 있어서, 세포는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물을 합성할 수 있다.
32. 유전자 조작된 세포에 의해서 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 제조하기 위한 방법으로서, 하기 단계를 포함한다:
a) 제1항 내지 제31항 중 어느 하나에 따른 세포를 제공하는 단계, 및
b) 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 생산을 허용하는 조건 하에 배지에서 세포를 배양하는 단계, 및
c) 바람직하게 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 배양으로부터 분리시키는 단계.
33. 제32항에 따른 방법에 있어서, 방법은 하기 단계 중 적어도 하나를 더 포함한다:
i) 배양 배지에 초기 반응기 부피의 리터 당 적어도 50, 보다 바람직하게 적어도 75, 보다 바람직하게 적어도 100, 보다 바람직하게 적어도 120, 보다 바람직하게 적어도 150 그램의 락토스를 포함하는 락토스 공급물을, 바람직하게 연속 방식으로, 바람직하게 배양 배지의 최종 부피가 상기 락토스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게 2배 이하, 보다 바람직하게 2배 미만이 되도록 첨가하는 단계로서, 반응기 부피는 250 mL 내지 10.000 m3 (입방 미터) 범위인 단계;
ii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해서 첨가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해서 첨가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게 75 g/L, 보다 바람직하게 100 g/L, 보다 바람직하게 125 g/L, 보다 바람직하게 150 g/L, 보다 바람직하게 175 g/L, 보다 바람직하게 200 g/L, 보다 바람직하게 225 g/L, 보다 바람직하게 250 g/L, 보다 바람직하게 275 g/L, 보다 바람직하게 300 g/L, 보다 바람직하게 325 g/L, 보다 바람직하게 350 g/L, 보다 바람직하게 375 g/L, 보다 바람직하게, 400 g/L, 보다 바람직하게 450 g/L, 보다 바람직하게 500 g/L, 보다 더 바람직하게, 550 g/L, 가장 바람직하게 600 g/L이고; 바람직하게 상기 용액의 pH는 3과 7 사이로 설정되고, 바람직하게 상기 공급 용액의 온도는 20℃와 80℃ 사이로 유지되는 것인 단계;
상기 방법은 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게 적어도 75 g/L, 보다 바람직하게 적어도 90 g/L, 보다 바람직하게 적어도 100 g/L, 보다 바람직하게 적어도 125 g/L, 보다 바람직하게 적어도 150 g/L, 보다 바람직하게 적어도 175 g/L, 보다 바람직하게 적어도 200 g/L의 농도로 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 생성시킨다.
34. 제33항에 따른 방법에 있어서, 락토스 공급물은 배양의 시작부터 락토스를 적어도 5 mM의 농도, 바람직하게 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 보다 바람직하게 > 300 mM의 농도로 첨가하여 수행된다.
35.
제33항 또는 제34항에 따른 방법에 있어서, 상기 락토스 공급물은 배양의 생산 단계 전반에서, 적어도 5 mM, 바람직하게 10 mM 또는 30 mM의 락토스 농도가 수득되는, 농도로 배양 배지에 락토스를 첨가하여 수행된다.
36. 제32항 내지 제35항 중 어느 하나에 따른 방법에 있어서, 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안 또는 연속 방식으로 배양된다.
37. 제32항 내지 제36항 중 어느 하나에 따른 방법에 있어서, 탄소 및 에너지 공급원, 바람직하게 글루코스, 글리세롤, 프룩토스, 말토스, 아라비노스, 말토덱스트린, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 폴리올, 옥수수 침지액, 고-프룩토스 시럽, 숙시네이트, 말레이트, 아세테이트, 시트레이트, 락테이트 및 피루베이트가 또한 바람직하게 연속으로 배양 배지에 바람직하게 락토스와 첨가된다.
38. 제32항 내지 제37항 중 어느 하나에 따른 방법에 있어서, 지수적 세포 성장의 제1 단계는 락토스가 제2 단계에서 배양 배지에 첨가되기 전에 탄소-기반 기질, 바람직하게 글루코스 또는 수크로스를 배양 배지에 첨가하여 제공된다.
39. 제32항 내지 제38항 중 어느 하나에 따른 방법에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함한다: 청징화, 한외여과, 나노여과, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피.
40. 제32항 내지 제39항 중 어느 하나에 따른 방법에 있어서, 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 상기 세포로부터 정제하는 단계를 더 포함한다.
41. 제32항 내지 제40항 중 어느 하나에 따른 방법에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함한다: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과 또는 이온 교환, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조 또는 동결건조.
42. 코어 삼당류로서 LN3을 포함하는 올리고당의 발효적 생산에서 제1항 내지 제12항 중 어느 하나에 정의된 바와 같은 막 단백질의 군으로부터 선택되는 막 단백질의 용도.
43. 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 제1항 내지 제31항 중 어느 하나에 따른 세포의 용도.
44. 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물의 생산을 위한 제31항에 따른 세포의 용도.
45. 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 제32항 내지 제41항 중 어느 하나에 따른 방법의 용도.
본 발명은 실시예에서 보다 상세히 기술될 것이다. 실시예는 본 발명의 추가 예시 및 설명으로서 제공되고 제한하려는 의도가 아니다.
실시예
실시예 1. 막 단백질 패밀리의 확인
HMM은 프로파일 은닉 마코프 (Markov) 모델이라고 불리는 확률 모델이다. 이것은 위치-특이적 채점 시스템으로 정렬된 단백질 세트를 특징화시킨다. 아미노산은 그들이 발생되는 빈도에 따라서 서열 정렬의 각 위치에서 점수를 제공한다 (Eddy, S.R.1998. Profile hidden Markov models. Bioinformatics. 14: 755-63). HMM은 Pfam, InterPro, SMART, TIGRFAM, PIRSF, PANTHER, SFLD, Superfamily 및 유전자3D를 포함하는, 이러한 단백질 분류 방법을 사용하는 수많은 데이터베이스로부터 분명한 바와 같이 광범위한 유용성을 갖는다.
2019년 6월 13일 배포된 HMMER package 3.2.1의 HMMsearch (http://hmmer.org/)는 서열 상동성에 대해 서열 데이터베이스를 검색하기 위해 이러한 HMM을 사용할 수 있다. 사용할 수 있는 서열 데이터베이스는 예를 들어, NCBI nr 단백질 데이터베이스 (NR; https://www.ncbi.nlm.nih.gov/protein), UniProt Knowledgebase (UniProtKB, https://www.uniprot.org/help/uniprotkb) 및 SWISS-PROT 데이터베이스 (https://web.expasy.org/docs/swiss-prot_guideline.html)이지만, 이에 제한되지 않는다.
막 단백질 패밀리는 2016년 9월에 배포된 eggNOG 데이터베이스 4.5.1 (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6324079/; http://eggnog.embl.de/#/app/home), 2019년 6월 17일 배포된 TCDB 데이터베이스 (http://www.tcdb.org/public/tcdb), 2019년 7월 4일 배포된 InterPro 75.0 (https://www.ebi.ac.uk/interpro/) 및 2018년 9월 배포된 Pfam 32.0를 사용하는 PFAM 도메인 (https://pfam.xfam.org/)을 기반으로 분류되었다. eggNOG 데이터베이스는 오솔로그 관계, 유전자 진화 이력 및 기능 주석의 공공 데이터베이스이다. 수송체 분류 데이터베이스 (Transporter Classification DataBase) (TCDB)는 효소 분류를 위한 효소 위원회 (Enzyme Commission)(EC) 체계와 유사하고 기능 및 계통발생적 정보 둘 모두를 통합한다. Pfam 및 InterPro 데이터베이스는 단백질 패밀리의 거대 컬렉션이다. 다른 단백질 도메인 예컨대 SMART (http://smart.embl-heidelberg.de/), TIGRFAM (https://www.jcvi.org/tigrfams), PIRSF (https://proteininformationresource.org/pirwww/dbinfo/pirsf.shtml), PANTHER (http://pantherdb.org/), SFLD (http://sfld.rbvi.ucsf.edu/archive/django/index.html), Superfamily (http://supfam.org/) 및 Gene3D (http://gene3d.biochem.ucl.ac.uk/Gene3D/), NCBI 보존 도메인 (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)이 또한 사용될 수 있다.
eggNOG 패밀리의 확인은 2017년 11월 15일에 배포된 eggNOG-mapper 1.0.3 ( https://github.com/eggnogdb/eggnog-mapper)의 독립 형태를 사용하고 2016년 9월 배포된 eggnogdb 4.5.1을 기반으로 수행되었다. eggNOG 패밀리 각각 경우에, HMM은 eggNOG 웹사이트에서 다운로드할 수 있고, 단백질 데이터베이스에서 HMMsearch를 위해 사용될 수 있다.
TCDB 패밀리의 확인은 2019년 6월 17일에 배포된 TCDB 데이터베이스에서 블라스팅 (blastp)하여 수행되었다. 수득된 패밀리의 새로운 구성원은 웹사이트 (http://www.tcdb.org/download.php)에서 검색될 수 있다. Fasta 파일이 단백질 데이터베이스에 대한 blstp의 입력으로서 사용될 수 있다.
PFAM 도메인의 확인은 2018년 9월에 배포된 https://pfam.xfam.org/search#tabview=tab1 상에서의 온라인 검색을 통해 수행되었다. 수득된 패밀리에 대한 HMM은 'Curation & model'에서 다운로드하였다. 단백질 데이터베이스에 대해 이 모델을 사용한 HMMsearch는 새로운 패밀리 구성원을 확인하게 된다. InterPro 히트를 포함하는 서열은 또한 PFAM 웹사이트로부터 다운로드될 수 있다.
InterPro (수퍼)패밀리, 도메인 및 사이트의 확인은 https://www.ebi.ac.uk/interpro/ 상의 온라인 도구 또는 InterProScan (https://www.ebi.ac.uk/interpro/download.html)의 독립 형태를 사용하여 수행되었고, 둘 모두는 2019년 7월 4일 배포된 InterPro 75.0을 기반으로 한다. InterPro는 단백질 모티프 및 도메인의 많은 데이터베이스의 정보를 조합하는 복합 데이터베이스이다. InterPro 도메인 및/또는 (수퍼)패밀리의 HMM은 InterProScan에서 수득될 수 있고, 단백질 데이터베이스에서 새로운 패밀리 구성원을 확인하는데 사용될 수 있다. InterPro 히트를 포함하는 서열은 또한 InterPro 웹사이트 ('Protein Matched')로부터 다운로드할 수 있거나 또는 UniProt 웹사이트 (https://www.uniprot.org)에서 문의할 수 있다.
실시예 2: 폴리펩티드 서열 간 동일성 백분율의 계산
비교를 위한 서열의 정렬 방법은 당분야에 충분히 공지되어 있고, 이러한 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치 개수를 최대화하고 갭의 개수를 최소화하는 2개 서열의 전체 (즉, 전체 길이 서열 포괄) 정렬을 찾기 위해서 Needleman and Wunsch의 알고리즘 (J. Mol. Biol. (1970) 48: 443-453)을 사용한다. BLAST 알고리즘 (Altschul et al., J. Mol. Biol. (1990) 215: 403-10)은 전체 서열 동일성 백분율 (즉, 전체 길이 서열에 대함)을 계산하고, 2개 서열 간 유사성의 통계적 분석을 수행한다. BLAST 분석을 수행하기 위한 소프트웨어는 NCBI를 통해 공공으로 입수가능하다. 상동체는 예를 들어 디폴트 쌍별 정렬 매개변수, 및 백분율 채점 방법을 사용하는, 예를 들어, ClustalW 다중 서열 정렬 알고리즘 (version 1.83)을 사용해 쉽게 확인할 수 있다. 유사성 및 동일성의 전체 백분율 (즉, 전체 길이 서열 포괄됨)은 또한 MatGAT 소프트웨어 패키지 (Campanella et al., BMC Bioinformatics (2003) 4:29)에서 입수가능한 방법 중 하나를 사용해 결정될 수 있다. 당업자에게 자명한 바와 같이, 보존된 모티프 간에 정렬을 최적화하기 위해 약간의 수동 편집을 수행할 수 있다. 더 나아가서, 상동체의 확인을 위해 전체 길이 서열을 사용하는 대신에, 소위 국소 서열 동일성을 결정하기 위해, 특정 도메인을 또한 사용할 수 있다. 서열 동일성 값은 전체 핵산 또는 아미노산 서열 (= 전체 서열 동일성 점수를 생성시키는 전체 길이 서열에 대한 국소 서열 동일성 검색) 상에서 또는 선택된 도메인 또는 보존된 모티프(들) (= 국소 서열 동일성 점수를 생성시키는 부분 서열 상에서 국소 서열 동일성 검색) 상에서, 디폴트 매개변수를 사용하여 상기 언급된 프로그램을 사용해 결정될 수 있다. 국소 정렬 경우, Smith-Waterman 알고리즘이 특히 유용하다 (Smith TF, Waterman MS (1981) J. Mol. Biol 147(1); 195-7).
실시예 3: SEQ ID NO 01을 갖는 막 단백질의 상동체의 확인
수송체 유전자의 상동체는 서열 데이터베이스 예컨대 PATRIC (https://www.patricbrc.org/), Uniprot (https://www.uniprot.org/), NCBI nr 또는 nt 데이터베이스 (https://www.ncbi.nlm.nih.gov/) 등에서 수득될 수 있다. PATRIC (https://www.patricbrc.org/)은 박테리아 병원체에서 검색을 지원하는 상이한 유형의 데이터 및 소프트웨어 도구의 통합본이다.
이 실시예는 SEQ ID NO 01을 코딩하는 전체 길이 유전자에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열을 코딩하는 유전자를 추출하는 방법을 기술한다. SEQ ID NO 01을 갖는 막 단백질은 글로벌 패밀리 PGF_00466006에 속한다. 이러한 패밀리의 구성원은 PATRIC 명령행 인터페이스 (https://docs.patricbrc.org/cli_tutorial/index.html)를 사용해 추출되었다. 아미노산 서열은 디폴트 매개변수의 EMBOSS Needle을 사용해 계산하여 SEQ ID NO 01에 대해 >80% 전체 서열 동일성으로 필터링되었다. 7002의 고유 서열을 나타내는 70477 식별자는 2020년 11월 25일에 추출되었다. 디폴트 매개변수 및 문의로서 SEQ ID NO 01을 사용한 Blastp를 사용하여서 Uniprot (2020년 12월 2일 데이터베이스 배포 데이타)로부터 서열을 추출하였다. 아미노산 서열은 디폴트 매개변수의 EMBOSS Needle을 사용해 계산하여 SEQ ID NO 01에 대해 > 80% 전체 서열 동일성으로 여과되었고 1471 식별자가 생성되었다. 이들 식별자 중에서, 첨부된 서열 목록에 열거된, SEQ ID NO 53, 54, 55, 56, 57, 58, 59, 60, 63, 64, 65, 66, 67 및 68을 갖는 막 단백질을 확인할 수 있었다.
실시예 4. 재료 및 방법 에스케리치아 콜라이
배지
LB (Luria Broth) 배지는 1% 트립톤 펩톤 (Difco, Erembodegem, Belgium), 0.5% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR. Leuven, Belgium)로 이루어졌다. 96-웰 플레이트 또는 진탕 플라스크의 배양 실험에서 사용되는 최소 배지는 2.00 g/L NH4Cl, 5.00 g/L (NH4)2SO4, 2.993 g/L KH2PO4, 7.315 g/L K2HPO4, 8.372 g/L MOPS, 0.5 g/L NaCl, 0.5 g/L MgSO4.7H2O, 30 g/L 수크로스 또는 실시예에 명시될 경우 다른 탄소 공급원, 1 ml/L 비타민 용액, 100 μL/L 몰리브데이트 용액, 및 1 mL/L 셀레늄 용액을 함유하였다. 각 실시예에 명시된 바와 같이, 20 g/L 락토스는 전구체로서 배지에 추가로 첨가되었다. 최소 배지는 1 M KOH을 사용해 7의 pH로 설정되었다. 비타민 용액은 3.6 g/L FeCl2.4H2O, 5 g/L CaCl2.2H2O, 1.3 g/L MnCl2.2H2O, 0.38 g/L CuCl2.2H2O, 0.5 g/L CoCl2.6H2O, 0.94 g/L ZnCl2, 0.0311 g/L H3BO4, 0.4 g/L Na2EDTA.2H2O 및 1.01 g/L 티아민.HCl로 이루어졌다. 몰리브데이트 용액은 0.967 g/L NaMoO4.2H2O를 함유하였다. 셀레늄 용액은 42 g/L Seo2를 함유하였다.
발효배양을 위한 최소 배지는 6.75 g/L NH4Cl, 1.25 g/L (NH4)2SO4, 2.93 g/L KH2PO4 및 7.31 g/L KH2PO4, 0.5 g/L NaCl, 0.5 g/L MgSO4.7H2O, 30 g/L 수크로스, 1 mL/L 비타민 용액, 100 μL/L 몰리브데이트 용액, 및 상기 기술된 동일한 조성의 1 mL/L 셀레늄 용액을 함유하였다. 각 실시예에 명시된 바와 같이, 100 g/L 락토스는 전구체로서 배지에 추가로 첨가되었다.
복합 배지는 오토클레이빙 (121℃, 21')으로 최소 배지는 여과 (0.22 μm Sartorius)를 통해 멸균되었다. 필요할 때, 배지는 항생제 (예를 들어, 클로람페니콜 (20 mg/L), 카르베니실린 (100 mg/L), 스펙티노마이신 (40 mg/L) 및/또는 카나마이신 (50 mg/L))를 첨가하여 선택적으로 만들었다.
플라스미드
pKD46 (Red 헬퍼 플라스미드, 암피실린 내성), pKD3 (FRT-측접 클로람페니콜 내성 (cat) 유전자 함유), pKD4 (FRT-측접 카나마이신 내성 (kan) 유전자 함유), 및 pCP20 (FLP 리콤비나제 활성 발현) 플라스미드는 Prof. R. Cunin (Vrije Universiteit Brussel, Belgium in 2007)로부터 입수하였다. 플라스미드는 Invitrogen에서 구매한 숙주 이.콜라이 DH5알파 (F-, phi80dlacZ델타M15,델타 (lacZYAargF) U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, lambda-, thi-1, gyrA96, relA1)에서 유지시켰다.
균주 및 돌연변이
에스케리치아 콜라이 K12 MG1655 [람다-, F-, rph-1]는 콜라이 유전자 자원 센터 (Coli Genetic Stock Center) (US)에서 2007년 3월에, CGSC 균주#: 7740를 입수하였다. 유전자 파괴를 비롯한 유전자 도입은 Datsenko and Wanner (PNAS 97 (2000), 6640- 6645)가 공개한 기술을 사용해 수행되었다. 이러한 기술은 람다 Red 리콤비나제를 통해 수행되는 상동성 재조합 이후 항생제 선택을 기반으로 한다. 필리파제 리콤비나제의 후속 촉매는 최종 생산 균주에서 항생제 선택 카세트의 제거를 보장한다.
Red 헬퍼 플라스미드 pKD46을 보유하는 형질전환체는 암피실린 (100 mg/L) 및 L-아라비노스 (10 mM) 존재의 10 mL LB 배지에 30℃에서 0.6의 OD600nm 까지 성장되었다. 세포는 50 mL의 빙냉수로 1회 세척하고, 1 ml 빙내수로 2회 세척하여 전기적격하게 만들었다. 다음으로, 세포는 50 μL의 빙냉수에 재현탁되었다. 전기 천공은 50 μL의 세포 및 10-100 ng의 선형 이중 가닥-DNA 생산물과 유전자 Pulser™ (BioRad) (600 Ω, 25 μFD, 및 250 볼트)를 사용하여 수행되었다. 전기천공 후에, 세포는 1시간 동안 37℃에서 인큐베이션된 1 mL LB에 첨가되었고, 최종적으로 25 mg/L의 클로람페니콜 또는 50 mg/L의 카나마이신을 함유하는 LB-한천 상에 도말되어서 항생제 내성 형질전환체를 선택하였다. 선택된 돌연변이체는 변형된 영역의 상류 및 하류의 프라이머를 사용하는 PCR을 통해 검증되었고 헬퍼 플라스미드의 상실에 대해 42℃에 LB-한천에서 성장시켰다. 돌연변이체는 암피실린 민감도에 대해 시험되었다. 선형 ds-DNA 앰플리콘은 pKD3, pKD4 및 그들 유도체를 주형으로서 사용하는 PCR을 통해 수득되었다. 사용된 플라스미드는 주형에 상보적인 서열의 일부 및 재조합이 일어나야만 하는 염색체 DNA 상의 면에 상보적인 다른 일부를 가졌다. 게놈 녹-아웃 경우, 상동성의 영역은 관심 유전자의 출발 및 중지 코돈의 상류 50-nt 및 하류 50-nt에 디자인하였다. 게놈 녹-인 경우, 전사 출발 지점 (+1)을 준수해야 한다. PCR 생산물은 PCR-정제되었고, Dpnl로 분해되고, 아가로스 겔로부터 재정제되어서 용리 완충액 (5 mM Tris, pH 8.0)에 재현탁된다. 선택된 돌연변이체 (클로람페니콜 또는 카나마이신 내성)는 온도-민감성 복제 및 FLP 합성의 열적 유도를 보이는 암피실린 및 클로람페니콜 내성 플라스미드인 pCP20 플라스미드로 형질전환되었다. 암피실린-내성 형질전환체는 30℃에서 선택되었고, 이후에 42℃에 LB에서 소수가 콜로니 정제된 다음에, 모든 항생제 내성 및 FLP 헬퍼 플라스미드의 상실에 대해 시험되었다. 유전자 녹아웃 및 녹-인은 대조군 프라이머를 사용해 검토되었다.
락토-N-트리오스 (LN3, LNT-II, GlcNAc-b1,3-Gal-b1,4-Glc) 및 락토-N-테트라오스 (LNT) 및 락토-N-네오테트라오스 (LNnT)를 포함하는 이에서 기원된 올리고당을 생산하기 위해서, 돌연변이체 균주는 이.콜라이 K12 MG1655로부터 유래되었고, 이.콜라이 LacZ 및 nagB 유전자의 녹-아웃 및 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)에 대한 항상성 전사 유닛의 게놈 녹-인으로 변형되었다. LNT 또는 LNnT 생산을 위해서, 돌연변이체 균주는 게놈 녹-인을 통해서 또는 발현 플라스미드로부터 균주에 전달될 수 있는 각각 SEQ ID NO 23을 갖는 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (WbgO) 또는 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)에 대한 항상성 전사 유닛에 의해 추가로 변형된다. 임의로, LgtA, wbgO 및/또는 LgtB 유전자의 다수 카피가 돌연변이체 이.콜라이 균주에 첨가될 수 있다. 이들 균주에서, LNT 및/또는 LNnT 생산은 SEQ ID NO 25를 갖는 이. 콜라이 유래 돌연변이체 L-글루타민-D-프룩토스-6-포스페이트 아미노트랜스퍼라제 glmS*54 (야생형 glmS와 A39T, R250C 및 G472S 돌연변이가 상이)에 대한 항상성 전사 유닛의 하나 이상의 게놈 녹-인에 의한 균주의 변형을 통해서 개선된 UDP-GlcNAc 생산을 통해 증강될 수 있다. 또한, 균주는 임의로 이.콜라이 ushA 및 galT 유전자의 게놈 녹아웃에 의해 증강된 UDP-갈락토스 생산을 위해 변형될 수 있다. 돌연변이체 이.콜라이 균주는 또한 임의로 SEQ ID NO 26을 갖는 이. 콜라이 유래 UDP-글루코스-4-에피머라제 (galE), SEQ ID NO 27을 갖는 이. 콜라이 유래 포스포글루코사민 뮤타제 (glmM) 및 SEQ ID NO 28을 갖는 이. 콜라이 유래 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제 (glmU) 에 대한 항상성 전사 유닛의 게놈 녹-인으로 적합화되었다.
코어 삼당류로서 LN3을 갖는 푸코실화 올리고당의 생산을 위해서, 이.콜라이 균주는 이.콜라이 wcaJ 및 thyA 유전자의 녹아웃 및 SEQ ID NO 29를 갖는 에이치. 파일로리 (H. pylori) 알파-1,2-푸코실트랜스퍼라제 (HpFutC) 및/또는 SEQ ID NO 30을 갖는 에이치. 파일로리 알파-1,3-푸코실트랜스퍼라제 (HpFucT)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드 및 선택 마커로서 SEQ ID NO 31을 갖는 이.콜라이 thyA에 대한 항상성 전사 유닛에 의해 추가로 변형되었다. 푸코실트랜스퍼라제 유전자의 항상성 전사 유닛은 게놈 녹-인을 통해서 돌연변이체 이.콜라이 균주에 존재할 수 있다. GDP-푸코스 생산은 WO2016075243 및 WO2012007481에 기술된 바와 같이 glgC, agp, pfkA, pfkB, pgi, arcA, iclR, pgi 및 lon 을 포함하는 이. 콜라이 유전자의 게놈 녹아웃을 통해 추가로 최적화될 수 있다. GDP-푸코스 생산은 SEQ ID NO 32를 갖는 이.콜라이 manA, SEQ ID NO 33을 갖는 manB, SEQ ID NO 34를 갖는 manC, SEQ ID NO 35를 갖는 gmd 및 SEQ ID NO 36을 갖는 fcl에 대한 항상성 전사 유닛의 게놈 녹-인을 포함하여 추가적으로 최적화될 수 있다. GDP-푸코스 생산은 또한 이.콜라이 fucK 및 fucI 유전자의 게놈 녹아웃 및 SEQ ID NO 37을 갖는 이. 콜라이 유래 푸코스 퍼미아제 (fucP) 및 SEQ NO ID 38을 갖는 박테로이데스 프라질리스 (Bacteroides fragilis) 유래 이기능성 푸코스 키나제/푸코스-1-포스페이트 구아닐릴트랜스퍼라제 (fkp)를 함유하는 항상성 전사 유닛의 게놈 녹-인에 의해 수득될 수 있다.
코어 삼당류로서 LN3을 갖는 시알릴화 올리고당의 생산을 위해서, 이.콜라이 균주는 이.콜라이 nagA 유전자의 녹아웃 및 SEQ ID NO 39를 갖는 사카로마이세스 세레비지아에 유래 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 (GNA1), SEQ ID NO 40을 갖는 박테로이데스 오바투스 (Bacteroides ovatus) 유래 N-아세틸글루코사민 2-에피머라제 (AGE), SEQ ID NO 41을 갖는 네이세리아 메닌지티디스 (Neisseria meningitidis) 유래 N-아세틸뉴라미네이트 (Neu5Ac) 신타제 (NeuB), SEQ ID NO 42를 갖는 파스퇴렐라 멀토시다 (Pasteurella multocida) 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (NeuA), 및 피. 멀토시다 유래 SEQ ID NO 43 (PmultST3) 및/또는 엔. 메닌지티디스 유래 SEQ ID NO 44 (NmeniST3)를 포함하는 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제, 및/또는 포토박테리움 담셀라에 (Photobacterium damselae) 유래 SEQ ID NO 45 (PdST6) 및/또는 포토박테리움 (Photobacterium) sp. JT-ISH-224 유래 SEQ ID NO 46 (P-JT-ISH-224-ST6)를 포함하는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제를 함유하는 항상성 전사 유닛의 게놈 녹-인에 의해서 추가로 변형되었다. PmNeuA 및 시알릴트랜스퍼라제의 항상성 전사 유닛은 게놈 녹-인을 통해서 또는 발현 플라스미드를 통해서 돌연변이체 균주에게 전달될 수 있다. 시알산 생산은 WO18122225에 기술된 바와 같이 nagC, nagD, nagE, nanA, nanE, nanK, manX, manY 및 manZ 를 포함하는 이. 콜라이 유전자의 게놈 녹-아웃 및 SEQ ID NO 25를 갖는 이. 콜라이 유래 L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제 (glmS*54)의 돌연변이된 변이체 (야생형 이.콜라이 glmS와 A39T, R250C 및 G472S 돌연변이가 상이) 및 SEQ ID NO 47을 갖는 이. 콜라이 유래 포스파타제 yqaB를 포함하는 항상성 전사 유닛의 게놈 녹-인을 갖는 돌연변이체 이. 콜라이 균주에서 추가로 최적화될 수 있다. 시알산 생산은 또한 이.콜라이 nagA 및 nagB 유전자의 녹아웃 및 SEQ ID NO 27을 갖는 이. 콜라이 유래 포스포글루코사민 뮤타제 (glmM), SEQ ID NO 28을 갖는 이. 콜라이 유래 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제 (glmU), SEQ ID NO 48을 갖는 캄필로박터 제주니 (Campylobacter jejuni) 유래 UDP-N-아세틸글루코사민 2-에피머라제 (NeuC) 및 SEQ ID NO 41을 갖는 엔. 메닌지티디스 유래 N-아세틸뉴라미네이트 신타제 (NeuB)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 통해 수득될 수 있다. 이러한 돌연변이체 균주에서, 시알산 생산은 SEQ ID NO 25를 갖는 이. 콜라이 유래 돌연변이체 glmS*54 및 SEQ ID NO 47을 갖는 이. 콜라이 유래 포스파타제 yqaB를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 추가로 최적화될 수 있다.
모든 돌연변이체 균주는 또한 임의로 SEQ ID NO 49을 갖는 이. 콜라이 W 유래 수크로스 수송체 (CscB) , SEQ ID NO 50을 갖는 지. 모빌리스 (Z. mobilis)로부터 기원하는 프룩토스 키나제 (Frk) 및 SEQ ID NO 51을 갖는 비. 아돌레센티스 (B. adolescentis)로부터 기원하는 수크로스 포스포릴라제를 함유하는 항상성 전사 유닛의 게놈 녹-인을 통해서 수크로스 상에서 성장을 위해 적합화될 수 있다. 더 나아가서, 돌연변이체 균주는 SEQ ID NO 52를 갖는 이. 콜라이 유래 락토스 퍼미아제 lacY에 대한 항상성 전사 유닛의 게놈 녹-인을 통해 증강된 락토스 흡수를 위해서 변형될 수 있다.
더 나아가서, 모든 돌연변이체 균주는 임의로 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 lgtB 및 SEQ ID NO 26을 갖는 이. 콜라이 유래 UDP-글루코스 4-에프리머라제 (galE)에 대한 항상성 전사 유닛의 게놈 녹-인과 함께, lacZ, glk 및 galETKM 오페론의 게놈 녹-아웃에 의해 세포내 락토스 합성에 위해 적합화될 수 있다.
다음 단계에서, 표 2 및 3에 열거된 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질은 이.콜라이 K12 MG1655로부터 유래되는 상기 돌연변이체 균주에서 평가될 수 있다. 본 발명에 기술된 다른 단백질은 또한 표 2에 열거된다. 막 단백질 유전자는 pSC101 플라스미드 상에 존재하거나 또는 항상성 전사 유닛으로 숙주 게놈에 통합되어 평가될 수 있다.
반드시는 아니지만 바람직하게, 글리코실트랜스퍼라제는 그들 가용성을 증강시키기 위해 MBP-태그에 N-말단에서 융합되었다 (Fox et al., Protein Sci. 2001, 10(3), 622-630).
모든 항상성 프로모터, UTR 및 종결자 서열은 하기 문헌에 기술된 라이브러리로부터 기원되었다: Cambray et al. (Nucleic Acids Res. 2013, 41(9), 5139-5148), Chen et al. (Nat. Methods 2013, 10(7), 659-664), De Mey et al. (BMC Biotechnol. 2007, 4(34), 1-14), Dunn et al. (Nucleic Acids Res. 1980, 8(10), 2119-2132), Kim and Lee (FEBS Letters 1997, 407(3), 353-356) 및 Mutalik et al. (Nat. Methods 2013, No. 10, 354-360). 모든 유전자는 Twist Bioscience (twistbioscience.com) 또는 IDT (eu.idtdna.com)에서 합성으로 주문하였고 코돈 용법은 공급사의 도구를 사용해 적합화되었다.
모든 균주는 저온바이알 중에 -80℃에서 저장되었다 (밤샘 LB 배양을 1:1 비율로 70% 글리세롤과 혼합함).
배양 조건
96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL LB 중에, 저온바이알로부터 출발하여서 800 rpm의 회전 진탕기에서 밤새 37℃에서 인큐베이션되었다. 이 배양을 400x로 희석하여 400 μL 최소 배지가 있는, 96웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용하였다. 이들 최종 96-웰 배양 플레이트는 72시간, 또는 더 짧거나 또는 더 긴 동안 800 rpm의 회전 진탕기에 37℃에서 인큐베이션되었다. 배양 실험의 종료 시에 당 농도를 측정하기 위해서 전체 액체배지 샘플은 세포를 스핀 다운 하기 전에 60℃에서 15분 동안 배양 액체배지를 끓여서 각 웰로부터 채취하였다 (= 세포내 및 세포외 당 농도의 평균). 또한, 배양의 희석을 수행하여 600 nm에서 광학 밀도를 측정하였다. 세포 성능 지수 또는 CPI는 달리 명시하지 않으면, 기준 균주와 비교하여 상대%로서, 생물량으로 전체 액체배지에서 측정된 코어 삼당류로서 LN3을 갖는 올리고당의 농도를 나누어서 결정되었다. 생물량은 600 nm에서 측정된 광학 밀도의 대략 1/3인 것으로 경험적으로 결정된다. 코어 삼당류로서 LN3을 갖는 올리고당의 이출 비율은 기준 균주와 비교하여 상대%로서, 전체 액채베지에서 측정된 코어 삼당류로서 LN3을 갖는 올리고당의 농도로 상청액에서 측정된 코어 삼당류로서 LN3을 갖는 올리고당의 농도를 나누어서 결정되었다.
생물반응기에 대한 전배양은 일정 균주의 전체 1 mL 저온바이알로부터 출발하여서 1 L 또는 2.5 L 진탕 플라스크의 250 mL 또는 500 mL 최소 배지에 접종하였고 200 rpm으로 회전 진탕기 상에서 24시간 동안 37℃에서 인큐베이션하였다. 5 L 생물반응기에 접종하였고 (2 L 뱃치 배지 중 250 mL 접종원); 과정은 MFCS 제어 소프트웨어 (Sartorius Stedim Biotech, Melsungen, Germany)를 통해 제어하였다. 배양 조건은 37℃, 및 최대 교반으로 설정하였고; 압력 가스 유속은 균주 및 생물반응기에 의존하여 달리하였다. pH는 0.5 M H2S04 및 20% NH4OH를 사용해 6.8로 제어되었다. 배기 가스는 냉각시켰다. 실리콘 소포제의 10% 용액이 발효배양 동안 기포가 생성될 때 첨가되었다.
광학 밀도
배양의 세포 밀도는 600 nm에서 광학 밀도를 측정하여 빈번하게 모니터링되었다 (Implen Nanophotometer NP80, Westburg, Belgium 또는 with a Spark 10M microplate reader, Tecan, Switzerland).
생산성
비생산성 Qp은 전형적으로 시간 단위 당 생물량의 질량 단위 당 생산물의 질량 단위 (= g 올리고당 / g 생물량 / h)로 표시되는, 생산물 (코어 삼당류로서 LN3을 갖는 올리고당)의 특별한 생산율이다. Qp 값은 각 단계의 종료 시에 형성된 생산물 및 생물량의 양 및 각 단계가 지속되는 시간 기간을 측정하여, 발효배양 작업의 각 단계, 즉 뱃치 및 유가식 단계에 대해 결정되었다.
비생산성 Qs은 전형적으로 시간 단위 당 생물량의 질량 단위 당 기질의 질량 단위 (= g 수크로스 / g 생물량 / h)로 표시되는, 기질, 예를 들어 수크로스의 특별한 소비율이다. Qs 값은 각 단계의 종료 시에 형성된 생물량 및 소비된 수크로스의 총량 및 각 단계가 지속된 시간 기간을 측정하여, 발효배양 작업의 각 단계, 즉 뱃치 및 유가식 단계에 대해 결정되었다.
수크로스에 대한 수율 Ys는 기질로부터 만든 생산물의 분획이고, 전형적으로 기질의 질량 단위 당 생산물의 질량 단위 (= g 올리고당 / g 수크로스)로 표시된다. Ys는 각 단계의 종료 시에 생산된 코어 삼당류로서 LN3을 갖는 올리고당의 총량 및 소비된 수크로스의 총량을 측정하여, 발효배양 작업의 각 단계, 즉 뱃치 및 유가 단계에 대해 결정되었다.
생물량에 대한 수율 Yx는 기질로부터 만들어진 생물량의 분획이고, 전형적으로 기질의 질량 단위 당 생물량의 질량 단위 (= g 생물량 / g 수크로스)로 표시된다. Yp는 각 단계의 종료 시에 생산된 생물량의 총량 및 소비된 수크로스의 총량을 측정하여, 발효배양 작업의 각 단계, 즉 뱃치 및 유가 단계에 대해 결정되었다.
비율은 전형적으로 발효배양 작업에서 생산물이 만들어지는 속도이고, 시간 단위 당 만들어진 생산물의 농도 (= g 올리고당 / L/ h)로서 표시된다. 비율은 유가 단계의 종료 시에 만들어진 코어 삼당류로서 LN3을 갖는 올리고당의 농도를 측정하고 총 발효배양 시간으로 이러한 농도를 나누어서 결정된다.
락토스 전환율은 락토스가 발효배양 작업에서 소비되는 속도이고, 전형적으로 시간 단위 당 락토스의 질량 단위 (= g 소비된 락토스 / h)로 표시된다. 락토스 전환율은 총 발효배양 시간으로 나눈, 발효배양 작업 동안 소비된 총 락토스의 측정으로 결정된다.
성장율/속도 측정
최대 성장률 (μMax)은 R 패키지 그로핏을 사용하여 600 nm에서 관찰된 광학 밀도를 기반으로 계산되었다.
분석적 분석
표준, 예컨대, 제한없이 수크로스, 락토스, 락토-N-트리오스 II (LN3), 락토-N-테트라오스 (LNT), 락토-N-네오-테트라오스 (LNnT), LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LSTa, LSTc 및 LSTd는 Carbosynth (UK), Elicityl (France) 및 IsoSep (Sweden)에서 구매하였다. 다른 화합물은 사내 제조 표준을 사용해 분석되었다.
중성 올리고당은 증발 광산란 검출기 (ELSD) 또는 굴절률 (RI) 검출이 구비된 Waters Acquity H-클래스 UPLC에서 분석되었다. 0.7 μL 샘플 부피는 Acquity UPLC BEH Amide VanGuard 컬럼 (130Å, 2.1 x 5 mm)이 구비된 Waters Acquity UPLC BEH 아미드 컬럼 (2.1 x 100 mm; 130Å; 1.7 μm) 컬럼 상에 주입되었다. 컬럼 온도는 50℃였다. 이동층은 0.2% 트리에틸아민이 첨가된 ¼ 물 및 ¾ 아세토니트릴 용액으로 이루어졌다. 방법은 0.130 mL/분의 유속과 등용매였다. ELS 검출기는 50℃의 드리프트 튜브 온도를 가졌고, N2 가스 압력은 50 psi 였고, 게인 200 및 데이터 속도 10 pps 였다. RI 검출기의 온도는 35℃로 설정되었다.
시알릴화 올리고당은 굴절률 (RI) 검출이 구비된 Waters Acquity H-클래스 UPLC에서 분석되었다. 0. 5 μL 샘플 부피가 Waters Acquity UPLC BEH 아미드 컬럼 (2.1 x 100 mm; 130Å; 1.7 μm)에 주입되었다. 컬럼 온도는 50℃였다. 이동층은 0.05% 피롤리딘이 첨가된 70% 아세토니트릴, 26% 암모늄 아세테이트 완충액 (150 mM) 및 4% 메탄올의 혼합물로 이루어졌다. 방법은 0.150 mL/분의 유속과 등용매였다. RI 검출기의 온도는 35℃로 설정되었다..
중성 및 시알릴화 당은 굴절률 (RI) 검출이 구비된 Waters Acquity H-클래스 UPLC에서 분석되었다. 0.5 μL 샘플의 부피를 Waters Acquity UPLC BEH 아미드 컬럼 (2.1 x 100 mm; 130Å; 1.7 μm)에 주입하였다. 컬럼 온도는 50℃였다. 이동층은 0.1% 트리에틸아민이 첨가된 72% 아세토니트릴 및 28% 암모늄 아세테이트 완충액 (100 mM)의 혼합물로 이루어졌다. 방법은 0.260 mL/분의 유속과 등용매였다. RI 검출기의 온도는 35℃로 설정되었다.
질량 분광계에서 분석을 위해서, 전자 분무 이온화 (ESI)가 구비된 Waters Xevo TQ-MS는 450℃의 탈용매화 온도, 650 L/h의 질소 탈용매화 가스 흐름 및 20 V의 콘 전압으로 사용되었다. MS는 모든 올리고당에 대해 음성 모드에서 선택된 이온 모니터링 (SIM)으로 작동되었다. 분리는 35℃의 Thermo Hypercarb 컬럼 (2.1 x 100 mm; 3 μm)이 구비된 Waters Acquity UPLC에서 수행되었다. 용리액 A는 0.1% 포름산 존재의 초순수이고 용리액 B는 0.1% 포름산 존재의 아세토니트릴인 구배가 사용되었다. 올리고당은 하기 구배를 사용하여 55분에 분리되었다: 21분 동안 2%에서 12%의 용리액 B의 초기 증가, 11분 동안 12%에서 40%의 용리액 B의 제2 증가, 및 5분 동안 40%에서 100%의 용리액 B의 제3 증가. 세척 단계로서 100% 의 용리액 B가 5분 동안 사용되었다. 컬럼 평형화를 위해서 2%의 용리액 B의 초기 조건이 1분 안에 복구되었고 12분 동안 유지되었다.
낮은 농도 (50 mg/L 미만)에서 중성 및 시알화 당은 펄스식 전류측정 검출 (PAD) 구비된 Dionex HPAEC 시스템에서 분석되었다. 5 μL 부피의 샘플은 Dionex CarboPac PA200 guard 컬럼 4 x 50 mm가 구비된 Dionex CarboPac PA200 컬럼 4 x 250 mm에 주입되었다. 컬럼 온도는 30℃로 설정되었다. 용리액 A가 탈이온수이고, 용리액 B가 200 mM 소듐 히드록시드이고, 용리액 C가 500 mM 소듐 아세테이트인 구배가 사용되었다. 올리고당은 하기 구배를 사용하여 25%의 용리액 B의 일정 비율을 유지하면서 60분에 분리되었다: 75%의 용리액 A에서 10분 동안 유지되는 초기 등용매 단계, 8분 동안 0%에서 4%로 용리액 C의 초기 증가, 71%의 용리액 A 및 4%의 용리액 C에서 6분 동안 유지되는 제2 등용매 단계, 2.6분 동안 4%에서 12%로 용리액 C의 제2 증가, 63%의 용리액 A 및 12%의 용리액 C에서 3.4분 동안 유지되는 제3 등용매 단계 및 5분 동안 12%에서 48%로 용리액 C의 제3 증가. 세척 단계로서, 48%의 용리액 C가 3분 동안 사용되었다. 컬럼 평형화를 위해서, 75%의 용리액 A 및 0%의 용리액 C의 초기 조건은 1분 안에 복구되었고, 11분 동안 유지되었다. 적용되는 유속은 0.5 mL/분이었다.
데이터의 정규화
모든 유형의 배양 조건에 대해서, 돌연변이체 균주로부터 수득된 데이터는 돌연변이체 균주와 동일한 유전적 배경을 갖지만 막 단백질 발현 카세트가 결여된 기준 균주 (즉, 설정점)를 사용하여 동일한 배양 조건에서 수득된 데이터에 대해 정규화되었다. 따라서 모든 데이터 (표 4-11의 데이터 포함)는 설정점에 대한 상대%로서 제공된다.
실시예 5. 20 g/L 락토스가 보충된 최소 배지에서 성장 실험으로 72시간 배양된 이. 콜라이 숙주에서 LN3 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 LN3 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 LN3 생산 숙주에서 pSC101 플라스미드 상에 존재하였다. 성장 실험은 실시예 4에 제공되는 배양 조건에 따라서 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 6. 20 g/L 락토스가 보충된 최소 배지에서 성장 실험으로 72시간 배양된 이. 콜라이 숙주에서 LN3 및 락토-N-테트라오스 (LNT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 LN3 ?? 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO 01, 03, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 21을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 LNT 생산 숙주에서 pSC101 플라스미드 상에 존재하였다. 성장 실험은 실시예 4에 제공된 배양 조건에 따라서 수행되었다.
표 4는 막 단백질이 발현되지 않는 기준 균주와 비교하여 막 단백질을 발현하는 상이한 균주에 대한 LN3 및 LNT의 전체 액체배지 측정을 표시한다. 표 4에 따라서, SEQ ID NO 01, 03, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 21을 갖는 막 단백질의 발현은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23을 갖는 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (WbgO)를 발현하는 LNT 생산 숙주에서 생산되는 LNT를 비롯해 LN3의 생산을 증강시켰다.
"SD"는 표준 편차 (시험된 동일 균주의 4 복제물)를 나타낸다. "기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
또한, 표 5는 본 실시예에 요약된 바와 같은 막 단백질을 발현하는 상이한 균주에 대한 세포 성능 지수 (CPI)는 상기 막 단백질이 발현되지 않는 기준 균주와 비교하여 더 높다는 것을 보여준다.
"SD"는 표준 편차 (시험된 동일 균주의 4 복제물)를 나타낸다. "기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
실시예 7. 20 g/L 락토스가 보충된 최소 배지에서 성장 실험으로 72시간 배양된 이. 콜라이 숙주에서 락토-N-테트라오스 (LNT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO 02, 04, 05, 66, 67 및 68을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 LNT 생산 숙주에서 pSC101 플라스미드 상에 존재하였다. 성장 실험은 실시예 4에 제공된 배양 조건에 따라서 수행되었다. 따라서, 본 실시예에서 균주는 평가되는 막 단백질을 제외하고 실시예 6과 동일하다.
상기 기술된 이들 6개의 상이한 막 단백질로부터의 실험 데이터는 표 6에 표시된다.
모든 6 균주는 배양 배지가 탄소 공급원으로서 수크로스 및 전구체로서 락토스를 함유하는, 실시예 4에 제공되는 배양 조건에 따라서 성장 실험에서 평가될 때 전체 액체배지 샘플 중에서 기준 균주 (발현되는 막 단백질없음)와 비교하여 더 많은 LNT를 생산할 수 있고 더 높은 세포 성능 지수 (CPI)를 보인다. 또한, 이들 균주는 실시예 6에서 사용되는 균주와 대조적으로 LN3의 더 높은 생산 (전체 액체배지에서 측정된, 기준 균주와 비교된 LN3 생산%)을 보이지 않았다. 따라서 실시예 7에 제시되는 균주는 LN3의 분획은 가능한 낮게 유지되어야 하는, LNT의 생산에 특히 유리한데 반해서, 실시예 6의 균주는 LN3 및 LNT의 혼합물을 목적으로 하거나 또는 생산된 올리고당 분획 중 LN3의 상대량이 중요하지 않은 경우에 유용하다.
이 스크리닝에서 사용되는 LNT 생산 숙주는 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23을 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하였다.
"SD"는 표준 편차 (시험된 동일 균주의 4 복제물)를 나타낸다. "기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
실시예 8. 20 g/L 락토스가 보충된 최소 배지에서 성장 실험으로 72시간 배양된 이. 콜라이 숙주에서 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO 01, 02, 03, 05, 66 및 68을 갖는 막 단백질을 평가하기 위해서 설정되었다. 후보 유전자는 LNnT 생산 숙주에서 pSC101 플라스미드 상에 존재한다. 성장 실험은 실시예 4에 제공되는 배양 조건에 따라 수행되었다.
상기 기술된 이들 6개 상이한 막 단백질로부터의 실험 데이터는 표 7에 표시된다.
모든 6 균주는 배양 배지가 탄소 공급원으로서 수크로스 및 전구체로서 락토스를 함유하는, 실시예 4에 제공된 배양 조건에 따라서 성장 실험에서 평가될 때 전체 액체배지 샘플 중에서 기준 균주 (발현되는 막 단백질 없음)와 비교하여 더 많은 LNnT를 생산할 수 있다. 이러한 스크리닝에 사용되는 LNnT 생산 숙주는 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하였다.
"SD"는 표준 편차 (시험된 동일 균주의 4 복제물)를 나타낸다. "기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
실시예 9. 5 L 발효배양 작업으로 이. 콜라이 LN3 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LN3 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라서 수행되었다. 또한, LN3 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 상청액 및 전체 액체배지 샘플에서 측정된 적정가는 막 단백질 유전자를 발현하는 균주에 대해서 80 g/L와 125 g/L 사이로 다양하다. 기준 균주는 상청액 및 전체 액체배지에서 측정된 45 g/L와 65 g/L 사이의 LN3 적정가에 도달하고, 이것은 5 L 발효배양 작업에서 LN3 생산에 대한 SEQ ID 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 보여준다.
실시예 10. 5 L 발효배양 작업으로 이. 콜라이 LN3 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LN3 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)으로 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LN3 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 변형된 균주에서 LN3 생산은 기준 균주과 비교하여 125% 내지 250%였고, 5 L 발효배양 작업에서 LN3 생산에 대한 SEQ ID 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 뒷받침한다.
실시예 11. 5 L 발효배양 작업으로 이. 콜라이 LNT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65,66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 상청액 및 전체 액체배지 샘플에서 측정된 적정가는 막 단백질 유전자를 발현하는 균주의 경우 90 g/L와 130 g/L 사이로 다양하다. 기준 균주는 상청액 및 전체 액체배지 샘플에서 측정된 50 g/L와 70 g/L 사이의 LNT 적정가에 도달하여서, 5 L 발효배양 작업으로 LNT 생산에 대한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 보여준다.
실시예 12. 5 L 발효배양 작업으로 이. 콜라이 LNT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65,66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 변형된 균주에서 LNT 생산은 기준 균주와 비교하여 135% 내지 265%였고, 5 L 발효배양 작업으로 LNT 생산에 대한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 뒷받침한다.
실시예 13. 5 L 발효배양 작업으로 이. 콜라이 LNT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양으로부터의 실험 데이터는 표 8 및 9에 표시된다.
발효배양의 종료 시에, 상청액 및 전체 액체배지 샘플에서 측정된 적정가는 기준 균주에서 평가된 것보다 더 높았다 (표 8). 기준 균주와 비교하여 LNT 생산의 증가가 전체 액체배지 경우에 비해서 상청액 경우에 더 높았으므로, LNT 분비가 기준 균주와 비교하여 증강되었다는 것을 추가로 관찰하였다. 또한, LNT의 생산율, 락토스 소비율 및 수크로스에 대한 LNT 수율은 기준 균주와 비교하여 더 높았다 (표 9). 전체적으로, 이들 데이터는 5 L 발효배양 작업에서 LNT 생산에 대해 SEQ ID NO 01을 갖는 막 단백질의 긍정적 효과를 보여준다.
기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
실시예 14. 5 L 발효배양 작업으로 이. 콜라이 LNnT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNnT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNnT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 상청액 및 전체 액체배지 샘플에서 측정된 적정가는 막 단백질 유전자를 발현하는 균주 경우에 70 g/L와 100 g/L 사이로 다양하다. 기준 균주는 상청액 및 전체 액체배지 샘플에서 측정된 40 g/L와 60 g/L 사이의 LNnT 적정가에 도달하여, 5 L 발효배양 작업으로 LNnT 생산에 대한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 보여준다.
실시예 15. 5 L 발효배양 작업으로 이. 콜라이 LNnT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNnT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNnT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 변형된 균주에서 LNnT 생산은 기준 균주와 비교하여 120% 내지 245%여서, 5 L 발효배양 작업으로 LNnT 생산에 대한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 뒷받침한다.
실시예 16. 5 L 발효배양 작업으로 이. 콜라이 LNnT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNnT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 02를 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 이의 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNnT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양으로부터의 실험 데이터는 표 10 및 11에 표시된다.
발효배양의 종료 시에, 상청액 및 전체 액체배지 샘플에서 측정된 적정가는 기준 균주에서 측정된 것보다 더 높았다 (표 10). 또한, 기준 균주와 비교하여 더 높은 세포 성능 지수 (CPI)가 수득된다. 기준 균주와 비교하여 LNnT 생산의 증가가 전체 액체배지 경우에 비해 상청액 경우에 더 높으므로, LNnT 분비가 기준 균주와 비교하여 증강되었다는 것을 추가로 관찰하였다. 또한, LNnT의 생산율, 락토스 소비율, 수크로스에 대한 LNnT 수율 및 LNnT의 비생산성은 기준 균주와 비교하여 더 높았다 (표 11). 전체적으로, 이들 데이터는 5 L 발효배양 작업에서 LNnT 생산에 대한 SEQ ID NO 02를 갖는 막 단백질의 긍정적 효과를 보여준다.
"기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
"기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
실시예 17. 재료 및 방법 사카로마이세스 세레비지아에
배지
균주는 아미노산없는 6.7 g/L 효모 질소 베이스 (YNB w/o AA, Difco), 20 g/L 한천 (Difco) (고체 배양), 22 g/L 글루코스 일수화물 또는 20 g/L 락토스 및 0.79 g/L CSM 또는 0.77 g/L CSM-Ura, 0.77 g/L CSM-Trp, 또는 0.77 g/L CSM-His (MP Biomedicals)를 함유하는 CSM drop-out (SD CSM-Ura, SD CSM-Trp, SD CSM-His) 또는 완전 보충 혼합물 (SD CSM)을 갖는 합성 한정 효모 배지에서 성장되었다.
균주
Euroscarf 배양 컬렉션에서 입수가능한, Brachmann et al. (Yeast (1998) 14:115-32)이 만든, 에스. 세레비지아에 BY4742가 사용되었다. 모든 돌연변이체 균주는 Gietz (Yeast 11:355-360, 1995)의 방법을 사용하는 상동성 재조합 또는 플라스미드 형질전환을 통해서 생성되었다.
플라스미드
UDP-갈락토스를 생산하는 실시예에서, 효모 발현 플라스미드는 HIS3 선택 마커 및 UDP-글루코스-4-에피머라제 예컨대, 예를 들어 이.콜라이 유래 galE (UniProt ID P09147)에 대한 항상성 전사 유닛을 함유하는 pRS420-플라스미드 시리즈 (Christianson et al., 1992, Gene 110: 119-122)로부터 유래될 수 있다. 이러한 플라스미드는 LN3 (락토-N-트리오스, LNT-II)을 생산하도록 락토스 퍼미아제 예컨대, 예를 들어, 케이. 락티스 (K. lactis) 유래 LAC12 (UniProt ID P07921) 및 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 활성 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtA (SEQ ID NO 22)에 대한 항상성 전사 유닛에 의해 추가로 변형될 수 있다. LN3-유래 올리고당 예컨대 LNT를 추가로 생산하기 위해서, 돌연변이체 LN3 생산 균주는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어 이.콜라이 O55:H7 유래 WbgO (SEQ ID NO 23)에 대한 항상성 전사 유닛에 의해 추가로 변형되었다.
LN3 유도된 올리고당 예컨대 락토-N-네오테트라오스 (LNnT, Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)의 생산을 위한 실시예에서, 돌연변이체 LN3 생산 균주는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어 네이세리아 메닌지티디스 (Neisseria meningitidis) 유래 LgtB (SEQ ID NO 24)에 대한 항상성 전사 유닛에 의해 추가로 변형되었다.
GDP-푸코스를 생산하기 위한 실시예에서, 효모 발현 플라스미드 예컨대 p2a_2μ_Fuc (Chan 2013, 플라스미드 70, 2-17)는 에스. 세레비지아에에서 외래 유전자의 발현에 사용될 수 있다. 이러한 플라스미드는 이. 콜라이에서 선택 및 유지를 허용하도록 암피실린 내성 유전자 및 박테리아 복제 기원 및 효모에서 선택 및 유지를 위한 2μ 효모 ori 및 Ura3 선택 마커를 함유한다. 이러한 플라스미드는 락토스 퍼미아제 예컨대, 예를 들어, 케이. 락티스 유래 LAC12 (UniProt ID P07921), GDP-만노스 4,6-데히드라타제 예컨대, 예를 들어, 이.콜라이 유래 gmd(SEQ ID NO 35) 및 GDP-L-푸코스 신타제 예컨대, 예를 들어, 이.콜라이 유래 fcl (SEQ ID NO 36)에 대한 항상성 전사 유닛에 의해 추가로 변형된다. 효모 발현 플라스미드 p2a_2μ_Fuc2는 암피실린 내성 유전자, 박테리아 ori, 2μ 효모 ori 및 Ura3 선택 옆에, 락토스 퍼미아제 예컨대, 예를 들어, 케이. 락티스 유래 LAC12 (UniProt ID P07921), 푸코스 퍼미아제 예컨대, 예를 들어, 이.콜라이 유래 fucP (SEQ ID NO 37) 및 푸코스 키나제/푸코스-1-포스페이트 구아닐릴트랜스퍼라제 활성을 갖는 이기능성 효소 예컨대, 예를 들어, 박테로이데스 프라질리스 유래 fkp (SEQ ID NO 38)에 대한 항상성 전사 유닛을 포함하는 p2a_2μ_Fuc 플라스미드의 대안 발현 플라스미드로서 사용될 수 있다. 푸코실화 코어 삼당류로서 LN3을 갖는 올리고당을 추가로 생산하기 위해서, p2a_2μ_Fuc 및 이의 변이체 p2a_2μ_Fuc2는 추가적으로 SEQ ID NO 29를 갖는 에이치. 파일로리 알파-1,2-푸코실트랜스퍼라제 (HpFutC) 및/또는 SEQ ID NO 30을 갖는 에이치. 파일로리 알파-1,3-푸코실트랜스퍼라제 (HpFucT)에 대한 항상성 전사 유닛을 함유하였다.
시알산 및 CMP-시알산을 생산하기 위해서, 효모 발현 플라스미드는 TRP1 선택 마커 및 SEQ ID NO 25를 갖는 이. 콜라이 유래 돌연변이체 glmS*54, SEQ ID NO 47을 갖는 이. 콜라이 유래 포스파타제 yqaB, SEQ ID NO 40을 갖는 비. 오바투스 유래 N-아세틸글루코사민 2-에피머라제 (AGE), SEQ ID NO 41을 갖는 엔. 메닌지티디스 유래 N-아세틸뉴라미네이트 신타제 (NeuB) 및 SEQ ID NO 42를 갖는 피. 멀토시다 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (NeuA)에 대한 항상성 전사 유닛을 함유하는 pRS420-플라스미드 시리즈 (Christianson et al., 1992, Gene 110: 119-122)로부터 유래되었다. 임의로, SEQ ID NO 39를 갖는 에스. 세레비지아에 유래 GNA1에 대한 항상성 전사 유닛이 역시 첨가되었다.
코어 삼당류로서 LN3을 갖는 시알릴화 올리고당의 생산을 위해서, 플라스미드는 케이. 락티스 유래 락토스 퍼미아제 (LAC12) (UniProt ID P07921), 및 피. 멀토시다 유래 SEQ ID NO 43 (PmultST3) 및/또는 엔. 메닌지티디스 유래 SEQ ID NO 44 (NmeniST3)를 포함하는 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제, 및/또는 포토박테리움 담셀라에 유래 SEQ ID NO 45 (PdST6) 및/또는 포토박테리움 sp. JT-ISH-224 유래 SEQ ID NO 46 (P-JT-ISH-224-ST6)를 포함하는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제를 포함하는 하나 이상의 시알릴트랜스퍼라제(들)에 대한 항상성 전사 유닛을 더 포함하였다.
반드시는 아니지만 바람직하게, 뉴클레오티드-활성화된 당 합성에 관여되는 단백질 및/또는 글리코실트랜스퍼라제 중 어느 하나 이상은 그들 가용성을 증강시키기 위해서 SUMOstar 태그 (예를 들어, pYSUMOstar, Life Sensors, Malvern, PA에서 입수)에 N-말단 및/또는 C-말단에서 융합되었다.
임의로, 돌연변이체 효모 균주는 샤페론 단백질 예컨대, 예를 들어, Hsp31, Hsp32, Hsp33, Sno4, Kar2, Ssb1, Sse1, Sse2, Ssa1, Ssa2, Ssa3, Ssa4, Ssb2, Ecm10, Ssc1, Ssq1, Ssz1, Lhs1, Hsp82, Hsc82, Hsp78, Hsp104, Tcp1, Cct4, Cct8, Cct2, Cct3, Cct5, Cct6 또는 Cct7을 코딩하는 항상성 전사 유닛의 게놈 녹-인에 의해 변형되었다 (Gong et al., 2009, Mol. Syst. Biol. 5: 275). 플라스미드는 Invitrogen에서 구매한 숙주 이.콜라이 DH5알파 (F-, phi80dlacZ델타M15, 델타(lacZYA-argF)U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, 람다-, thi-1, gyrA96, relA1)에서 유지되었다.
다음 단계에서, 표 2 및 3에 열거된 바와 같은 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질은 상기 돌연변이체 균주에서 평가될 수 있다. 막 단백질 유전자는 p2a 2μ_Fuc 또는 p2a_2μ_Fuc2 또는 pRS420 (Christianson et al., 1992, Gene 110: 119-122; HIS3 선택 마커 가짐) 플라스미드에 존재하거나 또는 항상성 전사 유닛으로 숙주 게놈여 통합되어서 평가될 수 있다.
유전자는 Blazeck (Biotechnology and Bioengineering, Vol. 109, No. 11, 2012)가 기술한 바와 같이, 합성 항상성 프로모터를 사용해 발현되었다.
플라스미드 또는 게놈으로부터, 발현시키기 위해 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, IDT 또는 Twist Bioscience. 발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 추가로 촉진시킬 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.
배양 조건
일반적으로, 효모 균주는 단일 콜로니를 수득하기 위해 SD CSM 플레이트에서 초기에 성장되었다. 이들 플레이트는 2 내지 3일 동안 30℃에서 성장되었다. 단일 콜로니로부터 출발하여, 전배양은 밤새 5 mL로 30℃에서, 200 rpm으로 진탕하면서 성장되었다. 후속 125 mL 진탕 플라스크 실험은 25 mL 배지 중에 이 전배양의 2%가 접종되었다. 이들 진탕 플라스크는 200 rpm의 회전 진탕으로 30℃에서 인큐베이션되었다.
분석적 분석
실시예 4의 이 섹션을 참조한다.
실시예 18. 에스. 세레비지아에 숙주에서 LN3 생산에 대해 시험된 막 단백질
실험은 실시예 17에 기술된 바와 같이 20 g/L 락토스가 보충된 배지에서 성장하는 숙주 세포의 LN3 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하도록 설정되었다. 후보 유전자는 LN3 생산 숙주에서 pRS420 플라스미드에 존재하였다. 성장 실험은 실시예 17에 제공되는 배양 조건에 따라 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 19. 에스. 세레비지아에 숙주에서 락토-N-테트라오스 (LNT) 생산에 대해 시험된 막 단백질
실험은 실시예 17에 기술된 바와 같이 20 g/L 락토스가 보충된 배지에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 증력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 LNT 생산 숙주에서 pRS420 플라스미드에 존재하였다. 성장 실험은 실시예 17에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23을 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하는 각각의 LNT 생산 숙주에서 평가되었다.
실시예 20. 에스. 세레비지아에 숙주에서 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 실시예 17에 기술된 바와 같이 20 g/L 락토스가 보충된 배지에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 LNnT 생산 숙주에서 pRS420 플라스미드에 존재하였다. 성장 실험은 실시예 17에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNnT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하는 각각의 LNnT 생산 숙주에서 평가되었다.
실시예 21. 재료 및 방법 클라미도모나스 레인하르드티 (Chlamydomonas reinhardtii)
배지
씨. 레인하르드티 (C. reinhardtii) 세포는 Tris-아세테이트-포스페이트 (TAP) 배지 (pH 7.0)에서 배양되었다. TAP 배지는 1000x 스톡의 Hutner 미량 원소 믹스를 사용한다. Hutner 미량 원소 믹스는 50 g/L Na2EDTA.H2O (Titriplex III), 22 g/L ZnSO4.7H2O, 11.4 g/L H3BO3, 5 g/L MnCl2.4H2O, 5 g/L FeSO4.7H2O, 1.6 g/L CoCl2.6H2O, 1.6 g/L CuSO4.5H2O 및 1.1 g/L (NH4)6MoO3으로 이루어졌다.
TAP 배지는 2.42 g/L Tris (트리스(히드록시메틸)아미노메탄), 25 mg/L 염 스톡 용액, 0.108 g/L K2HPO4, 0.054 g/L KH2PO4 및 1.0 mL/L 빙초산을 함유하였다. 염 스톡 용액은 15 g/L NH4CL, 4 g/L MgSO4.7H2O 및 2 g/L CaCl2.2H2O로 이루어졌다. 단류 합성을 위한 전구체로서, 전구체 예컨대, 예를 들어, 락토스 (e.g. 20 g/L), 갈락토스, 글루코스, 프룩토스, 푸코스, GlcNAc가 첨가될 수 있었다. 배지는 오토클레이빙 (121℃, 21')으로 멸균되었다. 한천 상의 스톡 배양을 위해서, 1% 한천 (정제된 고강도, 1000 g/㎠)을 함유하는 슬랜트 TAP 배지를 사용하였다.
균주
씨. 레인하르드티 야생형 균주 21gr (CC-1690, 야생형, mt+), 6145C (CC-1691, 야생형, mt-), CC-125 (137c, 야생형, mt+), CC-124 (137c, 야생형, mt-)는 클라미도모나스 자원 센터 (Chlamydomonas Resource Center (https://www.chlamycollection.org), University of Minnesota, U.S.A.)에서 입수한 바와 같다.
플라스미드
발현 플라스미드는 클라미도모나스 자원 센터에서 입수한 대로, pSI103으로부터 기원한 것이다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR, 또는 제한 결찰을 사용해 수행되었다. (이종성) 유전자 발현에 적합한 프로모터는 예를 들어, Scranton et al. (Algal Res. 2016, 15: 135-142)에서 유래될 수 있다. 표적화된 유전자 변형 (예컨대 유전자 녹-아웃 또는 유전자 치환)은 예를 들어, Jiang et al. (Eukaryotic Cell 2014, 13(11): 1465-1469)이 기술한 바와 같이 Crispr-Cas 기술을 사용해 수행될 수 있다.
전기천공을 통한 형질전환은 Wang et al. (Biosci. Rep. 2019, 39: BSR2018210)에 기술된 대로 수행되었다. 세포는 세포 밀도가 1.0-2.0 Х 107 세포/mL에 도달할 때까지 8000 Lx의 빛 강도의 연속적인 빛 및 일정 통기 하에서 액체 TAP 배지 중에 성장되었다. 다음으로, 세포는 1.0 Х 106 세포/mL의 농도로 신선한 액체 TAP 배지에 접종되었고, 세포 밀도가 4.0 Х 106 세포/mL에 도달할 때까지 18-20시간 동안 연속적인 빛 아래서 성장되었다. 다음으로, 세포는 실온에서 5분 동안 1250 g의 원심분리를 통해 수집되었고, 세척하고, 60 mM 솔비톨 (Sigma, U.S.A.)을 함유하는 사전 냉각된 액체 TAP 배지에 재현탁시키고, 10분 동안 얼음에 두었다. 다음으로, 250 μL의 세포 현탁물 (5.0 Х 107 세포에 상응)은 100 ng 플라스미드 DNA (400 ng/mL)가 존재하는 사전 냉각된 0.4 cm 전기천공 큐벳에 넣었다. 전기 천공은 BTX ECM830 전기영동 장치 (1575 Ω, 50 μFD)를 사용하여 4 ms의 펄스 길이 및 100 ms의 펄스 간격 시간을 갖고 각각 500 V의 6회 펄스로 수행되었다. 전기천공 후에, 큐벳을 즉시 얼음에 10분 두었다. 마지막으로, 세포 현탁액은 서서히 진탕하면서 희미한 빛에서 밤샘 회수를 위해서 60 mM 솔비톨이 존재하는 10 mL의 신선한 액체 TAP 배지를 함유하는 50 mL 코니칼 원심분리 튜브로 옮겼다. 밤샘 회수 이후에, 세포를 재수집하였고 암피실린 (100 mg/L) 또는 클로람페니콜 (100 mg/L)를 함유하는 선택적 1.5% (w/v) 한천-TAP 플레이트 상에서 전분 포매 방법으로 도말하였다. 다음으로, 플레이트는 8000 Lx의 빛 강도로 연속 조사 하에 23 +-0.5℃에서 인큐베이션되었다. 세포는 5-7일 이후에 분석되었다.
UDP-갈락토스를 생산하기 위한 실시예에서, 씨. 레인하르드티 세포는 갈락토키나제 예컨대, 예를 들어, 아라비돕시스 탈리아나 (Arabidopsis thaliana) 유래의 것 (KIN, UniProt ID Q9SEE5) 및 UDP-당 파이로포스포릴라제 예컨대, 예를 들어, 에이. 탈리아나 유래 USP (UniProt ID Q9C5I1)를 코딩하는 유전자를 포함하는 전사 유닛에 의해 변형된다.
LN3을 생산하기 위한 실시예에서, 항상성 전사 유닛은 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtA (SEQ ID NO 22)를 포함한다. LNT 생산에 대한 실시예에서, LN3 생산 균주는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 WbgO (SEQ ID NO 23)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. LNnT 생산에 대한 실시예에서, LN3 생산 균주는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (SEQ ID NO 24)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다.
GDP-푸코스를 생산하기 위해서, 씨. 레인하르드티 세포는 GDP-푸코스 신타제 예컨대, 예를 들어, 아라비돕시스 탈리아나 유래의 것 (GER1, UniProt ID O49213)에 대한 전사 유닛에 의해 변형된다.
코어 삼당류로서 LN3을 갖는 푸코실화 올리고당을 추가로 생산하기 위해서, 씨. 레인하르드티 세포는 알파-1,2-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파이로리 유래 HpFutC (SEQ ID NO 29) 및/또는 알파-1,3-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파이로리 유래 HpFucT (SEQ ID NO 30)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드에 의해 변형될 수 있다.
다음 단계에서, 표 2 및 3에 열거된 바와 같은 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질은 상기 돌연변이체 균주에서 평가될 수 있다. 막 단백질 유전자는 항상성 전사 유닛으로 숙주의 게놈에 통합되거나 또는 적합한 발현 플라스미드에 존재하여 평가될 수 있다..
플라스미드로부터, 또는 게놈으로부터 발현이 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, Twist Biosciences 또는 IDT.
발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 추가로 촉진될 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.
배양 조건
씨. 레인하르드티의 세포는 8000 Lx의 빛 강도로 14/10시간 명암 주기 하에 23 +/- 0.5℃에서 선택적 TAP-한천 플레이트에서 배양되었다. 세포는 5 내지 7일 배양 후에 분석되었다.
고밀도 배양을 위해서, 세포는 밀폐 시스템 예컨대, 예를 들어, Chen et al. (Bioresour. Technol. 2011, 102: 71-81) 및 Johnson et al. (Biotechnol. Prog. 2018, 34: 811-827)에 기술된 바와 같이 수직 또는 수평 광생물반응기, 교반식 탱크 광생물반응기 또는 편평 패널 광생물반응기에서 배양될 수 있다.
분석적 분석
실시예 4의 이 섹션을 참조한다.
실시예 22. 씨. 레인하르드티 숙주에서 LN3 생산을 위해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 21 참조)에서 성장하는 숙주 세포의 LN3 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인을 통해서 LN3 생산 숙주에 존재하였다. 성장 실험은 실시예 21에 제공되는 배양 조건에 따라 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 23. 씨. 레인하르디티 숙주에서 락토-N-테트라오스 (LNT) 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 21 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LNT 생산 숙주에 존재하였다. 성장 실험은 실시예 21에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하는 각각의 LNT 생산 숙주에서 평가되었다.
실시예 24. 씨. 레인하르드티 숙주에서 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 21 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해서 LNnT 생산 숙주에 존재하였다. 성장 실험은 실시예 21에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNnT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하는 각각의 LNnT 생산 숙주에서 평가되었다.
실시예 25. 재료 및 방법 바실러스 서브틸리스
배지
2개 상이한 배지, 즉 풍부 LB (Luria Broth) 및 진탕 플라스크용 최소 배지가 사용된다. 최소 배지는 미량 원소 믹스를 사용한다.
미량 원소 믹스는 0.735 g/L CaCl2.2H2O, 0.1 g/L MnCl2.2H2O, 0.033 g/L CuCl2.2H2O, 0.06 g/L CoCl2.6H2O, 0.17 g/L ZnCl2, 0.0311 g/L H3BO4, 0.4 g/L Na2EDTA.2H2O 및 0.06 g/L Na2MoO4로 이루어졌다. Fe-시트레이트 용액은 0.135 g/L FeCl3.6H2O, 1 g/L Na-시트레이트 (Hoch 1973 PMC1212887)를 함유하였다.
LB 배지는 1% 트립톤 펩톤 (Difco, Erembodegem, Belgium), 0.5% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR. Leuven, Belgium)로 이루어졌다. LBA (Luria Broth agar) 플레이트는 12 g/L 한천 (Difco, Erembodegem, Belgium)이 첨가된 LB 배지로 이루어졌다.
진탕 플라스크 (MMsf) 실험용 최소 배지는 2.00 g/L (NH4)2SO4, 7.5 g/L KH2PO4, 17.5 g/L K2HPO4, 1.25 g/L Na-시트레이트, 0.25 g/L MgSO4.7H2O, 0.05 g/L 트립토판, 10 내지 30 g/L 글루코스 또는 실시예에서 명시할 때 프룩토스, 말토스, 수크로스, 글리세롤 및 말토트리오스를 포함하지만, 이에 제한되지 않는 다른 탄소 공급원, 10 ml/L 미량 원소 믹스 및 10 ml/L Fe-시트레이트 용액을 함유하였다. 배지는 1 M KOH를 사용해 7의 pH로 설정되었다. 실험에 따라서, 락토스 (20 g/L)가 첨가되었다.
복합 배지, 예를 들어 LB는 오토클레이빙 (121℃, 21')으로 최소 배지는 여과 (0.22 μm Sartorius)로 멸균되었다. 필요한 경우, 배지는 항생제 (예를 들어, 제오신 (20 mg/L))를 첨가하여 선택적으로 만들었다.
균주
바실러스 서브틸리스 168은 바실러스 유전자 자원 센터 (Bacillus Genetic Stock Center) (Ohio, USA)에서 입수가능하다.
플라스미드
Popp et al. (Sci. Rep., 2017, 7, 15158)가 기술한 통합 벡터가 발현 벡터로서 사용되었고 필요하면 게놈 통합에 추가로 사용될 수 있었다. 발현에 적합한 프로모터는 part repository (iGem): 서열 id: Bba_K143012, Bba_K823000, Bba_K823002 또는 Bba_K823003로부터 유래될 수 있다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR, 또는 제한 결찰을 사용해 수행되었다. LN3을 생산하기 위한 실시예에서, 바실러스 서브틸리스 돌연변이체 균주는 락토스 임포터 (예컨대, SEQ ID NO 52를 갖는 이.콜라이 lacY)를 코딩하는 유전자를 함유하고 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtA (SEQ ID NO 22)를 포함하는 항상성 전사 유닛을 더 포함하도록 생성된다. LNT 생산을 위한 실시예에서, LN3 생산 균주는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 WbgO (SEQ ID NO 23)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. LNnT 생산을 위한 실시예에서, LN3 생산 균주는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (SEQ ID NO 24)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. 코어 삼당류로서 LN3을 갖는 푸코실화 올리고당을 추가로 생산하기 위해, 비. 서브틸리스 세포는 알파-1,2-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파일로리 유래 HpFutC (SEQ ID NO 29) 및/또는 알파-1,3-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파일로리 유래 HpFucT (SEQ ID NO 30)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드에 의해 (또는 게놈 녹-인을 통해) 변형될 수 있다.
다음 단계에서, 표 2 및 3에 열거된 바와 같은 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질이 상기 돌연변이체 균주에서 평가될 수 있다. 막 단백질 유전자는 본 명세서에 기술된 바와 같은 적합한 발현 플라스미드에 존재하거나 또는 항상성 전사 유닛으로 숙주의 게놈에 통합되어 평가될 수 있다.
플라스미드로부터, 또는 게놈으로부터 발현이 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, Twist Biosciences 또는 IDT.
발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 추가로 촉진될 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.
배양 조건
96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL LB 중에서, 저온바이알 또는 LB 플레이트의 단일 콜로니로부터 출발하여서, 밤새 37℃에서, 800 rpm의 회전 진탕기에서 인큐베이션하였다. 이 배양은 400x로 희석하여, 400 μL MMsf의 96-웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용되었다. 각각의 균주는 생물학적 복제물로서 96-웰 플레이트의 다수 웰에서 성장되었다. 이들 최종 96-웰 배양 플레이트는 72시간, 또는 더 짧거나 또는 더 긴 동안 800 rpm의 회전 진탕기에 37℃에서 인큐베이션되었다.
분석적 분석
실시예 4의 이 섹션을 참조한다.
실시예 26. 비. 서브틸리스 숙주에서 LN3 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 25 참조)에서 성장하는 숙주 세포의 LN3 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LN3 생산 숙주에 존재하였다. 성장 실험은 실시예 25에 제공되는 배양 조건에 따라 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 27. 비. 서브틸리스 숙주에서 락토-N-테트라오스 (LNT) 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 25 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LNT 생산 숙주에 존재하였다. 성장 실험은 실시예 25에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하는 각각의 LNT 생산 숙주에서 평가되었다.
실시예 28. 비. 서브틸리스 숙주에서 락토-N-네오테트라오스 (LNnT) 생산 을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 25 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LNnT 생산 숙주에 존재하였다. 성장 실험은 실시예 25에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNnT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하는 각각의 LNnT 생산 숙주에서 평가되었다.
실시예 29. 재료 및 방법 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)
배지
2종의 상이한 배지, 즉 풍부 트립톤-효모 추출물 (TY) 배지 및 진탕 플라스크용 최소 배지 (MMsf)가 사용되었다. 최소 배지는 1000x 스톡 미량 원소 믹스를 사용한다.
미량 원소 믹스는 10 g/L CaCl2, 10 g/L FeSO4.7H2O, 10 g/L MnSO4.H2O, 1 g/L ZnSO4.7H2O, 0.2 g/L CuSO4, 0.02 g/L NiCl2.6H2O, 0.2 g/L 바이오틴 (pH 7.0) 및 0.03 g/L 프로토카테츄산로 이루어졌다.
진탕 플라스크 실험용 최소 배지 (MMsf)는 20 g/L (NH4)2SO4, 5 g/L 우레아, 1 g/L KH2PO4, 1 g/L K2HPO4, 0.25 g/L MgSO4.7H2O, 42 g/L MOPS, 10 내지 30 g/L 글루코스 또는 실시예에 명시될 때 프룩토스, 말토스, 수크로스, 글리세롤 및 말토트리오스를 포함하지만 이에 제한되지 않는 다른 탄소 공급원 및 1 ml/L 미량 원소 믹스를 함유하였다. 실험에 따라서, 락토스 (20 g/L)가 배지에 첨가되었다.
TY 배지는 1.6% 트립톤 (Difco, Erembodegem, Belgium), 1% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR. Leuven, Belgium)로 이루어졌다. TY 한천 (TYA) 플레이트는 12 g/L 한천 (Difco, Erembodegem, Belgium)이 첨가된 TY 배지로 이루어졌다.
복합 배지, 예를 들어, TY는 오토클레이빙 (121℃, 21') 및 최소 배지는 여과 여과 (0.22 μm Sartorius)로 멸균되었다. 필요한 경우, 배지는 항생제 (예를 들어, 카나마이신, 암피실린)를 첨가하여 선택적으로 만들었다.
균주
코리네박테리움 글루타미쿰 ATCC 13032는 미국 생물자원 센터 (American Type Culture Collection)에서 입수가능하다.
플라스미드
Suzuki et al. (Appl. Microbiol. Biotechnol., 2005 Apr, 67(2):225-33)에 기술된 Cre/loxP 기술 기반 통합 플라스미드 벡터 및 Okibe et al. (Journal of Microbiological Methods 85, 2011, 155-163)가 기술한 온도-민감성 셔틀 벡터가 유전자 결실, 돌연변이 및 삽입을 위해 구축된다. (이종성) 유전자 발현에 적합한 프로모터는 Yim et al. (Biotechnol. Bioeng., 2013 Nov, 110(11):2959-69)로부터 유래될 수 있다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR, 또는 제한 결찰을 사용해 수행되었다.
LN3을 생산하기 위한 실시예에서, 씨. 글루타미쿰 (C. glutamicum) 돌연변이체 균주는 락토스 임포터 (예컨대, SEQ ID NO 52 유래 이.콜라이 lacY)를 코딩하는 유전자를 함유하고 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtA (SEQ ID NO 22)를 포함하는 항상성 전사 유닛을 추가로 함유하도록 생성된다. LNT 생산을 위한 실시예에서, LN3 생산 균주는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 WbgO (SEQ ID NO 23)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. LNnT 생산을 위한 실시예에서, LN3 생산 균주은 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (SEQ ID NO 24)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. 코어 삼당류로서 LN3을 갖는 푸코실화 올리고당을 추가로 생산하기 위해서, 씨. 글루타미쿰 세포는 알파-1,2-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파일로리 유래 HpFutC (SEQ ID NO 29) 및/또는 알파-1,3-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파일로리 유래 HpFucT (SEQ ID NO 30)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드에 의해 변형될 수 있다 (또는 게놈 녹-인에 의함).
다음 단계에서, 표 2 및 3에 열거된 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질이 상기 돌연변이체 균주에서 평가될 수 있다. 막 단백질 유전자는 본 명세서에 기술된 바와 같은 적합한 발현 플라스미드에 존재하거나 또는 항상성 전사 유닛으로 숙주 게놈에 통합되어 평가될 수 있다.
플라스미드로부터, 또는 게놈으로부터 발현이 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, Twist Biosciences 또는 IDT.
발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 추가로 촉진될 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.
배양 조건
96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL TY 중에, TY 플레이트의 단일 콜로니 또는 저온 바이알로부터 출발하였고, 800 rpm의 회전 진탕기에서 밤새 37℃에서 인큐베이션되었다. 이 배양은 400x로 희석하여, 400 μL MMsf 배지의 96-웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용되었다. 각각의 균주는 생물학적 복제물로서 96-웰 플레이트의 다수 웰에서 성장되었다. 이들 최종 96-웰 배양 플레이트는 72시간, 또는 더 짧거나 또는 더 긴 동안 800 rpm의 회전 진탕기에 37℃에서 인큐베이션되었다.
분석적 분석
실시예 4의 이 섹션을 참조한다.
실시예 30. 씨. 글루타미쿰 숙주에서 LN3 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 29 참조)에서 성장하는 숙주 세포의 LN3 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 긱 균주는 실시예 29에 기술된 바와 같이 LN3의 생산을 위해 변형된다. 또한, 각각의 균주는 nagB, glmS 및 gamA 유전자의 게놈 녹-아웃 및 이.콜라이 유래 락토스 퍼미아제 (LacY) (SEQ ID NO 52), 천연 프룩토스-6-P-아미노트랜스퍼라제 (UniProt ID Q8NND3), 이.콜라이 W 유래 수크로스 수송체 (CscB) (UniProt ID E0IXR1), 지. 모빌리스 유래 프룩토스 키나제 (Frk) (UniProt ID Q03417) 및 비. 아돌레센트 유래 수크로스 포스포릴라제 (BaSP) (UniProt ID A0ZZH6)를 코딩하는 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 수크로스에서 성장된다. 후보 막 단백질 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LN3 생산 숙주에 존재하였다. 성장 실험은 실시예 29에 제공되는 배양 조건에 따라 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 31. 씨. 글루타미쿰 숙주에서 락토-N-테트라오스 (LNT) 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 29 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 각각의 균주는 실시예 29에 기술된 바와 같이 LNT의 생산을 위해 변형된다. 또한, 각각의 균주는 nagB, glmS 및 gamA 유전자의 게놈 녹-아웃 및 이.콜라이 유래 락토스 퍼미아제 (LacY) (SEQ ID NO 52), 천연 프룩토스-6-P-아미노트랜스퍼라제 (UniProt ID Q8NND3), 이.콜라이 W 유래 수크로스 수송체 (CscB) (UniProt ID E0IXR1), 지. 모빌리스 유래 프룩토스 키나제 (Frk) (UniProt ID Q03417) 및 비. 아돌레센티스 유래 수크로스 포스포릴라제 (BaSP) (UniProt ID A0ZZH6)를 코딩하는 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 수크로스에서 성장한다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LNT 생산 숙주에 존재한다. 성장 실험은 실시예 29에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및SEQ ID NO 23을 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하는 각각의 LNT 생산 숙주에서 평가되었다.
실시예 32. 씨. 글루타미쿰 숙주에서 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 29 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 각각의 균주는 실시예 29에 기술된 바와 같이 LNnT의 생산을 위해 변형된다. 또한, 각각의 균주는 이.콜라이 유래 락토스 퍼미아제 (LacY) (SEQ ID NO 52), 천연 프룩토스-6-P-아미노트랜스퍼라제 (UniProt ID Q8NND3), 이.콜라이 W 유래 수크로스 수송체 (CscB) (UniProt ID E0IXR1), 지. 모빌리스 유래 프룩토스 키나제 (Frk) (UniProt ID Q03417) 및 비. 아돌레센티스 유래 수크로스 포스포릴라제 (BaSP) (UniProt ID A0ZZH6)를 코딩하는 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 수크로스에서 성장한다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LNnT 생산 숙주에 존재하였다. 성장 실험은 실시예 29에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNnT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하는 각각의 LNnT 생산 숙주에서 평가되었다.
실시예 33. 재료 및 방법 동물 세포
상이한 포유동물의 지방 조직으로부터 중간엽 줄기 세포의 단리
신선한 지방 조직은 도살장 (예를 들어, 소, 돼지, 양, 닭, 오리, 메기, 뱀, 개구리) 또는 지방 흡입술 (예를 들어, 인간 경우, 사전 동의 후)로부터 수득되어서, 항생제가 보충된 포스페이트 완충 염수에 유지된다. 지방 조직의 효소 분해를 수행하고 중간엽 줄기 세포를 단리하기 위해 원심분리한다. 단리된 중간엽 줄기 세포를 세포 배양 플라스크로 옮겼고, 표준 성장 조건, 예컨대 37℃, 5% CO2 하에서 성장시킨다. 초기 배양 배지는 DMEM-F12, RPMI, 및 알파-MEM 배지 (15% 태아 소 혈청 보충), 및 1% 항생제를 포함한다. 배양 배지는 후속하여 제1 계대 이후에 10% FBS (태아 소 혈청)-보충된 배지로 대체된다. 예를 들어, 모든 목적을 위해 그 전문이 참조로 본 명헤서에 편입되는 Ahmad and Shakoori (2013, Stem Cell Regen Med. 9(2): 29- 36)는 이 실시예에서 본 명세서에 기술된 방법(들)의 일정 별형(들)을 기술한다.
모유로부터 중간엽 줄기 세포의 단리
이 실시예는 본 명세서에 기술된 바와 같이, 인간 또는 임의의 다른 포유동물(들)로부터 무균 조건 하에서 수집된 모유로부터 중간엽 줄기 세포의 단리를 예시한다. 동일 부피의 포스페이트 완충 염수를 희석된 모유에 첨가하고 나서, 20분 동안 원심분리한다. 세포 펠렛을 포스페이트 완충 염수로 3회 세척하고 세포는 표준 배양 조건 하에서 10% 태아 소 혈청 및 1% 항생제가 보충된 DMEM-F12, RPMI, 및 알파-MEM 배지의 세포 배양 플라스크에 파종한다. 예를 들어, 모든 목적을 위해 그 전문이 참조로 본 명세서에 편입되는, Hassiotou et al. (2012, Stem Cells. 30(10): 2164-2174)는 이 실시예에서 본 명세서에 기술된 방법(들)의 일정 별형(들)을 기술한다.
2D 및 3D 배양 시스템을 사용한 줄기 세포의 분화
단리된 중간엽 세포는 2D 및 3D 배양 시스템에서 유선-유사 상피 및 내강 세포로 분화될 수 있다. 예를 들어, 하기 문헌들을 참조하고 이들 각각은 모든 목적을 위해 그들 전문이 참조로 본 명세서에 편입된다: Huynh et al. 1991. Exp Cell Res. 197(2): 191 -199; Gibson et al. 1991, In Vitro Cell Dev Biol Anim. 27(7): 585-594; Blatchford et al. 1999; Animal Cell Technology': Basic & Applied Aspects, Springer, Dordrecht. 141-145; Williams et al. 2009, Breast Cancer Res 11(3): 26-43; 및 Arevalo et al. 2015, Am J Physiol Cell Physiol. 310(5): C348 - C356.
2D 배양 경우, 단리된 세포는 10 ng/mL 상피 성장 인자 및 5 pg/mL 인슐린이 보충된 성장 배지의 배양 플레이트에 초기에 파종되었다. 합류점에서, 세포는 2% 태아 소 혈청, 1% 페니실린-스트렙토마이신 (100 U/mL 페니실린, 100 ug/mL 스트렙토마이신), 및 5 pg/mL 인슐린이 보충된 성장 배지를 48시간 동안 공급받았다. 분화를 유도하기 위해서, 세포는 5 pg/mL 인슐린, 1 pg/mL 히드로코르티손, 0.65 ng/mL 트리아이오도티로닌, 100 nM 덱사메타손, 및 1 pg/mL 프로락틴을 함유하는 완전 성장 배지를 공급받았다. 24시간 후에, 혈청을 완전 유도 배지에서 제거한다.
3D 배양을 위해서, 단리된 세포는 트립신 처리되어, 마트리겔, 히알루론산, 또는 초-저 부착 표면 배양 플레이트에서 6일 동안 배양되었고 10 ng/mL 상피 성장 인자 및 5 pg/mL 인슐린이 보충된 성장 배지를 첨가하여 분화 및 락테이트를 유도하였다. 합류점에서, 세포는 2% 태아 소 혈청, 1% 페니실린-스트렙토마이신 (100 U/mL 페니실린, 100 ug/mL 스트렙토마이신), 및 5 pg/mL 인슐린이 보충된 성장 배지를 48시간 동안 공급받았다. 분화를 유도하기 위해서, 세포는 5 pg/mL 인슐린, 1 pg/mL 히드로코르티손, 0.65 ng/mL 트리아이오도티로닌, 100 nM 덱사메타손, 및 1 pg/mL 프로락틴을 함유하는 완전 성장 배지를 공급받았다. 24시간 후에, 혈청을 완전 유도 배지에서 제거한다.
유선-유사 세포의 제조 방법
포유동물 세포는 Oct4, Sox2, Klf4, 및 c-Myc를 코딩하는 바이러스 벡터에 의한 재프로그래밍을 통해서 유도 만능성이 된다. 최종 재프로그래밍된 세포는 Mammocult 배지 (Stem Cell Technologies에서 입수), 또는 유선 세포 농후화 배지 (DMEM, 3% FBS, 에스트로겐, 프로게스테론, 헤파린, 히드로코르티손, 인슐린, EGF)에서 배양되어서 그들을 유선-유사로 만들고, 이로부터 선택된 모유 성분의 발현을 유도할 수 있다. 대안적으로, 리모델링 시스템 예컨대, CRISPR/Cas9를 사용하여 후생적 리모델링을 수행하여서, 선택된 관심 유전자, 예컨대, 카세인, a-락트알부민을 항상적으로 활성화시켜서, 그들 개별 단백질의 발현을 허용하고/하거나, 모든 목적을 위해 그 전문이 참조로 본 명세서에 편입되는 예를 들어, WO21067641에 기술된 바와 같이 선택된 내생성 유전자를 하향조절 및/또는 녹-아웃시킬 수 있다.
배양
완전 성장 배지는 고 글루코스 DMEM/F12, 10% FBS, 1% NEAA, 1% pen/strep, 1% ITS-X, 1% F-Glu, 10 ng/mL EGF, 및 5 pg/mL 히드로코르티손을 포함한다. 완전 수유 배지는 고 글루코스 DMEM/F12, 1% NEAA, 1% pen/strep, 1% ITS-X, 1% F-Glu, 10 ng/mL EGF, 5 pg/mL 히드로코르티손, 및 1 pg/mL 프로락틴 (Hyunh 1991에서 5ug/mL)을 포함한다. 세포는 완전 성장 배지가 있는 콜라겐 코팅된 플라스크 상에 20,000 세포/㎠의 밀도로 파종되고, 완전 성장 배지에서 48시간 동안 부착 및 확장되도록 정치시키고, 그 이후에 배지를 완전 수유 배지로 바꿔준다. 수유 배지에 노출 후, 세포는 분화를 시작하고 성장을 멈춘다. 약 1주 이내에, 세포는 우유 지질, 락토스, 카세인 및 유장같은 수유 생산물(들)을 배지로 분비하기 시작한다. 수유 배지의 원하는 농도는 한외여과에 의한 희석 또는 농축으로 획득될 수 있다. 수유 배지의 원하는 염 균형은 예를 들어, 배지로부터 원치않는 대사 산물을 제거하기 위해, 투석을 통해 달성될 수 있다. 사용된 호르몬 및 다른 성장 인자는 수지 정제에 의해서, 예를 들어, His-태그화된 성장 인자를 제거하기 위한 니켈 수지의 사용을 통해서 선택적으로 추출되어서, 락테이트화된 생산물 중 오염물의 수준을 추가로 감소시킬 수 있다.
분석적 분석
실시예 4의 이 섹션을 참조한다.
실시예 34. 비-유선 성체 줄기 세포에서 LN3 생산에 대해 시험된 막 단백질
실험은 LN3 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 실시예 33에 기술된 바와 같이 유선-유사 세포로 재프로그램된 단리된 중간엽 세포는 호모 사피엔스 유래 GlcN6P 신타제 (UniProt ID Q06210), 호모 사피엔스 유래 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 (UniProt ID Q96EK6), 호모 사피엔스 유래 포스포아세틸글루코사민 뮤타제 (UniProt ID O95394), UDP-N-아세틸헥소사민 파이로포스포릴라제 (UniProt ID Q16222) 및 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 LgtA를 과발현시키도록 CRISPR-CAS를 통해서 변형된다. 도입된 모든 유전자는 숙주 세포에 대해 코돈-최적화된다. 또한 후보 막 단백질 유전자는 LN3 생산 숙주 (CRISPR-CAS)에 도입되었다. 성장 실험은 실시예 33에 제공된 배양 조건에 따라 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 35. 비-유선 성체 줄기 세포에서 락토-N-테트라오스 (LNT) 생산에 대해 시험된 막 단백질
실험은 LN3 및/또는 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 실시예 33에 기술된 바와 같이 유선-유사 세포로 재프로그래밍된 단리된 중간엽 세포는 호모 사피엔스 유래 GlcN6P 신타제 (UniProt ID Q06210), 호모 사피엔스 유래 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 (UniProt ID Q96EK6), 호모 사피엔스 유래 포스포아세틸글루코사민 뮤타제 (UniProt ID O95394), UDP-N-아세틸헥소사민 파이로포스포릴라제 (UniProt ID Q16222), SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 LgtA 및 SEQ ID NO 23을 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 과발현하도록 CRISPR-CAS를 통해 변형된다. 도입된 모든 유전자는 숙주 세포에 대해 코돈-최적화된다. 또한, 후보 막 단백질 유전자가 LNT 생산 숙주에 도입되었다 (CRISPR-CAS). 성장 실험은 실시예 33에 제공된 배양 조건에 따라 수행되었다. LN3 및 LNT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23을 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하는 각각의 LNT 생산 숙주에서 평가되었다.
실시예 36. 비-유선 성체 줄기 세포 에서 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 실시예 33에 기술된 바와 같이 유선-유사 세포로 재프로그래밍된 단리된 중간엽 세포는 호모 사피엔스 유래 GlcN6P 신타제 (UniProt ID Q06210), 호모 사피엔스 유래 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 (UniProt ID Q96EK6), 호모 사피엔스 유래 포스포아세틸글루코사민 뮤타제 (UniProt ID O95394), UDP-N-아세틸헥소사민 파이로포스포릴라제 (UniProt ID Q16222), SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 LgtA 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 과발현하도록 CRISPR-CAS를 통해 변형된다. 도입된 모든 유전자는 숙주 세포에 대해 코돈-최적화된다. 또한 후보 막 단백질 유전자는 LNnT 생산 숙주에 도입되었다 (CRISPR-CAS). 성장 실험은 실시예 33에 제공된 배양 조건에 따라 수행되었다. LN3 및 LNnT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하는 각각의 LNnT 생산 숙주에서 평가되었다.
<110> Inbiose N.V.
<120> Production of oligosaccharides comprising LN3 as core structure
in host cells
<130> 035-PCT
<150> EP21152592.8
<151> 2021-01-20
<160> 98
<170> PatentIn version 3.5
<210> 1
<211> 410
<212> PRT
<213> Cronobacter muytjensii
<400> 1
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ala Gly Leu Ala Leu Ala Ala Phe
290 295 300
Ala Thr Leu Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Ile Gly Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Leu Ala Asn Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Ala Ser Arg Glu Gly
405 410
<210> 2
<211> 411
<212> PRT
<213> Yokenella regensburgei (ATCC43003)
<400> 2
Met Gln Asn His Thr Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Ile Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Phe Ala Pro Trp Glu Thr Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Ser Ala Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Met Ser Gly Glu His Ala Ser Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ala Ala Ala
340 345 350
Met Gly Met Leu Gln Met Met Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Gly Gly Leu Val Trp Leu Val Leu Ile Val Tyr Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Ala Ser Thr Lys Pro Asp
405 410
<210> 3
<211> 410
<212> PRT
<213> Escherichia coli strain K12 (MG1655)
<400> 3
Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Leu Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Leu Val Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Gln Met Gly Asn Ser His Glu Gly
405 410
<210> 4
<211> 411
<212> PRT
<213> Enterobacter sp.
<400> 4
Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Ala Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Met Val Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Tyr Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Gln Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Cys Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Asn Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn
260 265 270
Ile Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ile Gly Leu Val Val Ala Ala Val
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Val Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Phe Ser Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Val Asn Gly Leu Leu Trp Leu Ala Leu Met Phe Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ser Leu Gln Pro Gly
405 410
<210> 5
<211> 410
<212> PRT
<213> Citrobacter koseri (Citrobacter diversus)
<400> 5
Met Gln Asn Leu Ser Gln Thr Gly Val Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Thr Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Leu Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asp Ser Arg Glu Gly
405 410
<210> 6
<211> 410
<212> PRT
<213> Citrobacter youngae ATCC 29220
<400> 6
Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Leu Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Ala Leu Ala Ser Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Ile Lys Glu Leu
195 200 205
Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu His Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Ala Leu Ala Arg Leu Thr Ser Arg Lys Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Val Gly Leu Val Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Ser Gly Val Leu Trp Leu Ile Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ser Arg Lys Ile
405 410
<210> 7
<211> 416
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 7
Met Asn Lys Gln Ser Trp Leu Leu Asn Leu Ser Leu Leu Lys Thr His
1 5 10 15
Pro Ala Phe Arg Ala Val Phe Leu Ala Arg Phe Ile Ser Ile Val Ser
20 25 30
Leu Gly Leu Leu Gly Val Ala Val Pro Val Gln Ile Gln Met Met Thr
35 40 45
His Ser Thr Trp Gln Val Gly Leu Ser Val Thr Leu Thr Gly Gly Ala
50 55 60
Met Phe Val Gly Leu Met Val Gly Gly Val Leu Ala Asp Arg Tyr Glu
65 70 75 80
Arg Lys Lys Val Ile Leu Leu Ala Arg Gly Thr Cys Gly Ile Gly Phe
85 90 95
Ile Gly Leu Cys Leu Asn Ala Leu Leu Pro Glu Pro Ser Leu Leu Ala
100 105 110
Ile Tyr Leu Leu Gly Leu Trp Asp Gly Phe Phe Ala Ser Leu Gly Val
115 120 125
Thr Ala Leu Leu Ala Ala Thr Pro Ala Leu Val Gly Arg Glu Asn Leu
130 135 140
Met Gln Ala Gly Ala Ile Thr Met Leu Thr Val Arg Leu Gly Ser Val
145 150 155 160
Ile Ser Pro Met Ile Gly Gly Leu Leu Leu Ala Thr Gly Gly Val Ala
165 170 175
Trp Asn Tyr Gly Leu Ala Ala Ala Gly Thr Phe Ile Thr Leu Leu Pro
180 185 190
Leu Leu Ser Leu Pro Ala Leu Pro Pro Pro Pro Gln Pro Arg Glu His
195 200 205
Pro Leu Lys Ser Leu Leu Ala Gly Phe Arg Phe Leu Leu Ala Ser Pro
210 215 220
Leu Val Gly Gly Ile Ala Leu Leu Gly Gly Leu Leu Thr Met Ala Ser
225 230 235 240
Ala Val Arg Val Leu Tyr Pro Ala Leu Ala Asp Asn Trp Gln Met Ser
245 250 255
Ala Ala Gln Ile Gly Phe Leu Tyr Ala Ala Ile Pro Leu Gly Ala Ala
260 265 270
Ile Gly Ala Leu Thr Ser Gly Lys Leu Ala His Ser Ala Arg Pro Gly
275 280 285
Leu Leu Met Leu Leu Ser Thr Leu Gly Ser Phe Leu Ala Ile Gly Leu
290 295 300
Phe Gly Leu Met Pro Met Trp Ile Leu Gly Val Val Cys Leu Ala Leu
305 310 315 320
Phe Gly Trp Leu Ser Ala Val Ser Ser Leu Leu Gln Tyr Thr Met Leu
325 330 335
Gln Thr Gln Thr Pro Glu Ala Met Leu Gly Arg Ile Asn Gly Leu Trp
340 345 350
Thr Ala Gln Asn Val Thr Gly Asp Ala Ile Gly Ala Ala Leu Leu Gly
355 360 365
Gly Leu Gly Ala Met Met Thr Pro Val Ala Ser Ala Ser Ala Ser Gly
370 375 380
Phe Gly Leu Leu Ile Ile Gly Val Leu Leu Leu Leu Val Leu Val Glu
385 390 395 400
Leu Arg His Phe Arg Gln Thr Pro Pro Gln Val Thr Ala Ser Asp Ser
405 410 415
<210> 8
<211> 405
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 8
Met Ala Thr Ala Trp Tyr Lys Gln Val Asn Pro Pro Gln Arg Lys Ala
1 5 10 15
Leu Phe Ser Ala Trp Leu Gly Tyr Val Phe Asp Gly Phe Asp Phe Met
20 25 30
Met Ile Phe Tyr Ile Leu His Ile Ile Lys Ala Asp Leu Gly Ile Thr
35 40 45
Asp Ile Gln Ala Thr Leu Ile Gly Thr Val Ala Phe Ile Ala Arg Pro
50 55 60
Ile Gly Gly Gly Phe Phe Gly Ala Met Ala Asp Lys Tyr Gly Arg Lys
65 70 75 80
Pro Met Met Met Trp Ala Ile Phe Ile Tyr Ser Val Gly Thr Gly Leu
85 90 95
Ser Gly Ile Ala Thr Asn Leu Tyr Met Leu Ala Val Cys Arg Phe Ile
100 105 110
Val Gly Leu Gly Met Ser Gly Glu Tyr Ala Cys Ala Ser Thr Tyr Ala
115 120 125
Val Glu Ser Trp Pro Lys Asn Leu Gln Ser Lys Ala Ser Ala Phe Leu
130 135 140
Val Ser Gly Phe Ser Val Gly Asn Ile Ile Ala Ala Gln Ile Ile Pro
145 150 155 160
Gln Phe Ala Glu Val Tyr Gly Trp Arg Asn Ser Phe Phe Ile Gly Leu
165 170 175
Leu Pro Val Leu Leu Val Leu Trp Ile Arg Lys Ser Ala Pro Glu Ser
180 185 190
Gln Glu Trp Ile Glu Asp Lys Tyr Lys Asp Lys Ser Thr Phe Leu Ser
195 200 205
Val Phe Arg Lys Pro His Leu Ser Ile Ser Met Ile Val Phe Leu Val
210 215 220
Cys Phe Cys Leu Phe Gly Ala Asn Trp Pro Ile Asn Gly Leu Leu Pro
225 230 235 240
Ser Tyr Leu Ala Asp Asn Gly Val Asn Thr Val Val Ile Ser Thr Leu
245 250 255
Met Thr Ile Ala Gly Leu Gly Thr Leu Thr Gly Thr Ile Phe Phe Gly
260 265 270
Phe Val Gly Asp Lys Ile Gly Val Lys Lys Ala Phe Val Val Gly Leu
275 280 285
Ile Thr Ser Phe Ile Phe Leu Cys Pro Leu Phe Phe Ile Ser Val Lys
290 295 300
Asn Ser Ser Leu Ile Gly Leu Cys Leu Phe Gly Leu Met Phe Thr Asn
305 310 315 320
Leu Gly Ile Ala Gly Leu Val Pro Lys Phe Ile Tyr Asp Tyr Phe Pro
325 330 335
Thr Lys Leu Arg Gly Leu Gly Thr Gly Leu Ile Tyr Asn Leu Gly Ala
340 345 350
Thr Gly Gly Met Ala Ala Pro Val Leu Ala Thr Tyr Ile Ser Gly Tyr
355 360 365
Tyr Gly Leu Gly Val Ser Leu Phe Ile Val Thr Val Ala Phe Ser Ala
370 375 380
Leu Leu Ile Leu Leu Val Gly Phe Asp Ile Pro Gly Lys Ile Tyr Lys
385 390 395 400
Leu Ser Val Ala Lys
405
<210> 9
<211> 416
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 9
Met Ser Leu Ala Lys Ala Ser Leu Trp Thr Ala Ala Ser Thr Leu Val
1 5 10 15
Lys Ile Gly Ala Gly Leu Leu Val Gly Lys Leu Leu Ala Val Ser Phe
20 25 30
Gly Pro Ala Gly Leu Gly Leu Ala Ala Asn Phe Arg Gln Leu Ile Thr
35 40 45
Val Leu Gly Val Leu Ala Gly Ala Gly Ile Phe Asn Gly Val Thr Lys
50 55 60
Tyr Val Ala Gln Tyr His Asp Asn Pro Gln Gln Leu Arg Arg Val Val
65 70 75 80
Gly Thr Ser Ser Ala Met Val Leu Gly Phe Ser Thr Leu Met Ala Leu
85 90 95
Val Phe Val Leu Ala Ala Ala Pro Ile Ser Gln Gly Leu Phe Gly Asn
100 105 110
Thr Asp Tyr Gln Gly Leu Val Arg Leu Val Ala Leu Val Gln Met Gly
115 120 125
Ile Ala Trp Gly Asn Leu Leu Leu Ala Leu Met Lys Gly Phe Arg Asp
130 135 140
Ala Ala Gly Asn Ala Leu Ser Leu Ile Val Gly Ser Leu Ile Gly Val
145 150 155 160
Leu Ala Tyr Tyr Val Ser Tyr Arg Leu Gly Gly Tyr Glu Gly Ala Leu
165 170 175
Leu Gly Leu Ala Leu Ile Pro Ala Leu Val Val Ile Pro Ala Ala Ile
180 185 190
Met Leu Ile Lys Arg Gly Val Ile Pro Leu Ser Tyr Leu Lys Pro Ser
195 200 205
Trp Asp Asn Gly Leu Ala Gly Gln Leu Ser Lys Phe Thr Leu Met Ala
210 215 220
Leu Ile Thr Ser Val Thr Leu Pro Val Ala Tyr Ile Met Met Arg Lys
225 230 235 240
Leu Leu Ala Ala Gln Tyr Ser Trp Asp Glu Val Gly Ile Trp Gln Gly
245 250 255
Val Ser Ser Ile Ser Asp Ala Tyr Leu Gln Phe Ile Thr Ala Ser Phe
260 265 270
Ser Val Tyr Leu Leu Pro Thr Leu Ser Arg Leu Thr Glu Lys Arg Asp
275 280 285
Ile Thr Arg Glu Val Val Lys Ser Leu Lys Phe Val Leu Pro Ala Val
290 295 300
Ala Ala Ala Ser Phe Thr Val Trp Leu Leu Arg Asp Phe Ala Ile Trp
305 310 315 320
Leu Leu Leu Ser Asn Lys Phe Thr Ala Met Arg Asp Leu Phe Ala Trp
325 330 335
Gln Leu Val Gly Asp Val Leu Lys Val Gly Ala Tyr Val Phe Gly Tyr
340 345 350
Leu Val Ile Ala Lys Ala Ser Leu Arg Phe Tyr Ile Leu Ala Glu Val
355 360 365
Ser Gln Phe Thr Leu Leu Met Val Phe Ala His Trp Leu Ile Pro Ala
370 375 380
His Gly Ala Leu Gly Ala Ala Gln Ala Tyr Met Ala Thr Tyr Ile Val
385 390 395 400
Tyr Phe Ser Leu Cys Cys Gly Val Phe Leu Leu Trp Arg Arg Arg Ala
405 410 415
<210> 10
<211> 110
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 10
Met Asn Pro Tyr Ile Tyr Leu Gly Gly Ala Ile Leu Ala Glu Val Ile
1 5 10 15
Gly Thr Thr Leu Met Lys Phe Ser Glu Gly Phe Thr Arg Leu Trp Pro
20 25 30
Ser Val Gly Thr Ile Ile Cys Tyr Cys Ala Ser Phe Trp Leu Leu Ala
35 40 45
Gln Thr Leu Ala Tyr Ile Pro Thr Gly Ile Ala Tyr Ala Ile Trp Ser
50 55 60
Gly Val Gly Ile Val Leu Ile Ser Leu Leu Ser Trp Gly Phe Phe Gly
65 70 75 80
Gln Arg Leu Asp Leu Pro Ala Ile Ile Gly Met Met Leu Ile Cys Ala
85 90 95
Gly Val Leu Ile Ile Asn Leu Leu Ser Arg Ser Thr Pro His
100 105 110
<210> 11
<211> 507
<212> PRT
<213> Bifidobacterium longum subsp. Infantis (strain ATCC 15697)
<400> 11
Met Ser Asn Glu Asn Thr Ala Val Gly Asp Val Arg Lys Lys Gly Gly
1 5 10 15
Leu Gly Gln Arg Ile Ala Tyr Ala Cys Gly Asn Leu Gly Gln Ala Ala
20 25 30
Phe Tyr Asn Ala Met Ser Thr Tyr Phe Val Thr Tyr Val Thr Ser Cys
35 40 45
Leu Phe Val Ser Tyr Ser Lys Ala Leu Ala Ala Gln Met Ile Ala Val
50 55 60
Ile Thr Gly Leu Ile Val Val Ile Arg Ile Ala Glu Ile Phe Ile Asp
65 70 75 80
Pro Leu Leu Gly Asn Leu Val Asp Asn Thr Thr Thr Lys Trp Gly Arg
85 90 95
Phe Arg Pro Trp Gln Phe Ile Gly Gly Leu Val Ser Ser Val Leu Ile
100 105 110
Met Leu Ile Phe Ser Gly Met Phe Gly Leu Val Asn Val Asn Thr Thr
115 120 125
Leu Phe Ile Val Leu Phe Val Ile Thr Phe Ile Val Leu Asp Val Phe
130 135 140
Tyr Ser Leu Arg Asp Ile Ser Tyr Trp Gly Met Ile Pro Ala Leu Ser
145 150 155 160
Ser Asp Ser His Glu Arg Ser Thr Tyr Thr Ala Leu Gly Thr Phe Thr
165 170 175
Gly Ser Ile Gly Tyr Asn Gly Ile Thr Val Ile Val Ile Pro Ile Val
180 185 190
Ser Tyr Phe Thr Trp Thr Phe Thr Gly Ala Lys Gly Gln Gly Gln Ala
195 200 205
Gly Trp Thr Ser Phe Gly Phe Ile Val Ala Leu Leu Gly Leu Ile Thr
210 215 220
Ala Trp Ala Val Ala Phe Gly Thr Lys Glu Ser Thr Asn Ala Leu Arg
225 230 235 240
Ala Lys Ala Gln Lys Asn Gly Asn Pro Phe Glu Ala Phe Lys Ala Leu
245 250 255
Phe Gln Asn Asp Gln Leu Leu Trp Val Ala Leu Ser Tyr Leu Leu Tyr
260 265 270
Ala Ile Ala Asn Val Ile Thr Thr Gly Val Met Tyr Tyr Leu Phe Val
275 280 285
Phe Val Leu Asp Glu Pro Ala Ala Phe Ser Val Thr Gly Ile Ile Pro
290 295 300
Leu Ile Ala Gly Phe Ile Met Ala Pro Leu Tyr Pro Ile Leu Asn Arg
305 310 315 320
Trp Ile Pro Arg Arg Tyr Leu Phe Ala Gly Gly Met Val Ser Met Ile
325 330 335
Ile Gly Tyr Thr Met Leu Ala Leu Phe Ser Ser Asn Leu Pro Val Val
340 345 350
Ile Val Ala Leu Ile Phe Phe Tyr Val Pro Ala Gln Phe Ile Gln Met
355 360 365
Thr Ala Ile Leu Ser Leu Thr Asp Ser Ile Glu Tyr Gly Gln Leu Lys
370 375 380
Asn Gly Lys Arg Asn Glu Ala Val Thr Leu Ser Val Arg Pro Met Leu
385 390 395 400
Asp Lys Ile Gly Gly Ala Met Ser Asn Gly Val Val Gly Ala Val Ala
405 410 415
Leu Ala Ala Gly Met Thr Gly His Ala Thr Ala Ala Asp Met Thr Ala
420 425 430
Ser Asn Ile Thr Thr Phe Lys Thr Phe Ala Phe Tyr Ile Pro Leu Val
435 440 445
Leu Ile Ile Leu Ser Leu Val Val Phe Trp Phe Lys Val Lys Ile Asp
450 455 460
Glu Lys Met His Ala Gln Ile Val Asp Glu Leu Glu Ala Lys Leu Ala
465 470 475 480
Ser Gly Glu Ile Val Asp Asp Glu Ala Gln Thr Val Glu Ala Val Glu
485 490 495
Ala Ile Asn Glu Glu Thr Pro Ala Ala Lys Asn
500 505
<210> 12
<211> 405
<212> PRT
<213> Bifidobacterium longum subsp. Infantis (strain ATCC 15697)
<400> 12
Met Ala Leu Asp Val Gly Lys Ala Leu Lys Ser Lys Thr Leu Val Val
1 5 10 15
Gly Val Leu Ser Met Ser Leu Leu Met Ser Ala Ser Asn Ala Val Ser
20 25 30
Gly Thr Ile Pro Ala Met Lys Glu Ala Phe Ser Asp Tyr Ser Ala Ala
35 40 45
Asn Val Glu Leu Leu Thr Thr Val Pro Thr Ile Gly Ser Met Val Gly
50 55 60
Thr Ala Leu Thr Gly Leu Phe Ala Asn Ala Ile Gly Arg Lys Lys Ile
65 70 75 80
Ala Met Ala Gly Phe Leu Ile Ser Ala Val Thr Gly Val Ile Pro Ala
85 90 95
Phe Phe Pro Tyr Tyr Trp Pro Ile Leu Ile Ser Arg Met Phe Phe Gly
100 105 110
Phe Gly Ser Ala Leu Phe Val Thr Leu Ser Val Ser Tyr Ile Thr Asp
115 120 125
Leu Tyr Asp Gly Asp Met Gln Arg Lys Leu Leu Gly Trp Arg Gln Ala
130 135 140
Val Gly Asn Leu Gly Asp Val Val Leu Leu Phe Val Ala Ser Leu Leu
145 150 155 160
Ile Thr Ile Asn Trp Gln Ser Thr Tyr Leu Ile Phe Phe Leu Leu Phe
165 170 175
Val Pro Met Val Leu Val Gly Met Phe Ile Pro Lys Glu Phe Asp Asn
180 185 190
Phe Ser Ile Arg Ser Ala Leu Val Asp Asp Glu Gly His Val Val Asp
195 200 205
Lys Ser Ala Ser Gln Lys Gln Thr Thr Asn Trp Gln Val Leu Trp Leu
210 215 220
Ala Phe Ile Phe Leu Val Val Ser Met Leu Tyr Asn Val Met Ser Ile
225 230 235 240
Lys Leu Ala Ser Tyr Val Val Asp Glu Gly Ile Gly Ser Ala Ser Leu
245 250 255
Ala Thr Leu Ile Phe Ser Phe Leu Val Val Ala Thr Ile Leu Ser Gly
260 265 270
Val Leu Phe Asp Lys Val Ala Lys Val Thr Lys Arg Leu Thr Val Thr
275 280 285
Ile Ser Glu Val Val Ile Gly Ile Cys Phe Ile Ala Thr Ala Leu Thr
290 295 300
Lys Asn Val Pro Leu Met Phe Ala Leu Val Leu Ile Ala Gly Phe Ala
305 310 315 320
Trp Gly Ile Ile Asn Pro Ala Leu Thr Ala Arg Phe Val Asp Tyr Ser
325 330 335
Pro Ala His Ser Met Asn Leu Thr Thr Ser Ile Val Ile Ile Gly Ile
340 345 350
Asn Ile Gly Cys Leu Ile Ser Pro Tyr Phe Phe Ala Leu Thr Ala Ser
355 360 365
Ile Phe Gly Asn Ser Ser Ala Gly Phe Ala Ile Ile Val Gly Gly Ala
370 375 380
Leu Tyr Leu Val Met Val Val Ile Glu Leu Ile Thr Leu Lys Val Asp
385 390 395 400
Lys Lys Leu Thr Val
405
<210> 13
<211> 407
<212> PRT
<213> Bifidobacterium longum subsp. Infantis (strain ATCC 15697)
<400> 13
Met Ser Lys Ile Ile Asn Tyr Ser Glu Val Leu Glu Ser Lys Arg Leu
1 5 10 15
Met Val Gly Val Leu Ser Val Ser Phe Leu Leu Ser Ala Gly Asn Ala
20 25 30
Ile Ser Gly Thr Ile Pro Ala Met Glu Glu Ala Phe Ser Asn Ile Ser
35 40 45
Lys Ala Asn Ile Glu Thr Leu Thr Thr Ile Pro Thr Ala Gly Ile Met
50 55 60
Leu Gly Thr Val Leu Ser Gly Val Phe Ser Asn Tyr Leu Gly Lys Lys
65 70 75 80
Lys Ser Val Leu Ala Gly Leu Ile Ile Ala Leu Val Gly Gly Val Ile
85 90 95
Pro Ala Phe Leu Pro Gln Tyr Trp Pro Ile Phe Ile Ser Arg Phe Leu
100 105 110
Phe Gly Val Gly Met Gly Ile Phe Asn Pro Leu Ser Val Ser Tyr Ile
115 120 125
Thr Asp Leu Tyr Val Gly Asp Arg Gln Arg Ser Leu Leu Gly Tyr Arg
130 135 140
Asn Ala Val Ser Asn Leu Gly Asp Thr Ile Met Leu Phe Val Ala Gly
145 150 155 160
Ile Leu Ile Thr Phe Gly Trp Asn Ile Thr Tyr Leu Val Phe Phe Ala
165 170 175
Leu Leu Ile Pro Ile Val Leu Ile Ile Leu Phe Val Pro Lys Glu Phe
180 185 190
Asp Asn Phe Asp Ile Arg Asn Ser Ala Leu Asp Glu Asn Gly Gln Ile
195 200 205
Ser Asp Ser Val Ser Asp Val Lys Pro Ser Thr Asn Leu Lys Val Ile
210 215 220
Glu Val Gly Val Val Phe Met Val Ile Thr Met Leu Tyr Asn Ala Ile
225 230 235 240
Pro Leu Lys Phe Ala Ser Tyr Ile Val Thr Glu His Ile Gly Thr Ala
245 250 255
Ser Thr Ala Thr Trp Ile Phe Ser Phe Leu Val Leu Ala Gly Ile Phe
260 265 270
Ser Gly Val Leu Phe Glu Lys Ile Ser Lys Val Phe Lys Arg Leu Thr
275 280 285
Val Phe Val Phe Glu Ile Val Ile Gly Val Ala Tyr Ile Thr Ile Ala
290 295 300
Phe Thr Tyr Asn Ile Pro Leu Leu Thr Ala Leu Val Leu Ile Ser Gly
305 310 315 320
Phe Gly Trp Gly Ile Ile Asn Pro Ala Leu Thr Ala Arg Leu Val Asp
325 330 335
Val Ser Pro Ile Asn Ser Met Asn Leu Ser Thr Ser Ile Ile Val Ile
340 345 350
Phe Ile Ser Val Gly Ser Leu Ile Ser Pro Tyr Phe Phe Ala Met Phe
355 360 365
Ala Gly Leu Phe Gly Asn Asp Ser Ala Ala Phe Ala Ile Val Val Gly
370 375 380
Gly Ala Leu Tyr Val Val Met Ala Val Leu Asp Phe Ile Lys Ile Lys
385 390 395 400
Lys Asn Lys Glu Leu Ser Ile
405
<210> 14
<211> 471
<212> PRT
<213> Klebsiella pneumoniae
<400> 14
Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Leu Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Val Val Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Trp Ser Ser
85 90 95
Thr Leu Asn Glu Leu Val Leu Ala Arg Val Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Ile Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val
165 170 175
Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Val Gly Met Ala
195 200 205
Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Leu Ser Pro
210 215 220
Leu Ser Leu Gly Ala Leu Val Leu Cys Gly Ile Leu Ala Ile Ala Leu
225 230 235 240
Tyr Leu Lys His Ala Lys Asn Asn Pro Arg Ala Leu Phe Ser Leu Ala
245 250 255
Leu Phe Arg Thr His Thr Phe Ser Leu Gly Leu Ser Gly Ser Phe Ala
260 265 270
Gly Arg Val Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ser Thr Thr Leu Gly
325 330 335
Leu Ser Leu Val Ser Leu Leu Phe Met Ser Val Ala Met Leu Gly Trp
340 345 350
Tyr Tyr Ala Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser
355 360 365
Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Glu Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Met Phe
405 410 415
Gly Gln Gln His Ile Ala Ala Asp Ser Gly Ala Ser His Thr Val Phe
420 425 430
Met Tyr Thr Trp Leu Cys Met Ala Leu Ile Ile Ala Leu Pro Ala Leu
435 440 445
Ile Phe Ala Arg Val Pro Asn Asp Thr His Lys Asn Ala Val Ile Ser
450 455 460
Arg Arg Lys Arg Ser Thr Gln
465 470
<210> 15
<211> 375
<212> PRT
<213> Bifidobacterium longum subsp. Infantis (strain ATCC 15697)
<400> 15
Met Ala Glu Val Val Phe Asp His Val Thr Arg Ile Tyr Pro Gly Asn
1 5 10 15
Asp Lys Pro Ser Val Asp Asp Leu Asn Leu Asp Ile Lys Asp Gly Glu
20 25 30
Phe Leu Val Leu Val Gly Pro Ser Gly Cys Gly Lys Ser Thr Thr Leu
35 40 45
Arg Met Leu Ala Gly Leu Glu Glu Val Asn Lys Gly Arg Ile Leu Ile
50 55 60
Gly Gly Lys Asp Val Thr Thr Met Gln Pro Lys Asp Arg Asp Ile Ala
65 70 75 80
Met Val Phe Gln Asn Tyr Ala Leu Tyr Pro His Met Thr Val Ala Asp
85 90 95
Asn Met Gly Phe Ala Leu Lys Ile Ala Gly Thr Pro Lys Asp Glu Ile
100 105 110
Arg Lys Arg Val Glu Lys Ala Ala Glu Ile Leu Asp Leu Thr Glu Tyr
115 120 125
Leu Asp Arg Lys Pro Lys Ala Leu Ser Gly Gly Gln Arg Gln Arg Val
130 135 140
Ala Met Gly Arg Ala Ile Val Arg Glu Pro Lys Val Phe Leu Met Asp
145 150 155 160
Glu Pro Leu Ser Asn Leu Asp Ala Lys Leu Arg Val Gln Thr Arg Thr
165 170 175
Gln Ile Ala Ala Leu Gln Arg Gln Leu Gly Val Thr Thr Leu Tyr Val
180 185 190
Thr His Asp Gln Thr Glu Ala Leu Thr Met Gly Asp Arg Ile Ala Val
195 200 205
Ile Lys Leu Gly Ile Leu Gln Gln Val Gly Ala Pro Thr Glu Leu Tyr
210 215 220
Asp Arg Pro Ala Asn Val Phe Val Ala Gly Phe Ile Gly Ser Pro Ser
225 230 235 240
Met Asn Leu Asn Thr His Pro Val Val Asn Gly Lys Ala Lys Ile Gly
245 250 255
Glu Asp Thr Val Asp Leu Pro Ala Glu Ala Val Asn Lys Leu Thr Ala
260 265 270
Glu Asp Asn Gly Gln Ile Val Val Gly Phe Arg Pro Glu Asp Ala Gly
275 280 285
Leu Ala Pro Val Asp Asp Pro Asn Ala Phe Ser Leu Lys Val Val Asn
290 295 300
Val Glu Asp Leu Gly Ser Asp Gly Tyr Ile Tyr Gly Thr Ile Val Thr
305 310 315 320
Asp Gly Ser Ala Ala Glu Ala Ser Gln Val Met Ser Asp Gln Asn Lys
325 330 335
Leu Thr Thr Ile Arg Val Asn Pro Arg Ala Leu Pro Lys Val Gly Ala
340 345 350
Thr Val Lys Ile Lys Ile Asp Pro Ala Lys Met His Leu Phe Ala Pro
355 360 365
Ser Thr Glu Leu Arg Leu Asn
370 375
<210> 16
<211> 306
<212> PRT
<213> Bradyrhizobium japonicum USDA 110
<400> 16
Met Asn Met Ser Asn Met Ala Ile Asp Leu Val Gly Val Arg Lys Ser
1 5 10 15
Phe Gly Asp Lys Val Ile Val Asn Asp Leu Ser Phe Ser Val Ala Arg
20 25 30
Gly Glu Cys Phe Gly Leu Leu Gly Pro Asn Gly Ala Gly Lys Ser Thr
35 40 45
Ile Ala Arg Met Leu Leu Gly Met Ile Ser Pro Asp Arg Gly Lys Ile
50 55 60
Thr Val Leu Asp Glu Pro Val Pro Ser Arg Ala Arg Ala Ala Arg Val
65 70 75 80
Arg Val Gly Val Val Pro Gln Phe Asp Asn Leu Glu Pro Glu Phe Thr
85 90 95
Val Arg Glu Asn Leu Leu Val Phe Gly Arg Tyr Phe Gly Met Ser Ala
100 105 110
Arg Thr Ile Glu Ala Val Val Pro Ser Leu Leu Glu Phe Ala Arg Leu
115 120 125
Glu Ser Lys Ala Asp Val Arg Val Ser Leu Leu Ser Gly Gly Met Lys
130 135 140
Arg Arg Leu Thr Leu Ala Arg Ala Leu Ile Asn Asp Pro His Leu Leu
145 150 155 160
Val Met Asp Glu Pro Thr Thr Gly Leu Asp Pro His Ala Arg His Leu
165 170 175
Ile Trp Glu Arg Leu Arg Ala Leu Leu Ala Arg Gly Lys Thr Ile Leu
180 185 190
Leu Thr Thr His Phe Met Glu Glu Ala Glu Arg Leu Cys Asp Arg Leu
195 200 205
Cys Val Leu Glu Ser Gly Cys Lys Ile Ala Glu Gly Lys Pro Asp Ala
210 215 220
Leu Ile Asp Glu His Ile Gly Cys Asn Val Ile Glu Ile Tyr Gly Gly
225 230 235 240
Asp Leu Asp Gln Leu Arg Glu Leu Ile Arg Pro Tyr Ala Arg His Ile
245 250 255
Glu Val Ser Gly Glu Thr Leu Phe Cys Tyr Ala Arg Cys Pro Asp Glu
260 265 270
Ile Ser Val His Leu Arg Gly Arg Thr Asp Leu Arg Val Leu Gln Arg
275 280 285
Pro Pro Asn Leu Glu Asp Val Phe Leu Arg Leu Thr Gly Arg Glu Met
290 295 300
Glu Lys
305
<210> 17
<211> 330
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 17
Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu
1 5 10 15
Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile
20 25 30
Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val
35 40 45
Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn
50 55 60
Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg
65 70 75 80
Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser
85 90 95
Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr
100 105 110
Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp
115 120 125
Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val
130 135 140
Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn
145 150 155 160
Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val
165 170 175
Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp
180 185 190
Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn
195 200 205
Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly
210 215 220
Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala
225 230 235 240
Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala
245 250 255
Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn
260 265 270
Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys
275 280 285
Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu
290 295 300
Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile
305 310 315 320
Lys Asp Gly Phe His Lys Glu Ser Glu Leu
325 330
<210> 18
<211> 309
<212> PRT
<213> Bifidobacterium longum infantis Bi-26
<400> 18
Met Ser His Ala Thr Ala Thr Lys Thr Ala Ala Lys Lys Pro Ala Lys
1 5 10 15
Lys Lys Val Ser Ala Phe Ser Thr Arg Lys Val Asp Pro Ala Tyr Tyr
20 25 30
Trp Met Val Val Pro Ala Ala Ile Ile Phe Ala Phe Phe Leu Tyr Leu
35 40 45
Pro Phe Leu Asp Gly Val Lys Tyr Ser Phe Thr Asn Ser Gln Gly Tyr
50 55 60
Gly Asp Tyr Lys Phe Ile Gly Leu Lys Asn Tyr Ile Ala Leu Phe Gln
65 70 75 80
Asp Asn Arg Val Gly His Ala Tyr Leu Phe Thr Phe Leu Ile Ala Ile
85 90 95
Leu Ile Thr Val Leu Ile Asn Val Ile Ala Leu Phe Leu Ser Val Leu
100 105 110
Leu Asn Ser Lys Ile Ala Phe Lys Asn Gly Phe Arg Ala Val Phe Phe
115 120 125
Ile Pro Tyr Thr Leu Ser Val Leu Val Ile Gly Tyr Val Phe Lys Tyr
130 135 140
Ile Phe Met Asn Pro Leu Pro Glu Leu Gly Lys Ala Leu Gly Ile Lys
145 150 155 160
Trp Leu Ser Thr Ser Leu Leu Thr Asn Glu Gln Leu Ser Trp Ile Pro
165 170 175
Ile Val Phe Leu Ala Val Trp Gln Gly Ile Ala Tyr Ser Val Leu Ile
180 185 190
Tyr Leu Ala Gly Leu Gln Thr Ile Asp Asp Glu Ile Tyr Glu Ala Ala
195 200 205
Ala Ile Asp Gly Val Asn Ala Trp Gln Lys Phe Trp Lys Ile Thr Phe
210 215 220
Pro Leu Ile Gly Pro Phe Phe Thr Ile Asn Leu Val Leu Ser Met Lys
225 230 235 240
Asn Ala Leu Gly Thr Phe Asp Gln Val Val Ala Leu Thr Glu Gly Gly
245 250 255
Pro Asn Ser Ser Thr Glu Thr Val Thr Tyr Leu Ile Trp Lys Gly Gly
260 265 270
Leu Thr Gly Gly Glu Tyr Ala Tyr Gln Thr Ala Asn Ala Val Leu Phe
275 280 285
Phe Ile Val Leu Ala Ile Ile Ala Phe Val Gln Leu Arg Ile Ser Arg
290 295 300
Ser Gln Glu Gln Ile
305
<210> 19
<211> 288
<212> PRT
<213> Bifidobacterium longum infantis Bi-26
<400> 19
Met Thr Thr Ala Thr Val Thr Pro Ser Lys Ser Gly Lys Pro Ala Lys
1 5 10 15
Phe Arg Arg Asp His Lys Ile Asn Trp Trp Leu Thr Ala Ala Val Ala
20 25 30
Val Leu Ser Leu Thr Ile Leu Ile Pro Leu Tyr Phe Thr Ile Val Thr
35 40 45
Ala Leu Lys Thr Pro Ala Glu Ala Gly Thr Phe Ala Leu Pro Thr Ser
50 55 60
Trp Gln Trp His Asn Phe Ala Asp Ala Ser Ala Lys Val Asn Tyr Pro
65 70 75 80
Lys Ala Ala Leu Asn Ser Ala Ile Ile Thr Val Ala Ala Val Val Leu
85 90 95
Thr Leu Leu Thr Asn Thr Phe Val Ala Tyr Ala Val Ala Arg Asn Met
100 105 110
Asp Lys Arg Phe Phe Arg Phe Leu Tyr Tyr Phe Phe Ile Ala Ala Met
115 120 125
Phe Val Pro Phe Pro Val Val Met Leu Pro Ile Ala Lys Gln Met Gly
130 135 140
Ser Leu His Leu Asp Asn Gln Val Gly Leu Ile Ile Leu Tyr Thr Val
145 150 155 160
Leu Gly Leu Gly Thr Asn Leu Phe Ile Ala Thr Gly Phe Ile Arg Ser
165 170 175
Ile Pro Val Ser Leu Glu Glu Ala Ala Arg Ile Asp Gly Ala Ser Thr
180 185 190
Trp Arg Ile Phe Trp Thr Ile Ile Phe Pro Leu Met Ser Pro Ile Asn
195 200 205
Ala Thr Ile Ala Ile Leu Thr Ala Leu Trp Ala Trp Asn Asp Phe Leu
210 215 220
Leu Pro Leu Ile Ile Leu Thr Asp Gln Ser Asn Gln Thr Ile Pro Leu
225 230 235 240
Ala Gln Tyr Val Phe Ser Ser Gln Phe Ala Thr Asn Tyr Pro Met Ala
245 250 255
Phe Ser Ser Tyr Leu Met Ala Met Ala Pro Ile Leu Ile Val Tyr Ile
260 265 270
Phe Ala Gln Lys Trp Val Val Gly Gly Val Met Arg Gly Ala Val Lys
275 280 285
<210> 20
<211> 303
<212> PRT
<213> Bifidobacterium longum infantis Bi-26
<400> 20
Met Thr Asn Ala Thr Ala Gln Pro Asp Thr Ser Val Met Arg Lys Pro
1 5 10 15
Lys Arg Gln Tyr Ile Gly Ile Leu Tyr Cys Leu Pro Tyr Val Val Val
20 25 30
Phe Leu Phe Gly Met Ile Val Pro Met Phe Tyr Ala Leu Tyr Leu Ser
35 40 45
Phe Phe Lys Gln Ser Leu Leu Gly Gly Thr Thr Phe Ala Gly Phe Asp
50 55 60
Asn Phe Ile Arg Ala Phe Lys Asp Glu Ala Leu Trp Gly Gly Phe Lys
65 70 75 80
Asn Val Leu Ile Tyr Ala Ala Ile Gln Ile Pro Met Asn Leu Ile Leu
85 90 95
Ser Leu Val Ala Ala Leu Val Leu Asp Ser Gln Arg Ile Arg His Ile
100 105 110
Ala Val Pro Arg Ile Leu Leu Phe Leu Pro Tyr Ala Val Pro Gly Val
115 120 125
Ile Ala Ala Leu Met Trp Gly Tyr Ile Tyr Gly Asp Lys Tyr Gly Leu
130 135 140
Phe Gly Gln Ile Ala Gly Met Phe Gly Val Ala Ala Pro Asn Met Leu
145 150 155 160
Ser Lys Gln Leu Met Leu Phe Ala Ile Ala Asn Ile Cys Thr Trp Cys
165 170 175
Phe Leu Gly Tyr Asn Met Leu Ile Tyr Tyr Ser Ala Leu Ile Gly Ile
180 185 190
Pro Asn Asp Leu Tyr Glu Ser Ala Arg Ile Asp Gly Ala Ser Glu Leu
195 200 205
Arg Ile Ala Trp Ser Val Lys Ile Pro Gln Ile Lys Ser Thr Ile Val
210 215 220
Met Thr Val Leu Phe Ser Val Ile Gly Thr Leu Gln Leu Phe Asn Glu
225 230 235 240
Pro Asn Ile Leu Arg Thr Ser Ala Pro Asp Val Ile Asn Ser Ser Tyr
245 250 255
Thr Pro Asn Ile Tyr Thr Tyr Asn Leu Ala Phe Asn Gly Gln Asn Val
260 265 270
Asn Tyr Ala Ala Ala Val Ser Leu Val Ile Gly Ile Ile Val Met Ala
275 280 285
Leu Val Ala Val Val Lys Ile Ile Gly Asn Lys Trp Glu Asn Lys
290 295 300
<210> 21
<211> 379
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 21
Met Met Lys Ser Lys Met Lys Leu Met Pro Leu Leu Val Ser Val Thr
1 5 10 15
Leu Ile Ser Gly Cys Thr Val Leu Pro Gly Ser Asn Met Ser Thr Met
20 25 30
Gly Lys Asp Val Ile Lys Gln Gln Asp Ala Asp Phe Asp Leu Asp Lys
35 40 45
Met Val Asn Val Tyr Pro Leu Thr Pro Arg Leu Ile Asp Gln Leu Arg
50 55 60
Pro Arg Pro Asn Val Ala Arg Pro Asn Met Thr Leu Glu Ser Glu Ile
65 70 75 80
Ala Asn Tyr Gln Tyr Arg Val Gly Pro Gly Asp Val Leu Asn Val Thr
85 90 95
Val Trp Asp His Pro Glu Leu Thr Thr Pro Ala Gly Gln Tyr Arg Ser
100 105 110
Ser Ser Asp Thr Gly Asn Trp Val Gln Pro Asp Gly Thr Met Phe Tyr
115 120 125
Pro Tyr Ile Gly Lys Val His Val Val Gly Lys Thr Leu Ala Glu Ile
130 135 140
Arg Ser Asp Ile Thr Gly Arg Leu Ala Thr Tyr Ile Ala Asp Pro Gln
145 150 155 160
Val Asp Val Asn Ile Ala Ala Phe Arg Ser Gln Lys Ala Tyr Ile Ser
165 170 175
Gly Gln Val Asn Lys Ser Gly Gln Gln Ala Ile Thr Asn Val Pro Leu
180 185 190
Thr Ile Leu Asp Ala Ile Asn Ala Ala Gly Gly Leu Thr Asp Thr Ala
195 200 205
Asp Trp Arg Asn Val Val Leu Thr His Asn Gly Arg Glu Glu Arg Ile
210 215 220
Ser Leu Gln Ala Leu Met Gln Asn Gly Asp Leu Asn Gln Asn Arg Leu
225 230 235 240
Leu Tyr Pro Gly Asp Ile Leu Tyr Val Pro Arg Asn Asp Asp Leu Lys
245 250 255
Val Phe Val Met Gly Glu Val Lys Lys Gln Ser Thr Leu Lys Met Asp
260 265 270
Phe Ser Gly Met Thr Leu Thr Glu Ala Leu Gly Asn Ala Glu Gly Ile
275 280 285
Asp Met Thr Thr Ser Asn Ala Ser Gly Ile Phe Val Ile Arg Pro Leu
290 295 300
Lys Gly Glu Gly Gly Arg Asn Gly Lys Ile Ala Asn Ile Tyr Gln Leu
305 310 315 320
Asp Met Ser Asp Ala Thr Ser Leu Val Met Ala Thr Glu Phe Arg Leu
325 330 335
Gln Pro Tyr Asp Val Val Tyr Val Thr Thr Ala Pro Val Ser Arg Trp
340 345 350
Asn Arg Leu Ile Asn Gln Leu Leu Pro Thr Ile Ser Gly Val Arg Tyr
355 360 365
Met Thr Asp Thr Ala Ser Asp Ile His Asn Trp
370 375
<210> 22
<211> 348
<212> PRT
<213> Neisseria meningitidis
<400> 22
Met Pro Ser Glu Ala Phe Arg Arg His Arg Ala Tyr Arg Glu Asn Lys
1 5 10 15
Leu Gln Pro Leu Val Ser Val Leu Ile Cys Ala Tyr Asn Val Glu Lys
20 25 30
Tyr Phe Ala Gln Ser Leu Ala Ala Val Val Asn Gln Thr Trp Cys Asn
35 40 45
Leu Asp Ile Leu Ile Val Asp Asp Gly Ser Thr Asp Gly Thr Leu Ala
50 55 60
Ile Ala Gln Arg Phe Gln Glu Gln Asp Gly Arg Ile Lys Ile Leu Ala
65 70 75 80
Gln Ala Gln Asn Ser Gly Leu Ile Pro Ser Leu Asn Ile Gly Leu Asp
85 90 95
Glu Leu Ala Lys Ser Gly Met Gly Glu Tyr Ile Ala Arg Thr Asp Ala
100 105 110
Asp Asp Ile Ala Ala Pro Asp Trp Ile Glu Lys Ile Val Gly Glu Met
115 120 125
Glu Lys Asp Arg Ser Ile Ile Ala Met Gly Ala Trp Leu Glu Val Leu
130 135 140
Ser Glu Glu Lys Asp Gly Asn Arg Leu Ala Arg His His Glu His Gly
145 150 155 160
Lys Ile Trp Lys Lys Pro Thr Arg His Glu Asp Ile Ala Asp Phe Phe
165 170 175
Pro Phe Gly Asn Pro Ile His Asn Asn Thr Met Ile Met Arg Arg Ser
180 185 190
Val Ile Asp Gly Gly Leu Arg Tyr Asn Thr Glu Arg Asp Trp Ala Glu
195 200 205
Asp Tyr Gln Phe Trp Tyr Asp Val Ser Lys Leu Gly Arg Leu Ala Tyr
210 215 220
Tyr Pro Glu Ala Leu Val Lys Tyr Arg Leu His Ala Asn Gln Val Ser
225 230 235 240
Ser Lys Tyr Ser Ile Arg Gln His Glu Ile Ala Gln Gly Ile Gln Lys
245 250 255
Thr Ala Arg Asn Asp Phe Leu Gln Ser Met Gly Phe Lys Thr Arg Phe
260 265 270
Asp Ser Leu Glu Tyr Arg Gln Ile Lys Ala Val Ala Tyr Glu Leu Leu
275 280 285
Glu Lys His Leu Pro Glu Glu Asp Phe Glu Arg Ala Arg Arg Phe Leu
290 295 300
Tyr Gln Cys Phe Lys Arg Thr Asp Thr Leu Pro Ala Gly Val Trp Leu
305 310 315 320
Asp Phe Ala Ala Asn Gly Arg Met Arg Arg Leu Phe Thr Leu Arg Gln
325 330 335
Tyr Phe Gly Ile Leu His Arg Leu Leu Lys Asn Arg
340 345
<210> 23
<211> 265
<212> PRT
<213> Escherichia coli O55:H7
<400> 23
Met Ile Ile Asp Glu Ala Glu Ser Ala Glu Ser Thr His Pro Val Val
1 5 10 15
Ser Val Ile Leu Pro Val Asn Lys Lys Asn Pro Phe Leu Asp Glu Ala
20 25 30
Ile Asn Ser Ile Leu Ser Gln Thr Phe Ser Ser Phe Glu Ile Ile Ile
35 40 45
Val Ala Asn Cys Cys Thr Asp Asp Phe Tyr Asn Glu Leu Lys His Lys
50 55 60
Val Asn Asp Lys Ile Lys Leu Ile Arg Thr Asn Ile Ala Tyr Leu Pro
65 70 75 80
Tyr Ser Leu Asn Lys Ala Ile Asp Leu Ser Asn Gly Glu Phe Ile Ala
85 90 95
Arg Met Asp Ser Asp Asp Ile Ser His Pro Asp Arg Phe Thr Lys Gln
100 105 110
Val Asp Phe Leu Lys Asn Asn Pro Tyr Val Asp Val Val Gly Thr Asn
115 120 125
Ala Ile Phe Ile Asp Asp Lys Gly Arg Glu Ile Asn Lys Thr Lys Leu
130 135 140
Pro Glu Glu Asn Leu Asp Ile Val Lys Asn Leu Pro Tyr Lys Cys Cys
145 150 155 160
Ile Val His Pro Ser Val Met Phe Arg Lys Lys Val Ile Ala Ser Ile
165 170 175
Gly Gly Tyr Met Phe Ser Asn Tyr Ser Glu Asp Tyr Glu Leu Trp Asn
180 185 190
Arg Leu Ser Leu Ala Lys Ile Lys Phe Gln Asn Leu Pro Glu Tyr Leu
195 200 205
Phe Tyr Tyr Arg Leu His Glu Gly Gln Ser Thr Ala Lys Lys Asn Leu
210 215 220
Tyr Met Val Met Val Asn Asp Leu Val Ile Lys Met Lys Cys Phe Phe
225 230 235 240
Leu Thr Gly Asn Ile Asn Tyr Leu Phe Gly Gly Ile Arg Thr Ile Ala
245 250 255
Ser Phe Ile Tyr Cys Lys Tyr Ile Lys
260 265
<210> 24
<211> 275
<212> PRT
<213> Neisseria meningitidis MC58
<400> 24
Met Gln Asn His Val Ile Ser Leu Ala Ser Ala Ala Glu Arg Arg Ala
1 5 10 15
His Ile Ala Asp Thr Phe Gly Arg His Gly Ile Pro Phe Gln Phe Phe
20 25 30
Asp Ala Leu Met Pro Ser Glu Arg Leu Glu Gln Ala Met Ala Glu Leu
35 40 45
Val Pro Gly Leu Ser Ala His Pro Tyr Leu Ser Gly Val Glu Lys Ala
50 55 60
Cys Phe Met Ser His Ala Val Leu Trp Lys Gln Ala Leu Asp Glu Gly
65 70 75 80
Leu Pro Tyr Ile Thr Val Phe Glu Asp Asp Val Leu Leu Gly Glu Gly
85 90 95
Ala Glu Lys Phe Leu Ala Glu Asp Ala Trp Leu Gln Glu Arg Phe Asp
100 105 110
Pro Asp Thr Ala Phe Ile Val Arg Leu Glu Thr Met Phe Met His Val
115 120 125
Leu Thr Ser Pro Ser Gly Val Ala Asp Tyr Cys Gly Arg Ala Phe Pro
130 135 140
Leu Leu Glu Ser Glu His Trp Gly Thr Ala Gly Tyr Ile Ile Ser Arg
145 150 155 160
Lys Ala Met Arg Phe Phe Leu Asp Arg Phe Ala Ala Leu Pro Pro Glu
165 170 175
Gly Leu His Pro Val Asp Leu Met Met Phe Ser Asp Phe Phe Asp Arg
180 185 190
Glu Gly Met Pro Val Cys Gln Leu Asn Pro Ala Leu Cys Ala Gln Glu
195 200 205
Leu His Tyr Ala Lys Phe His Asp Gln Asn Ser Ala Leu Gly Ser Leu
210 215 220
Ile Glu His Asp Arg Leu Leu Asn Arg Lys Gln Gln Arg Arg Asp Ser
225 230 235 240
Pro Ala Asn Thr Phe Lys His Arg Leu Ile Arg Ala Leu Thr Lys Ile
245 250 255
Ser Arg Glu Arg Glu Lys Arg Arg Gln Arg Arg Glu Gln Phe Ile Val
260 265 270
Pro Phe Gln
275
<210> 25
<211> 609
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 25
Met Cys Gly Ile Val Gly Ala Ile Ala Gln Arg Asp Val Ala Glu Ile
1 5 10 15
Leu Leu Glu Gly Leu Arg Arg Leu Glu Tyr Arg Gly Tyr Asp Ser Ala
20 25 30
Gly Leu Ala Val Val Asp Thr Glu Gly His Met Thr Arg Leu Arg Arg
35 40 45
Leu Gly Lys Val Gln Met Leu Ala Gln Ala Ala Glu Glu His Pro Leu
50 55 60
His Gly Gly Thr Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu
65 70 75 80
Pro Ser Glu Val Asn Ala His Pro His Val Ser Glu His Ile Val Val
85 90 95
Val His Asn Gly Ile Ile Glu Asn His Glu Pro Leu Arg Glu Glu Leu
100 105 110
Lys Ala Arg Gly Tyr Thr Phe Val Ser Glu Thr Asp Thr Glu Val Ile
115 120 125
Ala His Leu Val Asn Trp Glu Leu Lys Gln Gly Gly Thr Leu Arg Glu
130 135 140
Ala Val Leu Arg Ala Ile Pro Gln Leu Arg Gly Ala Tyr Gly Thr Val
145 150 155 160
Ile Met Asp Ser Arg His Pro Asp Thr Leu Leu Ala Ala Arg Ser Gly
165 170 175
Ser Pro Leu Val Ile Gly Leu Gly Met Gly Glu Asn Phe Ile Ala Ser
180 185 190
Asp Gln Leu Ala Leu Leu Pro Val Thr Arg Arg Phe Ile Phe Leu Glu
195 200 205
Glu Gly Asp Ile Ala Glu Ile Thr Arg Arg Ser Val Asn Ile Phe Asp
210 215 220
Lys Thr Gly Ala Glu Val Lys Arg Gln Asp Ile Glu Ser Asn Leu Gln
225 230 235 240
Tyr Asp Ala Gly Asp Lys Gly Ile Tyr Cys His Tyr Met Gln Lys Glu
245 250 255
Ile Tyr Glu Gln Pro Asn Ala Ile Lys Asn Thr Leu Thr Gly Arg Ile
260 265 270
Ser His Gly Gln Val Asp Leu Ser Glu Leu Gly Pro Asn Ala Asp Glu
275 280 285
Leu Leu Ser Lys Val Glu His Ile Gln Ile Leu Ala Cys Gly Thr Ser
290 295 300
Tyr Asn Ser Gly Met Val Ser Arg Tyr Trp Phe Glu Ser Leu Ala Gly
305 310 315 320
Ile Pro Cys Asp Val Glu Ile Ala Ser Glu Phe Arg Tyr Arg Lys Ser
325 330 335
Ala Val Arg Arg Asn Ser Leu Met Ile Thr Leu Ser Gln Ser Gly Glu
340 345 350
Thr Ala Asp Thr Leu Ala Gly Leu Arg Leu Ser Lys Glu Leu Gly Tyr
355 360 365
Leu Gly Ser Leu Ala Ile Cys Asn Val Pro Gly Ser Ser Leu Val Arg
370 375 380
Glu Ser Asp Leu Ala Leu Met Thr Asn Ala Gly Thr Glu Ile Gly Val
385 390 395 400
Ala Ser Thr Lys Ala Phe Thr Thr Gln Leu Thr Val Leu Leu Met Leu
405 410 415
Val Ala Lys Leu Ser Arg Leu Lys Gly Leu Asp Ala Ser Ile Glu His
420 425 430
Asp Ile Val His Gly Leu Gln Ala Leu Pro Ser Arg Ile Glu Gln Met
435 440 445
Leu Ser Gln Asp Lys Arg Ile Glu Ala Leu Ala Glu Asp Phe Ser Asp
450 455 460
Lys His His Ala Leu Phe Leu Ser Arg Gly Asp Gln Tyr Pro Ile Ala
465 470 475 480
Leu Glu Gly Ala Leu Lys Leu Lys Glu Ile Ser Tyr Ile His Ala Glu
485 490 495
Ala Tyr Ala Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu Ile Asp
500 505 510
Ala Asp Met Pro Val Ile Val Val Ala Pro Asn Asn Glu Leu Leu Glu
515 520 525
Lys Leu Lys Ser Asn Ile Glu Glu Val Arg Ala Arg Gly Gly Gln Leu
530 535 540
Tyr Val Phe Ala Asp Gln Asp Ala Gly Phe Val Ser Ser Asp Asn Met
545 550 555 560
His Ile Ile Glu Met Pro His Val Glu Glu Val Ile Ala Pro Ile Phe
565 570 575
Tyr Thr Val Pro Leu Gln Leu Leu Ala Tyr His Val Ala Leu Ile Lys
580 585 590
Gly Thr Asp Val Asp Gln Pro Arg Asn Leu Ala Lys Ser Val Thr Val
595 600 605
Glu
<210> 26
<211> 338
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 26
Met Arg Val Leu Val Thr Gly Gly Ser Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Cys Val Gln Leu Leu Gln Asn Gly His Asp Val Ile Ile Leu Asp Asn
20 25 30
Leu Cys Asn Ser Lys Arg Ser Val Leu Pro Val Ile Glu Arg Leu Gly
35 40 45
Gly Lys His Pro Thr Phe Val Glu Gly Asp Ile Arg Asn Glu Ala Leu
50 55 60
Met Thr Glu Ile Leu His Asp His Ala Ile Asp Thr Val Ile His Phe
65 70 75 80
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Glu Tyr
85 90 95
Tyr Asp Asn Asn Val Asn Gly Thr Leu Arg Leu Ile Ser Ala Met Arg
100 105 110
Ala Ala Asn Val Lys Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Asp Gln Pro Lys Ile Pro Tyr Val Glu Ser Phe Pro Thr Gly Thr
130 135 140
Pro Gln Ser Pro Tyr Gly Lys Ser Lys Leu Met Val Glu Gln Ile Leu
145 150 155 160
Thr Asp Leu Gln Lys Ala Gln Pro Asp Trp Ser Ile Ala Leu Leu Arg
165 170 175
Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Asp Met Gly Glu Asp
180 185 190
Pro Gln Gly Ile Pro Asn Asn Leu Met Pro Tyr Ile Ala Gln Val Ala
195 200 205
Val Gly Arg Arg Asp Ser Leu Ala Ile Phe Gly Asn Asp Tyr Pro Thr
210 215 220
Glu Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala
225 230 235 240
Asp Gly His Val Val Ala Met Glu Lys Leu Ala Asn Lys Pro Gly Val
245 250 255
His Ile Tyr Asn Leu Gly Ala Gly Val Gly Asn Ser Val Leu Asp Val
260 265 270
Val Asn Ala Phe Ser Lys Ala Cys Gly Lys Pro Val Asn Tyr His Phe
275 280 285
Ala Pro Arg Arg Glu Gly Asp Leu Pro Ala Tyr Trp Ala Asp Ala Ser
290 295 300
Lys Ala Asp Arg Glu Leu Asn Trp Arg Val Thr Arg Thr Leu Asp Glu
305 310 315 320
Met Ala Gln Asp Thr Trp His Trp Gln Ser Arg His Pro Gln Gly Tyr
325 330 335
Pro Asp
<210> 27
<211> 445
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 27
Met Ser Asn Arg Lys Tyr Phe Gly Thr Asp Gly Ile Arg Gly Arg Val
1 5 10 15
Gly Asp Ala Pro Ile Thr Pro Asp Phe Val Leu Lys Leu Gly Trp Ala
20 25 30
Ala Gly Lys Val Leu Ala Arg His Gly Ser Arg Lys Ile Ile Ile Gly
35 40 45
Lys Asp Thr Arg Ile Ser Gly Tyr Met Leu Glu Ser Ala Leu Glu Ala
50 55 60
Gly Leu Ala Ala Ala Gly Leu Ser Ala Leu Phe Thr Gly Pro Met Pro
65 70 75 80
Thr Pro Ala Val Ala Tyr Leu Thr Arg Thr Phe Arg Ala Glu Ala Gly
85 90 95
Ile Val Ile Ser Ala Ser His Asn Pro Phe Tyr Asp Asn Gly Ile Lys
100 105 110
Phe Phe Ser Ile Asp Gly Thr Lys Leu Pro Asp Ala Val Glu Glu Ala
115 120 125
Ile Glu Ala Glu Met Glu Lys Glu Ile Ser Cys Val Asp Ser Ala Glu
130 135 140
Leu Gly Lys Ala Ser Arg Ile Val Asp Ala Ala Gly Arg Tyr Ile Glu
145 150 155 160
Phe Cys Lys Ala Thr Phe Pro Asn Glu Leu Ser Leu Ser Glu Leu Lys
165 170 175
Ile Val Val Asp Cys Ala Asn Gly Ala Thr Tyr His Ile Ala Pro Asn
180 185 190
Val Leu Arg Glu Leu Gly Ala Asn Val Ile Ala Ile Gly Cys Glu Pro
195 200 205
Asn Gly Val Asn Ile Asn Ala Glu Val Gly Ala Thr Asp Val Arg Ala
210 215 220
Leu Gln Ala Arg Val Leu Ala Glu Lys Ala Asp Leu Gly Ile Ala Phe
225 230 235 240
Asp Gly Asp Gly Asp Arg Val Ile Met Val Asp His Glu Gly Asn Lys
245 250 255
Val Asp Gly Asp Gln Ile Met Tyr Ile Ile Ala Arg Glu Gly Leu Arg
260 265 270
Gln Gly Gln Leu Arg Gly Gly Ala Val Gly Thr Leu Met Ser Asn Met
275 280 285
Gly Leu Glu Leu Ala Leu Lys Gln Leu Gly Ile Pro Phe Ala Arg Ala
290 295 300
Lys Val Gly Asp Arg Tyr Val Leu Glu Lys Met Gln Glu Lys Gly Trp
305 310 315 320
Arg Ile Gly Ala Glu Asn Ser Gly His Val Ile Leu Leu Asp Lys Thr
325 330 335
Thr Thr Gly Asp Gly Ile Val Ala Gly Leu Gln Val Leu Ala Ala Met
340 345 350
Ala Arg Asn His Met Ser Leu His Asp Leu Cys Ser Gly Met Lys Met
355 360 365
Phe Pro Gln Ile Leu Val Asn Val Arg Tyr Thr Ala Gly Ser Gly Asp
370 375 380
Pro Leu Glu His Glu Ser Val Lys Ala Val Thr Ala Glu Val Glu Ala
385 390 395 400
Ala Leu Gly Asn Arg Gly Arg Val Leu Leu Arg Lys Ser Gly Thr Glu
405 410 415
Pro Leu Ile Arg Val Met Val Glu Gly Glu Asp Glu Ala Gln Val Thr
420 425 430
Glu Phe Ala His Arg Ile Ala Asp Ala Val Lys Ala Val
435 440 445
<210> 28
<211> 456
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 28
Met Leu Asn Asn Ala Met Ser Val Val Ile Leu Ala Ala Gly Lys Gly
1 5 10 15
Thr Arg Met Tyr Ser Asp Leu Pro Lys Val Leu His Thr Leu Ala Gly
20 25 30
Lys Ala Met Val Gln His Val Ile Asp Ala Ala Asn Glu Leu Gly Ala
35 40 45
Ala His Val His Leu Val Tyr Gly His Gly Gly Asp Leu Leu Lys Gln
50 55 60
Ala Leu Lys Asp Asp Asn Leu Asn Trp Val Leu Gln Ala Glu Gln Leu
65 70 75 80
Gly Thr Gly His Ala Met Gln Gln Ala Ala Pro Phe Phe Ala Asp Asp
85 90 95
Glu Asp Ile Leu Met Leu Tyr Gly Asp Val Pro Leu Ile Ser Val Glu
100 105 110
Thr Leu Gln Arg Leu Arg Asp Ala Lys Pro Gln Gly Gly Ile Gly Leu
115 120 125
Leu Thr Val Lys Leu Asp Asp Pro Thr Gly Tyr Gly Arg Ile Thr Arg
130 135 140
Glu Asn Gly Lys Val Thr Gly Ile Val Glu His Lys Asp Ala Thr Asp
145 150 155 160
Glu Gln Arg Gln Ile Gln Glu Ile Asn Thr Gly Ile Leu Ile Ala Asn
165 170 175
Gly Ala Asp Met Lys Arg Trp Leu Ala Lys Leu Thr Asn Asn Asn Ala
180 185 190
Gln Gly Glu Tyr Tyr Ile Thr Asp Ile Ile Ala Leu Ala Tyr Gln Glu
195 200 205
Gly Arg Glu Ile Val Ala Val His Pro Gln Arg Leu Ser Glu Val Glu
210 215 220
Gly Val Asn Asn Arg Leu Gln Leu Ser Arg Leu Glu Arg Val Tyr Gln
225 230 235 240
Ser Glu Gln Ala Glu Lys Leu Leu Leu Ala Gly Val Met Leu Arg Asp
245 250 255
Pro Ala Arg Phe Asp Leu Arg Gly Thr Leu Thr His Gly Arg Asp Val
260 265 270
Glu Ile Asp Thr Asn Val Ile Ile Glu Gly Asn Val Thr Leu Gly His
275 280 285
Arg Val Lys Ile Gly Thr Gly Cys Val Ile Lys Asn Ser Val Ile Gly
290 295 300
Asp Asp Cys Glu Ile Ser Pro Tyr Thr Val Val Glu Asp Ala Asn Leu
305 310 315 320
Ala Ala Ala Cys Thr Ile Gly Pro Phe Ala Arg Leu Arg Pro Gly Ala
325 330 335
Glu Leu Leu Glu Gly Ala His Val Gly Asn Phe Val Glu Met Lys Lys
340 345 350
Ala Arg Leu Gly Lys Gly Ser Lys Ala Gly His Leu Thr Tyr Leu Gly
355 360 365
Asp Ala Glu Ile Gly Asp Asn Val Asn Ile Gly Ala Gly Thr Ile Thr
370 375 380
Cys Asn Tyr Asp Gly Ala Asn Lys Phe Lys Thr Ile Ile Gly Asp Asp
385 390 395 400
Val Phe Val Gly Ser Asp Thr Gln Leu Val Ala Pro Val Thr Val Gly
405 410 415
Lys Gly Ala Thr Ile Ala Ala Gly Thr Thr Val Thr Arg Asn Val Gly
420 425 430
Glu Asn Ala Leu Ala Ile Ser Arg Val Pro Gln Thr Gln Lys Glu Gly
435 440 445
Trp Arg Arg Pro Val Lys Lys Lys
450 455
<210> 29
<211> 299
<212> PRT
<213> Helicobacter pylori UA1234
<400> 29
Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met
1 5 10 15
Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Ser Asn Thr Pro
20 25 30
Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln
35 40 45
Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Glu Lys Glu Ile
50 55 60
Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asn Val Leu
65 70 75 80
Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr
85 90 95
Glu Pro Lys Leu Leu Lys Thr Ser Arg Leu Thr Tyr Phe Tyr Gly Tyr
100 105 110
Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln
115 120 125
Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Gly Asn Asn Lys Lys Lys
130 135 140
Glu Glu Glu Tyr His Arg Lys Leu Ala Leu Ile Leu Ala Ala Lys Asn
145 150 155 160
Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly Cys
165 170 175
Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala Lys
180 185 190
Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu Phe
195 200 205
Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr Arg
210 215 220
Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser Cys
225 230 235 240
Lys His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr
245 250 255
Leu Ile Asn Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp Leu
260 265 270
Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu Ser
275 280 285
His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala
290 295
<210> 30
<211> 478
<212> PRT
<213> Helicobacter pylori UA1234
<400> 30
Met Phe Gln Pro Leu Leu Asp Ala Tyr Val Glu Ser Ala Ser Ile Glu
1 5 10 15
Lys Met Ala Ser Lys Ser Pro Pro Pro Leu Lys Ile Ala Val Ala Asn
20 25 30
Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Asn Ser Val Leu Tyr
35 40 45
Phe Ile Leu Ser Gln Arg Tyr Thr Ile Thr Leu His Gln Asn Pro Asn
50 55 60
Glu Phe Ser Asp Leu Val Phe Gly Asn Pro Leu Gly Ser Ala Arg Lys
65 70 75 80
Ile Leu Ser Tyr Gln Asn Ala Lys Arg Val Phe Tyr Thr Gly Glu Asn
85 90 95
Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp Glu
100 105 110
Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asp Arg
115 120 125
Leu His His Lys Ala Glu Ser Val Asn Asp Thr Thr Ala Pro Tyr Lys
130 135 140
Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His Cys Phe
145 150 155 160
Lys Glu Lys His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser Asp
165 170 175
Pro Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Pro Asn Ala
180 185 190
Pro Ile Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro Val
195 200 205
Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Asn Val Lys Asn
210 215 220
Lys Asn Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu Asn
225 230 235 240
Thr Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Ile Asp Ala Tyr Phe
245 250 255
Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys Asp
260 265 270
Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Lys Asn Phe Asp
275 280 285
Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Lys Asn Ala Tyr
290 295 300
Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys Ala
305 310 315 320
Tyr Phe Tyr Gln Asn Leu Ser Phe Lys Lys Ile Leu Ala Phe Phe Lys
325 330 335
Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Asp Asn Pro Phe Ile Phe
340 345 350
Cys Arg Asp Leu Asn Glu Pro Leu Val Thr Ile Asp Asp Leu Arg Val
355 360 365
Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr
370 375 380
Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr Asp Asp
385 390 395 400
Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg
405 410 415
Ile Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn
420 425 430
Tyr Glu Arg Leu Leu Ser Lys Ala Thr Pro Leu Leu Glu Leu Ser Gln
435 440 445
Asn Thr Thr Ser Lys Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro
450 455 460
Leu Leu Arg Ala Ile Arg Arg Trp Val Lys Lys Leu Gly Leu
465 470 475
<210> 31
<211> 264
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 31
Met Lys Gln Tyr Leu Glu Leu Met Gln Lys Val Leu Asp Glu Gly Thr
1 5 10 15
Gln Lys Asn Asp Arg Thr Gly Thr Gly Thr Leu Ser Ile Phe Gly His
20 25 30
Gln Met Arg Phe Asn Leu Gln Asp Gly Phe Pro Leu Val Thr Thr Lys
35 40 45
Arg Cys His Leu Arg Ser Ile Ile His Glu Leu Leu Trp Phe Leu Gln
50 55 60
Gly Asp Thr Asn Ile Ala Tyr Leu His Glu Asn Asn Val Thr Ile Trp
65 70 75 80
Asp Glu Trp Ala Asp Glu Asn Gly Asp Leu Gly Pro Val Tyr Gly Lys
85 90 95
Gln Trp Arg Ala Trp Pro Thr Pro Asp Gly Arg His Ile Asp Gln Ile
100 105 110
Thr Thr Val Leu Asn Gln Leu Lys Asn Asp Pro Asp Ser Arg Arg Ile
115 120 125
Ile Val Ser Ala Trp Asn Val Gly Glu Leu Asp Lys Met Ala Leu Ala
130 135 140
Pro Cys His Ala Phe Phe Gln Phe Tyr Val Ala Asp Gly Lys Leu Ser
145 150 155 160
Cys Gln Leu Tyr Gln Arg Ser Cys Asp Val Phe Leu Gly Leu Pro Phe
165 170 175
Asn Ile Ala Ser Tyr Ala Leu Leu Val His Met Met Ala Gln Gln Cys
180 185 190
Asp Leu Glu Val Gly Asp Phe Val Trp Thr Gly Gly Asp Thr His Leu
195 200 205
Tyr Ser Asn His Met Asp Gln Thr His Leu Gln Leu Ser Arg Glu Pro
210 215 220
Arg Pro Leu Pro Lys Leu Ile Ile Lys Arg Lys Pro Glu Ser Ile Phe
225 230 235 240
Asp Tyr Arg Phe Glu Asp Phe Glu Ile Glu Gly Tyr Asp Pro His Pro
245 250 255
Gly Ile Lys Ala Pro Val Ala Ile
260
<210> 32
<211> 391
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 32
Met Gln Lys Leu Ile Asn Ser Val Gln Asn Tyr Ala Trp Gly Ser Lys
1 5 10 15
Thr Ala Leu Thr Glu Leu Tyr Gly Met Glu Asn Pro Ser Ser Gln Pro
20 25 30
Met Ala Glu Leu Trp Met Gly Ala His Pro Lys Ser Ser Ser Arg Val
35 40 45
Gln Asn Ala Ala Gly Asp Ile Val Ser Leu Arg Asp Val Ile Glu Ser
50 55 60
Asp Lys Ser Thr Leu Leu Gly Glu Ala Val Ala Lys Arg Phe Gly Glu
65 70 75 80
Leu Pro Phe Leu Phe Lys Val Leu Cys Ala Ala Gln Pro Leu Ser Ile
85 90 95
Gln Val His Pro Asn Lys His Asn Ser Glu Ile Gly Phe Ala Lys Glu
100 105 110
Asn Ala Ala Gly Ile Pro Met Asp Ala Ala Glu Arg Asn Tyr Lys Asp
115 120 125
Pro Asn His Lys Pro Glu Leu Val Phe Ala Leu Thr Pro Phe Leu Ala
130 135 140
Met Asn Ala Phe Arg Glu Phe Ser Glu Ile Val Ser Leu Leu Gln Pro
145 150 155 160
Val Ala Gly Ala His Pro Ala Ile Ala His Phe Leu Gln Gln Pro Asp
165 170 175
Ala Glu Arg Leu Ser Glu Leu Phe Ala Ser Leu Leu Asn Met Gln Gly
180 185 190
Glu Glu Lys Ser Arg Ala Leu Ala Ile Leu Lys Ser Ala Leu Asp Ser
195 200 205
Gln Gln Gly Glu Pro Trp Gln Thr Ile Arg Leu Ile Ser Glu Phe Tyr
210 215 220
Pro Glu Asp Ser Gly Leu Phe Ser Pro Leu Leu Leu Asn Val Val Lys
225 230 235 240
Leu Asn Pro Gly Glu Ala Met Phe Leu Phe Ala Glu Thr Pro His Ala
245 250 255
Tyr Leu Gln Gly Val Ala Leu Glu Val Met Ala Asn Ser Asp Asn Val
260 265 270
Leu Arg Ala Gly Leu Thr Pro Lys Tyr Ile Asp Ile Pro Glu Leu Val
275 280 285
Ala Asn Val Lys Phe Glu Ala Lys Pro Ala Asn Gln Leu Leu Thr Gln
290 295 300
Pro Val Lys Gln Gly Ala Glu Leu Asp Phe Pro Ile Pro Val Asp Asp
305 310 315 320
Phe Ala Phe Ser Leu His Asp Leu Ser Asp Lys Glu Thr Thr Ile Ser
325 330 335
Gln Gln Ser Ala Ala Ile Leu Phe Cys Val Glu Gly Asp Ala Thr Leu
340 345 350
Trp Lys Gly Ser Gln Gln Leu Gln Leu Lys Pro Gly Glu Ser Ala Phe
355 360 365
Ile Ala Ala Asn Glu Ser Pro Val Thr Val Lys Gly His Gly Arg Leu
370 375 380
Ala Arg Val Tyr Asn Lys Leu
385 390
<210> 33
<211> 456
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 33
Met Lys Lys Leu Thr Cys Phe Lys Ala Tyr Asp Ile Arg Gly Lys Leu
1 5 10 15
Gly Glu Glu Leu Asn Glu Asp Ile Ala Trp Arg Ile Gly Arg Ala Tyr
20 25 30
Gly Glu Phe Leu Lys Pro Lys Thr Ile Val Leu Gly Gly Asp Val Arg
35 40 45
Leu Thr Ser Glu Thr Leu Lys Leu Ala Leu Ala Lys Gly Leu Gln Asp
50 55 60
Ala Gly Val Asp Val Leu Asp Ile Gly Met Ser Gly Thr Glu Glu Ile
65 70 75 80
Tyr Phe Ala Thr Phe His Leu Gly Val Asp Gly Gly Ile Glu Val Thr
85 90 95
Ala Ser His Asn Pro Met Asp Tyr Asn Gly Met Lys Leu Val Arg Glu
100 105 110
Gly Ala Arg Pro Ile Ser Gly Asp Thr Gly Leu Arg Asp Val Gln Arg
115 120 125
Leu Ala Glu Ala Asn Asp Phe Pro Pro Val Asp Glu Thr Lys Arg Gly
130 135 140
Arg Tyr Gln Gln Ile Asn Leu Arg Asp Ala Tyr Val Asp His Leu Phe
145 150 155 160
Gly Tyr Ile Asn Val Lys Asn Leu Thr Pro Leu Lys Leu Val Ile Asn
165 170 175
Ser Gly Asn Gly Ala Ala Gly Pro Val Val Asp Ala Ile Glu Ala Arg
180 185 190
Phe Lys Ala Leu Gly Ala Pro Val Glu Leu Ile Lys Val His Asn Thr
195 200 205
Pro Asp Gly Asn Phe Pro Asn Gly Ile Pro Asn Pro Leu Leu Pro Glu
210 215 220
Cys Arg Asp Asp Thr Arg Asn Ala Val Ile Lys His Gly Ala Asp Met
225 230 235 240
Gly Ile Ala Phe Asp Gly Asp Phe Asp Arg Cys Phe Leu Phe Asp Glu
245 250 255
Lys Gly Gln Phe Ile Glu Gly Tyr Tyr Ile Val Gly Leu Leu Ala Glu
260 265 270
Ala Phe Leu Glu Lys Asn Pro Gly Ala Lys Ile Ile His Asp Pro Arg
275 280 285
Leu Ser Trp Asn Thr Val Asp Val Val Thr Ala Ala Gly Gly Thr Pro
290 295 300
Val Met Ser Lys Thr Gly His Ala Phe Ile Lys Glu Arg Met Arg Lys
305 310 315 320
Glu Asp Ala Ile Tyr Gly Gly Glu Met Ser Ala His His Tyr Phe Arg
325 330 335
Asp Phe Ala Tyr Cys Asp Ser Gly Met Ile Pro Trp Leu Leu Val Ala
340 345 350
Glu Leu Val Cys Leu Lys Asp Lys Thr Leu Gly Glu Leu Val Arg Asp
355 360 365
Arg Met Ala Ala Phe Pro Ala Ser Gly Glu Ile Asn Ser Lys Leu Ala
370 375 380
Gln Pro Val Glu Ala Ile Asn Arg Val Glu Gln His Phe Ser Arg Glu
385 390 395 400
Ala Leu Ala Val Asp Arg Thr Asp Gly Ile Ser Met Thr Phe Ala Asp
405 410 415
Trp Arg Phe Asn Leu Arg Thr Ser Asn Thr Glu Pro Val Val Arg Leu
420 425 430
Asn Val Glu Ser Arg Gly Asp Val Pro Leu Met Glu Ala Arg Thr Arg
435 440 445
Thr Leu Leu Thr Leu Leu Asn Glu
450 455
<210> 34
<211> 478
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 34
Met Ala Gln Ser Lys Leu Tyr Pro Val Val Met Ala Gly Gly Ser Gly
1 5 10 15
Ser Arg Leu Trp Pro Leu Ser Arg Val Leu Tyr Pro Lys Gln Phe Leu
20 25 30
Cys Leu Lys Gly Asp Leu Thr Met Leu Gln Thr Thr Ile Cys Arg Leu
35 40 45
Asn Gly Val Glu Cys Glu Ser Pro Val Val Ile Cys Asn Glu Gln His
50 55 60
Arg Phe Ile Val Ala Glu Gln Leu Arg Gln Leu Asn Lys Leu Thr Glu
65 70 75 80
Asn Ile Ile Leu Glu Pro Ala Gly Arg Asn Thr Ala Pro Ala Ile Ala
85 90 95
Leu Ala Ala Leu Ala Ala Lys Arg His Ser Pro Glu Ser Asp Pro Leu
100 105 110
Met Leu Val Leu Ala Ala Asp His Val Ile Ala Asp Glu Asp Ala Phe
115 120 125
Arg Ala Ala Val Arg Asn Ala Met Pro Tyr Ala Glu Ala Gly Lys Leu
130 135 140
Val Thr Phe Gly Ile Val Pro Asp Leu Pro Glu Thr Gly Tyr Gly Tyr
145 150 155 160
Ile Arg Arg Gly Glu Val Ser Ala Gly Glu Gln Asp Met Val Ala Phe
165 170 175
Glu Val Ala Gln Phe Val Glu Lys Pro Asn Leu Glu Thr Ala Gln Ala
180 185 190
Tyr Val Ala Ser Gly Glu Tyr Tyr Trp Asn Ser Gly Met Phe Leu Phe
195 200 205
Arg Ala Gly Arg Tyr Leu Glu Glu Leu Lys Lys Tyr Arg Pro Asp Ile
210 215 220
Leu Asp Ala Cys Glu Lys Ala Met Ser Ala Val Asp Pro Asp Leu Asn
225 230 235 240
Phe Ile Arg Val Asp Glu Glu Ala Phe Leu Ala Cys Pro Glu Glu Ser
245 250 255
Val Asp Tyr Ala Val Met Glu Arg Thr Ala Asp Ala Val Val Val Pro
260 265 270
Met Asp Ala Gly Trp Ser Asp Val Gly Ser Trp Ser Ser Leu Trp Glu
275 280 285
Ile Ser Ala His Thr Ala Glu Gly Asn Val Cys His Gly Asp Val Ile
290 295 300
Asn His Lys Thr Glu Asn Ser Tyr Val Tyr Ala Glu Ser Gly Leu Val
305 310 315 320
Thr Thr Val Gly Val Lys Asp Leu Val Val Val Gln Thr Lys Asp Ala
325 330 335
Val Leu Ile Ala Asp Arg Asn Ala Val Gln Asp Val Lys Lys Val Val
340 345 350
Glu Gln Ile Lys Ala Asp Gly Arg His Glu His Arg Val His Arg Glu
355 360 365
Val Tyr Arg Pro Trp Gly Lys Tyr Asp Ser Ile Asp Ala Gly Asp Arg
370 375 380
Tyr Gln Val Lys Arg Ile Thr Val Lys Pro Gly Glu Gly Leu Ser Val
385 390 395 400
Gln Met His His His Arg Ala Glu His Trp Val Val Val Ala Gly Thr
405 410 415
Ala Lys Val Thr Ile Asp Gly Asp Ile Lys Leu Leu Gly Glu Asn Glu
420 425 430
Ser Ile Tyr Ile Pro Leu Gly Ala Thr His Cys Leu Glu Asn Pro Gly
435 440 445
Lys Ile Pro Leu Asp Leu Ile Glu Val Arg Ser Gly Ser Tyr Leu Glu
450 455 460
Glu Asp Asp Val Val Arg Phe Ala Asp Arg Tyr Gly Arg Val
465 470 475
<210> 35
<211> 373
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 35
Met Ser Lys Val Ala Leu Ile Thr Gly Val Thr Gly Gln Asp Gly Ser
1 5 10 15
Tyr Leu Ala Glu Phe Leu Leu Glu Lys Gly Tyr Glu Val His Gly Ile
20 25 30
Lys Arg Arg Ala Ser Ser Phe Asn Thr Glu Arg Val Asp His Ile Tyr
35 40 45
Gln Asp Pro His Thr Cys Asn Pro Lys Phe His Leu His Tyr Gly Asp
50 55 60
Leu Ser Asp Thr Ser Asn Leu Thr Arg Ile Leu Arg Glu Val Gln Pro
65 70 75 80
Asp Glu Val Tyr Asn Leu Gly Ala Met Ser His Val Ala Val Ser Phe
85 90 95
Glu Ser Pro Glu Tyr Thr Ala Asp Val Asp Ala Met Gly Thr Leu Arg
100 105 110
Leu Leu Glu Ala Ile Arg Phe Leu Gly Leu Glu Lys Lys Thr Arg Phe
115 120 125
Tyr Gln Ala Ser Thr Ser Glu Leu Tyr Gly Leu Val Gln Glu Ile Pro
130 135 140
Gln Lys Glu Thr Thr Pro Phe Tyr Pro Arg Ser Pro Tyr Ala Val Ala
145 150 155 160
Lys Leu Tyr Ala Tyr Trp Ile Thr Val Asn Tyr Arg Glu Ser Tyr Gly
165 170 175
Met Tyr Ala Cys Asn Gly Ile Leu Phe Asn His Glu Ser Pro Arg Arg
180 185 190
Gly Glu Thr Phe Val Thr Arg Lys Ile Thr Arg Ala Ile Ala Asn Ile
195 200 205
Ala Gln Gly Leu Glu Ser Cys Leu Tyr Leu Gly Asn Met Asp Ser Leu
210 215 220
Arg Asp Trp Gly His Ala Lys Asp Tyr Val Lys Met Gln Trp Met Met
225 230 235 240
Leu Gln Gln Glu Gln Pro Glu Asp Phe Val Ile Ala Thr Gly Val Gln
245 250 255
Tyr Ser Val Arg Gln Phe Val Glu Met Ala Ala Ala Gln Leu Gly Ile
260 265 270
Lys Leu Arg Phe Glu Gly Thr Gly Val Glu Glu Lys Gly Ile Val Val
275 280 285
Ser Val Thr Gly His Asp Ala Pro Gly Val Lys Pro Gly Asp Val Ile
290 295 300
Ile Ala Val Asp Pro Arg Tyr Phe Arg Pro Ala Glu Val Glu Thr Leu
305 310 315 320
Leu Gly Asp Pro Thr Lys Ala His Glu Lys Leu Gly Trp Lys Pro Glu
325 330 335
Ile Thr Leu Arg Glu Met Val Ser Glu Met Val Ala Asn Asp Leu Glu
340 345 350
Ala Ala Lys Lys His Ser Leu Leu Lys Ser His Gly Tyr Asp Val Ala
355 360 365
Ile Ala Leu Glu Ser
370
<210> 36
<211> 321
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 36
Met Ser Lys Gln Arg Val Phe Ile Ala Gly His Arg Gly Met Val Gly
1 5 10 15
Ser Ala Ile Arg Arg Gln Leu Glu Gln Arg Gly Asp Val Glu Leu Val
20 25 30
Leu Arg Thr Arg Asp Glu Leu Asn Leu Leu Asp Ser Arg Ala Val His
35 40 45
Asp Phe Phe Ala Ser Glu Arg Ile Asp Gln Val Tyr Leu Ala Ala Ala
50 55 60
Lys Val Gly Gly Ile Val Ala Asn Asn Thr Tyr Pro Ala Asp Phe Ile
65 70 75 80
Tyr Gln Asn Met Met Ile Glu Ser Asn Ile Ile His Ala Ala His Gln
85 90 95
Asn Asp Val Asn Lys Leu Leu Phe Leu Gly Ser Ser Cys Ile Tyr Pro
100 105 110
Lys Leu Ala Lys Gln Pro Met Ala Glu Ser Glu Leu Leu Gln Gly Thr
115 120 125
Leu Glu Pro Thr Asn Glu Pro Tyr Ala Ile Ala Lys Ile Ala Gly Ile
130 135 140
Lys Leu Cys Glu Ser Tyr Asn Arg Gln Tyr Gly Arg Asp Tyr Arg Ser
145 150 155 160
Val Met Pro Thr Asn Leu Tyr Gly Pro His Asp Asn Phe His Pro Ser
165 170 175
Asn Ser His Val Ile Pro Ala Leu Leu Arg Arg Phe His Glu Ala Thr
180 185 190
Ala Gln Asn Ala Pro Asp Val Val Val Trp Gly Ser Gly Thr Pro Met
195 200 205
Arg Glu Phe Leu His Val Asp Asp Met Ala Ala Ala Ser Ile His Val
210 215 220
Met Glu Leu Ala His Glu Val Trp Leu Glu Asn Thr Gln Pro Met Leu
225 230 235 240
Ser His Ile Asn Val Gly Thr Gly Val Asp Cys Thr Ile Arg Glu Leu
245 250 255
Ala Gln Thr Ile Ala Lys Val Val Gly Tyr Lys Gly Arg Val Val Phe
260 265 270
Asp Ala Ser Lys Pro Asp Gly Thr Pro Arg Lys Leu Leu Asp Val Thr
275 280 285
Arg Leu His Gln Leu Gly Trp Tyr His Glu Ile Ser Leu Glu Ala Gly
290 295 300
Leu Ala Ser Thr Tyr Gln Trp Phe Leu Glu Asn Gln Asp Arg Phe Arg
305 310 315 320
Gly
<210> 37
<211> 438
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 37
Met Gly Asn Thr Ser Ile Gln Thr Gln Ser Tyr Arg Ala Val Asp Lys
1 5 10 15
Asp Ala Gly Gln Ser Arg Ser Tyr Ile Ile Pro Phe Ala Leu Leu Cys
20 25 30
Ser Leu Phe Phe Leu Trp Ala Val Ala Asn Asn Leu Asn Asp Ile Leu
35 40 45
Leu Pro Gln Phe Gln Gln Ala Phe Thr Leu Thr Asn Phe Gln Ala Gly
50 55 60
Leu Ile Gln Ser Ala Phe Tyr Phe Gly Tyr Phe Ile Ile Pro Ile Pro
65 70 75 80
Ala Gly Ile Leu Met Lys Lys Leu Ser Tyr Lys Ala Gly Ile Ile Thr
85 90 95
Gly Leu Phe Leu Tyr Ala Leu Gly Ala Ala Leu Phe Trp Pro Ala Ala
100 105 110
Glu Ile Met Asn Tyr Thr Leu Phe Leu Val Gly Leu Phe Ile Ile Ala
115 120 125
Ala Gly Leu Gly Cys Leu Glu Thr Ala Ala Asn Pro Phe Val Thr Val
130 135 140
Leu Gly Pro Glu Ser Ser Gly His Phe Arg Leu Asn Leu Ala Gln Thr
145 150 155 160
Phe Asn Ser Phe Gly Ala Ile Ile Ala Val Val Phe Gly Gln Ser Leu
165 170 175
Ile Leu Ser Asn Val Pro His Gln Ser Gln Asp Val Leu Asp Lys Met
180 185 190
Ser Pro Glu Gln Leu Ser Ala Tyr Lys His Ser Leu Val Leu Ser Val
195 200 205
Gln Thr Pro Tyr Met Ile Ile Val Ala Ile Val Leu Leu Val Ala Leu
210 215 220
Leu Ile Met Leu Thr Lys Phe Pro Ala Leu Gln Ser Asp Asn His Ser
225 230 235 240
Asp Ala Lys Gln Gly Ser Phe Ser Ala Ser Leu Ser Arg Leu Ala Arg
245 250 255
Ile Arg His Trp Arg Trp Ala Val Leu Ala Gln Phe Cys Tyr Val Gly
260 265 270
Ala Gln Thr Ala Cys Trp Ser Tyr Leu Ile Arg Tyr Ala Val Glu Glu
275 280 285
Ile Pro Gly Met Thr Ala Gly Phe Ala Ala Asn Tyr Leu Thr Gly Thr
290 295 300
Met Val Cys Phe Phe Ile Gly Arg Phe Thr Gly Thr Trp Leu Ile Ser
305 310 315 320
Arg Phe Ala Pro His Lys Val Leu Ala Ala Tyr Ala Leu Ile Ala Met
325 330 335
Ala Leu Cys Leu Ile Ser Ala Phe Ala Gly Gly His Val Gly Leu Ile
340 345 350
Ala Leu Thr Leu Cys Ser Ala Phe Met Ser Ile Gln Tyr Pro Thr Ile
355 360 365
Phe Ser Leu Gly Ile Lys Asn Leu Gly Gln Asp Thr Lys Tyr Gly Ser
370 375 380
Ser Phe Ile Val Met Thr Ile Ile Gly Gly Gly Ile Val Thr Pro Val
385 390 395 400
Met Gly Phe Val Ser Asp Ala Ala Gly Asn Ile Pro Thr Ala Glu Leu
405 410 415
Ile Pro Ala Leu Cys Phe Ala Val Ile Phe Ile Phe Ala Arg Phe Arg
420 425 430
Ser Gln Thr Ala Thr Asn
435
<210> 38
<211> 949
<212> PRT
<213> Bacteroides fragilis NCTC 9343
<400> 38
Met Gln Lys Leu Leu Ser Leu Pro Ser Asn Leu Val Gln Ser Phe His
1 5 10 15
Glu Leu Glu Arg Val Asn Arg Thr Asp Trp Phe Cys Thr Ser Asp Pro
20 25 30
Val Gly Lys Lys Leu Gly Ser Gly Gly Gly Thr Ser Trp Leu Leu Glu
35 40 45
Glu Cys Tyr Asn Glu Tyr Ser Asp Gly Ala Thr Phe Gly Glu Trp Leu
50 55 60
Glu Lys Glu Lys Arg Ile Leu Leu His Ala Gly Gly Gln Ser Arg Arg
65 70 75 80
Leu Pro Gly Tyr Ala Pro Ser Gly Lys Ile Leu Thr Pro Val Pro Val
85 90 95
Phe Arg Trp Glu Arg Gly Gln His Leu Gly Gln Asn Leu Leu Ser Leu
100 105 110
Gln Leu Pro Leu Tyr Glu Lys Ile Met Ser Leu Ala Pro Asp Lys Leu
115 120 125
His Thr Leu Ile Ala Ser Gly Asp Val Tyr Ile Arg Ser Glu Lys Pro
130 135 140
Leu Gln Ser Ile Pro Glu Ala Asp Val Val Cys Tyr Gly Leu Trp Val
145 150 155 160
Asp Pro Ser Leu Ala Thr His His Gly Val Phe Ala Ser Asp Arg Lys
165 170 175
His Pro Glu Gln Leu Asp Phe Met Leu Gln Lys Pro Ser Leu Ala Glu
180 185 190
Leu Glu Ser Leu Ser Lys Thr His Leu Phe Leu Met Asp Ile Gly Ile
195 200 205
Trp Leu Leu Ser Asp Arg Ala Val Glu Ile Leu Met Lys Arg Ser His
210 215 220
Lys Glu Ser Ser Glu Glu Leu Lys Tyr Tyr Asp Leu Tyr Ser Asp Phe
225 230 235 240
Gly Leu Ala Leu Gly Thr His Pro Arg Ile Glu Asp Glu Glu Val Asn
245 250 255
Thr Leu Ser Val Ala Ile Leu Pro Leu Pro Gly Gly Glu Phe Tyr His
260 265 270
Tyr Gly Thr Ser Lys Glu Leu Ile Ser Ser Thr Leu Ser Val Gln Asn
275 280 285
Lys Val Tyr Asp Gln Arg Arg Ile Met His Arg Lys Val Lys Pro Asn
290 295 300
Pro Ala Met Phe Val Gln Asn Ala Val Val Arg Ile Pro Leu Cys Ala
305 310 315 320
Glu Asn Ala Asp Leu Trp Ile Glu Asn Ser His Ile Gly Pro Lys Trp
325 330 335
Lys Ile Ala Ser Arg His Ile Ile Thr Gly Val Pro Glu Asn Asp Trp
340 345 350
Ser Leu Ala Val Pro Ala Gly Val Cys Val Asp Val Val Pro Met Gly
355 360 365
Asp Lys Gly Phe Val Ala Arg Pro Tyr Gly Leu Asp Asp Val Phe Lys
370 375 380
Gly Asp Leu Arg Asp Ser Lys Thr Thr Leu Thr Gly Ile Pro Phe Gly
385 390 395 400
Glu Trp Met Ser Lys Arg Gly Leu Ser Tyr Thr Asp Leu Lys Gly Arg
405 410 415
Thr Asp Asp Leu Gln Ala Val Ser Val Phe Pro Met Val Asn Ser Val
420 425 430
Glu Glu Leu Gly Leu Val Leu Arg Trp Met Leu Ser Glu Pro Glu Leu
435 440 445
Glu Glu Gly Lys Asn Ile Trp Leu Arg Ser Glu His Phe Ser Ala Asp
450 455 460
Glu Ile Ser Ala Gly Ala Asn Leu Lys Arg Leu Tyr Ala Gln Arg Glu
465 470 475 480
Glu Phe Arg Lys Gly Asn Trp Lys Ala Leu Ala Val Asn His Glu Lys
485 490 495
Ser Val Phe Tyr Gln Leu Asp Leu Ala Asp Ala Ala Glu Asp Phe Val
500 505 510
Arg Leu Gly Leu Asp Met Pro Glu Leu Leu Pro Glu Asp Ala Leu Gln
515 520 525
Met Ser Arg Ile His Asn Arg Met Leu Arg Ala Arg Ile Leu Lys Leu
530 535 540
Asp Gly Lys Asp Tyr Arg Pro Glu Glu Gln Ala Ala Phe Asp Leu Leu
545 550 555 560
Arg Asp Gly Leu Leu Asp Gly Ile Ser Asn Arg Lys Ser Thr Pro Lys
565 570 575
Leu Asp Val Tyr Ser Asp Gln Ile Val Trp Gly Arg Ser Pro Val Arg
580 585 590
Ile Asp Met Ala Gly Gly Trp Thr Asp Thr Pro Pro Tyr Ser Leu Tyr
595 600 605
Ser Gly Gly Asn Val Val Asn Leu Ala Ile Glu Leu Asn Gly Gln Pro
610 615 620
Pro Leu Gln Val Tyr Val Lys Pro Cys Lys Asp Phe His Ile Val Leu
625 630 635 640
Arg Ser Ile Asp Met Gly Ala Met Glu Ile Val Ser Thr Phe Asp Glu
645 650 655
Leu Gln Asp Tyr Lys Lys Ile Gly Ser Pro Phe Ser Ile Pro Lys Ala
660 665 670
Ala Leu Ser Leu Ala Gly Phe Ala Pro Ala Phe Ser Ala Val Ser Tyr
675 680 685
Ala Ser Leu Glu Glu Gln Leu Lys Asp Phe Gly Ala Gly Ile Glu Val
690 695 700
Thr Leu Leu Ala Ala Ile Pro Ala Gly Ser Gly Leu Gly Thr Ser Ser
705 710 715 720
Ile Leu Ala Ser Thr Val Leu Gly Ala Ile Asn Asp Phe Cys Gly Leu
725 730 735
Ala Trp Asp Lys Asn Glu Ile Cys Gln Arg Thr Leu Val Leu Glu Gln
740 745 750
Leu Leu Thr Thr Gly Gly Gly Trp Gln Asp Gln Tyr Gly Gly Val Leu
755 760 765
Gln Gly Val Lys Leu Leu Gln Thr Glu Ala Gly Phe Ala Gln Ser Pro
770 775 780
Leu Val Arg Trp Leu Pro Asp His Leu Phe Thr His Pro Glu Tyr Lys
785 790 795 800
Asp Cys His Leu Leu Tyr Tyr Thr Gly Ile Thr Arg Thr Ala Lys Gly
805 810 815
Ile Leu Ala Glu Ile Val Ser Ser Met Phe Leu Asn Ser Ser Leu His
820 825 830
Leu Asn Leu Leu Ser Glu Met Lys Ala His Ala Leu Asp Met Asn Glu
835 840 845
Ala Ile Gln Arg Gly Ser Phe Val Glu Phe Gly Arg Leu Val Gly Lys
850 855 860
Thr Trp Glu Gln Asn Lys Ala Leu Asp Ser Gly Thr Asn Pro Pro Ala
865 870 875 880
Val Glu Ala Ile Ile Asp Leu Ile Lys Asp Tyr Thr Leu Gly Tyr Lys
885 890 895
Leu Pro Gly Ala Gly Gly Gly Gly Tyr Leu Tyr Met Val Ala Lys Asp
900 905 910
Pro Gln Ala Ala Val Arg Ile Arg Lys Ile Leu Thr Glu Asn Ala Pro
915 920 925
Asn Pro Arg Ala Arg Phe Val Glu Met Thr Leu Ser Asp Lys Gly Phe
930 935 940
Gln Val Ser Arg Ser
945
<210> 39
<211> 159
<212> PRT
<213> Saccharomyces cerevisiae
<400> 39
Met Ser Leu Pro Asp Gly Phe Tyr Ile Arg Arg Met Glu Glu Gly Asp
1 5 10 15
Leu Glu Gln Val Thr Glu Thr Leu Lys Val Leu Thr Thr Val Gly Thr
20 25 30
Ile Thr Pro Glu Ser Phe Ser Lys Leu Ile Lys Tyr Trp Asn Glu Ala
35 40 45
Thr Val Trp Asn Asp Asn Glu Asp Lys Lys Ile Met Gln Tyr Asn Pro
50 55 60
Met Val Ile Val Asp Lys Arg Thr Glu Thr Val Ala Ala Thr Gly Asn
65 70 75 80
Ile Ile Ile Glu Arg Lys Ile Ile His Glu Leu Gly Leu Cys Gly His
85 90 95
Ile Glu Asp Ile Ala Val Asn Ser Lys Tyr Gln Gly Gln Gly Leu Gly
100 105 110
Lys Leu Leu Ile Asp Gln Leu Val Thr Ile Gly Phe Asp Tyr Gly Cys
115 120 125
Tyr Lys Ile Ile Leu Asp Cys Asp Glu Lys Asn Val Lys Phe Tyr Glu
130 135 140
Lys Cys Gly Phe Ser Asn Ala Gly Val Glu Met Gln Ile Arg Lys
145 150 155
<210> 40
<211> 421
<212> PRT
<213> Bacteroides ovatus
<400> 40
Met Asp Ser Lys Asn Asn Ile Gly His Ser Ala Asp Ile Ser Leu Thr
1 5 10 15
Ala Glu Leu Pro Ile Pro Ile Tyr Asn Gly Asn Thr Ile Met Asp Phe
20 25 30
Lys Lys Leu Ala Ser Leu Tyr Lys Asp Glu Leu Leu Asp Asn Val Leu
35 40 45
Pro Phe Trp Leu Glu His Ser Gln Asp His Glu Tyr Gly Gly Tyr Phe
50 55 60
Thr Cys Leu Asp Arg Glu Gly Lys Val Phe Asp Thr Asp Lys Phe Ile
65 70 75 80
Trp Leu Gln Ser Arg Glu Val Trp Met Phe Ser Met Leu Tyr Asn Lys
85 90 95
Val Glu Lys Arg Gln Glu Trp Leu Asp Cys Ala Ile Gln Gly Gly Glu
100 105 110
Phe Leu Lys Lys Tyr Gly His Asp Gly Asn Tyr Asn Trp Tyr Phe Ser
115 120 125
Leu Asp Arg Ser Gly Arg Pro Leu Val Glu Pro Tyr Asn Ile Phe Ser
130 135 140
Tyr Thr Phe Ala Thr Met Ala Phe Gly Gln Leu Ser Leu Thr Thr Gly
145 150 155 160
Asn Gln Glu Tyr Ala Asp Ile Ala Lys Lys Thr Phe Asp Ile Ile Leu
165 170 175
Ser Lys Val Asp Asn Pro Lys Gly Arg Trp Asn Lys Leu His Pro Gly
180 185 190
Thr Arg Asn Leu Lys Asn Phe Ala Leu Pro Met Ile Leu Cys Asn Leu
195 200 205
Ala Leu Glu Ile Glu His Leu Leu Asp Glu Thr Tyr Leu Arg Glu Thr
210 215 220
Met Asp Thr Cys Ile His Glu Val Met Glu Val Phe Tyr Arg Pro Glu
225 230 235 240
Leu Gly Gly Ile Ile Val Glu Asn Val Asp Ile Asp Gly Asn Leu Val
245 250 255
Asp Cys Phe Glu Gly Arg Gln Val Thr Pro Gly His Ala Ile Glu Ala
260 265 270
Met Trp Phe Ile Met Asp Leu Gly Lys Arg Leu Asn Arg Pro Glu Leu
275 280 285
Ile Glu Lys Ala Lys Glu Thr Thr Leu Thr Met Leu Asn Tyr Gly Trp
290 295 300
Asp Lys Gln Tyr Gly Gly Ile Tyr Tyr Phe Met Asp Arg Asn Gly Cys
305 310 315 320
Pro Pro Gln Gln Leu Glu Trp Asp Gln Lys Leu Trp Trp Val His Ile
325 330 335
Glu Thr Leu Ile Ser Leu Leu Lys Gly Tyr Gln Leu Thr Gly Asp Lys
340 345 350
Lys Cys Leu Glu Trp Phe Glu Lys Val His Asp Tyr Thr Trp Glu His
355 360 365
Phe Lys Asp Lys Glu Tyr Pro Glu Trp Tyr Gly Tyr Leu Asn Arg Arg
370 375 380
Gly Glu Val Leu Leu Pro Leu Lys Gly Gly Lys Trp Lys Gly Cys Phe
385 390 395 400
His Val Pro Arg Gly Leu Tyr Gln Cys Trp Lys Thr Leu Glu Glu Ile
405 410 415
Lys Asn Ile Val Ser
420
<210> 41
<211> 349
<212> PRT
<213> Neisseria meningitidis
<400> 41
Met Gln Asn Asn Asn Glu Phe Lys Ile Gly Asn Arg Ser Val Gly Tyr
1 5 10 15
Asn His Glu Pro Leu Ile Ile Cys Glu Ile Gly Ile Asn His Glu Gly
20 25 30
Ser Leu Lys Thr Ala Phe Glu Met Val Asp Ala Ala Tyr Asn Ala Gly
35 40 45
Ala Glu Val Val Lys His Gln Thr His Ile Val Glu Asp Glu Met Ser
50 55 60
Asp Glu Ala Lys Gln Val Ile Pro Gly Asn Ala Asp Val Ser Ile Tyr
65 70 75 80
Glu Ile Met Glu Arg Cys Ala Leu Asn Glu Glu Asp Glu Ile Lys Leu
85 90 95
Lys Glu Tyr Val Glu Ser Lys Gly Met Ile Phe Ile Ser Thr Pro Phe
100 105 110
Ser Arg Ala Ala Ala Leu Arg Leu Gln Arg Met Asp Ile Pro Ala Tyr
115 120 125
Lys Ile Gly Ser Gly Glu Cys Asn Asn Tyr Pro Leu Ile Lys Leu Val
130 135 140
Ala Ser Phe Gly Lys Pro Ile Ile Leu Ser Thr Gly Met Asn Ser Ile
145 150 155 160
Glu Ser Ile Lys Lys Ser Val Glu Ile Ile Arg Glu Ala Gly Val Pro
165 170 175
Tyr Ala Leu Leu His Cys Thr Asn Ile Tyr Pro Thr Pro Tyr Glu Asp
180 185 190
Val Arg Leu Gly Gly Met Asn Asp Leu Ser Glu Ala Phe Pro Asp Ala
195 200 205
Ile Ile Gly Leu Ser Asp His Thr Leu Asp Asn Tyr Ala Cys Leu Gly
210 215 220
Ala Val Ala Leu Gly Gly Ser Ile Leu Glu Arg His Phe Thr Asp Arg
225 230 235 240
Met Asp Arg Pro Gly Pro Asp Ile Val Cys Ser Met Asn Pro Asp Thr
245 250 255
Phe Lys Glu Leu Lys Gln Gly Ala His Ala Leu Lys Leu Ala Arg Gly
260 265 270
Gly Lys Lys Asp Thr Ile Ile Ala Gly Glu Lys Pro Thr Lys Asp Phe
275 280 285
Ala Phe Ala Ser Val Val Ala Asp Lys Asp Ile Lys Lys Gly Glu Leu
290 295 300
Leu Ser Gly Asp Asn Leu Trp Val Lys Arg Pro Gly Asn Gly Asp Phe
305 310 315 320
Ser Val Asn Glu Tyr Glu Thr Leu Phe Gly Lys Val Ala Ala Cys Asn
325 330 335
Ile Arg Lys Gly Ala Gln Ile Lys Lys Thr Asp Ile Glu
340 345
<210> 42
<211> 223
<212> PRT
<213> Pasteurella multocida
<400> 42
Met Thr Asn Ile Ala Ile Ile Pro Ala Arg Ala Gly Ser Lys Gly Ile
1 5 10 15
Pro Asp Lys Asn Leu Gln Pro Val Gly Gly His Ser Leu Ile Gly Arg
20 25 30
Ala Ile Leu Ala Ala Lys Asn Ala Asp Val Phe Asp Met Ile Val Val
35 40 45
Thr Ser Asp Gly Asp Asn Ile Leu Arg Glu Ala Glu Lys Tyr Gly Ala
50 55 60
Leu Ala Leu Lys Arg Pro Ala Glu Leu Ala Gln Asp Asn Ser Arg Thr
65 70 75 80
Ile Asp Ala Ile Leu His Ala Leu Glu Ser Leu Asn Ile Arg Glu Gly
85 90 95
Thr Cys Thr Leu Leu Gln Pro Thr Ser Pro Leu Arg Asp His Leu Asp
100 105 110
Ile Lys Asn Ala Met Asp Met Tyr Val Asn Gly Gly Val His Ser Val
115 120 125
Val Ser Ala Cys Glu Cys Glu His His Pro Tyr Lys Ala Phe Ala Leu
130 135 140
Ser Lys Asp His Glu Val Leu Pro Val Arg Glu Ile Ala Asp Phe Glu
145 150 155 160
Ala Ala Arg Gln Thr Leu Pro Lys Met Tyr Arg Ala Asn Gly Ala Ile
165 170 175
Tyr Ile Asn Asp Ile Ala Gln Leu Leu Lys Glu Lys Tyr Phe Phe Ile
180 185 190
Pro Pro Leu Lys Phe Tyr Leu Met Pro Thr Tyr Arg Ser Val Asp Ile
195 200 205
Asp Val Lys Gln Asp Leu Glu Leu Ala Glu Ile Leu Ser Asn Lys
210 215 220
<210> 43
<211> 268
<212> PRT
<213> Pasteurella multocida
<400> 43
Met Asp Lys Phe Ala Glu His Glu Ile Pro Lys Ala Val Ile Val Ala
1 5 10 15
Gly Asn Gly Glu Ser Leu Ser Gln Ile Asp Tyr Arg Leu Leu Pro Lys
20 25 30
Asn Tyr Asp Val Phe Arg Cys Asn Gln Phe Tyr Phe Glu Glu Arg Tyr
35 40 45
Phe Leu Gly Asn Lys Ile Lys Ala Val Phe Phe Thr Pro Gly Val Phe
50 55 60
Leu Glu Gln Tyr Tyr Thr Leu Tyr His Leu Lys Arg Asn Asn Glu Tyr
65 70 75 80
Phe Val Asp Asn Val Ile Leu Ser Ser Phe Asn His Pro Thr Val Asp
85 90 95
Leu Glu Lys Ser Gln Lys Ile Gln Ala Leu Phe Ile Asp Val Ile Asn
100 105 110
Gly Tyr Glu Lys Tyr Leu Ser Lys Leu Thr Ala Phe Asp Val Tyr Leu
115 120 125
Arg Tyr Lys Glu Leu Tyr Glu Asn Gln Arg Ile Thr Ser Gly Val Tyr
130 135 140
Met Cys Ala Val Ala Ile Ala Met Gly Tyr Thr Asp Ile Tyr Leu Thr
145 150 155 160
Gly Ile Asp Phe Tyr Gln Ala Ser Glu Glu Asn Tyr Ala Phe Asp Asn
165 170 175
Lys Lys Pro Asn Ile Ile Arg Leu Leu Pro Asp Phe Arg Lys Glu Lys
180 185 190
Thr Leu Phe Ser Tyr His Ser Lys Asp Ile Asp Leu Glu Ala Leu Ser
195 200 205
Phe Leu Gln Gln His Tyr His Val Asn Phe Tyr Ser Ile Ser Pro Met
210 215 220
Ser Pro Leu Ser Lys His Phe Pro Ile Pro Thr Val Glu Asp Asp Cys
225 230 235 240
Glu Thr Thr Phe Val Ala Pro Leu Lys Glu Asn Tyr Ile Asn Asp Ile
245 250 255
Leu Leu Pro Pro His Phe Val Tyr Glu Lys Leu Gly
260 265
<210> 44
<211> 371
<212> PRT
<213> Neisseria meningitidis
<400> 44
Met Gly Leu Lys Lys Ala Cys Leu Thr Val Leu Cys Leu Ile Val Phe
1 5 10 15
Cys Phe Gly Ile Phe Tyr Thr Phe Asp Arg Val Asn Gln Gly Glu Arg
20 25 30
Asn Ala Val Ser Leu Leu Lys Glu Lys Leu Phe Asn Glu Glu Gly Glu
35 40 45
Pro Val Asn Leu Ile Phe Cys Tyr Thr Ile Leu Gln Met Lys Val Ala
50 55 60
Glu Arg Ile Met Ala Gln His Pro Gly Glu Arg Phe Tyr Val Val Leu
65 70 75 80
Met Ser Glu Asn Arg Asn Glu Lys Tyr Asp Tyr Tyr Phe Asn Gln Ile
85 90 95
Lys Asp Lys Ala Glu Arg Ala Tyr Phe Phe His Leu Pro Tyr Gly Leu
100 105 110
Asn Lys Ser Phe Asn Phe Ile Pro Thr Met Ala Glu Leu Lys Val Lys
115 120 125
Ser Met Leu Leu Pro Lys Val Lys Arg Ile Tyr Leu Ala Ser Leu Glu
130 135 140
Lys Val Ser Ile Ala Ala Phe Leu Ser Thr Tyr Pro Asp Ala Glu Ile
145 150 155 160
Lys Thr Phe Asp Asp Gly Thr Gly Asn Leu Ile Gln Ser Ser Ser Tyr
165 170 175
Leu Gly Asp Glu Phe Ser Val Asn Gly Thr Ile Lys Arg Asn Phe Ala
180 185 190
Arg Met Met Ile Gly Asp Trp Ser Ile Ala Lys Thr Arg Asn Ala Ser
195 200 205
Asp Glu His Tyr Thr Ile Phe Lys Gly Leu Lys Asn Ile Met Asp Asp
210 215 220
Gly Arg Arg Lys Met Thr Tyr Leu Pro Leu Phe Asp Ala Ser Glu Leu
225 230 235 240
Lys Thr Gly Asp Glu Thr Gly Gly Thr Val Arg Ile Leu Leu Gly Ser
245 250 255
Pro Asp Lys Glu Met Lys Glu Ile Ser Glu Lys Ala Ala Lys Asn Phe
260 265 270
Lys Ile Gln Tyr Val Ala Pro His Pro Arg Gln Thr Tyr Gly Leu Ser
275 280 285
Gly Val Thr Thr Leu Asn Ser Pro Tyr Val Ile Glu Asp Tyr Ile Leu
290 295 300
Arg Glu Ile Lys Lys Asn Pro His Thr Arg Tyr Glu Ile Tyr Thr Phe
305 310 315 320
Phe Ser Gly Ala Ala Leu Thr Met Lys Asp Phe Pro Asn Val His Val
325 330 335
Tyr Ala Leu Lys Pro Ala Ser Leu Pro Glu Asp Tyr Trp Leu Lys Pro
340 345 350
Val Tyr Ala Leu Phe Thr Gln Ser Gly Ile Pro Ile Leu Thr Phe Asp
355 360 365
Asp Lys Asn
370
<210> 45
<211> 391
<212> PRT
<213> Photobacterium damselae
<400> 45
Met Thr Val Val Ala Pro Thr Leu Glu Val Tyr Ile Asp His Ala Ser
1 5 10 15
Leu Pro Ser Leu Gln Gln Leu Ile His Ile Ile Gln Ala Lys Asp Glu
20 25 30
Tyr Pro Ser Asn Gln Arg Phe Val Ser Trp Lys Arg Val Thr Val Asp
35 40 45
Ala Asp Asn Ala Asn Lys Leu Asn Ile His Thr Tyr Pro Leu Lys Gly
50 55 60
Asn Asn Thr Ser Pro Glu Met Val Ala Ala Ile Asp Glu Tyr Ala Gln
65 70 75 80
Ser Lys Asn Arg Leu Asn Ile Glu Phe Tyr Thr Asn Thr Ala His Val
85 90 95
Phe Asn Asn Leu Pro Pro Ile Ile Gln Pro Leu Tyr Asn Asn Glu Lys
100 105 110
Val Lys Ile Ser His Ile Ser Leu Tyr Asp Asp Gly Ser Ser Glu Tyr
115 120 125
Val Ser Leu Tyr Gln Trp Lys Asp Thr Pro Asn Lys Ile Glu Thr Leu
130 135 140
Glu Gly Glu Val Ser Leu Leu Ala Asn Tyr Leu Ala Gly Thr Ser Pro
145 150 155 160
Asp Ala Pro Lys Gly Met Gly Asn Arg Tyr Asn Trp His Lys Leu Tyr
165 170 175
Asp Thr Asp Tyr Tyr Phe Leu Arg Glu Asp Tyr Leu Asp Val Glu Ala
180 185 190
Asn Leu His Asp Leu Arg Asp Tyr Leu Gly Ser Ser Ala Lys Gln Met
195 200 205
Pro Trp Asp Glu Phe Ala Lys Leu Ser Asp Ser Gln Gln Thr Leu Phe
210 215 220
Leu Asp Ile Val Gly Phe Asp Lys Glu Gln Leu Gln Gln Gln Tyr Ser
225 230 235 240
Gln Ser Pro Leu Pro Asn Phe Ile Phe Thr Gly Thr Thr Thr Trp Ala
245 250 255
Gly Gly Glu Thr Lys Glu Tyr Tyr Ala Gln Gln Gln Val Asn Val Ile
260 265 270
Asn Asn Ala Ile Asn Glu Thr Ser Pro Tyr Tyr Leu Gly Lys Asp Tyr
275 280 285
Asp Leu Phe Phe Lys Gly His Pro Ala Gly Gly Val Ile Asn Asp Ile
290 295 300
Ile Leu Gly Ser Phe Pro Asp Met Ile Asn Ile Pro Ala Lys Ile Ser
305 310 315 320
Phe Glu Val Leu Met Met Thr Asp Met Leu Pro Asp Thr Val Ala Gly
325 330 335
Ile Ala Ser Ser Leu Tyr Phe Thr Ile Pro Ala Asp Lys Val Asn Phe
340 345 350
Ile Val Phe Thr Ser Ser Asp Thr Ile Thr Asp Arg Glu Glu Ala Leu
355 360 365
Lys Ser Pro Leu Val Gln Val Met Leu Thr Leu Gly Ile Val Lys Glu
370 375 380
Lys Asp Val Leu Phe Trp Ala
385 390
<210> 46
<211> 498
<212> PRT
<213> Photobacterium sp. JT-ISH-224
<400> 46
Met Ser Glu Glu Asn Thr Gln Ser Ile Ile Lys Asn Asp Ile Asn Lys
1 5 10 15
Thr Ile Ile Asp Glu Glu Tyr Val Asn Leu Glu Pro Ile Asn Gln Ser
20 25 30
Asn Ile Ser Phe Thr Lys His Ser Trp Val Gln Thr Cys Gly Thr Gln
35 40 45
Gln Leu Leu Thr Glu Gln Asn Lys Glu Ser Ile Ser Leu Ser Val Val
50 55 60
Ala Pro Arg Leu Asp Asp Asp Glu Lys Tyr Cys Phe Asp Phe Asn Gly
65 70 75 80
Val Ser Asn Lys Gly Glu Lys Tyr Ile Thr Lys Val Thr Leu Asn Val
85 90 95
Val Ala Pro Ser Leu Glu Val Tyr Val Asp His Ala Ser Leu Pro Thr
100 105 110
Leu Gln Gln Leu Met Asp Ile Ile Lys Ser Glu Glu Glu Asn Pro Thr
115 120 125
Ala Gln Arg Tyr Ile Ala Trp Gly Arg Ile Val Pro Thr Asp Glu Gln
130 135 140
Met Lys Glu Leu Asn Ile Thr Ser Phe Ala Leu Ile Asn Asn His Thr
145 150 155 160
Pro Ala Asp Leu Val Gln Glu Ile Val Lys Gln Ala Gln Thr Lys His
165 170 175
Arg Leu Asn Val Lys Leu Ser Ser Asn Thr Ala His Ser Phe Asp Asn
180 185 190
Leu Val Pro Ile Leu Lys Glu Leu Asn Ser Phe Asn Asn Val Thr Val
195 200 205
Thr Asn Ile Asp Leu Tyr Asp Asp Gly Ser Ala Glu Tyr Val Asn Leu
210 215 220
Tyr Asn Trp Arg Asp Thr Leu Asn Lys Thr Asp Asn Leu Lys Ile Gly
225 230 235 240
Lys Asp Tyr Leu Glu Asp Val Ile Asn Gly Ile Asn Glu Asp Thr Ser
245 250 255
Asn Thr Gly Thr Ser Ser Val Tyr Asn Trp Gln Lys Leu Tyr Pro Ala
260 265 270
Asn Tyr His Phe Leu Arg Lys Asp Tyr Leu Thr Leu Glu Pro Ser Leu
275 280 285
His Glu Leu Arg Asp Tyr Ile Gly Asp Ser Leu Lys Gln Met Gln Trp
290 295 300
Asp Gly Phe Lys Lys Phe Asn Ser Lys Gln Gln Glu Leu Phe Leu Ser
305 310 315 320
Ile Val Asn Phe Asp Lys Gln Lys Leu Gln Asn Glu Tyr Asn Ser Ser
325 330 335
Asn Leu Pro Asn Phe Val Phe Thr Gly Thr Thr Val Trp Ala Gly Asn
340 345 350
His Glu Arg Glu Tyr Tyr Ala Lys Gln Gln Ile Asn Val Ile Asn Asn
355 360 365
Ala Ile Asn Glu Ser Ser Pro His Tyr Leu Gly Asn Ser Tyr Asp Leu
370 375 380
Phe Phe Lys Gly His Pro Gly Gly Gly Ile Ile Asn Thr Leu Ile Met
385 390 395 400
Gln Asn Tyr Pro Ser Met Val Asp Ile Pro Ser Lys Ile Ser Phe Glu
405 410 415
Val Leu Met Met Thr Asp Met Leu Pro Asp Ala Val Ala Gly Ile Ala
420 425 430
Ser Ser Leu Tyr Phe Thr Ile Pro Ala Glu Lys Ile Lys Phe Ile Val
435 440 445
Phe Thr Ser Thr Glu Thr Ile Thr Asp Arg Glu Thr Ala Leu Arg Ser
450 455 460
Pro Leu Val Gln Val Met Ile Lys Leu Gly Ile Val Lys Glu Glu Asn
465 470 475 480
Val Leu Phe Trp Ala Asp Leu Pro Asn Cys Glu Thr Gly Val Cys Ile
485 490 495
Ala Val
<210> 47
<211> 188
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 47
Met Tyr Glu Arg Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Ile
1 5 10 15
Leu Asp Thr Glu Pro Thr His Arg Lys Ala Trp Arg Glu Val Leu Gly
20 25 30
His Tyr Gly Leu Gln Tyr Asp Ile Gln Ala Met Ile Ala Leu Asn Gly
35 40 45
Ser Pro Thr Trp Arg Ile Ala Gln Ala Ile Ile Glu Leu Asn Gln Ala
50 55 60
Asp Leu Asp Pro His Ala Leu Ala Arg Glu Lys Thr Glu Ala Val Arg
65 70 75 80
Ser Met Leu Leu Asp Ser Val Glu Pro Leu Pro Leu Val Asp Val Val
85 90 95
Lys Ser Trp His Gly Arg Arg Pro Met Ala Val Gly Thr Gly Ser Glu
100 105 110
Ser Ala Ile Ala Glu Ala Leu Leu Ala His Leu Gly Leu Arg His Tyr
115 120 125
Phe Asp Ala Val Val Ala Ala Asp His Val Lys His His Lys Pro Ala
130 135 140
Pro Asp Thr Phe Leu Leu Cys Ala Gln Arg Met Gly Val Gln Pro Thr
145 150 155 160
Gln Cys Val Val Phe Glu Asp Ala Asp Phe Gly Ile Gln Ala Ala Arg
165 170 175
Ala Ala Gly Met Asp Ala Val Asp Val Arg Leu Leu
180 185
<210> 48
<211> 373
<212> PRT
<213> Campylobacter jejuni
<400> 48
Met Val Lys Lys Ile Leu Phe Ile Thr Gly Ser Arg Ala Asp Tyr Ser
1 5 10 15
Lys Ile Lys Ser Leu Met Tyr Arg Val Gln Asn Ser Ser Glu Phe Glu
20 25 30
Leu Tyr Ile Phe Ala Thr Gly Met His Leu Ser Lys Asn Phe Gly Tyr
35 40 45
Thr Val Lys Glu Leu Tyr Lys Asn Gly Phe Lys Asn Ile Tyr Glu Phe
50 55 60
Ile Asn Tyr Asp Lys Tyr Tyr Gln Thr Asp Lys Ala Leu Ala Thr Thr
65 70 75 80
Ile Asp Gly Phe Ser Arg Tyr Ala Asn Glu Leu Lys Pro Asp Leu Ile
85 90 95
Val Val His Gly Asp Arg Ile Glu Pro Leu Ala Ala Ala Ile Val Gly
100 105 110
Ala Leu Asn Asn Ile Leu Val Ala His Ile Glu Gly Gly Glu Ile Ser
115 120 125
Gly Thr Ile Asp Asp Ser Leu Arg His Ala Ile Ser Lys Leu Ala His
130 135 140
Ile His Leu Val Asn Asp Glu Phe Ala Lys Arg Arg Leu Met Gln Leu
145 150 155 160
Gly Glu Asp Glu Lys Ser Ile Phe Ile Ile Gly Ser Pro Asp Leu Glu
165 170 175
Leu Leu Asn Asp Asn Lys Ile Ser Leu Ser Glu Ala Lys Lys Tyr Tyr
180 185 190
Asp Ile Asn Tyr Glu Asn Tyr Ala Leu Leu Met Phe His Pro Val Thr
195 200 205
Thr Glu Ile Thr Ser Ile Lys Asn Gln Ala Asp Asn Leu Val Lys Ala
210 215 220
Leu Ile Gln Ser Asn Lys Asn Tyr Ile Val Ile Tyr Pro Asn Asn Asp
225 230 235 240
Leu Gly Phe Glu Leu Ile Leu Gln Ser Tyr Glu Glu Phe Lys Asn Asn
245 250 255
Pro Arg Phe Lys Leu Phe Pro Ser Leu Arg Phe Glu Tyr Phe Ile Thr
260 265 270
Leu Leu Lys Asn Ala Asp Phe Ile Ile Gly Asn Ser Ser Cys Ile Leu
275 280 285
Lys Glu Ala Leu Tyr Leu Lys Thr Ala Gly Ile Leu Val Gly Ser Arg
290 295 300
Gln Asn Gly Arg Leu Gly Asn Glu Asn Thr Leu Lys Val Asn Ala Asn
305 310 315 320
Ser Asp Glu Ile Leu Lys Ala Ile Asn Thr Ile His Lys Lys Gln Asp
325 330 335
Leu Phe Ser Ala Lys Leu Glu Ile Leu Asp Ser Ser Lys Leu Phe Phe
340 345 350
Glu Tyr Leu Gln Ser Gly Asp Phe Phe Lys Leu Ser Thr Gln Lys Val
355 360 365
Phe Lys Asp Ile Lys
370
<210> 49
<211> 415
<212> PRT
<213> Escherichia coli W
<400> 49
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 50
<211> 301
<212> PRT
<213> Zymomonas mobilis
<400> 50
Met Lys Asn Asp Lys Lys Ile Tyr Gly Cys Ile Glu Gly Gly Gly Thr
1 5 10 15
Lys Phe Met Leu Ala Leu Ile Asp Ser Asp Arg Lys Met Leu Ala Val
20 25 30
Glu Arg Val Pro Thr Thr Thr Pro Glu Glu Thr Leu Gly Lys Ser Val
35 40 45
Glu Phe Phe Lys Lys Ala Leu Pro Gln Tyr Ala Asp Ser Phe Ala Ser
50 55 60
Phe Gly Ile Ala Ser Phe Gly Pro Leu Cys Leu Asp Arg Lys Ser Pro
65 70 75 80
Lys Trp Gly Tyr Ile Thr Asn Thr Pro Lys Pro Phe Trp Pro Asn Thr
85 90 95
Asp Val Val Thr Pro Phe Lys Glu Ala Phe Gly Cys Pro Val Glu Ile
100 105 110
Asp Thr Asp Val Asn Gly Ala Ala Leu Ala Glu Asn Phe Trp Gly Ala
115 120 125
Ser Lys Gly Thr His Thr Ser Val Tyr Val Thr Val Gly Thr Gly Phe
130 135 140
Gly Gly Gly Val Leu Ile Asp Gly Lys Pro Ile His Gly Leu Ala His
145 150 155 160
Pro Glu Met Gly His Gly Ile Pro Ile Arg His Pro Asp Asp Arg Asp
165 170 175
Phe Glu Gly Cys Cys Pro Tyr His Gly Gly Cys Tyr Glu Gly Leu Ala
180 185 190
Ser Gly Thr Ala Ile Arg Lys Arg Trp Gly Lys Ala Leu Asn Glu Met
195 200 205
Glu Pro Ala Glu Phe Glu Lys Ala Arg Glu Ile Ile Ala Phe Tyr Leu
210 215 220
Ala His Phe Asn Val Thr Leu Gln Ala Phe Ile Ser Pro Glu Arg Ile
225 230 235 240
Val Phe Gly Gly Gly Val Met His Val Asp Gly Met Leu Ala Ser Val
245 250 255
Arg Arg Gln Thr Ala Glu Ile Ala Asn Ser Tyr Phe Glu Gly Ala Asp
260 265 270
Phe Glu Lys Ile Ile Val Leu Pro Gly Leu Gly Asp Gln Ala Gly Met
275 280 285
Met Gly Ala Phe Ala Leu Ala Leu Ala Ala Glu Asn Lys
290 295 300
<210> 51
<211> 504
<212> PRT
<213> Bifidobacterium adolescentis
<400> 51
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp
1 5 10 15
Gly Thr Ile Lys Ser Met Thr Asp Ile Leu Arg Thr Arg Phe Asp Gly
20 25 30
Val Tyr Asp Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Glu Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asn Ile
65 70 75 80
Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe
85 90 95
Gln Asp Val Leu Ala Lys Gly Glu Glu Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ser Val Phe Pro Asn Gly Ala Thr Glu Glu Asp Leu
115 120 125
Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Lys
130 135 140
Phe Ala Gly Lys Thr Arg Leu Val Trp Val Ser Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Asp Ser Asp Lys Gly Trp Glu Tyr Leu Met Ser
165 170 175
Ile Phe Asp Gln Met Ala Ala Ser His Val Ser Tyr Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Glu Ala Gly Thr Ser Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Lys Leu Ile Ser Arg Leu Arg Glu Glu Gly Val Lys
210 215 220
Arg Gly Leu Glu Ile Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Leu Pro
245 250 255
Pro Leu Leu Leu His Ala Leu Ser Thr Gly His Val Glu Pro Val Ala
260 265 270
His Trp Thr Asp Ile Arg Pro Asn Asn Ala Val Thr Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Leu Asp Arg
290 295 300
Ser Leu Lys Gly Leu Val Pro Asp Glu Asp Val Asp Asn Leu Val Asn
305 310 315 320
Thr Ile His Ala Asn Thr His Gly Glu Ser Gln Ala Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Ser Thr Tyr Tyr Ser
340 345 350
Ala Leu Gly Cys Asn Asp Gln His Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Leu Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Lys Asn Asp Met Glu Leu Leu Arg Lys Thr Asn Asn Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Thr Ala Glu Ile Asp Glu Asn Leu Lys
405 410 415
Arg Pro Val Val Lys Ala Leu Asn Ala Leu Ala Lys Phe Arg Asn Glu
420 425 430
Leu Asp Ala Phe Asp Gly Thr Phe Ser Tyr Thr Thr Asp Asp Asp Thr
435 440 445
Ser Ile Ser Phe Thr Trp Arg Gly Glu Thr Ser Gln Ala Thr Leu Thr
450 455 460
Phe Glu Pro Lys Arg Gly Leu Gly Val Asp Asn Thr Thr Pro Val Ala
465 470 475 480
Met Leu Glu Trp Glu Asp Ser Ala Gly Asp His Arg Ser Asp Asp Leu
485 490 495
Ile Ala Asn Pro Pro Val Val Ala
500
<210> 52
<211> 417
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 52
Met Tyr Tyr Leu Lys Asn Thr Asn Phe Trp Met Phe Gly Leu Phe Phe
1 5 10 15
Phe Phe Tyr Phe Phe Ile Met Gly Ala Tyr Phe Pro Phe Phe Pro Ile
20 25 30
Trp Leu His Asp Ile Asn His Ile Ser Lys Ser Asp Thr Gly Ile Ile
35 40 45
Phe Ala Ala Ile Ser Leu Phe Ser Leu Leu Phe Gln Pro Leu Phe Gly
50 55 60
Leu Leu Ser Asp Lys Leu Gly Leu Arg Lys Tyr Leu Leu Trp Ile Ile
65 70 75 80
Thr Gly Met Leu Val Met Phe Ala Pro Phe Phe Ile Phe Ile Phe Gly
85 90 95
Pro Leu Leu Gln Tyr Asn Ile Leu Val Gly Ser Ile Val Gly Gly Ile
100 105 110
Tyr Leu Gly Phe Cys Phe Asn Ala Gly Ala Pro Ala Val Glu Ala Phe
115 120 125
Ile Glu Lys Val Ser Arg Arg Ser Asn Phe Glu Phe Gly Arg Ala Arg
130 135 140
Met Phe Gly Cys Val Gly Trp Ala Leu Cys Ala Ser Ile Val Gly Ile
145 150 155 160
Met Phe Thr Ile Asn Asn Gln Phe Val Phe Trp Leu Gly Ser Gly Cys
165 170 175
Ala Leu Ile Leu Ala Val Leu Leu Phe Phe Ala Lys Thr Asp Ala Pro
180 185 190
Ser Ser Ala Thr Val Ala Asn Ala Val Gly Ala Asn His Ser Ala Phe
195 200 205
Ser Leu Lys Leu Ala Leu Glu Leu Phe Arg Gln Pro Lys Leu Trp Phe
210 215 220
Leu Ser Leu Tyr Val Ile Gly Val Ser Cys Thr Tyr Asp Val Phe Asp
225 230 235 240
Gln Gln Phe Ala Asn Phe Phe Thr Ser Phe Phe Ala Thr Gly Glu Gln
245 250 255
Gly Thr Arg Val Phe Gly Tyr Val Thr Thr Met Gly Glu Leu Leu Asn
260 265 270
Ala Ser Ile Met Phe Phe Ala Pro Leu Ile Ile Asn Arg Ile Gly Gly
275 280 285
Lys Asn Ala Leu Leu Leu Ala Gly Thr Ile Met Ser Val Arg Ile Ile
290 295 300
Gly Ser Ser Phe Ala Thr Ser Ala Leu Glu Val Val Ile Leu Lys Thr
305 310 315 320
Leu His Met Phe Glu Val Pro Phe Leu Leu Val Gly Cys Phe Lys Tyr
325 330 335
Ile Thr Ser Gln Phe Glu Val Arg Phe Ser Ala Thr Ile Tyr Leu Val
340 345 350
Cys Phe Cys Phe Phe Lys Gln Leu Ala Met Ile Phe Met Ser Val Leu
355 360 365
Ala Gly Asn Met Tyr Glu Ser Ile Gly Phe Gln Gly Ala Tyr Leu Val
370 375 380
Leu Gly Leu Val Ala Leu Gly Phe Thr Leu Ile Ser Val Phe Thr Leu
385 390 395 400
Ser Gly Pro Gly Pro Leu Ser Leu Leu Arg Arg Gln Val Asn Glu Val
405 410 415
Ala
<210> 53
<211> 410
<212> PRT
<213> Cronobacter sakazakii strain MOD1_LR753
<400> 53
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ala Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Arg Asp Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Met Met Phe Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Thr Arg Pro Glu Ala
405 410
<210> 54
<211> 411
<212> PRT
<213> Franconibacter pulveris LMG 24059
<400> 54
Met Gln Asn Lys Thr Met Thr Lys Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Met Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Ala Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Met Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Tyr Tyr Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Ala Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Ala Leu Ala Lys Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Thr Leu Gly Leu Val Ile Ala Ala Leu
290 295 300
Ala Thr Leu Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Leu Asn Gly Leu Leu Trp Leu Gly Met Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Asn Ser Leu Gln Pro Gln
405 410
<210> 55
<211> 410
<212> PRT
<213> Enterobacter hormaechei strain 017
<400> 55
Met Ile Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Ile Ile Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ala Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 56
<211> 410
<212> PRT
<213> Citrobacter koseri strain NCTC10771
<400> 56
Met Gln Asn Leu Ser Gln Thr Gly Val Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Glu Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Leu Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asp Ser Arg Glu Gly
405 410
<210> 57
<211> 410
<212> PRT
<213> Salmonella enterica subsp. arizonae serovar 41:z4,z23:- strain TAMU30EF
<400> 57
Met His Asn Arg Leu Gln Ser Gly Val Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys Ala Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Val Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Thr Gly Asn Leu His Thr Val
405 410
<210> 58
<211> 408
<212> PRT
<213> Shigella flexneri strain 585219
<400> 58
Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Leu Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Met Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Val Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln Ser
225 230 235 240
Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu Tyr Gly
245 250 255
Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn Leu Leu
260 265 270
Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile Ile Met
275 280 285
Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala Ala Thr
290 295 300
Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser Ile
305 310 315 320
Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu Thr
325 330 335
Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met Gly
340 345 350
Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser Lys His
355 360 365
Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn Leu Val
370 375 380
Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys Asp Lys
385 390 395 400
Gln Met Gly Asn Ser His Glu Gly
405
<210> 59
<211> 410
<212> PRT
<213> Yokenella regensburgei strain UMB0819
<400> 59
Met Leu Asn Arg Ser Ser Ser Gly Ser Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Gln Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Ile Leu Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ala Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 60
<211> 410
<212> PRT
<213> Escherichia coli strain AMC_967
<400> 60
Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Ile Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Leu Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Ala Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Leu Val Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Gln Met Gly Asn Ser His Glu Gly
405 410
<210> 61
<211> 410
<212> PRT
<213> Klebsiella pneumoniae VAKPC309
<400> 61
Met Gln Asn Tyr Ser Leu Ser Gly Arg Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Gln Glu Phe Gln
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ala Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Phe Gly Leu Ile Leu Ser Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Glu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Leu Gly Gly Val Leu Trp Leu Gly Leu Met Ile Tyr Phe Leu Lys
385 390 395 400
Asp Lys Ser Val Gly Asn Ser Gln Gln Gly
405 410
<210> 62
<211> 411
<212> PRT
<213> Klebsiella oxytoca strain 4928STDY7071490
<400> 62
Met His Asn Ser Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ala Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Glu Glu Phe Gly
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Met Leu Gly Leu Leu Ile Ser Ala Val
290 295 300
Ala Thr Val Ala Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Glu Ser Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn
370 375 380
Leu Leu Ser Gly Val Leu Trp Leu Ala Met Met Val Tyr Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ser Leu Glu Pro Gln
405 410
<210> 63
<211> 411
<212> PRT
<213> Klebsiella michiganensis strain A2
<400> 63
Met His Asn Ser Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ala Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Glu Glu Phe Gly
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Leu Leu Leu Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Lys Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Ile Ser Ala Val
290 295 300
Ala Thr Val Ala Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Glu Ala Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn
370 375 380
Leu Leu Ser Gly Val Leu Trp Leu Ala Met Thr Val Tyr Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ser Leu Glu Pro Gln
405 410
<210> 64
<211> 409
<212> PRT
<213> Pluralibacter gergoviae strain FDAARGOS_186
<400> 64
Met Gln Asn His Ala Leu Ser Gly Lys Arg Leu Gly Arg Ser Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Glu Phe Gln
35 40 45
Ala Ser Thr Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Val Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Leu Thr Cys
85 90 95
Leu Ala Thr Leu Leu Val Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Cys Gly Leu Cys Phe Val Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Tyr Glu Glu Ala Val Ser Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Ser Trp Glu Ser Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Val Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Arg Leu Ser Leu Lys Glu Leu
195 200 205
Gly His Asp Tyr Gly Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Ile Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Ser Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Cys Ser Val Arg Trp Leu Ile
275 280 285
Ile Ala Gly Gly Trp Pro Ala Met Thr Gly Leu Leu Val Ala Ala Leu
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ser Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ser Ala
340 345 350
Met Gly Val Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Tyr Gln Leu Gly Gly Ser Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Leu Ser Gly Ala Leu Trp Leu Gly Leu Ile Ile Tyr Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Gly Asn Arg
405
<210> 65
<211> 410
<212> PRT
<213> Kluyvera ascorbata ATCC 33433
<400> 65
Met Asp Thr Ser Ser Ser Arg Lys Arg Leu Gly Arg Lys Ala Ile Leu
1 5 10 15
Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly Asn
20 25 30
Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Lys Glu Phe Asn Ala
35 40 45
Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly Gly
50 55 60
Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly Arg
65 70 75 80
Arg Pro Val Met Leu Thr Gly Val Ile Trp Phe Ile Val Thr Cys Leu
85 90 95
Ala Thr Leu Leu Val Asn Asn Ile Glu Gln Phe Thr Phe Leu Arg Phe
100 105 110
Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala Ala
115 120 125
Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala Leu
130 135 140
Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val Gly
145 150 155 160
Ala Ala Trp Ile His Val Ala Arg Trp Glu Gly Met Phe Val Leu Phe
165 170 175
Ala Ala Leu Ser Ala Ile Ala Phe Val Gly Leu Phe Lys Ser Met Pro
180 185 190
Glu Thr Ala Thr Arg Ile Gly Glu Thr Leu Ser Leu Lys Ala Leu Gly
195 200 205
Arg Asp Tyr Arg Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly Ala
210 215 220
Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln
225 230 235 240
Ser Pro Val Ile Ile Ile Ser Gly Glu His Ala Ser Ser Tyr Glu Tyr
245 250 255
Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn Leu
260 265 270
Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile Ile
275 280 285
Ala Gly Gly Tyr Pro Ile Met Phe Gly Leu Val Leu Ala Ala Ala Ala
290 295 300
Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser
305 310 315 320
Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu
325 330 335
Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met
340 345 350
Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser Lys
355 360 365
His Cys Tyr Glu Leu Gly Gly Ile Gly Leu Phe Ser Leu Phe Asn Leu
370 375 380
Ala Gly Gly Leu Leu Trp Leu Gly Leu Met Thr Met Phe Leu Arg Asp
385 390 395 400
Lys Ala Val Gly Ser Gly Leu Gln Pro Gln
405 410
<210> 66
<211> 409
<212> PRT
<213> Enterobacter kobei
<400> 66
Met Gln Asn His Ser Leu Pro Gly Arg Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Asn Ala Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Ala Glu Gly Met Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Gly Pro Ile Val Ala Gly Leu Leu Val Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Phe Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Leu Ile Trp Leu Ala Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Asn Ala Leu Ser
405
<210> 67
<211> 409
<212> PRT
<213> Lelliottia sp. WB101
<400> 67
Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Arg Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Val Val Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Met Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ala Leu Gln
405
<210> 68
<211> 410
<212> PRT
<213> Citrobacter freundii
<400> 68
Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Val Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Phe Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Ile Lys Glu Leu
195 200 205
Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu His Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ser Val Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Ser Gly Val Leu Trp Leu Ile Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ser Arg Glu Gly
405 410
<210> 69
<211> 410
<212> PRT
<213> Salmonella enterica subsp. Salamae
<400> 69
Met His Asn Arg Leu Gln Ser Gly Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Gln
35 40 45
Ala Ser Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys Val Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Thr Gly Asp Ser Gln Thr Gly
405 410
<210> 70
<211> 408
<212> PRT
<213> Shigella flexneri
<400> 70
Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Phe Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Met Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln Ser
225 230 235 240
Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu Tyr Gly
245 250 255
Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn Leu Leu
260 265 270
Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile Ile Met
275 280 285
Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala Ala Thr
290 295 300
Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser Ile
305 310 315 320
Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu Thr
325 330 335
Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met Gly
340 345 350
Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser Lys His
355 360 365
Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn Leu Val
370 375 380
Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys Asp Lys
385 390 395 400
Gln Met Gly Asn Ser His Gly Gly
405
<210> 71
<211> 410
<212> PRT
<213> Cronobacter sakazakii strain MOD1_LR634
<400> 71
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ala Trp Phe Ile Val Ala Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Thr Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Met Met Phe Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Thr Arg Pro Glu Ala
405 410
<210> 72
<211> 410
<212> PRT
<213> Cronobacter condimenti strain s37
<400> 72
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Ile Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn
260 265 270
Leu Leu Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Met Met Ile Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Ile Ile Gly Gly Asn Ala Leu Phe Asn Leu Phe Ser
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Ala Ser Arg Gly Gly
405 410
<210> 73
<211> 410
<212> PRT
<213> Cronobacter sp. EKM102R
<400> 73
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ala Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Ile Ser Ser His Ser Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Ile Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Thr Arg Pro Glu Gly
405 410
<210> 74
<211> 410
<212> PRT
<213> Cronobacter universalis NCTC 9529
<400> 74
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Met Met Ala Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Ala Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Thr Arg Pro Glu Gly
405 410
<210> 75
<211> 411
<212> PRT
<213> Salmonella enterica strain 413_SENT
<400> 75
Met Gln Asn Asn Ser Leu Thr Lys Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Ala Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Trp Tyr Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Gly Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Ala Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Ala Phe Gly Leu Ala Met Ala Ala Leu
290 295 300
Ala Thr Leu Phe Ser Ala His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Leu Asn Gly Leu Leu Trp Val Ala Met Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Asn Ser Leu Gln Pro Gln
405 410
<210> 76
<211> 393
<212> PRT
<213> Klebsiella pneumoniae subsp. pneumoniae strain NCTC11695
<400> 76
Met Gln Asn Tyr Ser Leu Ser Gly Arg Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Gln Glu Phe Gln
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Phe Gly Leu Ile Leu Ser Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Glu Leu Gly Ala Thr Ala Cys Ser Ala Cys Leu Thr
370 375 380
Cys Trp Ala Glu Tyr Cys Gly Trp Gly
385 390
<210> 77
<211> 410
<212> PRT
<213> Klebsiella aerogenes strain 4928STDY7071344
<400> 77
Met Gln Asn Tyr Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Gln Glu Phe Gln
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Met Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Ile Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Phe Gly Leu Leu Leu Ser Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Glu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Leu Gly Gly Val Leu Trp Leu Gly Leu Ile Ile Tyr Phe Leu Lys
385 390 395 400
Asp Lys Ser Val Gly Ser Ser Gln Gln Ala
405 410
<210> 78
<211> 412
<212> PRT
<213> Raoultella planticola strain FDAARGOS_283
<400> 78
Met Gln Asn Tyr Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Glu Glu Phe Gln
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Met Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Met Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Gly Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Met Phe Gly Leu Leu Leu Ser Ala Val
290 295 300
Ala Thr Val Val Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Glu Leu Gly Gly Ser Gly Val Phe Ser Leu Phe Asn
370 375 380
Leu Leu Ser Gly Val Met Trp Leu Ala Met Ile Val Tyr Phe Leu Lys
385 390 395 400
Asp Lys Ser Val Gly Asn Ser Asn Asp Pro Gln Ala
405 410
<210> 79
<211> 411
<212> PRT
<213> Klebsiella sp. 2680
<400> 79
Met His Asn Tyr Ser Leu Ala Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Asp Ala Phe Gly
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Ala Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Phe Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Thr Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Gln Gly Glu Lys Leu Ser Val Lys Ala Leu
195 200 205
Gly Arg Asp Tyr Arg Asp Val Leu Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Ile Thr Gly Leu Leu Ile Ser Ala Ala
290 295 300
Ala Thr Val Val Ser Ala His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Glu Phe Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn
370 375 380
Leu Leu Ser Gly Ala Leu Trp Leu Val Met Thr Ala Tyr Phe Leu Lys
385 390 395 400
Asp Lys Arg Ala Gly Asn Ser Arg Glu Pro Gln
405 410
<210> 80
<211> 411
<212> PRT
<213> Kluyvera georgiana strain HRGM_Genome_0064
<400> 80
Met Asp Thr Leu Ser Ser Ser Arg Lys Arg Leu Gly Arg Lys Ala Ile
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Lys Glu Phe Asn
35 40 45
Ala Gly Asp Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Val Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Tyr Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Ala Arg Trp Glu Ser Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Leu Ala Tyr Ile Gly Leu His Lys Glu Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gly Ala Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Val Ala Gly Gly Tyr Pro Ile Met Phe Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Met Tyr Leu Leu Gly Gly Ile Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Gly Gly Leu Leu Trp Leu Gly Leu Met Val Met Phe Leu Arg
385 390 395 400
Asp Lys Thr Val Gly Ser Gly Leu Gln Pro Gln
405 410
<210> 81
<211> 411
<212> PRT
<213> Kluyvera intermedia strain NCTC12125
<400> 81
Met Asp Thr Ser Ser Ser Ser Arg Lys Arg Leu Gly Arg Lys Ala Ile
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Lys Glu Phe Asn
35 40 45
Ala Gly Asp Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Ile Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Met Val Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Leu Ala Arg Trp Glu Ser Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Tyr Val Gly Leu Phe Lys Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Thr Leu
195 200 205
Gly Gln Asp Tyr Arg Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Asn Ala Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Ala Gly Gly Tyr Pro Ile Met Phe Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ser Tyr Gln Met Gly Gly Ile Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Gly Gly Val Leu Trp Leu Val Leu Met Val Met Phe Leu Arg
385 390 395 400
Asp Lys Thr Val Gly Ser Gly Leu Gln Pro Glu
405 410
<210> 82
<211> 431
<212> PRT
<213> Salmonella enterica strain 2014K-0203
<400> 82
Met His Asn Arg Leu Gln Ser Gly Val Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Val Ser Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Ile Val Trp Phe Ile Ala Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Leu Lys Ala Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Val Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Ala Val Val Ser Ser His Ala Tyr Leu Trp Met Met Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ser Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Glu Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Ala Gly Ile Arg Lys Gln Ala Lys Arg Ala Ala Met Pro
405 410 415
Asp Lys Pro Ser Val Ile Arg His Arg Glu Ala Ser Ala Lys Arg
420 425 430
<210> 83
<211> 416
<212> PRT
<213> Salmonella bongori strain 85-0051
<400> 83
Met His Asn Arg Thr Gln Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Leu Lys Asp Leu
195 200 205
Gly Arg Asp Tyr Gln Arg Val Ile Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Phe Trp Leu Leu Leu Met Leu Val Phe Leu Lys
385 390 395 400
Asn Lys Arg Thr Gly Asp Ser Gln Thr Asp Pro Glu Ser Gly Tyr Ala
405 410 415
<210> 84
<211> 412
<212> PRT
<213> Salmonella enterica subsp. enterica serovar Hillingdon strain S01-0588
<400> 84
Met Val Cys Arg Ile Val Tyr Asn Gln Ala Ala Gly Trp Asp Val Arg
1 5 10 15
Arg Cys Phe Phe Leu Ser Val Trp Cys Cys Thr Ser Phe Ser Thr Tyr
20 25 30
Ile Gly Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln
35 40 45
Tyr Gln Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu
50 55 60
Ala Gly Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg
65 70 75 80
Ile Gly Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val
85 90 95
Thr Cys Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe
100 105 110
Leu Arg Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly
115 120 125
Tyr Ala Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile
130 135 140
Thr Ala Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro
145 150 155 160
Leu Val Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe
165 170 175
Ile Leu Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg
180 185 190
Ala Met Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys
195 200 205
Ala Leu Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val
210 215 220
Ala Gly Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp
225 230 235 240
Ile Ala Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser
245 250 255
Tyr Glu Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala
260 265 270
Gly Asn Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser
275 280 285
Leu Ile Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala
290 295 300
Ala Ala Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala
305 310 315 320
Gly Leu Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu
325 330 335
Val Arg Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser
340 345 350
Ala Ala Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu
355 360 365
Val Ser Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu
370 375 380
Phe Asn Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe
385 390 395 400
Leu Lys Asp Lys Arg Thr Gly Asn Leu Gln Thr Val
405 410
<210> 85
<211> 410
<212> PRT
<213> Citrobacter youngae strain TE1
<400> 85
Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Phe Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Trp Arg Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ala Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Leu Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys Tyr Ala Tyr Leu Gly Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Phe Ile Phe Leu Lys
385 390 395 400
Asp Lys Gln Val Gly Ala Ser Arg Gly Gly
405 410
<210> 86
<211> 410
<212> PRT
<213> Citrobacter sp. RHB21-C01
<400> 86
Met Gln Asn Arg Leu Gln Gln Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Met Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Pro Leu Ser Leu Lys Ala Leu
195 200 205
Gly Arg Asp Tyr Gln Gln Val Met Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Gln
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Ile Gly Gly Trp Pro Ile Val Leu Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Leu Gly Ile Glu Val Ser
355 360 365
Lys Tyr Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Thr Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Gln Val Gly Asn Thr Arg Glu Gly
405 410
<210> 87
<211> 410
<212> PRT
<213> Citrobacter werkmanii strain MGYG-HGUT-02535
<400> 87
Met His Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Phe Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Ile Lys Glu Leu
195 200 205
Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ala Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Val Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Ser Gly Ile Leu Trp Leu Ala Leu Met Phe Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asp Ser Arg Glu Gly
405 410
<210> 88
<211> 409
<212> PRT
<213> Enterobacteriaceae bacterium UBA3109
<400> 88
Met Gln Asn His Ser Leu Ser Gly Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr His
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Leu Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Ile Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Lys Ala Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gly Met Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Phe Gly Gly Trp Pro Ile Val Phe Gly Leu Ala Leu Ala Ala Val
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Leu Ser Gly Gly Ser Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Val Asn Gly Val Leu Trp Val Ala Leu Met Val Val Phe Leu Arg
385 390 395 400
Asp Lys Ser Val Gly Asn Ala Leu Ser
405
<210> 89
<211> 409
<212> PRT
<213> Enterobacteriaceae bacterium UBA6698
<400> 89
Met Pro Asn His Ala Leu Pro Gly Arg Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Ile Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Asn Ala Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Ala Glu Gly Met Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Gly Pro Ile Val Ala Gly Leu Leu Leu Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Phe Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Leu Ile Trp Leu Val Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Ser Val Gly Asn Ala Leu Ser
405
<210> 90
<211> 411
<212> PRT
<213> Leclercia sp. 4-9-1-25
<400> 90
Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Leu Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Lys Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Met Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Thr Leu Gly Leu Leu Leu Ala Ala Val
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Phe Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Leu Leu Trp Leu Val Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro Asp
405 410
<210> 91
<211> 411
<212> PRT
<213> Lelliottia amnigena strain TZW14
<400> 91
Met Leu Asn Arg Ser Ser Ser Ser Gly His Arg Leu Gly Arg Gln Ala
1 5 10 15
Leu Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile
20 25 30
Ala Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr
35 40 45
Asn Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala
50 55 60
Gly Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile
65 70 75 80
Gly Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr
85 90 95
Cys Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Met Val Leu
100 105 110
Arg Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr
115 120 125
Ala Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr
130 135 140
Ala Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu
145 150 155 160
Val Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Ile
165 170 175
Leu Phe Ala Leu Leu Ala Ala Ile Ser Trp Tyr Gly Leu His Arg Ala
180 185 190
Met Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu
195 200 205
Leu Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Val Arg Phe Val Ala
210 215 220
Gly Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile
225 230 235 240
Ala Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr
245 250 255
Glu Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly
260 265 270
Asn Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu
275 280 285
Ile Ile Leu Gly Gly Trp Pro Ile Ala Gly Gly Leu Ile Leu Ala Ala
290 295 300
Val Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly
305 310 315 320
Leu Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val
325 330 335
Arg Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala
340 345 350
Ala Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val
355 360 365
Ser Lys His Ala Tyr Ile Ile Gly Gly Asn Gly Leu Phe Ser Leu Phe
370 375 380
Asn Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Ile Phe Leu
385 390 395 400
Lys Asn Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 92
<211> 409
<212> PRT
<213> Lelliottia aquatilis strain TZW17
<400> 92
Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Phe Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Ile Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Leu Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Arg Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ala Gly Leu Val Val Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Gly Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ala Leu Gln
405
<210> 93
<211> 410
<212> PRT
<213> Enterobacter sp. RHBSTW-00901
<400> 93
Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Met Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Phe Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Thr Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Met Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ala Met Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 94
<211> 410
<212> PRT
<213> Enterobacter cloacae subsp. dissolvens strain GN05902
<400> 94
Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Thr Val Ala Ala Val
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Thr Tyr Ala Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Val Val Leu Met Val Met Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 95
<211> 410
<212> PRT
<213> Enterobacter mori strain JGM37
<400> 95
Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Val Met Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ala Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Ile Gly Ser Ala Leu Gln Pro
405 410
<210> 96
<211> 410
<212> PRT
<213> Kosakonia sacchari strain BO-1
<400> 96
Met Gln Asn His Thr Leu Thr Ser Gln Arg Leu Gly Arg Arg Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Gln Gly Met Phe Val Leu
165 170 175
Phe Ala Leu Leu Ala Ala Phe Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Phe Lys Ala Leu
195 200 205
Trp Arg Asp Tyr Ala Asp Val Met Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Leu Leu Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Phe Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Val Phe Leu Arg
385 390 395 400
Asp Lys Arg Val Gly Asn Ser Leu Glu Gly
405 410
<210> 97
<211> 410
<212> PRT
<213> Cronobacter malonaticus strain MOD1-Md25g
<400> 97
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ala Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Met Met Phe Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Ile Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Thr Arg Pro Glu Ala
405 410
<210> 98
<211> 410
<212> PRT
<213> Cronobacter dublinensis 582
<400> 98
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Lys Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Met Ala Gly Leu Ala Leu Ala Ala Phe
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Thr Gly Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Thr Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Ala Ser Arg Glu Gly
405 410
Claims (45)
- 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당의 생산을 위해 유전자 변형된 숙주 세포로서, 숙주 세포는 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제에 대한 적어도 하나의 핵산 서열을 포함하고 발현하며,
- 상기 세포는 i) 내생성 막 단백질의 과발현 및/또는 ii) 이종성 막 단백질의 발현을 더 포함하여 코어 삼당류로서 LN3을 포함하는 올리고당의 a) 개선된 생산, 및/또는 b) 가능하고/하거나 증강된 유출을 제공하고, 바람직하게 상기 개선된 생산 및 상기 증강된 유출은 동일한 유전적 배경을 갖지만 내생성 막 단백질의 상기 과발현 및 이종성 막 단백질의 상기 발현이 결여된 숙주 세포와 비교된 것이고,
- 바람직하게 상기 세포는 상기 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열을 더 포함하고 발현하고,
임의로 상기 개선된 생산은
- 상기 올리고당의 더 나은 적정가 (리터 당 그램 올리고당),
- 더 나은 생산율 r (시간 당 리터 당 그램 올리고당),
- 더 나은 세포 성능 지수 (그램 생물량 당 그램 올리고당),
- 더 나은 비생산성 (시간 당 그램 생물량 당 그램 올리고당),
- 수크로스에 대한 더 나은 수율 (그램 수크로스 당 그램 올리고당), 및/또는
- 더 나은 수크로스 흡수/전환율 (시간 당 그램 당 그램 수크로스),
- 더 나은 락토스 전환/소비율 (시간 당 그램 락토스), 및/또는
- 숙주 세포의 증강된 성장 속도
를 포함하는 것인 세포. - 제1항에 있어서, 상기 막 단백질은 운송체, P-P-결합-가수분해-구동 수송체, 및 β-배럴 포린의 군으로부터 선택되고,
a) 상기 막 단백질이 운송체의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1 및 2.A.66의 군, 또는
- eggnog 패밀리 05E8G, 05EGZ, 05JHE, 07QF7 07QRN, 07RBJ, 0814C 및 08N8A의 군, 또는
- PFAM 목록 PF00893, PF01943, PF05977, PF07690 및 PF13347, 또는
- interpro 목록 IPR000390, IPR001411, IPR001927, IPR002797, IPR004638, IPR005829, IPR010290, IPR011701, IPR020846, IPR023721, IPR023722, IPR032896, IPR036259 및 IPR039672, 또는
- SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 살라마에 (Salamae) 유래 MdfA 또는 SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
로부터 선택되거나;
b) 상기 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 3.A.1.1 및 3.A.1.2의 군, 또는
- eggnog 패밀리 05CJ1, 05DFW, 05EZD, 05I1K, 07HR3 및 08IJ9의 군, 또는
- PFAM 목록 PF00005, PF00528, PF13407 및 PF17912, 또는
- interpro 목록 IPR000515, IPR003439, IPR003593, IPR005978, IPR008995, IPR013456, IPR015851, IPR017871, IPR025997, IPR027417, IPR028082, IPR035906, 및 IPR040582, 또는
- SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
로부터 선택되거나; 또는
c) 상기 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 1.B.18, 또는
- eggnog 패밀리 05DAY, 또는
- PFAM 목록 PF02563, PF10531 및 PF18412, 또는
- interpro 목록 IPR003715, IPR019554 및 IPR040716, 또는
- SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
로부터 선택되고;
TCDB 클래스는 2019년 6월 17일 배포된 TCDB.org 에 의해 정의되는 바와 같고, eggnog 패밀리는 2016년 9월 배포된 eggnogdb 4.5.1에 의해 정의되는 바와 같고, PFAM 목록은 2018년 9월에 배포된 Pfam 32.0에 의해 정의되는 바와 같고, interpro 목록은 2019년 7월 4일 배포된 InterPro 75.0에 의해 정의되는 바와 같은 것인, 세포. - 제1항 또는 제2항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
a) 운송체 막 단백질로서 SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 살라마에 (Salamae) 유래 MdfA 또는 SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) P-P-결합-가수분해-구동 수송체로서 SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) β-배럴 포린 막 단백질로서 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 상기 Wza 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열. - 제1항 내지 제3항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열. - 제1항 내지 제4항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
- 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
- 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90% 서열 동일성,
- 각각 SEQ ID NO 05, 06, 56, 57 또는 68을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 95.00% 서열 동일성, 또는
- 각각 SEQ ID NO 58, 60 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 99.00% 서열 동일성
을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열. - 제1항 내지 제4항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열. - 제1항 내지 제4항 또는 제6항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열. - 제1항 내지 제3항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
a) SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열. - 제1항 내지 제3항 또는 제8항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열. - 제1항 내지 제3항, 제8항 또는 제9항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
- 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
- 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90% 서열 동일성,
- 각각 SEQ ID NO 05, 06, 56 또는 57을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 95.00% 서열 동일성, 또는
- 각각 SEQ ID NO 58 또는 60을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 99.00% 서열 동일성
을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열. - 제1항 내지 제3항, 제8항 또는 제9항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열. - 제1항 내지 제3항, 제8항, 제9항 또는 제11항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열. - 제1항 내지 제12항 중 어느 하나의 항에 있어서, 상기 막 단백질은 세포벽의 외막을 가로지르는 화합물의 수송에 관여되는 수송체 단백질인 세포.
- 제1항 내지 제13항 중 어느 하나의 항에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,
바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제 중 적어도 하나의 발현 또는 활성이 변형되는 것인 세포. - 제1항 내지 제14항 중 어느 하나의 항에 있어서, 상기 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당은 포유동물 모유 올리고당 또는 루이스-유형 항원 올리고당인 세포.
- 제1항 내지 제15항 중 어느 하나의 항에 있어서, 상기 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당은 포유동물 모유 올리고당 (MMO), 바람직하게 인간 모유 올리고당 (HMO), 보다 바람직하게 코어 사당류로서 LNT 또는 LNnT를 갖는 MMO 또는 HMO, 보다 더 바람직하게 코어 사당류로서 LNT 또는 LNnT를 갖는 HMO, 가장 바람직하게 LNT 또는 LNnT인 세포.
- 제1항 내지 제16항 중 어느 하나의 항에 있어서, 상기 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당은 중성 올리고당인 세포.
- 제1항 내지 제17항 중 어느 하나의 항에 있어서, 상기 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당은 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-푸코펜타오스 VI, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라-락토-N-헥사오스 (pLNnH), 파라-락토-N-네오헥사오스 (pLNH), 디푸코실-락토-N-헥사오스, 디푸코실-락토-N-네오헥사오스, 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 시알릴-락토-N-테트라오스 a, 시알릴-락토-N-테트라오스 b, 시알릴-락토-N-테트라오스 c, 시알릴-락토-N-테트라오스 d를 포함하는 목록으로부터 선택되는 것인 세포.
- 제1항 내지 제18항 중 어느 하나의 항에 있어서, 상기 글리코실트랜스퍼라제는 베타-1,3 또는 베타-1,4 연결로 LN3의 말단 GlcNAc 잔기로 UDP-Gal 도너로부터 갈락토스 (Gal)를 전달하여서, 각각 락토-N-테트라오스 (LNT; Gal-베타1,3-GlcNAc-베타1,3-Gal-베타1,4-Glc) 또는 락토-N-네오테트라오스 (LNnT; Gal-베타1,4-GlcNAc-베타1,3-Gal-베타1,4-Glc)를 생산하는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제인 세포.
- 제19항에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 90 g/L 이상의 LNT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는 것인 세포.
- 제19항에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 70 g/L 이상, 바람직하게 90 g/L 이상의 LNnT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNnT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는 것인 세포.
- 제1항 내지 제12항 중 어느 하나의 항에 있어서, 상기 세포는 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당의 생산에서 사용되는 뉴클레오티드-활성화된 당을 추가로 합성할 수 있는 것인 세포.
- 제22항에 있어서, 상기 뉴클레오티드-활성화된 당은 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택되는 것인 세포.
- 제1항 내지 제23항 중 어느 하나의 항에 있어서, 세포는 적어도 부분적으로 불활성화된 선택된 단당류, 이당류 또는 올리고당에 대한 이화 경로를 포함하고, 단당류, 이당류, 또는 올리고당은 코어 삼당류로서 LN3을 포함하는 올리고당의 합성에 관여되고/되거나 필요한 것인 세포.
- 제1항 내지 제24항 중 어느 하나의 항에 있어서, 상기 세포는 상기 코어 삼당류로서 LN3을 포함하는 올리고당의 합성을 위한 전구체를 사용하는 것인 세포.
- 제1항 내지 제25항 중 어느 하나의 항에 있어서, 상기 막 단백질은 상기 코어 삼당류로서 LN3을 포함하는 올리고당의 합성을 위한 전구체의 흡수에 관여되는 것인 세포.
- 제1항 내지 제26항 중 어느 하나의 항에 있어서, 상기 세포는 상기 코어 삼당류로서 LN3을 포함하는 올리고당의 합성을 위한 전구체를 생산하는 것인 세포.
- 제1항 내지 제27항 중 어느 하나의 항에 있어서, 세포는 배지에서 안정하게 배양되는 것인 세포.
- 제1항 내지 제28항 중 어느 하나의 항에 있어서, 상기 세포는 미생물, 식물 세포, 동물 세포, 곤충 세포 또는 원충 세포이고, 바람직하게
- 상기 미생물은 박테리아, 진균 또는 효모이고,
- 상기 식물 세포는 담배, 알파파, 벼, 목화, 유채, 대두, 옥수수 또는 곡물, 및/또는 세포이고
- 상기 동물 세포는 비-인간 포유동물, 조류, 어류, 무척추동물, 파충류, 또는 양서류로부터 유래되거나, 또는 상기 동물 세포는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주인 세포. - 제29항에 있어서, 상기 세포는 박테리아, 바람직하게 에스케리치아 콜라이 (Escherichia coli) 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이의 세포이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655인 세포.
- 제1항 내지 제30항 중 어느 하나의 항에 있어서, 세포는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물을 합성할 수 있는 것인 세포.
- 유전자 조작된 세포에 의해서 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당의 제조를 위한 방법으로서,
a) 제1항 내지 제31항 중 어느 하나의 항에 따른 세포를 제공하는 단계, 및
b) 상기 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 허용하는 조건 하에 배지에서 세포를 배양하는 단계, 및
c) 바람직하게 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 배양으로부터 분리시키는 단계
를 포함하는 것인 제조 방법. - 제32항에 있어서, 방법은
i) 배양 배지에 초기 반응기 부피의 리터 당 적어도 50, 보다 바람직하게 적어도 75, 보다 바람직하게 적어도 100, 보다 바람직하게 적어도 120, 보다 바람직하게 적어도 150 그램의 락토스를 포함하는 락토스 공급물을, 바람직하게 연속 방식으로, 바람직하게 배양 배지의 최종 부피가 상기 락토스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게 2배 이하, 보다 바람직하게 2배 미만이 되도록 첨가하는 단계로서, 반응기 부피는 250 mL 내지 10.000 ㎥ (입방 미터) 범위인, 단계;
ii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해서 첨가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해서 첨가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게 75 g/L, 보다 바람직하게 100 g/L, 보다 바람직하게 125 g/L, 보다 바람직하게 150 g/L, 보다 바람직하게 175 g/L, 보다 바람직하게 200 g/L, 보다 바람직하게 225 g/L, 보다 바람직하게 250 g/L, 보다 바람직하게 275 g/L, 보다 바람직하게 300 g/L, 보다 바람직하게 325 g/L, 보다 바람직하게 350 g/L, 보다 바람직하게 375 g/L, 보다 바람직하게, 400 g/L, 보다 바람직하게 450 g/L, 보다 바람직하게 500 g/L, 보다 더 바람직하게, 550 g/L, 가장 바람직하게 600 g/L이고; 바람직하게 상기 용액의 pH는 3과 7 사이로 설정되고, 바람직하게 상기 공급 용액의 온도는 20℃와 80℃ 사이로 유지되는 것인 단계
중 적어도 하나를 더 포함하고,
상기 방법은 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게 적어도 75 g/L, 보다 바람직하게 적어도 90 g/L, 보다 바람직하게 적어도 100 g/L, 보다 바람직하게 적어도 125 g/L, 보다 바람직하게 적어도 150 g/L, 보다 바람직하게 적어도 175 g/L, 보다 바람직하게 적어도 200 g/L의 농도로 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 생성시키는 것인 제조 방법. - 제33항에 있어서, 락토스 공급은 배양의 시작부터 적어도 5 mM의 농도, 바람직하게 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 보다 바람직하게 > 300 mM의 농도로 락토스를 첨가하여 수행되는 것인 제조 방법.
- 제33항 또는 제34항에 있어서, 상기 락토스 공급은 배양의 생산 단계 전반에서, 적어도 5 mM, 바람직하게 10 mM 또는 30 mM의 락토스 농도가 수득되는, 농도로 배양 배지에 락토스를 첨가하여 수행되는 것인 제조 방법.
- 제32항 내지 제35항 중 어느 하나의 항에 있어서, 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안 또는 연속 방식으로 배양되는 것인 제조 방법.
- 제32항 내지 제36항 중 어느 하나의 항에 있어서, 탄소 및 에너지 공급원, 바람직하게 글루코스, 글리세롤, 프룩토스, 말토스, 아라비노스, 말토덱스트린, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 폴리올, 옥수수 침지액, 고-프룩토스 시럽, 숙시네이트, 말레이트, 아세테이트, 시트레이트, 락테이트 및 피루베이트가 또한 바람직하게 연속적으로 배양 배지에, 바람직하게 락토스와 함께, 첨가되는 것인 제조 방법.
- 제32항 내지 제37항 중 어느 하나의 항에 있어서, 지수적 세포 성장의 제1 단계는 락토스가 제2 단계에서 배양 배지에 첨가되기 전에 탄소-기반 기질, 바람직하게 글루코스 또는 수크로스를 배양 배지에 첨가하여 제공되는 것인 제조 방법.
- 제32항 내지 제38항 중 어느 하나의 항에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함하는 것인 제조 방법: 청징화, 한외여과, 나노여과, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피.
- 제32항 내지 제39항 중 어느 하나의 항에 있어서, 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 각각 상기 세포로부터의 정제 단계를 더 포함하는 것인 제조 방법.
- 제32항 내지 제40항 중 어느 하나의 항에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함하는 것인 제조 방법: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과 또는 이온 교환, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조 또는 동결건조.
- 코어 삼당류로서 LN3을 포함하는 올리고당의 발효적 생산에서 제1항 내지 제12항 중 어느 하나의 항에 정의된 바와 같은 막 단백질의 군으로부터 선택되는 막 단백질의 용도.
- 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 제1항 내지 제31항 중 어느 하나의 항에 따른 세포의 용도.
- 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물의 생산을 위한 제31항에 따른 세포의 용도.
- 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 제32항 내지 제41항 중 어느 하나의 항에 따른 방법의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21152592.8 | 2021-01-20 | ||
EP21152592 | 2021-01-20 | ||
PCT/EP2022/051163 WO2022157213A1 (en) | 2021-01-20 | 2022-01-20 | Production of oligosaccharides comprising ln3 as core structure in host cells |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230134558A true KR20230134558A (ko) | 2023-09-21 |
Family
ID=74194595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237028215A KR20230134558A (ko) | 2021-01-20 | 2022-01-20 | 숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240117398A1 (ko) |
EP (1) | EP4281577A1 (ko) |
KR (1) | KR20230134558A (ko) |
CN (1) | CN116745430A (ko) |
AU (1) | AU2022210808A1 (ko) |
TW (1) | TW202246496A (ko) |
WO (1) | WO2022157213A1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023120615A1 (ja) * | 2021-12-21 | 2023-06-29 | 協和発酵バイオ株式会社 | コア3糖としてラクト-n-トリオースiiを含む糖質の製造方法および該糖質の結晶の製造方法 |
CN115369064B (zh) * | 2022-09-30 | 2023-07-07 | 海南师范大学 | 一种增强生防贝莱斯芽孢杆菌根际定殖和防效的多功能复合菌剂的开发和应用 |
WO2024089131A1 (en) | 2022-10-25 | 2024-05-02 | Inbiose N.V. | Saccharide importers for lacto-n-triose |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3235907B1 (en) | 2010-07-12 | 2023-06-21 | Inbiose N.V. | Metabolically engineered organisms for the production of added value bio-products |
RU2746410C2 (ru) | 2014-11-14 | 2021-04-13 | Инбиос Н.В. | Мутантные микроорганизмы, устойчивые к гибели под действием лактозы |
EP3141610A1 (en) * | 2015-09-12 | 2017-03-15 | Jennewein Biotechnologie GmbH | Production of human milk oligosaccharides in microbial hosts with engineered import / export |
WO2017182965A1 (en) * | 2016-04-19 | 2017-10-26 | Glycom A/S | Separation of oligosaccharides from fermentation broth |
CA3048521A1 (en) | 2016-12-27 | 2018-07-05 | Inbiose N.V. | In vivo synthesis of sialylated compounds |
EP3569713A1 (en) * | 2018-05-16 | 2019-11-20 | Jennewein Biotechnologie GmbH | Use of glycosidases in the production of oligosaccharides |
CA3115210A1 (en) * | 2018-10-02 | 2020-04-09 | Zimitech, Inc. | Use of substrate importers for the export of oligosaccharides |
AU2020358725A1 (en) | 2019-10-03 | 2022-04-14 | Turtletree Labs Pte. Ltd. | Nutrient compositions and methods, kits, and cell compositions for producing the same |
WO2021148614A1 (en) * | 2020-01-23 | 2021-07-29 | Glycom A/S | Hmo production |
-
2022
- 2022-01-20 WO PCT/EP2022/051163 patent/WO2022157213A1/en active Application Filing
- 2022-01-20 EP EP22701579.9A patent/EP4281577A1/en active Pending
- 2022-01-20 AU AU2022210808A patent/AU2022210808A1/en active Pending
- 2022-01-20 US US18/261,806 patent/US20240117398A1/en active Pending
- 2022-01-20 CN CN202280010589.6A patent/CN116745430A/zh active Pending
- 2022-01-20 TW TW111102369A patent/TW202246496A/zh unknown
- 2022-01-20 KR KR1020237028215A patent/KR20230134558A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
WO2022157213A1 (en) | 2022-07-28 |
TW202246496A (zh) | 2022-12-01 |
EP4281577A1 (en) | 2023-11-29 |
CN116745430A (zh) | 2023-09-12 |
AU2022210808A1 (en) | 2023-08-31 |
US20240117398A1 (en) | 2024-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022034076A2 (en) | Production of galactosylated di- and oligosaccharides | |
KR20230134558A (ko) | 숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산 | |
EP4192946A1 (en) | Cellular production of di- and/or oligosaccharides | |
EP4192945A1 (en) | Cellular production of sialylated di- and/or oligosaccharides | |
KR20240008322A (ko) | 발효 생산 | |
WO2022219188A1 (en) | Cellular production of sialylated di- and/or oligosaccharides | |
KR20230172003A (ko) | 바이오산물의 세포 생산 | |
WO2023175079A1 (en) | Sialyltransferases for the production of sialylated oligosaccharides | |
KR20240035566A (ko) | 락토-n-바이오스 전환 푸코실트랜스퍼라제 | |
WO2023111141A1 (en) | Sialyltransferases for the production of sialylated oligosaccharides | |
KR20230132539A (ko) | 글리코실화된 생산물의 세포 생산 | |
TW202221134A (zh) | 半乳糖化雙醣與寡醣的產生 |