KR20230132539A - 글리코실화된 생산물의 세포 생산 - Google Patents
글리코실화된 생산물의 세포 생산 Download PDFInfo
- Publication number
- KR20230132539A KR20230132539A KR1020237027723A KR20237027723A KR20230132539A KR 20230132539 A KR20230132539 A KR 20230132539A KR 1020237027723 A KR1020237027723 A KR 1020237027723A KR 20237027723 A KR20237027723 A KR 20237027723A KR 20230132539 A KR20230132539 A KR 20230132539A
- Authority
- KR
- South Korea
- Prior art keywords
- udp
- cell
- cells
- glcnac
- alpha
- Prior art date
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 85
- 230000001413 cellular effect Effects 0.000 title description 4
- LFTYTUAZOPRMMI-UHFFFAOYSA-N UNPD164450 Natural products O1C(CO)C(O)C(O)C(NC(=O)C)C1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-UHFFFAOYSA-N 0.000 claims abstract description 163
- LFTYTUAZOPRMMI-CFRASDGPSA-N UDP-N-acetyl-alpha-D-glucosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](O)[C@@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-CFRASDGPSA-N 0.000 claims abstract description 148
- 238000000034 method Methods 0.000 claims abstract description 131
- 229920001542 oligosaccharide Polymers 0.000 claims abstract description 126
- 150000002482 oligosaccharides Chemical class 0.000 claims abstract description 125
- 150000002772 monosaccharides Chemical class 0.000 claims abstract description 111
- 150000002016 disaccharides Chemical class 0.000 claims abstract description 80
- 210000004027 cell Anatomy 0.000 claims description 416
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 141
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 137
- 229920001184 polypeptide Polymers 0.000 claims description 135
- 108090000623 proteins and genes Proteins 0.000 claims description 135
- 230000014509 gene expression Effects 0.000 claims description 108
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 88
- 102000004169 proteins and genes Human genes 0.000 claims description 85
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 claims description 69
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 claims description 69
- 102000004190 Enzymes Human genes 0.000 claims description 64
- 108090000790 Enzymes Proteins 0.000 claims description 64
- 230000000694 effects Effects 0.000 claims description 56
- 108700023372 Glycosyltransferases Proteins 0.000 claims description 55
- 230000002538 fungal effect Effects 0.000 claims description 52
- 108090001031 Glutamine-fructose-6-phosphate transaminase (isomerizing) Proteins 0.000 claims description 51
- 102000004894 Glutamine-fructose-6-phosphate transaminase (isomerizing) Human genes 0.000 claims description 51
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 claims description 46
- 230000015572 biosynthetic process Effects 0.000 claims description 46
- 229950006780 n-acetylglucosamine Drugs 0.000 claims description 46
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 claims description 45
- 150000004676 glycans Chemical class 0.000 claims description 42
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 41
- 150000007523 nucleic acids Chemical class 0.000 claims description 41
- 102000051366 Glycosyltransferases Human genes 0.000 claims description 39
- 102000039446 nucleic acids Human genes 0.000 claims description 38
- 108020004707 nucleic acids Proteins 0.000 claims description 38
- 238000003786 synthesis reaction Methods 0.000 claims description 38
- 241000588724 Escherichia coli Species 0.000 claims description 37
- SQVRNKJHWKZAKO-PFQGKNLYSA-N N-acetyl-beta-neuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-PFQGKNLYSA-N 0.000 claims description 37
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 36
- 238000001035 drying Methods 0.000 claims description 36
- -1 alpha-1 Proteins 0.000 claims description 34
- 239000000203 mixture Substances 0.000 claims description 34
- 239000002243 precursor Substances 0.000 claims description 34
- 102200068615 rs281865226 Human genes 0.000 claims description 34
- 102200092685 rs371246226 Human genes 0.000 claims description 34
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 claims description 31
- 230000003284 homeostatic effect Effects 0.000 claims description 29
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 28
- 125000000539 amino acid group Chemical group 0.000 claims description 27
- 241000894006 Bacteria Species 0.000 claims description 25
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 claims description 25
- OVRNDRQMDRJTHS-OZRXBMAMSA-N N-acetyl-beta-D-mannosamine Chemical compound CC(=O)N[C@@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-OZRXBMAMSA-N 0.000 claims description 25
- 102200049817 rs74626221 Human genes 0.000 claims description 25
- 108010060845 lactose permease Proteins 0.000 claims description 24
- 239000000126 substance Substances 0.000 claims description 24
- FDJKUWYYUZCUJX-UHFFFAOYSA-N N-glycolyl-beta-neuraminic acid Natural products OCC(O)C(O)C1OC(O)(C(O)=O)CC(O)C1NC(=O)CO FDJKUWYYUZCUJX-UHFFFAOYSA-N 0.000 claims description 23
- 229910052799 carbon Inorganic materials 0.000 claims description 23
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 claims description 22
- XOCCAGJZGBCJME-DYYUQQNFSA-N N-Acetyl-L-Rhamnosamine Chemical compound C[C@@H]1OC(O)[C@H](NC(C)=O)[C@H](O)[C@H]1O XOCCAGJZGBCJME-DYYUQQNFSA-N 0.000 claims description 21
- 235000020256 human milk Nutrition 0.000 claims description 21
- 230000035772 mutation Effects 0.000 claims description 21
- MNLRQHMNZILYPY-MDMHTWEWSA-N N-acetyl-alpha-D-muramic acid Chemical compound OC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)O[C@H](O)[C@@H]1NC(C)=O MNLRQHMNZILYPY-MDMHTWEWSA-N 0.000 claims description 20
- SUHQNCLNRUAGOO-UHFFFAOYSA-N N-glycoloyl-neuraminic acid Natural products OCC(O)C(O)C(O)C(NC(=O)CO)C(O)CC(=O)C(O)=O SUHQNCLNRUAGOO-UHFFFAOYSA-N 0.000 claims description 20
- FDJKUWYYUZCUJX-KVNVFURPSA-N N-glycolylneuraminic acid Chemical compound OC[C@H](O)[C@H](O)[C@@H]1O[C@](O)(C(O)=O)C[C@H](O)[C@H]1NC(=O)CO FDJKUWYYUZCUJX-KVNVFURPSA-N 0.000 claims description 20
- 241000282414 Homo sapiens Species 0.000 claims description 19
- GSXOAOHZAIYLCY-UHFFFAOYSA-N D-F6P Natural products OCC(=O)C(O)C(O)C(O)COP(O)(O)=O GSXOAOHZAIYLCY-UHFFFAOYSA-N 0.000 claims description 18
- XOCCAGJZGBCJME-IANFNVNHSA-N N-Acetyl-D-fucosamine Chemical compound C[C@H]1OC(O)[C@H](NC(C)=O)[C@@H](O)[C@H]1O XOCCAGJZGBCJME-IANFNVNHSA-N 0.000 claims description 18
- USAZACJQJDHAJH-KDEXOMDGSA-N [[(2r,3s,4r,5s)-5-(2,4-dioxo-1h-pyrimidin-6-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2r,3r,4s,5r,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl] hydrogen phosphate Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](C=2NC(=O)NC(=O)C=2)O1 USAZACJQJDHAJH-KDEXOMDGSA-N 0.000 claims description 17
- 239000000427 antigen Substances 0.000 claims description 17
- 238000000746 purification Methods 0.000 claims description 17
- 108010046068 N-Acetyllactosamine Synthase Proteins 0.000 claims description 16
- 108010013639 Peptidoglycan Proteins 0.000 claims description 16
- 210000004251 human milk Anatomy 0.000 claims description 16
- LFTYTUAZOPRMMI-NESSUJCYSA-N UDP-N-acetyl-alpha-D-galactosamine Chemical compound O1[C@H](CO)[C@H](O)[C@H](O)[C@@H](NC(=O)C)[C@H]1O[P@](O)(=O)O[P@](O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-NESSUJCYSA-N 0.000 claims description 15
- LFTYTUAZOPRMMI-ZYQOOJPVSA-N UDP-N-acetyl-alpha-D-mannosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](O)[C@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-ZYQOOJPVSA-N 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 15
- MVMSCBBUIHUTGJ-UHFFFAOYSA-N 10108-97-1 Natural products C1=2NC(N)=NC(=O)C=2N=CN1C(C(C1O)O)OC1COP(O)(=O)OP(O)(=O)OC1OC(CO)C(O)C(O)C1O MVMSCBBUIHUTGJ-UHFFFAOYSA-N 0.000 claims description 14
- LQEBEXMHBLQMDB-UHFFFAOYSA-N GDP-L-fucose Natural products OC1C(O)C(O)C(C)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C3=C(C(N=C(N)N3)=O)N=C2)O1 LQEBEXMHBLQMDB-UHFFFAOYSA-N 0.000 claims description 14
- MVMSCBBUIHUTGJ-GDJBGNAASA-N GDP-alpha-D-mannose Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H]1O)O)N1C=2N=C(NC(=O)C=2N=C1)N)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@@H]1O MVMSCBBUIHUTGJ-GDJBGNAASA-N 0.000 claims description 14
- LQEBEXMHBLQMDB-JGQUBWHWSA-N GDP-beta-L-fucose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C3=C(C(NC(N)=N3)=O)N=C2)O1 LQEBEXMHBLQMDB-JGQUBWHWSA-N 0.000 claims description 14
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 claims description 14
- BGWGXPAPYGQALX-ARQDHWQXSA-N beta-D-fructofuranose 6-phosphate Chemical compound OC[C@@]1(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BGWGXPAPYGQALX-ARQDHWQXSA-N 0.000 claims description 14
- 108010019236 Fucosyltransferases Proteins 0.000 claims description 13
- 102000006471 Fucosyltransferases Human genes 0.000 claims description 13
- 241000233866 Fungi Species 0.000 claims description 13
- MSFSPUZXLOGKHJ-UHFFFAOYSA-N Muraminsaeure Natural products OC(=O)C(C)OC1C(N)C(O)OC(CO)C1O MSFSPUZXLOGKHJ-UHFFFAOYSA-N 0.000 claims description 13
- 238000000108 ultra-filtration Methods 0.000 claims description 13
- 241000196324 Embryophyta Species 0.000 claims description 12
- 102100021700 Glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1 Human genes 0.000 claims description 12
- 101000896564 Homo sapiens Glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1 Proteins 0.000 claims description 12
- 230000006698 induction Effects 0.000 claims description 12
- 229920001282 polysaccharide Polymers 0.000 claims description 12
- 108060003306 Galactosyltransferase Proteins 0.000 claims description 11
- 102000030902 Galactosyltransferase Human genes 0.000 claims description 11
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 claims description 11
- 108010055629 Glucosyltransferases Proteins 0.000 claims description 11
- 102000000340 Glucosyltransferases Human genes 0.000 claims description 11
- 108010087568 Mannosyltransferases Proteins 0.000 claims description 11
- 102000006722 Mannosyltransferases Human genes 0.000 claims description 11
- 108010035265 N-acetylneuraminate synthase Proteins 0.000 claims description 11
- 102100029954 Sialic acid synthase Human genes 0.000 claims description 11
- 108090000141 Sialyltransferases Proteins 0.000 claims description 11
- 102000003838 Sialyltransferases Human genes 0.000 claims description 11
- 238000004108 freeze drying Methods 0.000 claims description 11
- 230000005764 inhibitory process Effects 0.000 claims description 11
- 238000001728 nano-filtration Methods 0.000 claims description 11
- 239000005017 polysaccharide Substances 0.000 claims description 11
- 238000001694 spray drying Methods 0.000 claims description 11
- 102000007524 N-Acetylgalactosaminyltransferases Human genes 0.000 claims description 10
- 108010046220 N-Acetylgalactosaminyltransferases Proteins 0.000 claims description 10
- INJACODUUNZJCO-NAGKVERXSA-N UDP-N-acetyl-beta-L-fucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 INJACODUUNZJCO-NAGKVERXSA-N 0.000 claims description 10
- 108091007433 antigens Proteins 0.000 claims description 10
- 102000036639 antigens Human genes 0.000 claims description 10
- 238000002036 drum drying Methods 0.000 claims description 10
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 10
- 108010043841 Glucosamine 6-Phosphate N-Acetyltransferase Proteins 0.000 claims description 9
- 108010074307 Phosphoacetylglucosamine mutase Proteins 0.000 claims description 9
- 102100024440 Phosphoacetylglucosamine mutase Human genes 0.000 claims description 9
- 210000004369 blood Anatomy 0.000 claims description 9
- 239000008280 blood Substances 0.000 claims description 9
- TXCIAUNLDRJGJZ-UHFFFAOYSA-N CMP-N-acetyl neuraminic acid Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-UHFFFAOYSA-N 0.000 claims description 8
- TXCIAUNLDRJGJZ-BILDWYJOSA-N CMP-N-acetyl-beta-neuraminic acid Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@]1(C(O)=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-BILDWYJOSA-N 0.000 claims description 8
- 241000238631 Hexapoda Species 0.000 claims description 8
- 241000235648 Pichia Species 0.000 claims description 8
- 240000008042 Zea mays Species 0.000 claims description 8
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 8
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 8
- 235000005822 corn Nutrition 0.000 claims description 8
- 210000002919 epithelial cell Anatomy 0.000 claims description 8
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 241001646716 Escherichia coli K-12 Species 0.000 claims description 7
- 102000002740 Glucosamine 6-Phosphate N-Acetyltransferase Human genes 0.000 claims description 7
- 108010092364 Glucuronosyltransferase Proteins 0.000 claims description 7
- 102000016354 Glucuronosyltransferase Human genes 0.000 claims description 7
- 101000802660 Homo sapiens Histo-blood group ABO system transferase Proteins 0.000 claims description 7
- 102100037921 UDP-N-acetylglucosamine pyrophosphorylase Human genes 0.000 claims description 7
- DQQDLYVHOTZLOR-OCIMBMBZSA-N UDP-alpha-D-xylose Chemical compound C([C@@H]1[C@H]([C@H]([C@@H](O1)N1C(NC(=O)C=C1)=O)O)O)OP(O)(=O)OP(O)(=O)O[C@H]1OC[C@@H](O)[C@H](O)[C@H]1O DQQDLYVHOTZLOR-OCIMBMBZSA-N 0.000 claims description 7
- DQQDLYVHOTZLOR-UHFFFAOYSA-N UDP-alpha-D-xylose Natural products O1C(N2C(NC(=O)C=C2)=O)C(O)C(O)C1COP(O)(=O)OP(O)(=O)OC1OCC(O)C(O)C1O DQQDLYVHOTZLOR-UHFFFAOYSA-N 0.000 claims description 7
- 102100021436 UDP-glucose 4-epimerase Human genes 0.000 claims description 7
- 108010075202 UDP-glucose 4-epimerase Proteins 0.000 claims description 7
- 108010061048 UDPacetylglucosamine pyrophosphorylase Proteins 0.000 claims description 7
- 102000010199 Xylosyltransferases Human genes 0.000 claims description 7
- 210000004102 animal cell Anatomy 0.000 claims description 7
- 108010001671 galactoside 3-fucosyltransferase Proteins 0.000 claims description 7
- 150000008195 galaktosides Chemical class 0.000 claims description 7
- 102000056538 human ABO Human genes 0.000 claims description 7
- 235000013336 milk Nutrition 0.000 claims description 7
- 239000008267 milk Substances 0.000 claims description 7
- 210000004080 milk Anatomy 0.000 claims description 7
- 238000000926 separation method Methods 0.000 claims description 7
- 241000305071 Enterobacterales Species 0.000 claims description 6
- 108010042871 N-acetylmannosaminyltransferase Proteins 0.000 claims description 6
- 108010065282 UDP xylose-protein xylosyltransferase Proteins 0.000 claims description 6
- 101710091363 UDP-N-acetylglucosamine 2-epimerase Proteins 0.000 claims description 6
- HDYANYHVCAPMJV-GXNRKQDOSA-N UDP-alpha-D-galacturonic acid Chemical compound C([C@@H]1[C@H]([C@H]([C@@H](O1)N1C(NC(=O)C=C1)=O)O)O)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](C(O)=O)[C@H](O)[C@H](O)[C@H]1O HDYANYHVCAPMJV-GXNRKQDOSA-N 0.000 claims description 6
- HDYANYHVCAPMJV-LXQIFKJMSA-N UDP-alpha-D-glucuronic acid Chemical compound C([C@@H]1[C@H]([C@H]([C@@H](O1)N1C(NC(=O)C=C1)=O)O)O)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O HDYANYHVCAPMJV-LXQIFKJMSA-N 0.000 claims description 6
- 238000010979 pH adjustment Methods 0.000 claims description 6
- HOEWKBQADMRCLO-YKNQQZBYSA-N (2r,4s,5r,6r)-2-[[(2r,3s,4r)-5-(4-amino-2-oxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-4-hydroxy-5-[(2-hydroxyacetyl)amino]-6-[(1r,2r)-1,2,3-trihydroxypropyl]oxane-2-carboxylic acid Chemical compound O=C1N=C(N)C=CN1C1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)O[C@@]2(O[C@H]([C@H](NC(=O)CO)[C@@H](O)C2)[C@H](O)[C@H](O)CO)C(O)=O)O1 HOEWKBQADMRCLO-YKNQQZBYSA-N 0.000 claims description 5
- 108010083651 3-galactosyl-N-acetylglucosaminide 4-alpha-L-fucosyltransferase Proteins 0.000 claims description 5
- 241000228212 Aspergillus Species 0.000 claims description 5
- 241000235070 Saccharomyces Species 0.000 claims description 5
- 102000003929 Transaminases Human genes 0.000 claims description 5
- 108090000340 Transaminases Proteins 0.000 claims description 5
- 101000980463 Treponema pallidum (strain Nichols) Chaperonin GroEL Proteins 0.000 claims description 5
- NQBRVZNDBBMBLJ-MQTLHLSBSA-N UDP-N-acetyl-alpha-D-muramic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O[C@H](C)C(O)=O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 NQBRVZNDBBMBLJ-MQTLHLSBSA-N 0.000 claims description 5
- NQBRVZNDBBMBLJ-UHFFFAOYSA-N UDP-N-acetylmuramic acid alpha-anomer Natural products CC(=O)NC1C(OC(C)C(O)=O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 NQBRVZNDBBMBLJ-UHFFFAOYSA-N 0.000 claims description 5
- 108700023183 UTP-glucose-1-phosphate uridylyltransferases Proteins 0.000 claims description 5
- 108010042381 alpha 1,3-mannosyltransferase Proteins 0.000 claims description 5
- 239000003610 charcoal Substances 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000004191 hydrophobic interaction chromatography Methods 0.000 claims description 5
- 238000005342 ion exchange Methods 0.000 claims description 5
- 238000004255 ion exchange chromatography Methods 0.000 claims description 5
- 210000004962 mammalian cell Anatomy 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 239000007921 spray Substances 0.000 claims description 5
- VUDQSRFCCHQIIU-UHFFFAOYSA-N 1-(3,5-dichloro-2,6-dihydroxy-4-methoxyphenyl)hexan-1-one Chemical compound CCCCCC(=O)C1=C(O)C(Cl)=C(OC)C(Cl)=C1O VUDQSRFCCHQIIU-UHFFFAOYSA-N 0.000 claims description 4
- 241000251468 Actinopterygii Species 0.000 claims description 4
- 101710098620 Alpha-1,2-fucosyltransferase Proteins 0.000 claims description 4
- 240000002791 Brassica napus Species 0.000 claims description 4
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 4
- 229920000742 Cotton Polymers 0.000 claims description 4
- 241000224495 Dictyostelium Species 0.000 claims description 4
- 241000660147 Escherichia coli str. K-12 substr. MG1655 Species 0.000 claims description 4
- 244000068988 Glycine max Species 0.000 claims description 4
- 235000010469 Glycine max Nutrition 0.000 claims description 4
- 241000235649 Kluyveromyces Species 0.000 claims description 4
- 241000235395 Mucor Species 0.000 claims description 4
- 240000007594 Oryza sativa Species 0.000 claims description 4
- 235000007164 Oryza sativa Nutrition 0.000 claims description 4
- 241000228143 Penicillium Species 0.000 claims description 4
- 241000235527 Rhizopus Species 0.000 claims description 4
- 101000604870 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Glycolipid 2-alpha-mannosyltransferase Proteins 0.000 claims description 4
- 108090000636 UDP-4-amino-4,6-dideoxy-N-acetyl-beta-L-altrosamine transaminases Proteins 0.000 claims description 4
- 108010085193 UDP-N-acetylglucosamine 1-carboxyvinyltransferase Proteins 0.000 claims description 4
- 241000235017 Zygosaccharomyces Species 0.000 claims description 4
- 238000001042 affinity chromatography Methods 0.000 claims description 4
- 238000002425 crystallisation Methods 0.000 claims description 4
- 230000008025 crystallization Effects 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 4
- 238000001962 electrophoresis Methods 0.000 claims description 4
- 238000001704 evaporation Methods 0.000 claims description 4
- 230000008020 evaporation Effects 0.000 claims description 4
- 210000002950 fibroblast Anatomy 0.000 claims description 4
- 238000002523 gelfiltration Methods 0.000 claims description 4
- 210000003292 kidney cell Anatomy 0.000 claims description 4
- 238000004246 ligand exchange chromatography Methods 0.000 claims description 4
- 238000001471 micro-filtration Methods 0.000 claims description 4
- 238000001556 precipitation Methods 0.000 claims description 4
- 238000001223 reverse osmosis Methods 0.000 claims description 4
- 235000009566 rice Nutrition 0.000 claims description 4
- 102100027934 Beta-1,3-glucosyltransferase Human genes 0.000 claims description 3
- 101710186241 Beta-1,3-glucosyltransferase Proteins 0.000 claims description 3
- 241000255789 Bombyx mori Species 0.000 claims description 3
- 241000699802 Cricetulus griseus Species 0.000 claims description 3
- 241000255601 Drosophila melanogaster Species 0.000 claims description 3
- 241001099157 Komagataella Species 0.000 claims description 3
- 102100035838 Lactosylceramide 4-alpha-galactosyltransferase Human genes 0.000 claims description 3
- 241000222702 Leishmania tarentolae Species 0.000 claims description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 3
- 241000555303 Mamestra brassicae Species 0.000 claims description 3
- 240000004658 Medicago sativa Species 0.000 claims description 3
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims description 3
- 241001529936 Murinae Species 0.000 claims description 3
- 108010093077 N-Acetylglucosaminyltransferases Proteins 0.000 claims description 3
- 102000002493 N-Acetylglucosaminyltransferases Human genes 0.000 claims description 3
- 244000061176 Nicotiana tabacum Species 0.000 claims description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 claims description 3
- 240000003768 Solanum lycopersicum Species 0.000 claims description 3
- 241000256251 Spodoptera frugiperda Species 0.000 claims description 3
- 241000255993 Trichoplusia ni Species 0.000 claims description 3
- 108010070808 UDP-galactose-lactosylceramide alpha 1-4-galactosyltransferase Proteins 0.000 claims description 3
- 210000004504 adult stem cell Anatomy 0.000 claims description 3
- 210000001671 embryonic stem cell Anatomy 0.000 claims description 3
- 230000006862 enzymatic digestion Effects 0.000 claims description 3
- 210000005260 human cell Anatomy 0.000 claims description 3
- 201000000050 myeloid neoplasm Diseases 0.000 claims description 3
- 239000002736 nonionic surfactant Substances 0.000 claims description 3
- 210000001672 ovary Anatomy 0.000 claims description 3
- PRAKEZFYQAJEHH-SUVUXTLLSA-N 1-[(3R,4R,5R,6R)-3-amino-2,4,5-trihydroxy-6-methyloxan-2-yl]ethanone Chemical compound C(C)(=O)C1(O)[C@H](N)[C@@H](O)[C@@H](O)[C@H](O1)C PRAKEZFYQAJEHH-SUVUXTLLSA-N 0.000 claims description 2
- 241000271566 Aves Species 0.000 claims description 2
- 241000195493 Cryptophyta Species 0.000 claims description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 claims description 2
- 102100038834 UTP-glucose-1-phosphate uridylyltransferase Human genes 0.000 claims description 2
- 239000003929 acidic solution Substances 0.000 claims description 2
- 239000012670 alkaline solution Substances 0.000 claims description 2
- 108010039255 alpha 1,6-mannosyltransferase Proteins 0.000 claims description 2
- 108010064886 beta-D-galactoside alpha 2-6-sialyltransferase Proteins 0.000 claims description 2
- 241000938605 Crocodylia Species 0.000 claims 1
- 244000163122 Curcuma domestica Species 0.000 claims 1
- 235000003392 Curcuma domestica Nutrition 0.000 claims 1
- 102100039847 Globoside alpha-1,3-N-acetylgalactosaminyltransferase 1 Human genes 0.000 claims 1
- 102000005731 Glucose-6-phosphate isomerase Human genes 0.000 claims 1
- 241000219146 Gossypium Species 0.000 claims 1
- 101000887519 Homo sapiens Globoside alpha-1,3-N-acetylgalactosaminyltransferase 1 Proteins 0.000 claims 1
- 101710202061 N-acetyltransferase Proteins 0.000 claims 1
- XCCTYIAWTASOJW-UHFFFAOYSA-N UDP-Glc Natural products OC1C(O)C(COP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-UHFFFAOYSA-N 0.000 claims 1
- 235000003373 curcuma longa Nutrition 0.000 claims 1
- 238000000502 dialysis Methods 0.000 claims 1
- 238000005868 electrolysis reaction Methods 0.000 claims 1
- 235000013976 turmeric Nutrition 0.000 claims 1
- 238000004113 cell culture Methods 0.000 abstract description 4
- 238000002955 isolation Methods 0.000 abstract description 4
- 238000012269 metabolic engineering Methods 0.000 abstract description 2
- 239000000047 product Substances 0.000 description 143
- 235000018102 proteins Nutrition 0.000 description 84
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 78
- 101150033479 GFA1 gene Proteins 0.000 description 59
- 101100060191 Arabidopsis thaliana CLO gene Proteins 0.000 description 58
- 102000040430 polynucleotide Human genes 0.000 description 55
- 108091033319 polynucleotide Proteins 0.000 description 55
- 239000002157 polynucleotide Substances 0.000 description 54
- AXQLFFDZXPOFPO-UHFFFAOYSA-N UNPD216 Natural products O1C(CO)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(=O)C)C1OC(C1O)C(O)C(CO)OC1OC1C(O)C(O)C(O)OC1CO AXQLFFDZXPOFPO-UHFFFAOYSA-N 0.000 description 46
- AXQLFFDZXPOFPO-UNTPKZLMSA-N beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O([C@@H]1O[C@H](CO)[C@H](O)[C@@H]([C@H]1O)O[C@H]1[C@@H]([C@H]([C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)NC(=O)C)[C@H]1[C@H](O)[C@@H](O)[C@H](O)O[C@@H]1CO AXQLFFDZXPOFPO-UNTPKZLMSA-N 0.000 description 46
- USIPEGYTBGEPJN-UHFFFAOYSA-N lacto-N-tetraose Natural products O1C(CO)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(=O)C)C1OC1C(O)C(CO)OC(OC(C(O)CO)C(O)C(O)C=O)C1O USIPEGYTBGEPJN-UHFFFAOYSA-N 0.000 description 46
- 125000003729 nucleotide group Chemical group 0.000 description 39
- 239000002773 nucleotide Substances 0.000 description 38
- 239000000370 acceptor Substances 0.000 description 37
- 238000012546 transfer Methods 0.000 description 36
- 238000013518 transcription Methods 0.000 description 34
- 230000035897 transcription Effects 0.000 description 34
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 32
- IEQCXFNWPAHHQR-UHFFFAOYSA-N lacto-N-neotetraose Natural products OCC1OC(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)C(NC(=O)C)C(O)C1OC1OC(CO)C(O)C(O)C1O IEQCXFNWPAHHQR-UHFFFAOYSA-N 0.000 description 32
- 229940062780 lacto-n-neotetraose Drugs 0.000 description 32
- RBMYDHMFFAVMMM-PLQWBNBWSA-N neolactotetraose Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O RBMYDHMFFAVMMM-PLQWBNBWSA-N 0.000 description 32
- 235000000346 sugar Nutrition 0.000 description 31
- 235000001014 amino acid Nutrition 0.000 description 30
- 239000002777 nucleoside Substances 0.000 description 28
- OVRNDRQMDRJTHS-ZTVVOAFPSA-N N-acetyl-D-mannosamine Chemical compound CC(=O)N[C@@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-ZTVVOAFPSA-N 0.000 description 27
- 239000012634 fragment Substances 0.000 description 26
- 238000006243 chemical reaction Methods 0.000 description 25
- 238000006467 substitution reaction Methods 0.000 description 25
- 229940024606 amino acid Drugs 0.000 description 24
- 150000001413 amino acids Chemical class 0.000 description 24
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 23
- 108020004414 DNA Proteins 0.000 description 22
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 22
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 21
- 230000012010 growth Effects 0.000 description 21
- 239000008101 lactose Substances 0.000 description 21
- 239000002609 medium Substances 0.000 description 20
- 150000003833 nucleoside derivatives Chemical class 0.000 description 19
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 18
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 18
- 238000002474 experimental method Methods 0.000 description 18
- 239000008103 glucose Substances 0.000 description 18
- 229960001031 glucose Drugs 0.000 description 18
- 239000013613 expression plasmid Substances 0.000 description 17
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 16
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 15
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 15
- 101100186924 Escherichia coli neuC gene Proteins 0.000 description 15
- 239000002253 acid Substances 0.000 description 15
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 14
- 101100186921 Legionella pneumophila subsp. pneumophila (strain Philadelphia 1 / ATCC 33152 / DSM 7513) neuB gene Proteins 0.000 description 13
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 13
- 238000011156 evaluation Methods 0.000 description 13
- 238000000855 fermentation Methods 0.000 description 13
- 230000004151 fermentation Effects 0.000 description 13
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 12
- 238000002869 basic local alignment search tool Methods 0.000 description 12
- 150000001720 carbohydrates Chemical class 0.000 description 12
- 239000002158 endotoxin Substances 0.000 description 12
- 229930182830 galactose Natural products 0.000 description 12
- 229960003082 galactose Drugs 0.000 description 12
- 239000004615 ingredient Substances 0.000 description 12
- 244000005700 microbiome Species 0.000 description 12
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical group O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 11
- 102100023951 Glucosamine 6-phosphate N-acetyltransferase Human genes 0.000 description 11
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 11
- BRGMHAYQAZFZDJ-PVFLNQBWSA-N N-Acetylglucosamine 6-phosphate Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BRGMHAYQAZFZDJ-PVFLNQBWSA-N 0.000 description 11
- 108010081778 N-acylneuraminate cytidylyltransferase Proteins 0.000 description 11
- 229910019142 PO4 Inorganic materials 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 11
- 210000004216 mammary stem cell Anatomy 0.000 description 11
- 230000037361 pathway Effects 0.000 description 11
- MSWZFWKMSRAUBD-UHFFFAOYSA-N 2-Amino-2-Deoxy-Hexose Chemical compound NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 10
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 10
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 10
- HMQPEDMEOBLSQB-RCBHQUQDSA-N beta-D-Galp-(1->3)-alpha-D-GlcpNAc Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HMQPEDMEOBLSQB-RCBHQUQDSA-N 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 10
- 235000013350 formula milk Nutrition 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 10
- 101100245749 Campylobacter jejuni subsp. jejuni serotype O:23/36 (strain 81-176) pseF gene Proteins 0.000 description 9
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 9
- 101150056133 GNPNAT1 gene Proteins 0.000 description 9
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- 102100031349 N-acylneuraminate cytidylyltransferase Human genes 0.000 description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 229930006000 Sucrose Natural products 0.000 description 9
- 230000009471 action Effects 0.000 description 9
- TYALNJQZQRNQNQ-JLYOMPFMSA-N alpha-Neup5Ac-(2->6)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)OC[C@@H]1[C@H](O)[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)O[C@@H]2CO)O)O1 TYALNJQZQRNQNQ-JLYOMPFMSA-N 0.000 description 9
- 230000027455 binding Effects 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 9
- 235000004554 glutamine Nutrition 0.000 description 9
- 101150100121 gna1 gene Proteins 0.000 description 9
- 101150018810 lgtB gene Proteins 0.000 description 9
- 239000012528 membrane Substances 0.000 description 9
- 101150019075 neuA gene Proteins 0.000 description 9
- 125000003835 nucleoside group Chemical group 0.000 description 9
- 239000005720 sucrose Substances 0.000 description 9
- 150000008163 sugars Chemical class 0.000 description 9
- TYALNJQZQRNQNQ-UHFFFAOYSA-N #alpha;2,6-sialyllactose Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OCC1C(O)C(O)C(O)C(OC2C(C(O)C(O)OC2CO)O)O1 TYALNJQZQRNQNQ-UHFFFAOYSA-N 0.000 description 8
- XHMJOUIAFHJHBW-IVMDWMLBSA-N 2-amino-2-deoxy-D-glucopyranose 6-phosphate Chemical compound N[C@H]1C(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O XHMJOUIAFHJHBW-IVMDWMLBSA-N 0.000 description 8
- 241000589875 Campylobacter jejuni Species 0.000 description 8
- 102100031132 Glucose-6-phosphate isomerase Human genes 0.000 description 8
- 101000581507 Homo sapiens Methyl-CpG-binding domain protein 1 Proteins 0.000 description 8
- 101001134861 Homo sapiens Pericentriolar material 1 protein Proteins 0.000 description 8
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 description 8
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 8
- 102100027383 Methyl-CpG-binding domain protein 1 Human genes 0.000 description 8
- 101100315731 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) QRI1 gene Proteins 0.000 description 8
- 101100315730 Schizosaccharomyces pombe (strain 972 / ATCC 24843) uap1 gene Proteins 0.000 description 8
- 230000001580 bacterial effect Effects 0.000 description 8
- 239000002585 base Substances 0.000 description 8
- 229930191176 lacto-N-biose Natural products 0.000 description 8
- 229920006008 lipopolysaccharide Polymers 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- KFEUJDWYNGMDBV-LODBTCKLSA-N N-acetyllactosamine Chemical compound O[C@@H]1[C@@H](NC(=O)C)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 KFEUJDWYNGMDBV-LODBTCKLSA-N 0.000 description 7
- QUOQJNYANJQSDA-MHQSSNGYSA-N Sialyllacto-N-tetraose a Chemical compound O1C([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)O[C@@H]1[C@@H](O)[C@H](OC2[C@H]([C@H](OC3[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]3O)O)O[C@H](CO)[C@H]2O)NC(C)=O)O[C@H](CO)[C@@H]1O QUOQJNYANJQSDA-MHQSSNGYSA-N 0.000 description 7
- 238000007792 addition Methods 0.000 description 7
- PDWGIAAFQACISG-QZBWVFMZSA-N beta-D-Gal-(1->3)-beta-D-GlcNAc-(1->3)-[beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->6)]-beta-D-Gal-(1->4)-D-Glc Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)OC[C@@H]1[C@@H]([C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](O)[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O1)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O PDWGIAAFQACISG-QZBWVFMZSA-N 0.000 description 7
- 235000015872 dietary supplement Nutrition 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- 238000005755 formation reaction Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 238000006460 hydrolysis reaction Methods 0.000 description 7
- 230000001976 improved effect Effects 0.000 description 7
- 239000010452 phosphate Substances 0.000 description 7
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- DVGKRPYUFRZAQW-UHFFFAOYSA-N 3 prime Natural products CC(=O)NC1OC(CC(O)C1C(O)C(O)CO)(OC2C(O)C(CO)OC(OC3C(O)C(O)C(O)OC3CO)C2O)C(=O)O DVGKRPYUFRZAQW-UHFFFAOYSA-N 0.000 description 6
- OIZGSVFYNBZVIK-FHHHURIISA-N 3'-sialyllactose Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)O[C@@H]1[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O OIZGSVFYNBZVIK-FHHHURIISA-N 0.000 description 6
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 6
- 239000005715 Fructose Substances 0.000 description 6
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 6
- HESSGHHCXGBPAJ-UHFFFAOYSA-N N-acetyllactosamine Natural products CC(=O)NC(C=O)C(O)C(C(O)CO)OC1OC(CO)C(O)C(O)C1O HESSGHHCXGBPAJ-UHFFFAOYSA-N 0.000 description 6
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 description 6
- 108010056664 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyltransferase Proteins 0.000 description 6
- 150000007513 acids Chemical class 0.000 description 6
- 235000014633 carbohydrates Nutrition 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 235000013305 food Nutrition 0.000 description 6
- 229930195712 glutamate Natural products 0.000 description 6
- 238000004128 high performance liquid chromatography Methods 0.000 description 6
- 230000007062 hydrolysis Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 229930182817 methionine Natural products 0.000 description 6
- ZDZMLVPSYYRJNI-CYQYEHMMSA-N p-lacto-n-hexaose Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1N=C(C)O)O[C@@H]1[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)OC([C@@H]1O)CO[C@H]1[C@@H]([C@H](C(O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)O1)O)N=C(O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O ZDZMLVPSYYRJNI-CYQYEHMMSA-N 0.000 description 6
- 235000013406 prebiotics Nutrition 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 239000002028 Biomass Substances 0.000 description 5
- 229930091371 Fructose Natural products 0.000 description 5
- RJTOFDPWCJDYFZ-SPVZFZGWSA-N Lacto-N-triaose Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O RJTOFDPWCJDYFZ-SPVZFZGWSA-N 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 241000588650 Neisseria meningitidis Species 0.000 description 5
- SFMRPVLZMVJKGZ-JRZQLMJNSA-N Sialyllacto-N-tetraose b Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)OC[C@@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]2O)O)O1 SFMRPVLZMVJKGZ-JRZQLMJNSA-N 0.000 description 5
- 102000004357 Transferases Human genes 0.000 description 5
- 108090000992 Transferases Proteins 0.000 description 5
- 102000048175 UTP-glucose-1-phosphate uridylyltransferases Human genes 0.000 description 5
- NPPRJALWPIXIHO-PNCMPRLYSA-N beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->3)-[beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->6)]-beta-D-Gal-(1->4)-D-Glc Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)OC[C@@H]1[C@@H]([C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O[C@H]3[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O3)O)[C@@H](CO)O2)NC(C)=O)[C@@H](O)[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O1)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O NPPRJALWPIXIHO-PNCMPRLYSA-N 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- RJTOFDPWCJDYFZ-UHFFFAOYSA-N lacto-N-triose Natural products CC(=O)NC1C(O)C(O)C(CO)OC1OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1O RJTOFDPWCJDYFZ-UHFFFAOYSA-N 0.000 description 5
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 235000021317 phosphate Nutrition 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- DHMOYSJTQIXOGT-VGHJGKRNSA-N (2R,4S,5R,6R)-5-Amino-4-hydroxy-6-[(1R,2R)-1,2,3-trihydroxypropyl]-2-[[(2R,3R,4S,5R,6S)-3,4,5-trihydroxy-6-[(2R,3S,4R,5R,6R)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-2-yl]methoxy]oxane-2-carboxylic acid Chemical compound N[C@@H]1[C@@H](O)C[C@@](OC[C@H]2O[C@@H](O[C@H]3[C@H](O)[C@@H](O)[C@H](O)O[C@@H]3CO)[C@H](O)[C@@H](O)[C@H]2O)(O[C@H]1[C@H](O)[C@H](O)CO)C(O)=O DHMOYSJTQIXOGT-VGHJGKRNSA-N 0.000 description 4
- CILYIEBUXJIHCO-UHFFFAOYSA-N 102778-91-6 Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OC1C(O)C(OC2C(C(O)C(O)OC2CO)O)OC(CO)C1O CILYIEBUXJIHCO-UHFFFAOYSA-N 0.000 description 4
- FZLJPEPAYPUMMR-RTRLPJTCSA-N 2-acetamido-2-deoxy-D-glucopyranose 1-phosphate Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)OC1OP(O)(O)=O FZLJPEPAYPUMMR-RTRLPJTCSA-N 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- AEMOLEFTQBMNLQ-AQKNRBDQSA-N D-glucopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-AQKNRBDQSA-N 0.000 description 4
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 4
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 4
- CILYIEBUXJIHCO-UITFWXMXSA-N N-acetyl-alpha-neuraminyl-(2->3)-beta-D-galactosyl-(1->4)-beta-D-glucose Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)O[C@@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)O[C@@H]2CO)O)O[C@H](CO)[C@@H]1O CILYIEBUXJIHCO-UITFWXMXSA-N 0.000 description 4
- OIZGSVFYNBZVIK-UHFFFAOYSA-N N-acetylneuraminosyl-D-lactose Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1O OIZGSVFYNBZVIK-UHFFFAOYSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 241000606856 Pasteurella multocida Species 0.000 description 4
- 241000607568 Photobacterium Species 0.000 description 4
- 101710167959 Putative UTP-glucose-1-phosphate uridylyltransferase Proteins 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- SXMGGNXBTZBGLU-IBUUTZGMSA-N Sialyllacto-N-neotetraose c Chemical compound O([C@H]([C@@H]([C@@H](O)[C@H]1O)O)O[C@H]2[C@H](O)[C@H]([C@@H](O[C@@H]2CO)O[C@@H]2[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]2O)O)NC(=O)C)C1CO[C@]1(C(O)=O)C[C@H](O)[C@@H](NC(C)=O)[C@H]([C@H](O)[C@H](O)CO)O1 SXMGGNXBTZBGLU-IBUUTZGMSA-N 0.000 description 4
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 4
- 239000004473 Threonine Substances 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 4
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000008827 biological function Effects 0.000 description 4
- 229940041514 candida albicans extract Drugs 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000001030 gas--liquid chromatography Methods 0.000 description 4
- 238000006206 glycosylation reaction Methods 0.000 description 4
- 239000012535 impurity Substances 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 229960000310 isoleucine Drugs 0.000 description 4
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 239000010410 layer Substances 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 238000002887 multiple sequence alignment Methods 0.000 description 4
- 230000003204 osmotic effect Effects 0.000 description 4
- 230000002018 overexpression Effects 0.000 description 4
- 229940051027 pasteurella multocida Drugs 0.000 description 4
- DTBNBXWJWCWCIK-UHFFFAOYSA-K phosphonatoenolpyruvate Chemical compound [O-]C(=O)C(=C)OP([O-])([O-])=O DTBNBXWJWCWCIK-UHFFFAOYSA-K 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 235000004400 serine Nutrition 0.000 description 4
- 235000021309 simple sugar Nutrition 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 235000008521 threonine Nutrition 0.000 description 4
- 239000012137 tryptone Substances 0.000 description 4
- 239000004474 valine Substances 0.000 description 4
- 229960004295 valine Drugs 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 3
- MSWZFWKMSRAUBD-GASJEMHNSA-N 2-amino-2-deoxy-D-galactopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O MSWZFWKMSRAUBD-GASJEMHNSA-N 0.000 description 3
- MSWZFWKMSRAUBD-IVMDWMLBSA-N 2-amino-2-deoxy-D-glucopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-IVMDWMLBSA-N 0.000 description 3
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- 241000283254 Balaenoptera acutorostrata Species 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- NBSCHQHZLSJFNQ-GASJEMHNSA-N D-Glucose 6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@H]1O NBSCHQHZLSJFNQ-GASJEMHNSA-N 0.000 description 3
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 241000238557 Decapoda Species 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 241000192125 Firmicutes Species 0.000 description 3
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 3
- VFRROHXSMXFLSN-UHFFFAOYSA-N Glc6P Natural products OP(=O)(O)OCC(O)C(O)C(O)C(O)C=O VFRROHXSMXFLSN-UHFFFAOYSA-N 0.000 description 3
- 102100041034 Glucosamine-6-phosphate isomerase 1 Human genes 0.000 description 3
- 101710185468 Glutamine-fructose-6-phosphate aminotransferase [isomerizing] Proteins 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 244000299507 Gossypium hirsutum Species 0.000 description 3
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 229930182816 L-glutamine Natural products 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 102000003939 Membrane transport proteins Human genes 0.000 description 3
- 108090000301 Membrane transport proteins Proteins 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 3
- 241001494479 Pecora Species 0.000 description 3
- 239000001888 Peptone Substances 0.000 description 3
- 108010080698 Peptones Proteins 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- 108091023045 Untranslated Region Proteins 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 238000001994 activation Methods 0.000 description 3
- 230000009056 active transport Effects 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 150000001298 alcohols Chemical class 0.000 description 3
- DLRVVLDZNNYCBX-CAPXFGMSSA-N allolactose Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@@H]1OC[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](O)O1 DLRVVLDZNNYCBX-CAPXFGMSSA-N 0.000 description 3
- AEMOLEFTQBMNLQ-BKBMJHBISA-N alpha-D-galacturonic acid Chemical compound O[C@H]1O[C@H](C(O)=O)[C@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-BKBMJHBISA-N 0.000 description 3
- RQNFGIWYOACERD-OCQMRBNYSA-N alpha-L-Fucp-(1->4)-[alpha-L-Fucp-(1->2)-beta-D-Galp-(1->3)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](CO)O[C@@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)[C@@H]2NC(C)=O)O[C@H]2[C@H]([C@H](O)[C@H](O)[C@H](C)O2)O)O[C@H](CO)[C@H](O)[C@@H]1O RQNFGIWYOACERD-OCQMRBNYSA-N 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 229940009098 aspartate Drugs 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- DMYPRRDPOMGEAK-XWDFSUOISA-N beta-D-Galp-(1->3)-[alpha-L-Fucp-(1->4)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-[alpha-L-Fucp-(1->3)]-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O4)O)[C@H](O[C@H]4[C@H]([C@H](O)[C@H](O)[C@H](C)O4)O)[C@@H](CO)O3)NC(C)=O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)OC(O)[C@@H]1O DMYPRRDPOMGEAK-XWDFSUOISA-N 0.000 description 3
- 230000031018 biological processes and functions Effects 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 229940077731 carbohydrate nutrients Drugs 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000005352 clarification Methods 0.000 description 3
- 238000004440 column chromatography Methods 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- SUSQQDGHFAOUBW-PVLJGHBYSA-N difucosyllacto-n-hexaose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](C)O[C@@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO[C@H]3[C@@H]([C@@H](O[C@@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](C)O4)O)[C@H](O[C@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O4)O)[C@@H](CO)O3)NC(C)=O)[C@@H]2O)O)O[C@@H]1CO SUSQQDGHFAOUBW-PVLJGHBYSA-N 0.000 description 3
- 238000000909 electrodialysis Methods 0.000 description 3
- 239000003792 electrolyte Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000029142 excretion Effects 0.000 description 3
- 235000019688 fish Nutrition 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000005805 hydroxylation reaction Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- GSXOAOHZAIYLCY-HSUXUTPPSA-N keto-D-fructose 6-phosphate Chemical compound OCC(=O)[C@@H](O)[C@H](O)[C@H](O)COP(O)(O)=O GSXOAOHZAIYLCY-HSUXUTPPSA-N 0.000 description 3
- RQNFGIWYOACERD-UHFFFAOYSA-N lacto-N-Difucosylhexaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(CO)OC(OC3C(C(OC4C(OC(O)C(O)C4O)CO)OC(CO)C3O)O)C2NC(C)=O)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O RQNFGIWYOACERD-UHFFFAOYSA-N 0.000 description 3
- OQIUPKPUOLIHHS-UHFFFAOYSA-N lacto-N-difucohexaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(CO)OC(OC3C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C3O)O)C2NC(C)=O)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O OQIUPKPUOLIHHS-UHFFFAOYSA-N 0.000 description 3
- DMYPRRDPOMGEAK-UHFFFAOYSA-N lacto-N-difucohexaose II Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(OC3C(C(OC4C(C(O)C(O)C(CO)O4)O)C(OC4C(C(O)C(O)C(C)O4)O)C(CO)O3)NC(C)=O)C(O)C(CO)O2)O)C(CO)OC(O)C1O DMYPRRDPOMGEAK-UHFFFAOYSA-N 0.000 description 3
- 229940041290 mannose Drugs 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 239000002207 metabolite Substances 0.000 description 3
- 235000013379 molasses Nutrition 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000036542 oxidative stress Effects 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 230000009057 passive transport Effects 0.000 description 3
- 235000019319 peptone Nutrition 0.000 description 3
- 210000001322 periplasm Anatomy 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 3
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 229920005862 polyol Polymers 0.000 description 3
- 150000003077 polyols Chemical class 0.000 description 3
- 239000004810 polytetrafluoroethylene Substances 0.000 description 3
- 229920001343 polytetrafluoroethylene Polymers 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 235000002374 tyrosine Nutrition 0.000 description 3
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 3
- BGWQRWREUZVRGI-NNPWBXLPSA-N (3s,4s,5s,6r)-6-[(1r)-1,2-dihydroxyethyl]oxane-2,3,4,5-tetrol Chemical compound OC[C@@H](O)[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O BGWQRWREUZVRGI-NNPWBXLPSA-N 0.000 description 2
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 2
- KFEUJDWYNGMDBV-UHFFFAOYSA-N (N-Acetyl)-glucosamin-4-beta-galaktosid Natural products OC1C(NC(=O)C)C(O)OC(CO)C1OC1C(O)C(O)C(O)C(CO)O1 KFEUJDWYNGMDBV-UHFFFAOYSA-N 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 2
- PXBFMLJZNCDSMP-UHFFFAOYSA-N 2-Aminobenzamide Chemical compound NC(=O)C1=CC=CC=C1N PXBFMLJZNCDSMP-UHFFFAOYSA-N 0.000 description 2
- MSWZFWKMSRAUBD-CBPJZXOFSA-N 2-amino-2-deoxy-D-mannopyranose Chemical compound N[C@@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-CBPJZXOFSA-N 0.000 description 2
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 2
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 2
- 230000005730 ADP ribosylation Effects 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 241000186015 Bifidobacterium longum subsp. infantis Species 0.000 description 2
- 108010013423 CMPacetylneuraminate monooxygenase Proteins 0.000 description 2
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 2
- 241000282828 Camelus bactrianus Species 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 206010008631 Cholera Diseases 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 2
- BGWQRWREUZVRGI-OLLRPPRZSA-N D-glucoheptopyranose Chemical compound OC[C@H](O)[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O BGWQRWREUZVRGI-OLLRPPRZSA-N 0.000 description 2
- RGHNJXZEOKUKBD-SQOUGZDYSA-N D-gluconic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O RGHNJXZEOKUKBD-SQOUGZDYSA-N 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- OAXMVFUPLMUHGJ-JUZXSSEISA-N Difucosyllacto-N-hexaose a Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@@H]1O[C@H]1[C@H](OC2[C@H]([C@H](O[C@H]3[C@H]([C@@H](CO[C@H]4[C@@H]([C@@H](O[C@H]5[C@H]([C@H](O)[C@H](O)[C@H](O)O5)O)[C@H](O[C@@H]5[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O5)O)[C@@H](CO)O4)NC(C)=O)O[C@@H](OC([C@H](O)CO)[C@H](O)[C@@H](O)C=O)[C@@H]3C)O)O[C@H](CO)[C@H]2O)NC(C)=O)O[C@H](CO)[C@H](O)[C@@H]1O OAXMVFUPLMUHGJ-JUZXSSEISA-N 0.000 description 2
- 241000283095 Elephas maximus Species 0.000 description 2
- 241000588921 Enterobacteriaceae Species 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 241001014021 Escherichia coli O55:H7 Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 2
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 108030002652 Glucosamine-1-phosphate N-acetyltransferases Proteins 0.000 description 2
- 102000009127 Glutaminase Human genes 0.000 description 2
- 108010073324 Glutaminase Proteins 0.000 description 2
- 101150075171 Gne gene Proteins 0.000 description 2
- 101000798109 Homo sapiens Melanotransferrin Proteins 0.000 description 2
- 101000967073 Homo sapiens Metal regulatory transcription factor 1 Proteins 0.000 description 2
- 101001030197 Homo sapiens Myelin transcription factor 1 Proteins 0.000 description 2
- 108090000769 Isomerases Proteins 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- 229930195714 L-glutamate Natural products 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 241000481961 Lachancea thermotolerans Species 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 2
- TVVLIFCVJJSLBL-SEHWTJTBSA-N Lacto-N-fucopentaose V Chemical compound O[C@H]1C(O)C(O)[C@H](C)O[C@H]1OC([C@@H](O)C=O)[C@@H](C(O)CO)O[C@H]1[C@H](O)[C@@H](OC2[C@@H](C(OC3[C@@H](C(O)C(O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](O)[C@@H](CO)O1 TVVLIFCVJJSLBL-SEHWTJTBSA-N 0.000 description 2
- 241000270322 Lepidosauria Species 0.000 description 2
- 241000283093 Loxodonta africana Species 0.000 description 2
- 108090000856 Lyases Proteins 0.000 description 2
- 102000004317 Lyases Human genes 0.000 description 2
- 101150068888 MET3 gene Proteins 0.000 description 2
- 241000289584 Macropus rufus Species 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 229930195725 Mannitol Natural products 0.000 description 2
- 241001416166 Mephitis mephitis Species 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- 102100038893 Myelin transcription factor 1 Human genes 0.000 description 2
- 241001232569 Myrmecophaga tridactyla Species 0.000 description 2
- 101710179749 N-acetylmannosamine kinase Proteins 0.000 description 2
- SQVRNKJHWKZAKO-LUWBGTNYSA-N N-acetylneuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-LUWBGTNYSA-N 0.000 description 2
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 2
- 241000289565 Notamacropus eugenii Species 0.000 description 2
- CTQNGGLPUBDAKN-UHFFFAOYSA-N O-Xylene Chemical compound CC1=CC=CC=C1C CTQNGGLPUBDAKN-UHFFFAOYSA-N 0.000 description 2
- 239000005642 Oleic acid Substances 0.000 description 2
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 2
- 241000289371 Ornithorhynchus anatinus Species 0.000 description 2
- 101150012394 PHO5 gene Proteins 0.000 description 2
- 241001520299 Phascolarctos cinereus Species 0.000 description 2
- 241000286209 Phasianidae Species 0.000 description 2
- 241001489192 Pichia kluyveri Species 0.000 description 2
- 101710176049 Probable glutamine-fructose-6-phosphate aminotransferase [isomerizing] Proteins 0.000 description 2
- 241000192142 Proteobacteria Species 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- 101710198235 Putative glutamine-fructose-6-phosphate aminotransferase [isomerizing] Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 101100386089 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MET17 gene Proteins 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- 235000019485 Safflower oil Nutrition 0.000 description 2
- DRUQKRWRXOUEGS-NGERZBJRSA-N Samin Chemical compound C1=C2OCOC2=CC([C@H]2OC[C@H]3[C@@H]2CO[C@@H]3O)=C1 DRUQKRWRXOUEGS-NGERZBJRSA-N 0.000 description 2
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- 241000187392 Streptomyces griseus Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- TVTGZVYLUHVBAJ-UHFFFAOYSA-N UNPD122247 Natural products CC1OC(O)C(N)C(O)C1O TVTGZVYLUHVBAJ-UHFFFAOYSA-N 0.000 description 2
- 241000282454 Ursus arctos Species 0.000 description 2
- 241001147416 Ursus maritimus Species 0.000 description 2
- 241000196831 Ursus thibetanus japonicus Species 0.000 description 2
- 241000607626 Vibrio cholerae Species 0.000 description 2
- 108010046377 Whey Proteins Proteins 0.000 description 2
- 102000007544 Whey Proteins Human genes 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- MUBKMWFYVHYZAI-UHFFFAOYSA-N [Al].[Cu].[Zn] Chemical compound [Al].[Cu].[Zn] MUBKMWFYVHYZAI-UHFFFAOYSA-N 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 238000005273 aeration Methods 0.000 description 2
- 230000009603 aerobic growth Effects 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- QDSLHWJDSQGPEE-WCTZXXKLSA-N aldehydo-N-acetyl-D-mannosamine 6-phosphate Chemical compound CC(=O)N[C@H](C=O)[C@@H](O)[C@H](O)[C@H](O)COP(O)(O)=O QDSLHWJDSQGPEE-WCTZXXKLSA-N 0.000 description 2
- YMJBYRVFGYXULK-QZABAPFNSA-N alpha-D-glucosamine 1-phosphate Chemical compound N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(O)=O YMJBYRVFGYXULK-QZABAPFNSA-N 0.000 description 2
- HXXFSFRBOHSIMQ-VFUOTHLCSA-N alpha-D-glucose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-VFUOTHLCSA-N 0.000 description 2
- FZIVHOUANIQOMU-YIHIYSSUSA-N alpha-L-Fucp-(1->2)-beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)O[C@H](CO)[C@H]2O)NC(C)=O)O[C@H](CO)[C@H](O)[C@@H]1O FZIVHOUANIQOMU-YIHIYSSUSA-N 0.000 description 2
- CMQZRJBJDCVIEY-JEOLMMCMSA-N alpha-L-Fucp-(1->3)-[beta-D-Galp-(1->4)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)O[C@@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO)[C@@H]2O)O)[C@@H]1NC(C)=O CMQZRJBJDCVIEY-JEOLMMCMSA-N 0.000 description 2
- DUKURNFHYQXCJG-JEOLMMCMSA-N alpha-L-Fucp-(1->4)-[beta-D-Galp-(1->3)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO)[C@@H]2O)O)O[C@@H]1CO DUKURNFHYQXCJG-JEOLMMCMSA-N 0.000 description 2
- 230000009604 anaerobic growth Effects 0.000 description 2
- 235000020244 animal milk Nutrition 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 230000004900 autophagic degradation Effects 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- HMQPEDMEOBLSQB-UFLFEMAHSA-N beta-D-Galp-(1->3)-beta-D-GalpNAc Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HMQPEDMEOBLSQB-UFLFEMAHSA-N 0.000 description 2
- UTVHXMGRNOOVTB-IXBJWXGWSA-N beta-D-Galp-(1->4)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)[C@H](NC(C)=O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O UTVHXMGRNOOVTB-IXBJWXGWSA-N 0.000 description 2
- CDOJPCSDOXYJJF-CAQKAZPESA-N beta-D-GalpNAc-(1->4)-D-GlcpNAc Chemical compound O[C@@H]1[C@@H](NC(=O)C)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 CDOJPCSDOXYJJF-CAQKAZPESA-N 0.000 description 2
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 2
- 230000001588 bifunctional effect Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 239000002775 capsule Substances 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 235000008504 concentrate Nutrition 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 239000008406 cosmetic ingredient Substances 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- BCUMESVDMXHZRL-UHFFFAOYSA-N difucosyllacto-n-hexaose i Chemical compound OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(C)=O)C(OC2C(C(OC3C(C(NC(C)=O)C(OC4C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C4O)O)OC3CO)OC3C(C(O)C(O)C(C)O3)O)OC(CO)C2O)O)OC1CO BCUMESVDMXHZRL-UHFFFAOYSA-N 0.000 description 2
- RXKJFZQQPQGTFL-UHFFFAOYSA-N dihydroxyacetone Chemical compound OCC(=O)CO RXKJFZQQPQGTFL-UHFFFAOYSA-N 0.000 description 2
- GNGACRATGGDKBX-UHFFFAOYSA-N dihydroxyacetone phosphate Chemical compound OCC(=O)COP(O)(O)=O GNGACRATGGDKBX-UHFFFAOYSA-N 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000006345 epimerization reaction Methods 0.000 description 2
- 235000013861 fat-free Nutrition 0.000 description 2
- 235000019197 fats Nutrition 0.000 description 2
- 108010081954 galacto-N-biose Proteins 0.000 description 2
- 230000006251 gamma-carboxylation Effects 0.000 description 2
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 229960002442 glucosamine Drugs 0.000 description 2
- XHMJOUIAFHJHBW-VFUOTHLCSA-N glucosamine 6-phosphate Chemical compound N[C@H]1[C@H](O)O[C@H](COP(O)(O)=O)[C@H](O)[C@@H]1O XHMJOUIAFHJHBW-VFUOTHLCSA-N 0.000 description 2
- 108010022717 glucosamine-6-phosphate isomerase Proteins 0.000 description 2
- 229950010772 glucose-1-phosphate Drugs 0.000 description 2
- 229940097042 glucuronate Drugs 0.000 description 2
- 102000005396 glutamine synthetase Human genes 0.000 description 2
- 108020002326 glutamine synthetase Proteins 0.000 description 2
- 150000002402 hexoses Chemical class 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 125000001165 hydrophobic group Chemical group 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000033444 hydroxylation Effects 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 239000002054 inoculum Substances 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 238000006317 isomerization reaction Methods 0.000 description 2
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 2
- 230000006651 lactation Effects 0.000 description 2
- QCQYVCMYGCHVMR-UHFFFAOYSA-N lacto-N-biose I Natural products CC(=O)NC(C=O)C(C(O)C(O)CO)OC1OC(CO)C(O)C(O)C1O QCQYVCMYGCHVMR-UHFFFAOYSA-N 0.000 description 2
- FZIVHOUANIQOMU-UHFFFAOYSA-N lacto-N-fucopentaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(OC3C(C(OC4C(OC(O)C(O)C4O)CO)OC(CO)C3O)O)OC(CO)C2O)NC(C)=O)OC(CO)C(O)C1O FZIVHOUANIQOMU-UHFFFAOYSA-N 0.000 description 2
- FKADDOYBRRMBPP-UHFFFAOYSA-N lacto-N-fucopentaose II Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(C)=O)C(OC2C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C2O)O)OC1CO FKADDOYBRRMBPP-UHFFFAOYSA-N 0.000 description 2
- CMQZRJBJDCVIEY-UHFFFAOYSA-N lacto-N-fucopentaose III Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(CO)OC(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)C1NC(C)=O CMQZRJBJDCVIEY-UHFFFAOYSA-N 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 210000005075 mammary gland Anatomy 0.000 description 2
- 239000000594 mannitol Substances 0.000 description 2
- 235000010355 mannitol Nutrition 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 239000006151 minimal media Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- BXYCQGWJGKAYEA-HAESSKSKSA-N n-[(3r,4r,5r,6r)-4,5-dihydroxy-6-(hydroxymethyl)-2-[(2r,3s,4r,5r)-2,3,4,5,6-pentahydroxyhexanoyl]oxan-3-yl]acetamide Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)OC1C(=O)[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO BXYCQGWJGKAYEA-HAESSKSKSA-N 0.000 description 2
- 238000001668 nucleic acid synthesis Methods 0.000 description 2
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 238000002888 pairwise sequence alignment Methods 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 239000000825 pharmaceutical preparation Substances 0.000 description 2
- 229940127557 pharmaceutical product Drugs 0.000 description 2
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- NTBYIQWZAVDRHA-ARQDHWQXSA-N pneumosamine Chemical compound C[C@@H](O)[C@H](O)[C@H](O)[C@H](N)C=O NTBYIQWZAVDRHA-ARQDHWQXSA-N 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 239000006041 probiotic Substances 0.000 description 2
- 230000000529 probiotic effect Effects 0.000 description 2
- 235000018291 probiotics Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000006722 reduction reaction Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000012465 retentate Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000003813 safflower oil Substances 0.000 description 2
- 235000005713 safflower oil Nutrition 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000006152 selective media Substances 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 125000005630 sialyl group Chemical group 0.000 description 2
- SXMGGNXBTZBGLU-UHFFFAOYSA-N sialyllacto-n-tetraose c Chemical compound OCC1OC(OC2C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C2O)O)C(NC(=O)C)C(O)C1OC(C(C(O)C1O)O)OC1COC1(C(O)=O)CC(O)C(NC(C)=O)C(C(O)C(O)CO)O1 SXMGGNXBTZBGLU-UHFFFAOYSA-N 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 239000000600 sorbitol Substances 0.000 description 2
- 238000004611 spectroscopical analysis Methods 0.000 description 2
- 239000012607 strong cation exchange resin Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 229940118696 vibrio cholerae Drugs 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 239000003643 water by type Substances 0.000 description 2
- 235000021119 whey protein Nutrition 0.000 description 2
- 238000004736 wide-angle X-ray diffraction Methods 0.000 description 2
- 239000008096 xylene Substances 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-SVZMEOIVSA-N (+)-Galactose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-SVZMEOIVSA-N 0.000 description 1
- YGOAYNVRTAEAAI-GKZUZGRISA-N (2R)-2-[(3R,4R,5S,6R)-2-acetyl-3-amino-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxypropanoic acid Chemical compound C(C)(=O)C1(O)[C@H](N)[C@@H](O[C@@H](C(=O)O)C)[C@H](O)[C@H](O1)CO YGOAYNVRTAEAAI-GKZUZGRISA-N 0.000 description 1
- AEMOLEFTQBMNLQ-GPGIQTIDSA-N (2R,3S,4S,5S)-3,4,5,6-Tetrahydroxyoxane-2-carboxylic acid Chemical compound OC1O[C@@H](C(O)=O)[C@@H](O)[C@H](O)[C@@H]1O AEMOLEFTQBMNLQ-GPGIQTIDSA-N 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- NTBYIQWZAVDRHA-JGWLITMVSA-N (2r,3r,4r,5r)-2-amino-3,4,5-trihydroxyhexanal Chemical compound C[C@@H](O)[C@@H](O)[C@H](O)[C@@H](N)C=O NTBYIQWZAVDRHA-JGWLITMVSA-N 0.000 description 1
- MPQBLCRFUYGBHE-XZBKPIIZSA-N (2r,3s,4r,5r)-2,4,5-trihydroxy-3-methoxyhexanal Chemical compound O=C[C@H](O)[C@@H](OC)[C@H](O)[C@@H](C)O MPQBLCRFUYGBHE-XZBKPIIZSA-N 0.000 description 1
- PNIWLNAGKUGXDO-LNCRCTFVSA-N (2s,3r,4s,5r,6r)-2-[(2r,3s,4r,5r)-5-amino-4,6-dihydroxy-2-(hydroxymethyl)oxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical group O[C@@H]1[C@@H](N)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 PNIWLNAGKUGXDO-LNCRCTFVSA-N 0.000 description 1
- SPFMQWBKVUQXJV-QGROCUHESA-N (2s,3r,4s,5s)-2,3,4,5,6-pentahydroxyhexanal;hydrate Chemical compound O.OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)C=O SPFMQWBKVUQXJV-QGROCUHESA-N 0.000 description 1
- OSNSWKAZFASRNG-WNFIKIDCSA-N (2s,3r,4s,5s,6r)-6-(hydroxymethyl)oxane-2,3,4,5-tetrol;hydrate Chemical compound O.OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@@H]1O OSNSWKAZFASRNG-WNFIKIDCSA-N 0.000 description 1
- MPQBLCRFUYGBHE-DBRKOABJSA-N (2s,3s,4r,5r)-2,4,5-trihydroxy-3-methoxyhexanal Chemical compound O=C[C@@H](O)[C@@H](OC)[C@H](O)[C@@H](C)O MPQBLCRFUYGBHE-DBRKOABJSA-N 0.000 description 1
- NTBYIQWZAVDRHA-KCDKBNATSA-N (2s,3s,4r,5s)-2-amino-3,4,5-trihydroxyhexanal Chemical compound C[C@H](O)[C@@H](O)[C@@H](O)[C@H](N)C=O NTBYIQWZAVDRHA-KCDKBNATSA-N 0.000 description 1
- FMAORJIQYMIRHF-HERZVMAMSA-N (3R,4R)-Oxolane-2,3,4-triol Chemical compound O[C@@H]1COC(O)[C@@H]1O FMAORJIQYMIRHF-HERZVMAMSA-N 0.000 description 1
- FMAORJIQYMIRHF-BCDHYOAOSA-N (3S,4R)-Oxolane-2,3,4-triol Chemical compound O[C@@H]1COC(O)[C@H]1O FMAORJIQYMIRHF-BCDHYOAOSA-N 0.000 description 1
- SHZGCJCMOBCMKK-CBPJZXOFSA-N (3r,4r,5r,6r)-6-methyloxane-2,3,4,5-tetrol Chemical compound C[C@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-CBPJZXOFSA-N 0.000 description 1
- VRYALKFFQXWPIH-PBXRRBTRSA-N (3r,4s,5r)-3,4,5,6-tetrahydroxyhexanal Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)CC=O VRYALKFFQXWPIH-PBXRRBTRSA-N 0.000 description 1
- MSWZFWKMSRAUBD-QTVWNMPRSA-N (3r,4s,5r,6r)-3-amino-6-(hydroxymethyl)oxane-2,4,5-triol Chemical compound N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@H]1O MSWZFWKMSRAUBD-QTVWNMPRSA-N 0.000 description 1
- LEJHBBPEPOZERQ-RSVSWTKNSA-N (3r,4s,5s,6r)-3,5-diamino-6-methyloxane-2,4-diol Chemical compound C[C@H]1OC(O)[C@H](N)[C@@H](O)[C@@H]1N LEJHBBPEPOZERQ-RSVSWTKNSA-N 0.000 description 1
- MSWZFWKMSRAUBD-RSVSWTKNSA-N (3r,4s,5s,6r)-3-amino-6-(hydroxymethyl)oxane-2,4,5-triol Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@H]1O MSWZFWKMSRAUBD-RSVSWTKNSA-N 0.000 description 1
- SHZGCJCMOBCMKK-GASJEMHNSA-N (3r,4s,5s,6r)-6-methyloxane-2,3,4,5-tetrol Chemical compound C[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O SHZGCJCMOBCMKK-GASJEMHNSA-N 0.000 description 1
- KYPWIZMAJMNPMJ-JDJSBBGDSA-N (3r,5r,6r)-6-methyloxane-2,3,5-triol Chemical compound C[C@H]1OC(O)[C@H](O)C[C@H]1O KYPWIZMAJMNPMJ-JDJSBBGDSA-N 0.000 description 1
- KYPWIZMAJMNPMJ-IANNHFEVSA-N (3r,5s,6r)-6-methyloxane-2,3,5-triol Chemical compound C[C@H]1OC(O)[C@H](O)C[C@@H]1O KYPWIZMAJMNPMJ-IANNHFEVSA-N 0.000 description 1
- JYAQWANEOPJVEY-QYNIQEEDSA-N (3s,4r,5r)-3,4,5-trihydroxy-3-methylhexanal Chemical compound C[C@@H](O)[C@@H](O)[C@@](C)(O)CC=O JYAQWANEOPJVEY-QYNIQEEDSA-N 0.000 description 1
- SHZGCJCMOBCMKK-WHZQZERISA-N (3s,4s,5r,6r)-6-methyloxane-2,3,4,5-tetrol Chemical compound C[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@H]1O SHZGCJCMOBCMKK-WHZQZERISA-N 0.000 description 1
- KYPWIZMAJMNPMJ-OEXCPVAWSA-N (3s,5s,6r)-6-methyloxane-2,3,5-triol Chemical compound C[C@H]1OC(O)[C@@H](O)C[C@@H]1O KYPWIZMAJMNPMJ-OEXCPVAWSA-N 0.000 description 1
- NNLZBVFSCVTSLA-XMABDTGBSA-N (4r,5r,6r)-6-[(1r)-1,2-dihydroxyethyl]-2,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound OC[C@@H](O)[C@H]1OC(O)(C(O)=O)C[C@@H](O)[C@H]1O NNLZBVFSCVTSLA-XMABDTGBSA-N 0.000 description 1
- FDWRIIDFYSUTDP-WGDKFINWSA-N (4s,5s,6r)-6-methyloxane-2,4,5-triol Chemical compound C[C@H]1OC(O)C[C@H](O)[C@@H]1O FDWRIIDFYSUTDP-WGDKFINWSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- FDWRIIDFYSUTDP-UHFFFAOYSA-N 102850-49-7 Natural products CC1OC(O)CC(O)C1O FDWRIIDFYSUTDP-UHFFFAOYSA-N 0.000 description 1
- MSFSPUZXLOGKHJ-PGYHGBPZSA-N 2-amino-3-O-[(R)-1-carboxyethyl]-2-deoxy-D-glucopyranose Chemical compound OC(=O)[C@@H](C)O[C@@H]1[C@@H](N)C(O)O[C@H](CO)[C@H]1O MSFSPUZXLOGKHJ-PGYHGBPZSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- ODDPRQJTYDIWJU-UHFFFAOYSA-N 3'-beta-D-galactopyranosyl-lactose Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(OC2C(OC(O)C(O)C2O)CO)OC(CO)C1O ODDPRQJTYDIWJU-UHFFFAOYSA-N 0.000 description 1
- DBTMGCOVALSLOR-UHFFFAOYSA-N 32-alpha-galactosyl-3-alpha-galactosyl-galactose Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(OC2C(C(CO)OC(O)C2O)O)OC(CO)C1O DBTMGCOVALSLOR-UHFFFAOYSA-N 0.000 description 1
- LMIZXKMXHCOVTQ-SUVUXTLLSA-N 4-acetamido-4,6-dideoxy-D-galactose Chemical compound C[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1NC(C)=O LMIZXKMXHCOVTQ-SUVUXTLLSA-N 0.000 description 1
- CZRCFAOMWRAFIC-UHFFFAOYSA-N 5-(tetradecyloxy)-2-furoic acid Chemical compound CCCCCCCCCCCCCCOC1=CC=C(C(O)=O)O1 CZRCFAOMWRAFIC-UHFFFAOYSA-N 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- 102100038222 60 kDa heat shock protein, mitochondrial Human genes 0.000 description 1
- 244000215068 Acacia senegal Species 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- 241000588626 Acinetobacter baumannii Species 0.000 description 1
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 1
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 1
- 241000272517 Anseriformes Species 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 241000269350 Anura Species 0.000 description 1
- 101100001956 Arabidopsis thaliana APTG1 gene Proteins 0.000 description 1
- 101100393868 Arabidopsis thaliana GT11 gene Proteins 0.000 description 1
- 101100393871 Arabidopsis thaliana GT12 gene Proteins 0.000 description 1
- 101100393877 Arabidopsis thaliana GT14 gene Proteins 0.000 description 1
- 101100134896 Arabidopsis thaliana OFUT14 gene Proteins 0.000 description 1
- 101100134902 Arabidopsis thaliana OFUT23 gene Proteins 0.000 description 1
- 101100406353 Arabidopsis thaliana OFUT36 gene Proteins 0.000 description 1
- 101100350231 Arabidopsis thaliana OFUT5 gene Proteins 0.000 description 1
- 241000180579 Arca Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000235349 Ascomycota Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241000193833 Bacillales Species 0.000 description 1
- 241000304886 Bacilli Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 101100434663 Bacillus subtilis (strain 168) fbaA gene Proteins 0.000 description 1
- 241000221198 Basidiomycota Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000186000 Bifidobacterium Species 0.000 description 1
- 241000237519 Bivalvia Species 0.000 description 1
- 101150085381 CDC19 gene Proteins 0.000 description 1
- 101150003194 CPR6 gene Proteins 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 101150025634 CTT1 gene Proteins 0.000 description 1
- 101100480861 Caldanaerobacter subterraneus subsp. tengcongensis (strain DSM 15242 / JCM 11007 / NBRC 100824 / MB4) tdh gene Proteins 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 101100351264 Candida albicans (strain SC5314 / ATCC MYA-2876) PDC11 gene Proteins 0.000 description 1
- 101100083070 Candida albicans (strain SC5314 / ATCC MYA-2876) PGA6 gene Proteins 0.000 description 1
- 101100447466 Candida albicans (strain WO-1) TDH1 gene Proteins 0.000 description 1
- 101150107838 Capg gene Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000283705 Capra hircus Species 0.000 description 1
- 108010058432 Chaperonin 60 Proteins 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000186031 Corynebacteriaceae Species 0.000 description 1
- 241001517048 Corynebacterium afermentans Species 0.000 description 1
- 241000186226 Corynebacterium glutamicum Species 0.000 description 1
- 241000270722 Crocodylidae Species 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 241001530054 Cystophora cristata Species 0.000 description 1
- AEMOLEFTQBMNLQ-PKKLWIBTSA-N D-Alluronic Acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@@H](O)[C@H]1O AEMOLEFTQBMNLQ-PKKLWIBTSA-N 0.000 description 1
- TVTGZVYLUHVBAJ-GASJEMHNSA-N D-Fucosamine Chemical compound C[C@H]1OC(O)[C@H](N)[C@@H](O)[C@H]1O TVTGZVYLUHVBAJ-GASJEMHNSA-N 0.000 description 1
- WQZGKKKJIJFFOK-CBPJZXOFSA-N D-Gulose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O WQZGKKKJIJFFOK-CBPJZXOFSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-BZINKQHNSA-N D-Guluronic Acid Chemical compound OC1O[C@H](C(O)=O)[C@H](O)[C@@H](O)[C@H]1O AEMOLEFTQBMNLQ-BZINKQHNSA-N 0.000 description 1
- NBSCHQHZLSJFNQ-QTVWNMPRSA-N D-Mannose-6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@@H]1O NBSCHQHZLSJFNQ-QTVWNMPRSA-N 0.000 description 1
- WQZGKKKJIJFFOK-IVMDWMLBSA-N D-allopyranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@H](O)[C@@H]1O WQZGKKKJIJFFOK-IVMDWMLBSA-N 0.000 description 1
- HEBKCHPVOIAQTA-QWWZWVQMSA-N D-arabinitol Chemical compound OC[C@@H](O)C(O)[C@H](O)CO HEBKCHPVOIAQTA-QWWZWVQMSA-N 0.000 description 1
- HMFHBZSHGGEWLO-ZRMNMSDTSA-N D-arabinofuranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H]1O HMFHBZSHGGEWLO-ZRMNMSDTSA-N 0.000 description 1
- SRBFZHDQGSBBOR-ZRMNMSDTSA-N D-arabinopyranose Chemical compound O[C@@H]1COC(O)[C@@H](O)[C@@H]1O SRBFZHDQGSBBOR-ZRMNMSDTSA-N 0.000 description 1
- XPYBSIWDXQFNMH-UHFFFAOYSA-N D-fructose 1,6-bisphosphate Natural products OP(=O)(O)OCC(O)C(O)C(O)C(=O)COP(O)(O)=O XPYBSIWDXQFNMH-UHFFFAOYSA-N 0.000 description 1
- SHZGCJCMOBCMKK-SVZMEOIVSA-N D-fucopyranose Chemical compound C[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O SHZGCJCMOBCMKK-SVZMEOIVSA-N 0.000 description 1
- AVVWPBAENSWJCB-RSVSWTKNSA-N D-galactofuranose Chemical compound OC[C@@H](O)[C@@H]1OC(O)[C@H](O)[C@H]1O AVVWPBAENSWJCB-RSVSWTKNSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-YMDCURPLSA-N D-galactopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-YMDCURPLSA-N 0.000 description 1
- RGHNJXZEOKUKBD-UHFFFAOYSA-N D-gluconic acid Natural products OCC(O)C(O)C(O)C(O)C(O)=O RGHNJXZEOKUKBD-UHFFFAOYSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 1
- SRBFZHDQGSBBOR-AGQMPKSLSA-N D-lyxopyranose Chemical compound O[C@@H]1COC(O)[C@@H](O)[C@H]1O SRBFZHDQGSBBOR-AGQMPKSLSA-N 0.000 description 1
- RXVWSYJTUUKTEA-UHFFFAOYSA-N D-maltotriose Natural products OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1OC1C(O)C(O)C(O)C(CO)O1 RXVWSYJTUUKTEA-UHFFFAOYSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-VANFPWTGSA-N D-mannopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@@H]1O AEMOLEFTQBMNLQ-VANFPWTGSA-N 0.000 description 1
- FDWRIIDFYSUTDP-DUVQVXGLSA-N D-olivose Chemical compound C[C@H]1OC(O)C[C@@H](O)[C@@H]1O FDWRIIDFYSUTDP-DUVQVXGLSA-N 0.000 description 1
- SHZGCJCMOBCMKK-QTVWNMPRSA-N D-rhamnopyranose Chemical compound C[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O SHZGCJCMOBCMKK-QTVWNMPRSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- SRBFZHDQGSBBOR-SOOFDHNKSA-N D-ribopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@@H]1O SRBFZHDQGSBBOR-SOOFDHNKSA-N 0.000 description 1
- LKDRXBCSQODPBY-OEXCPVAWSA-N D-tagatose Chemical compound OCC1(O)OC[C@@H](O)[C@H](O)[C@@H]1O LKDRXBCSQODPBY-OEXCPVAWSA-N 0.000 description 1
- 229920002271 DEAE-Sepharose Polymers 0.000 description 1
- 241000289338 Dasyurus viverrinus Species 0.000 description 1
- 241000192095 Deinococcus-Thermus Species 0.000 description 1
- 241000723298 Dicentrarchus labrax Species 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 102100026620 E3 ubiquitin ligase TRAF3IP2 Human genes 0.000 description 1
- 101710140859 E3 ubiquitin ligase TRAF3IP2 Proteins 0.000 description 1
- 102100023431 E3 ubiquitin-protein ligase TRIM21 Human genes 0.000 description 1
- 239000004267 EU approved acidity regulator Substances 0.000 description 1
- 241000257465 Echinoidea Species 0.000 description 1
- 239000004386 Erythritol Substances 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- 101100082611 Escherichia coli (strain K12) pdeF gene Proteins 0.000 description 1
- 101100137785 Escherichia coli (strain K12) proX gene Proteins 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241000644323 Escherichia coli C Species 0.000 description 1
- 241001646719 Escherichia coli O157:H7 Species 0.000 description 1
- 241001621104 Escherichia coli O6 Species 0.000 description 1
- 241000901842 Escherichia coli W Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 101150095274 FBA1 gene Proteins 0.000 description 1
- 238000012366 Fed-batch cultivation Methods 0.000 description 1
- 108010040721 Flagellin Proteins 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 101150082479 GAL gene Proteins 0.000 description 1
- PNHLMHWWFOPQLK-BKUUWRAGSA-N GDP-4-dehydro-6-deoxy-alpha-D-mannose Chemical compound O[C@H]1[C@@H](O)C(=O)[C@@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C3=C(C(NC(N)=N3)=O)N=C2)O1 PNHLMHWWFOPQLK-BKUUWRAGSA-N 0.000 description 1
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 101710087553 Glucosamine-6-phosphate isomerase 1 Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 102100033429 Glutamine-fructose-6-phosphate aminotransferase [isomerizing] 1 Human genes 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 229920000084 Gum arabic Polymers 0.000 description 1
- 101150068227 HSP104 gene Proteins 0.000 description 1
- 101150007068 HSP81-1 gene Proteins 0.000 description 1
- 101150087422 HSP82 gene Proteins 0.000 description 1
- 244000286779 Hansenula anomala Species 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 1
- 238000011993 High Performance Size Exclusion Chromatography Methods 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000685877 Homo sapiens E3 ubiquitin-protein ligase TRIM21 Proteins 0.000 description 1
- 101001045848 Homo sapiens Histone-lysine N-methyltransferase 2B Proteins 0.000 description 1
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 1
- 101001120260 Homo sapiens Polyadenylate-binding protein 1 Proteins 0.000 description 1
- 101000801742 Homo sapiens Triosephosphate isomerase Proteins 0.000 description 1
- 101150050258 Hsp26 gene Proteins 0.000 description 1
- 101150028525 Hsp83 gene Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229920001202 Inulin Polymers 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 208000007976 Ketosis Diseases 0.000 description 1
- 241000798864 Kluyveromyces lactis NRRL Y-1140 Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- LKDRXBCSQODPBY-AMVSKUEXSA-N L-(-)-Sorbose Chemical compound OCC1(O)OC[C@H](O)[C@@H](O)[C@@H]1O LKDRXBCSQODPBY-AMVSKUEXSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-DOTFUZMJSA-N L-Alturonic Acid Chemical compound OC1O[C@@H](C(O)=O)[C@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-DOTFUZMJSA-N 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VSOAQEOCSA-N L-altropyranose Chemical compound OC[C@@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-VSOAQEOCSA-N 0.000 description 1
- HMFHBZSHGGEWLO-HWQSCIPKSA-N L-arabinofuranose Chemical compound OC[C@@H]1OC(O)[C@H](O)[C@H]1O HMFHBZSHGGEWLO-HWQSCIPKSA-N 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- WQZGKKKJIJFFOK-DHVFOXMCSA-N L-galactose Chemical compound OC[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O WQZGKKKJIJFFOK-DHVFOXMCSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- WQZGKKKJIJFFOK-ZNVMLXAYSA-N L-idopyranose Chemical compound OC[C@@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-ZNVMLXAYSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-HNFCZKTMSA-N L-idopyranuronic acid Chemical compound OC1O[C@@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-HNFCZKTMSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 240000001046 Lactobacillus acidophilus Species 0.000 description 1
- 244000199885 Lactobacillus bulgaricus Species 0.000 description 1
- 241001147746 Lactobacillus delbrueckii subsp. lactis Species 0.000 description 1
- 101001010029 Lactobacillus helveticus Putative phosphotransferase enzyme IIA component Proteins 0.000 description 1
- BRHHWBDLMUBZQQ-JZEMXWCPSA-N Lactodifucotetraose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@@H]([C@H](O)[C@H](O)CO)[C@H](C=O)O[C@@H]1[C@H](O[C@H]2[C@H]([C@H](O)[C@H](O)[C@H](C)O2)O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 BRHHWBDLMUBZQQ-JZEMXWCPSA-N 0.000 description 1
- LKOHREGGXUJGKC-UHFFFAOYSA-N Lactodifucotetraose Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)OC2CO)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O LKOHREGGXUJGKC-UHFFFAOYSA-N 0.000 description 1
- PNIWLNAGKUGXDO-UHFFFAOYSA-N Lactosamine Natural products OC1C(N)C(O)OC(CO)C1OC1C(O)C(O)C(O)C(CO)O1 PNIWLNAGKUGXDO-UHFFFAOYSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000192130 Leuconostoc mesenteroides Species 0.000 description 1
- 241000283092 Loxodonta Species 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 102100024295 Maltase-glucoamylase Human genes 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- GKEWHGPIQCSUCC-JJGOEJEFSA-N Monofucosyllacto-N-hexaose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)C[C@@H](OO[C@@H]2[C@@H]([C@H](O[C@H]3[C@@H](C(O[C@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)NC(C)=O)[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O2)O)[C@@H]1NC(C)=O GKEWHGPIQCSUCC-JJGOEJEFSA-N 0.000 description 1
- 108010047290 Multifunctional Enzymes Proteins 0.000 description 1
- 102000006833 Multifunctional Enzymes Human genes 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 241000237536 Mytilus edulis Species 0.000 description 1
- XOCCAGJZGBCJME-QALBOBFASA-N N-Acetyl-6-deoxy-L-altrosamine Chemical compound C[C@@H]1OC(O)[C@H](NC(C)=O)[C@@H](O)[C@H]1O XOCCAGJZGBCJME-QALBOBFASA-N 0.000 description 1
- OVRNDRQMDRJTHS-WZPXOXCRSA-N N-Acetyl-D-Gulosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@H]1O OVRNDRQMDRJTHS-WZPXOXCRSA-N 0.000 description 1
- OVRNDRQMDRJTHS-XLSKCSLXSA-N N-Acetyl-D-Talosamine Chemical compound CC(=O)N[C@@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-XLSKCSLXSA-N 0.000 description 1
- XOCCAGJZGBCJME-VAYLDTTESA-N N-Acetyl-L-Fucosamine Chemical compound C[C@@H]1OC(O)[C@@H](NC(C)=O)[C@H](O)[C@@H]1O XOCCAGJZGBCJME-VAYLDTTESA-N 0.000 description 1
- OVRNDRQMDRJTHS-IQMFPIFPSA-N N-Acetyl-L-Idosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-IQMFPIFPSA-N 0.000 description 1
- BRGMHAYQAZFZDJ-ZTVVOAFPSA-N N-acetyl-D-mannosamine 6-phosphate Chemical compound CC(=O)N[C@@H]1C(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BRGMHAYQAZFZDJ-ZTVVOAFPSA-N 0.000 description 1
- MNLRQHMNZILYPY-MKFCKLDKSA-N N-acetyl-D-muramic acid Chemical compound OC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)OC(O)[C@@H]1NC(C)=O MNLRQHMNZILYPY-MKFCKLDKSA-N 0.000 description 1
- XOCCAGJZGBCJME-ZQLGFOCFSA-N N-acetyl-D-quinovosamine Chemical compound C[C@H]1OC(O)[C@H](NC(C)=O)[C@@H](O)[C@@H]1O XOCCAGJZGBCJME-ZQLGFOCFSA-N 0.000 description 1
- FZLJPEPAYPUMMR-FMDGEEDCSA-N N-acetyl-alpha-D-glucosamine 1-phosphate Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(O)=O FZLJPEPAYPUMMR-FMDGEEDCSA-N 0.000 description 1
- 102100033341 N-acetylmannosamine kinase Human genes 0.000 description 1
- SQMNIXJSBCSNCI-LUWBGTNYSA-N N-acetylneuraminic acid 9-phosphate Chemical compound CC(=O)N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)COP(O)(O)=O SQMNIXJSBCSNCI-LUWBGTNYSA-N 0.000 description 1
- 108010089489 N-acylneuraminate-9-phosphatase Proteins 0.000 description 1
- 102100023906 N-acylneuraminate-9-phosphatase Human genes 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 206010051606 Necrotising colitis Diseases 0.000 description 1
- 241000588677 Neisseria meningitidis serogroup B Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 101100234604 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) ace-8 gene Proteins 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 101100176068 Oryza sativa subsp. japonica GLUA3 gene Proteins 0.000 description 1
- 241000237502 Ostreidae Species 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 101150050255 PDC1 gene Proteins 0.000 description 1
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 description 1
- 101150093629 PYK1 gene Proteins 0.000 description 1
- 241000632869 Pachira glabra Species 0.000 description 1
- 235000019482 Palm oil Nutrition 0.000 description 1
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 241001517016 Photobacterium damselae Species 0.000 description 1
- 241000607606 Photobacterium sp. Species 0.000 description 1
- 241000270285 Pituophis Species 0.000 description 1
- 241000607000 Plesiomonas Species 0.000 description 1
- 241000606999 Plesiomonas shigelloides Species 0.000 description 1
- 101100015393 Plesiomonas shigelloides wbgU gene Proteins 0.000 description 1
- 102100026090 Polyadenylate-binding protein 1 Human genes 0.000 description 1
- 108010093965 Polymyxin B Proteins 0.000 description 1
- 101710178100 Probable UDP-N-acetylglucosamine 2-epimerase Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 101710086464 Putative UDP-N-acetylglucosamine 2-epimerase Proteins 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 235000019484 Rapeseed oil Nutrition 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- JVWLUVNSQYXYBE-UHFFFAOYSA-N Ribitol Natural products OCC(C)C(O)C(O)CO JVWLUVNSQYXYBE-UHFFFAOYSA-N 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 108020004422 Riboswitch Proteins 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 1
- 241000235072 Saccharomyces bayanus Species 0.000 description 1
- 101100166584 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CCW12 gene Proteins 0.000 description 1
- 101100330447 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DAN1 gene Proteins 0.000 description 1
- 101100451671 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SSA3 gene Proteins 0.000 description 1
- 101100451681 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SSA4 gene Proteins 0.000 description 1
- 101100344462 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YDJ1 gene Proteins 0.000 description 1
- 244000253911 Saccharomyces fragilis Species 0.000 description 1
- 241001138501 Salmonella enterica Species 0.000 description 1
- 241000277331 Salmonidae Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 101710150619 Sialic acid TRAP transporter permease protein SiaT Proteins 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 1
- 241001149962 Sporothrix Species 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000187438 Streptomyces fradiae Species 0.000 description 1
- 241000204060 Streptomycetaceae Species 0.000 description 1
- 241000271567 Struthioniformes Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 235000019486 Sunflower oil Nutrition 0.000 description 1
- 101150001810 TEAD1 gene Proteins 0.000 description 1
- 101150074253 TEF1 gene Proteins 0.000 description 1
- 241000270666 Testudines Species 0.000 description 1
- 102100034795 Thioredoxin, mitochondrial Human genes 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 244000288561 Torulaspora delbrueckii Species 0.000 description 1
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 241000255985 Trichoplusia Species 0.000 description 1
- 241000289672 Trichosurus vulpecula Species 0.000 description 1
- 102100033598 Triosephosphate isomerase Human genes 0.000 description 1
- 241000283293 Tursiops Species 0.000 description 1
- 241000283311 Tursiops truncatus Species 0.000 description 1
- INJACODUUNZJCO-GOGQOHCTSA-N UDP-2-acetamido-2,6-dideoxy-beta-L-talose Chemical compound CC(=O)N[C@@H]1[C@H](O)[C@H](O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 INJACODUUNZJCO-GOGQOHCTSA-N 0.000 description 1
- BEGZZYPUNCJHKP-DBYWSUQTSA-N UDP-N-acetyl-3-O-(1-carboxyvinyl)-alpha-D-glucosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](OC(=C)C(O)=O)[C@@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 BEGZZYPUNCJHKP-DBYWSUQTSA-N 0.000 description 1
- 108010070691 UDP-N-acetylglucosamine 4-epimerase Proteins 0.000 description 1
- CYKLRRKFBPBYEI-NQQHDEILSA-N UDP-alpha-D-glucosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](O)[C@@H](N)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 CYKLRRKFBPBYEI-NQQHDEILSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 101100440252 Xenopus laevis ncapg gene Proteins 0.000 description 1
- 241000269959 Xiphias gladius Species 0.000 description 1
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 1
- 108050001741 Xylosyltransferases Proteins 0.000 description 1
- 241000607447 Yersinia enterocolitica Species 0.000 description 1
- YMJBYRVFGYXULK-IVMDWMLBSA-N [(3r,4r,5s,6r)-3-amino-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl] dihydrogen phosphate Chemical compound N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)OC1OP(O)(O)=O YMJBYRVFGYXULK-IVMDWMLBSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000000205 acacia gum Substances 0.000 description 1
- 235000010489 acacia gum Nutrition 0.000 description 1
- KBGAYAKRZNYFFG-BOHATCBPSA-N aceneuramic acid Chemical compound OC(=O)C(=O)C[C@H](O)[C@@H](NC(=O)C)[C@@H](O)[C@H](O)[C@H](O)CO KBGAYAKRZNYFFG-BOHATCBPSA-N 0.000 description 1
- 229960000583 acetic acid Drugs 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 238000005903 acid hydrolysis reaction Methods 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 229960001570 ademetionine Drugs 0.000 description 1
- 239000003463 adsorbent Substances 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 101150024831 ahpC gene Proteins 0.000 description 1
- 101150061301 ahpF gene Proteins 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- PMMURAAUARKVCB-UHFFFAOYSA-N alpha-D-ara-dHexp Natural products OCC1OC(O)CC(O)C1O PMMURAAUARKVCB-UHFFFAOYSA-N 0.000 description 1
- RNBGYGVWRKECFJ-ZXXMMSQZSA-N alpha-D-fructofuranose 1,6-bisphosphate Chemical compound O[C@H]1[C@H](O)[C@](O)(COP(O)(O)=O)O[C@@H]1COP(O)(O)=O RNBGYGVWRKECFJ-ZXXMMSQZSA-N 0.000 description 1
- HXXFSFRBOHSIMQ-FPRJBGLDSA-N alpha-D-galactose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H](O)[C@H]1O HXXFSFRBOHSIMQ-FPRJBGLDSA-N 0.000 description 1
- WQZGKKKJIJFFOK-UHFFFAOYSA-N alpha-D-glucopyranose Natural products OCC1OC(O)C(O)C(O)C1O WQZGKKKJIJFFOK-UHFFFAOYSA-N 0.000 description 1
- HXXFSFRBOHSIMQ-RWOPYEJCSA-L alpha-D-mannose 1-phosphate(2-) Chemical compound OC[C@H]1O[C@H](OP([O-])([O-])=O)[C@@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-RWOPYEJCSA-L 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- IEIKZYHDKYKRAL-APCLMFJUSA-N alpha-L-Fucp-(1->3)-[beta-D-Galp-(1->4)]-beta-D-GlcpNAc-(1->6)-[beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)]-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)O[C@@H](OC[C@@H]2[C@@H]([C@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)NC(C)=O)[C@@H](O)[C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O2)O)[C@@H]1NC(C)=O IEIKZYHDKYKRAL-APCLMFJUSA-N 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 230000010516 arginylation Effects 0.000 description 1
- KYPWIZMAJMNPMJ-JMSAOHGTSA-N ascarylopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)C[C@H]1O KYPWIZMAJMNPMJ-JMSAOHGTSA-N 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 235000008452 baby food Nutrition 0.000 description 1
- HMQPEDMEOBLSQB-RPHKZZMBSA-N beta-D-Galp-(1->3)-D-GlcpNAc Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HMQPEDMEOBLSQB-RPHKZZMBSA-N 0.000 description 1
- ODDPRQJTYDIWJU-OAUIKNEUSA-N beta-D-Galp-(1->3)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@H](O[C@@H](O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O ODDPRQJTYDIWJU-OAUIKNEUSA-N 0.000 description 1
- KFEUJDWYNGMDBV-RPHKZZMBSA-N beta-D-Galp-(1->4)-D-GlcpNAc Chemical compound O[C@@H]1[C@@H](NC(=O)C)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 KFEUJDWYNGMDBV-RPHKZZMBSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-UHFFFAOYSA-N beta-D-galactopyranuronic acid Natural products OC1OC(C(O)=O)C(O)C(O)C1O AEMOLEFTQBMNLQ-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- NBSCHQHZLSJFNQ-VFUOTHLCSA-N beta-D-glucose 6-phosphate Chemical compound O[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@H]1O NBSCHQHZLSJFNQ-VFUOTHLCSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- QHXLIQMGIGEHJP-UHFFFAOYSA-N boron;2-methylpyridine Chemical compound [B].CC1=CC=CC=N1 QHXLIQMGIGEHJP-UHFFFAOYSA-N 0.000 description 1
- FNAQSUUGMSOBHW-UHFFFAOYSA-H calcium citrate Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O.[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O FNAQSUUGMSOBHW-UHFFFAOYSA-H 0.000 description 1
- 239000001354 calcium citrate Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- 150000001719 carbohydrate derivatives Chemical class 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 235000006214 castanha do maranho Nutrition 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 241001233037 catfish Species 0.000 description 1
- 238000005341 cation exchange Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 230000007073 chemical hydrolysis Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 239000012501 chromatography medium Substances 0.000 description 1
- 235000020639 clam Nutrition 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 239000003240 coconut oil Substances 0.000 description 1
- 235000019864 coconut oil Nutrition 0.000 description 1
- 210000003022 colostrum Anatomy 0.000 description 1
- 235000021277 colostrum Nutrition 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- CLRLHXKNIYJWAW-QBTAGHCHSA-N deaminoneuraminic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@@H]1OC(O)(C(O)=O)C[C@H](O)[C@H]1O CLRLHXKNIYJWAW-QBTAGHCHSA-N 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 238000006356 dehydrogenation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011026 diafiltration Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 229940120503 dihydroxyacetone Drugs 0.000 description 1
- FCIROHDMPFOSFG-LAVSNGQLSA-N disialyllacto-N-tetraose Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)OC[C@@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@]3(O[C@H]([C@H](NC(C)=O)[C@@H](O)C3)[C@H](O)[C@H](O)CO)C(O)=O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@H]3[C@@H]([C@@H](O)C(O)O[C@@H]3CO)O)O[C@H](CO)[C@@H]2O)O)O1 FCIROHDMPFOSFG-LAVSNGQLSA-N 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- UNXHWFMMPAWVPI-ZXZARUISSA-N erythritol Chemical compound OC[C@H](O)[C@H](O)CO UNXHWFMMPAWVPI-ZXZARUISSA-N 0.000 description 1
- 235000019414 erythritol Nutrition 0.000 description 1
- 229940009714 erythritol Drugs 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000006052 feed supplement Substances 0.000 description 1
- 210000004700 fetal blood Anatomy 0.000 description 1
- 235000021323 fish oil Nutrition 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 238000005187 foaming Methods 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 229960002737 fructose Drugs 0.000 description 1
- RNBGYGVWRKECFJ-UHFFFAOYSA-N fructose-1,6-phosphate Natural products OC1C(O)C(O)(COP(O)(O)=O)OC1COP(O)(O)=O RNBGYGVWRKECFJ-UHFFFAOYSA-N 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 150000002243 furanoses Chemical group 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- FBPFZTCFMRRESA-GUCUJZIJSA-N galactitol Chemical compound OC[C@H](O)[C@@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-GUCUJZIJSA-N 0.000 description 1
- 125000002519 galactosyl group Chemical group C1([C@H](O)[C@@H](O)[C@@H](O)[C@H](O1)CO)* 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000003197 gene knockdown Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 101150073660 glmM gene Proteins 0.000 description 1
- 101150117187 glmS gene Proteins 0.000 description 1
- 101150111330 glmU gene Proteins 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 230000004110 gluconeogenesis Effects 0.000 description 1
- 239000000174 gluconic acid Substances 0.000 description 1
- 235000012208 gluconic acid Nutrition 0.000 description 1
- 125000002566 glucosaminyl group Chemical group 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229940097043 glucuronic acid Drugs 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- MNQZXJOMYWMBOU-UHFFFAOYSA-N glyceraldehyde Chemical compound OCC(O)C=O MNQZXJOMYWMBOU-UHFFFAOYSA-N 0.000 description 1
- 229960005150 glycerol Drugs 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- 150000002337 glycosamines Chemical class 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 150000003278 haem Chemical group 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 150000002386 heptoses Chemical class 0.000 description 1
- 101150051897 his5 gene Proteins 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 229910052816 inorganic phosphate Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 230000003870 intestinal permeability Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- JYJIGFIDKWBXDU-MNNPPOADSA-N inulin Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)OC[C@]1(OC[C@]2(OC[C@]3(OC[C@]4(OC[C@]5(OC[C@]6(OC[C@]7(OC[C@]8(OC[C@]9(OC[C@]%10(OC[C@]%11(OC[C@]%12(OC[C@]%13(OC[C@]%14(OC[C@]%15(OC[C@]%16(OC[C@]%17(OC[C@]%18(OC[C@]%19(OC[C@]%20(OC[C@]%21(OC[C@]%22(OC[C@]%23(OC[C@]%24(OC[C@]%25(OC[C@]%26(OC[C@]%27(OC[C@]%28(OC[C@]%29(OC[C@]%30(OC[C@]%31(OC[C@]%32(OC[C@]%33(OC[C@]%34(OC[C@]%35(OC[C@]%36(O[C@@H]%37[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O%37)O)[C@H]([C@H](O)[C@@H](CO)O%36)O)[C@H]([C@H](O)[C@@H](CO)O%35)O)[C@H]([C@H](O)[C@@H](CO)O%34)O)[C@H]([C@H](O)[C@@H](CO)O%33)O)[C@H]([C@H](O)[C@@H](CO)O%32)O)[C@H]([C@H](O)[C@@H](CO)O%31)O)[C@H]([C@H](O)[C@@H](CO)O%30)O)[C@H]([C@H](O)[C@@H](CO)O%29)O)[C@H]([C@H](O)[C@@H](CO)O%28)O)[C@H]([C@H](O)[C@@H](CO)O%27)O)[C@H]([C@H](O)[C@@H](CO)O%26)O)[C@H]([C@H](O)[C@@H](CO)O%25)O)[C@H]([C@H](O)[C@@H](CO)O%24)O)[C@H]([C@H](O)[C@@H](CO)O%23)O)[C@H]([C@H](O)[C@@H](CO)O%22)O)[C@H]([C@H](O)[C@@H](CO)O%21)O)[C@H]([C@H](O)[C@@H](CO)O%20)O)[C@H]([C@H](O)[C@@H](CO)O%19)O)[C@H]([C@H](O)[C@@H](CO)O%18)O)[C@H]([C@H](O)[C@@H](CO)O%17)O)[C@H]([C@H](O)[C@@H](CO)O%16)O)[C@H]([C@H](O)[C@@H](CO)O%15)O)[C@H]([C@H](O)[C@@H](CO)O%14)O)[C@H]([C@H](O)[C@@H](CO)O%13)O)[C@H]([C@H](O)[C@@H](CO)O%12)O)[C@H]([C@H](O)[C@@H](CO)O%11)O)[C@H]([C@H](O)[C@@H](CO)O%10)O)[C@H]([C@H](O)[C@@H](CO)O9)O)[C@H]([C@H](O)[C@@H](CO)O8)O)[C@H]([C@H](O)[C@@H](CO)O7)O)[C@H]([C@H](O)[C@@H](CO)O6)O)[C@H]([C@H](O)[C@@H](CO)O5)O)[C@H]([C@H](O)[C@@H](CO)O4)O)[C@H]([C@H](O)[C@@H](CO)O3)O)[C@H]([C@H](O)[C@@H](CO)O2)O)[C@@H](O)[C@H](O)[C@@H](CO)O1 JYJIGFIDKWBXDU-MNNPPOADSA-N 0.000 description 1
- 229940029339 inulin Drugs 0.000 description 1
- 230000026045 iodination Effects 0.000 description 1
- 238000006192 iodination reaction Methods 0.000 description 1
- INQOMBQAUSQDDS-UHFFFAOYSA-N iodomethane Chemical compound IC INQOMBQAUSQDDS-UHFFFAOYSA-N 0.000 description 1
- 150000002584 ketoses Chemical class 0.000 description 1
- 229930193965 lacto-N-fucopentaose Natural products 0.000 description 1
- DOVBXGDYENZJBJ-ONMPCKGSSA-N lactosamine Chemical compound O=C[C@H](N)[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O DOVBXGDYENZJBJ-ONMPCKGSSA-N 0.000 description 1
- 229960001375 lactose Drugs 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000002865 local sequence alignment Methods 0.000 description 1
- ILRKELAUAFUGGJ-XLXDPAEISA-N ls tetrasaccharide d Chemical compound C1([C@@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O)O)NC(=O)C)O[C@]1(C(O)=O)C[C@H](O)[C@@H](NC(C)=O)[C@H]([C@H](O)[C@H](O)CO)O1 ILRKELAUAFUGGJ-XLXDPAEISA-N 0.000 description 1
- 230000028744 lysogeny Effects 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 235000011147 magnesium chloride Nutrition 0.000 description 1
- 229960002160 maltose Drugs 0.000 description 1
- 125000000311 mannosyl group Chemical group C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- FYGDTMLNYKFZSV-UHFFFAOYSA-N mannotriose Natural products OC1C(O)C(O)C(CO)OC1OC1C(CO)OC(OC2C(OC(O)C(O)C2O)CO)C(O)C1O FYGDTMLNYKFZSV-UHFFFAOYSA-N 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 238000005374 membrane filtration Methods 0.000 description 1
- 230000009061 membrane transport Effects 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 244000005706 microflora Species 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 108091064355 mitochondrial RNA Proteins 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 230000004879 molecular function Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000003541 multi-stage reaction Methods 0.000 description 1
- 235000020638 mussel Nutrition 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- BXYCQGWJGKAYEA-KLTJMQSJSA-N n-[(3r,4r,5s,6r)-4,5-dihydroxy-6-(hydroxymethyl)-2-[(2r,3s,4r,5r)-2,3,4,5,6-pentahydroxyhexanoyl]oxan-3-yl]acetamide Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)OC1C(=O)[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO BXYCQGWJGKAYEA-KLTJMQSJSA-N 0.000 description 1
- OVRNDRQMDRJTHS-IYWGXSQHSA-N n-[(3r,4s,5s,6r)-2,4,5-trihydroxy-6-(hydroxymethyl)oxan-3-yl]acetamide Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@H]1O OVRNDRQMDRJTHS-IYWGXSQHSA-N 0.000 description 1
- 208000004995 necrotizing enterocolitis Diseases 0.000 description 1
- 230000012666 negative regulation of transcription by glucose Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 235000006180 nutrition needs Nutrition 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 101150110245 ompC gene Proteins 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 101150008884 osmY gene Proteins 0.000 description 1
- 101150114893 oxyR gene Proteins 0.000 description 1
- 235000020636 oyster Nutrition 0.000 description 1
- 239000002540 palm oil Substances 0.000 description 1
- 230000032696 parturition Effects 0.000 description 1
- 230000007110 pathogen host interaction Effects 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 230000004108 pentose phosphate pathway Effects 0.000 description 1
- 201000006195 perinatal necrotizing enterocolitis Diseases 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 125000001095 phosphatidyl group Chemical group 0.000 description 1
- 108010032867 phosphoglucosamine mutase Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 230000027086 plasmid maintenance Effects 0.000 description 1
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000024 polymyxin B Polymers 0.000 description 1
- 229960005266 polymyxin b Drugs 0.000 description 1
- 150000004804 polysaccharides Polymers 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000001508 potassium citrate Substances 0.000 description 1
- 229960002635 potassium citrate Drugs 0.000 description 1
- QEEAPRPFLLJWCF-UHFFFAOYSA-K potassium citrate (anhydrous) Chemical compound [K+].[K+].[K+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O QEEAPRPFLLJWCF-UHFFFAOYSA-K 0.000 description 1
- 235000011082 potassium citrates Nutrition 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 150000003214 pyranose derivatives Chemical group 0.000 description 1
- 229940043131 pyroglutamate Drugs 0.000 description 1
- 229940005657 pyrophosphoric acid Drugs 0.000 description 1
- 230000006340 racemization Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006894 reductive elimination reaction Methods 0.000 description 1
- 238000001448 refractive index detection Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- HEBKCHPVOIAQTA-ZXFHETKHSA-N ribitol Chemical compound OC[C@H](O)[C@H](O)[C@H](O)CO HEBKCHPVOIAQTA-ZXFHETKHSA-N 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 229960002181 saccharomyces boulardii Drugs 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000003998 size exclusion chromatography high performance liquid chromatography Methods 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 101150017120 sod gene Proteins 0.000 description 1
- 101150087539 sodA gene Proteins 0.000 description 1
- 101150018269 sodB gene Proteins 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 235000015424 sodium Nutrition 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000000371 solid-state nuclear magnetic resonance spectroscopy Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 101150100021 soxR gene Proteins 0.000 description 1
- 101150033650 soxS gene Proteins 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 229960004793 sucrose Drugs 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 239000002600 sunflower oil Substances 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 235000021335 sword fish Nutrition 0.000 description 1
- 230000031068 symbiosis, encompassing mutualism through parasitism Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 101150088047 tdh3 gene Proteins 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 238000004809 thin layer chromatography Methods 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 235000013337 tricalcium citrate Nutrition 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000000825 ultraviolet detection Methods 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000000196 viscometry Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 235000019155 vitamin A Nutrition 0.000 description 1
- 239000011719 vitamin A Substances 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 239000012610 weak anion exchange resin Substances 0.000 description 1
- 239000012608 weak cation exchange resin Substances 0.000 description 1
- 239000000811 xylitol Substances 0.000 description 1
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 1
- 235000010447 xylitol Nutrition 0.000 description 1
- 229960002675 xylitol Drugs 0.000 description 1
- 125000000969 xylosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)CO1)* 0.000 description 1
- 101150020580 yap1 gene Proteins 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 229940098232 yersinia enterocolitica Drugs 0.000 description 1
- UZVNCLCLJHPHIF-NOJKMYKQSA-J zinc;(1e)-2-(ethylcarbamoylamino)-n-methoxy-2-oxoethanimidoyl cyanide;manganese(2+);n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[Zn+2].[S-]C(=S)NCCNC([S-])=S.[S-]C(=S)NCCNC([S-])=S.CCNC(=O)NC(=O)C(\C#N)=N\OC UZVNCLCLJHPHIF-NOJKMYKQSA-J 0.000 description 1
- FYGDTMLNYKFZSV-BYLHFPJWSA-N β-1,4-galactotrioside Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@H](CO)O[C@@H](O[C@@H]2[C@@H](O[C@@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-BYLHFPJWSA-N 0.000 description 1
- HAIWUXASLYEWLM-QTSLKERKSA-N β‐D‐sedoheptulose Chemical compound OC[C@H]1OC(O)(CO)[C@@H](O)[C@H](O)[C@@H]1O HAIWUXASLYEWLM-QTSLKERKSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1081—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/04—Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/12—Disaccharides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/18—Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01222—O-Fucosylpeptide 3-beta-N-acetylglucosaminyltransferase (2.4.1.222)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/99—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
- C12Y204/99003—Alpha-N-acetylgalactosaminide alpha-2,6-sialyltransferase (2.4.99.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/99—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
- C12Y204/99004—Beta-galactoside alpha-2,3-sialyltransferase (2.4.99.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
- C12N2510/02—Cells for production
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/07—Bacillus
- C12R2001/125—Bacillus subtilis ; Hay bacillus; Grass bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/15—Corynebacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/185—Escherichia
- C12R2001/19—Escherichia coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/85—Saccharomyces
- C12R2001/865—Saccharomyces cerevisiae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y206/00—Transferases transferring nitrogenous groups (2.6)
- C12Y206/01—Transaminases (2.6.1)
- C12Y206/01016—Glutamine-fructose-6-phosphate transaminase (isomerizing) (2.6.1.16), i.e. glucosamine-6-phosphate-synthase
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
본 발명은 합성 생물학 및 대사 공학의 기술 분야이다. 보다 특히, 본 발명은 대사적으로 조작된 세포 배양의 기술 분야이다. 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 세포에 의해 제조할 뿐만 아니라 배양으로부터 상기 글리코실화된 생산물의 분리를 위한 방법을 설명한다. 더 나아가서, 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포를 제공한다. 본 발명은 또한 세포 밖으로 이당 또는 올리고당을 배출하는 세포를 제공한다.
Description
본 발명은 합성 생물학 및 대사 공학의 기술 분야이다. 보다 특히, 본 발명은 대사적으로 조작된 세포 배양의 기술 분야이다. 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 세포를 통해서 제조할뿐만 아니라 배양으로부터 상기 글리코실화된 생산물을 분리하는 방법을 설명한다. 더 나아가서, 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포를 제공한다. 본 발명은 또한 세포 밖으로 이당 또는 올리고당을 배출하는 세포를 제공한다.
단백질 및 지질에 당-접합된 형태로서 또는 비접합된 글리칸으로서 체액 및 동물 모유에 존재하는, 탄수화물은 분화, 숙주-병원체 상호작용, 및 발생 및 면역학적 반응을 포함하는 많은 생물학적 과정에서 활성이다 (Bode, Early Hum. Dev. 1-4 (2015); Reily et al., Nat. Rev. Nephrol. 15, 346-366 (2019); Varki, Glycobiology 27, 3-49 (2017)). 탄수화물은 각각 1개, 2개 및 3개 이상의 서브유닛으로 구성되는 단당, 이당, 및 올리고당을 포함하는 많은 상이한 구조로 분류된다. 많은 탄수화물은 뉴클레오티드-활성화된 당으로부터 성장하는 글리칸 사슬로 단당의 활성화된 형태를 전달하는 글리코실트랜스퍼라제에 의해 합성된다. 뉴클레오시드라고도 하는, 뉴클레오티드-활성화된 당은 뉴클레오티드로 치환된 각각의 단당에 관한 것이다. 뉴클레오티드 5'-디포스포당 (예를 들어, UDP, GDP, ADP 또는 dTDP에 연결된 당을 포함하는 NDP-당)은 글리코실트랜스퍼라제에 의해 사용되는 당 도너의 가장 일반적인 형태를 나타낸다. 뉴클레오시드는 에피머화/이성체화, 탈카르복실화, 탈수, 탈수소화, 산화 또는 환원 반응을 포함하는 상호전환 반응에 의해서 또는 회수 경로를 통해서, 즉 올리고당의 분해를 통해서, NDP-파이로포스포릴라제로부터 합성될 수 있다 (Field and Naismith, 2003, Biochemistry 42, 7637-7647; Singh et al., 2012, Nat. Prod. Rep. 29(10), 1201-1237).
뉴클레오시드 UDP-N-아세틸글루코사민 (UDP-GlcNAc)은 많은 천연 글리코실화된 생산물의 합성에서 중요한 중간체이다. 이러한 생산물의 예는 N-아세틸글루코사민 (GlcNAc), N-아세틸만노사민 (ManNAc), N-아세틸갈락토사민 (GalNAc), 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산 (MurNAc), N-아세틸-L-퀴노보사민, N-아세틸뉴라민산 (Neu5Ac), 및 N-글리코릴뉴라민산 (Neu5Gc)을 포함하는 단당으로 구성되고, 박테리아, 바이러스, 진균, 효모, 및 고등 유기체 중에 널리 분포된 이당 및 올리고당을 포함한다. UDP-GlcNAc로부터 유래되는 올리고당의 큰 부분은 박테리아의 세포 표면을 코팅하는 다당류 구조 또는 거의 모든 박테리아의 주변세포질 공간의 펩티도글리칸 (또는 뮤레인) 층에서 발견되었다. 지질다당류 (LPS)는 그람-음성 박테리아 외막의 주요 성분이다. LPS가 포유동물 숙주의 소화관에서 마주하게 되는 항생제 및 세제같은 일정 종류의 화학적 공격으로부터 박테리아 막을 보호하지만, 그들은 또한 동물 면역계로부터 강력한 반응을 유도한다. 이들 면역조절 성질 덕분에, 지질다당류는 종종 의학적 또는 수의학적 관심을 받는다 (Bertani and Ruiz, 2018, EcoSal. Plus 8(1), ESP-0001-2018; Caroff and Karibian, 2003, Carb. Res. 338, 2431-2447; Sampath, 2018, Agriculture and Natural Resources 52(2), 115-120). 그람-양성 박테리아 및 고세균은 LPS를 보유하지 않지만, 동일한 단백질 또는 당단백질의 단일 층으로 구성된 표면 층을 갖고, 이들 당단백질은 그람-음성 박테리아의 0-항원을 닮고 종종 유사한 당 빌딩 블록을 함유한다 (Schaffer et al., 2002, J. Biol. Chem. 277(8), 6230-6239). 펩티도글리칸 (또는 뮤레인)은 박테리아의 세포 구조 및 삼투압을 유지하는 짧은 펩티드 가교에 의해서 가교-결합되는 교대식 GlcNAc 및 MurNAc 당으로 구성되는 글리코시드 구조이다 (Vollmer et al., 2008, FEMS Microb. Rev. 32(2), 149-167). 진핵생물은 또한 UDP-GlcNAc로부터 유래되는 다양한 글리코실화된 생산물을 함유한다. 예를 들어, GlcNAc, GalNAc 및/또는 Neu5Ac 빌딩 블록을 포함하는 올리고당은 대부분의 포유동물의 모유에서 빈번하게 확인된다. 인간 모유 중 대부분의 올리고당 (HMO)은 인간 모유에 고유하고, 그들 조성은 건강한 성장 및 발달을 위해 신생아의 영양 요구를 충족하도록 수유 전반에서 일정하게 변화된다. 연구들은 면역 발달을 지원하고, 장 투과성을 완화시키고, 장 세포 반응에 영향을 미치고, 괴사성 장염의 발생을 감소시킨다는 것을 입증하였다 (Walsh et al., 2020, J. Funct. Foods 72, 104052 및 이의 참조).
UDP-GlcNAc로부터 유래되는 글리코실화된 생산물의 합성에 광범위한 관심이 있지만, 그들 산업적 합성은 지금까지 여전히 도전이다. 상기 합성은 뉴클레오시드로부터 성장하는 당류 사슬에 단당 서브유닛을 전달하는 특별한 뉴클레오시드 및 글리코실트랜스퍼라제의 생산을 포함한다. 이들 글리코실화된 생산물의 세포 생산 동안 발생하는 문제는 천연 세포벽 생합성 경로의 방해 및/또는 세포 밖으로 상기 글리코실화된 생산물의 배출이다. 또한, 이들 화합물을 향한 물질대사에서의 탄소 흐름의 최적화가 여전히 생산 준주에서 방해받는다. Deng 및 동료들은 발효 배양을 통해 재조합 이. 콜라이 세포를 사용한 GlcNAc의 성공적인 생산을 보고하였다 (Deng et al., Metab. Eng. 7, 201-214 (2005); EP1576106). 그러나, 미생물 시스템에서, GlcNAc는 이.콜라이 세포의 세포외에서, 보다 특히 후자의 이출 동안 GlcNAc-6-포스페이트의 탈-인산화를 통해서, 이. 콜라이의 주변세포질에서 생산된다. 이와 같이, 수득된 GlcNAc 모이어티는 본 발명에서 UDP-GlcNAc로부터 유래된 글리코실화된 생산물의 생산에 필수적인 UDP-GlcNAc로 세포내 전환에 더 이상 이용가능하지 않다. 또한, Deng 및 동료들이 기술한 방법은 생산 숙주에 대한 억제 효과를 최소화하기 위해 정밀한 제어를 필요로 하는 2-단계 공급 배치 시스템을 요구하여, 이 방법은 고적정가의 UDP-GlcNAc를 생산하기 위한 상업적 흥미를 얻지 못한다.
본 발명의 목적은 UDP-GlcNAc로부터 유래되고, 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물이 세포에 의해 생산될 수 있는 도구 및 방법을 제공하는 것이다. 본 발명에 따라서, 이러한 목적 및 다른 목적은 상기 글리코실화된 생산물을 제조하기 위한 세포 및 방법을 제공하여 달성되고, 세포는 상기 글리코실화된 생산물의 제조를 위해 유전자 변형된다.
본 발명은 대사적으로 조작된 세포, 및 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당으로 구성된 글리코실화된 생산물의 제조를 위한 방법을 제공한다. 방법은 UDP-GlcNAc를 합성하고 상기 UDP-GlcNAc를 사용하여 상기 글리코실화된 생산물을 생산하는, 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하는 세포를 제공하는 단계, 및 상기 글리코실화된 생산물를 생산하도록 허용하는 조건 하에서 상기 세포를 배양하는 단계를 포함한다. 본 발명은 또한 상기 글리코실화된 생산물을 분리하기 위한 방법을 제공한다. 더 나아가서, 본 발명은 상기 글리코실화된 생산물을 생산하기 위해 대사적으로 조작된 세포를 제공한다. 본 발명은 또한 세포 밖으로 이당 또는 올리고당을 배출하는 세포를 제공한다.
정의
본 발명 및 이의 다양한 구현예를 설명하기 위해서 본 명세서에서 사용되는 단어는 그들의 일반적으로 정의된 뜻의 의미에서 이해되어야 할뿐만 아니라, 본 명세서 구조에서 특별한 정의를 통해서 일반적으로 정의되는 뜻의 범위를 벗어나는 물질 또는 행위를 포함하는 것으로 이해되어야 한다. 따라서, 본 명세서의 상황에서 성분이 하나 초과의 뜻을 포함하는 것으로 이해될 수 있으면, 청구항에서 이의 사용은 명세서 및 단어 그 자체에 의해 뒷받침되는 모든 가능한 뜻에 대해 포괄적인 것으로 이해되어야만 한다.
본 명세서에 개시된 발명의 다양한 구현예 및 구현예의 양태는 본 명세서에 특별히 기술된 순서 및 상황 뿐만 아니라, 또한 임의 순서 및 이의 임의 조합을 포함하는 것으로 이해되어야 한다. 상황에서 요구할 때마다, 단수로 사용되는 모든 단어는 복수를 포함하는 것으로 간주되고 그 반대도 마찬가지이다. 달리 정의하지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 일반적으로 본 발명이 속하는 분야의 당업자가 일반적으로 이해하는 바와 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용되는 명명법 및 본 명세서에 기술된 세포 배양, 분자 유전학, 유기 화학 및 핵산 화학 및 혼성화에서의 실험 절차는 당분야에서 충분히 공지되어서 일반적으로 적용된다. 핵산 및 펩티드 합성을 위해 표준 기술이 사용된다. 일반적으로, 정제 단계는 제조사의 사양에 따라서 수행된다.
명세서에서, 본 발명의 구현예들이 개시되어 있고, 특정한 용어가 적용되지만, 용어들은 설명적인 의미로만 사용되고 제한의 목적이 아니고, 본 발명의 범주는 하기 청구항에 기재된다. 예시된 구현예는 예의 목적으로만 기재되었고 본 발명을 제한하는 것으로 간주해서는 안된다는 것을 이해해야 한다. 변경, 다른 구현예, 개선, 상세사항, 및 사용은 균등론을 포함하여, 특허법에 따라서 해석되는, 청구항에 의해서만 제한되는, 본 개시의 범주 내에서 본 명세서의 개시의 문자 및 정신과 일관되게 이루어질 수 있다는 것은 당업자에게 자명할 것이다. 하기의 청구항에서, 청구 범위 단계를 지정하는데 사용되는 참조 부호는 단지 설명의 편이를 위해 제공되고, 단계를 수행하기 위한 임의의 특정 순서를 의미하려는 의도가 아니다.
이 문헌 및 이의 청구항에서, 동사 "포함하다" 및 이의 활용형은 단어 뒤에 오는 항목이 포함되지만, 특별히 언급되지 않은 항목을 배제하지 않는다는 것을 의미하는 이의 비제한적인 의미로 사용된다. 본 출원의 전반에서, 동사 "포함하다"는 "이루어지다" 또는 "본질적으로 이루어지다"로 대체될 수 있고, 그 반대도 마찬가지일 수 있다. 또한, 동사 "이루어지다"는 본 명세서에 정의된 바와 같은 조성물이 특별히 확인된 것 이외의 추가적인 성분(들)을 포함할 수 있다는 것을 의미하는 "본질적으로 이루어지다"로 대체될 수 있고, 상기 추가적인 성분(들)은 본 발명의 고유한 특징을 변경시키지 않는다. 또한, 부정 관사 "한" 또는 "하나"에 의한 성분에 대한 참조는 하나 및 오직 하나의 성분이 존재하는 것을 문맥에서 명확하게 요구하지 않으면, 하나 초과의 성분이 존재할 가능성을 배제하지 않는다. 따라서, 부정 관사 "한" 또는 "하나"는 일반적으로 "적어도 하나"를 의미한다.
본 출원 전반에서, 달리 명확하게 명시하지 않으면, 관사 "한" 및 "하나"는 바람직하게 "적어도 2", 보다 바람직하게 "적어도 3", 보다 더 바람직하게 "적어도 4", 보다 더 바람직하게 "적어도 5", 보다 더 바람직하게 "적어도 6", 가장 바람직하게 "적어도 2"로 대체된다.
본 출원 전반에서, 달리 명확하게 명시하지 않으면, "합성하다", "합성된" 및 "합성"의 특성은 각각 "생산하다", "생산된", 및 "생산"의 특성과 상호교환적으로 사용된다.
본 명세서에서 확인되는 각각의 구현예는 달리 표시하지 않으면 함께 조합될 수 있다. 본 명세서에서 언급되는 모든 공개물, 특허, 및 특허 출원은 각각의 개별 공개물, 특허, 또는 특허 출원이 참조로 편입된다고 특별히 개별적으로 표시된 바와 동일한 정도로 참조로 본 명세서에 편입된다.
본 발명에 따라서, 용어 "폴리뉴클레오티드(들)"는 일반적으로 비변형된 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있는, 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 의미한다. "폴리뉴클레오티드(들)"는 제한없이, 단일-가닥 및 이중-가닥 DNA, 단일-가닥 및 이중-가닥 영역 또는 단일-가닥, 이중-가닥 및 삼중-가닥 영역의 혼합물인 DNA, 단일-가닥 및 이중-가닥 RNA, 및 단일-가닥 및 이중-가닥 영역의 혼합물인 RNA, 단일-가닥일 수 있거나, 또는 보다 전형적으로 이중-가닥, 또는 삼중-가닥 영역, 또는 단일-가닥 및 이중-가닥 영역의 혼합물일 수 있는 DNA 및 RNA를 포함하는 하이브리드 분자를 포함한다. 또한, 본 명세서에서 사용되는, "폴리뉴클레오티드"는 RNA 또는 DNA 또는 RNA 및 DNA 둘 모두를 포함하는 삼중-가닥 영역을 의미한다. 이러한 영역에서 가닥은 동일한 분자 또는 상이한 분자 유래일 수 있다. 영역은 하나 이상의 분자 모두를 포함할 수 있지만, 보다 전형적으로 분자 중 일부의 영역만을 포함한다. 삼중-나선 영역의 분자 중 하나는 종종 올리고뉴클레오티드이다. 본 명세서에서 사용되는, 용어 "폴리뉴클레오티드(들)"는 또한 하나 이상의 변형된 염기를 함유하는 상기 기술된 바와 같은 DNA 또는 RNA를 포함한다. 따라서, 안정성 또는 다른 이유로 변형된 골격을 갖는 DNA 또는 RNA는 본 발명에 따른 "폴리뉴클레오티드(들)"이다. 또한, 특정한 염기, 예컨대, 이노신, 또는 변형된 염기, 예컨대 트리틸화된 염기를 포함하는 DNA 또는 RNA는 용어 "폴리뉴클레오티드"에 포괄되는 것으로 이해한다. 매우 다양한 변형이 DNA 및 RNA에 만들어져서 당업자에게 공지된 많은 유용한 목적을 제공한다는 것을 이해할 것이다. 본 명세서에서 적용되는 바와 같은 용어 "폴리뉴클레오티드(들)"는 예를 들어, 단순 및 복합 세포를 포함한, 세포 및 바이러스의 특징적인 DNA 및 RNA의 화학적 형태를 비롯하여, 폴리뉴클레오티드의 화학적, 효소적, 또는 대사적으로 변형된 형태를 포괄한다. 용어 "폴리뉴클레오티드(들)"는 또한 종종 올리고뉴클레오티드(들)라고 하는 짧은 폴리뉴클레오티드를 포괄한다.
"폴리펩티드(들)"는 펩티드 결합 또는 변형된 펩티드 결합을 통해서 서로에게 연결된 둘 이상의 아미노산을 포함하는 임의의 펩티드 또는 단백질을 의미한다. "폴리펩티드(들)"는 일반적으로 펩티드, 올리고펩티드 및 올리고머라고 하는, 짧은 사슬과, 일반적으로 단백질이라고 하는 보다 긴 사슬을 의미한다. 폴리펩티드는 20개 유전자 코딩되는 아미노산 이외의 아미노산을 함유할 수 있다. "폴리펩티드(들)"는 천연 과정, 예컨대 프로세싱 및 다른 번역후 변형에 의해서 뿐만 아니라, 또한 화학적 변형 기술에 의해서 변형된 것들을 포함한다. 이러한 변형은 기초 교재 및 보다 상세한 논문을 비롯하여, 방대한 연구 문헌에서 충분히 설명되고, 당업자에게 충분히 공지되어 있다. 동일 유형의 변형이 소정 폴리펩티드의 몇개 부위에서 동일하거나 또는 다양한 정도로 존재할 수 있다. 더 나아가서, 소정 펩티드는 많은 유형의 변형을 함유할 수 있다. 변형은 펩티드 골격, 아미노산 측쇄, 및 아미노 또는 카르복실 말단을 포함하여, 폴리펩티드의 어느 곳에서도 발생될 수 있다. 변형은 예를 들어, 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 부착, 헴 모이어티의 공유 부착, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 부착, 지질 또는 지질 유도체의 공유 부착, 포스파티딜이노시톨의 공유 부착, 가교 결합, 고리화, 디술피드 결합 형성, 탈메틸화, 공유 가교 결합의 형성, 파이로글루타메이트의 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 단백질분해 프로세싱, 인산화, 프레닐화, 라세미화, 지질 부착, 술페이트화, 글루탐산 잔기의 감마-카르복실화, 히드록실화 및 ADP-리보실화, 헬레노일화, 단백질에 아미노산의 전달-RNA 매개 첨가, 예컨대, 아르기닐화, 및 유비퀴틴화를 포함한다. 폴리펩티드는 분지되거나 또는 분지되지 않은, 환형 또는 분지형일 수 있다. 환형, 분지형 및 분지된 원형 폴리펩티드는 번역 후 천연 과정에 의할 수 있고, 또한 완전 합성 방법으로도 만들어질 수 있다.
본 명세서에서 사용되는 용어 "폴리펩티드를 코딩하는 폴리뉴클레오티드"는 본 발명의 폴리펩티드를 코딩하는 서열을 포함하는 폴리뉴클레오티드를 포괄한다. 용어는 또한 코딩 및/또는 비-코딩 서열을 함유할 수도 있는 추가 영역과 함께 (예를 들어, 통합된 파지 또는 삽입 서열 또는 편집에 의해 개재됨) 폴리펩티드를 코딩하는 단일 연속 영역 또는 불연속 영역을 포함하는 폴리뉴클레오티드를 포괄한다.
"단리된"은 이의 천연 상태로부터 "인간의 손에 의해" 변경된 것을 의미하는데, 다시 말해서, 자연에서 발생된 경우에, 이의 본래 환경으로부터 변화 또는 제거되었거나, 또는 둘 모두이다. 예를 들어, 살아있는 유기체에 천연적으로 존재하는 폴리뉴클레오티드 또는 폴리펩티드는 "단리된" 것이 아니지만, 본 명세서에서 이 용어가 적용되는 바와 같이, 이의 천연 상태의 공존 물질로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 "단리된" 것이다. 유사하게, "합성"은 본 명세서에서 이 용어가 사용되는 바와 같이, 천연 공급원으로부터 직접적으로 단리된 것이 아니라 합성적으로 생성된 임의 서열을 의미한다. "합성된"은, 본 명세서에서 이 용어가 사용되는 바와 같이, 천연 공급원으로부터 직접적으로 단리된 것이 아니라 임의의 합성적으로 생성된 서열을 의미한다.
세포 또는 숙주 세포에 대해서 본 명세서에서 사용되는 용어 "재조합" 또는 "유전자이식" 또는 "대사적으로 조작된", "유전자 조작된" 또는 "유전자 변형된"은상호교환적으로 사용되고 세포가 이종성 핵산을 복제하거나, 또는 이종성 핵산 (즉, "상기 세포에 대해 외래인" 서열 또는 상기 세포 내 상기 위치 또는 환경에 대해 외래"인 서열)에 의해 코딩되는 펩티드 또는 단백질을 발현하는 것을 의미한다. 이러한 서열은 적어도 하나의 이종성 또는 외생성 유전자로 형질전환된 것으로 설명되거나, 또는 적어도 하나의 이종성 또는 외생성 유전자의 도입을 통해 형질전환된 것으로 설명된다. 대사적으로 조작되거나 또는 재조합 또는 유전자이식되거나 또는 유전자 조작된 세포는 세포의 천연 (비-재조합) 형태 내에서 발견되지 않는 유전자를 함유할 수 있다. 재조합 세포는 또한 세포의 천연 형태에서 발견되는 유전자를 함유하는데, 여기서 유전자는 인공 수단을 통해서 세포에 재-도입된다. 세포의 천연 유전자는 또한 그들이 재조합 세포로 재-도입되기 전에 변형될 수 있다.
이 용어는 또한 변형된 세포에 내생성인 핵산을 함유하거나 또는 이의 발현 또는 활성이 세포로부터 핵산 제거없이 변형된 세포를 포괄하고; 이러한 변형은 유전자 치환, 프로모터의 치환; 부위-특이적 돌연변이; 및 관련 기술을 통해 수득된 것을 포함한다. 따라서, "재조합 폴리펩티드"는 재조합 세포에 의해 생산된 것이다.
이 용어는 또한 당업자에게 일반적으로 충분히 공지된 기술 (예컨대, 예를 들어, 유전자의 녹-아웃)을 통해서 세포에 내생성인 핵산을 제거하여 변형된 세포를 포괄한다.
본 명세서에서 사용되는, "이종성 서열" 또는 "이종성 핵산"은 특정 세포에 외래인 (예를 들어, 상이한 종 유래) 공급원으로부터 기원하거나, 또는 동일한 공급원 유래인 경우에, 게놈 내 이의 본래 형태 또는 위치로부터 변형된 것이다. 따라서, 프로모터에 작동적으로 연결된 이종성 핵산은 프로모터가 유래되는 것과 상이한 공급원 유래이거나, 또는 동일한 공급원인 경우에, 게놈 내 이의 본래 형태 또는 위치로부터 변형된다. 이종성 서열은 숙주 미생물 세포의 게놈으로, 예를 들어, 형질감염, 형질전환, 접합 또는 형질도입을 통해서 안정하게 도입될 수 있고, 기술은 도입시키려는 서열 및 세포에 의존하여서 적용될 수 있다. 다양한 기술들이 당업자에게 공지되어 있는데, 예를 들어, 하기 문헌에 개시되어 있다: Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989). 본 개시의 상황 내에서 사용되는 용어 "돌연변이체" 또는 "조작된" 세포 또는 미생물은 유전자 변형된 세포 또는 미생물을 의미한다.
본 개시의 상황 내에서 용어 "내생성"은 세포의 천연 부분이고 세포 염색체 내 이의 천연 위치에서 발생되는 임의의 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열을 의미한다. 용어 "외생성"은 연구 중인 세포 밖에서 기원하고, 세포의 천연 일부가 아니거나 또는 세포 염색체 또는 플라스미드 내 이의 천연 위치에서 발생되지 않는 임의의 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열을 의미한다.
폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소에 대해서 사용될 때 "이종성"은 공급원 유래이거나 또는 숙주 유기체 이외의 공급원으로부터 유래되는 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소를 의미한다. 대조적으로, "상동성" 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소는 숙주 유기체로부터 유래되는 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소를 의미하고자 본 명세서에서 사용된다. 유전자 서열을 유지하거나 또는 조작하는데 사용되는 유전자 조절 서열 또는 보조 핵산 서열 (예를 들어, 프로모터, 5' 비번역 영역, 3' 비번역 영역, 폴리A 첨가 서열, 인트론 서열, 스플라이스 부위, 리보솜 결합 부위, 내부 리보솜 진입 서열, 게놈 상동성 영역, 재조합 부위 등)에 대해 언급될 때, "이종성"은 조절 또는 보조 핵산 서열이 구성체, 게놈, 염색체, 또는 에피솜에서 병치되는 유전자와 천연적으로 연관되지 않은 것을 의미한다. 따라서, 이의 천연 상태 (즉, 비-유전자 조작된 유기체의 게놈)에서 작동적으로 연결되지 않은 유전자에 작동적으로 연결된 프로모터는 프로모터가 연결되는 유전자와 동일한 종 (또는 일부 경우에, 동일한 유기체)으로부터 유래될 수 있더라도, 본 명세서에서 "이종성 프로모터"라고 한다.
용어 단백질 또는 효소의 "변형된 활성"은 야생형, 즉 상기 단백질 또는 효소의 천연, 활성과 비교하여 단백질 또는 효소의 활성의 변화에 관한 것이다. 상기 변형된 활성은 단백질 또는 효소의 야생형 활성과 비교하여 상기 단백질 또는 효소의 폐기, 손상, 감소 또는 지연된 활성일 수 있거나 또는 또한 단백질 또는 효소의 야생형 활성과 비교하여 상기 단백질 또는 효소의 가속화되거나 또는 증강된 활성일 수 있다. 단백질 또는 효소의 변형된 활성은 상기 단백질 또는 효소의 변형된 발현에 의해 수득되거나 또는 단백질 또는 효소의 변형된, 즉 돌연변이체 형태의 발현에 의해 수득된다. 효소의 변형된 활성은 또한 효소의 겉보기 미카엘리스 상수 Km 및/또는 겉보기 최대 속도 (Vmax)의 변형과 관련된다.
용어 유전자의 "변형된 발현"은 원하는 화합물의 제조 과정의 임의 단계에서 상기 유전자의 야생형 발현과 비교하여 발현의 변화에 관한 것이다. 상기 변형된 발현은 야생형과 비교하여 더 낮거나 또는 더 높은 발현으로서, 용어 "더 높은 발현"은 또한 내생성 유전자의 경우에 상기 유전자의 "과발현" 또는 야생형 균주에 존재하지 않는 이종성 유전자의 경우에 "발현"으로 정의된다. 더 낮은 발현 또는 감소된 발현은 기능성 최종 생산물을 생산하기 위해 "부족한-능력" (즉, 기능성 야생형 유전자와 비교하여 통계적으로 유의하게 '부족한-능력')이 되거나 또는 완전하게 불능 (예컨대, 유전자 녹-아웃)이 되는 방식으로 유전자를 변화시키는데 사용되는 당업자에게 일반적으로 충분히 공지된 기술 (예컨대, siRNA, CrispR, CrispRi, 리보스위치, 리콤비니어링, 상동성 재조합, ssDNA 돌연변이유발법, RNAi, miRNA, asRNA, 유전자 돌연변이, 유전자 녹-아웃, 트랜스포존 돌연변이유발법 등의 사용)을 통해서 수득된다. 더 낮은 발현이 상기 기술된 바와 같이 수득되는 방식으로 관심 유전자의 변화 다음에, 더 낮은 발현은 또한 전사 단위, 프로모터, 비번역 영역, 리보솜 결합 부위, 샤인 달가르노 서열 또는 전사 종결자를 변화시켜서 수득될 수 있다. 더 낮은 발현 또는 감소된 발현은 예를 들어 프로모터 서열의 하나 이상의 염기쌍을 돌연변이시키거나 또는 프로모터 서열을 야생형과 비교해 더 낮은 발현 강도를 갖는 항상성 프로모터 또는 조절된 발현을 야기하는 유도성 프로모터 또는 조절된 발현을 야기하는 억제성 프로모터로 완전하게 변화시켜서 수득될 수 있다. 과발현 또는 발현은 당업자에게 일반적으로 충분히 공지된 기술을 통해서 수득되며, 상기 유전자는 프로모터 서열, 비번역 영역 서열 (리보솜 결합 서열 또는 샤인 달가르노 서열을 함유), 코딩 서열 및 임의로 전사 종결자가 존재하여 기능성 활성 단백질의 발현을 일으키는 임의 서열과 관련된 "발현 카세트"의 일부이다. 상기 발현은 항상성이거나 또는 조절된다.
용어 "항상성 발현"은 일정 성장 조건 하에서 RNA 폴리머라제의 서브유닛 이외의 전사 인자 (σ70, σ54, 또는 관련 σ-인자같은 박테리아 시그마 인자 및 RNA 폴리머라제 코어 효소와 공-회합된 효모 미토콘드리아 RNA 폴리머라제 특이성 인자 MTF1을 포함)에 의해 조절되지 않는 발현으로서 정의된다. 이러한 전사 인자의 비제한적인 예는 이.콜라이의 CRP, LacI, ArcA, Cra, IclR, 또는 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae)의 Aft2p, Crz1p, Skn7, 또는 비. 서브틸리스 (B. subtilis)의 DeoR, GntR, Fur이다. RNA 폴리머라제는 DNA 주형으로부터 RNA의 합성을 위한 촉매적 기구이다. RNA 폴리머라제는 특이적 DNA 서열에 결합하여서, 예를 들어 원핵생물 숙주에서 시그마 인자를 통해서, 또는 효모에서 MTF1을 통해 전사를 개시한다. 항상성 발현은 유도 또는 억제 필요없이 일정한 발현 수준을 제공한다.
용어 "비-화학적 유도 또는 억제 시 조건적 발현"은 환경 변화 (예를 들어, 혐기성 또는 호기성 성장, 산화 스트레스, 온도 변화, 예컨대, 예를 들어 열-충격 또는 냉-충격, 삼투압, 빛 조건)에 대한 반응으로서 또는 제한없이 아폽토시스 및 오토파지를 포함한 상기 숙주 세포의 발생 단계 또는 세포 주기의 위치에 의존하여, 숙주의 일정 천연 조건 (예를 들어, 발아 효모의 교배 단계, 박테리아의 정지 단계, 분만 중이거나 또는 수유 중인 유기체)에서만 발현되는 유전자의 선택적 또는 조절적 또는 조율적 발현으로서 정의된다. 조건적 발현은 유전자가 발현되는 때를 제어하도록 허용한다. "비-화학적 유도 또는 억제"는 화학적 화합물의 존재 또는 부재와 관련되지 않은 조율적인 발현으로서 정의된다. 용어 "화학적 화합물"은 탄소 공급원 (글루코스, 알로-락토스, 락토스, 갈락토스, 글리세롤, 아라비노스 포함), 알콜 (메탄올, 에탄올 포함), 산성 화합물 (예컨대, 아세테이트, 포르메이트), IPTG, 금속 이온 (알루미늄, 구리, 아연, 질소 포함), 포스페이트, 방향족 (예컨대, 크실렌)을 포함하는 분자를 의미한다. 기아 및 질소 고갈은 조건적 발현을 일으키는 화학적 억제로서 이해한다.
용어 "제어 서열"은 폴리펩티드로 폴리뉴클레오티드 서열의 전사 및 번역을 허용하는, 세포 전사 및 번역 시스템에 의해 인식되는 서열을 의미한다. 따라서 이러한 DNA 서열은 특정 세포 또는 유기체에서 작동적으로 연결된 코딩 서열의 발현에 필수적이다. 이러한 제어 서열은 프로모터 서열, 리보솜 결합 서열, 샤인 달가르노 서열, 코작 서열, 전사 종결자 서열일 수 있지만, 이에 제한되지 않는다. 예를 들어, 원핵생물에 적합한 제어 서열은 프로모터, 임의로 오퍼레이터 서열, 및 리보솜 결합 부위를 포함한다. 원핵생물 세포는 프로모터, 폴리아데닐화 신호, 및 인핸서를 이용하는 것으로 알려져 있다. 전서열 또는 분비 리더에 대한 DNA는 폴리펩티드의 분비에 관여하는 전단백질로서 발현되는 경우에 폴리펩티드에 대한 DNA에 작동적으로 연결될 수 있고; 프로모터 또는 인핸서는 서열의 전사에 영향을 미치는 경우에 코딩 서열에 작동적으로 연결되거나; 또는 리보솜 결합 부위는 서열의 전사에 미치는 경우에 코딩 서열에 작동적으로 연결되거나; 또는 리보솜 결합 부위는 번역을 촉진하도록 위치되는 경우에 코딩 서열에 작동적으로 연결된다. 상기 제어 서열은 더 나아가서 폴리펩티드로 상기 폴리뉴클레오티드의 전사 또는 변역을 유도하거나 또는 억제하는 유전자 회로를 통해서 또는 유도성 프로모터를 통해서 외부 화학물, 예컨대, 제한없이, IPTG, 아라비노스, 락토스, 알로-락토스, 람노스 또는 푸코스를 사용해 제어될 수 있다.
일반적으로, "작동적으로 연결된"은 연결되는 DNA 서열이 연속적이고, 분비 리더의 경우에, 연속적이고, 판독 상으로 존재한다는 것을 의미한다. 그러나, 인핸서는 연속적일 필요는 없다.
용어 "야생형"은 자연계에서 발생되는 바와 같은 일반적으로 공지된 유전자 또는 표현형 상태를 의미한다.
본 명세서에서 사용되는 용어 "단백질의 변형된 발현"은 i) 내생성 단백질의 더 높은 발현 또는 과발현, ii) 이종성 단백질의 발현, 또는 iii) 야생형 (즉, 천연) 단백질과 비교하여 더 높은 활성을 갖는 변이체 단백질의 발현 및/또는 과발현을 의미한다.
본 명세서에서 사용되는, 용어 "유선 세포(들)"는 일반적으로 유선 상피 세포(들), 유선-상피 내강 세포(들), 또는 포유동물 상피 폐포 세포(들), 또는 이의 임의 조합을 의미한다. 본 명세서에서 사용되는, 용어 "유선-유사 세포(들)"는 일반적으로 천연 유선 세포(들)와 유사한 (또는 실질적으로 유사한) 표현형/유전자형을 갖지만 비-유선 세포 공급원(들)으로부터 유래되는 세포를 의미한다. 이러한 유선-유사 세포(들)는 적어도 하나의 바람직하지 않은 유전자 성분을 제거하고/하거나 유선 세포에 전형적인 적어도 하나의 사전결정된 유전자 구성체를 포함하도록 조작될 수 있다. 유선-유사 세포(들)의 비-제한적인 예는 유선 상피-유사 세포(들), 유선 상피 내강-유사 세포(들), 유선 세포 계통의 세포의 하나 이상의 특징을 나타내는 비-유선 세포(들), 또는 이의 임의 조합을 포함할 수 있다. 유선-유사 세포(들)의 추가적인 비-제한적인 예는 천연 유선 세포(들)와 유사한 (또는 실질적으로 유사한) 표현형을 갖거나, 또는 보다 특히 천연 유선 상피 세포(들)와 유사한 (또는 실질적으로 유사한) 표현형을 갖는 세포(들)를 포함할 수 있다. 천연 유선 세포 또는 유선 상피 세포와 유사한 (또는 실질적으로 유사한) 적어도 하나의 특징을 나타내거나 또는 표현형을 갖는 세포는 적어도 하나의 모유 성분을 발현할 수 있도록 조작되었거나, 또는 천연적으로 나타내는 세포 (예를 들어, 유선 세포 계통 또는 비-유선 세포 계통으로부터 유래됨)를 포함할 수 있다.
본 명세서에서 사용되는, 용어 "비-유선 세포(들)"는 일반적으로 비-유선 계통의 임의 세포를 포함할 수 있다. 본 발명의 상황에서, 비-유선 세포는 적어도 하나의 모유 성분을 발현하도록 조작될 수 있는 임의의 포유동물 세포일 수 있다. 이러한 비-유선 세포(들)의 비제한적인 예는 간세포(들), 혈액 세포(들), 신장 세포(들), 제대혈 세포(들), 상피 세포(들), 표피 세포(들), 근세포(들), 섬유아세포(들), 중간엽 세포(들), 또는 이의 임의 조합을 포함한다. 일부 예에서, 분자 생물학 및 게놈 편집 기술을 조작하여서 무수한 유전자를 동시에 제거하거나, 침묵화시키거나, 또는 약화시킬 수 있다.
출원 전반에서, 달리 명확하게 명시하지 않으면, <동사>할 수 있는" 및 "<동사>하도록 할 수 있는"은 바람직하게 상기 동사의 능동태로 대체되고 그 반대도 마찬가지이다. 예를 들어, "발현할 수 있는"의 표현은 바람직하게 "발현하다"로 대체되고 그 반대도 마찬가지이며, 다시 말해서, "발현하다"는 바람직하게 "발현할 수 있는"으로 대체된다.
본 명세서에서 사용되는 용어로서 "변이체(들)"는 기준 폴리뉴클레오티드 또는 폴리펩티드와 각각 상이하지만 필수 성질은 보유하는 폴리뉴클레오티드 또는 폴리펩티드이다. 폴리뉴클레오티드의 전형적인 변이체는 다른, 기준 폴리뉴클레오티드와 뉴클레오티드 서열이 상이하다. 변이체의 뉴클레오티드 서열에서 변화는 기준 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드의 아미노산 서열은 변경시킬 수 있거나 또는 변경시키지 않을 수 있다. 뉴클레오티드 변화는 하기에 논의되는 바와 같이, 기준 서열에 의해 코딩되는 폴리펩티드에 아미노산 치환, 부가, 결실, 융합 및 절두를 일으킬 수 있다. 폴리펩티드의 전형적인 변이체는 다른, 기준 폴리펩티드와 아미노산 서열이 상이하다. 일반적으로, 차이는 기준 폴리펩티드와 변이체의 서열이 전체적으로 밀접하게 유사하고, 많은 영역에서, 동일하도록 제한적이다. 변이체 및 기준 폴리펩티드는 임의 조합의 하나 이상의 치환, 부가, 결실이 아미노산 서열에서 상이할 수 있다. 치환되거나 또는 삽입된 아미노산 잔기는 유전자 코드에 의해 코딩되는 것일 수 있거나 또는 아닐 수도 있다. 폴리뉴클레오티드 또는 폴리펩티드의 변이체는 천연 발생 예컨대 대립유전자 변이체일 수 있거나, 또는 천연적으로 발생되는 것으로 알려지지 않은 변이체일 수 있다. 폴리뉴클레오티드 및 폴리펩티드의 비천연 발생 변이체는 돌연변이유발법 기술에 의해서, 직접 합성에 의해서, 그리고 당업자에게 공지된 다른 재조합 방법에 의해서 만들어질 수 있다.
본 명세서에서 사용되는 용어 폴리펩티드의 "유도체"는 폴리펩티드의 아미노산 서열 내에 아미노산 잔기의 결실, 부가 또는 치환을 함유할 수 있지만, 침묵화 변화를 일으키므로, 기능적으로 동등한 폴리펩티드를 생산하는 폴리펩티드이다. 아미노산 치환은 관여된 잔기의 극성, 전하, 가용성, 소수성, 친수성, 및/또는 양친매성 성질의 유사성을 기반으로 만들어질 수 있다. 예를 들어, 비극성 (소수성) 아미노산은 알라닌, 류신, 이소류신, 발린, 프롤린, 페닐알라닌, 트립토판, 및 메티오닌을 포함하고; 극성 중성 아미노산은 글리신, 세린, 트레오닌, 시스테인, 티로신, 아스파라긴, 및 글루타민을 포함하고; 양으로 하전된 (염기성) 아미노산은 아르기닌, 리신, 및 히스티딘을 포함하고; 음으로 하전된 (산성) 아미노산은 아스파르트산 및 글루탐산을 포함한다. 본 발명의 상황 내에서, 본 명세서에서 사용되는 유도체 폴리펩티드는 제한없이 효소적 활성을 포함하는, 임의의 다수 기준으로 판단하여 본래 폴리펩티드와 실질적으로 유사한 생체내 활성을 나타낼 수 있고, 번역 동안 또는 그 이후에 차등적으로 변형될 수 있는 폴리펩티드를 의미한다. 더 나아가서, 비-고전적인 아미노산 또는 화학적 아미노산 유사체는 본래 폴리펩티드 서열에 치환 또는 부가로서 도입될 수 있다.
일부 구현예에서, 본 개시는 본 발명에서 사용되는 효소의 구조를 변형시켜서 기능성 변이체를 만드는 것을 고려한다. 변이체는 아미노산 치환, 결실, 부가, 또는 이의 조합에 의해 제조될 수 있다. 예를 들어, 류신을 이소류신 또는 발린으로, 아스파테이트를 글루타메이트로, 트레오닌을 세린으로 단리된 치환, 또는 아미노산을 구조적으로 관련된 아미노산으로의 유사한 치환 (예를 들어, 보존성 돌연변이)은 최종 분자의 생물학적 활성에 대해 주요한 효과를 갖지 않을 것으로 예상하는 것이 타당하다. 보존성 치환은 그들 측쇄와 관련된 아미노산 패밀리 내에서 일어나는 것이다. 본 개시의 폴리펩티드의 아미노산 서열의 변화가 기능성 상동체를 생성시키는지 여부는 야생형 폴리펩티드와 유사한 방식으로 세포에서 반응을 생성시키는 변이체 폴리펩티드의 능력을 평가하여 쉽게 결정될 수 있다.
본 명세서에서 사용되는 용어 "기능성 상동체"는 서열 유사성을 갖고 또한 적어도 하나의 기능적 특징, 예컨대, 생화학적 활성을 공유하는 분자를 설명한다. 기능성 상동체는 전형적으로 유사하지만, 반드시 동일하지는 않은 정도로 동일한 특징을 일으키게 된다. 기능적으로 상동성인 단백질은 한 상동체에 의해 생성되는 정량적 측정이 다른 것의 적어도 10%; 보다 전형적으로, 적어도 20%, 약 30%와 약 40% 사이; 예를 들어, 약 50%와 약 60% 사이; 약 70%와 약 80% 사이; 또는 약 90%와 약 95% 사이; 약 98%와 약 100% 사이, 또는 본래 분자에 의해 생성되는 것의 100% 초과인 동일한 특징을 제공한다. 따라서, 분자가 효소적 활성을 갖는 경우에, 기능성 상동체는 본래 효소와 비교하여 상기-언급된 %의 효소적 활성을 갖게 된다. 분자가 DNA-결합 분자 (예를 들어, 폴리펩티드)인 경우에, 상동체는 본래 분자와 비교하여 결합된 분자의 중량으로 측정하여 상기-언급된 %의 결합 친화성을 갖게 된다.
기능성 상동체 및 기준 폴리펩티드는 천연 발생 폴리펩티드일 수 있고, 서열 유사성은 수렴 또는 분기 진화적 사건에 기인할 수 있다. 때때로 기능성 상동체는 오솔로그라고 하며, 여기서 "오솔로그"는 다른 종에서 기준이 되는 유전자 또는 단백질의 기능적으로 동등한 상동성 유전자 또는 단백질을 의미한다.
기능성 상동체는 뉴클레오티드 및 폴리펩티드 서열 정렬의 분석으로 확인될 수 있다. 예를 들어, 뉴클레오티드 또는 폴리펩티드 서열의 데이터베이스 상에서 조회의 수행은 생물량-조절 폴리펩티드의 상동체를 확인할 수 있다. 서열 분석은 기준 서열로서 생물량-조절 폴리펩티드의 아미노산 서열을 사용하는 비-중복 데이터베이스의 BLAST, 상호 BLAST, 또는 PSI-BLAST 분석을 포함할 수 있다. 아미노산 서열은 일부 예에서, 뉴클레오티드 서열로부터 추론된다. 전형적으로, 40% 초과의 서열 동일성을 갖는 데이터베이스의 폴리펩티드는 생물량-조절 폴리펩티드로서 적합성에 대한 추가 평가를 위한 후보이다. 아미노산 서열 유사성은 보존성 아미노산 치환, 예컨대, 한 소수성 잔기의 다른 것으로의 치환 또는 한 극성 잔기의 다른 것으로의 치환을 허용한다. 원하는 경우에, 이러한 후보의 수동 검사가 추가 평가하려는 후보의 수를 줄이기 위해 수행될 수 있다. 수동 검사는 생산성-조절 폴리펩티드에 존재하는 도메인, 예를 들어, 보존된 기능성 도메인을 갖는 것으로 보이는 후보를 선택하여서 수행될 수 있다.
폴리펩티드에 대한, "단편"은 폴리뉴클레오티드 분자의 클론 또는 임의 부분, 특히 전체 길이 폴리뉴클레오티드 분자의 이용가능한, 기능성 특징을 보유하는 폴리뉴클레오티드의 일부를 의미한다. 유용한 단편은 복제, 전사 또는 번역의 조절에서 또는 혼성화 또는 증폭 기술에서 사용될 수 있는 올리고뉴클레오티드 및 폴리뉴클레오티드를 포함한다. "폴리뉴클레오티드 단편"은 폴리뉴클레오티드 SEQ ID NO, 전형적으로, 본 명세서에서 제공되는 임의의 폴리뉴클레오티드 서열의 적어도 약 9, 10, 11, 12 연속 뉴클레오티드, 예를 들어 적어도 약 30 뉴클레오티드 또는 적어도 약 50 뉴클레오티드의, 임의 하위서열을 의미한다. 예시적인 단편은 추가적으로 또는 대안적으로 폴리펩티드의 보존된 패밀리 도메인을 코딩하는 영역을 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지는 단편을 포함할 수 있다. 예시적인 단편은 추가적으로 또는 대안적으로 폴리펩티드의 보존된 도메인을 포함하는 단편을 포함할 수 있다. 이와 같이, 폴리뉴클레오티드 SEQ ID NO의 단편은 바람직하게 상기 폴리뉴클레오티드 SEQ ID NO로서, 200, 150, 100, 50 또는 25개 이하의 연속 뉴클레오티드가 누락되고, 바람직하게 50개 이하의 연속 뉴클레오티드가 누락된 것인 폴리뉴클레오티드 SEQ ID NO를 포함하거나 또는 그로 이루어지고, 통상의 실험을 통해서 당업자가 평가할 수 있는 전체 길이 폴리뉴클레오티드 분자의 사용가능한, 기능적 특징 (예를 들어, 활성)을 보유하는 뉴클레오티드 서열을 의미한다. 대안적으로, 폴리뉴클레오티드 SEQ ID NO의 단편은 바람직하게 상기 폴리뉴클레오티드 SEQ ID NO로부터 연속 뉴클레오티드의 양을 포함하거나 또는 그로 이루어지고, 연속 뉴클레오티드의 상기 양은 상기 폴리뉴클레오티드 SEQ ID NO의 전체 길이의 적어도 50.0%, 60.0%, 70.0%, 80.0%, 81.0%, 82.0%, 83.0%, 84.0%, 85.0%, 86.0%, 87.0%, 88.0%, 89.0%, 90.0%, 91.0%, 92.0%, 93.0%, 94.0%, 95.0%, 95.5%, 96.0%, 96.5%, 97.0%, 97.5%, 98.0%, 98.5%, 99.0%, 99.5%, 100%, 바람직하게 적어도 80.0%, 보다 바람직하게 적어도 87.0%, 보다 더 바람직하게 적어도 90.0%, 보다 더 바람직하게 적어도 95.0%, 가장 바람직하게 적어도 97.0%이고, 전체 길이 폴리뉴클레오티드 분자의 사용가능한, 기능적 특성 (예를 들어, 활성)을 보유하는 뉴클레오티드 서열을 의미한다. 이와 같이, 폴리뉴클레오티드 SEQ ID NO의 단편은 바람직하게 상기 폴리뉴클레오티드 SEQ ID NO를 포함하거나 또는 그로 이루어지고, 연속 뉴클레오티드의 양은 누락되고, 상기 양은 상기 폴리뉴클레오티드 SEQ ID NO의 전체 길이의 50.0%, 40.0%, 30.0% 이하이고, 바람직하게 상기 폴리뉴클레오티드 SEQ ID NO의 전체 길이의 20.0%, 15.0%, 10.0%, 9.0%, 8.0%, 7.0%, 6.0%, 5.0%, 4.5%, 4.0%, 3.5%, 3.0%, 2.5%, 2.0%, 1.5%, 1.0%, 0.5% 이하, 보다 바람직하게 15.0% 이하, 보다 더 바람직하게 10.0% 이하, 보다 더 바람직하게 5.0% 이하, 가장 바람직하게 2.5% 이하인 뉴클레오티드 서열을 의미하고, 상기 단편은 당업자게 통상적으로 평가할 수 있는 전체 길이의 폴리뉴클레오티드 분자의 사용가능한, 기능성 특징 (예를 들어, 활성)을 보유한다.
단편은 추가적으로 또는 대안적으로 폴리펩티드 및 단백질 분자의 하위서열, 또는 폴리펩티드의 하위서열을 포함할 수 있다. 일부 경우에, 단편 또는 도메인은 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 또는 유사한 정도까지, 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드의 하위서열이다. 본 명세서에 정의된 바와 같은 "폴리펩티드의 하위서열"은 폴리펩티드로부터 유래되는 연속 아미노산 잔기의 서열을 의미한다. 예를 들어, 폴리펩티드 단편은 인식가능한 구조적 모티프 또는 기능적 도메인 예컨대, DNA-결합 부위 또는 DNA 프로모터 영역에 결합하는 도메인, 활성화 도메인, 또는 단백질-단백질 상호작용을 위한 도메인을 포함할 수 있고, 전사를 개시할 수 있다. 단편은 3 아미노산 잔기부터 온전한 폴리펩티드의 전체 길이까지, 예를 들어, 적어도 10 아미노산 잔기 길이, 예를 들어, 적어도 약 20 아미노산 잔기 길이, 예를 들어, 적어도 약 30 아미노산 잔기 길이까지 크기가 다양할 수 있다. 우선적으로, 단편은 유래되는 폴리펩티드의 적어도 하나의 성질 또는 활성을 갖는 기능성 단편이고, 예컨대, 예를 들어, 단편은 폴리펩티드의 기능성 도메인 또는 보존성 도메인을 포함할 수 있다. 이와 같이, 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 단편은 바람직하게 80, 60, 50, 40, 30, 20 또는 15개 이하의 연속 아미노산 잔기가 누락되고, 바람직하게 40 이하의 연속 아미노산 잔기가 누락된 것인 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)를 포함하거나 또는 그로 이루어지고, 당업자가 통상적으로 평가할 수 있는 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 바람직하게 유사하거나 또는 더 큰 정도까지 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드 서열을 의미한다. 대안적으로, 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 단편은 바람직하게 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)로부터 연속 아미노산 잔기의 양을 포함하거나 또는 그로 이루어지고, 연속 아미노산 잔기의 상기 양은 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 전체 길이의 적어도 50.0%, 60.0%, 70.0%, 80.0%, 81.0%, 82.0%, 83.0%, 84.0%, 85.0%, 86.0%, 87.0%, 88.0%, 89.0%, 90.0%, 91.0%, 92.0%, 93.0%, 94.0%, 95.0%, 95.5%, 96.0%, 96.5%, 97.0%, 97.5%, 98.0%, 98.5%, 99.0%, 99.5%, 100%, 바람직하게 적어도 80.0%, 보다 바람직하게 적어도 87.0%, 보다 더 바람직하게 적어도 90.0%, 보다 더 바람직하게 적어도 95.0%, 가장 바람직하게 적어도 97.0%이고, 당업자가 통상적으로 평가할 수 있는 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 바람직하게 유사하거나 또는 더 큰 정도까지 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드 서열을 의미한다. 이와 같이, 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 단편은 바람직하게 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)를 포함하거나 또는 그로 이루어지고, 연속 아미노산 잔기의 양이 누락되고, 상기 양은 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 전체 길이의 50.0%, 40.0%, 30.0% 이하, 바람직하게 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 전체 길이의 20.0%, 15.0%, 10.0%, 9.0%, 8.0%, 7.0%, 6.0%, 5.0%, 4.5%, 4.0%, 3.5%, 3.0%, 2.5%, 2.0%, 1.5%, 1.0%, 0.5% 이하, 보다 바람직하게 15.0% 이하, 보다 더 바람직하게 10.0% 이하, 보다 더 바람직하게 5.0% 이하, 가장 바람직하게 2.5% 이하이고, 당업자가 통상적으로 평가할 수 있는 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 바람직하게 유사하거나 또는 더 큰 정도까지 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드 서열을 의미한다.
출원 전반에서, 폴리펩티드의 서열은 SEQ ID NO 또는 대안적으로 UniProt ID로 표시될 수 있다. 그러므로, 용어 "폴리펩티드 SEQ ID NO" 및 "폴리펩티드 UniProt ID"는 달리 명확하게 명시하지 않으면, 상호교환적으로 사용될 수 있다.
폴리펩티드의 "기능성 단편"은 바람직하게 유사하거나 또는 더 큰 정도까지, 유래되는 폴리펩티드의 적어도 하나의 성질 또는 활성을 갖는다. 기능성 단편은 예를 들어, 폴리펩티드의 기능성 도메인 또는 보존성 도메인을 포함할 수 있다. 폴리펩티드 또는 이의 단편은 폴리펩티드의 활성에 실질적으로 효과를 갖지 않는 보존성 아미노산 치환을 가질 수 있다는 것을 이해한다. 보존성 치환이란 한 소수성 아미노산의 다른 것으로의 치환 또는 한 극성 아미노산의 다른 것으로의 치환 또는 한 산성 아미노산의 다른 것으로의 치환 또는 한 염기성 아미노산의 다른 것으로의 치환 등을 의도한다. 바람직하게, 보존성 치환이란 예컨대, 글리신의 알라닌으로 및 그 반대; 발린, 이소류신 및 류신의 메티오닌으로 및 그 반대; 아스파테이트의 글루타메이트로 및 그 반대; 아스파라긴의 글루타민으로 및 그 반대; 세린의 트레오닌으로 및 그 반대; 리신의 아르기닌으로 및 그 반대; 시스테인의 메티오닌으로 및 그 반대; 및 페닐알라닌 및 티로신의 트립토판으로 및 그 반대와 같은 조합을 의도한다.
본 명세서에서 사용되는 상동성 서열은 서열 유사성을 갖고, 적어도 하나의 기능성 특징, 예컨대, 생화학적 활성을 공유하는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 설명한다. 보다 특히, 본 명세서에서 사용되는 용어 "기능성 상동체"는 서열 유사성 (다른 말로, 상동성)을 갖고, 동시에 적어도 하나의 기능적 유사성 예컨대, 생화학적 활성을 갖는 폴리펩티드를 설명한다 (Altenhoff et al., PLoS Comput. Biol. 8 (2012) e1002514).
상동체는 뉴클레오티드 및 폴리펩티드 서열 정렬의 분석을 통해서 확인될 수 있다. 예를 들어, 뉴클레오티드 또는 폴리펩티드 서열의 데이터베이스 상에서 조회의 수행은 관심 폴리펩티드의 상동체, 예컨대, 예를 들어, 생물량-조절 폴리펩티드, 글리코실트랜스퍼라제, 뉴클레오티드-활성화된 당 합성에 관여되는 단백질 또는 막 수송체 단백질을 확인할 수 있다. 서열 분석은 각각 기준 서열로서, 생물량-조절 폴리펩티드, 글리코실트랜스퍼라제, 뉴클레오티드-활성화된 당 합성에 관여되는 단백질 또는 막 수송체 단백질의 아미노산 서열을 사용하는 비-중복 데이터베이스의 BLAST, 상호 BLAST, 또는 PSI-BLAST 분석을 포함한다. 아미노산 서열은 일부 예에서, 뉴클레오티드 서열로부터 추론된다. 전형적으로, 40% 초과의 서열 동일성을 갖는 데이터베이스의 폴리펩티드는 각각 생물량-조절 폴리펩티드, 글리코실트랜스퍼라제, 뉴클레오티드-활성화된 당 합성에 관여되는 단백질 또는 막 수송체 단백질로서 적합성에 대한 추가 평가를 위한 후보이다. 아미노산 서열 유사성은 보존성 아미노산 치환, 예컨대, 한 소수성 잔기의 다른 것으로의 치환 또는 한 극성 잔기의 다른 것으로의 치환 또는 한 산성 아미노산의 다른 것으로의 치환 또는 한 염기성 아미노산의 다른 것으로의 치환 등을 허용한다. 바람직하게, 보존성 치환이란 예컨대, 글리신의 알라닌으로 및 그 반대; 발린, 이소류신 및 류신의 메티오닌으로 및 그 반대; 아스파테이트의 글루타메이트로 및 그 반대; 아스파라긴의 글루타민으로 및 그 반대; 세린의 트레오닌으로 및 그 반대; 리신의 아르기닌으로 및 그 반대; 시스테인의 메티오닌으로 및 그 반대; 및 페닐알라닌 및 티로신의 트립토판으로 및 그 반대같은 조합을 의도한다. 원하는 경우에, 이러한 후보의 수동 검사는 추가 평가하려는 후보의 수를 줄이기 위해 수행될 수 있다. 수동 검사는 생산성-조절 폴리펩티드에 존재하는 도메인, 예를 들어, 보존된 기능성 도메인을 갖는 것으로 보이는 후보를 선택하여 수행될 수 있다.
도메인은 예를 들어, Pfam (El-Gebali et al., Nucleic Acids Res. 47 (2019) D427-D432), 단백질 핑거프린트 도메인 (PRINTS) (Attwood et al., Nucleic Acids Res. 31 (2003) 400-402), SUBFAM 도메인 (Gough et al., J. Mol. Biol. 313 (2001) 903-919), TIGRFAM 도메인 (Selengut et al., Nucleic Acids Res. 35 (2007) D260-D264), 보존 도메인 데이터베이스 (CDD) (https://www.ncbi.nlm.nih.gov/cdd) (Lu et al., Nucleic Acids Res. 48 (2020) D265-D268) 지정, PTHR 도메인 (http://www.pantherdb.org) (Mi et al., Nucleic Acids. Res. 41 (2013) D377-D386; Thomas et al., Genome Research 13 (2003) 2129-2141), IPR (InterPro 도메인) (Mitchell et al., Nucleic Acids Res. 47 (2019) D351-D360) 또는 PATRIC 식별자 또는 PATRIC DB 글로벌 패밀리 도메인 (https://www.patricbrc.org/) (Davis et al., Nucleic Acids Res. 48(D1) (2020) D606-D612)를 통해서 특징규명될 수 있다.
PANTHER (Protein ANalysis THrough Evolutionary Relationships) 분류 체계는 고처리량 분석을 용이하게 하기 위해서 단백질 (및 그들 유전자)을 분류하도록 디자인되었다. 단백질은 다음에 따라서 분류되었다: (a) 패밀리 및 서브패밀리: 패밀리는 진화적으로 관련된 단백질의 그룹이고; 서브패밀리는 또한 동일한 기능을 갖는 관련 단백질이다; (b) 분자적 기능: 생화학적 수준에서 직접 상호작용하는 단백질, 예를 들어 단백질 키나제와 함께 또는 단백질 그 자체의 기능; (c) 생물학적 과정: 세포 또는 유기체의 수준에서 과정, 예를 들어 유사분열을 수행하도록 상호작용하는 단백질의 더 큰 네트워크의 상황에서 단백질의 기능; (d) 경로: 생물학적 과정과 유사하지만, 또한 상호작용 분자 간 관계를 명시적으로 지정하는 경로.
InterPro는 그들을 패밀리로 분류하고 도메인 및 중요한 부위를 예측하여 단백질의 기능적 분석을 제공한다. 이러한 방식으로 단백질을 분류하기 위해서, InterPro는 InterPro 컨소시움을 구성하는 몇몇 상이한 데이터베이스 (구성원 데이터베이스라고함)에 의해 제공되는, 서명이라고 알려진 예측 모델을 사용한다. 이들 구성원 데이터베이스로부터의 단백질 서명은 단일한 검색가능한 소스로 결합되어서, 그들의 개별 강도를 활용하여 강력한 통합 데이터베이스 및 진단 도구를 생성한다.
각 데이터베이스의 내용은 각 배포에서 고정되고 변화되지 않는다. 특정 데이터베이스의 내용이 변화되면, 이러한 특정 데이터베이스는 새로운 배포일을 갖는 새로운 배포 형태를 받는다. 그들의 해당 배포일 및 이들 특정 배포일에 주석달린 특정 내용을 갖는 각 데이터베이스에 대한 모든 배포 형태가 입수가능하고 당업자에게 공지되어 있다. 본 명세서에서 사용되는 PANTHER (PTHR) 데이터베이스 (http://www.pantherdb.org)는 2020-09-10에 배포된 PANTHER 15.0이다. 본 명세서에서 사용되는 InterPro 데이터베이스 (http://ebi.ac.uk/interpro)는 2020-10-08에 배포된 InterPro 82.0이다.
단백질 또는 폴리펩티드 서열 정보 및 기능적 정보는 단백질 서열 및 주석 데이터에 대한 종합 리소스 예컨대, 예를 들어 Universal Protein Resource (UniProt) (www.uniprot.org) (Nucleic Acids Res. 2021, 49(D1), D480-D489)에 의해 제공될 수 있다. UniProt는 UniProt Reference Clusters (UniRef) 및 UniProt Archive (UniParc)와 함께, UniProt Knowledgebase (UniProtKB)라고 불리는 전문적이고 풍부하게 선별된 단백질 데이터베이스를 포함한다. UniProt 식별자 (UniProt ID)는 데이터베이스에 존재하는 각 단백질에 대해 고유하다.
둘 이상의 핵산 또는 폴리펩티드 서열의 상황에서 용어 "동일한" 또는 "퍼센트 동일성" 또는 "% 동일성"은 서열 비교 알고리즘을 사용하거나 또는 육안 검사를 통해 측정하여, 최대 상응도를 위해 비교 및 정렬될 때, 동일한 아미노산 잔기 또는 뉴클레오티드의 명시된 %를 갖거나 또는 동일한 둘 이상의 서열 또는 하위서열을 의미한다. 서열 비교를 위해서, 한 서열은 시험 서열이 비교되는 기준 서열로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열은 컴퓨터에 입력되고, 하위서열 좌표가 필요한 경우 지정되고, 서열 알고리즘 프로그램 매개변수가 지정된다. 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로, 기준 서열에 대해서 시험 서열(들)에 대한 서열 동일성%를 계산한다. 서열 동일성의 %는 바람직하게 2개 서열의 정렬 및 더 짧은 서열의 잔기 개수로 나눈 동일한 잔기를 갖는 위치의 개수 x100의 확인에 의해 결정된다. 동일성은 소정 SEQ ID NO, 즉 기준 서열의 전체 길이 서열 상에서 전반적으로 계산되어서, 전체 동일성% 점수를 생성시킬 수 있다. 대안적으로, %동일성은 기준 서열의 부분 서열 상에서 계산되어서, 국소 동일성% 점수를 생성시킬 수 있다. 부분 서열은 바람직하게 전체 길이 기준 서열의 적어도 50%, 60%, 70%, 80%, 90% 또는 95%를 의미한다. 다른 바람직한 구현예에서, 기준 폴리펩티드 서열의 부분 서열은 적어도 200 아미노산 잔기 내지 기준 폴리펩티드 서열의 아미노산 잔기의 총 개수까지 범위를 의미한다. 국소 서열 정렬에서 기준 서열의 전체 길이 사용은 시험 및 기준 서열 간에 전체 동일성% 점수를 생성시킨다. % 동일성은 상이한 알고리즘 예컨대, 예를 들어, BLAST 및 PSI-BLAST (Altschul et al., 1990, J Mol Biol 215:3, 403- 410; Altschul et al., 1997, Nucleic Acid Res 25: 17, 3389-402), Clustal Omega 방법 (Sievers et al., 2011, Mol. Syst. Biol. 7:539), MatGAT 방법 (Campanella et al., 2003, BMC Bioinformatics, 4:29) 또는 EMBOSS Needle (https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)을 사용해 결정될 수 있다.
BLAST (Basic Local Alignment Search Tool)) 정렬 방법은 디폴트 매개변수를 사용해 서열을 비교하기 위해 NCBI (National Center for Biotechnology Information)가 제공하는 알고리즘이다. 이 프로그램은 뉴클레오티드 또는 단백질 서열을 서열 데이터베이스와 비교하여 통계적 유의성을 계산한다. PSI-BLAST (Position-Specific Iterative Basic Local Alignment Search Tool)는 단백질-단백질 BLAST (BLASTp)를 사용해 상기 소정 점수 한계치 이상에서 검출되는 서열의 다수 서열 정렬로부터 위치-특이적 채점 매트릭스 (PSSM) 또는 프로파일을 유도시킨다. BLAST 방법은 쌍별 또는 다수 서열 정렬에 사용될 수 있다. 쌍별 서열 정렬은 2개 생물학적 서열 (단백질 또는 핵산) 간에 기능적, 구조적 및/또는 진화적 관계를 의미할 수 있는 유사성의 영역을 확인하는데 사용된다. BLAST에 대한 웹 인터페이스는 https://blast.ncbi.nlm.nih.gov/Blast.cgi에서 입수가능하다.
Clustal Omega (Clustal Ω)는 3개 이상의 서열 간에 정렬을 생성시키기 위해서 씨딩된 가이드 트리 및 HMM 프로파일-프로파일 기술을 사용하는 다수 서열 정렬 프로그램이다. 분기 서열의 생물학적으로 의미있는 다수 서열 정렬을 생성시킨다. Clustal Ω에 대한 웹 인터페이스는 https://www.ebi.ac.uk/Tools/msa/clustalo/에서 입수가능하다. Clustal Ω를 사용하는 다수 서열 정렬에 대한 디폴트 매개변수 및 단백질 서열의 % 동일성의 계산은 입력 서열의 탈-정렬 활성화: FALSE; mbed-유사 클러스터링 가이드-트리 활성화: TRUE; mbed-유사 클러스터링 반복 활성화: TRUE; (조합된 가이드-트리/HMM) 반복 횟수: 디폴트(0); 최대 가이드 트리 반복: 디폴트 [-1]; 최대 HMM 반복: 디폴트 [-1]; 순서: 정렬됨.
MatGAT (Matrix Global Alignment Tool)는 데이터의 사전 정렬 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 매트릭스를 생성하는 컴퓨터 어플리케이션이다. 프로그램은 Myers 및 Miller 글로벌 정렬 알고리즘을 사용하여 일련의 쌍별 정렬을 수행하고, 유사성 및 동일성을 계산한 다음에, 그 결과를 거리 매트릭스에 배치한다. 사용자는 그들 단백질 서열 검사에 사용하기 위한 정렬 매트릭스 (예를 들어, BLOSUM50, BLOSUM62, 및 PAM250) 유형을 지정할 수 있다.
EMBOSS Needle (https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)은 그들의 전체 길이를 고려했을 때 2개 서열의 최적 정렬 (갭 포함)를 찾기 위해 Needleman-Wunsch 글로벌 정렬 알고리즘을 사용한다. 최적 정렬은 모든 가능한 정렬을 탐색하고 최상을 선택하여서 동적 프로그래밍 방법으로 보장된다. Needleman-Wunsch 알고리즘은 최상의 점수를 계산하고 mn 단계 (여기서 'n' 및 'm'은 2개 서열의 길이임)의 순서로 정렬할 수 있는 알고리즘 클래스의 구성원이다. 갭 개방 패널티 (디폴트 10.0)는 갭이 생성될 때 제거되는 점수이다. 디폴트 값은 단백질 서열에 대해 EBLOSUM62 매트릭스를 사용하는 것으로 가정한다. 갭 연장 (디폴트 0.5) 패널티는 갭에서 각각의 염기 또는 잔기에 대한 표준 갭 패널티에 첨가된다. 이것은 얼마나 긴 갭이 패널티를 받는가이다.
본 발명의 목적을 위해서, % 동일성은 MatGAT2.01를 사용해 결정된다 (Campanella et al., 2003, BMC Bioinformatics 4:29). 단백질에 대해서 하기 디폴트 매개변수가 적용된다: (1) 갭 비용 존재: 12 및 확장: 2; (2) 적용된 매트릭스는 BLOSUM65였다.
본 명세서에서 사용되는 용어 "글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제"는 D-프룩토스-6-포스페이트 + L-글루타민의 D-글루코사민-6-포스페이트 + L-글루타메이트로의 전환을 촉매하는 효소를 의미한다. 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 헥소사민 생합성 경로의 제1 및 속도-제한 효소이다. 헥소사민 경로의 최종 생산물은 UDP-N-아세틸글루코사민 또는 UDP-GlcNAc이다. 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 PANTHER 분류 체계 (www.pantherdb.org)에서 주석달린 바와 같은 PTHR10937 도메인의 존재 또는 InterPro 분류 체계 (https://www.ebi.ac.uk/interpro/entry/InterPro/IPR005855/)에서 주석달린 바와 같은 IPR005855 도메인의 존재를 특징으로 한다. 이러한 유형의 효소에 대한 대체 명칭은 글루타민--프룩토스-6-포스페이트 트랜사미나제 (이성질체화), D-프룩토스-6-포스페이트 아미도트랜스퍼라제, GlcN6P 신타제, 글루코사민 6-포스페이트 신타제, 글루코사민-6-포스페이트 이소머라제 (글루타민-형성), 글루코사민포스페이트 이소머라제, 헥소스포스페이트 아미노트랜스퍼라제, 글루코사민-6-포스페이트 신타제, L-글루타민-D-프룩토스-6-포스페이트 아미도트랜스퍼라제 및 L-글루타민:D-프룩토스-6-포스페이트 이소머라제 (탈아미노화)를 포함한다. 본 명세서에서 사용되는 용어 "GFA1" 및 "GFAT"는 상호교환적으로 사용되고 예를 들어, 에스. 세레비지아에 (S. cerevisiae), 칸디다 알비칸스 (Candida albicans), 스키조사카로마이세스 폼베 (Schizosaccharomyces pombe), 및 스포로트릭스 스켄크키 (Sporothrix schenckii)에서 발견되는 바와 같은 효모 및 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 의미한다. 용어 "glmS"는 GFA1의 유사체이고, 예를 들어, 이.콜라이 K-12 균주, 이.콜라이 O6:H1, 이.콜라이 O157:H7, 파스퇴렐라 멀토시다 (Pasteurella multocida) 및 네이세리아 메닌지티디스 (Neisseria meningitidis) 혈청군 B (균주 MC58)에서 발견되는 바와 같은 원핵생물 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 의미한다.
글루코사민 6-포스페이트 N-아세틸트랜스퍼라제는 아세틸-CoA로부터 D-글루코사민-6-포스페이트로 아세틸 기의 전달을 촉매하여서 유리 CoA 및 N-아세틸-D-글루코사민 6-포스페이트를 생성시키는 효소이다. 대체 명칭은 아미노데옥시글루코스포스페이트 아세틸트랜스퍼라제, D-글루코사민-6-P N-아세틸트랜스퍼라제, 글루코사민 6-포스페이트 아세틸라제, 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, 글루코사민-6-포스페이트 아세틸라제, N-아세틸글루코사민-6-포스페이트 신타제, 포스포글루코사민 아세틸라제, 포스포글루코사민 N-아세틸라제, 포스포글루코사민 트랜스아세틸라제, GNA 및 GNA1을 포함한다. 포스포아세틸글루코사민 뮤타제는 N-아세틸-D-글루코사민 6-포스페이트의 N-아세틸-D-글루코사민-1-포스페이트로의 전환을 촉매하는 효소이다. 대체 명칭은 PAGM, 아세틸글루코사민 포스포뮤타제, N-아세틸글루코사민-포스페이트 뮤타제 및 PGM-보완 단백질 1을 포함한다. UDP-N-아세틸글루코사민 파이로포스포릴라제는 N-아세틸-D-글루코사민 1-포스페이트로부터 UDP-N-아세틸-D-글루코사민의 합성에 관여되는 효소이다. 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제는 베타 1,3 연결로 갈락토스 단위에 UDP-GlcNAc의 전달을 촉매하는 효소이다. UTP--글루코스-1-포스페이트 우리딜릴트랜스퍼라제는 글루코스-1-포스페이트 및 UTP로부터 UDP-글루코스를 합성하는 효소이다. 대체 명칭은 알파-D-글루코실-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 파이로포스포릴라제, UDPGP 및 우리딘 디포스포글루코스 파이로포스포릴라제를 포함한다. UDP-글루코스 4-에피머라제는 UDP-갈락토스로 UDP-글루코스의 가역적 전환을 촉매하는 효소이다. 대체 명칭은 갈락토발데나제 및 UDP-갈락토스 4-에피머라제를 포함한다. N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제는 베타 1,3-연결로 글리칸 사슬 중 말단 GlcNAc 잔기로 UDP-갈락토스 도너로부터 갈락토스의 전달을 촉매하는 효소이다. N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제는 베타 1,4-연결로 글리칸 사슬 중 말단 GlcNAc 잔기로 UDP-갈락토스 도너로부터 갈락토스의 전달을 촉매하는 효소이다. 락토스 퍼미아제는 락토스의 통과를 촉진하는 막 단백질이다. UDP-N-아세틸글루코사민 2-에피머라제 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스 2-에피머라제는 UDP-N-아세틸만노사민 (UDP-ManNAc)으로 UDP-N-아세틸글루코사민 (UDP-GlcNAc)의 가역적 전환을 촉매하는 효소이다. N-아세틸뉴라미네이트 신타제 또는 N-아세틸뉴라민산 신타제는 N-아세틸뉴라미네이트 (또는 시알산, Neu5Ac)로 N-아세틸만노사민 (ManNAc)의 전환을 촉매하는 효소이다. N-아실뉴라미네이트 시티딜릴트랜스퍼라제는 CMP-N-아세틸뉴라민산 또는 CMP-Neu5Ac로 N-아세틸뉴라미네이트의 전환을 촉매하는 효소이다. 대체 명칭은 CMP-N-아세틸뉴라민산 신타제 및 CMP-NeuNAc 신타제를 포함한다. 글루코스-6-포스페이트 이소머라제는 글루코스-6-포스페이트 및 프룩토스-6-포스페이트의 상호전환을 촉매하는 효소이다. 대체 명칭은 포스포글루코스 이소머라제/포스포글루코이소머라제 (PGI) 및 포스포헥소스 이소머라제 (PHI)를 포함한다.
본 명세서에서 사용되는 용어 "글리코실트랜스퍼라제"는 활성화된 도너 분자로부터 특이적 억셉터 분자로 당 모이어티의 전달을 촉매할 수 있어서, 글리코시드 결합을 형성하는 효소를 의미한다. 이와 같이 합성된 올리고당은 선형 또는 분지형일 수 있고, 다수의 단당 빌딩 블록을 함유할 수 있다. 뉴클레오티드 디포스포-당, 뉴클레오티드 모노포스포-당 및 당 포스페이트를 사용하는 글리코실트랜스퍼라제 및 관련 단백질의 별기 서열-기반 패밀리로의 분류가 기술되어 있고 (Campbell et al., Biochem. J. 326, 929-939 (1997)), CAZy (CArbohydrate-Active EnZymes) 웹사이트 (www.cazy.org)에서 입수가능하다.
본 명세서에서 사용되는 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제 및 푸코사미닐트랜스퍼라제를 포함하지만 이에 제한되지 않는 목록으로부터 선택될 수 있다.
푸코실트랜스퍼라제는 GDP-푸코스 (GDP-Fuc) 도너로부터 글리칸 억셉터로 푸코스 잔기 (Fuc)를 전달하는 글리코실트랜스퍼라제이다. 푸코실트랜스퍼라제는 알파-글리코시드 결합을 통해서 GDP-Fuc로부터 글리칸 억셉터로 Fuc 잔기의 전달을 촉매하는 알파-1,2-푸코실트랜스퍼라제, 알파-1,3-푸코실트랜스퍼라제, 알파-1,3/4-푸코실트랜스퍼라제, 알파-1,4-푸코실트랜스퍼라제 및 알파-1,6-푸코실트랜스퍼라제를 포함한다. 푸코실트랜스퍼라제는 GT10, GT11, GT23, GT65 및 GT68 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 시알릴트랜스퍼라제는 시알릴 기 (예컨대 Neu5Ac 또는 Neu5Gc)를 도너 (예컨대 CMP-Neu5Ac 또는 CMP-Neu5Gc)로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. 시알릴트랜스퍼라제는 알파-글리코시드 결합을 통해 글리칸 억셉터로 시알릴 기의 전달을 촉매하는 알파-2,3-시알릴트랜스퍼라제, 알파-2,6-시알릴트랜스퍼라제 및 알파-2,8-시알릴트랜스퍼라제를 포함한다. 시알릴트랜스퍼라제는 GT29, GT42, GT80 및 GT97 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 갈락토실트랜스퍼라제는 갈락토실 기 (Gal)를 UDP-갈락토스 (UDP-Gal) 도너로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. 갈락토실트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해 글리칸 억셉터에 UDP-Gal로부터 Gal 잔기를 전달하는 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, 베타-1,4-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 알파-1,3-갈락토실트랜스퍼라제 및 알파-1,4-갈락토실트랜스퍼라제를 포함한다. 갈락토실트랜스퍼라제는 GT2, GT6, GT8, GT25 및 GT92 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 글루코실트랜스퍼라제는 글루코실 기 (Glc)를 UDP-글루코스 (UDP-Glc) 도너로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. 글루코실트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해 글리칸 억셉터로 UDP-Glc로부터 Glc 잔기를 전달하는 알파-글루코실트랜스퍼라제, 베타-1,2-글루코실트랜스퍼라제, 베타-1,3-글루코실트랜스퍼라제 및 베타-1,4-글루코실트랜스퍼라제를 포함한다. 글루코실트랜스퍼라제는 GT1, GT4 및 GT25 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 만노실트랜스퍼라제는 만노스 기 (Man)를 GDP-만노스 (GDP-Man) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 만노실트랜스퍼라제는 알파-글리코시드 결합을 통해 글리칸 억셉터로 GDP-Man으로부터 Man 잔기를 전달하는 알파-1,2-만노실트랜스퍼라제, 알파-1,3-만노실트랜스퍼라제 및 알파-1,6-만노실트랜스퍼라제를 포함한다. 만노실트랜스퍼라제는 GT22, GT39, GT62 및 GT69 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸글루코사미닐트랜스퍼라제는 N-아세틸글루코사민 기 (GlcNAc)를 UDP-N-아세틸글루코사민 (UDP-GlcNAc) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. N-아세틸글루코사미닐트랜스퍼라제는 GT2 및 GT4 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제는 N-아세틸글루코사미닐트랜스퍼라제의 일부이고, 베타-1,3-연결을 통해서 기질에 존재하는 말단 갈락토스 단위로 UDP-GlcNAc 도너로부터 GlcNAc를 전달한다. 베타-1,6-N-아세틸글루코사미닐트랜스퍼라제는 베타-1,6-연결을 통해서 기질에 UDP-GlcNAc 도너로부터 GlcNAc를 전달하는 N-아세틸글루코사미닐트랜스퍼라제이다. N-아세틸갈락토사미닐트랜스퍼라제는 N-아세틸갈락토사민 기 (GalNAc)를 UDP-N-아세틸갈락토사민 (UDP-GalNAc) 도너로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. N-아세틸갈락토사미닐트랜스퍼라제는 GT7, GT12 및 GT27 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 알파-1,3-N-아세틸갈락토사미닐트랜스퍼라제는 N-아세틸갈락토사미닐트랜스퍼라제의 일부이고, 알파-1,3-연결을 통해서 UDP-GalNAc 도너로부터 기질로 GalNAc를 전달한다. N-아세틸만노사미닐트랜스퍼라제는 N-아세틸만노사민 기 (ManNAc)를 UDP-N-아세틸만노사민 (UDP-ManNAc) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 자일로실트랜스퍼라제는 자일로스 잔기 (Xyl)를 UDP-자일로스 (UDP-Xyl) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 자일로실트랜스퍼라제는 GT14, GT61 및 GT77 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 글루쿠로닐트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해서 UDP-글루쿠로네이트 도너로부터 글리칸 억셉터로 글루쿠로네이트를 전달하는 글리코실트랜스퍼라제이다. 글루쿠로닐트랜스퍼라제는 GT4, GT43 및 GT93 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 갈락투로닐트랜스퍼라제는 갈락투로네이트를 UDP-갈락투로네이트 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. N-글리코릴뉴라미닐트랜스퍼라제는 N-글리코릴뉴라민산 기 (Neu5Gc)를 CMP-Neu5Gc 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 람노실트랜스퍼라제는 람노스 잔기를 GDP-람노스 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 람노실트랜스퍼라제는 GT1, GT2 및 GT102 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸람노실트랜스퍼라제는 N-아세틸람노사민 잔기를 UDP-N-아세틸-L-람노사민 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제는 플라젤린을 변형시키는데 사용되는 시알산-유사 당인, 슈다민산의 생합성에서 UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스를 사용하는 글리코실트랜스퍼라제이다. UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 (murA)는 에놀피루빌 기를 포스포에놀피루베이트 (PEP)로부터 UDP-N-아세틸글루코사민 (UDPAG)으로 전달하여 UDP-N-아세틸글루코사민 에놀피루베이트를 형성하는 글리코실트랜스퍼라제이다. 푸코사미닐트랜스퍼라제는 N-아세틸푸코사민 잔기를 dTDP-N-아세틸푸코사민 또는 UDP-N-아세틸푸코사민 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다.
용어 "뉴클레오티드-당", "활성화된 당", "뉴클레오시드", "활성화된 단당", "뉴클레오티드-활성화된 당" 또는 "뉴클레오티드 도너"는 본 명세서에서 상호교환적으로 사용되고, 단당의 활성화된 형태를 의미한다. 활성화된 단당의 예는 UDP-N-아세틸글루코사민 (UDP-GlcNAc), UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), GDP-L-퀴노보스, CMP-시알산 (CMP-Neu5Ac 또는 CMP-N-아세틸뉴라민산), CMP-Neu4Ac, CMP-Neu5Ac9N3, CMP-Neu4,5Ac2, CMP-Neu5,7Ac2, CMP-Neu5,9Ac2, CMP-Neu5,7(8,9)Ac2, CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하지만, 이에 제한되지 않는다. 뉴클레오티드-당은 글리코실화 반응에서 글리코실 도너로서 작용한다. 글리코실화 반응은 글리코실트랜스퍼라제에 의해 촉매되는 반응이다.
본 명세서에서 사용되는 용어 "단당"은 가수분해에 의해서 더 단순한 당으로 분해될 수 없고, 알도스 또는 케토스로 분류되며, 분자 당 하나 이상의 히드록실 기를 함유하는 당을 의미한다. 단당은 오직 하나의 단순 당을 함유하는 당류이다. 단당의 예는 헥소스, D-글루코피라노스, D-갈락토푸라노스, D-갈락토피라노스, L-갈락토피라노스, D-만노피라노스, D-알로피라노스, L-알트로피라노스, D-굴로피라노스, L-이도피라노스, D-탈로피라노스, D-리보푸라노스, D-리보피라노스, D-아라비노푸라노스, D-아라비노피라노스, L-아라비노푸라노스, L-아라비노피라노스, D-자일로피라노스, D-릭소피라노스, D-에리트로푸라노스, D-트레오푸라노스, 헵토스, L-글리세로-D-만노-헵토피라노스 (LDmanHep), D-글리세로-D-만노-헵토피라노스 (DDmanHep), 6-데옥시-L-알트로피라노스, 6-데옥시-D-굴로피라노스, 6-데옥시-D-탈로피라노스, 6-데옥시-D-갈락토피라노스, 6-데옥시-L-갈락토피라노스, 6-데옥시-D-만노피라노스, 6-데옥시-L-만노피라노스, 6-데옥시-D-글루코피라노스, 2-데옥시-D-아라비노-헥소스, 2-데옥시-D-에리트로-펜토스, 2,6-디데옥시-D-아라비노-헥소피라노스, 3,6-디데옥시-D-아라비노-헥소피라노스, 3,6-디데옥시-L-아라비노-헥소피라노스, 3,6-디데옥시-D-자일로-헥소피라노스, 3,6-디데옥시-D-리보-헥소피라노스, 2,6-디데옥시-D-리보-헥소피라노스, 3,6-디데옥시-L-자일로-헥소피라노스, 2-아미노-2-데옥시-D-글루코피라노스, 2-아미노-2-데옥시-D-갈락토피라노스, 2-아미노-2-데옥시-D-만노피라노스, 2-아미노-2-데옥시-D-알로피라노스, 2-아미노-2-데옥시-L-알트로피라노스, 2-아미노-2-데옥시-D-굴로피라노스, 2-아미노-2-데옥시-L-이도피라노스, 2-아미노-2-데옥시-D-탈로피라노스, 2-아세타미도-2-데옥시-D-글루코피라노스, 2-아세타미도-2-데옥시-D-갈락토피라노스, 2-아세타미도-2-데옥시-D-만노피라노스, 2-아세타미도-2-데옥시-D-알로피라노스, 2-아세타미도-2-데옥시-L-알트로피라노스, 2-아세타미도-2-데옥시-D-굴로피라노스, 2-아세타미도-2-데옥시-L-이도피라노스, 2-아세타미도-2-데옥시-D-탈로피라노스, 2-아세타미도-2,6-디데옥시-D-갈락토피라노스, 2-아세타미도-2,6-디데옥시-L-갈락토피라노스, 2-아세타미도-2,6-디데옥시-L-만노피라노스, 2-아세타미도-2,6-디데옥시-D-글루코피라노스, 2-아세타미도-2,6-디데옥시-L-알트로피라노스, 2-아세타미도-2,6-디데옥시-D-탈로피라노스, D-글루코피라누론산, D-갈락토피라누론산, D-만노피라누론산, D-알로피라누론산, L-알트로피라누론산, D-굴로피라누론산, L-굴로피라누론산, L-이도피라누론산, D-탈로피라누론산, 시알산, 5-아미노-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 5-아세타미도-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 5-글리콜릴라미도-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 에리트리톨, 아라비니톨, 자일리톨, 리비톨, 글루시톨, 갈락티톨, 만니톨, D-리보-헥스-2-울로피라노스, D-아라비노-헥스-2-울로푸라노스 (D-프룩토푸라노스), D-아라비노-헥스-2-울로피라노스, L-자일로-헥스-2-울로피라노스, D-릭소-헥스-2-울로피라노스, D-트레오-펜트-2-울로피라노스, D-알트로-헵트-2-울로피라노스, 3-C-(히드록시메틸)-D-에리토푸라노스, 2,4,6-트리데옥시-2,4-디아미노-D-글루코피라노스, 6-데옥시-3-O-메틸-D-글루코스, 3-O-메틸-D-람노스, 2,6-디데옥시-3-메틸-D-리보-헥소스, 2-아미노-3-O-[(R)-1-카르복시에틸]-2-데옥시-D-글루코피라노스, 2-아세타미도-3-O-[(R)-카르복시에틸]-2-데옥시-D-글루코피라노스, 2-글리콜릴라미도-3-O-[(R)-1-카르복시에틸]-2-데옥시-D-글루코피라노스, 3-데옥시-D-릭소-헵트-2-울로피라노사르산, 3-데옥시-D-만노-옥트-2-울로피라노손산, 3-데옥시-D-글리세로-D-갈락토-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-L-글리세로-L-만노-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-L-글리세로-L-알트로-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-D-글리세로-D-갈락토-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-D-글리세로-D-탈로-논-2-울로피라노손산, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, 글루코스 (Glc), 갈락토스 (Gal), N-아세틸글루코사민 (GlcNAc), 글루코사민 (Glcn), 만노스 (Man), 자일로스 (Xyl), N-아세틸만노사민 (ManNAc), N-아세틸뉴라민산, N-글리코릴뉴라민산, a 시알산, N-아세틸갈락토사민 (GalNAc), 갈락토사민 (Galn), 푸코스 (Fuc), 람노스 (Rha), 글루쿠론산, 글루콘산, 프룩토스 (Fru) 및 폴리올을 포함한다.
용어 폴리올이란 다수의 히드록실 기를 함유하는 알콜을 의미한다. 예를 들어, 글리세롤, 솔비톨, 또는 만니톨이다.
본 명세서에서 사용되는 용어 "2개의 상이한 단당 서브유닛을 포함하는 이당"은 2개의 상이한 단당 단위로 구성된 당류를 의미하는데, 단당 중 하나는 GlcNAc이거나 또는 하나 또는 양쪽 단당은 GlcNAc로부터 유래된다. 본 명세서에서 사용되는 이당의 예는 락토-N-비오스 (Gal-b1,3-GlcNAc, LNB), 갈락토-N-비오스 (Gal-b1,3-GalNAc, Gal-b1,6-GalNAc), N-아세틸락토사민 (Gal-b1,4-GlcNAc, LacNAc), LacDiNAc (GalNAc-b1,4-GlcNAc), N-아세틸갈락토사미닐글루코스 (GalNAc-b1,4-Glc), N-아세틸글루코사미닐글루코스 (GlcNAc-b1,4-Glc), Fuc-a1,3-GlcNAc, Man-b1,4-GlcNAc 또는 ManNAc-b1,4-GlcNAc를 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되고 당분야에서 일반적으로 이해되는 바와 같은 용어 "올리고당"은 작은 개수, 전형적으로 3 내지 20개, 바람직하게 3 내지 15개, 보다 바람직하게 3 내지 13개, 보다 더 바람직하게 3 내지 12개, 보다 더 바람직하게 3 내지 11개, 가장 바람직하게 3 내지 10개의 단순 당, 즉 단당을 함유하는 당류 중합체를 의미한다. 본 발명에서 사용되는 올기고당은 선형 구조일 수 있거나 또는 분지를 포함할 수 있다. 2개 당 단위 사이의 연결 (예를 들어, 글리코시드 연결, 갈락토시드 연결, 글루코시드 연결 등)은 예를 들어, 1,4, 1->4, 또는 (1-4)로서 표현될 수 있고, 본 명세서에서 상호교환적으로 사용된다. 예를 들어, 용어 "Gal-b1,4-Glc", "Gal-β1,4-Glc", "b-Gal-(1->4)-Glc", "β-Gal-(1->4)-Glc", "Galbeta1-4-Glc", "Gal-b(1-4)-Glc" 및 "Gal-β(1-4)-Glc"는 동일한 의미를 가지며, 다시 말해서, 베타-글루코시드 결합은 갈락토스 (Gal)의 탄소-1을 글루코스 (Glc)의 탄소-4와 연결시킨다. 각각의 단당은 환형 형태 (예를 들어, 피라노스 또는 푸라노스 형태)일 수 있다. 개별 단당 단위 사이의 연결은 알파 1->2, 알파 1->3, 알파 1->4, 알파 1->6, 알파 2->1, 알파 2->3, 알파 2->4, 알파 2->6, 베타 1->2, 베타 1->3, 베타 1->4, 베타 1->6, 베타 2->1, 베타 2->3, 베타 2->4, 및 베타 2->6을 포함할 수 있다. 올리고당은 알파- 및 베타-글리코시드 결합 둘 모두를 함유할 수 있거나 또는 오직 베타-글리코시드 결합만을 함유할 수 있다. 용어 "글리칸" 및 "다당류"는 상호교환적으로 사용되고, 글리코시드로 연결된 다수의 단당으로 이루어지는 화합물을 의미한다. 용어 글리칸은 10개 초과의 단당 잔기를 함유하는 화합물에 대해 일반적으로 사용된다.
본 명세서에서 사용되는 "올리고당"은 3개 이상의 단당으로 구성되고, 구성 단당 중 적어도 하나는 나머지 구성 단당과 상이하고, 단당 중 적어도 하나는 GlcNAc이거나 또는 UDP-GlcNAc로부터 유래된다. 바람직하게, 본 명세서에 기술된 바와 같은 올리고당은 상기 본 명세서에서 사용되는 목록으로부터 선택되는 단당을 함유한다. 본 발명의 올리고당의 예는 루이스-유형 항원 올리고당, UDP-GlcNAc로부터 유래되는 단당 및/또는 GlcNAc를 함유하는 포유동물 모유 올리고당 (MMO), O-항원, 엔테로박테리아 공통 항원 (ECA), 캡슐 다당류에 존재하는 올리고당 반복부, 펩티도글리칸 (PG) 및 인간 ABO식 혈액형 체계의 항원을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는, "포유동물 모유 올리고당"은 UDP-GlcNAc로부터 유리되는 단당 및/또는 GlcNAc를 함유하는 올리고당을 의미한다. 예는 6'-시알릴락토스, 3'-시알릴락토스, 3,6-디시알릴락토스, 6,6'-디시알릴락토스, 8,3-디시알릴락토스, 3,6-디시알릴락토-N-테트라오스, 락토디푸코테트라오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 I, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-푸코펜타오스 VI, 시알릴락토-N-네오테트라오스 d, 시알릴락토-N-네오테트라오스 c, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 a, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스, 락토-N-네오헥사오스, 파라-락토-N-헥사오스, 모노푸코실모노시알릴락토-N-네오테트라오스 c, 모노푸코실 파라-락토-N-헥사오스, 모노푸코실락토-N-헥사오스 III, 이성질체 푸코실화 락토-N-헥사오스 III, 이성질체 푸코실화 락토-N-헥사오스 I, 시알릴락토-N-헥사오스, 시알릴락토-N-네오헥사오스 II, 디푸코실-파라-락토-N-헥사오스, 디푸코실락토-N-헥사오스, 디푸코실락토-N-헥사오스 a, 디푸코실락토-N-헥사오스 c를 포함하지만, 이에 제한되지 않는다.
포유동물 모유 올리고당 또는 MMO는 인간 (즉, 인간 모유 올리고당 또는 HMO) 및 소 (보스 타우루스 (Bos Taurus)), 양 (오비스 아리에스 (Ovis aries)), 염소 (카프라 애가그루스 히르쿠스 (Capra aegagrus hircus)), 쌍봉 낙타 (카멜루스 박트리아누스 (Camelus bactrianus)), 말 (에쿠우스 페루스 카발루스 (Equus ferus caballus)), 돼지 (수스 스크로파 (Sus scropha)), 개 (카니스 루푸스 파밀리아리스 (Canis lupus familiaris)), 에조불곰 (우르수스 아르크토스 에소엔시스 (Ursus arctos yesoensis)), 북극곰 (우르수스 마리티무스 (Ursus maritimus)), 일본 흑곰 (우르수스 티베타누스 자포니쿠스 (Ursus thibetanus japonicus)), 등줄무늬 스컹크 (메피티스 메피티스 (Mephitis mephitis)), 두건 물범 (시스토포라 크리스타타 (Cystophora cristata)), 아시아 코끼리 (엘레파스 막시무스 (Elephas maximus)), 아프리카 코끼리 (록소돈타 아프리카나 (Loxodonta africana)), 큰개미핥기 (미르메코파가 트리닥틸라 (Myrmecophaga tridactyla)), 병코돌고래 (투르시옵스 트룬카테스 (Tursiops truncates)), 북방 밍크 고래 (발라에놉테라 아쿠토로스트라타 (Balaenoptera acutorostrata)), 타마 왈라비 (마크로푸스 유게니 (Macropus eugenii)), 붉은 캥거루 (마크로푸스 루푸스 (Macropus rufus)), 주머니 여우 (트리코수루스 불페쿨라 (Trichosurus Vulpecula)), 코알라 (파스콜라르크토스 시네레우스 (Phascolarctos cinereus)), 동부 주머니 고양이 (다시우루스 비베리누스 (Dasyurus viverrinus)), 오리너구리 (오르니토린쿠스 아나티누스 (Ornithorhynchus anatinus))를 포함하지만, 이에 제한되지 않는 포유동물로부터의초유를 포함하여 수유 중 임의 단계에서 발견되는 모유에 존재하는 올리고당을 포함한다. 인간 모유 올리고당은 또한 인간 모유에서 발견되는 인간 모유 올리고당과 화학적으로 동일하지만, 생물공학적으로 생산 (예를 들어, 박테리아, 진균, 효모, 식물, 동물, 또는 원충 세포, 바람직하게 대사적으로 조작된 세포 및 유기체를 포함하는 세포 무함유 시스템 또는 세포 및 유기체를 사용함)되는 인간과 동일한 모유 올리고당으로서도 알려져 있다. 인간과 동일한 모유 올리고당은 HiMO 명칭 하에 판매된다.
본 명세서에서 사용되는, 용어 "O-항원"은 그람-음성 박테리아의 표면 지질다당류 (LPS)의 반복적 글리칸 성분을 의미한다. 용어 "엔테로박테리아 공통 항원" 또는 "ECA"는 엔테로박테리아세아에의 모든 구성원이 공유하고, 외막의 외엽 및 주변세포질에 위치되는, 3개 아미노 당의 반복 단위, 즉, N-아세틸글루코사민, N-아세틸-d-만노사미누론산 및 4-아세타미도-4,6-디데옥시-d-갈락토스로 구축되는 특이적 탄수화물 항원을 의미한다. 용어 "캡슐 다당류"는 박테리아 캡슐에 존재하는 반복-단위 구조를 갖는 장쇄 다당류를 의미하는 것으로서, 후자는 세포 외피 밖에 위치되는 다당류 층이다. 용어 "펩티도글리칸" 또는 "뮤레인"은 당 및 아미노산으로 구성되는, 대부분의 박테리아의 세포백의 필수 구조 성분을 의미하고, 당 성분은 베타-1,4 연결된 GlcNAc 및 N-아세틸무람산의 교대식 잔기로 이루어진다. 본 명세서에서 사용되는, 인간 ABO 혈액형 체계의 항원은 올리고당이다. 인간 ABO 혈액형 체계의 이러한 항원은 인간 구조에 제한되지 않는다. 상기 구조는 Gal-베타1,3-GlcNAc, Gal-베타1,4-GlcNAc, Gal-베타1,3-GalNAc 및 Gal-베타1,4-Glc를 포함하는 이당 코어 구조 상에 존재하는 A 결정자 GalNAc-알파1,3(Fuc-알파1,2)-Gal-, B 결정자 Gal-알파1,3(Fuc-알파1,2)-Gal- 및 H 결정자 Fuc-알파1,2-Gal-를 포함한다.
본 명세서에서 사용되는 용어 "LNT II", "LNT-II", "LN3", "락토-N-트리오스 II", "락토-N-트리오스 II", "락토-N-트리오스", "락토-N-트리오스" 또는 "GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다. 본 명세서에서 사용되는 용어 "LNT", "락토-N-테트라오스", "락토-N-테트라오스" 또는 "Galβ1-3GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다. 본 발명에서 사용되는 용어 "LNnT", "락토-N-네오테트라오스", "락토-N-네오테트라오스", "네오-LNT" 또는 "Galβ1-4GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다.
본 명세서에서 사용되는 용어 "3-시알릴락토스", "3'-시알릴락토스", "알파-2,3-시알릴락토스", "알파 2,3 시알릴락토스", "α-2,3-시알릴락토스", "α2,3 시알릴락토스", "Neu5Aca2-3Galβ1-4Glc", "3SL", "3'SL", "3-SL" 또는 "3'-SL"은 상호교환적으로 사용된다. 본 명세서에서 사용되는 용어 "6-시알릴락토스", "6'-시알릴락토스", "알파-2,6-시알릴락토스", "알파 2,6 시알릴락토스", "α-2,6-시알릴락토스", "α 2,6 시알릴락토스", "Neu5Aca2-6Galβ1-4Glc", "6SL", "6'SL", "6-SL" 또는 "6'-SL"은 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LSTa", "LS-사당류 a", "시알릴-락토-N-테트라오스 a", "시알릴락토-N-테트라오스 a" 또는 "Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc"는 상호교환적으로 사용된다. 용어 "LSTb", "LS-사당류 b", "시알릴-락토-N-테트라오스 b", "시알릴락토-N-테트라오스 b"는 상호교환적으로 사용되고, "Gal-b1,3-(Neu5Ac-a2,6)-GlcNAc-b1,3-Gal-b1,4-Glc"를 의미한한다.
본 발명에서 사용되는 용어 "LSTc", "LS-사당류 c", "시알릴-락토-N-테트라오스 c", "시알릴락토-N-테트라오스 c", "시알릴락토-N-네오테트라오스 c" 또는 "Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc"는 상호교환적으로 사용된다. 용어 "LSTd", "LS-사당류 d", "시알릴-락토-N-테트라오스 d", "시알릴락토-N-테트라오스 d", "시알릴락토-N-네오테트라오스 d" 또는 "Neu5Ac-a2,3-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc". 용어 "DSLNnT" 및 "디시알릴락토-N-네오테트라오스"는 상호교환적으로 사용되고, Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-[Neu5Ac-a2,6]-Gal-b1,4-Glc를 의미한다. 용어 "DSLNT", "DS-LNT" 및 "디시알릴락토-N-테트라오스"는 상호교환적으로 사용되고, Neu5Ac-a2,3-Gal-b1,3-[Neu5Ac-a2,6]-GlcNAc-b1,3-Gal-b1,4-Glc를 의미한다.
용어 "정제된"은 생물학적 분자의 활성을 방해하는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다. 세포, 당류, 핵산, 및 폴리펩티드 경우에, 용어 "정제된"은 이의 천연 상태에서 발견되는 물질을 정상적으로 수반하는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다. 전형적으로, 본 발명의 정제된 당류, 올리고당, 단백질 또는 핵산은 은-염색 겔 상에서 밴드 강도를 통해서 또는 순도 결정을 위한 다른 방법으로 측정하여 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80% 또는 85% 순수하거나, 일반적으로 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 순수하다. 순도 또는 균질성은 당분야에 충분히 공지된 많은 수단, 예컨대, 단백질 또는 핵산 샘플의 폴리아크릴아미드 겔 전기영동에 이어서 염색 시 가시화를 통해서 표시될 수 있다. 일정 목적을 위해서 고해상도가 필요할 것이고 HPLC 또는 정제를 위한 유사한 수단이 이용될 것이다. 올리고당 경우에, 순도는 제한없이, 박층 크로마토그래피, 가스 크로마토그래피, NMR, HPLC, 모세관 전기영동 또는 지량 분광법같은 방법을 사용해 결정된다.
용어 "배양"은 세포가 배양되거나 또는 발효배양되는 배양 배지, 세포 그 자체, 및 전체 액체배지, 즉 세포 내부 (세포내)를 비롯하여 외부 (세포외)에서, 세포에 의해 생산되는 이당 및/또는 올리고당을 의미한다. 본 명세서에서 사용되는, 용어 "세포 생산성 지수 (CPI)"는 배양으로 생산된 세포의 질량으로 나눈 세포에 의해 생산되는 생산물의 질량을 의미한다.
본 명세서에서 사용되는 용어 "배출", "배출된", "배출되다"는 예를 들어, 능동 또는 수동 수송을 통해서, 소포체 (ER) 또는 이로부터 유래된 임의 소포의 사용을 통해서, 임의 방법에 의해 세포 내부에서 세포 밖으로 분자의 전달을 의미한다.
본 명세서에서 사용되는 용어 "세포 밖으로 이당 또는 올리고당을 배출하는 세포"는 시토졸에서 이당 또는 올리고당을 합성하고 예를 들어 능동 또는 수동 수송을 통한 임의 방법을 통해서 상기 세포의 밖으로 상기 이당 또는 올리고당을 전달하는 세포를 의미한다.
본 명세서에서 사용되는 용어 "전구체"는 본 발명에 따른 이당 또는 올리고당의 특별한 생산을 위해 세포가 흡수하거나 또는 합성하는 물질을 의미한다. 이러한 의미에서 전구체는 본 명세서에 정의된 바와 같은 억셉터일 수 있지만, 또한 본 발명의 이당 및/또는 올리고당의 생화학적 합성 경로의 일부로서 세포 내에서 먼저 변형되는 다른 물질, 대사산물, 단당, 이당 또는 올리고당일 수도 있다. 이러한 전구체의 예는 본 명세서에 정의된 바와 같은 억셉터, 및/또는 글루코스, 갈락토스, 프룩토스, 글리세롤, 시알산, N-아세틸뉴라민산, 푸코스, 만노스, 말토스, 수크로스, 락토스, 디히드록시아세톤, 글루코사민, N-아세틸글루코사민, 만노사민, N-아세틸만노사민, 갈락토사민, N-아세틸갈락토사민, 갈락토실락토스, N-아세틸락토사민 (LacNAc), 락토-N-비오스 (LNB), 인산화 당 등 예컨대, 제한없이 글루코스-1-포스페이트, 갈락토스-1-포스페이트, 글루코스-6-포스페이트, 프룩토스-6-포스페이트, 프룩토스-1,6-비스포스페이트, 글리세롤-3-포스페이트, 글리세르알데히드-3-포스페이트, 디히드록시아세톤-포스페이트, 글루코사민-6-포스페이트, N-아세틸-글루코사민-6-포스페이트, N-아세틸만노사민-6-포스페이트, N-아세틸-뉴라민산-9-포스페이트, N-아세틸글루코사민-1-포스페이트, 만노스-6-포스페이트, 만노스-1-포스페이트 및 본 명세서에 정의된 바와 같은 뉴클레오티드-활성화된 당 예컨대, 예를 들어, UDP-글루코스, UDP-갈락토스, UDP-N-아세틸글루코사민, CMP-시알산, GDP-만노스, GDP-4-데히드로-6-데옥시-α-D-만노스, 및/또는 GDP-푸코스를 포함한다.
임의로, 세포는 락토스 수송체, N-아세틸뉴라민산 수송체, 푸코스 수송체, 뉴클레오티드-활성화된 당을 위한 수송체로 이루어진 군으로부터 선택되는 단백질을 코딩하는 적어도 하나의 핵산 서열을 포함하도록 형질전환되고, 상기 수송체는 이당 및/또는 올리고당 합성을 위한 전구체가 첨가된 배지에 내재화된다.
본 명세서에서 사용되는 용어 "억셉터"는 글리코실트랜스퍼라제에 의해 변형될 수 있는 이당 또는 올리고당을 의미한다. 이러한 억셉터의 예는 락토스, 락토-N-비오스 (LNB), 락토-N-트리오스, 락토-N-테트라오스 (LNT), 락토-N-네오테트라오스 (LNnT), N-아세틸-락토사민 (LacNAc), 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라 락토-N-네오헥사오스 (pLNnH), 파라 락토-N-헥사오스 (pLNH), 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 갈락토실락토스, 1, 2, 3, 4, 5, 또는 다수의 N-아세틸락토사민 단위 및/또는 1, 2, 3, 4, 5, 또는 다수의, 락토-N-비오스 단위로 확장된 락토스, 및 1 또는 다수의 N-아세틸락토사민 단위 및/또는 1 또는 다수의 락토-N-비오스 단위를 함유하는 올리고당 또는 올리고당으로의 중간체, 이의 푸코실화 및 시알릴화 형태를 포함한다.
제1 구현예에 따라서, 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포를 제공한다. 본 명세서에서, 대사적으로 조작된 세포는 변이체 효모 또는 진균 글루타민―프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현할 수 있고, 바람직하게 발현하고, UDP-GlcNAc를 합성할 수 있고, 바람직하게 합성하고, 글리코실트랜스퍼라제를 발현할 수 있고, 바람직하게 발현하는 것이 제공되고, 상기 UDP-GlcNAc는 상기 글리코실화된 생산물을 생산하도록 세포에 의해 사용된다.
제2 구현예에 따라서, 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성되는 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 제조를 위한 방법을 제공한다. 방법은 하기의 단계를 포함한다:
(a)(i) 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,
(ii) UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 합성할 수 있고, 바람직하게, 합성하고,
(iii) 글리코실트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,
(iv) 상기 UDP-GlcNAc를 사용하여 상기 글리코실화된 생산물을 생산하는,
세포를 제공하는 단계, 및
(b) 상기 글리코실화된 생산물을 생산하도록 허용하는 조건 하에서 상기 세포를 배양하는 단계,
(c) 바람직하게, 상기 배양으로부터 상기 글리코실화된 생산물을 분리하는 단계.
본 발명에 따라서, UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성되는 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 제조를 위한 상기 방법은 본 명세서에 개시된 바와 같은 대사적으로 조작된 세포를 이용한다.
본 발명의 범주에서, 허용하는 조건은 온도, pH, 압력, 삼투압 및 생산물/전구체/억셉터 농도를 포함하지만, 이에 제한되지 않는 물리적 또는 화학적 매개변수에 관한 조건으로 이해한다.
특정 구현예에서, 허용되는 조건은 30 +/- 20 섭씨도의 온도-범위, 2.0 - 10.0의 pH-범위를 포함할 수 있다.
본 발명의 방법의 다른 바람직한 구현예에서, 배양은 상기 글리코실화된 생산물의 합성을 위한 전구체가 공급된다. 방법의 추가의 바람직한 구현예에서, 배양은 상기 글리코실화된 생산물의 합성을 위한 적어도 2종의 전구체가 공급된다.
본 발명의 방법 및/또는 세포의 일 양태에 따라서, 세포는 UDP-GlcNAc를 합성하고 상기 UDP-GlcNAc는 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 합성하기 위한 경로에서 사용한다. 방법 및/또는 세포의 바람직한 구현예에서, 세포는 UDP-GlcNAc를 합성하고 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당 또는 올리고당을 합성하기 위한 경로에서 상기 UDP-GlcNAc를 사용한다. 본 명세서에서 사용되는, 세포는 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당 또는 올리고당; 및/또는 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 합성할 수 있다.
본 발명의 방법 및/또는 세포의 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여서, 본 명세서에 정의된 바와 같지만 GlcNAc는 아닌 단당 억셉터로 세포에서 발현되는 특이적 글리코실트랜스퍼라제에 의해서 상기 UDP-GlcNAc로부터 GlcNAc 모이어티를 전달하여서 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당을 합성한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여, 본 명세서에 정의된 바와 같지만 GlcNAc-GlcNAc는 아닌 이당 억셉터로 특이적 글리코실트랜스퍼라제에 의해서 상기 UDP-GlcNAc로부터 GlcNAc 모이어티를 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 합성한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc 및 UDP-GlcNAc로부터 유래되지 않은 하나 이상의 다른 뉴클레오티드-활성화된 당(들)을 사용하여 GlcNAc 모이어티 및 단당 빌딩 블록(들)을 상기 UDP-GlcNAc 및 상기 하나 이상의 다른 뉴클레오티드-활성화된 당(들)으로부터, 각각, 특이적글리코실트랜스퍼라제에 의해서, 각각, 본 명세서에 정의된 바와 같은 당류 억셉터로 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 합성한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여 UDP-GlcNAc 유래된 뉴클레오시드(들)를 생산하고 단당을 상기 UDP-GlcNAc 유래된 뉴클레오시드로부터 특이적 글리코실트랜스퍼라제에 의해서 본 명세서에 정의된 바와 같은 단당 억셉터로 전달하여서 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당을 합성한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)를 생산하고 하나 이상의 단당을 상기 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들) 및/또는 상기 합성된 UDP-GlcNAc로부터의 GlcNAc를 각각 특이적 글리코실트랜스퍼라제에 의해서, 본 명세서에 정의된 바와 같은 당류 억셉터로 전달하여 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 합성한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)를 생산하고 상기 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)로부터의 하나 이상의 단당, UDP-GlcNAc로부터 유래되지 않은 하나 이상의 뉴클레오티드로부터의 하나 이상의 단당 및/또는 상기 UDP-GlcNAc로부터의 GlcNAc를 각각, 특이적 글리코실트랜스퍼라제에 의해서, 본 명세서에 정의된 바와 같은 당류 억셉터로 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 합성한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc 및 UDP-GlcNAc로부터 유래되지 않은 하나 이상의 다른 뉴클레오티드-활성화된 당(들)을 사용하여 상기 UDP-GlcNAc로부터의 GlcNAc 모이어티 및 단당 빌딩 블록(들) 및 상기 하나 이상의 다른 뉴클레오티드-활성화된 당(들)을, 각각, 특이적 글리코실트랜스퍼라제에 의해서, 각각, 본 명세서에 정의된 바와 같은 억셉터로 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 포함하는 글리코실화된 생산물을 합성한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)를 생산하고 상기 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)로부터의 하나 이상의 단당 및/또는 상기 합성된 UDP-GlcNAc로부터의 GlcNAc를, 각각, 특이적 글리코실트랜스퍼라제에 의해서, 본 명세서에 정의된 바와 같은 억셉터로 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 포함하는 글리코실화된 생산물을 합성한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)를 생산하고 상기 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)로부터의 하나 이상의 단당, UDP-GlcNAc로부터 유래되지 않은 하나 이상의 뉴클레오시드로부터의 하나 이상의 단당 및/또는 상기 UDP-GlcNAc로부터의 GlcNAc를, 각각, 특이적 글리코실트랜스퍼라제를 통해서, 본 명세서에 정의된 바와 같은 억셉터로 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 포함하는 글리코실화된 생산물을 합성한다.
본 발명의 방법 및/또는 세포의 바람직한 구현예에서, UDP-GlcNAc로부터 유래되지 않은 뉴클레오시드는 전구체(들)로서 배양에 첨가된다. 본 발명의 방법 및/또는 세포의 보다 바람직한 구현예에서, UDP-GlcNAc로부터 유래되지 않은 뉴클레오시드는 본 발명의 세포에 의해 합성된다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 상기 UDP-GlcNAc 유래된 이당 또는 올리고당의 합성을 위한 억셉터는 전구체로서 배양에 첨가된다. 본 발명의 방법 및/또는 세포의 보다 바람직한 구현예에서, 상기 억셉터는 본 발명의 세포에 의해 합성된다.
본 발명은 대사적으로 조작된 세포를 사용하여 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 상기 생산을 위한 상이한 유형의 세포를 제공한다. 예를 들어, 본 발명은 세포를 제공하고, 상기 세포는 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 세포는 상기 세포에 의해 사용되는 UDP-GlcNAc를 합성하여 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고 상기 세포는 상기 세포에 의해 사용되는 하나의 UDP-GlcNAc-유래 뉴클레오시드를 합성하여 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고 상기 세포는 상기 세포에 의해 사용되는 UDP-GlcNAc 및/또는 하나 이상의 UDP-GlcNAc-유래 뉴클레오시드(들)를 합성하여 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 2종의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고 상기 세포는 상기 세포에 의해 사용되는 UDP-GlcNAc를 합성하여 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 2종의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 세포는 상기 세포에 의해 사용되는 하나의 UDP-GlcNAc-유래 뉴클레오시드를 합성하여 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 2종의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고 상기 세포는 상기 세포에 의해 사용되는 UDP-GlcNAc 및/또는 하나 이상의 UDP-GlcNAc-유래 뉴클레오시드(들)를 합성하고 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 3종 이상의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 세포는 상기 세포에 의해 사용되는 UDP-GlcNAc 및/또는 하나 이상의 UDP-GlcNAc-유래 뉴클레오시드(들)를 합성하여 상기 글리코실화된 생산물을 생산한다.
본 발명에 따른 방법 및/또는 세포의 바람직한 구현예에 따라서, 대사적으로 조작된 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 포함하는 적어도 하나의 유전자 발현 모듈에 의해 변형되고, 상기 발현 모듈로부터의 발현은 항상성이거나 또는 비-화학적 유도 또는 억제 시에 조건적이다.
상기 발현 모듈은 또한 전사 유닛으로도 알려져 있고, 코딩 유전자 서열 및 코딩 유전자에 작동적으로 연결된 적절한 전사 및/또는 번역 제어 신호를 포함하는 재조합 유전자의 발현을 위한 폴리뉴클레오티드를 포함한다. 상기 제어 신호는 프로모터 서열, 비번역 영역, 리보솜 결합 부위, 종결자 서열을 포함한다. 상기 발현 모듈은 하나의 단일 재조합 유전자의 발현을 위한 성분을 함유할 수 있고 또한 더 많은 재조합 유전자의 발현을 위한 성분을 함유할 수 있거나 또는 둘 이상의 재조합 유전자의 통합된 발현을 위한 오페론 구조로 구성될 수 있다. 상기 폴리뉴클레오티드는 당분야에 충분히 공지된 기술을 사용하는 재조합 DNA 기술에 의해 생산될 수 있다. 발현 모듈을 구축하기 위한 당업자에게 충분히 공지된 방법은 예를 들어, 시험관내 재조합 DNA 기술, 합성 기술, 및 생체내 유전자 재조합을 포함한다. 예를 들어, 기술들은 하기 문헌에 기술되어 있다: Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York 또는 Current Protocols in Molecular Biology, John Wiley and Sons, N.Y. (1989 및 연간 업데이트).
본 발명의 바람직한 양태에 따라서, 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 포함하는 하나 이상의 발현 모듈에 의해 변형된다. 본 명세서에서 사용되는, 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제에 대한 하나의 발현 모듈에 의해 변형될 수 있다. 세포는 또한 둘 이상의 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제에 대한 하나의 발현 모듈에 의해 변형될 수 있다. 세포는 또한 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제에 대한 하나의 발현 모듈 및 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제와 구별되는 하나 이상의 다른 재조합 유전자에 대한 하나 이상의 발현 모듈에 의해 변형될 수 있다. 세포는 또한 둘 이상의 발현 모듈에 의해 변형될 수 있고, 상기 발현 모듈 중 적어도 하나는 하나 이상의 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제(들)의 발현을 위한 성분을 함유한다.
상기 다른 재조합 유전자는 상기 글리코실화된 생산물의 합성에서 작용하는 폴리펩티드의 발현에 관여될 수 있거나; 또는 상기 재조합 유전자는 상기 글리코실화된 생산물의 합성에 관여되지 않는 상기 대사적으로 조작된 세포에서의 다른 경로에 연결될 수 있다. 상기 재조합 유전자는 변형된 발현 또는 활성을 갖는 내생성 단백질을 코딩하고, 바람직하게 상기 내생성 단백질은 과발현되거나; 또는 상기 재조합 유전자는 이종으로 도입되어 상기 변형된 세포에서 발현되고, 바람직하게 과발현되는 이종성 단백질을 코딩한다. 내생성 단백질은 이종성 단백질을 또한 발현하는 세포에서 변형된 발현을 가질 수 있다.
발현 모듈은 상기 세포의 게놈에 통합될 수 있거나 또는 벡터 상에서 상기 세포에게 제시될 수 있다. 상기 벡터는 상기 대사적으로 조작된 세포로 안정하게 형질전환/형질감염시키려는, 플라스미드, 코스미드, 파지, 리포솜, 또는 바이러스의 형태로 존재할 수 있다. 이러한 벡터는 특히, 염색체, 에피솜 및 바이러스-유래 벡터, 예를 들어, 플라스미드, 박테리오파지, 트랜스포존, 효모 에피솜, 삽입 성분, 효모 염색체 성분, 바이러스로부터 유래되는 벡터, 및 이의 조합으로부터 유래되는 벡터, 예컨대, 플라스미드 및 박테리오파지 유전자 성분으로부터 유래되는 것들, 예컨대, 코스미드 및 파지미드를 포함한다. 이들 벡터는 선택 마커 예컨대, 항생제 마커, 영양요구성 마커, 독소-항독소 마커, RNA 센서/안티센스 마커를 함유할 수 있지만, 이에 제한되지 않는다. 발현 시스템 구성체는 발현을 일으킬뿐만 아니라 조절하는 제어 영역을 함유할 수 있다. 일반적으로, 숙주에서 폴리뉴클레오티드를 유지, 전파 또는 발현시키고/시키거나 폴리펩티드를 발현시키는데 적합한 임의의 시스템 또는 벡터는 이와 관련하여 발현에 사용될 수 있다. 적절한 DNA 서열은 임의의 다양한 충분히 공지된 통상의 기술, 예컨대, 예를 들어, Sambrook et al. 등에 기재된 것들을 통해서 발현 시스템으로 삽입될 수 있고, 상기를 참조한다. 재조합 생산을 위해서, 세포는 본 발명의 발현 시스템 또는 이의 일부 또는 폴리뉴클레오티드를 도입하도록 유전자 조작될 수 있다. 세포로 폴리뉴클레오티드의 도입은 많은 표준 실험실 매뉴얼, 예컨대, [Davis et al., Basic Methods in Molecular Biology, (1986)], 및 [Sambrook et al., 1989, 상동]에 기술된 방법을 통해서 실시될 수 있다.
본 발명의 보다 바람직한 양태에 따라서, 대사적으로 조작된 세포에 존재하는 상기 발현 모듈의 각각으로부터의 발현은 항상성이거나 또는 비-화학적 유도 또는 억제 시에 조건적이다.
본 명세서에서 사용되는, 항상성 발현은 유기체에서 연속적으로 전사되는 유전자의 발현으로서 이해해야 한다. 재조합 숙주 세포에서 종종 사용되는 항상성 프로모터의 예는 박테리아 프로모터 예컨대, 예를 들어, spc 리보솜 단백질 오페론 프로모터 Pspc, β-락타마제 프로모터 Pbla, Pcat 프로모터, rrnB 리보솜 RNA 오페론의 P1 및 P2 프로모터, ompC 및 yfgF의 프로모터; 효모 프로모터 예컨대, 예를 들어 ACT1, CCW12, CYC1, FBA1, HXT7-391, GPD, MFα1, PAB1, PDC1, PGK1, PYK1, TDH3, TEF1 또는 TPI1; 또는 다른 프로모터 예컨대 예를 들어, 파지 람다의 PL 프로모터 (Da Silva and Srikrishnan, FEMS Yeast Res. (2012) 12: 197-214; Redden et al., FEMS Yeast Res. (2015) 15: 1-10; Shimada et al. 2014, PLOS ONE 9(6): e100908) 또는 예컨대, 예를 들어, Redden and Alper (Nat. Commun. 2015, 6, 7810), Liu et al. (Microb. Cell Fact. 2020, 19, 38), Xu et al. (Microb. Cell Fact.2021, 20, 148) 및 Lee et al. (ACS Synth. Biol. 2015, 4(9), 975-986)에 기술된 바와 같은, 라이브러리로부터 기원하는 프로모터 서열을 포함한다.
본 명세서에서 사용되는, 비-화학적 유도 또는 억제 시 조건적인 발현은 환경 변화 (예를 들어, 혐기성 또는 호기성 성장, 산화 스트레스, 온도 변화, 예컨대, 예를 들어 열-충격 또는 냉-충격, 삼투압, 빛 조건)에 대한 반응으로서 또는 제한없이 아폽토시스 및 오토파지를 포함하는 상기 숙주 세포의 발생 단계 또는 세포 주기의 위치에 의존하여, 숙주의 일정 천연 조건 (예를 들어, 발아 효모의 교배 단계, 박테리아의 정지기, 분만 중이거나 또는 수유 중인 유기체)에서만 발현되는 유전자의 선택적 또는 조절적 발현으로서 이해해야 한다. 비-화학적 유도 또는 억제 시에 조건적 발현을 제공하는 프로모터의 예는 산소-반응성 프로모터 (예컨대, 예를 들어, 에스. 세레비지아에 (S. cerevisiae) 유래 DAN1, 이. 콜라이 유래 nar, 박테리아 글로빈 프로모터), 산화 스트레스-반응성 프로모터 (예컨대, 예를 들어, 효모 유래 CTT1, Skn7, TRX2 또는 Yap1 또는 박테리아 유래 oxyR, soxR, soxS, sodA 또는 ahpC), 열-충격 반응성 프로모터 (예컨대, 예를 들어, 효모 유래 CPR6, HSP26, HSP82, HSP104, SSA1, SSA3, SSA4 또는 YDJ1; 또는 박테리아 유래 ahpF, DnaK, GroEL 또는 HtpG) 및 정지상에서 활성인 프로모터 (예컨대, 예를 들어, 이.콜라이 osmY 프로모터)를 포함한다 (Farr and Kogoma, Microbiol. Rev. 1991, 55(4): 561-585; Imlay J.A., Annu. Rev. Microbiol. 2015, 69: 93-108; Lara et al., J. Biol. Eng. 2017, 11:39; Lee et al., Biotechnol. Bioeng. 2003, 82(3): 271-277; Loprosert et al., Mol. Microbiol. 2000, 37: 1504-1514; Morano et al., Genetics 2012, 190(4): 1157-1195).
본 명세서에서 사용되는, 화학적 유도 또는 억제 시 조건적인 발현은 탄소 공급원 (예컨대, 예를 들어, 글루코스, 알로-락토스, 락토스, 갈락토스, 글리세롤, 아라비노스), 알콜 (예컨대, 예를 들어, 메탄올, 에탄올), 산성 화합물 (예컨대, 예를 들어, 아세테이트, 포르메이트), IPTG, 금속 이온 (예컨대, 예를 들어, 알루미늄, 구리, 아연, 질소), 포스페이트, 방향족 (예컨대, 예를 들어, 크실렌)을 포함하는 일정 화학적 화합물의 존재 또는 부재 시에만 발현되는 유전자의 선택적 또는 조건적 발현으로서 이해해야 한다. 화학적 유도 또는 억제 시에 조건적 발현을 제공하는 프로모터의 예는 이. 콜라이 유래 람노스-유도성 rhaBAD 프로모터, 이.콜라이 araBAD 오페론의 아라비노스-유도성 pBAD 프로모터, 이.콜라이 유래 IPTG-유도성 lac 프로모터 또는 IPTG/락토스-유도성 T7 프로모터 또는 이.콜라이 염 (NaCl)-유도성 프로모터 proU (Marschall et al. 2016, Appl. Microbiol. Biotechnol. 100, 5719-5728) 또는 효모 유래 ADH1, GAL1-GAL10, MET3, MET25, PCUP1 및 PHO5 프로모터를 포함한다. 1500 bp 프로모터 PADH1 는 글루코스 상에서 성장 동안 활성화되고 글루코스 고갈 이후에 에탄올 소비 동안 하향조절된다. 상류 서열의 1100 bp의 결실을 갖는 프로모터, PADH1s 의 짧은 변이체는 발현을 초기 에탄올 성장기로 이동시켜서 후기 에탄올 소비기로 활성이 증가된다. 상류 단편의 300 bp의 복원은 초기 대수 성장에서 활성화되어서 후기 에탄올 소비기로 활성을 유지시키는 중간 ADH1 프로모터 (pADH1m)를 생성시켰다 (Ruohonen et al., 1995, J. Biotechnol. 39: 193-203). ADH2 프로모터는 글루코스 억제에 의해 조밀하게 조절된다. 글루코스의 존재 하에서, GAL 프로모터는 완전하게 꺼지고, 갈락토스의 존재 하에서, 발현의 1000-배 증가는 단지 4시간에 달성될 수 있다. 프로모터 PCUP1 는 Cu2+ 의 존재 하에서 20-배 발현을 유도할 수 있다. PHO5 프로모터는 무기 포스페이트에 의해 조절되지만, MET3 및 MET25 프로모터는 메티오닌 또는 S-아데노실메티오닌에 의해 억제된다 (Keren et al., Mol. Sys. Biol. (2013) 9:701; Redden et al., FEMS Yeast Res. (2015) 15: 1-10).
본 명세서에서 제공되는 바와 같은 프로모터 서열의 목록은 예시로서 제공되고 제한하려는 의도가 아님을 이해해야 한다.
본 발명의 방법 및/또는 세포의 일 양태에 따라서, 세포는 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 변이체는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고, V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나에 따른 폴리펩티드 서열을 포함하거나, 또는 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 또는 38을 갖는 상기 폴리펩티드 중 어느 하나의 전체 길이에 대해 적어도 80% 전체 서열 동일성을 갖는 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 또는 38 중 어느 하나의 기능성 상동체, 변이체 또는 유도체이거나, 또는 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53을 갖는 상기 폴리펩티드 중 어느 하나의 전체 길이에 대해서 적어도 80% 전체 서열 동일성을 갖고 V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 기능성 상동체, 변이체 또는 유도체인 단백질이다.
본 명세서에서 사용되는, 열거된 임의의 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질은 서열이 개별 단백질의 아미노산 서열의 전체 길이에 대해서 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95,50%, 96.00%, 96,50%, 97.00%, 97,50%, 98.00%, 98,50%, 99.00%, 99,50%, 99,60%, 99,70%, 99,80%, 99,90% 서열 동일성을 갖는 것으로 이해해야 한다.
SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53을 갖는 폴리펩티드 중 어느 하나의 전체 길이에 대해서 적어도 80% 전체 서열 동일성은 본 명세서에 제공되는 바와 같이, 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53을 갖는 폴리펩티드 중 어느 하나에 대해서 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95,50%, 96.00%, 96,50%, 97.00%, 97,50%, 98.00%, 98,50%, 99.00%, 99,50%, 99,60%, 99,70%, 99,80%, 99,90% 전체 서열 동일성으로서 이해해야 한다.
본 발명의 방법 및/또는 세포의 바람직한 양태에 따라서, 세포는 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 변이체는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고 V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나에 따른 폴리펩티드 서열을 포함하는 단백질이다.
본 발명의 방법 및/또는 세포의 다른 바람직한 양태에 따라서, 세포는 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 변이체는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고, 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 아미노산 서열에 대해 적어도 200 아미노산 잔기의 범위에 걸쳐서 적어도 80.0% 동일한 서열인 아미노산 서열을 포함하거나 또는 그로 이루어지는 폴리펩티드이고 V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 단백질이다. 바람직하게, 상기 변이체는 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 아미노산 서열에 대해서, 적어도 200, 적어도 210, 적어도 220, 적어도 230, 적어도 240, 적어도 250의 범위에 걸쳐서, 바람직하게 아미노산 잔기의 전체 개수까지의 아미노산 서열과 적어도 80.0%, 적어도 85.0%, 적어도 90.0%, 적어도 95.0%, 적어도 96.0%, 적어도 97.0%, 적어도 98.0%, 적어도 98.5%, 또는 적어도 99% 동일하고, V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 아미노산 서열을 포함하거나 또는 그로 이루어진다.
본 발명의 방법 및/또는 세포의 다른 바람직한 양태에 따라서, 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 중 어느 하나의 발현 또는 활성은 세포에서 변형된다. 본 발명의 방법 및/또는 세포의 보다 바람직한 양태에 따라서, 변형된 발현은 본 명세서에 정의된 바와 같이 이해해야 한다. 본 발명의 방법 및/또는 세포의 다른 보다 바람직한 구현예에 따라서, 효소의 변형된 활성은 예를 들어, 효소의 천연 활성과 비교하여, 더 양호한 전환율, 더 빠른 반응 속도, 피드백 억제에 대해 감소된 민감도, 개선된 동역학 및 더 큰 기질 친화성을 포함하는 효소의 증강, 증가 및/또는 개선된 활성으로서 이해해야 한다.
본 명세서에서 사용되는, 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고, D-프룩토스-6-포스페이트 + L-글루타민을 D-글루코사민-6-포스페이트 + L-글루타메이트로 전환시킬 수 있는 단백질이다. D-프룩토스-6-포스페이트 (또는 프룩토스-6-포스페이트)는 헥소스 포스페이트로서 알려진 유기 화합물의 클래스에 속하고, 식별자 PubChem CID 69507로 PubChem에서 기술된다 (National Center for Biotechnology Information (2020). CID 69507, 프룩토스-6-포스페이트에 대한 PubChem 화합물 요약, https://pubchem.ncbi.nlm.nih.gov/compound/Fructose-6-phosphate에서 항목은 2004년 9월 16일 생성되었고, 2020년 10월 10일 수정됨. 2020년 10월 15일 검색됨) 2015년 11월 16일에 생성된 식별자 HMDB0000124를 사용해 Human Metabolome Database version 4.0 (Wishart et al., Nucleic Acids Res. 2007, Jan;35(Database issue):D521-526)을 참조함, 2020년 10월 9일 업데이트되었고, 2020년 10월 16일에 http://www.hmdb.ca/metabolites/HMDB0000124에서 검색됨). 헥소스 포스페이트는 하나 이상의 포스페이트 기로 치환된 헥소스를 함유하는 탄수화물 유도체이다. 프룩토스 6-포스페이트는 효모부터 인간에 이르는, 모든 진핵생물 및 원핵생물에 존재한다. 프룩토스 6-포스페이트는 다수의 효소 반응에 참여한다. 프룩토스 6-포스페이트는 글루코사민 6-포스페이트로부터 생합성될 수 있고, 이것은 효소 글루코사민-6-포스페이트 이소머라제 1에 의해 촉매된다. 프룩토스 6-포스페이트는 효소 글루코스-6-포스페이트 이소머라제의 작용을 통해서 글루코스 6-포스페이트로 전환될 수 있다. 가역적으로, 프룩토스 6-포스페이트는 글루코스-6-포스페이트 이소머라제에 의해 매개되는 베타-D-글루코스 6-포스페이트로부터 생합성될 수 있다. 프룩토스 6-포스페이트는 예를 들어, 펜토스 포스페이트 경로, 글루코스신생합성 경로, 및 해당과정 경로에 관여된다.
L-글루타민은 20개 표준 아미노산 중 하나일뿐만 아니라 또한 다양한 질소-함유 화합물의 합성에서 중요한 중간체이다. 숙주 세포의 글루타민 물질대사와 관련된 가장 중요한 효소는 글루타민 신써타제 및 글루타미나제이다. 글루타민 신써타제는 암모니아를 질소 공급원으로서 사용하여 글루타민으로 글루타메이트의 전환을 촉매한다 (글루타메이트 + NH4+ + ATP는 글루타민 + ADP + Pi를 생성시킴). 글루타미나제는 글루타민의 글루타메이트 및 암모늄 이온으로의 가수분해를 촉매하는 효소이다.
본 발명의 다른 양태에 따라서, 방법 및 대사적으로 조작된 세포가 제공되고, 상기 세포는 UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 합성한다. 본 명세서에서 사용되는, 상기 세포는 UDP-GlcNAc를 합성하고 상기 UDP-GlcNAc는 UDP-GlcNAc-유래 뉴클레오시드로 추가로 전환될 수 있다. 본 발명에 따라서, 상기 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제의 작용을 통해서 상기 세포에서 이용가능하게 만든 D-글루코사민-6-포스페이트의 다단계 전환을 통해서 UDP-GlcNAc를 합성한다. 상이한 다단계 전환이 상기 숙주 세포에 의해 사용되어서 상기 D-글루코사민-6-포스페이트를 UDP-GlcNAc로 전환시킨다. 예를 들어, 제1 전환 반응 세트는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 예컨대, 예를 들어 에스. 세레비지아에 유래 GNA1의 작용에 의한 N-아세틸-D-글루코사민-6-포스페이트로 D-글루코사민-6-포스페이트의 제1 전환에 이어서, N-아세틸-D-글루코사민-6-포스페이트가 포스포아세틸글루코사민 뮤타제 예컨대, 예를 들어, 에스. 세레비지아에 유래 PCM1의 작용에 의해 N-아세틸-D-글루코사민-1-포스페이트로 전환되는 제2 반응과, 이어서 UDP-N-아세틸글루코사민 파이로포스포릴라제 예컨대, 예를 들어, 에스. 세레비지아에 유래 QRI1의 작용에 의해 UDP-GlcNAc로 N-아세틸-D-글루코사민-1-포스페이트의 최종 전환을 포함한다. UDP-GlcNAcFH D-글루코사민-6-포스페이트의 다른 다단계 전환은 포스포글루코사민 뮤타제 예컨대, 예를 들어, 이. 콜라이 유래 glmM의 작용에 의한 D-글루코사민-1-포스페이트로 D-글루코사민-6-포스페이트의 제1 전환 및 UDP-N-아세틸글루코사민 파이로포스포릴라제 및 글루코사민-1-포스페이트 N-아세틸트랜스퍼라제의 작용 또는 이기능성 효소 예컨대, 예를 들어, UDP-N-아세틸글루코사민 파이로포스포릴라제 및 글루코사민-1-포스페이트 N-아세틸트랜스퍼라제 활성 둘 모두를 갖는 이. 콜라이의 glmU의 작용에 의해서, UDP-GlcNAc로 D-글루코사민-1-포스페이트의 후속 전환을 포함한다.
본 발명의 바람직한 양태에서, 상기 세포는 UDP-GlcNAc로부터 유래되는 하나 이상의 뉴클레오시드를 합성한다. 예를 들어, UDP-GlcNAc-유래 뉴클레오시드 UDP-N-아세틸갈락토사민 (UDP-GalNAc)은 UDP-N-아세틸글루코사민 4-에피머라제 예컨대, 예를 들어, 플레시오모나스 시겔로이데스 (Plesiomonas shigelloides) 유래 wbgU, 여시니아 엔테로콜리티카 (Yersinia enterocolitica) 유래 gne 또는 슈도모나스 애루지노사 (Pseudomonas aeruginosa) 혈청형 O6 유래 wbpP를 사용한 단일-단계 반응의 작용에 의해서 UDP-GlcNAc로부터 합성될 수 있다. UDP-GlcNAc-유래 뉴클레오시드 CMP-Neu5Ac는 UDP-GlcNAc를 UDP 및 ManNAc로 전환시키는 N-아세틸글루코사민-6-포스페이트 2-에피머라제 또는 UDP-GlcNAc 2'-에피머라제 (예컨대, 예를 들어, 씨. 제주니 (C. jejuni) 또는 아시네토박터 바우만니 (Acinetobacter baumannii) 유래 neuC), 포스포에놀피루베이트 (PEP)를 사용하면서 ManNAc를 Neu5Ac (시알산)로 후속하여 전환시키는 N-아세틸뉴라미네이트 신타제 (예컨대, 예를 들어, 이.콜라이, 씨. 제주니 또는 엔. 메닌지티디스 (N. meningitidis) 유래 neuB), 및 Neu5Ac 및 CTP로부터 CMP-Neu5Ac를 최종적으로 합성하는 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 또는 CMP-시알산 신써타제 (예컨대, 예를 들어, 씨. 제주니 또는 엔. 메닌지티디스 유래 neuA)가 관여되는 잘-정돈된 다단계 반응에 의해서 UDP-GlcNAc로부터 합성될 수 있다. CMP-Neu5Ac는 또한 UDP-GlcNAc를 UDP 및 ManNAc로 전환시키고 ManNAc를 ManNAc-6-포스페이트로 후속 인산화시키는 이기능성 UDP-GlcNAc 2'-에피머라제/ManNAc 키나제 (예컨대, 예를 들어, 엠. 무스쿨루스 (M. musculus) 유래 gne), PEP를 사용하면서 ManNAc-6-포스페이트를 Neu5Ac-9-포스페이트로 전환시키는 Neu5Ac-9-포스페이트 신타제 (예컨대, 예를 들어, 알. 노르베지쿠스 (R. norvegicus) 유래 Neu5Ac-9-포스페이트 신타제), Neu5Ac-9-포스페이트를 Neu5Ac로 탈인산화시키는 Neu5Ac-9-포스페이트 포스파타제 (예컨대, 예를 들어, 알. 노르베지쿠스 유래 Neu5Ac-9-Pase) 및 Neu5Ac 및 CTP로부터 CMP-Neu5Ac를 최종적으로 합성하는 CMP-시알산 신써타제 (예컨대, 예를 들어, 엠. 무스쿨루스 (M. musculus) 유래 Cmas)를 포함하는 대안 경로를 통해서 UDP-GlcNAc로부터 합성될 수 있다. 차례로, CMP-Neu5Ac는 척추동물 CMP-Neu5Ac 히드록실라제 (CMAH) 효소에 의해 수행되는 히드록실화 반응을 통해서 CMP-Neu5Gc로 전환될 수 있다. UDP-ManNAc는 UDP-GlcNAc 2-에피머라제 (예컨대, 예를 들어, 스타필로코쿠스 아우레우스 (Staphylococcus aureus) 유래, 이. 콜라이 유래 RffE, 에스. 뉴모니아에 (S. pneumoniae) 유래 Cps19fK, 및 에스. 엔테리카 (S. enterica) 유래 RfbC)에 의해 수행되는 에피머화 반응을 통해서 UDP-GlcNAc로부터 직접적으로 합성될 수 있다. UDP-D-N-아세틸글루코사민은 또한 글루코- (퀴노보사민), 갈락토-, 만노- (람노사민) 및 탈로-구성으로 2-아세타미도-2,6-디데옥시-L-헥소스의 생산을 위한 공통 전구체이다. 예를 들어, UDP-GlcNAc는 다기능성 효소 예컨대 비브리오 콜레라에 (Vibrio cholerae) 혈청형 O37 유래 WbvB에 의해 UDP-2-아세타미도-2,6-디데옥시-L-릭소-4-헥술로스로 전환될 수 있다. 이러한 UDP-2-아세타미도-2,6-디데옥시-L-릭소-4-헥술로스는 C-4 리덕타제 예컨대, 브이. 콜레라에 혈청형 O37 유래 WbvR에 의해 전환되어서 UDP-2-아세타미도-L-람노스를 산출한다. 이러한 UDP-2-아세타미도-L-람노스는 WbvD, 또한 브이. 콜레라에 혈청형 O37 유래 효소에 의해서 UDP-2-아세타미도-L-퀴노보스로 에피머화될 수 있다. UDP-GlcNAc로부터 UDP-N-아세틸-D-푸코사민 (UDP-FucNAc)의 합성을 위한 병행 경로는 슈도모나스 애루지노사 (Pseudomonas aeruginosa) O11 유래의 3개 효소 WbjB, WbjC, 및 WbjD 또는 스타필로코쿠스 아우레우스 (Staphylococcus aureus) 5형 유래 CapE, CapF, 및 CapG를 사용해 수행될 수 있다. UPD-GlcNAc는 또한 "인버팅" 4,6-데히드라타제 예컨대, 예를 들어, 에이치. 파일로리 (H. pylori) 유래 PseB 또는 피. 애루지노사 (P. aeruginosa) 유래 FlaA1을 사용하여 UDP-2-아세타미도-2,6-디데옥시-β-L-아라비노-4-헥술로스로 전환될 수 있다. 피. 애루지노사 O11 유래 WbjC 및 에스. 아우레우스 5형 유래 CapF를 사용하여 또한 UDP-2-아세타미도-2,6-디데옥시-β-L-아라비노-4-헥술로스를 UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAc)으로 전환될 수 있다.
본 발명의 다른 바람직한 양태에서, 상기 세포는 추가로 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택되는 뉴클레오티드-당 또는 뉴클레오시드을 합성한다.
본 발명의 다른 양태에 따라서, 상기 세포는 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산에서 상기 UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 사용한다. 본 발명의 바람직한 양태에서, 상기 단당 서브유닛 중 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택된다.
본 발명의 한 양태에서, 상기 이당은 2종의 상이한 단당 서브유닛으로 구성된 글리칸 구조를 포함하고, 상기 단당 서브유닛 중 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택된다. 본 명세서에서 사용되는, 상기 이당로부터의 양쪽 단당 서브유닛은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택될 수 있지만 서로 상이해야 한다.
대안적으로, 제1 단당 서브유닛은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되고, 상기 제1 단당 서브유닛과 상이한 제2 단당 서브유닛은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, N-글리코릴뉴라민산, 글루코스, 갈락토스, 만노스, 푸코스, 람노스, 자일로스, 글루쿠로네이트 및 갈락투로네이트를 포함하는 목록으로부터 선택된다.
상기 이당의 예는 락토-N-비오스 (Gal-b1,3-GlcNAc, LNB), 갈락토-N-비오스 (Gal-b1,3-GalNAc, Gal-b1,6-GalNAc), N-아세틸락토사민 (Gal-b1,4-GlcNAc, LacNAc), LacDiNAc (GalNAc-b1,4-GlcNAc), N-아세틸갈락토사미닐글루코스 (GalNAc-b1,4-Glc), N-아세틸글루코사미닐글루코스 (GlcNAc-b1,4-Glc), Fuc-a1,3-GlcNAc, Man-b1,4-GlcNAc 또는 ManNAc-b1,4-GlcNAc를 포함한다.
본 발명의 다른 양태에서, 상기 올리고당은 3종 이상의 단당 서브유닛으로 구성된 글리칸 구조를 포함하고, 상기 단당 서브유닛 중 적어도 하나는 상기 올리고당의 다른 단당 서브유닛과 상이하고, 올리고당의 단당 서브유닛의 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택된다. 본 명세서에서 사용되는, 상기 올리고당은 3종의 단당 서브유닛으로 구성될 수 있고, 상기 단당 중 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되고, 상기 제1 단당은 상기 올리고당의 다른 2종 단당 서브유닛과 상이하고, 후자의 2종 단당은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, N-글리코릴뉴라민산, 글루코스, 갈락토스, 만노스, 푸코스, 람노스, 자일로스, 글루쿠로네이트 및 갈락투로네이트를 포함하는 목록으로부터 선택된다. 본 명세서에서 사용되는, 상기 올리고당은 3종 이상의 단당 서브유닛으로 구성된 글리칸 구조를 포함하고, 상기 단당 중 적어도 하나는 올리고당에 존재하는 다른 서브유닛과 상이하고, 상기 단당 서브유닛 중 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, N-글리코릴뉴라민산을 포함하는 목록으로부터 선택된다.
상기 올리고당의 예는 6'-시알릴락토스, 3'-시알릴락토스, 3,6-디시알릴락토스, 6,6'-디시알릴락토스, 3,6-디시알릴락토-N-테트라오스, 8,3-디시알릴락토스, 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 시알릴락토-N-네오테트라오스 d, 시알릴락토-N-네오테트라오스 c, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 a, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스, 락토-N-네오헥사오스, 파라-락토-N-헥사오스, 모노푸코실모노시알릴락토-N-네오테트라오스 c, 모노푸코실 파라-락토-N-헥사오스, 모노푸코실락토-N-헥사오스 III, 이성질체 푸코실화 락토-N-헥사오스 III, 이성질체 푸코실화 락토-N-헥사오스 I, 시알릴락토-N-헥사오스, 시알릴락토-N-네오헥사오스 II, 디푸코실-파라-락토-N-헥사오스, 디푸코실락토-N-헥사오스, 디푸코실락토-N-헥사오스 a, 디푸코실락토-N-헥사오스 c 또는 갈락토실화 키토산을 포함한다.
본 발명의 다른 바람직한 양태에서, 상기 글리코실화된 생산물은 UDP-GlcNAc로부터 유래되는 단당 및/또는 GlcNAc를 함유하는 포유동물 모유 이당 또는 올리고당, 바람직하게 GlcNAc 및/또는 UDP-GlcNAc로부터 유래되는 단당을 함유하는 인간 모유 이당 또는 올리고당, O-항원, 엔테로박테리아 공통 항원 (ECA), 캡슐 다당류에 존재하는 올리고당 반복부, 펩티도글리칸 (PG) 및 인간 ABO식 혈액형 체계의 항원을 포함하는 목록으로부터 선택된다.
본 발명의 방법 및/또는 세포의 다른 양태에서, 상기 세포는 본 명세서에서 정의된 바와 같은 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되는 글리코실트랜스퍼라제를 발현한다.
본 발명의 방법 및/또는 세포의 바람직한 양태에서, 상기 푸코실트랜스퍼라제는 알파-1,2-푸코실트랜스퍼라제, 알파-1,3-푸코실트랜스퍼라제, 알파-1,3/4-푸코실트랜스퍼라제, 알파-1,4-푸코실트랜스퍼라제 및 알파-1,6-푸코실트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 시알릴트랜스퍼라제는 알파-2,3-시알릴트랜스퍼라제, 알파-2,6-시알릴트랜스퍼라제 및 알파-2,8-시알릴트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 갈락토실트랜스퍼라제는 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, 베타-1,4-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 알파-1,3-갈락토실트랜스퍼라제 및 알파-1,4-갈락토실트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 글루코실트랜스퍼라제는 알파-글루코실트랜스퍼라제, 베타-1,2-글루코실트랜스퍼라제, 베타-1,3-글루코실트랜스퍼라제 및 베타-1,4-글루코실트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 만노실트랜스퍼라제는 알파-1,2-만노실트랜스퍼라제, 알파-1,3-만노실트랜스퍼라제 및 알파-1,6-만노실트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 N-아세틸글루코사미닐트랜스퍼라제는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 베타-1,6-N-아세틸글루코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 N-아세틸갈락토사미닐트랜스퍼라제는 알파-1,3-N-아세틸갈락토사미닐트랜스퍼라제이다.
본 발명의 방법 및/또는 세포의 다른 양태에서, 상기 세포는 본 명세서에 정의된 바와 같은 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, 포스포아세틸글루코사민 뮤타제, UDP-N-아세틸글루코사민 파이로포스포릴라제, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제, UTP--글루코스-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 4-에피머라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 락토스 퍼미아제, UDP-N-아세틸글루코사민 2-에피머라제, N-아세틸뉴라미네이트 신타제, N-아실뉴라미네이트 시티딜릴트랜스퍼라제, 글루코스-6-포스페이트 이소머라제 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스 2-에피머라제를 포함하는 목록으로부터 선택되는 효소 중 어느 하나 이상을 추가로 발현한다.
본 발명의 방법 및/또는 세포의 추가 양태에서, 세포는 상기 효소 및/또는 글리코실트랜스퍼라제 중 적어도 하나의 발현 또는 활성이 변형된다. 바람직한 구현예에서, 상기 효소 및/또는 글리코실트랜스퍼라제는 변형된 발현 또는 활성을 갖는 세포의 내생성 단백질이고, 바람직하게 상기 내생성 효소 및/또는 글리코실트랜스퍼라제는 과발현되고; 대안적으로 상기 효소 및/또는 글리코실트랜스퍼라제는 상기 세포에서 이종으로 도입되어서 발현되는, 바람직하게 과발현되는 이종성 단백질이다. 상기 내생성 효소 및/또는 글리코실트랜스퍼라제는 또한 이종성 효소 및/또는 글리코실트랜스퍼라제를 발현하는 세포에서 변형된 발현을 가질 수 있다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 상기 배양 동안, 상기 세포는 세포 밖으로 상기 글리코실화된 생산물을 배출한다. 본 발명의 방법 및/또는 세포의 보다 바람직한 구현예에서, 상기 배양 동안, 상기 세포는 세포 밖으로 이당 또는 올리고당을 배출한다. 본 명세서에서 사용되는, 이당 또는 올리고당을 포함하는 상기 글리코실화된 생산물의 상기 배출은 임의 방법에 의해서, 예를 들어, 능동 또는 수동 수송을 통해서, 소포체 (ER) 또는 이로부터 유래되는 임의 소포의 사용을 통해서 수행된다.
다른 구현예에 따라서, 본 발명은 세포 밖으로 이당 또는 올리고당을 배출하는 효모 또는 진균 세포를 제공한다. 바람직한 구현예에서, 본 발명은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함하는 이당 또는 올리고당을 배출하는 효모 또는 진균 세포를 제공한다. 보다 바람직한 구현예에서, N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함하는 이당 또는 올리고당을 배출하는 상기 효모 또는 진균 세포는 본 명세서에 기술된 바와 같은 대사적으로 조작된 세포이다.
추가 구현예에서, 본 발명은 세포에 의해서 이당 또는 올리고당을 배출하기 위한 방법을 제공한다. 바람직한 추가 구현예에서, 상기 방법은 본 명세서에 기술된 바와 같은 대사적으로 조작된 세포를 사용한다. 보다 바람직한 추가 구현예에서, 상기 방법은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함하는 이당 또는 올리고당의 배출에 사용될 수 있다.
본 발명의 방법 및/또는 세포의 다른 구현예에서, 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 사용한다. 바람직한 구현예에서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위해 2종 이상의 전구체를 사용한다.
본 발명의 방법 및/또는 세포의 다른 구현예에서, 세포는 상기 글리코실화된 생산물의 합성을 위한 전구체를 생산한다. 바람직한 구현예에서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 하나 이상의 전구체를 생산한다. 보다 바람직한 구현예에서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 상기 전구체 중 어느 하나의 최적 생산을 위해 변형된다.
바람직한 구현예에서, 본 발명은 세포를 사용해 글리코실화된 생산물의 제조를 위한 방법을 제공하고, 상기 세포는 상기 전구체 중 어느 하나를 상기 글리코실화된 생산물을 완전하게 전환시킨다.
용어 "전구체"는 본 명세서에 개시된 바와 같은 정의에서 설명한 바와 같이 이해해야 한다.
본 발명의 다른 양태는 방법 및 세포를 제공하고, UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물은 본 명세서에 기술된 바와 같은 진균, 효모, 박테리아, 곤충, 동물 또는 식물 발현 시스템 또는 세포, 또는 원충 세포에서 및/또는 그에 의해서 생산된다. 발현 시스템 또는 세포는 박테리아, 효모, 또는 진균을 포함하는 목록으로부터 선택되거나, 또는 식물, 동물 또는 원충 세포를 의미한다. 후자의 박테리아는 바람직하게 프로테오박테리아 (Proteobacteria) 문 또는 피르미큐테스 (Firmicutes) 문 또는 시아노박테리아 (Cyanobacteria) 문 또는 데이노코쿠스-써무스 (Deinococcus-Thermus) 문에 속한다. 프로테오박테리아 문에 속하는 후자의 박테리아는 바람직하게 엔테로박테리아세아에 과, 바람직하게 에스케리치아 콜라이 (Escherichia coli) 종에 속한다. 후자의 박테리아는 바람직하게 에스케리치아 콜라이 종에 속하는 임의 균주, 예컨대, 제한없이, 에스케리치아 콜라이 B, 에스케리치아 콜라이 C, 에스케리치아 콜라이 W, 에스케리치아 콜라이 K12, 에스케리치아 콜라이 니슬 (Nissle)에 관한 것이다. 보다 특히, 후자의 용어는 실험실 환경에 잘 적응하고, 야생형 균주와 달리, 장에서 생존하는 그들 능력을 상실한, 배양된 에스케리치아 콜라이 균주 - 이.콜라이 K12 균주로서 지정됨 -에 관한 것이다. 이. 콜라이 K12 균주의 잘 알려진 예는 K12 야생형, W3110, MG1655, M182, MC1000, MC1060, MC1061, MC4100, JM101, NZN111 및 AA200이다. 따라서, 본 발명은 특히 상기 표시된 바와 같은 돌연변이 및/또는 형질전환된 에스케리치아 콜라이 세포 또는 균주에 관한 것이고, 상기 이.콜라이 균주는 K12 균주이다. 보다 바람직하게, 에스케리치아 콜라이 K12 균주는 이.콜라이 MG1655이다. 피르미큐테스 문에 속하는 후자의 박테리아는 바람직하게 바실리 (Bacilli), 바람직하게 락토바실리알레스 (Lactobacilliales)로서, 예컨대, 락토바실러스 락티스 (Lactobacillus lactis), 류코노스톡 메센테로이데스 (Leuconostoc mesenteroides) 구성원, 또는 바실랄레스 (Bacillales)로서, 예컨대 바릴러스 (Bacillus) 속의 구성원, 예컨대, 바실러스 서브틸리스 (Bacillus subtilis), 또는 비. 아밀로리케파시엔스 (B. amyloliquefaciens)에 속한다. 후자의 박테리아는 아시네토박테리아 문에 속하고, 바람직하게 코리네박테리아세아에 (Corynebacteriaceae) 과에 속하는 것으로서, 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) 또는 씨. 아페르멘탄스 (C. afermentans)가 있거나, 또는 스트렙토마이세타세아에 (Streptomycetaceae) 과에 속하는 것으로서 스트렙토마이세스 그리세우스 (Streptomyces griseus) 또는 에스. 프라디아에 (S. fradiae) 구성원이 있다. 후자의 효모는 바람직하게 아스코마이코타 (Ascomycota) 문 또는 바시디오마이코타 (Basidiomycota) 문 또는 듀테로마이코타 (Deuteromycota) 문 또는 자이고마이세테스 (Zygomycetes) 문에 속한다. 후자의 효모는 바람직하게 사카로마이세스 (Saccharomyces) 속 (예컨대, 예를 들어, 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae), 에스. 바야누스 (S. bayanus), 에스. 보울라르디 (S. boulardii)의 구성원), 자이고사카로마이세스 (Zygosaccharomyces), 피키아 (Pichia) (예컨대, 예를 들어, 피키아 파스토리스 (Pichia pastoris), 피. 아노말라 (P. anomala), 피. 클루이베리 (P. kluyveri)) 구성원), 코마가타엘라 (Komagataella), 한세눌라 (Hansenula), 클루이베로마이세스 (Kluyveromyces) (예컨대, 예를 들어, 클루이베로마이세스 락티스 (Kluyveromyces lactis), 케이. 마르시아누스 (K. marxianus), 케이. 써모톨레란스 (K. thermotolerans) 구성원) 또는 데바로마이세스 (Debaromyces)에 속한다. 후자의 진균은 바람직하게 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium), 페니실리움 (Penicillium), 무코르 (Mucor) 또는 아스퍼질러스 (Aspergillus) 속에 속한다. 식물 세포는 개화 및 비-개화 식물의 세포를 비롯하여, 조류 세포, 예를 들어, 클라미도모나스 (Chlamydomonas), 클로렐라 (Chlorella) 등을 포함한다. 바람직하게, 상기 식물은 담배, 알파파, 벼, 토마토, 목화, 유채, 대두, 옥수수, 또는 행운목이다. 후자의 동물 세포는 바람직하게 비-인간 포유동물 (예를 들어, 소, 물소, 돼지, 양, 마우스, 래트), 조류 (예를 들어, 닭, 오리, 타조, 칠면조, 꿩), 어류 (예를 들어, 황새치, 연어, 참치, 농어, 송어, 메기), 무척추동물 (예를 들어, 바닷가재, 게, 새우, 조개, 굴, 홍합, 성게), 파충류 (예를 들어, 뱀, 악어, 거북이), 양서류 (예를 들어, 개구리) 또는 곤충 (예를 들어, 파리, 선충)으로부터 유래되거나 또는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주이다. 인간 및 비-인간 포유동물 세포 둘 모두는 바람직하게 WO21067641에 기술된 바와 같이, 상피 세포 예컨대, 예를 들어, 유선 상피 세포, 배아 신장 세포 (예를 들어, HEK293 또는 HEK 293T 세포), 섬유아세포, COS 세포, 중국 햄스터 난소 (CHO) 세포, 쥐 골수종 세포 예컨대, 예를 들어, N20, SP2/0 또는 YB2/0 세포, NIH-3T3 세포, 비-유선 성체 줄기 세포 또는 이의 유도체를 포함하는 목록으로부터 선택된다. 후자의 곤충 세포는 바람직하게 스포돕테라 프루기페르다 (Spodoptera frugiperda) 예컨대, 예를 들어, Sf9 또는 Sf21 세포, 봄빅스 모리 (Bombyx mori), 마메스트라 브라시카에 (Mamestra brassicae), 트리코플루시아 니 (Trichoplusia ni) 예컨대, 예를 들어, BTI-TN-5B1-4 세포 또는 드로소필라 멜라노가스터 (Drosophila melanogaster) 예컨대, 예를 들어, 드로소필라 (Drosophila) S2 세포로부터 유래된다. 후자의 원충 세포는 바람직하게 리슈마니아 타렌톨라에 (Leishmania tarentolae) 세포이다.
본 명세서에서 사용되는 미생물 또는 세포는 주요 탄소 공급원으로서 단당, 이당, 올리고당, 다당류, 폴리올, 당밀, 옥수수 침지액, 펩톤, 트립톤, 효모 추출물 또는 이의 혼합물 예컨대, 예를 들어, 혼합 공급원료, 바람직하게 혼합 단당 공급원료, 예컨대, 예를 들어, 가수분해 수크로스를 포함하는 복합 배지 상에서 성장할 수 있다. 용어 주요는 관심 바이오산물, 생물량 형성, 이산화탄소 및/또는 부산물 형성 (예컨대, 산 및/또는 알콜, 예컨대, 아세테이트, 락테이트, 및/또는 에탄올)을 위해 가장 중요한 탄소 공급원을 의미하는 것으로서, 다시 말해서, 모든 필요한 탄소의 20, 30, 40, 50, 60, 70, 75, 80, 85, 90, 95, 98, 99%가 상기 표시된 탄소 공급원으로부터 유래된다. 본 발명의 일 구현예에서, 상기 탄소 공급원은 상기 유기체에 대한 유일한 탄소 공급원이고, 다시 말해서, 모든 필요한 탄소의 100%는 상기 표시된 탄소 공급원으로부터 유래된다. 일반적인 주요 탄소 공급원은 글루코스, 글리세롤, 프룩토스, 말토스, 락토스, 아라비노스, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 당밀, 옥수수 침지액, 고-프룩토스 시럽, 아세테이트, 시트레이트, 락테이트 및 피루베이트를 포함하지만, 이에 제한되지 않는다. 용어 복합 배지는 정확한 구성이 결정되지 않은 배지를 의미하는 것이다. 예는 당밀, 옥수수 침지액, 펩톤, 트립톤 또는 효모 추출물이다.
추가의 바람직한 구현예에서, 본 명세서에 기술된 미생물 또는 세포는 본 명세서에서 참조로 편입되는, WO2012/007481에 기술된 바와 같이 생산 경로 및 생물량 경로를 갖는 분할 물질대사를 사용한다. 상기 유기체는 예를 들어, 포스포글루코이소머라제 유전자, 포스포프룩토키나제 유전자, 프룩토스-6-포스페이트 알돌라제 유전자, 프룩토스 이소머라제 유전자, 및/또는 프룩토스:PEP 포스포트랜스퍼라제 유전자로부터 선택되는 유전자를 변경시켜서, 프룩토스-6-포스페이트를 축적하도록 유전자 변형될 수 있다 .
본 발명에 따라서, 본 명세서에 기술된 바와 같은 방법은 바람직하게 상기 글리코실화된 생산물을 상기 배양으로부터 분리시키는 단계를 포함한다.
용어 "상기 배양으로부터 분리"는 세포 및/또는 이의 성장 배지로부터 상기 글리코실화된 생산물을 수확, 수집, 또는 회수하는 것을 의미한다.
상기 글리코실화된 생산물은 세포가 성장된, 수성 배양 배지로부터 통상의 방식으로 분리될 수 있다. 상기 글리코실화된 생산물이 글리코실화된 생산물을 생산하는 세포에 여전히 존재하는 경우에, 세포 밖으로 상기 글리코실화된 생산물을 배출하거나 또는 유리시키는 통상의 방식은 예컨대, 높은 pH, 열충격, 초음파 처리, 프렌치 프레스, 균질화, 효소적 가수분해, 화학적 가수분해, 용매 가수분해, 세제, 가수분해 등을 사용하는 세포 파괴가 사용될 수 있다. 배양 배지 및/또는 세포 추출물은 함께 및 분리하여 이후 추가로 상기 글리코실화된 생산물을 분리하는데 사용될 수 있다. 이것은 바람직하게 현탁된 미립자 및 오염물, 특히 유전자 조작된 세포를 배양하여서 생산되는 세포, 세포 성분, 불용성 대사산물 및 찌꺼기를 제거하기 위해서 상기 글리코실화된 생산물을 함유하는 혼합물을 청징화시키는 것을 포함한다. 이러한 단계에서, 상기 글리코실화된 생산물을 함유하는 혼합물은 통상의 방식으로 청징화될 수 있다. 바람직하게, 상기 글리코실화된 생산물을 함유하는 혼합물은 원심분리, 응결, 경사법 및/또는 여과에 의해 청징화된다. 상기 글리코실화된 생산물을 함유하는 혼합물로부터 상기 글리코실화된 생산물을 분리시키는 다른 단계는 바람직하게 후속 분리 단계를 방해할 수 있는 펩티드, 아미노산, RNA 및 DNA 및 임의의 내독소 및 당지질을 비롯한, 실질적으로 모든 단백질을 상기 글리코실화된 생산물을 함유하는 혼합물로부터, 바람직하게 청징화된 이후에, 제거하는 것을 포함한다. 이러한 단계에서, 단백질 및 관련 불순물은 통상의 방식으로 상기 글리코실화된 생산물을 함유하는 혼합물로부터 제거될 수 있다. 바람직하게, 단백질, 염, 부산물, 색소, 내독소 및 다른 관련 불순물은 상기 글리코실화된 생산물을 함유하는 혼합물로부터, 한외여과, 나노여과, 2-층 분할법, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 비이온성 계면활성제 처리, 효소 분해, 접선 유동 고-성능 여과, 접선 유동 한외여과, 전기영동 (예를 들어, 슬랩-폴리아크릴아미드 또는 소듐 도데실 술페이트-폴리아크릴아미드 겔 전기영동 (PAGE) 사용), 친화성 크로마토그래피 (예를 들어, DEAE-세파로스, 폴리-L-리신 및 폴리믹신-B, 내독소-선택적 흡착제 매트릭스를 포함한 친화성 리간드 사용), 이온 교환 크로마토그래피 (예컨대, 제한없이, 양이온 교환, 음이온 교환, 혼합층 이온 교환, 인사이드-아웃 리간드 부착), 소수성 상호작용 크로마토그래피 및/또는 겔 여과 (즉, 크기 배제 크로마토그래피), 특히 크로마토그래피, 보다 특히 이온 교환 크로마토그래피 또는 소수성 상호작용 크로마토그래피 또는 리간드 교환 크로마토그래피 또는 전기투석을 통해서 제거된다. 크기 배제 크로마토그래피, 단백질 및 관련 불순물이 크로마토그래피 매질 또는 선택된 막에 의해 유지되는 것을 제외하고, 상기 글리코실화된 생산물은 상기 글리코실화된 생산물을 함유하는 혼합물에 잔류한다.
추가의 바람직한 구현예에서, 본 명세서에 기술된 바와 같은 방법은 또한 상기 글리코실화된 생산물의 추가 정제를 위해 제공된다. 상기 글리코실화된 생산물의 추가 정제는 예를 들어, (활성화된) 차콜 또는 탄소, 나노여과, 한외여과, 전기영동, 효소 처리 또는 이온 교환, 온도 조정, pH 조정 또는 알칼리 또는 산성 용액으로 pH 조정의 사용을 통해 수행되어서 임의의 잔존 DNA, 단백질, LPS, 내독소, 또는 다른 불순물을 제거할 수 있다. 알콜, 예컨대, 에탄올, 및 수성 알콜 혼합물이 또한 사용될 수 있다. 다른 정제 단계는 생산물의 결정화, 증발 또는 침전에 의해 수행된다. 다른 정제 단계는 생산된 글리코실화된 생산물을 건조, 예를 들어, 분무 건조, 동결건조, 분무 냉동 건조, 냉동 분무 건조, 밴드 건조, 벨트 건조, 진공 밴드 건조, 진공 벨트 건조, 드럼 건조, 롤러 건조, 진공 드럼 건조 또는 진공 롤러 건조하는 것이다.
예시적인 구현예에서, 생산된 글리코실화된 생산물의 분리 및 정제는 임의 순서로 하기 단계를 포함하는, 방법으로 수행된다:
a) 배양 또는 이의 청징화된 형태를 생산된 글리코실화된 생산물의 체류를 보장하고 단백질, 염, 부산물, 색소 및 다른 관련 불순물의 적어도 일부분은 통과하도록 허용하는 600-3500 Da의 분자량 컷-오프 (MWCO)를 갖는 나노여과막과 접촉시키는 단계,
b) 무기 전해질의 수용액과 상기 막을 사용하여, 단계 a)로부터의 체류물에 대해 투석여과 과정을 수행한 이후에, 과량의 전해질을 제거하기 위해 순수로 임의적인 투과여과를 수행하는 단계,
c) 및 상기 전해질의 양이온으로부터 염의 형태로 글리코실화된 생산물이 농축된 체류물을 수집하는 단계.
대안적인 예시적인 구현예에서, 생산된 글리코실화된 생산물의 분리 및 정제는 임의 순서로 하기 단계를 포함하는, 방법으로 수행된다: 배양 또는 이의 청징화된 형태에 대해서 상이한 막을 사용하여 2개 막 여과 단계를 수행하는 단계로서,
- 하나의 막은 약 300 달톤과 약 500 달톤 사이의 분자량 컷-오프를 갖고,
- 다른 막은 약 600 달톤과 약 800 달톤 사이의 분자량 컷-오프를 갖는다.
대안적인 예시적인 구현예에서, 생산된 글리코실화된 생산물의 분리 및 정제는 배양 또는 이의 청징화된 형태를 한 단계에서 H+-형태의 강한 양이온 교환 수지, 및 다른 단계에서 유리 염기 형태의 약한 음이온 교환 수지로 처리하는 단계를 포함하는 방법으로 수행되고, 상기 단계들은 임의 순서로 수행될 수 있다.
대안적인 예시적인 구현예에서, 생산된 글리코실화된 생산물의 분리 및 정제는 하기 방식으로 수행된다. 생산된 글리코실화된 생산물, 생물량, 배지 성분 및 오염물을 포함하는 배양은 하기 정제 단계에 적용된다:
i) 배양으로부터 생물량의 분리 단계,
ii) 양으로 하전된 물질의 제거를 위해 양이온성 이온 교환기 처리 단계,
iii) 음으로 하전된 물질의 제거를 위해 음이온성 이온 교환기 처리 단계,
iv) 나노여과 단계 및/또는 전기투석 단계,
80% 이상의 순도로 생산된 글리코실화된 생산물을 포함하는 정제된 용액이 제공된다. 임의로 정제된 용액은 분무 건조, 동결건조, 분무 냉동 건조, 냉동 분무 건조, 밴드 건조, 벨트 건조, 진공 밴드 건조, 진공 벨트 건조, 드럼 건조, 롤러 건조, 진공 드럼 건조 및 진공 롤러 건조를 포함하는 목록으로부터 선택되는 어느 하나 이상의 건조 단계에 의해 건조된다.
대안적인 예시적인 구현예에서, 생산된 글리코실화된 생산물의 분리 및 정제는 임의 순서로 하기 단계를 포함하는 방법으로 수행된다: 배양의 효소 처리 단계; 배양으로부터 생물량의 제거 단계; 한외여과; 나노여과; 및 컬럼 크로마토그래피 단계. 바람직하게 이러한 컬럼 크로마토그래피는 단일 컬럼 또는 다수 컬럼이다. 추가로 바람직하게, 컬럼 크로마토그래피 단계는 모의 이동층 크로마토그래피이다. 이러한 모의 이동층 크로마토그래피는 바람직하게 i) 적어도 4개 컬럼으로서, 적어도 하나의 컬럼은 약하거나 또는 강한 양이온 교환 수지를 포함하는 것인 컬럼; 및/또는 ii) 상이한 유속을 갖는 4개 구역 I, II, III 및 IV; 및/또는 iii) 물을 포함하는 용리액; 및/또는 iv) 15℃ 내지 60℃의 작업 온도를 포함한다.
특별한 구현예에서, 본 발명은 분무 건조, 동결건조, 분무 냉동 건조, 냉동 분무 건조, 밴드 건조, 벨트 건조, 진공 밴드 건조, 진공 벨트 건조, 드럼 건조, 롤러 건조, 진공 드럼 건조 및 진공 롤러 건조를 포함하는 목록으로부터 선택되는 어느 하나 이상의 건조 단계에 의해서 분말로 건조되는 생산된 글리코실화된 생산물을 제공하고, 건조된 분말은 < 15% -wt.의 물, 바람직하게 < 10% -wt.의 물, 보다 바람직하게 < 7% -wt.의 물, 가장 바람직하게 < 5% -wt.의 물을 함유한다.
다른 양태에서, 본 발명은 본 명세서에 기술된 바와 같은 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자를 포함하는 벡터를 제공한다.
다른 양태에서, 본 발명은 본 명세서에 기술된 바와 같은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 본 명세서에 기술된 바와 같은 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자의 용도를 제공한다.
다른 양태에서, 본 발명은 본 명세서에 기술된 바와 같은 글리코실화된 생산물의 생산을 위한 본 명세서에 기술된 바와 같은 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자를 포함하는 벡터의 용도를 제공한다.
다른 양태에서, 본 발명은 본 명세서에 기술된 바와 같은 글리코실화된 생산물의 생산을 위한 본 명세서에 기술된 바와 같은 대사적으로 조작된 세포의 용도를 제공한다.
본 명세서에 기술된 바와 같은 세포에서 생산된 글리코실화된 생산물의 확인을 위해서, 단량체 빌딩 블록 (예를 들어, 단당 또는 글리칸 단위 조성), 측쇄의 아노머 구성, 치환 기의 존재 및 위치, 중합도/분자량 및 연결 패턴은 당분야에 공지된 표준 방법, 예컨대, 예를 들어, 메틸화 분석, 환원 절단, 가수분해, GC-MS (가스 크로마토그래피-질량 분광법), MALDI-MS (매트릭스-보조 레이저 탈착/이온화-질량 분광법), ESI-MS (전자분무 이온화-질량 분광법), HPLC (자외선 또는 굴절률 검출 동반 고성능 액상 크로마토그래피), HPAEC-PAD (펄스식 전류측정 검출 동반 고성능 음이온-교환 크로마토그래피), CE (모세관 전기영동), IR (적외선)/라만 분광법, 및 NMR (핵 자기 공명) 분광법 기술에 의해 확인될 수 있다. 결정 구조는 예를 들어, 고체 NMR, FT-IR (퓨리에 변환 적외선 분광법), 및 WAXS (광각 X-선 산란)을 사용하여 해석될 수 있다. 중합도 (DP), DP 분포 및 다분산도는 예를 들어, 점도계 및 SEC (SEC-HPLC, 고성능 크기-배제 크로마토그래피)를 통해 결정될 수 있다. 당류의 단량체 성분을 확인하기 위해서, 방법 예컨대, 예를 들어, 산-촉매 가수분해, HPLC (고성능 액상 크로마토그래피) 또는 GLC (기체-액체 크로마토그래피) (알디톨 아세테이트로 전환 이후)가 사용될 수 있다. 글리코시드 연결을 결정하기 위해서, 당류는 DMSO 중 요오드화메틸 및 강염기에 의해 메틸화되고, 가수분해가 수행되고, 부분적으로 메틸화된 알디톨로 환원이 달성되며, 메틸화된 알디톨 아세테이트로의 아세틸화가 수행되며, 분석은 GLC/MS (질량 분광법과 결합된 기체-액체 크로마토그래피)에 의해 수행된다. 올리고당 서열을 결정하기 위해서, 부분 해중합이 산 또는 효소를 사용해 수행되어서 구조가 결정된다. 아노머 구성을 확인하기 위해서, 올리고당에 대해서 효소적 분석을 수행하고, 예를 들어, 특정 유형의 연결에 특이적인 효소, 예를 들어 베타-갈락토시다제, 또는 알파-글루코시다제 등과 접촉되고, NMR을 사용해 생산물을 분석할 수 있다.
글리코실화된 생산물을 포함하는 생산물
일부 구현예에서, 본 명세서에 기술된 바와 같이 생산되는 글리코실화된 생산물은 식품 (예를 들어, 인간 식품 또는 사료), 식이 보충물, 약학 성분, 미용 성분 또는 의약품에 포함된다. 일부 구현예에서, 글리코실화된 생산물은 식품, 사료, 식이 보충물, 약학 성분, 미용 성분, 또는 의약품에 적합한 하나 이상의 성분과 혼합된다.
일부 구현예에서, 식이 보충물은 적어도 하나의 프리바이오틱 성분 및/또는 적어도 하나의 프로바이오틱 성분을 포함한다.
"프리바이오틱"은 숙주에 유익한 미생물, 특히 위장관의 미생물의 성장을 촉진하는 물질이다. 일부 구현예에서, 식이 보충물은 하나 이상의 유익한 미생물의 성장을 촉진하기 위해서, 본 명세서에 개시된 방법을 통해서 생산 및/또는 정제된 프리바이오틱인 글리코실화된 생산물을 포함한, 다수의 프리바이오틱을 제공한다. 식이 보충물을 위한 프리바이오틱 성분의 예는 다른 프리바이오틱 분자 (예컨대, HMO) 및 식물 다당류 (예컨대, 이눌린, 펙틴, b-글루칸 및 자일로올리고당)를 포함한다. "프로바이오틱" 생산물은 전형적으로 수용자의 이익을 위해서, 위장관 미생물총에 첨가되거나 또는 대체되는 살아있는 미생물을 함유한다. 이러한 미생물의 예는 락토바실러스 (Lactobacillus) 종 (예를 들어, 엘. 악시도필루스 (L. acidophilus) 및 엘. 불가리쿠스 (L. bulgaricus)), 비피도박테리움 (Bifidobacterium) 종 (예를 들어, 비. 아니말리스 (B. animalais), 비. 롱검 (B. longum) 및 비. 인판티스 (B. Infantis) (예를 들어, Bi-26)), 및 사카로마이세스 보울라르디 (Saccharomyces boulardii)를 포함한다. 일부 구현예에서, 본 명세서의 방법으로 생산 및/또는 정제된 글리코실화된 생산물은 이러한 미생물과 조합하여 경구로 투여된다.
식이 보충물을 위한 추가 성분의 예는 이당 (예컨대, 락토스), 단당 (예컨대, 글루코스 및 갈락토스), 증점제 (예컨대, 검 아라빅), 산도 조절제 (예컨대, 트리소듐 시트레이트), 물, 탈지유, 및 풍미제를 포함한다.
일부 구현예에서, 글리코실화된 생산물은 인간 이유식 (예를 들어, 영아용 조제식)에 혼입된다. 영아용 조제식은 일반적으로 인간 모유에 대한 완전 또는 부분 대체물로서 영아에게 먹이기 위해 제조된 식품이다. 일부 구현예에서, 영아용 조제식은 분말로서 판매되고, 물과 혼합하여 영아에게 젖병 또는 컵으로 먹이기 위해 제조된다. 영아용 조제식의 조성물은 전형적으로 인간 모유를 대략적으로 모방하기 위해 디자인된다. 일부 구현예에서, 본 명세서의 방법으로 생산 및/또는 정제된 글리코실화된 생산물은 영아용 조제식에 포함되어서 인간 모유의 올리고당에 의해 제공되는 것과 유사한 영양적 이득을 제공한다. 일부 구현예에서, 글리코실화된 생산물은 영아용 조제식의 하나 이상의 성분과 혼합된다. 영아용 조제식 성분의 예는 무지방유, 탄수화물 공급원 (예를 들어, 락토스), 단백질 공급원 (예를 들어, 농축 유청 단백질 및 카세인), 지방 공급원 (예를 들어, 식물성 오일 - 예컨대, 야자유, 고올레산 홍화유, 유채씨유, 코코넛유 및/또는 해바라기유; 및 어유), 비타민 (예컨대, 비타민 A, Bb, Bi2, C 및 D), 미네랄 (예컨대, 포타슘 시트레이트, 칼슘 시트레이트, 마그네슘 클로라이드, 소듐 클로라이드, 소듐 시트레이트 및 칼슘 포스페이트) 및 가능한 인간 모유 올리고당 (HMO)을 포함한다. 이러한 HMO는 예를 들어, DiFL, 락토-N-트리오스 II, LNT, LNnT, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스, 락토-N-푸코펜타오스 II, 락토-N- 푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 6'-갈락토실락토스, 3'-갈락토실락토스, 락토-N-헥사오스 및 락토- N-네오헥사오스를 포함한다.
일부 구현예에서, 하나 이상의 영아용 조제식 성분은 무지방유, 탄수화물 공급원, 단백질 공급원, 지방 공급원, 및/또는 비타민 및 미네랄을 포함한다.
일부 구현예에서, 하나 이상의 영아용 조제식 성분은 락토스, 농축 유청 단백질 및/또는 고올레산 홍화유를 포함한다.
일부 구현예에서, 영아용 조제식 중 글리코실화된 생산물 농도는 일반적으로 인간 모유에 존재하는 글리코실화된 생산물 농도와 대략 동일한 농도이다.
일부 구현예에서, 글리코실화된 생산물은 사료 조제물에 혼입되고, 상기 사료는 반려동물 사료, 동물 우유 대체제, 수의학 제품, 수의학 사료 보충물, 영양 보충물, 이유후 사료, 또는 이유기 보조 사료를 포함하는 목록으로부터 선택된다.
본 명세서의 실시예에서 확인하게 되는 바와 같이, 본 발명의 방법 및 세포는 바람직하게 본 명세서에 기술된 바와 같은 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제가 결여된 상기 글리코실화된 생산물의 생산을 위한 숙주 및 방법과 비교했을 때, 하기 놀라운 장점 중 적어도 하나를 제공한다:
- 상기 글리코실화된 생산물의 더 높은 적정가 (g/L),
- 더 높은 생산율 r (상기 글리코실화된 생산물의 g/ L/h),
- 더 높은 세포 성능 지수 CPI (상기 글리코실화된 생산물의 g / g X),
- 더 높은 비생산성 Qp (상기 글리코실화된 생산물의 g /g X /h),
- 수크로스에 대한 더 높은 수율 Ys (상기 글리코실화된 생산물의 g / g 수크로스),
- 더 높은 수크로스 흡수/전환율 Qs (g 수크로스 / g X /h),
- 더 높은 락토스 전환/소비율 rs (g 락토스/h),
- 상기 글리코실화된 생산물의 더 높은 배출, 및/또는
- 생산 숙주의 더 높은 성장 속도.
달리 정의하지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 일반적으로 본 발명이 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 일반적으로 본 명세서에서 사용되는 명명법 및 상기 및 하기에 기술된 세포 배양, 분자 유전학, 유기 화학 및 핵산 화학 및 혼성화의 실험실 절차는 당분야에서 충분히 공지되어 있고 일반적으로 적용된다. 표준 기술이 핵산 및 펩티드 합성에 사용된다. 일반적으로, 정제 단계는 제조사 사양에 따라서 수행된다.
추가 장점은 특정 구현예 및 실시예에 뒷따른다. 상기 언급된 특성 및 히아 여전히 설명되는 특성은 각각 특정된 조합으로 사용될 수 있을 뿐만 아니라, 또한 본 발명의 범주를 벗어나지 않고, 다른 조합 또는 그들 자체로 사용될 수 있다는 것은 자명하다.
본 발명은 하기 특정 구현예에 관한 것이다:
1. 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포로서, 상기 세포는,
(i) 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고,
(ii) UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 합성하고,
(iii) 글리코실트랜스퍼라제를 발현하며,
상기 세포는 상기 UDP-GlcNAc를 사용하여 상기 글리코실화된 생산물을 생산한다.
2. 구현예 1에 따른 세포에 있어서, 상기 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 포함하는 적어도 하나의 유전자 발현 모듈에 의해 변형된 대사적으로 조작된 세포이고, 바람직하게 상기 발현 모듈로부터의 발현은 항상성이거나 또는 비-화학적 유도 또는 억제 시 조건적이다.
3. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고,
(i) V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나에 따른 폴리펩티드 서열을 포함하거나, 또는
(ii) 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 또는 38을 갖는 상기 폴리펩티드 중 어느 하나의 전체 길이에 대해 적어도 80% 전체 서열 동일성을 갖는 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 또는 38 중 어느 하나의 기능성 상동체, 변이체 또는 유도체이거나, 또는
(iii) 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53을 갖는 상기 폴리펩티드 중 어느 하나의 전체 길이에 대해서 적어도 80% 전체 서열 동일성을 갖고, V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 기능성 상동체, 변이체 또는 유도체인, 단백질이다.
4. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 단당 서브유닛 중 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택된다.
5. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택되는 뉴클레오티드-당을 추가로 합성한다.
6. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,
바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제의 발현 또는 활성이 변형된다.
7. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, 포스포아세틸글루코사민 뮤타제, UDP-N-아세틸글루코사민 파이로포스포릴라제, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제, UTP--글루코스-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 4-에피머라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 락토스 퍼미아제, UDP-N-아세틸글루코사민 2-에피머라제, N-아세틸뉴라미네이트 신타제, N-아실뉴라미네이트 시티딜릴트랜스퍼라제, 글루코스-6-포스페이트 이소머라제 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스 2-에피머라제로부터 선택되는 효소 중 어느 하나 이상을 추가로 발현하고,
바람직하게, 상기 세포는 상기 효소 중 적어도 하나의 발현 또는 활성이 변형된다.
8. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실화된 생산물은 포유동물 모유 이당 또는 올리고당, O-항원, 엔테로박테리아 공통 항원 (ECA), 캡슐 다당류, 펩티도글리칸 (PG) 및 인간 ABO식 혈액형 체계의 항원을 포함하는 목록으로부터 선택된다.
9. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 사용하고, 바람직하게 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 둘 이상의 전구체를 사용한다.
10. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 생산한다.
11. 구현예 9 또는 10 중 어느 하나에 따른 세포에 있어서, 상기 글리코실화된 생산물의 합성을 위한 상기 전구체는 상기 글리코실화된 생산물로 완전하게 전환된다.
12. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 세포질 막에 걸쳐서 적어도 하나의 이당 또는 올리고당을 배출한다.
13. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 미생물, 식물, 또는 동물 세포로 이루어진 군으로부터 선택되고, 바람직하게 상기 미생물은 박테리아, 진균 또는 효모이고, 바람직하게 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 행운목이고, 바람직하게 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물이고, 바람직하게 상기 동물 세포은 포유동물 세포주이다.
14. 구현예 13에 따른 세포에 있어서, 상기 세포는 박테리아, 바람직하게 에스케리치아 콜라이 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이 균주의 세포이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655이다.
15. 구현예 13에 따른 세포에 있어서, 상기 세포는 효모이고, 바람직하게 효모 세포는 사카로마이세스 (Saccharomyces), 자이고사카로마이세스 (Zygosaccharomyces), 피키아 (Pichia), 코마가타엘라 (Komagataella), 한세눌라 (Hansenula), 클루이베로마이세스 (Kluyveromyces) 또는 데바로마이세스 (Debaromyces)를 포함하는 군으로부터 선택되는 속에 속한다.
16. 구현예 13에 따른 세포에 있어서, 상기 세포는 진균이고, 바람직하게 진균은 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium), 페니실리움 (Penicillium), 무코르 (Mucor) 또는 아스퍼질러스 (Aspergillus) 속에 속한다.
17. 세포에 의한 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 제조하기 위한 방법으로서, 방법은 하기 단계를 포함한다:
(a) 구현예 1 내지 16 중 어느 하나에 따른 세포를 제공하는 단계, 및
(b) 상기 글리코실화된 생산물을 생산하도록 허용하는 조건 하에서 상기 세포를 배양하는 단계,
(c) 바람직하게, 상기 배양으로부터 상기 글리코실화된 생산물을 분리시키는 단계.
18. 구현예 17에 따른 방법에 있어서, 상기 배양 동안, 상기 세포는 세포질 막에 걸쳐서 발효배양 액체배지 중에 상기 글리코실화된 생산물을 배출한다.
19. 구현예 17 또는 18 중 어느 하나에 따른 방법에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함한다: 청징화, 한외여과, 나노여과, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피.
20. 구현예 17 내지 19 중 어느 하나에 따른 방법에 있어서, 상기 세포로부터 상기 글리코실화된 생산물의 정제 단계를 더 포함한다.
21. 구현예 17 내지 20 중 어느 하나에 따른 방법에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함한다: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과 또는 이온 교환, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조 또는 동결건조.
22. 세포질 막에 걸쳐서 이당 또는 올리고당을 배출하는 효모 또는 진균 세포.
23. 구현예 22에 따른 효모 또는 진균 세포에 있어서, 상기 이당 또는 올리고당은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함한다.
24. 구현예 22 또는 23 중 어느 하나에 따른 효모 또는 진균 세포에 있어서, 상기 세포는 구현예 1 내지 16 중 어느 하나에 따른 대사적으로 조작된 세포이다.
25. 글리코실화된 생산물의 생산을 위한 구현예 1 내지 16 및 22 내지 24 중 어느 하나에 따른 세포의 용도.
26. 글리코실화된 생산물의 생산을 위한 구현예 17 내지 21 중 어느 하나에 따른 방법의 용도.
또한, 본 발명은 하기 바람직한 특정 구현예에 관한 것이다:
1. 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포로서, 상기 세포는
(i) 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,
(ii) UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 합성할 수 있고, 바람직하게, 합성하고,
(iii) 글리코실트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,
상기 세포는 상기 UDP-GlcNAc를 사용하여 상기 글리코실화된 생산물을 생산한다.
2. 바람직한 구현예 1에 따른 세포에 있어서, 상기 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 포함하는 적어도 하나의 유전자 발현 모듈에 의해 변형된 대사적으로 조작된 세포이고, 바람직하게 상기 발현 모듈로부터의 발현은 항상성이거나 또는 비-화학적 유도 또는 억제 시 조건적이다.
3. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고,
(i) V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나에 따른 폴리펩티드 서열을 포함하거나, 또는
(ii) 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 아미노산 서열에 대해 적어도 200 아미노산 잔기 범위에 걸쳐서 적어도 80.0% 동일한 서열인 아미노산 서열을 포함하거나 또는 그로 이루어지고, V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01와 상이한 폴리펩티드인, 단백질이다.
4. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 단당 서브유닛 중 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산으로 이루어진 목록으로부터 선택된다.
5. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스로 이루어진 목록으로부터 선택되는 뉴클레오티드-당을 추가로 합성한다.
6. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제로 이루어진 목록으로부터 선택되고,
- 바람직하게, 상기 푸코실트랜스퍼라제는 알파-1,2-푸코실트랜스퍼라제, 알파-1,3-푸코실트랜스퍼라제, 알파-1,3/4-푸코실트랜스퍼라제, 알파-1,4-푸코실트랜스퍼라제 및 알파-1,6-푸코실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 시알릴트랜스퍼라제는 알파-2,3-시알릴트랜스퍼라제, 알파-2,6-시알릴트랜스퍼라제 및 알파-2,8-시알릴트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 갈락토실트랜스퍼라제는 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, 베타-1,4-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 알파-1,3-갈락토실트랜스퍼라제 및 알파-1,4-갈락토실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 글루코실트랜스퍼라제는 알파-글루코실트랜스퍼라제, 베타-1,2-글루코실트랜스퍼라제, 베타-1,3-글루코실트랜스퍼라제 및 베타-1,4-글루코실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 만노실트랜스퍼라제는 알파-1,2-만노실트랜스퍼라제, 알파-1,3-만노실트랜스퍼라제 및 알파-1,6-만노실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 N-아세틸글루코사미닐트랜스퍼라제는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 베타-1,6-N-아세틸글루코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 N-아세틸갈락토사미닐트랜스퍼라제는 알파-1,3-N-아세틸갈락토사미닐트랜스퍼라제이고,
- 바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제의 발현 또는 활성이 변형된다.
7. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, 포스포아세틸글루코사민 뮤타제, UDP-N-아세틸글루코사민 파이로포스포릴라제, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제, UTP--글루코스-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 4-에피머라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 락토스 퍼미아제, UDP-N-아세틸글루코사민 2-에피머라제, N-아세틸뉴라미네이트 신타제, N-아실뉴라미네이트 시티딜릴트랜스퍼라제, 글루코스-6-포스페이트 이소머라제 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스 2-에피머라제를 포함하는 목록으로부터 선택되는 효소 중 어느 하나 이상을 추가로 발현하고,
바람직하게, 상기 세포는 상기 효소 중 적어도 하나의 발현 또는 활성이 변형된다.
8. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실화된 생산물은 포유동물 모유 이당 또는 올리고당, 바람직하게 인간 모유 이당 또는 올리고당, O-항원, 엔테로박테리아 공통 항원 (ECA), 캡슐 다당류에 존재하는 올리고당 반복부, 펩티도글리칸 (PG) 및 인간 ABO식 혈액형 체계의 항원을 포함하는 목록으로부터 선택된다.
9. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 사용하고, 바람직하게 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 둘 이상의 전구체를 사용한다.
10. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 생산한다.
11. 바람직한 구현예 9 또는 10 중 어느 하나에 따른 세포에 있어서, 상기 글리코실화된 생산물의 합성을 위한 상기 전구체는 상기 글리코실화된 생산물로 완전하게 전환된다.
12. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 세포 밖으로 적어도 하나의 이당 또는 올리고당을 배출한다.
13. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 박테리아, 진균, 효모, 식물 세포, 동물 세포, 또는 원충 세포이고,
- 바람직하게 상기 박테리아는 에스케리치아 콜라이 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이 균주이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655이고,
- 바람직하게 상기 진균은 리조푸스, 딕티오스텔리움, 페니실리움, 무코르 또는 아스퍼질러스를 포함하는 군으로부터 선택되는 속에 속하고,
- 바람직하게 상기 효모는 사카로마이세스, 자이고사카로마이세스, 피키아, 코마가타엘라, 한세눌라, 클루이베로마이세스 또는 데바로마이세스를 포함하는 군으로부터 선택되는 속에 속하고,
- 바람직하게 상기 식물 세포는 조류 세포이거나 또는 담배, 알파파, 벼, 토마토, 목화, 유채, 대두, 옥수수, 또는 행운목으로부터 유래되고,
- 바람직하게 상기 동물 세포는 비-인간 포유동물, 조류, 어류, 무척추동물, 파충류, 양서류 또는 곤충으로부터 유래되거나 또는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주이고, 보다 바람직하게 상기 인간 및 비-인간 포유동물 세포는 상피 세포, 배아 신장 세포, 섬유아세포, COS 세포, 중국 햄스터 난소 (CHO) 세포, 쥐 골수종 세포, NIH-3T3 세포, 비-유선 성체 줄기 세포 또는 이의 유도체이고, 보다 바람직하게 상기 곤충 세포는 스포돕테라 프루기페르다, 봄빅스 모리, 마메스트라 브라시카에, 트리코플루시아 니 또는 드로소필라 멜라노가스터이고,
- 바람직하게 상기 원충 세포는 리슈마니아 타렌톨라에 세포이다.
14. 세포에 의해 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 제조하기 위한 방법으로서, 방법은 하기 단계를 포함한다:
(a) 바람직한 구현예 1 내지 13 중 어느 하나에 따른 세포를 제공하는 단계, 및
(b) 상기 글리코실화된 생산물을 생산하도록 허용하는 조건 하에서 상기 세포를 배양하는 단계,
(c) 바람직하게, 상기 배양으로부터 상기 글리코실화된 생산물을 분리시키는 단계.
15. 바람직한 구현예 14에 따른 방법에 있어서, 상기 배양 동안 상기 세포는 세포 밖으로 상기 글리코실화된 생산물을 배출한다.
16. 바람직한 구현예 14 또는 15 중 어느 하나에 따른 방법에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함한다: 청징화, 한외여과, 나노여과, 2-층 분할법, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 비이온성 계면활성제 처리, 효소 분해, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피, 전기투석.
17. 바람직한 구현예 14 내지 16 중 어느 하나에 따른 방법에 있어서, 상기 세포로부터 상기 글리코실화된 생산물의 정제 단계를 더 포함한다.
18. 바람직한 구현예 17에 따른 방법에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함한다: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과, 전기영동, 효소 처리 또는 이온 교환, 온도 조정, pH 조정, 알칼리 또는 산성 용액으로 pH 조정, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조, 동결건조, 분무 냉동 건조, 냉동 분무 건조, 밴드 건조, 벨트 건조, 진공 밴드 건조, 진공 벨트 건조, 드럼 건조, 롤러 건조, 진공 드럼 건조 또는 진공 롤러 건조.
19. 세포 밖으로 이당 또는 올리고당을 배출하는 효모 또는 진균 세포.
20. 바람직한 구현예 19에 따른 효모 또는 진균 세포에 있어서, 상기 이당 또는 올리고당은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함한다.
21. 바람직한 구현예 19 또는 20 중 어느 하나에 따른 효모 또는 진균 세포에 있어서, 상기 세포는 바람직한 구현예 1 내지 13 중 어느 하나에 따른 대사적으로 조작된 세포이다.
22. 바람직한 구현예 1 및 3 중 어느 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자를 포함하는 벡터.
23. UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 바람직한 구현예 1 내지 13 및 19 내지 21 중 어느 하나에 따른 세포의 용도.
24. UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 바람직한 구현예 14 내지 18 중 어느 하나에 따른 방법의 용도.
25. UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 바람직한 구현예 1 및 3 중 어느 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자의 용도.
26. UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 바람직한 구현예 22에 따른 벡터의 용도.
본 발명은 실시예에서 보다 상세하게 기술될 것이다.
하기 실시예는 본 발명의 추가 예시 및 설명으로서 제공될 것이고 제한하려는 의도가 아니다.
실시예
실시예 1. 재료 및 방법 사카로마이세스 세레비지아에
배지
에스. 세레비지아에 균주는 완전 보충 혼합물이 존재하는 합성 한정 효모 배지 (SD CSM) 또는 아미노산없는 6.7 g/L 효모 질소 베이스 (YNB w/o AA, Difco), 22 g/L 글루코스 일수화물 (Riedel-De Haen) 및 적절한 선택적 아미노산 혼합물 (예를 들어, 0.79 g/L CSM 또는 0.77 g/L CSM-HIS, MP Biomedicals)을 함유하는 CSM drop-out (예를 들어, CSM-HIS 또는 CSM-LEU)에서 배양되었다. 6'-시알릴락토스 (6'SL), 락토-N-트리오스 II (LNT II) 및 락토-N-네오테트라오스 (LNnT)에 대한 생산 실험은 또한 5 g/L 락토스를 함유하였다. 고형 배지는 20 g/L 한천 noble (Difco)을 첨가하여 수득되었다.
발효배양 작업은 또한 완전 보충 혼합물 존재의 합성 한정 효모 배지 (SD CSM) 또는 탄소 공급원으로서 2% 글루코스를 함유하는 CSM drop-out 배지에서 수행되었다.
클로닝 절차 및 플라스미드 유지에 사용된, One Shot TOP10 Chemically competent™ 에스케리치아 콜라이 (C404003, Thermofisher Scientific)는 10 g/L 트립톤 (Difco), 5 g/L 효모 추출물 (Difco) 및 5 g/L 소듐 클로라이드 (VWR)로 이루어진 LB (Lysogeny Broth)를 사용하여 200 rpm에서 진탕하면서 37℃에서 배양되었다. 12 g/L 한천 (Biokar Diagnostics)은 고형 배지가 필요하면 첨가되었다. 필요한 경우에, 필요한 항생제 (100 μg/mL 암피실린 또는 25 μg/mL 클로람페니콜)가 오토클레이빙 이후에 첨가되었다. 소듐 클로라이드가 없고, 50 g/L 수크로스 (0.22 μm PTFE 필터를 사용해 필터 멸균됨)가 보충된 고형 LB는 SacBR에 대한 역선택을 원할 때 사용되었다.
모든 성분은 121℃에서 21분 동안 개별적으로 오토클레이빙되었다.
플라스미드
에스. 세레비지아에 BY4742 유래 천연 GFA1 (SEQ ID NO 01), 이중 돌연변이 Q96H 및 Q157R을 갖는 이의 변이체 (SEQ ID NO 42), 사중 돌연변이 V12L, Q96H, Q157R 및 E343V를 갖는 이의 변이체 (SEQ ID NO 39) 또는 다른 적합화를 갖는 변이체 (SEQ ID NO 40, 41, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53) 및/또는 SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그, 클루이베로마이세스 락티스 (Kluyveromyces lactis) NRRL Y-1140 (UniProt ID P07921) 유래 락토스 퍼미아제 (LAC12), 캄필로박터 제주니 (Campylobacter jejuni) 유래 N-아세틸글루코사민-6-포스페이트 2-에피머라제 (neuC) (UniProt ID AAK91727.1), 이.콜라이 유래 N-아세틸뉴라미네이트 신타제 (neuB) (UniProt ID Q46675), 캄필로박터 제주니 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) (UniProt ID Q93MP7), 알파-2,6-시알릴트랜스퍼라제 활성을 갖고 포토박테리움 담셀라에 (Photobacterium damselae) 유래 알파-2,6-시알릴트랜스퍼라제 (a26ST)의 아미노산 잔기 108 내지 497로 구성된 폴리펩티드 (UniProt ID O66375), 네이세리아 메닌지티디스 (Neisseria meningitidis) 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (lgtA) (SEQ ID NO 54) 및 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (lgtB) (UniProt ID Q51116)의 발현을 위한 발현 플라스미드는 골든 게이트 클로닝을 통해서 또는 VErsatile Genetic Assembly System (VEGAS)의 변형된 형태를 통해서 클로닝되었다 (Kuijpers et al., Microb. Cell Fact. 12, 47 (2013); Mitchell et al., Nucleic Acids Res. 43, 6620-6630 (2015)). 표 1은 사용된 단백질의 개요를 표시한다. 효모 프로모터 (pCCW12, pFBA1, pPAB1, pPGK1, pTEF, pTDH3) 및 종결자 (tADH1, tENO1, tGuo1, tSynth14, tSynth17, tSynth18)는 현행 문헌을 기반으로 선택되었다 (Curran et al., ACS Synth. Biol. 4, 824-832 (2015); Lee et al., ACS Synth. Biol. 4, 975-986 (2015)). 영양요구성 마커 HIS5 및 LEU2 는 각각 pUG27 (Euroscarf, P30115) 및 pUG73 (Euroscarf, P30118)으로부터 수득되었다. CEN6/ARS4 (pSH47, Euroscarf, P30119) 또는 2μ (pEX2, BCCM, p2890)는 효모에서 플라스미드를 유지시키기 위한 복제 기원으로서 선택되었다. 모든 부분은 One Shot TOP10 Chemically competent™ 이.콜라이에서 캐리어 벡터 상에 저장되었다. 상이한 항생제 내성 마커는 별개 캐리어 또는 발현 플라스미드 상에서 사용되었다. 올리고뉴클레오티드 및 gBlocks는 Integrated DNA Technologies (IDT)에서 입수하였다. 코돈 용법은 공급사의 도구를 사용하여 발현 숙주 에스 세레비지아에에 대해 적합화되었다. 생체내 조립을 위한 발현 플라스미드 및 선형 DNA 단편은 Gietz 및 Woods의 방법 (Gietz and Woods, Methods Enzymol. 350, 87-96 (2002))에 따라서 에스. 세레비지아에에 형질전환되었다. 별개 실시예에서 사용되는 발현 플라스미드의 개요는 표 2에 제공된다.
효모 균주
에스. 세레비지아에 S288c로부터 유래된, 사카로마이세스 세레비지아에 BY4742 (MATα, his3Δ1, leu2Δ0, lys2Δ0, ura3ΔO)는 Euroscarf 생물자원 센터 (Y10000, Euroscarf, University of Frankfurt, Germany)에서 입수하였고 발현 숙주로서 사용되었다. 모든 에스. 세레비지아에 균주는 1:1 비율 혼합물로 30% 멸균 글리세롤 존재의 저온바이알 중 -80℃에 저장되었다.
배양 조건
효모 배양은 접종 바늘을 사용하여 5 mL의 적절한 배지 중 저온바이알 또는 플레이트로부터 접종하였고 밤새 30℃ 및 200 rpm에서 인큐베이션하였다. 성장 및 생산 실험에 필요한, 단일 콜로니를 수득하기 위해서, 균주를 (선택적) SD CSM에 도말하였고 3일 동안 30℃에서 인큐베이션하였다. 이후에, 복제물을 선택하였고, 전-배양으로서 밤새 5 mL에 배양하였고 0.1의 광학 밀도 (OD)에서 성장 및 생산 실험을 접종하는데 사용되었다. 성장 및 생산 실험은 50 mL (ManNAc, Neu5Ac 및 6'SL 생산)을 함유하는 250 mL 진탕 플라스크 또는 100 mL (LNT II 및 LNnT 생산)의 신선한 예열 (30℃)된 적절한 배지를 함유하는 500 mL 진탕 플라스크에서 수행되었고, 30℃ 및 200 rpm에서 인큐베이션하였다. 샘플은 성장 및 생산을 평가하기 위해 규칙적인 시점에 수집되었다.
16시간 동안 성장된 진탕 플라스크 배양을 또한 생물반응기에 대한 접종원으로서 사용할 수 있다. 발효배양은 MFCS 제어 소프트웨어 (Sartorius Stedim Biotech, Melsungen, Germany)에 의해 제어되는, 4 L 작업 부피의 5 L Biostat Dcu-B에서 수행되었다. 발효기는 4% 접종원이 접종되었다. 발효기의 온도는 30℃로 유지되었고, pH는 전체 발효배양 전반에서 20% 암모늄 히드록시를 사용해 5.5와 6.5 사이로 제어되었다. 발효배양의 초기 시간 동안, 통기는 0.4 L/분으로 제어되었고, 용존 산소는 교반을 통해 20%로 제어되었다. 유가 배양 동안, 통기는 단계식 방식으로 1.5 L/분까지 조정되어서 용존 산소 수준을 유지하였다. 배기 가스는 냉각시켰다. 실리콘 소포제의 10% 용액은 발효배양 동안 기포가 발생될 때 첨가되었다. 유도제의 사용은 모든 유전자가 항상 발현되므로 요구되지 않는다. 발효배양은 글루코스 공급물을 사용해 수행되었고; 부가적인 락토스 공급물이 LNT II, LNnT 또는 6'SL의 생산에 사용되었다. 발효배양 동안 규치적인 샘플을 채취하였다.
세포외 생산을 평가하기 위해서, 0.5 mL 샘플을 원심분리 (11 000 rpm, 10분)하였고, 상청액은 PTFE 필터 (Novolab)를 통해서 여과되었다. 세포내 생산을 평가하기 위해서, 10 mL 샘플을 수집하였고 기술된 바와 같이 처리되었다 (Hollands et al., Metab. Eng. 52, 232-242 (2019). 여기서, 2 mL 샘플을 원심분리하였고, 펠렛은 dH2O로 세척하였다. 적절한 양의 Cellytic Y 세포 용해 시약 (Sigma Aldrich) 및 산-세척 유리 비드 (425-600 μm; Sigma Aldrich)를 첨가하였고, 그 후에 샘플은 4℃에서 1분 와류의 10회 주기로 와류시킨 다음에, 적어도 30초 동안 얼음에 두었다. 마지막으로, 비드와 세포를 원심분리 (10 000 rpm, 10분)를 통해 펠렛화하였고, 상청액은 PTFE 필터를 통해 여과시켰다.
광학 밀도 및 pH
표모 배양의 세포 밀도는 V-630 Bio 분광광도계 (Jasco)를 사용하여 600 nm에서 광학 밀도를 측정하여 모니터링되었다.
여과된 상청액의 pH는 성장 및 생산 실험 동안 잠재적 변화를 모니터링하기 위해 측정되었다.
분석적 분석
표준물 예컨대, 제한없이 수크로스, 락토스, 시알산, 6'-시알릴락토스, LNT II, LNT 및 LNnT는 Carbosynth (UK), Elicityl (France) 및 IsoSep (Sweden)에서 구매하였다. 다른 화합물은 사내 제조 표준물로 분석하였다. 여과된 상청액 중 N-아세틸만노사민 (ManNAc), 시알산 (Neu5Ac) 및 6'-시알릴락토스 (6'SL) 함량은 UV-검출기에 연결된 Waters Acquity UPLC H-클래스 시스템으로 정량하였다. Rezex ROA-유기산 H+ 컬럼 (100 x 4.6 mm ID, 8%)은 65℃에서 이동층으로서 5 mM 황산과 함께 사용되었다. 유속은 0.1 mL/분으로 설정되었고, ManNAc, Neu5Ac 및 6'SL은 ACQUITY TUV 검출기를 사용하여 200 nm에서 측정되었다. 정량은 정량된 희석 범위의 표준물을 기반으로 수행되었다. 여과된 상층액 중 락토-N-트리오스 II (LNT II) 및 락토-N-네오테트라오스 (LNnT)는 분석 전에 둘 모두 유도체화되었다. 유도체화는 안트라닐아미드 (100 μL, 2.5 M), 2-피콜린 보란 (100 μL, 0.6 M) 및 아세트산 (50 μL)을 250 μL의 샘플에 첨가하여 수행하였고, 그 이후에 40℃에서 3시간의 인큐베이션을 후속하였다. 유도체화된 샘플은 UV-검출기에 연결된 Waters Acquity UPLC H-클래스 시스템으로 정량되었다. Acquity UPLC BEH Amide 1.7 μm 컬럼 (21 x 100 mm)은 표 4에 기록된 농도구배에 따라서, 0.6 mL/분의 유속으로 60℃에서 사용되었다. LNT II 및 LNnT는 254 nm의 빛을 사용하는 ACQUITY TUV 검출기를 사용해 측정되었다. 정량은 정량된 희석 범위의 표준물을 기반으로 수행되었다.
실시예 2. N-아세틸만노사민 (ManNAc)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가
이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 씨. 제주니 유래 neuC (UniProt ID AAK91727.1) 또는 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 천연 GFA1의 부가적 카피에 대한 항상성 전사 유닛을 포함하거나, 또는 neuC (UniProt ID AAK91727.1) 및 SEQ ID NO 01을 갖는 WT GFA1, SEQ ID NO 42를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환되어서, 표 3에 열거된 균주 sMan01 내지 sMan05를 생성시켰다. 신규 균주는 50 mL의 적절한 선택 배지를 함유하는 250 mL 진탕 플라스크를 사용하여 실시예 1에서 제공된 배양 조건에 따라서 7-일 성장 실험에서 평가하였고, 기준 균주 sMan06 (표 3 참조)과 비교하였다.
표 5에 표시된 바와 같이, ManNAc 생산은 neuC를 발현하는 모든 조작된 에스. 세레비지아에 균주 (sMan01, sMan02, sMan03 및 sMan04)에서 확인할 수 있었다. neuC가 결여된 균주 sMan05 및 sMan06은 ManNAc를 생산하지 않았다 (데이터 미도시). 추가로, 표 5는 sMan02 경우 처럼 게놈 상에 존재하는 천연 GFA1에 추가로 발현 플라스미드 상에 존재하는 SEQ ID NO 01을 갖는 WT GFA1의 추가 카피는 조작된 균주에서 ManNAc 생산을 개선시켰고, 이러한 생산은 sMan01의 경우 처럼 부가적인 GFA1이 결여된 균주와 비교하여 약 5배 더 높았다는 것을 보여준다. 또한, sMan03 및 sMan04 경우 처럼 천연 GFA1에 추가로 변이체 GFA1의 발현은 플라스미드 상에 임의 GFA1 유전자가 결여된 sMan01 균주와 비교하여 ManNAc 생산을 개선시켰다. 여기서, V12L, Q96H, Q157R 및 E343V 돌연변이를 갖는 GFA1 변이체는 Q96H 및 Q157R 돌연변이를 갖는 GFA1 변이체와 비교하여 2일, 3일 및 4일에 이 실험에서 생산의 최고 및 유의한 증가를 보였다. WT GFA1 또는 변이체 GFA1 (Q96H 및 Q157R 돌연변이를 갖거나 또는 V12L, Q96H, Q157R 및 E343V 돌연변이를 가짐)의 추가 카피는 또한 표 6에 표시된 ManNAc 생산성에 대해서 유의한 양성 효과를 가졌다.
실시예 3. 시알산 (Neu5Ac)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가
이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 씨. 제주니 유래 neuC (UniProt ID AAK91727.1) 및 이.콜라이 유래 neuB (UniProt ID Q46675)에 대한 항상성 전사 유전자를 포함하거나, 또는 neuC (UniProt ID AAK91727.1), neuB (UniProt ID Q46675) 및 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 WT GFA1 또는 SEQ ID NO 42를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)의 추가 카피에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환되어서, 균주 sNeu5Ac01 내지 sNeu5Ac04 (표 3 참조)를 생성하였다. 신규 균주는 50 mL의 적절한 선택 배지를 함유하는 250 mL 진탕 플라스크를 사용하여 실시예 1에 제공된 배양 조건에 따라서 3-일 성장 실험에서 평가하였고, neuB 및 부가적 GFA1 카피가 결여된 기준 균주 sMan01과 비교하였다.
표 7에 표시된 바와 같이, 모든 새롭게 생성된 에스. 세레비지아에 균주는 ManNAc를 생산하였는데, 약 4.38 내지 5.65 mg/L의 ManNAc는 세포내 분획에서 검출되었고, 114와 240 mg/L 사이의 ManNAc는 생산 세포로부터 배양으로 배출되었다. GFA1 폴리펩티드 (천연 형태 또는 2개 또는 4개 돌연변이를 함유하는 변이체)의 부가적 카피의 존재는 ManNAc의 세포외 생산을 유의하게 개선시켰는데, sNeu5Ac01 경우 처럼 부가적 GFA1 카피가 결여된 균주와 비교하여 2배 초과로 더 높았다. 또한, 10.41 mg/L과 13.48 mg/L 사이 범위의 Neu5aC의 세포내 생산은 천연 GFA1 또는 변이체 GFA1의 부가적 카피를 갖는 균주에서 측정할 수 있었다. Neu5Ac 생산은 부가적인 야생형 또는 변이체 GFA1이 없는 한 (천연) GFA1 카피만을 발현하는 sNeu5Ac01 균주에서 검출할 수 없었다.
실시예 4. 6'-시알릴락토스 (6'SL)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가
다음 단계에서, SEQ ID NO 01을 갖는 이의 천연 GFA1에 부가적으로, neuC (UniProt ID AAK91727.1), neuB (UniProt ID Q46675) 및 SEQ ID NO 39를 갖는 GFA1 변이체 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)를 발현하는 조작된 에스. 세레비지아에 균주 sNeu5Ac04는 씨. 제주니 유래 neuA (UniProt ID Q93MP7), 케이. 락티스 유래 LAC12 (UniProt ID P07921) 및 알파-2,6-시알릴트랜스퍼라제 활성을 갖고 포토박테리움 담셀라에 유래 알파-2,6-시알릴트랜스퍼라제 (a26ST)의 아미노산 잔기 108 내지 497로 구성된 폴리펩티드 (UniProt ID O66375)의 부가적 발현을 위한 항상성 전사 유닛을 갖는 여분의 플라스미드 (pSL6)로 형질전환되어서 균주 sSL06 (표 3 참조)을 생성시켰다. 50 mL의 적절한 선택 배지를 함유하는 250 mL 진탕 플라스크를 사용하여 실시예 1에 제공된 배양 조건에 따라서 3-일 성장 실험에서 평가했을 때, 신규 균주는 72시간 배양 이후에 세포외에서 13.71 ± 0.26 mg/L 6'SL 및 세포내에서 10.19 ± 0.08 mg/L 6'SL을 합성하는 것이 입증되었다.
실시예 5. 락토-N-트리오스 (LNT II) 및/또는 락토-N-네오테트라오스 (LNnT)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가
이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA 및 케이. 락티스 유래 LAC12 (UniProt ID P07921)에 대한 항상성 전사 유닛을 포함하거나 또는 SEQ ID NO 54를 갖는 lgtA, LAC12 (UniProt ID P07921) 및 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 WT GFA1 또는 SEQ ID NO 42 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)를 갖는 변이체 GFA1의 부가적 카피에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환시켜서, 균주 sLNTII_01 내지 sLNTII_04 (표 3 참조)를 생성시켰다. 대안적인 단계에서, 야생형 에스. 세레비지아에 BY4742 균주는 엔. 메닌지티디스로부터 기원하는 SEQ ID NO 54를 갖는 lgtA 및 lgtB (UniProt ID Q51116), 및 케이. 락티스 유래 LAC12 (UniProt ID P07921)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드 또는 SEQ ID NO 54를 갖는 lgtA, lgtB (UniProt ID Q51116), LAC12 (UniProt ID P07921) 및 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 WT GFA1 또는 SEQ ID NO 42 또는 SEQ ID NO 39를 갖는 변이체 GFA1의 부가적인 카피에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환되어서, 균주 sLNnT01 내지 sLNnT04 (표 3 참조)를 생성시켰다. 이와 같이, 추가적으로 lgtB를 발현하는 sLNnT 균주는 sLNTII 균주와 비교하였다.
모든 신규한 sLNTII_01 내지 sLNTII_04 및 sLNnT01 내지 sLNnT04 균주는 100 mL의 적절한 선택 배지를 함유하는 500 mL 진탕 플라스크를 사용하여 실시예 1에 제공된 배양 조건에 따른 3-일 성장 실험에서 평가하였고 기준 균주 sLNTII_05 (표 3 참조)와 비교하였다.
표 8에 표시된 바와 같이, 모든 새로운 생성된 에스. 세레비지아에 균주를 생성시켰고 LNT II 또는 LNnT를 배출하였다. 놀랍게도, GFA1 폴리펩티드 (천연 또는 2개 또는 4개 돌연변이를 함유하는 변이체)의 부가적 카피의 존재는 LNT II 및 LNnT 둘 모두의 생산을 유의하게 개선시켰다. 여기서, SEQ ID NO 42를 갖는 GFA1 변이체를 발현하는 sLNnT03 균주는 최고의 LNnT 생산을 갖는 것으로 입증되었다.
실시예 6. 조작된 에스. 세레비지아에 균주를 사용한 LNT II, LNnT 및/또는 6'SL의 배출
이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 neuC (UniProt ID AAK91727.1), neuB (UniProt ID Q46675) 및 SEQ ID NO 39를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환되어서, 균주 sNeu5Ac04 (표 3)를 생성시켰다. 다음 단계에서, 조작된 에스. 세레비지아에 균주 sNeu5Ac04는 씨. 제주니 유래 neuA (UniProt ID Q93MP7), 케이. 락티스 유래 LAC12 (UniProt ID P07921) 및 알파-2,6-시알릴트랜스퍼라제 활성을 갖고, 포토박테리움 담셀라에 유래 알파-2,6-시알릴트랜스퍼라제 (a26ST)의 아미노산 잔기 108 내지 497을 갖는 폴리펩티드 (UniProt ID O66375)의 부가적 발현에 대한 항상성 전사 유닛을 갖는 여분의 플라스미드 (pSL6)로 형질전환되어서, 균주 sSL06 (표 3 참조)을 생성시켰다.
더 나아가서, 야생형 에스. 세레비지아에 BY4742는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA 및 케이. 락티스 유래 LAC12 (UniProt ID P07921)에 대한 항상성 전사 유닛을 포함하거나 또는 SEQ ID NO 54를 갖는 lgtA, LAC12 (UniProt ID P07921) 및 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 WT GFA1 또는 SEQ ID NO 42를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)의 부가적 카피에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환되어서, 균주 sLNTII_01 내지 sLNTII_04 (표 3 참조)를 생성시켰다. 대안적 단계에서, 야생형 에스. 세레비지아에 BY4742 균주는 엔. 메닌지티디스로부터 기원하는, SEQ ID NO 54를 갖는 lgtA 및 lgtB (UniProt ID Q51116), 및 케이. 락티스 유래 LAC12 (UniProt ID P07921)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드 또는 SEQ ID NO 54를 갖는 lgtA, lgtB (UniProt ID Q51116), LAC12 (UniProt ID P07921) 및 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 WT GFA1 또는 SEQ ID NO 42 또는 SEQ ID NO 39를 갖는 변이체 GFA1의 부가적 카피에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환시켜서, 균주 sLNnT01 내지 sLNnT04 (표 3 참조)를 생성시켰다.
모든 신규 효모 균주는 적절한 선택 배지를 함유하는 진탕 플라스크를 사용하여 실시예 1에 제공되는 배양 조건에 따른 3-일 성장 실험에서 평가되었다.
표 9에 표시된 바와 같은, 모든 새롭게 생성된 에스. 세레비지아에 균주는 6'SL, LNT II 또는 LNnT를 생산하여서 배양 액체배지로 배출하였다. 놀랍게도, GFA1 형태의 부가적 카피의 존재는 세포외 분획에서 유의하게 LNT II 및 LNnT 둘 모두의 생산을 개선시켰다.
실시예 7. 뱃치 발효배양에서 ManNAc, Neu5Ac 및 6'-시알릴락토스의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가
생물반응기 규모의 뱃치 발효배양은 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 및 SEQ ID NO 42 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)로부터 선택되는 변이체 GFA1을 발현하고 ManNAc를 생산하는 조작된 에스. 세레비지아에 균주 예컨대 균주 sManNAc03 및 sManNAc04, 또는 추가적으로 이.콜라이 유래 neuB (UniProt ID Q46675)를 발현하고 ManNAc 및 Neu5Ac를 생산하는 균주 예컨대 균주 sNeu5Ac03 및 sNeu5Ac04, 또는 추가적으로 이.콜라이 유래 neuB (UniProt ID Q46675) 및 씨. 제주니 유래 neuA (UniProt ID Q93MP7), 케이. 락티스 유래 LAC12 (UniProt ID P07921) 및 알파-2,6-시알릴트랜스퍼라제 활성을 갖고 포토박테리움 담셀라에 유래 알파-2,6-시알릴트랜스퍼라제 (a26ST)의 아미노산 잔기 108 내지 497로 구성된 폴리펩티드 (UniProt ID O66375)를 발현하고 ManNAc, Neu5Ac 및 6'SL을 생산하는 균주 예컨대 균주 sSL06를 평가하기 위해 수행되었다. 조작된 균주의 상세 설명은 표 3에 요약된다. 생물반응기 작업은 실시예 1에 기술된 대로 수행된다. 이들 실시예에서, 글루코스가 탄소 공급원으로서 사용된다. 6'SL 생산 균주를 사용한 작업에서 락토스는 6'SL 형성을 위한 전구체로서 50 내지 150 g/L 범위의 농도로 뱃치 배지에 첨가된다. 규칙적으로 샘플을 채취하고 ManNAc, Neu5Ac 및 6'SL의 생산은 실시예 1에 기술된 대로 측정된다.
실시예 8. 뱃치 발효배양으로 LNT II 및 LNnT의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가
다른 실시예에서, 생물반응기 규모의 뱃치 발효배양은 엔. 메닌지티디스 유래 SEQ ID NO 54를 갖는 lgtA, 케이. 락티스 유래 LAC12 (UniProt ID P07921) 및 SEQ ID NO 42 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)로부터 선택된 변이체 GFA1을 발현하고 LNT II를 생산하는 조작된 에스. 세레비지아에 균주 예컨대 균주 sLNTII_03 및 sLNTII_04, 또는 추가적으로 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)를 발현하고 LNT II 및 LNnT를 생산하는 균주 예컨대 균주 sLNnT03 및 sLNnT04를 평가하기 위해 수행된다. 조작된 균주의 상세설명은 표 3에 요약된다. 생물반응기 작업은 실시예 1에 기술된 대로 수행된다. 이들 실시예에서, 글루코스는 탄소 공급원으로서 사용된다. 락토스는 LNT II 및 LNnT 형성을 위한 전구체로서 50 내지 150 g/L 범위의 농도로 뱃치 배지에 첨가된다. 규칙적인 샘플이 채취되고 LNT II 및 LNnT의 생산은 실시예 1에 기술된 대로 측정된다.
실시예 9. 3'-시알릴락토스 (3'SL)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가
실시예 4에 대안적으로, SEQ ID NO 01을 갖는 이의 천연 GFA1에 더해서 neuC (UniProt ID AAK91727.1), neuB (UniProt ID Q46675) 및 SEQ ID NO 39를 갖는 GFA1 변이체 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)를 발현하는 조작된 에스. 세레비지아에 균주 sNeu5Ac04는 씨. 제주니 유래 neuA (UniProt ID Q93MP7), 케이. 락티스 유래 LAC12 (UniProt ID P07921) 및 알파-2,3-시알릴트랜스퍼라제 활성을 갖고 파스퇴렐라 멀토시다 (Pasteurella multocida) 유래 알파-2,3-시알릴트랜스퍼라제 (PmultST3)의 아미노산 잔기 1 내지 268로 구성된 폴리펩티드 (UniProt ID Q9CLP3) 또는 SEQ ID NO 56를 갖는 엔. 메닌지티디스 유래 알파-2,3-시알릴트랜스퍼라제의 부가적 발현을 위한 항상성 전사 유닛을 갖는 여분의 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 1에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가했을 때 3'SL의 생산에 대해 평가된다.
실시예 10. LNT II 및 락토-N-테트라오스 (LNT)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가
실시예 5에 대안적으로, 이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA, 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 wbgO (UniProt ID D3QY14), 케이. 락티스 NRRL Y-1140 유래 락토스 퍼미아제 LAC12 (UniProt ID P07921) 및 SEQ ID NO 39를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 1에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가했을 때 LNT II 및 락토-N-테트라오스 (LNT)의 생산에 대해 평가된다.
실시예 11. LNT II, 시알릴화 LNT II, LNT, 3'SL 및 LSTa를 포함하는 올리고당 혼합물의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가
이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)를 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA, 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 wbgO (UniProt ID D3QY14), 씨. 제주니 유래 N-아세틸글루코사민-6-포스페이트 2-에피머라제 (neuC) (UniProt ID AAK91727.1), 이.콜라이 유래 N-아세틸뉴라미네이트 신타제 (neuB) (UniProt ID Q46675)) 및 SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형된다. 다음 단계에서, 조작된 균주는 씨. 제주니 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) (UniProt ID Q93MP7), 케이. 락티스 유래 락토스 퍼미아제 LAC12 (UniProt ID P07921) 및 알파-2,3-시알릴트랜스퍼라제 활성을 갖고 파스퇴렐라 멀토시다 유래 알파-2,3-시알릴트랜스퍼라제 (PmultST3)의 아미노산 잔기 1 내지 268로 구성된 폴리펩티드 (UniProt ID Q9CLP3) 또는 SEQ ID NO 56를 갖는 엔. 메닌지티디스 유래 알파-2,3-시알릴트랜스퍼라제 (NmeniST3)의 부가적 발현에 대한 항상성 전사 유닛을 갖는 발현 플라스미드로 형질전환되었다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용해 실시예 1에 제공되는 배양 조건에 따른 3-일 성장 실험에서 평가될 때 LNT II, 3'-시알릴화 LNT II (Neu5Ac-α2,3-GlcNAc-β1,3-Gal-β1,4-Glc), LNT, 3'SL 및 LSTa (Neu5Ac-α2,3-Gal-β1,3-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다
실시예 12. LNT II, 시알릴화 LNT II, LNnT, 6'SL 및 LSTc를 포함하는 올리고당 혼합물의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가
이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA, 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (lgtB) (UniProt ID Q51116), 씨. 제주니 유래 N-아세틸글루코사민-6-포스페이트 2-에피머라제 (neuC) (UniProt ID AAK91727.1), 이.콜라이 유래 N-아세틸뉴라미네이트 신타제 (neuB) (UniProt ID Q46675) 및 SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형된다. 다음 단계에서, 조작된 균주는 씨. 제주니 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) (UniProt ID Q93MP7), 케이. 락티스 유래 락토스 퍼미아제 LAC12 (UniProt ID P07921) 및 알파-2,6-시알릴트랜스퍼라제 활성을 갖고 포토박테리움 담셀라에 유래 알파-2,6-시알릴트랜스퍼라제 (a26ST)의 아미노산 잔기 108 내지 497로 구성된 폴리펩티드 (UniProt ID O66375) 또는 알파-2,6-시알릴트랜스퍼라제 활성을 갖고 포토박테리움 sp. JT-ISH-224 유래 알파-2,6-시알릴트랜스퍼라제의 아미노산 잔기 18 내지 514 (UniProt ID A8QYL1)로 구성된 폴리펩티드의 부가적 발현을 위한 항상성 전사 유닛을 갖는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 1에 제공되는 배양 조건에 따른 3-일 성장 실험에서 평가될 때 LNT II, 6'-시알릴화 LNT II (Neu5Ac-α2,6-[GlcNAc-β1,3]-Gal-β1,4-Glc), LNnT, 6'SL 및 LSTc (Neu5Ac-α2,6-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.
실시예 13. LNT II, 시알릴화 LNT II, LNnT, 3'SL 및 LSTd를 포함하는 올리고당 혼합물의 생산에 대해 조작된 에스. 세레비지아에 균주의 평가
이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA, 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (lgtB) (UniProt ID Q51116), 씨. 제주니 유래 N-아세틸글루코사민-6-포스페이트 2-에피머라제 (neuC) (UniProt ID AAK91727.1), 이. 콜라이 유래 N-아세틸뉴라미네이트 신타제 (neuB) (UniProt ID Q46675) 및 SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형된다. 다음 단계에서, 조작된 균주는 씨. 제주니 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) (UniProt ID Q93MP7), 케이. 락티스 유래 락토스 퍼미아제 LAC12 (UniProt ID P07921) 및 알파-2,3-시알릴트랜스퍼라제 활성을 갖고 파스퇴렐라 멀토시다 유래 알파-2,3-시알릴트랜스퍼라제 (PmultST3)의 아미노산 잔기 1 내지 268로 구성된 폴리펩티드 (UniProt ID Q9CLP3) 또는 SEQ ID NO 56를 갖는 엔. 메닌지티디스 유래 알파-2,3-시알릴트랜스퍼라제(NmeniST3)의 부가적 발현을 위한 항상성 전사 유닛을 갖는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 1에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II, 3'-시알릴화 LNT II (Neu5Ac-α2,3-GlcNAc-β1,3-Gal-β1,4-Glc), LNnT, 3'SL 및 LSTd (Neu5Ac-α2,3-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.
실시예 14. 재료 및 방법 에스케리치아 콜라이
배지
2개 배지 즉, LB (Luria Broth) 및 최소 배지가 이. 콜라이를 배양하는데 사용되었다. LB 배지는 1% 트립톤 펩톤 (Difco), 0.5% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR)로 이루어졌다. 96-웰 플레이트 또는 진탕 플라스크의 배양 실험에서 사용되는 최소 배지는 2.00 g/L NH4Cl, 5.00 g/L (NH4)2SO4, 2.993 g/L KH2PO4, 7.315 g/L K2HPO4, 8.372 g/L MOPS, 0.5 g/L NaCl, 0.5 g/L MgSO4.7H2O, 30 g/L 수크로스 또는 30 g/L 글리세롤, 1 mL/L 비타민 용액, 100 μl/L 몰리브데이트 용액, 및 1 mL/L 셀레늄 용액을 함유하였다. 3'SL, 6'SL, LNT II 및/또는 LNnT의 생산에 대한 각 실시예에 명시된 바와 같이, 20 g/L 락토스가 전구체로서 배지에 추가적으로 첨가되었다. 최소 배지는 1 M KOH를 사용해 7.0의 pH로 설정되었다. 비타민 용액은 3.6 g/L FeCl2.4H2O, 5 g/L CaCl2.2H2O, 1.3 g/L MnCl2.2H2O, 0.38 g/L CuCl2.2H2O, 0.5 g/L CoCl2.6H2O, 0.94 g/L ZnCl2, 0.0311 g/L H3BO4, 0.4 g/L Na2EDTA.2H2O 및 1.01 g/L 티아민.HCl로 이루어졌다. 몰리브데이트 용액은 0.967 g/L NaMoO4.2H2O를 함유하였다. 셀레늄 용액은 42 g/L Seo2 를 함유하였다.
발효배양을 위한 최소 배지는 6.75 g/L NH4Cl, 1.25 g/L (NH4)2SO4, 2.93 g/L KH2PO4 및 7.31 g/L KH2PO4, 0.5 g/L NaCl, 0.5 g/L MgSO4.7H2O, 30 g/L 수크로스 또는 30 g/L 글리세롤, 1 mL/L 비타민 용액, 100 μL/L 몰리브데이트 용액, 및 상기 기술된 바와 동일한 조성의 1 mL/L 셀레늄 용액을 함유하였다. 각 실시예에 명시된 바와 같이, 0.30 g/L 시알산, 20 g/L 락토스, 20 g/L LacNAc 및/또는 20 g/L LNB가 전구체(들)로서 배지에 추가적으로 첨가되었다.
복합 배지는 오토클레이빙 (121℃, 21분)으로 최소 배지는 여과 (0.22 μm Sartorius)를 통해 멸균되었다. 필요할 때, 배지는 항생제, 예를 들어, 클로람페니콜 (20 mg/L), 카르베니실린 (100 mg/L), 스펙티노마이신 (40 mg/L) 및/또는 카나마이신 (50 mg/L)을 첨가하여 선택적으로 만들었다.
플라스미드
pKD46 (Red 헬퍼 플라스미드, 암피실린 내성), pKD3 (FRT-측접된 클로람페니콜 내성 (cat) 유전 함유자), pKD4 (FRT-측접된 카나마이신 내성 (kan) 유전자 함유), 및 pCP20 (FLP 리콤비나제 활성 발현) 플라스미드는 Prof. R. Cunin (Vrije Universiteit Brussel, Belgium in 2007)로부터 입수하였다. 플라스미드는 Invitrogen에서 구매한 숙주 이.콜라이 DH5알파 (F-, phi80dlacZΔM15, Δ(lacZYA-argF) U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, lambda-, thi-1, gyrA96, relA1)에서 유지시켰다.
균주 및 돌연변이
에스케리치아 콜라이 K12 MG1655 [λ-, F-, rph-1] 는 2007년 3월에, 콜라이 유전자 자원 센터 (Coli Genetic Stock Center) (US) (CGSC 균주#: 7740)에서 수득되었다. 유전자 파괴, 유전자 도입 및 유전자 치환은 Datsenko 및 Wanner (PNAS 97 (2000), 6640-6645)가 공개한 기술을 사용해 수행되었다. 이러한 기술은 람다 Red 리콤비나제에 의해 수행된 상동성 재조합 이후에 항생제 선택을 기반으로 한다. 필리파제 리콤비나제의 후속 촉매는 최종 생산 균주에서 항생제 선택 카세트의 제거를 보장한다. Red 헬퍼 플라스미드 pKD46을 보유하는 형질전환체는 암피실린, (100 mg/L) 및 L-아라비노스 (10 mM) 존재의 10 mL LB 배지에 30℃에서 0.6의 OD600nm 까지 성장되었다. 세포는 50 mL의 빙냉수로 1회 세척하고, 1 ml 빙내수로 2회 세척하여 전기적격하게 만들었다. 다음으로, 세포는 50 μL의 빙냉수에 재현탁되었다. 전기 천공은 50 μL의 세포 및 10-100 ng의 선형 이중 가닥-DNA 생산물과 유전자 Pulser™ (BioRad) (600 Ω, 25 μFD, 및 250 볼트)를 사용하여 수행되었다. 전기천공 후에, 세포는 1시간 동안 37℃에서 인큐베이션된 1 mL LB에 첨가되었고, 최종적으로25 mg/L의 클로람페니콜 또는 50 mg/L의 카나마이신을 함유하는 LB-한천 상에 도말되어서 항생제 내성 형질전환체를 선택하였다. 선택된 조작된 균주는 변형된 영역의 상류 및 하류의 프라이머를 사용하는 PCR을 통해 검증되었고 헬퍼 플라스미드의 상실에 대해 42℃에 LB-한천에서 성장시켰다. 조작된 균주는 암피실린 민감도에 대해 시험되었다. 선형 ds-DNA 앰플리콘은 pKD3, pKD4 및 그들 유도체를 주형으로서 사용하는 PCR을 통해 수득되었다. 사용된 플라스미드는 주형에 상보적인 서열의 일부 및 재조합이 일어나야만 하는 염색체 DNA 상의 면에 상보적인 다른 일부를 가졌다. 게놈 녹아웃 경우, 상동성의 영역은 관심 유전자의 출발 및 중지 코돈의 상류 50-nt 및 하류 50-nt에 디자인하였다. 게놈 녹-인 경우, 전사 출발 지점 (+1)을 준수해야 한다. PCR 생산물은 PCR-정제되었고, Dpnl로 분해되고, 아가로스 겔로부터 재-정제되어서 용리 완충액 (5 mM Tris, pH 8.0)에 재현탁된다. 선택된 조작된 균주는 온도-민감성 복제 및 FLP 합성의 역적 유도를 보이는 암피실린 및 클로람페니콜 내성 플라스미드인, pCP20 플라스미드로 형질전환되었다. 암피실린-내성 형질전환체는 30℃에서 선택되었고, 그 이후에, 몇개를 42℃에 LB에서 콜로니 정제하였고, 모든 항생제 내성 및 FLP 헬퍼 플라스미드의 상실에 대해 시험되었다. 유전자 녹아웃 및 녹인은 대조군 프라이머를 사용해 검토된다.
시알산 (Neu5Ac) 생산에 대한 실시예에서, 조작된 균주는 이.콜라이 nagA 및 nagB 유전자의 녹아웃 및 포스포글루코사민 뮤타제 예컨대, 예를 들어, 이. 콜라이 유래 glmM (UniProt ID P31120), N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제 예컨대, 예를 들어, 이. 콜라이 유래 glmU (UniProt ID P0ACC7), UDP-N-아세틸글루코사민 2-에피머라제 예컨대, 예를 들어, 씨. 제주니 유래 neuC (UniProt ID AAK91727.1) 및 N-아세틸뉴라미네이트 신타제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 neuB (UniProt ID E0NCD4)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 포함하는 이.콜라이 K12 MG1655로부터 유래되었다. 시알산 생산은 WO18122225에 기술된 바와 같은 nagC, nagD, nagE, nanA, nanE, nanK, manX, manY 및 manZ 를 포함하는 이. 콜라이 유전자의 게놈 녹아웃 및 SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53로부터 선택되는 변이체 GFA1을 포함하는 항상성 전사 유닛의 게놈 녹-인으로 조작된 이. 콜라이 균주에서 추가로 최적화될 수 있다.
시알릴화 올리고당 생산을 위해서, 시알산 생산 균주는 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 예컨대, 예를 들어, SEQ ID NO 55를 갖는 파스퇴렐라 멀토시다 유래 neuA, 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드, 엔. 메닌지티디스 유래 NmeniST3(SEQ ID NO 56) 또는 피. 멀토시다 subsp. 멀토시다 str. Pm70 유래 PmultST2 (SEQ ID NO 57), (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497의 아미노산 잔기로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 P-JT-ISH-224-ST6 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 P-JT-ISH-224-ST6-유사 폴리펩티드, 및/또는 (iii) 예컨대, 예를 들어, 엠. 무스쿨루스 유래 알파-2,8-시알릴트랜스퍼라제 (UniProt ID Q64689)를 추가로 발현할 필요가 있다. N-아실뉴라미네이트 시티딜릴트랜스퍼라제 및 시알릴트랜스퍼라제의 항상성 전사 유닛은 게놈 녹-인을 통해서 또는 발현 플라스미드를 통해서 조작된 균주로 전달될 수 있다. 시알산 및 CMP-시알산을 생산하는 조작된 균주가 시알릴화 락토스 구조를 만들고자 의도되었다면, 균주는 이.콜라이 LacZ, LacY 및 LacA 유전자의 게놈 녹아웃 및 락토스 퍼미아제 예컨대, 예를 들어, 이.콜라이 유래 LacY (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인으로 추가로 변형시켰다. 시알산, CMP-시알산 및/또는 시알릴화 올리고당을 생산하는 모든 조작된 균주는 임의로 수크로스 수송체 예컨대, 예를 들어, 이.콜라이 W 유래 CscB (UniProt ID E0IXR1), 프룩토스 키나제 예컨대, 예를 들어, 자이모모나스 모빌리스 (Zymomonas mobilis)에서 기원하는 Frk (UniProt ID Q03417) 및 예컨대, 예를 들어, 비피도박테리움 아돌레센티스 (Bifidobacterium adolescentis)로부터 기원하는, 수크로스 포스포릴라제 (UniProt ID A0ZZH6)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 통해서 수크로스 상의 성장을 위해 적합화될 수 있다.
LNT II, 및 락토-N-테트라오스 (LNT) 및 락토-N-네오테트라오스 (LNnT)를 포함하는 이에서 기원된 올리고당을 생산하기 위한 실시예에서, 조작된 균주는 이.콜라이 K12 MG1655로부터 유래되었고, 이.콜라이 LacZ 및 nagB 유전자의 녹아웃 및 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA에 대한 항상성 전사 유닛의 게놈 녹-인으로 변형되었다. LNT 또는 LNnT 생산을 위해서, 조작된 균주는 각각, 게놈 녹-인을 통해서 또는 발현 플라스미드로부터 균주에게 전달될 수 있는, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 wbgO (UniProt ID D3QY14) 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛에 의해 추가로 변형되었다. 임의로, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 및/또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 유전자의 다수 카피가 조작된 이. 콜라이 균주에 첨가될 수 있었다. 또한, LNT 및/또는 LNnT 생산은 SEQ ID NO 02 내지 38로부터 선택되는, GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1에 대한 항상성 전사 유닛의 하나 이상의 게놈 녹-인에 의한 균주의 변형을 통해서 개선된 UDP-GlcNAc 생산에 의해 증강될 수 있다. 부가적으로, 균주는 임의로 이.콜라이 ushA 및 galT 유전자의 게놈 녹아웃에 의해서 증강된 UDP-갈락토스 생산을 의해 변형될 수 있다. 조작된 이.콜라이 균주는 또한 임의로 UDP-글루코스-4-에피머라제 예컨대, 예를 들어, 이.콜라이 유래 galE (UniProt ID P09147), 포스포글루코사민 뮤타제 예컨대, 예를 들어, 이.콜라이 유래 glmM (UniProt ID P31120) 및 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제 / 글루코사민-1-포스페이트 아세틸트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 유래 glmU (UniProt ID P0ACC7)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 적합화될 수 있다. 조작된 균주는 또한 임의로 수크로스 수송체 예컨대, 예를 들어, 이.콜라이 W 유래 CscB (UniProt ID E0IXR1), 프룩토스 키나제 예컨대, 예를 들어, 지. 모빌리스로부터 기원하는 Frk (UniProt ID Q03417) 및 예컨대, 예를 들어, 비. 아돌레센티스로부터 기원하는 수크로스 포스포릴라제 (UniProt ID A0ZZH6)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 통해서 수크로스 상에서 성장을 위해 적합화될 수 있다.
필수는 아니지만 바람직하게, 뉴클레오티드-활성화된 당 합성에 관여된 단백질 및 글리코실라제트랜스퍼라제 중 어느 하나 이상은 그들 가용성을 증강시키기 위해서 가용성 인핸서 태그 예컨대, 예를 들어, SUMO-태그, MBP-태그, His, FLAG, Strep-II, Halo-태그, NusA, 티오레독신, GST 및/또는 Fh8-태그에 N-말단 및/또는 C-말단에서 융합된다 (Costa et al., Front. Microbiol. 2014, https://doi.org/10.3389/fmicb.2014.00063; Fox et al., Protein Sci. 2001, 10(3), 622-630; Jia and Jeaon, Open Biol. 2016, 6: 160196).
임의로, 조작된 이.콜라이 균주는 샤페론 단백질 예컨대, 예를 들어, DnaK, DnaJ, GrpE 또는 GroEL/ES 샤페로닌 시스템을 코딩하는 항상성 전사 유닛의 게놈 녹-인에 의해 변형되었다 (Baneyx F., Palumbo J.L. (2003) Improving Heterologous Protein Folding via Molecular Chaperone and Foldase Co-Expression. In: Vaillancourt P.E. (eds) E. coli Gene Expression Protocols. Methods in Molecular Biology™, vol 205. Humana Press).
모든 항상성 프로모터, UTR 및 종결자 서열은 Cambray et al. (Nucleic Acids Res. 2013, 41(9), 5139-5148), Dunn et al. (Nucleic Acids Res. 1980, 8, 2119-2132), Edens et al. (Nucleic Acids Res. 1975, 2, 1811-1820), Kim and Lee (FEBS Letters 1997, 407, 353-356) 및 Mutalik et al. (Nat. Methods 2013, No. 10, 354-360)가 기술한 라이브러리로부터 기원하였다. 모든 유전자는 Twist Bioscience (twistbioscience.com) 또는 IDT (eu.idtdna.com)에서 합성으로 주문하였고 코돈 용법은 공급사의 도구를 사용해 적합화되었다.
모든 균주는 저온바이알 중에 -80℃에서 저장되었다 (밤샘 LB 배양을 1:1 비율로 70% 글리세롤과 혼합함).
배양 조건
96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL LB 중에, 저온바이알로부터 출발하여서 800 rpm에 회전 진탕기에서 밤새 37℃에서 인큐베이션되었다. 이 배양을 400x로 희석하여 400 μL 최소 배지가 있는, 96웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용하였다. 이들 최종 96-웰 배양 플레이트를 72시간, 또는 더 짧거나 또는 더 긴 동안 800 rpm에 회전 진탕기 상에서 37℃에서 인큐베이션하였다. 배양 실험의 종료 시에 당 농도를 측정하기 위해서 전체 액체배지 샘플은 세포를 스핀 다운 하기 전에 60℃에서 15분 동안 배양 액체배지를 끓여서 각 웰로부터 채취하였다 (= 세포내 및 세포외 당 농도의 평균).
생물반응기에 대한 전배양은 일정 균주의 전체 1 mL 저온바이알로부터 출발하여서 1 L 또는 2.5 L 진탕 플라스크의 250 mL 또는 500 mL 최소 배지에 접종하였고 200 rpm으로 회전 진탕기 상에서 24시간 동안 37℃에서 인큐베이션하였다. 5 L 생물반응기에 접종하였고 (2 L 뱃치 배지 중 250 mL 접종원); 과정은 MFCS 제어 소프트웨어 (Sartorius Stedim Biotech, Melsungen, Germany)를 통해 제어하였다. 배양 조건은 37℃, 및 최대 교반으로 설정하였고; 압력 가스 유속은 균주 및 생물반응기에 의존하여 달리하였다. pH는 6.8에서 0.5 M H2S04 및 20% NH4OH를 사용헤 제어되었다. 배기 가스는 냉각시켰다. 실리콘 소포제의 10% 용액이 발효배양 동안 기포가 생성될 때 첨가되었다.
광학 밀도, pH 및 분석적 분석
박테리아 배양의 광학 밀도 및 pH의 결정을 비롯하여 분석적 분석은 실시예 1에 기술된 대로 수행되었다.
실시예 15. ManNAc 및 Neu5Ac 및 3'-시알릴락토스 (3'SL) 또는 6'-시알릴락토스 (6'SL)의 생산에 대한 조작된 이. 콜라이 균주의 평가
야생형 이.콜라이 K-12 MG1655 균주는 이.콜라이 유전자 nagA, nagB, lacY, lacZ, nanA, nanE 및 nanK 의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 엔. 메닌지티디스 유래 neuB (UniProt ID E0NCD4) 및 이.콜라이 유래 락토스 퍼미아제 (lacY) (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인으로 변형된다. 다음 단계에서, 신규 균주는 피. 멀토시다 유래의 SEQ ID NO 55를 갖는 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드, 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56) 또는 피. 멀토시다 subsp. 멀토시다 str. Pm70 유래 PmultST2 (SEQ ID NO 57), 또는 (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 P-JT-ISH-224-ST6 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 P-JT-ISH-224-ST6-유사 폴리펩티드에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공된 배양 조건에 따른 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 3'SL의 생산에 대해 평가된다. 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공된 배양 조건에 따른 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 6'SL의 생산에 대해 평가된다.
실시예 16. LNT II, LNT 또는 LNnT의 생산에 대한 조작된 이. 콜라이 균주의 평가
야생형 이.콜라이 K-12 MG1655 균주는 이.콜라이 유전자 LacZ 및 nagB 의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 및 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형되었다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II의 생산에 대해 평가된다.
LNT 또는 LNnT 생산에 대한 다음 단계에서, LNT II 생산 이.콜라이 균주는 각각 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO) (UniProt ID D3QY14) 또는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (lgtB) (UniProt ID Q51116)에 대한 항상성 전사 유닛에 의해 추가로 변형된다. wbgO를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공되는 배양 조건에 따라 2-일 성장 실험에서 평가될 때, LNT II 및 LNT의 생산에 대해 평가된다. lgtB를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공된 배양 조건에 따라 3-일 성장 실험에서 평가될 때, LNT II 및 LNnT의 생산에 대해 평가된다.
실시예 17. LNT II, 시알릴화 LNT II, LNT, 3'SL 및 LSTa를 포함하는 올리고당 혼합물의 생산에 대한 조작된 이. 콜라이 균주의 평가
야생형 이.콜라이 K-12 MG1655 균주는 이.콜라이 유전자 nagA, nagB, lacY, lacZ, nanA, nanE 및 nanK 의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 엔. 메닌지티디스 유래 neuB (UniProt ID E0NCD4), 이.콜라이 유래 락토스 퍼미아제 (lacY) (UniProt ID P02920), SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA 및 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 wbgO (UniProt ID D3QY14)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형된다. 다음 단계에서, 신규 균주는 피. 멀토시다 유래의 SEQ ID NO 55를 갖는 neuA 및 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드 또는 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II, 3'-시알릴화 LNT II (Neu5Ac-α2,3-GlcNAc-β1,3-Gal-β1,4-Glc), LNT, 3'SL 및 LSTa (Neu5Ac-α2,3-Gal-β1,3-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.
실시예 18. LNT II, 시알릴화 LNT II, LNnT, 6'SL 및 LSTc를 포함하는 올리고당 혼합물의 생산에 대한 조작된 이. 콜라이 균주의 평가
야생형 이.콜라이 K-12 MG1655 균주는 이. 콜라이 유전자 nagA, nagB, lacY, lacZ, nanA, nanE 및 nanK 의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 엔. 메닌지티디스 유래 neuB (UniProt ID E0NCD4), 이.콜라이 유래 락토스 퍼미아제 (lacY) (UniProt ID P02920), SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA 및 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛의 게놈 녹-인 의해 변형된다. 다음 단계에서, 신규 균주는 SEQ ID NO 55를 갖는 피. 멀토시다 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) 및 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 P-JT-ISH-224-ST6 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 P-JT-ISH-224-ST6-유사 폴리펩티드에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공되는 배양 조건에 따른 3-일 성장 실험에서 평가될 때 LNT II, 6'-시알릴화 LNT II (Neu5Ac-α2,6-[GlcNAc-β1,3]-Gal-β1,4-Glc), LNnT, 6'SL 및 LSTc (Neu5Ac-α2,6-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.
실시예 19. LNT II, 시알릴화 LNT II, LNnT, 3'SL 및 LSTd를 포함하는 올리고당 혼합물의 생산에 대해 조작된 이. 콜라이 균주의 평가
야생형 이.콜라이 K-12 MG1655 균주는 이. 콜라이 유전자 nagA, nagB, lacY, lacZ, nanA, nanE 및 nanK의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 엔. 메닌지티디스 유래 neuB (UniProt ID E0NCD4), 이.콜라이 유래 락토스 퍼미아제 (lacY) (UniProt ID P02920), 엔. 메닌지티디스 유래의 SEQ ID NO 54를 갖는 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA 및 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형된다. 다음 단계에서, 신규 균주는 SEQ ID NO 55를 갖는 피. 멀토시다 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) 및 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드 또는 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공된 배양 조건에 따라 2-일 성장 실험에서 평가될 때 LNT II, 3'-시알릴화 LNT II (Neu5Ac-α2,3-GlcNAc-β1,3-Gal-β1,4-Glc), LNnT, 3'SL 및 LSTd (Neu5Ac-α2,3-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.
실시예 20. 재료 및 방법 바실러스 서브틸리스
배지
2개 배지, 즉 진탕 플라스크 배양을 위핸 풍부 LB (Luria Broth) 및 최소 배지가 비. 서브틸리스를 배양하는데 사용된다. LB 배지는 1% 트립톤 펩톤 (Difco), 0.5% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR)로 이루어졌다. LBA (Luria Broth agar) 플레이트는 12 g/L 한천 (Difco)이 첨가된, LB 배지로 이루어졌다. 최소 배지는 2.00 g/L (NH4)2SO4, 7.5 g/L KH2PO4, 17.5 g/L K2HPO4, 1.25 g/L Na-시트레이트, 0.25 g/L MgSO4.7H2O, 0.05 g/L 트립토판, 10 내지 30 g/L 글루코스 (또는 프룩토스, 말토스, 수크로스, 글리세롤 및 말토트리오스를 포함하지만, 이에 제한되지 않는 다른 탄소 공급원), 10 mL/L 미량 원소 믹스 및 10 mL/L Fe-시트레이트 용액을 함유하였다. 배지는 1 M KOH를 사용해 7.0의 pH로 설정되었다. 실험에 따라서 락토스가 전구체로 첨가된다. 미량 원소 믹스는 0.735 g/L CaCl2.2H2O, 0.1 g/L MnCl2.2H2O, 0.033 g/L CuCl2.2H2O, 0.06 g/L CoCl2.6H2O, 0.17 g/L ZnCl2, 0.0311 g/L H3BO4, 0.4 g/L Na2EDTA.2H2O 및 0.06 g/L Na2MoO4 로 이루어졌다. Fe-시트레이트 용액은 0.135 g/L FeCl3.6H2O, 1 g/L Na-시트레이트 (Hoch 1973 PMC1212887)를 함유하였다.
복합 배지, 예를 들어, LB는 오토클레이빙 (121℃, 21분) 및 최소 배지는 여과 (0.22 μm Sartorius)에 의해 멸균되었다. 필요한 경우, 배지는 항생제 (예를 들어, 제오신 (20mg/L))를 첨가하여 선택적으로 만들었다.
균주, 플라스미드 및 돌연변이
바실러스 서브틸리스 168은 바실러스 유전자 자원 센터 (Bacillus Genetic Stock Center) (Ohio, USA)에서 입수한 대로 사용된다.
Cre/lox를 통한 유전자 결실용 플라스미드는 Yan et al. (Appl & Environm microbial, Sept 2008, p5556-5562)가 기술한 대로 구축된다. 유전자 파괴는 Xue et al. (J. microb. Meth. 34 (1999) 183-191)에 기술된 바와 같이 선형 DNA를 사용한 상동성 재조합 및 전기천공을 통한 형질전환을 통해서 수행된다. 유전자 녹아웃 방법은 Liu et al. (Metab. Engine. 24 (2014) 61-69)에 의해 기술된다. 이 방법은 표적 유전자의 상류 및 하류 1000 bp 상동체를 사용한다.
Popp et al. (Sci. Rep., 2017, 7, 15158)가 기술한 바와 같은 통합 벡터가 발현 벡터로서 사용되고 필요하면 게놈 통합을 위해 추가로 사용될 수 있다. 발현에 적합한 프로모터는 part repository (iGem): 서열 id: BBa_K143012, BBa_K823000, BBa_K823002 또는 BBa_K823003로부터 유래될 수 있다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR 또는 제한 결찰을 사용해 수행될 수 있다.
시알산 (Neu5Ac) 생산을 위한 실시예에서, 조작된 균주는 비. 서브틸리스 nagA, nagB, glmS 및 gamA 유전자의 녹아웃 및 SEQ ID NO 39 내지 53을 포함하는 목록으로부터 선택되는 하나 이상의 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그, 포스포글루코사민 뮤타제 예컨대, 예를 들어, 이.콜라이 유래 glmM (UniProt ID P31120), N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 유래 glmU (UniProt ID P0ACC7), UDP-N-아세틸글루코사민 2-에피머라제 예컨대, 예를 들어, 씨. 제주니 유래 neuC (UniProt ID AAK91727.1) 및 N-아세틸뉴라미네이트 신타제 예컨대, 예를 들어, 이.콜라이 유래 neuB (UniProt ID Q46675)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 포함하는 비. 서브틸리스로부터 유래되었다.
시알릴화 올리고당 생산에 대한 실시예에서, 시알산 생산 균주는 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래의 SEQ ID NO 55를 갖는 neuA, 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드, 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56) 또는 피. 멀토시다 subsp. 멀토시다 str. Pm70 유래 PmultST2 (SEQ ID NO 57), (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 폴리펩티드, 및/또는 (iii) 예컨대, 예를 들어, 엠. 무스쿨루스 유래 알파-2,8-시알릴트랜스퍼라제 (UniProt ID Q64689)를 추가로 발현시킬 필요가 있다. N-아실뉴라미네이트 시티딜릴트랜스퍼라제 및 시알릴트랜스퍼라제의 항상성 전사 유닛은 게놈 녹-인을 통해서 또는 발현 플라스미드를 통해서 조작된 균주에 전달될 수 있다. 시알산 및 CMP-시알산을 생산하는 조작된 균주가 시알릴화 락토스 구조를 만들도록 의도되었으면, 균주는 락토스 퍼미아제 예컨대, 예를 들어, 이.콜라이 LacY (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인으로 추가로 변형되었다.
LNT II 생산에 대한 실시예에서, 조작된 균주는 비. 서브틸리스 nagB, glmS 및 gamA 유전자의 녹아웃 및 SEQ ID NO 39 내지 53를 포함하는 목록으로부터 선택되는 하나 이상의 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38를 포함하는 목록으로부터 선택되는 GFA1 오솔로그, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA 및 락토스 퍼미아제 예컨대, 예를 들어, 이.콜라이 유래 LacY (UniProt ID P02920)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 포함하는 비. 서브틸리스로부터 유래되었다. LNT 또는 LNnT 생산 경우에, LNT II 생산 균주는 각각, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 wbgO (UniProt ID D3QY14) 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛으로 추가로 형질전환되었다.
이종성 및 상동성 발현
플라스미드로부터 또는 게놈으로부터, 발현되는 것이 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다; DNA2.0, Gen9, Twist Biosciences 또는 IDT.
발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 더 촉진시킬 수 있었다. 유전자는 공급사의 도구를 사용하여 최적화되었다.
배양 조건
96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL LB 중에서, 저온바이알 또는 LB 플레이트의 단일 콜로니로부터 출발하여서, 밤새 37℃에서, 800 rpm의 회전 진탕기에서 인큐베이션하였다. 이 배양은 400x로 희석하여 400 μL 최소 배지가 존재하는, 96-웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용되었다. 각 균주는 생물학적 복제물로서 96-웰 플레이트의 다수 웰에서 성장되었다. 이들 최종 96-웰 배양 플레이트는 72시간, 또는 더 짧거나 또는 더 길게, 800 rpm의 회전 진탕기에 37℃에서 인큐베이션되었다. 배양 실험 종료 시에 실험 샘플을 각 웰로부터 채취하여서 상청액 농도 (세포를 5분 스핀 다운 후, 세포외 당 농도)를 측정하거나, 또는 세포 스핀 다운 전에 90℃에서 15분 또는 60℃에서 60분 동안 배양 액체배지를 끓여서 측정하였다 (본 명세서에 정의된 바와 같이, 전체 액채배지 농도, 세포내 및 세포외 당 농도).
또한, 배양을 희석하여 600 nm에서 광학 밀도를 측정하였다. 세포 성능 지수 또는 CPI는 기준 균주와 비교하여 상대 %로, 생물량으로 올리고당 농도를 나누어서 결정하였다. 생물량은 600 nm에서 측정된 광학 밀도의 대략 1/3인 것으로 경험적으로 결정된다.
광학 밀도, pH 및 분석적 분석
박테리아 배양의 광학 밀도 및 pH의 결정을 비롯한 분석적 분석은 실시예 1에 기술된 대로 수행되었다.
실시예 21. ManNAc 및 Neu5Ac 및 3'-시알릴락토스 (3'SL) 또는 6'-시알릴락토스 (6'SL)의 생산에 대한 조작된 비. 서브틸리스 균주의 평가
야생형 비. 서브틸리스 균주는 비. 서브틸리스 유전자 nagA, nagB, glmS 및 gamA 의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 이.콜라이 유래 neuB (UniProt ID Q46675) 및 이.콜라이 유래 LacY (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 먼저 변형된다. 다음 단계에서, 신규 균주는 SEQ ID NO 55를 갖는 피. 멀토시다 유래 neuA 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드 또는 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56) 또는 (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 폴리펩티드에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 신규 균주는 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용해 실시예 20에 제공된 배양 조건에 따라 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 3'SL의 생산에 대해 평가된다. 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 20에 제공된 배양 조건에 따라 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 6'SL의 생산에 대해 평가된다.
실시예 22. LNT II, LNT 또는 LNnT의 생산에 대한 조작된 비. 서브틸리스 균주의 평가
야생형 비. 서브틸리스 균주는 비. 서브틸리스 유전자 nagB, glmS 및 gamA의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 락토스 퍼미아제 LacY (UniProt ID P02920) 및 엔. 메닌지티디스 유래의 SEQ ID NO 54를 갖는 lgtA에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 먼저 변형된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 20에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II의 생산에 대해 평가된다.
LNT 또는 LNnT 생산에 대한 다음 단계에서, LNT II 생산 비. 서브틸리스 균주는 이.콜라이 O55:H7 유래 wbgO (UniProt ID D3QY14) 또는 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛에 의해 추가로 변형된다, 각각. wbgO를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 20에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II 및 LNT의 생산에 대해 평가된다. lgtB를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 20에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II 및 LNnT의 생산에 대해 평가된다.
실시예 23. LNT II, 시알릴화 LNT II, LNnT, 6'SL 및 LSTc를 포함하는 올리고당 혼합물의 생산에 대한 조작된 비. 서브틸리스 균주의 평가
실시예 22에 기술된 바와 같이 LNnT를 생산하는 조작된 비. 서브틸리스 균주는 피. 멀토시다 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) (SEQ ID NO 55) 및 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 P-JT-ISH-224-ST6 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 P-JT-ISH-224-ST6-유사 폴리펩티드에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 추가로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 20에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II, 6'-시알릴화 LNT II (Neu5Ac-α2,6-[GlcNAc-β1,3]-Gal-β1,4-Glc), LNnT, 6'SL 및 LSTc (Neu5Ac-α2,6-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.
실시예 24. 재료 및 방법 코리네박테리움 글루타미쿰
배지
2종의 상이한 배지, 즉 풍부 트립톤-효모 추출물 (TY) 배지 및 최소 배지가 씨. 글루타미쿰을 배양하는데 사용된다. TY 배지는 1.6% 트립톤 (Difco), 1% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR)로 이루어졌다. TY 한천 (TYA) 플레이트는 12 g/L 한천 (Difco)이 첨가된, TY 배지로 이루어졌다. 진탕 플라스크 실험을 위한 최소 배지는 20 g/L (NH4)2SO4, 5 g/L 우레아, 1 g/L KH2PO4, 1 g/L K2HPO4, 0.25 g/L MgSO4.7H2O, 42 g/L MOPS, 10 내지 30 g/L 글루코스 (또는 프룩토스, 말토스, 수크로스, 글리세롤 및 말토트리오스를 포함하지만, 이에 제한되지 않는 다른 탄소 공급원) 및 1 mL/L 미량 원소 믹스를 함유하였다. 실험에 따라서, 락토스가 전구체로서 첨가된다. 미량 원소 믹스는 10 g/L CaCl2, 10 g/L FeSO4.7H2O, 10 g/L MnSO4.H2O, 1 g/L ZnSO4.7H2O, 0.2 g/L CuSO4, 0.02 g/L NiCl2.6H2O, 0.2 g/L 바이오틴 (pH 7.0) 및 0.03 g/L 프로토카테츄산으로 이루어졌다.
복합 배지, 예를 들어, TY는 오토클레이빙 (121℃, 21분) 및 최소 배지는 여과 (0.22 μm Sartorius)를 통해 멸균되었다. 필요한 경우, 배지는 항생제 (예를 들어, 카나마이신, 암피실린)를 첨가하여 선택적으로 만들었다.
균주 및 돌연변이
코리네박테리움 글루타미쿰 ATCC 13032는 미국 생물자원 센터 (American Type Culture Collection)에서 입수한 대로 사용되었다.
Suzuki et al. (Appl. Microbiol. Biotechnol., 2005 Apr, 67(2):225-33)가 기술한 바와 같은 Cre/loxP 기술 기반 통합 플라스미드 벡터 및 Okibe et al. (J. Microbiol. Meth. 85, 2011, 155-163)가 기술한 바와 같은 온도-감수성 셔틀 벡터가 유전자 결실, 돌연변이 및 삽입을 위해 구축된다. (이종성) 유전자 발현을 의한 적합한 프로모터는 Yim et al. (Biotechnol. Bioeng., 2013 Nov, 110(11):2959-69)로부터 유래될 수 있다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR 또는 제한 결찰을 사용해 수행될 수 있다.
Neu5Ac 생산 경우, 조작된 균주는 씨. 글루타미쿰 ldh, cgl2645, nagB, glmS 및 nanA 유전자의 녹아웃 및 SEQ ID NO 39 내지 53을 포함하는 목록으로부터 선택되는 하나 이상의 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그, 포스포글루코사민 뮤타제 예컨대, 예를 들어, 이.콜라이 유래 glmM (UniProt ID P31120), N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 유래 glmU (UniProt ID P0ACC7), UDP-N-아세틸글루코사민 2-에피머라제 예컨대, 예를 들어, 씨. 제주니 유래 neuC (UniProt ID AAK91727.1) 및 N-아세틸뉴라미네이트 신타제 예컨대, 예를 들어, 이.콜라이 유래 neuB (UniProt ID Q46675)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 포함하는 씨. 글루타미쿰으로부터 유래되었다.
시알릴화 올리고당 생산에 대한 실시예에서, 시알산 생산 균주는 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래의 SEQ ID NO 55를 갖는 neuA, 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드, 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56) 또는 피. 멀토시다 subsp. 멀토시다 str. Pm70 유래 PmultST2 (SEQ ID NO 57), (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 폴리펩티드, 및/또는 (iii) 예컨대, 예를 들어, 엠. 무스쿨루스 유래 알파-2,8-시알릴트랜스퍼라제 (UniProt ID Q64689)를 추가로 발현할 필요가 있다. N-아실뉴라미네이트 시티딜릴트랜스퍼라제 및 시알릴트랜스퍼라제의 항상성 전사 유닛은 게놈 녹-인을 통해서 또는 발현 플라스미드를 통해서 조작된 균주에 전달될 수 있다. 시알산 및 CMP-시알산을 생산하는 조작된 균주가 시알릴화 락토스 구조를 만들도록 의도된 경우, 균주는 락토스 퍼미아제 예컨대, 예를 들어, 이.콜라이 LacY (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 추가로 변형되었다.
LNT II 생산에 대한 실시예에서, 조작된 균주는 씨. 글루타미쿰 ldh, cgl2645, nagB 및 glmS 유전자의 녹아웃 및 SEQ ID NO 39 내지 53을 포함하는 목록으로부터 선택되는 하나 이상의 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA 및 락토스 퍼미아제 예컨대, 예를 들어, 이.콜라이 유래 LacY (UniProt ID P02920)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 포함하는 씨. 글루타미쿰으로부터 유래된다. LNT 또는 LNnT 생산에 대한 실시예에서, LNT II 생산 균주는 각각, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 wbgO (UniProt ID D3QY14) 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛으로 추가로 형질전환되었다.
이종성 및 상동성 발현
플라스미드로부터 또는 게놈으로부터, 발현되는 것이 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, Twist Biosciences 또는 IDT.
발현은 발현 숙주의 코돈 용법에 대해서 코돈 용법을 최적화하여 추가로 촉진시킬 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.
배양 조건
96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL TY 중에, TY 플레이트의 단일 콜로니 또는 저온 바이알로부터 출발하였고, 800 rpm의 회전 진탕기에서 밤새 37℃에서 인큐베이션되었다. 이 배양은 400x로 희석하여, 400 μL 최소 배지의 96-웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용되었다. 각각의 균주는 생물학적 복제물로서 96-웰 플레이트의 다수 웰에서 성장되었다. 이들 최종 96-웰 배양 플레이트는 72시간, 또는 더 짧거나 또는 더 긴 동안 800 rpm의 회전 진탕기에 37℃에서 인큐베이션되었다. 배양 종료 시 실험 샘플을 각 웰로부터 채취하여서 상청액 농도 (5분 세포 스핀 다운 후 세포외 당 농도)를 측정하거나, 또는 세포 스핀다운 전에 15분 동안 60℃에서 배양 액체배지를 끓여서 측정하였다 (= 본 명세서에 정의된 바와 같이, 전체 액체배지 농도, 세포내 및 세포외 당 농도).
또한, 배양의 희석을 수행하여 600 nm에서 광학 밀도를 측정하였다. 세포 성능 지수 또는 CPI는 기준 균주와 비교하여 상대%로서, 생물량으로 전체 액체 배지 중에서 측정된, 올리고당 농도, 예를 들어, 시알릴락토스 농도를 나누어서 결정되었다. 생물량은 600 nm에서 측정된 광학 밀도의 대략 1/3인 것으로 경험적으로 결정된다.
광학 밀도, pH 및 분석적 분석
박테리아 배양의 광학 밀도 및 pH의 결정을 비롯한 분석적 분석은 실시예 1에 기술된 대로 수행되었다.
실시예 25. ManNAc 및 Neu5Ac 및 3'-시알릴락토스 (3'SL) 또는 6'-시알릴락토스 (6'SL)의 생산에 대한 조작된 씨. 글루타미쿰 균주의 평가
야생형 씨. 글루타미쿰 균주는 씨. 글루타미쿰 유전자 ldh, cgl2645, nagB, glmS 및 nanA의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 이.콜라이 유래 neuB (UniProt ID Q46675) 및 이.콜라이 유래 LacY (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 먼저 변형된다. 다음 단계에서, 신규 균주는 SEQ ID NO 55를 갖는 피. 멀토시다 유래 neuA 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드 또는 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56) 또는 (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 폴리펩티드에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 24에서 제공하는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 3'SL의 생산에 대해 평가된다. 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 24에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 6'SL의 생산에 대해 평가된다.
실시예 26. LNT II, LNT 또는 LNnT의 생산에 대한 조작된 씨. 글루타미쿰 균주의 평가
야생형 씨. 글루타미쿰 균주는 씨. 글루타미쿰 유전자 ldh, cgl2645, nagB 및 glmS의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 락토스 퍼미아제 LacY (UniProt ID P02920) 및 엔. 메닌지티디스 유래의 SEQ ID NO 54를 갖는 lgtA에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 먼저 변형된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 23에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II의 성장에 대해 평가된다.
LNT 또는 LNnT 생산에 대한 다음 단계에서, LNT II 생산 씨. 글루타미쿰 균주는 이.콜라이 O55:H7 유래 wbgO (UniProt ID D3QY14) 또는 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛에 의해 추가로 변형된다, 각각. wbgO를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 24에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II 및 LNT의 생산에 대해 평가된다. lgtB를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 24에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II 및 LNnT의 생산에 대해 평가된다.
실시예 27. LNT II, 시알릴화 LNT II, LNT, 3'SL 및 LSTa를 포함하는 올리고당 혼합물의 생산에 대한 조작된 씨. 글루타미굼 균주의 평가
실시예 26에 기술된 바와 같이 LNT를 생산하는 조작된 씨. 글루타미쿰 균주는 피. 멀토시다 유래 neuA (SEQ ID NO 55) 및 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어지는 PmultST3-유사 폴리펩티드 또는 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드에 의해 추가로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 24에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II, 3'-시알릴화 LNT II (Neu5Ac-α2,3-GlcNAc-β1,3-Gal-β1,4-Glc), LNT, 3'SL 및 LSTa (Neu5Ac-α2,3-Gal-β1,3-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.
실시예 28. 재료 및 방법 클라미도모나스 레이하르드티 (Chlamydomonas reinhardtii)
배지
씨. 레인하르드티 (C. reinhardtii) 세포는 Tris-아세테이트-포스페이트 (TAP) 배지 (pH 7.0)에서 배양되었다. TAP 배지는 1000x 스톡의 Hutner 미량 원소 믹스를 사용한다. Hutner 미량 원소 믹스는 50 g/L Na2EDTA.H2O (Titriplex III), 22 g/L ZnSO4.7H2O, 11.4 g/L H3BO3, 5 g/L MnCl2.4H2O, 5 g/L FeSO4.7H2O, 1.6 g/L CoCl2.6H2O, 1.6 g/L CuSO4.5H2O 및 1.1 g/L (NH4)6MoO3으로 이루어졌다.
TAP 배지는 2.42 g/L Tris (트리스(히드록시메틸)아미노메탄), 25 mg/L 염스톡 용액, 0.108 g/L K2HPO4, 0.054 g/L KH2PO4 및 1.0 mL/L 빙초산을 함유하였다. 염 스톡 용액은 15 g/L NH4Cl, 4 g/L MgSO4.7H2O 및 2 g/L CaCl2.2H2O로 이루어졌다. 당류 합성을 위한 전구체로서, 전구체 예컨대, 예를 들어, 갈락토스, 글루코스, 프룩토스, 푸코스, GlcNAc가 첨가될 수 있다. 오토클레이빙 (121℃, 21분)으로 멸균되었다. 한천 상의 스톡 배양을 위해서, 1% 한천 (정제된 고강도, 1000 g/㎠)을 함유하는 슬랜트 TAP 배지를 사용하였다.
균주, 플라스미드 및 돌연변이
씨. 레인하르드티 야생형 균주 21gr (CC-1690, 야생형, mt+), 6145C (CC-1691, 야생형, mt-), CC-125 (137c, 야생형, mt+), CC-124 (137c, 야생형, mt-)는 클라미도모나스 자원 센터 (Chlamydomonas Resource Center (https://www.chlamycollection.org), University of Minnesota, U.S.A.)에서 입수한 바와 같다.
발현 플라스미드는 클라미도모나스 자원 센터에서 입수한 대로, pSI103으로부터 기원한 것이다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR, 또는 제한 결찰을 사용해 수행되었다. (이종성) 유전자 발현에 적합한 프로모터는 예를 들어, Scranton et al. (Algal Res. 2016, 15: 135-142)로부터 유래되었다. 표적화된 유전자 변형 (예컨대 유전자 녹-아웃 또는 유전자 치환)은 예를 들어, Jiang et al. (Eukaryotic Cell 2014, 13(11): 1465-1469)이 기술한 바와 같이 Crispr-Cas 기술을 사용해 수행될 수 있다.
전기천공을 통한 형질전환은 Wang et al. (Biosci. Rep. 2019, 39: BSR2018210)이 기술한 대로 수행되었다. 세포는 세포 밀도가 1.0-2.0 Х 107 세포/mL에 도달할 때까지 8000 Lx의 빛 강도의 연속적인 빛 및 일정한 통기 하에 액체 TAP 배지에서 성장되었다. 다음으로, 세포는 1.0 Х 106 세포/mL의 농도로 신선한 액체 TAP 배지에 접종되었고, 세포 밀도가 4.0 Х 106 세포/mL에 도달할 때까지 18-20시간 동안 연속적인 빛 아래서 성장되었다. 다음으로, 세포는 실온에서 5분 동안 1250 g의 원심분리를 통해 수집되었고, 세척하고, 60 mM 솔비톨 (Sigma, U.S.A.)을 함유하는 사전 냉각된 액체 TAP 배지에 재현탁시키고, 10분 동안 얼음에 두었다. 다음으로, 250 μL의 세포 현탁물 (5.0 Х 107 세포에 상응)은 100 ng 플라스미드 DNA (400 ng/mL)가 존재하는 사전 냉각된 0.4 cm 전기천공 큐벳에 넣었다. 전기 천공은 BTX ECM830 전기영동 장치 (1575 Ω, 50 μFD)를 사용하여 4 ms의 펄스 길이 및 100 ms의 펄스 간격 시간을 갖고 각각 500 V의 6회 펄스로 수행되었다. 전기천공 후에, 큐벳을 즉시 얼음에 10분 두었다. 마지막으로, 세포 현탁액은 서서히 진탕하면서 희미한 빛에서 밤샘 회수를 위해서 60 mM 솔비톨이 존재하는 10 mL의 신선한 액체 TAP 배지를 함유하는 50 mL 코니칼 원심분리 튜브로 옮겼다. 밤샘 회수 이후에, 세포를 재수집하였고 암피실린 (100 mg/L) 또는 클로람페니콜 (100 mg/L)를 함유하는 선택적 1.5% (w/v) 한천-TAP 플레이트 상에서 전분 포매 방법으로 도말하였다. 다음으로, 플레이트는 8000 Lx의 빛 강도로 연속 조사 하에 23 +-0.5℃에서 인큐베이션되었다. 세포는 5-7일 이후에 분석되었다.
UDP-갈락토스 생산의 실시예에서, 씨. 레인하르드티 세포는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 유래 갈락토키나제를 코딩하는 유전자 (KIN, UniProt ID Q9SEE5) 및 에이. 탈리아나 유래 UDP-당 파이로포스포릴라제 (USP)를 코딩하는 유전자 (UniProt ID Q9C5I1)를 포함하는 전사 유닛에 의해 변형된다.
UDP-GlcNAc의 증강된 생산에 대한 실시예에서, 씨. 레인하르드티 세포는 SEQ ID NO 39 내지 53를 포함하는 목록으로부터 선택되는 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그를 코딩하는 유전자를 포함하는 전사 유닛에 의해 변형된다.
LNT II 생산에 대한 실시예에서, 씨. 레인하르드티 세포는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtA (UniProt ID Q9JXQ6)를 포함하는 항상성 전사 유닛에 의해 변형된다. LNT 생산에 대한 실시예에서, LNT II 생산 균주는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 (UniProt ID D3QY14)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. LNnT 생산에 대한 실시예에서, LNT II 생산 균주는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다.
CMP-시알산 합성에 대한 실시예에서, 씨. 레인하르드티 세포는 UDP-N-아세틸글루코사민-2-에피머라제/N-아세틸만노사민 키나제 예컨대, 예를 들어, 호모 사피엔스 (Homo sapiens) 유래 GNE (UniProt ID Q9Y223) 또는 R263L 돌연변이를 포함하는 인간 GNE 폴리펩티드의 돌연변이체 형태, N-아실뉴라미네이트-9-포스페이트 신써타제 예컨대, 예를 들어, 호모 사피엔스 유래 NANS (UniProt ID Q9NR45) 및 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 예컨대, 예를 들어, 호모 사피엔스 유래 CMAS (UniProt ID Q8NFW8)에 대한 항상성 전사 유닛에 의해 변형된다. 시알릴화 올리고당의 생산에 대한 실시예에서, 씨. 레인하르드티 세포는 CMP-시알산 수송체 예컨대, 예를 들어, 무스 무스쿨루스 유래 CST (UniProt ID Q61420), 및 예컨대, 예를 들어, 호모 사피엔스, 무스 무스쿨루스, 라투스 노르베지쿠스 (Rattus norvegicus)같은 종으로부터 선택되는 골지체-국재화된 시알릴트랜스퍼라제에 의해 변형된다.
이종성 및 상동성 발현
플라스미드로부터, 또는 게놈으로부터 발현이 필요한 유전자는 하기 히사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, Twist Biosciences 또는 IDT.
발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 추가로 촉진될 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.
배양 조건
씨. 레인하르드티의 세포는 8000 Lx의 빛 강도로 14/10시간 명암 주기 하에 23 +/- 0.5℃에서 선택적 TAP-한천 플레이트에서 배양되었다. 세포는 5 내지 7일 배양 후에 분석되었다.
고밀도 배양을 위해서, 세포는 밀폐 시스템 예컨대, 예를 들어, Chen et al. (Bioresour. Technol. 2011, 102: 71-81) 및 Johnson et al. (Biotechnol. Prog. 2018, 34: 811-827)에 기술된 바와 같이 수직 또는 수평 광생물반응기, 교반식 탱크 광생물반응기 또는 편평 패널 광생물반응기에서 배양될 수 있다.
실시예 29. 변형된 씨. 레인하르드티 세포에서 LNT II, 시알릴화 LNT II, LNnT, 6'SL 및 LSTc를 포함하는 올리고당 혼합물의 생산
씨. 레인하르드티 세포는 에이. 탈리아나 유래 갈락토키나제 (KIN, UniProt ID Q9SEE5) 및 에이. 탈리아나 유래 UDP-당 파이로포스포릴라제 (USP) (UniProt ID Q9C5I1)를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해서 UDP-Gal의 생산을 위해 실시예 28에 기술된 바와 같이 조작된다. 다음 단계에서, 조작된 세포는 SEQ ID NO 39 내지 53을 포함하는 목록으로부터 선택되는 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그, R263L 돌연변이가 천연 폴리펩티드와 상이한 호모 사피엔스 유래 UDP-N-아세틸글루코사민-2-에피머라제/N-아세틸만노사민 키나제 GNE의 돌연변이체 형태 (UniProt ID Q9Y223), 호모 사피엔스 유래 N-아실뉴라미네이트-9-포스페이트 신써타제 NANS (UniProt ID Q9NR45), 호모 사피엔스 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 CMAS (UniProt ID Q8NFW8) 및 무스 무스쿨루스 유래 CMP-시알산 수송체 CST (UniProt ID Q61420)를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해서 CMP-시알산 합성을 위해 변형된다. 마지막 단계에서, 조작된 세포는 라투스 노르베지쿠스 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID P13721), 포토박테리움 담셀라에 유래 알파-2,6-시알릴트랜스퍼라제 PdST6 (UniProt ID O66375), 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA (UniProt ID Q9JXQ6) 및 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 lgtB (UniProt ID Q51116)를 포함하는 항상성 전사 유닛을 포함하는 발현 플라스미드에 의해 변형된다. 신규 균주는 실시예 28에 제공된 배양 조건에 따라서 전구체로서 갈락토스, 글루코스 및 GlcNAc를 포함하는 TAP-한천 플레이트 상에서 배양 실험에서 LNT II, 6'-시알릴화 LNT II (Neu5Ac-α2,6-[GlcNAc-β1,3]-Gal-β1,4-Glc), LNnT, 6'SL 및 LSTc (Neu5Ac-α2,6-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다. 인큐베이션 5일 후에, 세포를 수확하였고, 당류 생산을 UPLC에서 분석한다.
실시예 30. 재료 및 방법 동물 세포
상이한 포유동물의 지방 조직으로부터 중간엽 줄기 세포의 단리
신선한 지방 조직은 도살장 (예를 들어, 소, 돼지, 양, 닭, 오리, 메기, 뱀, 개구리) 또는 지방 흡입술 (예를 들어, 인간 경우, 사전 동의 후)로부터 수득되어서, 항생제가 보충된 포스페이트 완충 염수에 유지된다. 지방 조직의 효소 분해를 수행하고 중간엽 줄기 세포를 단리하기 위해 원심분리한다. 단리된 중간엽 줄기 세포를 세포 배양 플라스크로 옮겼고, 표준 성장 조건, 예컨대 37℃, 5% CO2 하에서 성장시킨다. 초기 배양 배지는 DMEM-F12, RPMI, 및 알파-MEM 배지 (15% 태아 소 혈청 보충), 및 1% 항생제를 포함한다. 배양 배지는 후속하여 제1 계대 이후에 10% FBS (태아 소 혈청)-보충된 배지로 대체된다. 예를 들어, 모든 목적을 위해 그 전문이 참조로 본 명세서에 편입되는, Ahmad 및 Shakoori (2013, Stem Cell Regen. Med. 9(2): 29-36)는 이 실시예에서 본 명세서에 기술된 방버(들)의 일정 별형(들)을 기술한다.
모유로부터 중간엽 줄기 세포의 단리
이 실시예는 본 명세서에 기술된 바와 같이, 인간 또는 임의의 다른 포유동물(들)로부터 무균 조건 하에서 수집된 모유로부터 중간엽 줄기 세포의 단리를 예시한다. 동일 부피의 포스페이트 완충 염수를 희석된 모유에 첨가하고 나서, 20분 동안 원심분리한다. 세포 펠렛을 포스페이트 완충 염수로 3회 세척하고 세포는 표준 배양 조건 하에서 10% 태아 소 혈청 및 1% 항생제가 보충된 DMEM-F12, RPMI, 및 알파-MEM 배지의 세포 배양 플라스크에 파종한다. 예를 들어, 모든 목적을 위해 그 전문이 참조로 본 명세서에 편입되는 Hassiotou et al. (2012, Stem Cell. 30(10): 2164-2174)은 이 실시예에서 본 명세서에 기술된 방법(들)의 일정 별형(들)을 기술한다.
2D 및 3D 배양 시스템을 사용한 줄기 세포의 분화
단리된 중간엽 세포는 2D 및 3D 배양 시스템에서 유선-유사 상피 및 내강 세포로 분화될 수 있다. 예를 들어, 하기 문헌들을 참조하고 이들 각각은 모든 목적을 위해 그들 전문이 참조로 본 명세서에 편입된다: Huynh et al. 1991. Exp Cell Res. 197(2): 191 -199; Gibson et al. 1991, In Vitro Cell Dev Biol Anim. 27(7): 585-594; Blatchford et al. 1999; Animal Cell Technology': Basic & Applied Aspects, Springer, Dordrecht. 141-145; Williams et al. 2009, Breast Cancer Res 11(3): 26-43; 및 Arevalo et al. 2015, Am J Physiol Cell Physiol. 310(5): C348 - C356.
2D 배양 경우, 단리된 세포는 10 ng/mL 상피 성장 인자 및 5 pg/mL 인슐린이 보충된 성장 배지의 배양 플레이트에 초기에 파종되었다. 합류점에서, 세포는 2% 태아 소 혈청, 1% 페니실린-스트렙토마이신 (100 U/mL 페니실린, 100 ug/mL 스트렙토마이신), 및 5 pg/mL 인슐린이 보충된 성장 배지를 48시간 동안 공급받았다. 분화를 유도하기 위해서, 세포는 5 pg/mL 인슐린, 1 pg/mL 히드로코르티손, 0.65 ng/mL 트리아이오도티로닌, 100 nM 덱사메타손, 및 1 pg/mL 프로락틴을 함유하는 완전 성장 배지를 공급받았다. 24시간 후에, 혈청을 완전 유도 배지에서 제거한다.
3D 배양을 위해서, 단리된 세포는 트립신 처리되어, 마트리겔, 히알루론산, 또는 초-저 부착 표면 배양 플레이트에서 6일 동안 배양되었고 10 ng/mL 상피 성장 인자 및 5 pg/mL 인슐린이 보충된 성장 배지를 첨가하여 분화 및 락테이트를 유도하였다. 합류점에서, 세포는 2% 태아 소 혈청, 1% 페니실린-스트렙토마이신 (100 U/mL 페니실린, 100 ug/mL 스트렙토마이신), 및 5 pg/mL 인슐린이 보충된 성장 배지를 48시간 동안 공급받았다. 분화를 유도하기 위해서, 세포는 5 pg/mL 인슐린, 1 pg/mL 히드로코르티손, 0.65 ng/mL 트리아이오도티로닌, 100 nM 덱사메타손, 및 1 pg/mL 프로락틴을 함유하는 완전 성장 배지를 공급받았다. 24시간 후에, 혈청을 완전 유도 배지에서 제거한다.
유선-유사 세포의 제조 방법
포유동물 세포는 Oct4, Sox2, Klf4, 및 c-Myc를 코딩하는 바이러스 벡터에 의한 재프로그래밍을 통해서 유도 만능성이 된다. 최종 재프로그래밍된 세포는 Mammocult 배지 (Stem Cell Technologies에서 입수), 또는 유선 세포 농후화 배지 (DMEM, 3% FBS, 에스트로겐, 프로게스테론, 헤파린, 히드로코르티손, 인슐린, EGF)에서 배양되어서 그들을 유선-유사로 만들고, 이로부터 선택된 모유 성분의 발현을 유도할 수 있다. 대안적으로, 리모델링 시스템 예컨대, CRISPR/Cas9을 사용하여 후생적 리모델링을 수행하여서, 선택된 관심 유전자, 예컨대, 카세인, a-락트알부민을 항상적으로 활성화시켜서, 그들 개별 단백질의 발현을 허용하고/하거나, 모든 목적을 위해 그 전문이 참조로 본 명세서에 편입되는 예를 들어, WO21067641에 기술된 바와 같이 선택된 내생성 유전자를 하향조절 및/또는 녹-아웃시킬 수 있다.
배양
완전 성장 배지는 고 글루코스 DMEM/F12, 10% FBS, 1% NEAA, 1% pen/strep, 1% ITS-X, 1% F-Glu, 10 ng/mL EGF, 및 5 pg/mL 히드로코르티손을 포함한다. 완전 수유 배지는 고 글루코스 DMEM/F12, 1% NEAA, 1% pen/strep, 1% ITS-X, 1% F-Glu, 10 ng/mL EGF, 5 pg/mL 히드로코르티손, 및 1 pg/mL 프로락틴 (Hyunh 1991에서 5ug/mL)을 포함한다. 세포는 완전 성장 배지가 있는 콜라겐 코팅된 플라스크 상에 20,000 세포/㎠의 밀도로 파종되고, 완전 성장 배지에서 48시간 동안 부착 및 확장되도록 정치시키고, 그 이후에 배지를 완전 수유 배지로 바꿔준다. 수유 배지에 노출 후, 세포는 분화를 시작하고 성장을 멈춘다. 약 1주 이내에, 세포는 우유 지질, 락토스, 카세인 및 유장같은 수유 생산물(들)을 배지로 분비하기 시작한다. 수유 배지의 원하는 농도는 한외여과에 의한 희석 또는 농축으로 획득될 수 있다. 수유 배지의 원하는 염 균형은 예를 들어, 배지로부터 원치않는 대사 산물을 제거하기 위해, 투석을 통해 달성될 수 있다. 사용된 호르몬 및 다른 성장 인자는 수지 정제에 의해서, 예를 들어, His-태그화된 성장 인자를 제거하기 위한 니켈 수지의 사용을 통해서 선택적으로 추출되어서, 락테이트화된 생산물 중 오염물의 수준을 추가로 감소시킬 수 있다.
실시예 31. 비-유선 성체 줄기 세포에서 시알릴화 올리고당을 포함하는 올리고당 혼합물의 생산
실시예 30에 기술된 바와 같이 유선-유사 세포로 재프로그래밍된 단리된 중간엽 세포는 SEQ ID NO 39 내지 53을 포함하는 목록으로부터 선택되는 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그, 호모 사피엔스 유래 GlcN6P 신타제 (UniProt ID Q06210), 호모 사피엔스 유래 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 (UniProt ID Q96EK6), 호모 사피엔스 유래 포스포아세틸글루코사민 뮤타제 (UniProt ID O95394), UDP-N-아세틸헥소사민 파이로포스포릴라제 (UniProt ID Q16222), 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 LgtA (UniProt ID Q9JXQ6), 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 WbgO (UniProt ID D3QY14), 무스 무스쿨루스 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (UniProt ID Q99KK2), 호모 사피엔스 유래 CMP-N-아세틸뉴라미네이트-베타-1,4-갈락토시드 알파-2,3-시알릴트랜스퍼라제 ST3GAL3 (UniProt ID Q11203) 및 라투스 노르베지쿠스 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID P13721)를 발현하도록 변형된다. 세포는 완전 성장 배지의 콜라겐 코팅된 플라스크에 20,000 세포/㎠의 밀도로 파종되고 완전 성장 배지에서 48시간 동안 부착 및 확장되도록 정치시켰고, 그 이후에 배지를 약 7일 동안 완전 수유 배지로 바꿔준다. 실시예 30에 기술된 바와 같이 배양 후에, 세포에 대해서 LNT, 3'SL, 6'SL, 시알릴화 LNT II 및 LSTa를 포함하는 올리고당 혼합물의 생산을 분석하기 위해 UPLC를 수행한다.
SEQUENCE LISTING
<110> Inbiose N.V.
<120> Cellular production of glycosylated products
<130> 033-PCT
<150> EP 21152132.3
<151> 2021-01-18
<160> 57
<170> PatentIn version 3.5
<210> 1
<211> 717
<212> PRT
<213> Saccharomyces cerevisiae S288C
<400> 1
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 2
<211> 717
<212> PRT
<213> Saccharomyces pastorianus strain CBS 1483
<400> 2
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Met Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 3
<211> 717
<212> PRT
<213> Saccharomyces cerevisiae YJM693
<400> 3
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Ile Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 4
<211> 717
<212> PRT
<213> Saccharomyces cerevisiae YJM1307
<400> 4
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Ala Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 5
<211> 717
<212> PRT
<213> Saccharomyces cerevisiae Pf-1
<400> 5
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Met Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 6
<211> 717
<212> PRT
<213> Saccharomyces cerevisiae YJM456
<400> 6
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Asn Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 7
<211> 717
<212> PRT
<213> Saccharomyces cerevisiae NYR20
<400> 7
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Arg Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 8
<211> 717
<212> PRT
<213> Saccharomyces paradoxus CBS432
<400> 8
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Ile Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 9
<211> 717
<212> PRT
<213> Saccharomyces cerevisiae YJM1311
<400> 9
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Arg Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 10
<211> 717
<212> PRT
<213> Saccharomyces cerevisiae P-684
<400> 10
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Arg Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Ala Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 11
<211> 716
<212> PRT
<213> S.cerevisiae strain S288C
<400> 11
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser His Cys Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile Pro
530 535 540
Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys Leu
545 550 555 560
Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly Arg
565 570 575
Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys Glu
580 585 590
Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys His
595 600 605
Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe Gly
610 615 620
Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln Val
625 630 635 640
Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp Glu
645 650 655
Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu Val
660 665 670
Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro Leu
675 680 685
Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val Asp
690 695 700
Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 12
<211> 717
<212> PRT
<213> Saccharomyces kudriavzevii IFO 1802
<400> 12
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Asp Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Ala Lys Gln Lys Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Lys
85 90 95
Arg Asn Cys His Pro Gln Arg Ser Asp Pro Glu Gly Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ala Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Asp Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Arg Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Pro Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Asp Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Ile Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Ile Cys Ser Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Glu Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Val Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Glu Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 13
<211> 717
<212> PRT
<213> Saccharomyces cerevisiae x Saccharomyces kudriavzevii VIN7
<400> 13
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Asp Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Ala Lys Gln Lys Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Lys
85 90 95
Arg Asn Cys His Pro Gln Arg Ser Asp Pro Glu Gly Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ala Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Asp Asn
210 215 220
Ala Gly Gln Pro Glu Thr Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Arg Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Pro Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Asp Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Ile Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Gly Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Ile Cys Ser Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Glu Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Val Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Glu Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 14
<211> 717
<212> PRT
<213> Saccharomyces pastorianus strain CBS 1483
<400> 14
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Val Asp
35 40 45
Ser Thr Leu Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Ala Arg Glu Lys Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Glu Lys
85 90 95
Ile Asn Cys His Pro Gln Arg Ser Asp Pro Glu Ser Gln Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Leu Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Asp
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Asp Asn
210 215 220
Ala Gly Gln Pro Glu Thr Pro Leu Arg Ser Asn Asn Arg Pro Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Gly
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Phe Asp Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Gly
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Val Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Met Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Asn Leu Glu Pro Arg Ile Lys Glu
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Glu Lys Ser Lys Thr Ile Lys Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Val Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 15
<211> 724
<212> PRT
<213> Naumovozyma castellii CBS 4309
<400> 15
Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Glu Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Leu Asp
35 40 45
Ser Thr Met Ile Phe Arg Gln Ile Gly Lys Val Ala Ala Leu Lys Glu
50 55 60
Glu Ile Lys Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Leu Asn Ser Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Arg Thr Leu Leu
115 120 125
Val Asn Lys Gly Phe Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Gln Asn Gly Asn
145 150 155 160
Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Ile His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn
210 215 220
Asn Leu Gly Lys Pro Glu Thr Pro Leu Gly Ser Ala Thr Asp Ser Thr
225 230 235 240
Val Asp Gly Ile Thr Val Asn Gly Lys Lys His Pro Arg Ser Tyr Gly
245 250 255
Val Asp Glu Ala Gln Ser Ser Asn Leu Leu Pro Ile Ala Ala Asn Glu
260 265 270
Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly
275 280 285
Thr Pro Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Val
290 295 300
Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala
305 310 315 320
His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val
325 330 335
Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala
340 345 350
Gln Ile Met Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Tyr
355 360 365
Glu Gln Pro Glu Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe
370 375 380
Glu Asn Asn Thr Leu Met Leu Gly Gly Leu Lys Ala Trp Leu Pro Ala
385 390 395 400
Ile Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr
405 410 415
His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile
420 425 430
Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Ser Pro
435 440 445
Val Phe Arg Asp Asp Ile Cys Val Phe Val Ser Gln Ser Gly Glu Thr
450 455 460
Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu
465 470 475 480
Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Leu Ser Arg Ala Thr
485 490 495
His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser
500 505 510
Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu
515 520 525
Ser Leu Ser Asp Asp Arg Leu Ser Lys Leu Glu Arg Arg Lys Asp Ile
530 535 540
Ile Gln Gly Leu Lys Leu Ile Pro Gly Gln Ile Lys Gln Val Leu Gln
545 550 555 560
Leu Glu Lys Lys Ile Lys Lys Leu Cys Glu Asn Glu Leu Lys Asp Gln
565 570 575
Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu
580 585 590
Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly
595 600 605
Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu
610 615 620
Asn Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys
625 630 635 640
Val Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Ile
645 650 655
Val Ile Cys Asn Glu Asn Asp Glu Val Trp Ala Lys Lys Ala Glu Ser
660 665 670
Ile His Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln
675 680 685
Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Met Ser Tyr Trp Leu Ala
690 695 700
Val Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser
705 710 715 720
Val Thr Val Glu
<210> 16
<211> 723
<212> PRT
<213> Candida glabrata strain DSY562
<400> 16
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Lys Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Leu Asp
35 40 45
Ser Thr Phe Ile Phe Arg Gln Ile Gly Lys Val Ser Ser Leu Glu Lys
50 55 60
Glu Ile Ala Leu Gln Lys Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Ser Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Ile Asn Cys His Pro Gln Arg Ser Asp Pro Asn Asn Glu Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Leu Asn Lys Gly Tyr Gln Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Lys Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Asn His Tyr Pro Asn Glu Ile
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Val Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Glu Ser
210 215 220
Met Gly Lys Pro Asp Thr Pro Leu Val Ser Ala Ser Gly Glu Ala Ile
225 230 235 240
Asn Asn Asn Asn Val Thr Val Ser Gly Arg Asn Ala Arg His Val Glu
245 250 255
Ala Asn Ala His Asn Asn Asn Leu Met Pro Ile Ala Ala Asn Asp Phe
260 265 270
Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser
275 280 285
Pro Thr Pro Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val Ile
290 295 300
Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His
305 310 315 320
Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Lys Glu Val Gly
325 330 335
Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln
340 345 350
Ile Met Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Tyr Glu
355 360 365
Gln Pro Glu Ser Ser Phe Asn Thr Met Arg Gly Arg Ile Asp Phe Glu
370 375 380
Asn Lys Asn Val Met Leu Gly Gly Leu Lys Ala Trp Leu Pro Val Ile
385 390 395 400
Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His
405 410 415
Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro
420 425 430
Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Arg Ser Pro Val
435 440 445
Phe Arg Glu Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala
450 455 460
Asp Thr Met Phe Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr
465 470 475 480
Ile Gly Ile Val Asn Thr Val Gly Ser Ser Ile Ser Arg Val Thr His
485 490 495
Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr
500 505 510
Lys Ala Tyr Thr Ser Gln Tyr Val Ala Leu Val Met Val Ala Leu Ser
515 520 525
Leu Ser Asp Asp Arg Val Ser Lys Ile Glu Arg Arg Lys Glu Ile Ile
530 535 540
Asp Gly Leu Lys Leu Ile Pro Gly Gln Ile Lys Gln Val Leu Asn Leu
545 550 555 560
Glu Asp Lys Ile Lys Lys Leu Cys Val Thr Glu Leu Lys Asp Gln Lys
565 570 575
Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu
580 585 590
Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val
595 600 605
Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn
610 615 620
Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val
625 630 635 640
Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Lys Pro Ile Ile
645 650 655
Ile Cys Asn Glu Asn Asp Asp Val Trp Ala Lys Lys Ala Glu Gln Ile
660 665 670
Asn Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly
675 680 685
Leu Leu Asn Ile Ile Pro Leu Gln Leu Met Ser Tyr Trp Leu Ala Val
690 695 700
Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val
705 710 715 720
Thr Val Glu
<210> 17
<211> 723
<212> PRT
<213> Candida glabrata strain BG2
<400> 17
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Lys Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Leu Asp
35 40 45
Ser Thr Phe Ile Phe Arg Gln Ile Gly Lys Val Ser Ser Leu Glu Lys
50 55 60
Glu Ile Ala Leu Gln Lys Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Ser Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Ile Asn Cys His Pro Gln Arg Ser Asp Pro Asn Asn Glu Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Leu Asn Lys Gly Tyr Gln Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Lys Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Ser His Tyr Pro Asn Glu Ile
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Val Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Glu Ser
210 215 220
Met Gly Lys Pro Asp Thr Pro Leu Val Ser Ala Ser Gly Glu Ala Ile
225 230 235 240
Asn Asn Asn Asn Val Thr Val Ser Gly Arg Asn Ala Arg His Val Glu
245 250 255
Ala Asn Ala His Asn Asn Asn Leu Met Pro Ile Ala Ala Asn Asp Phe
260 265 270
Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser
275 280 285
Pro Thr Pro Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val Ile
290 295 300
Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His
305 310 315 320
Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Lys Glu Val Gly
325 330 335
Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln
340 345 350
Ile Met Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Tyr Glu
355 360 365
Gln Pro Glu Ser Ser Phe Asn Thr Met Arg Gly Arg Ile Asp Phe Glu
370 375 380
Asn Lys Asn Val Met Leu Gly Gly Leu Lys Ala Trp Leu Pro Val Ile
385 390 395 400
Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His
405 410 415
Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro
420 425 430
Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Arg Ser Pro Val
435 440 445
Phe Arg Glu Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala
450 455 460
Asp Thr Met Phe Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr
465 470 475 480
Ile Gly Ile Val Asn Thr Val Gly Ser Ser Ile Ser Arg Val Thr His
485 490 495
Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr
500 505 510
Lys Ala Tyr Thr Ser Gln Tyr Val Ala Leu Val Met Val Ala Leu Ser
515 520 525
Leu Ser Asp Asp Arg Val Ser Lys Ile Glu Arg Arg Lys Glu Ile Ile
530 535 540
Asp Gly Leu Lys Leu Ile Pro Gly Gln Ile Lys Gln Val Leu Asn Leu
545 550 555 560
Glu Asp Lys Ile Lys Lys Leu Cys Val Thr Glu Leu Lys Asp Gln Lys
565 570 575
Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu
580 585 590
Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val
595 600 605
Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn
610 615 620
Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val
625 630 635 640
Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Lys Pro Ile Ile
645 650 655
Ile Cys Asn Glu Asn Asp Asp Val Trp Ala Lys Lys Ala Glu Gln Ile
660 665 670
Asn Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly
675 680 685
Leu Leu Asn Ile Ile Pro Leu Gln Leu Met Ser Tyr Trp Leu Ala Val
690 695 700
Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val
705 710 715 720
Thr Val Glu
<210> 18
<211> 727
<212> PRT
<213> Naumovozyma dairenensis CBS 421
<400> 18
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Glu Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Leu Ala Ile Asp Gly Asp Glu Pro Asp
35 40 45
Ser Thr Met Ile Phe Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Lys
50 55 60
Glu Ile Lys Arg Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Asn Asn Glu Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Thr Asn Lys Gly Phe Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Ile Tyr Asp Thr Asn Val Gln Asn Gly Asn
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn
210 215 220
Arg Pro Glu Thr Pro Ile His Asn Gly Thr Ser Asn His Ile Asn Gly
225 230 235 240
Ser Arg Ile Pro Asn Gly Asn Gly Pro Thr Thr Thr Asn Gly Asn Ser
245 250 255
Asn His Ile Asn Gly Leu Lys Lys Ala His Asn Leu Leu Pro Ile Ala
260 265 270
Thr Asn Glu Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser
275 280 285
Glu Asp Gly Thr Pro Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala
290 295 300
Ala Ser Val Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp
305 310 315 320
Asp Leu Ala His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg
325 330 335
Lys Glu Val Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met
340 345 350
Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr Lys His Phe Met Gln Lys
355 360 365
Glu Ile Tyr Glu Gln Pro Glu Ser Thr Leu Asn Thr Met Arg Gly Arg
370 375 380
Ile Asp Phe Asp Asn Asn Ser Ile Met Leu Gly Gly Leu Lys Ala Trp
385 390 395 400
Leu Pro Ala Ile Arg Arg Ala Arg Arg Leu Ile Met Val Ala Cys Gly
405 410 415
Thr Ser Tyr His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu
420 425 430
Ser Glu Ile Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg
435 440 445
Lys Ser Pro Val Phe Arg Asp Asp Ile Cys Val Phe Val Ser Gln Ser
450 455 460
Gly Glu Thr Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg
465 470 475 480
Gly Ala Leu Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Leu Ser
485 490 495
Arg Ala Thr His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly
500 505 510
Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met
515 520 525
Val Ala Leu Ser Leu Ser Asp Asp Arg Val Ser Lys Leu Glu Arg Arg
530 535 540
Lys Asp Ile Ile Gln Gly Leu Lys Leu Ile Pro Gly Gln Ile Lys Gln
545 550 555 560
Val Leu Asn Leu Glu Asp Arg Ile Lys Lys Leu Cys Glu Asn Glu Leu
565 570 575
Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala
580 585 590
Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His
595 600 605
Ser Glu Gly Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu
610 615 620
Val Asp Glu Asn Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu
625 630 635 640
Phe Pro Lys Val Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly
645 650 655
His Pro Ile Val Ile Cys Asn Glu Asn Asp Asp Val Trp Ala Lys Lys
660 665 670
Ala Glu Ser Val His Leu Glu Thr Leu Glu Val Pro Gln Thr Val Asp
675 680 685
Cys Leu Gln Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Met Ser Tyr
690 695 700
Trp Leu Ala Val Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu
705 710 715 720
Ala Lys Ser Val Thr Val Glu
725
<210> 19
<211> 725
<212> PRT
<213> Torulaspora delbrueckii CBS 1146
<400> 19
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Pro Asp
35 40 45
Ser Thr Leu Val Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Ala Glu His His Pro Lys Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Val Asn Cys His Pro Gln Lys Ser Asp Pro Thr Gly Glu Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ser Asn Lys Gly Tyr Ser Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Ile Gln Asn Gly Asn
145 150 155 160
Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Asp Glu Val
180 185 190
Met Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn
210 215 220
Ala Gln Pro Glu Thr Pro Leu Val Ser Glu Arg Ser Asn Gly Leu Ala
225 230 235 240
Ser Ser Arg Asn Leu Thr Val Asn Gly Gly Arg Lys Val Arg Leu Phe
245 250 255
Asp His Glu Asp Arg Gly Asn Ser Asn Leu Leu Pro Ile Ala Ala Asn
260 265 270
Glu Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp
275 280 285
Gly Thr Pro Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala Ser Ser
290 295 300
Val Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asn Asp Ile
305 310 315 320
Ala His Ile Tyr Asp Gly Glu Ile His Ile His Arg Ser Arg Arg Glu
325 330 335
Val Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu
340 345 350
Ala Gln Ile Met Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile
355 360 365
Phe Glu Gln Pro Glu Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp
370 375 380
Phe Glu Asn Asn Ser Val Met Leu Gly Gly Leu Gln Ala Trp Leu Pro
385 390 395 400
Ala Ile Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser
405 410 415
Tyr His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu
420 425 430
Ile Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Ser
435 440 445
Pro Val Phe Arg Asp Asp Ile Cys Val Phe Val Ser Gln Ser Gly Glu
450 455 460
Thr Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala
465 470 475 480
Leu Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ile
485 490 495
Thr His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala
500 505 510
Ser Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Val Ala
515 520 525
Leu Ser Leu Ser Asp Asp Arg Val Ser Lys Ile Glu Arg Arg Gly Asp
530 535 540
Ile Met Gln Gly Leu Lys Lys Ile Pro Gln Gln Ile Lys Glu Val Leu
545 550 555 560
Gln Leu Glu Gly Lys Ile Lys Gln Leu Cys Glu Lys Asp Leu Lys Asp
565 570 575
Gln Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala
580 585 590
Leu Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu
595 600 605
Gly Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp
610 615 620
Glu Asp Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro
625 630 635 640
Lys Val Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro
645 650 655
Ile Val Ile Cys Asn Lys Asn Asp Glu Val Trp Glu Lys Lys Ala Ala
660 665 670
Thr Thr Lys Met Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu
675 680 685
Gln Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu
690 695 700
Ala Val Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys
705 710 715 720
Ser Val Thr Val Glu
725
<210> 20
<211> 727
<212> PRT
<213> Torulaspora globosa strain CBS764
<400> 20
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Asp Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Leu Asp
35 40 45
Ser Thr Leu Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Arg Glu
50 55 60
Glu Ile Ala Glu His Lys Pro Lys Arg Asp Val Thr Phe Leu Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Ile Asn Cys His Pro Gln Lys Ser Asp Pro Asn Cys Glu Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Tyr Arg Glu Leu Lys Thr Leu Leu
115 120 125
Leu Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Glu Asn Gly His
145 150 155 160
Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ala His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn
210 215 220
Ala Gln Pro Glu Thr Pro Leu Val Ser Glu Arg Ala Asn Gly Ala Thr
225 230 235 240
Ala Asn Gly Asn Ser Val Arg Thr Leu Asn Gly Ser Gly Lys Lys Arg
245 250 255
Leu Tyr Asp His Glu Asp Arg Gly Asn Ser Asn Leu Leu Pro Ile Ala
260 265 270
Ala Asn Glu Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser
275 280 285
Glu Asp Gly Thr Pro Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala
290 295 300
Ser Ser Val Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asn
305 310 315 320
Asp Ile Ala His Ile Tyr Asp Gly Glu Ile His Ile His Arg Ser Arg
325 330 335
Arg Glu Val Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met
340 345 350
Glu Leu Ala Gln Ile Met Lys Gly Glu Tyr Asn His Phe Met Gln Lys
355 360 365
Glu Ile Phe Glu Gln Pro Glu Ser Ala Phe Asn Thr Met Arg Gly Arg
370 375 380
Ile Asp Phe Glu Lys Gly Thr Val Met Leu Gly Gly Leu Lys Ala Trp
385 390 395 400
Leu Pro Ala Ile Arg Arg Ala Arg Arg Leu Val Met Ile Ala Cys Gly
405 410 415
Thr Ser Tyr His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu
420 425 430
Ser Glu Ile Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg
435 440 445
Lys Ser Pro Ile Phe Arg Asp Asp Ile Cys Val Phe Val Ser Gln Ser
450 455 460
Gly Glu Thr Ala Asp Thr Met Leu Ala Leu Asn Tyr Ser Leu Glu Arg
465 470 475 480
Gly Ala Leu Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser
485 490 495
Arg Ile Thr His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly
500 505 510
Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met
515 520 525
Phe Ala Leu Ser Leu Ser Asp Asp Arg Val Ser Lys Leu Glu Arg Arg
530 535 540
Gln Asp Ile Ile Arg Gly Leu Lys Met Ile Pro Glu Gln Ile Lys Glu
545 550 555 560
Val Leu Ser Leu Glu Pro Gln Ile Lys Ala Leu Cys Glu Lys Glu Leu
565 570 575
Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala
580 585 590
Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His
595 600 605
Ser Glu Gly Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu
610 615 620
Val Asp Glu Asp Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu
625 630 635 640
Phe Pro Lys Val Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly
645 650 655
Gln Pro Ile Ile Ile Cys Asn Lys Asn Asp Glu Ala Trp Glu Lys Lys
660 665 670
Ser Ala Thr Thr Lys Met Val Thr Leu Glu Val Pro Leu Thr Val Asp
675 680 685
Cys Leu Gln Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr
690 695 700
Trp Leu Ala Val Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu
705 710 715 720
Ala Lys Ser Val Thr Val Glu
725
<210> 21
<211> 721
<212> PRT
<213> Zygosaccharomyces rouxii BRC 110957
<400> 21
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Thr Pro Asp
35 40 45
Ser Thr Leu Leu Tyr Lys Gln Ile Gly Lys Val Asp Ala Leu Lys Gln
50 55 60
Glu Ile Ala Gln Asp Ala Pro Glu Arg Asp Ile Thr Phe Ala Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Arg Gln
85 90 95
Ile Asn Cys His Pro Gln Arg Ser Asp Pro Gln Asn Glu Phe Thr Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Arg Thr Leu Leu
115 120 125
Ala Asn Arg Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Ile Leu Phe Lys His Leu Tyr Asp Glu Asn Leu Ser Asn Gly His
145 150 155 160
Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Thr Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Leu His Tyr Pro Glu Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Asp
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Ile Glu Phe Pro Asp Asp Ser
210 215 220
Ala Gly Lys Pro Asp Thr Pro Leu Gly Ser Arg Ser Gly Thr Pro Asn
225 230 235 240
Ala Ser Ser Arg Asn Leu Leu Asn Gly Asn Arg Arg Thr Arg Pro Tyr
245 250 255
Asp Gly His Asn Leu Leu Pro Leu Ala Ala Asn Glu Phe Asn Leu Arg
260 265 270
His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Thr Pro Asn Pro
275 280 285
Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val Ile Lys His Thr
290 295 300
Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp
305 310 315 320
Gly Glu Leu His Ile His Arg Ser Arg Arg Pro Glu Val Gly Ala Ser
325 330 335
Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met
340 345 350
Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro
355 360 365
Asp Ser Ala Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Asn Gly
370 375 380
Thr Ile Met Leu Gly Gly Leu Lys Ala Trp Leu Pro Ala Val Arg Arg
385 390 395 400
Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys
405 410 415
Leu Ala Thr Arg Ala Met Phe Glu Glu Leu Ser Glu Ile Pro Val Ser
420 425 430
Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg
435 440 445
Asp Asp Val Cys Cys Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr
450 455 460
Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Leu Gly
465 470 475 480
Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ala Thr His Cys Gly
485 490 495
Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala
500 505 510
Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser
515 520 525
Asp Asp Arg Val Ser Lys Ile Asp Arg Arg Lys Glu Ile Ile Lys Gly
530 535 540
Leu Gln Lys Ile Pro Asp Gln Ile Arg Glu Val Leu Lys Leu Glu Thr
545 550 555 560
Arg Ile Lys Glu Leu Cys Gln Asn Asp Leu Lys Asp His Lys Ser Leu
565 570 575
Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala
580 585 590
Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala
595 600 605
Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Gln Leu Pro
610 615 620
Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser
625 630 635 640
Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys
645 650 655
Asn Thr Asn Asp Glu Val Trp Ala Lys Lys Ala Glu Thr Asn Lys Leu
660 665 670
Leu Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Leu
675 680 685
Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu Ala Val Asn Arg
690 695 700
Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val
705 710 715 720
Glu
<210> 22
<211> 706
<212> PRT
<213> Ashbya gossypii FDAG1
<400> 22
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Gly Ala Asp
35 40 45
Glu Thr Phe Ile Phe Lys Gln Ile Gly Lys Val Ser Ala Leu Glu Arg
50 55 60
Glu Ile Ala Glu Arg Ala Pro Ala Arg Asp Val Arg Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Arg Gln
85 90 95
Val Asn Cys His Pro His Arg Ser Asp Ala Arg Asn Glu Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Arg Asn Lys Gly Tyr Glu Phe Glu Ser Asp Thr Asp Thr Glu Val Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Glu Asn Gly His
145 150 155 160
Glu Leu Asp Phe His Glu Leu Thr Lys Gln Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser Arg Tyr Pro Cys Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Val Gly Val Lys Ser Glu
195 200 205
Arg Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asn Glu
210 215 220
Lys Gln Pro Asp Val Pro Ile Pro Ala Val Leu Asn Gly His Lys Ala
225 230 235 240
Gly Ala Asp Cys Glu Lys Leu Leu Pro Ile Ala Ala Ser Glu Thr Gly
245 250 255
Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Val Pro
260 265 270
Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Val Ile Lys
275 280 285
His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile
290 295 300
Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val Gly Ala
305 310 315 320
Ser Ala Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile
325 330 335
Met Lys Gly Pro Tyr Asp His Phe Met Gln Lys Glu Ile Phe Glu Gln
340 345 350
Pro Glu Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Asn
355 360 365
Asn Thr Val Met Leu Gly Gly Leu Lys Ser Trp Leu Pro Ala Ile Arg
370 375 380
Ser Ala Arg Arg Leu Thr Met Ile Ala Cys Gly Thr Ser Tyr His Ser
385 390 395 400
Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro Val
405 410 415
Ser Ile Glu Leu Ala Ser Asp Phe Leu Asp Arg Arg Cys Pro Val Phe
420 425 430
Arg Asp Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala Asp
435 440 445
Thr Met Leu Ala Leu Asn Tyr Cys Ile Glu Arg Gly Ala Leu Thr Val
450 455 460
Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr His Cys
465 470 475 480
Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys
485 490 495
Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Leu Ala Leu Ser Leu
500 505 510
Ser Asp Asp Arg Val Ser Arg Ile Glu Arg Arg Lys Glu Ile Ile Gln
515 520 525
Gly Leu Lys Glu Ile Pro Arg Gln Ile Lys Gln Val Leu Gln Leu Glu
530 535 540
Lys Gln Ile Lys His Leu Cys Glu Thr Glu Leu Cys Asn Gln Lys Ser
545 550 555 560
Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly
565 570 575
Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu
580 585 590
Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn Leu
595 600 605
Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val
610 615 620
Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile
625 630 635 640
Cys Asn Glu Asn Asp Glu Val Trp Thr Arg Lys Ala Gln Asn Ser Asn
645 650 655
Leu Leu Thr Leu Glu Val Pro Leu Thr Val Asp Cys Leu Gln Gly Leu
660 665 670
Leu Asn Ile Ile Pro Leu Gln Leu Thr Ala Tyr Trp Leu Ala Val Asn
675 680 685
Asn Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr
690 695 700
Val Glu
705
<210> 23
<211> 701
<212> PRT
<213> Lachancea quebecensis LAQU0
<400> 23
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Asp Val Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Pro Asp
35 40 45
Ser Thr Leu Ile Tyr Lys Gln Ile Gly Lys Val Ala Ala Leu Glu Lys
50 55 60
Glu Ile Glu Val Glu Lys Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Trp
85 90 95
Ala Asn Cys His Pro Gln Arg Ser Asn Met Ala Ser Asp Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Gln Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Lys His Gly Asn
145 150 155 160
Glu Pro Asp Phe His Glu Leu Thr Met Gln Val Leu Leu Glu Leu Asp
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Val His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Arg Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Thr Asp
210 215 220
Glu Ala Gln Pro Asp Ile Pro Leu Asn Ser Ser Arg Gly Glu Ala Arg
225 230 235 240
Asn Phe Leu Pro Ile Ala Ser Asn Glu Ser Ala Leu Arg Arg Ser Gln
245 250 255
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ala Pro Asn Pro Val Glu Phe
260 265 270
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
275 280 285
Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp Gly Glu Leu
290 295 300
His Ile His Arg Ser Arg Arg Glu Ile Gly Ala Ser Ala Thr Arg Ser
305 310 315 320
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Ser Tyr
325 330 335
Lys His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro Asp Ser Thr Phe
340 345 350
Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Ser Asn Ser Val Met Leu
355 360 365
Gly Gly Leu Asn Ser Trp Leu Pro Val Ile Arg Arg Ala Arg Arg Leu
370 375 380
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
385 390 395 400
Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro Val Ser Val Glu Leu Ala
405 410 415
Ser Asp Phe Leu Asp Arg Lys Thr Pro Val Phe Arg Asp Asp Ile Ala
420 425 430
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
435 440 445
Lys Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Asn
450 455 460
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
465 470 475 480
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
485 490 495
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
500 505 510
Ser Lys Val Glu Arg Arg Arg Glu Ile Ile Gln Gly Leu Lys Lys Ile
515 520 525
Pro Glu Gln Ile Arg Lys Val Leu Leu Met Glu Pro Arg Ile Lys Glu
530 535 540
Leu Cys Glu Lys Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
545 550 555 560
Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys
565 570 575
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
580 585 590
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
595 600 605
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
610 615 620
Val Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys Asn Glu Asn Asp
625 630 635 640
Glu Val Trp Ser Ala Lys Ala Ala Asn Ser Asn Leu Ala Thr Leu Glu
645 650 655
Val Pro Leu Thr Val Asp Cys Leu Gln Gly Leu Leu Asn Ile Ile Pro
660 665 670
Leu Gln Leu Thr Ser Tyr Trp Leu Ala Val Asn Lys Asn Ile Asp Val
675 680 685
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
690 695 700
<210> 24
<211> 726
<212> PRT
<213> Kazachstania naganishii CBS 8797
<400> 24
Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Leu Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Val Ala Ile Asp Gly Asp Glu Leu Asp
35 40 45
Ser Thr Thr Ile Ile Lys Gln Ile Gly Lys Val Asp Ala Leu Lys Glu
50 55 60
Glu Ile Ala Lys Val Asn Pro Asn Arg Asp Val Thr Phe Ala Ser His
65 70 75 80
Val Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Arg Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Ala Asn Asn Glu Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Thr Asn Lys Gly Tyr Lys Phe Glu Ser Glu Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Ile Tyr Asp Thr Asn Thr Gln Asn Gly Asn
145 150 155 160
Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Asp Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Met Asp Phe Val Asp Val Glu Phe Pro Asp Asp Thr
210 215 220
Glu Asn Arg Pro Glu Thr Pro Leu Arg Gly Asn Thr Pro Thr Gly Arg
225 230 235 240
Asn Gly Ala Ile Ser Val Thr Ser Asn Lys Lys Asn Pro Asn Ala Phe
245 250 255
Ile Ser Asn Ser His Ser Asp Asn Asp Asn Leu Leu Pro Ile Ala Ala
260 265 270
Asn His Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu
275 280 285
Asp Gly Ser Pro Ala Pro Met Glu Phe Phe Leu Ser Ser Asp Ala Ser
290 295 300
Ser Val Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp
305 310 315 320
Ile Ala His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg
325 330 335
Glu Val Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu
340 345 350
Leu Ala Gln Ile Met Lys Gly Arg Tyr Lys His Phe Met Gln Lys Glu
355 360 365
Ile Tyr Glu Gln Pro Glu Ser Thr Phe Asn Thr Met Arg Gly Arg Ile
370 375 380
Asp Phe Glu Asn Asn Arg Ile Thr Leu Gly Gly Leu Lys Ala Trp Leu
385 390 395 400
Pro Ala Ile Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr
405 410 415
Ser Tyr His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser
420 425 430
Asp Ile Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys
435 440 445
Ser Pro Val Phe Arg Asp Asp Ile Cys Ile Phe Val Ser Gln Ser Gly
450 455 460
Glu Thr Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly
465 470 475 480
Ser Leu Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Leu Ser Arg
485 490 495
Ala Thr His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val
500 505 510
Ala Ser Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Val
515 520 525
Ala Leu Ser Leu Ser Asp Asp Arg Val Ser Lys Leu Gln Arg Arg Asn
530 535 540
Asp Ile Ile Gln Gly Leu Lys Gln Ile Pro Gln Gln Ile Lys Lys Val
545 550 555 560
Leu Asp Leu Glu Pro Lys Ile Lys Lys Leu Cys Gln Asn Lys Leu Lys
565 570 575
Asn Gln Lys Ser Leu Leu Ile Leu Gly Arg Gly Tyr Gln Phe Ala Ser
580 585 590
Ala Leu Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser
595 600 605
Glu Gly Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val
610 615 620
Asp Glu Asn Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe
625 630 635 640
Pro Lys Val Val Ser Ser Ile Glu Gln Ile Thr Ala Arg Lys Gly His
645 650 655
Pro Ile Ile Ile Cys Asn Asp Asn Asp Glu Val Trp Ser Lys Lys Ala
660 665 670
Glu Gly Thr Lys Leu Glu Thr Leu Asn Val Pro Gln Thr Val Asp Cys
675 680 685
Leu Gln Gly Leu Leu Asn Ile Val Pro Leu Gln Leu Ile Ser Tyr Arg
690 695 700
Leu Ala Val Asp Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala
705 710 715 720
Lys Ser Val Thr Val Glu
725
<210> 25
<211> 707
<212> PRT
<213> Saccharomycetaceae sp. 'Ashbya aceri'
<400> 25
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Ala Ala Asp
35 40 45
Glu Thr Phe Ile Phe Lys Gln Ile Gly Lys Val Ser Ala Leu Glu Arg
50 55 60
Glu Ile Ala Glu Arg Ala Pro Ala Arg Asp Ala Arg Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Arg Gln
85 90 95
Val Asn Cys His Pro His Arg Ser Asp Ala Gly Asn Glu Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Arg Asn Lys Gly Tyr Gln Phe Glu Ser Asp Thr Asp Thr Glu Val Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Glu Asn Gly His
145 150 155 160
Glu Leu Asp Phe His Glu Leu Thr Lys Gln Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser Arg Tyr Pro Ala Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Val Gly Val Lys Ser Glu
195 200 205
Arg Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asn Asp
210 215 220
Lys Gln Pro Asp Val Pro Ile Pro Ala Val Ser Asn Gly His Lys Ala
225 230 235 240
Gly Ala Asp Gly Arg Asp Lys Leu Leu Pro Ile Ala Ala Ser Glu Thr
245 250 255
Gly Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Val
260 265 270
Pro Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Val Ile
275 280 285
Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His
290 295 300
Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val Gly
305 310 315 320
Ala Ser Ala Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln
325 330 335
Ile Met Lys Gly Pro Tyr Asp His Phe Met Gln Lys Glu Ile Phe Glu
340 345 350
Gln Pro Glu Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu
355 360 365
Asn Asn Thr Val Met Leu Gly Gly Leu Lys Ser Trp Leu Pro Ala Ile
370 375 380
Arg Ser Ala Arg Arg Leu Thr Met Ile Ala Cys Gly Thr Ser Tyr His
385 390 395 400
Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro
405 410 415
Val Ser Ile Glu Leu Ala Ser Asp Phe Leu Asp Arg Arg Cys Pro Val
420 425 430
Phe Arg Asp Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala
435 440 445
Asp Thr Met Leu Ala Leu Asn Tyr Cys Ile Glu Arg Gly Ala Leu Thr
450 455 460
Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr His
465 470 475 480
Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr
485 490 495
Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Leu Ala Leu Ser
500 505 510
Leu Ser Asp Asp Arg Val Ser Arg Ile Glu Arg Arg Lys Glu Ile Ile
515 520 525
Gln Gly Leu Lys Glu Ile Pro Ser Gln Ile Lys Gln Val Leu Gln Leu
530 535 540
Glu Lys Gln Ile Lys His Leu Cys Glu Thr Glu Leu Cys Asn Gln Lys
545 550 555 560
Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu
565 570 575
Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val
580 585 590
Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn
595 600 605
Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val
610 615 620
Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Arg Pro Ile Ile
625 630 635 640
Ile Cys Asn Gln Asn Asp Glu Val Trp Thr Lys Lys Ala Gln Asn Ser
645 650 655
Asn Leu Leu Thr Leu Glu Val Pro Leu Thr Val Asp Cys Leu Gln Gly
660 665 670
Leu Leu Asn Ile Ile Pro Leu Gln Leu Thr Ala Tyr Trp Leu Ala Val
675 680 685
Asn Asn Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val
690 695 700
Thr Val Glu
705
<210> 26
<211> 701
<212> PRT
<213> Lachancea fermentati
<400> 26
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Asp Val Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Pro Asp
35 40 45
Ser Thr Leu Ile Tyr Lys Gln Ile Gly Lys Val Lys Ala Leu Glu Lys
50 55 60
Glu Ile Glu Glu His His Pro Asn Arg Glu Val Thr Phe Val Thr His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Val Gln
85 90 95
Ile Asn Cys His Pro Gln Arg Ser Asp Arg His Asn Glu Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Gln Leu Leu
115 120 125
Leu Asn Lys Gly Tyr Thr Phe Glu Ser Glu Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Met Tyr Asp Thr Asn Leu Lys Asn Gly Val
145 150 155 160
Glu Leu Asp Phe His Asp Leu Thr Lys Gln Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ala His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Arg Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Thr Asp
210 215 220
Asp Val Gln Pro Asp Ile Pro Leu Asn Ser Ala Arg Thr Glu Asp Arg
225 230 235 240
Asn Leu Leu Pro Ile Ala Ala Asn Glu Ser Ala Leu Arg Arg Ser Gln
245 250 255
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ala Pro Asn Pro Val Glu Phe
260 265 270
Phe Val Ser Ser Asp Ala Ala Ser Val Ile Lys His Thr Lys Lys Val
275 280 285
Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp Gly Glu Leu
290 295 300
His Ile His Arg Ser Arg Arg Glu Met Gly Ala Ser Ala Ile Arg Ser
305 310 315 320
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
325 330 335
Lys His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro Glu Ser Thr Leu
340 345 350
Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Asn Asn Thr Val Met Leu
355 360 365
Gly Gly Leu Lys Ser Trp Leu Pro Ile Ile Arg Arg Thr Arg Arg Leu
370 375 380
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
385 390 395 400
Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro Val Ser Val Glu Leu Ala
405 410 415
Ser Asp Phe Leu Asp Arg Lys Thr Pro Val Phe Arg Asp Asp Val Cys
420 425 430
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
435 440 445
Lys Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Asn
450 455 460
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
465 470 475 480
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
485 490 495
Tyr Ile Ala Leu Val Met Leu Ala Leu Ser Leu Ser Asp Asp Lys Val
500 505 510
Ser Arg Val Glu Arg Arg Lys Glu Ile Ile Gln Gly Leu Lys Glu Ile
515 520 525
Pro Glu Gln Ile Lys Gln Val Leu Lys Met Glu Pro Arg Ile Lys Glu
530 535 540
Leu Cys Glu Thr Glu Leu Arg Asp Lys Arg Ser Leu Leu Leu Leu Gly
545 550 555 560
Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys
565 570 575
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
580 585 590
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
595 600 605
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
610 615 620
Val Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys Asn Glu Asn Asp
625 630 635 640
Asp Leu Trp Ser Lys Arg Ala Ser Gln Ser Asn Leu Val Thr Leu Glu
645 650 655
Val Pro Leu Thr Val Asp Cys Leu Gln Gly Leu Leu Asn Ile Ile Pro
660 665 670
Leu Gln Leu Thr Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
675 680 685
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
690 695 700
<210> 27
<211> 718
<212> PRT
<213> Tetrapisispora blattae CBS 6284
<400> 27
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Thr Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Glu Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Pro Asp
35 40 45
Ser Ile Asp Ile Phe Arg Glu Ile Gly Lys Val Ser Ser Leu Lys Glu
50 55 60
Gln Ile Lys Lys Ala Asn Pro Asn Arg Asp Val Thr Tyr Leu Thr His
65 70 75 80
Ser Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Lys Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Ala Glu Asn Gln Phe Val Ile
100 105 110
Ile His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Met Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Leu His Leu Tyr Gln Thr Asn Leu Lys Ser Gly His
145 150 155 160
Glu Leu Asp Phe His Glu Leu Ser Lys Leu Val Leu Met Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Ile His Tyr Pro Gly Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Glu Asn
210 215 220
Ala Ala Gln Pro Glu Thr Pro Met Thr Ile Asn Glu Pro Lys Val Ile
225 230 235 240
Lys Ser Ser Ser Leu Lys Ser Asn Lys Ser Asp Phe His Ser Lys Asp
245 250 255
Gly Leu Met Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ala Pro Asn Pro Ile Glu Phe
275 280 285
Phe Ile Ser Ser Asp Ala Ala Ser Val Ile Lys Tyr Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Lys Asp Val Gly Gly Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Leu Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Lys His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Tyr
355 360 365
Asn Thr Met Arg Gly Arg Leu Asp Phe Asp Asn Asn Leu Val Asn Leu
370 375 380
Gly Gly Leu Gln Gln Phe Ile Pro Thr Ile Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Phe Ser Asp Leu Pro Val Ser Ile Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Phe Ala Leu
450 455 460
Asn Tyr Val Met Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Thr
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Ala Thr Asn Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Val Leu Leu Gly Glu Asp Arg Ile
515 520 525
Ser Lys Thr Glu Arg Arg Lys Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Glu Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Gln
545 550 555 560
Leu Cys Glu Asn Glu Leu Ser Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Glu Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Asn Lys Lys Lys Ser Glu Asn Asp Lys Phe Ile Thr Leu
660 665 670
Glu Val Pro Thr Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile
675 680 685
Pro Leu Gln Leu Met Ser Tyr Trp Leu Ala Ser Asn Lys Gly Ile Asp
690 695 700
Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 28
<211> 724
<212> PRT
<213> Zygosaccharomyces parabailii strain ATCC 60483
<400> 28
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Asp Ile Ile Asp Thr Leu Val Glu Gly Leu Glu Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Gln Pro Glu
35 40 45
Ser Thr Leu Leu Tyr Lys Gln Ile Gly Lys Val Ala Ala Leu Lys Glu
50 55 60
Glu Ile Ser His Asp Ala Pro Arg Arg Asp Val Ser Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Val Asn Cys His Pro Gln Lys Ser Asp Pro Asn Cys Glu Phe Thr Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Glu Asn Leu Ser Asn Gly His
145 150 155 160
Glu Leu Asp Phe His Val Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Glu Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn
210 215 220
Ala Gly Lys Pro Asp Thr Pro Leu Val Ser Arg Ser Gly Thr Pro Asn
225 230 235 240
Gly Ser Ala Arg Ser Gln Thr Thr Asn Gly Phe Ser Gly Leu Arg Arg
245 250 255
Thr Arg Pro Tyr Asp Ser Asn Asn Leu Leu Pro Ile Thr Pro Asn Glu
260 265 270
Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly
275 280 285
Lys Pro Asn Pro Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val
290 295 300
Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala
305 310 315 320
His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val
325 330 335
Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala
340 345 350
Gln Ile Met Lys Gly Pro Tyr Thr His Phe Met Gln Lys Glu Ile Phe
355 360 365
Glu Gln Pro Asp Ser Thr Phe Asn Thr Met Arg Gly Arg Ile Asp Phe
370 375 380
Asp Ser Ser Thr Val Met Leu Gly Gly Leu Gln Ala Trp Leu Pro Ala
385 390 395 400
Val Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr
405 410 415
His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile
420 425 430
Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro
435 440 445
Val Phe Arg Asp Asp Val Cys Cys Phe Val Ser Gln Ser Gly Glu Thr
450 455 460
Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu
465 470 475 480
Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr
485 490 495
His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser
500 505 510
Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu
515 520 525
Ser Leu Ser Asp Asp Arg Val Ser Lys Met Glu Arg Arg Arg Glu Ile
530 535 540
Met Asn Gly Leu Arg Asn Ile Pro Asp Gln Ile Arg Glu Val Leu Ser
545 550 555 560
Leu Glu Pro Arg Ile Lys Glu Leu Cys Gln Gln Asp Leu Glu Glu His
565 570 575
Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Thr Ala Leu
580 585 590
Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly
595 600 605
Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu
610 615 620
Gln Leu Pro Ile Ile Ala Phe Ala Thr Arg Asp Ser Leu Phe Pro Lys
625 630 635 640
Val Val Ser Thr Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Ile
645 650 655
Ile Ile Cys Asn Lys Asn Asp Asp Val Trp Ala Lys Lys Ala Glu Thr
660 665 670
Lys Gln Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln
675 680 685
Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu Ala
690 695 700
Val Asn Arg Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser
705 710 715 720
Val Thr Val Glu
<210> 29
<211> 724
<212> PRT
<213> Zygosaccharomyces bailii ISA1307
<400> 29
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Asp Ile Ile Asp Thr Leu Val Glu Gly Leu Glu Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Gln Pro Glu
35 40 45
Ser Thr Leu Leu Tyr Lys Gln Ile Gly Lys Val Ala Ala Leu Lys Glu
50 55 60
Glu Ile Ser His Asp Ala Pro Arg Arg Asp Val Ser Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Val Asn Cys His Pro Gln Lys Ser Asp Pro Asn Cys Glu Phe Thr Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Glu Asn Leu Ser Asn Gly His
145 150 155 160
Glu Leu Asp Phe His Val Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Glu Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn
210 215 220
Ala Gly Lys Pro Asp Thr Pro Leu Val Ser Arg Ser Gly Thr Pro Asn
225 230 235 240
Gly Ser Ala Arg Ser Gln Thr Thr Asn Gly Phe Ser Gly Leu Arg Arg
245 250 255
Thr Arg Pro Tyr Asp Ser Asn Asn Leu Leu Pro Ile Thr Pro Asn Glu
260 265 270
Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly
275 280 285
Lys Pro Asn Pro Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val
290 295 300
Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala
305 310 315 320
His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val
325 330 335
Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala
340 345 350
Gln Ile Met Lys Gly Pro Tyr Thr His Phe Met Gln Lys Glu Ile Phe
355 360 365
Glu Gln Pro Asp Ser Thr Phe Asn Thr Met Arg Gly Arg Ile Asp Phe
370 375 380
Asp Ser Gly Thr Val Met Leu Gly Gly Leu Gln Ala Trp Leu Pro Ala
385 390 395 400
Val Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr
405 410 415
His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile
420 425 430
Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro
435 440 445
Val Phe Arg Asp Asp Val Cys Cys Phe Val Ser Gln Ser Gly Glu Thr
450 455 460
Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu
465 470 475 480
Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr
485 490 495
His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser
500 505 510
Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu
515 520 525
Ser Leu Ser Asp Asp Arg Val Ser Lys Met Glu Arg Arg Arg Glu Ile
530 535 540
Met Asn Gly Leu Arg Asn Ile Pro Asp Gln Ile Arg Glu Val Leu Ser
545 550 555 560
Leu Glu Pro Arg Ile Lys Glu Leu Cys Gln Gln Asp Leu Glu Glu His
565 570 575
Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Thr Ala Leu
580 585 590
Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly
595 600 605
Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu
610 615 620
Gln Leu Pro Ile Ile Ala Phe Ala Thr Arg Asp Ser Leu Phe Pro Lys
625 630 635 640
Val Val Ser Thr Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Ile
645 650 655
Ile Ile Cys Asn Lys Asn Asp Asp Val Trp Ala Lys Lys Ala Glu Thr
660 665 670
Lys Gln Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln
675 680 685
Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu Ala
690 695 700
Val Asn Arg Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser
705 710 715 720
Val Thr Val Glu
<210> 30
<211> 724
<212> PRT
<213> Zygosaccharomyces parabailii strain ATCC 60483
<400> 30
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Asp Ile Ile Asp Thr Leu Val Glu Gly Leu Glu Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Gln Pro Glu
35 40 45
Ser Thr Leu Leu Tyr Lys Gln Ile Gly Lys Val Ala Ala Leu Lys Glu
50 55 60
Glu Ile Ser His Asp Ala Pro Arg Arg Asp Val Ser Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Val Asn Cys His Pro Gln Lys Ser Asp Pro Ser Cys Glu Phe Thr Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Glu Asn Leu Ser Asn Gly His
145 150 155 160
Glu Leu Asp Phe His Val Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Glu Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn
210 215 220
Ala Gly Lys Pro Asp Thr Pro Leu Val Ser Arg Ser Gly Thr Pro Asn
225 230 235 240
Gly Ser Ala Arg Ser Gln Thr Thr Asn Gly Phe Ser Gly Leu Arg Arg
245 250 255
Thr Arg Pro Tyr Asp Ser Asn Asn Leu Leu Pro Ile Thr Pro Asn Glu
260 265 270
Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly
275 280 285
Lys Pro Asn Pro Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val
290 295 300
Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala
305 310 315 320
His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val
325 330 335
Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala
340 345 350
Gln Ile Met Lys Gly Pro Tyr Thr His Phe Met Gln Lys Glu Ile Phe
355 360 365
Glu Gln Pro Asp Ser Thr Phe Asn Thr Met Arg Gly Arg Ile Asp Phe
370 375 380
Asp Ser Gly Thr Val Met Leu Gly Gly Leu Gln Ala Trp Leu Pro Ala
385 390 395 400
Val Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr
405 410 415
His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile
420 425 430
Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro
435 440 445
Val Phe Arg Asp Asp Val Cys Cys Phe Val Ser Gln Ser Gly Glu Thr
450 455 460
Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu
465 470 475 480
Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr
485 490 495
His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser
500 505 510
Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu
515 520 525
Ser Leu Ser Asp Asp Arg Val Ser Lys Met Glu Arg Arg Arg Glu Ile
530 535 540
Met Asn Gly Leu Arg Asn Ile Pro Asp Gln Ile Arg Glu Val Leu Ser
545 550 555 560
Leu Glu Pro Arg Ile Lys Glu Leu Cys Gln Gln Asp Leu Glu Glu His
565 570 575
Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Thr Ala Leu
580 585 590
Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly
595 600 605
Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu
610 615 620
Gln Leu Pro Ile Ile Ala Phe Ala Thr Arg Asp Ser Leu Phe Pro Lys
625 630 635 640
Val Val Ser Thr Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Val
645 650 655
Ile Ile Cys Asn Lys Asn Asp Asp Val Trp Ala Lys Lys Ala Glu Thr
660 665 670
Lys Gln Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln
675 680 685
Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu Ala
690 695 700
Val Asn Arg Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser
705 710 715 720
Val Thr Val Glu
<210> 31
<211> 721
<212> PRT
<213> Zygosaccharomyces mellis Ca-7
<400> 31
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Thr Pro Asp
35 40 45
Lys Thr Leu Leu Tyr Lys Gln Ile Gly Lys Val Asp Ala Leu Lys Gln
50 55 60
Glu Ile Ala Arg Asp Ala Pro Glu Arg Asp Ile Ala Phe Ala Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Arg Gln
85 90 95
Ile Asn Cys His Pro Gln Arg Ser Asp Ser Gln Asn Ala Phe Thr Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Arg Thr Leu Leu
115 120 125
Ala Asn Arg Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Ile Leu Phe Lys His Leu Tyr Asp Glu Asn Leu Ser Asn Gly His
145 150 155 160
Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Thr Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Val His Tyr Pro Glu Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Asp
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Ile Glu Phe Pro Asp Asp Thr
210 215 220
Ala Gly Lys Pro Asp Thr Pro Leu Gly Ser Lys Asn Ala Thr Pro Asn
225 230 235 240
Ala Ser Ser Arg Asn Leu Leu Asn Gly Asn Arg Arg Thr Arg Pro Phe
245 250 255
Asp Gly Asn Asn Leu Leu Pro Leu Thr Ala Asn Glu Phe Asn Leu Arg
260 265 270
His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Thr Pro Asn Pro
275 280 285
Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val Ile Lys His Thr
290 295 300
Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp
305 310 315 320
Gly Glu Leu His Ile His Arg Ser Arg Arg Pro Glu Val Gly Ala Ser
325 330 335
Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met
340 345 350
Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro
355 360 365
Asp Ser Ala Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Asn Gly
370 375 380
Ser Ile Met Leu Gly Gly Leu Lys Ala Trp Leu Pro Ala Val Arg Arg
385 390 395 400
Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys
405 410 415
Leu Ala Thr Arg Ala Met Phe Glu Glu Leu Ser Glu Ile Pro Val Ser
420 425 430
Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg
435 440 445
Asp Asp Val Cys Cys Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr
450 455 460
Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Leu Gly
465 470 475 480
Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ala Thr His Cys Gly
485 490 495
Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala
500 505 510
Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser
515 520 525
Asp Asp Arg Val Ser Lys Ile Glu Arg Arg Lys Asp Ile Ile Arg Gly
530 535 540
Leu His Asn Ile Pro Asp Gln Ile Arg Glu Val Leu Gln Leu Glu Ser
545 550 555 560
Arg Ile Lys Glu Leu Cys Gln Asn Asp Leu Lys Asp His Lys Ser Leu
565 570 575
Leu Val Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala
580 585 590
Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala
595 600 605
Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Gln Leu Pro
610 615 620
Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser
625 630 635 640
Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys
645 650 655
Asn Thr Asn Asp Glu Val Trp Ala Lys Lys Ala Glu Thr Asn Lys Leu
660 665 670
Leu Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Leu
675 680 685
Asn Ile Ile Pro Leu Gln Leu Val Ser Tyr Trp Leu Ala Val Asn Arg
690 695 700
Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val
705 710 715 720
Glu
<210> 32
<211> 716
<212> PRT
<213> Eremothecium cymbalariae DBVPG#7215
<400> 32
Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Ile Glu Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Glu Thr Phe Ile Phe Lys Gln Ile Gly Lys Val Leu Ala Leu Gln Lys
50 55 60
Glu Ile Asp Asp Met Gln Pro Arg Arg Asp Val Arg Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Arg Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Asp Gly Asn Glu Phe Val Ile
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Val Asn Lys Gly Tyr Glu Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr His Thr Asn Leu Lys Asn Gly His
145 150 155 160
Glu Leu Asp Phe His Glu Leu Ser Lys Gln Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser Arg Tyr Pro Gly Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Arg Arg Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Thr Asn
210 215 220
Lys Ala Ala Glu Val Pro Leu Ser Ser Asn Asn Gly Asp Ser Asn Asn
225 230 235 240
Arg His Asn Asp His His Lys Ala Asn Gly Asp Gly His Ala Asn Leu
245 250 255
Phe Pro Leu Thr Thr Gly Asn Glu Ser Gly Leu Arg His Ser Gln Ser
260 265 270
Arg Ala Phe Leu Ser Glu Asp Gly Val Pro Asn Pro Val Glu Phe Phe
275 280 285
Leu Ser Ser Asp Ala Ala Ser Val Ile Lys His Thr Lys Lys Val Leu
290 295 300
Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp Gly Glu Leu His
305 310 315 320
Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Ala Thr Arg Ser Ile
325 330 335
Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr Lys
340 345 350
His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro Glu Ser Thr Leu Asn
355 360 365
Thr Met Arg Gly Arg Ile Asp Phe Glu Asn Asn Thr Val Met Leu Gly
370 375 380
Gly Leu Lys Ser Trp Leu Pro Ala Ile Arg Asn Ala Arg Arg Leu Thr
385 390 395 400
Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg Ala
405 410 415
Ile Phe Glu Glu Leu Ser Glu Ile Pro Val Ser Ile Glu Leu Ala Ser
420 425 430
Asp Phe Met Asp Arg Arg Cys Pro Val Phe Arg Asp Asp Val Cys Ile
435 440 445
Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu Asn
450 455 460
Tyr Cys Ile Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser Val
465 470 475 480
Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn Ala
485 490 495
Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln Tyr
500 505 510
Ile Ala Leu Val Met Leu Ala Leu Ser Leu Ser Asp Asp Arg Val Ser
515 520 525
Arg Ile Glu Arg Arg Lys Glu Ile Ile Gln Gly Leu Lys Lys Ile Pro
530 535 540
Asp Gln Ile Lys Glu Val Leu Gln Leu Glu Arg Gln Ile Lys Gln Leu
545 550 555 560
Cys Glu Asn Glu Leu Cys Asn Gln Lys Ser Leu Leu Leu Leu Gly Arg
565 570 575
Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys Glu
580 585 590
Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys His
595 600 605
Gly Val Leu Ala Leu Val Asp Glu His Leu Pro Ile Ile Ala Phe Gly
610 615 620
Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln Val
625 630 635 640
Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys Asn Glu Asn Asp Asp
645 650 655
Val Trp Thr Lys Lys Ala Ala Ser Ser Asn Leu Val Thr Leu Glu Val
660 665 670
Pro Leu Thr Val Asp Cys Leu Gln Gly Leu Leu Asn Ile Ile Pro Leu
675 680 685
Gln Leu Thr Ala Tyr Trp Leu Ala Val Asn Asn Gly Ile Asp Val Asp
690 695 700
Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 33
<211> 704
<212> PRT
<213> Kluyveromyces dobzhanskii CBS 2104
<400> 33
Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Arg Glu Asp
35 40 45
Glu Thr Ser Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Lys
50 55 60
Glu Ile Glu Ala His Lys Pro Asn Arg Asp Ala His Phe Val Thr His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Val Asn Cys His Pro His Arg Ser Asp Pro Thr Gly Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Arg Gln Leu Leu
115 120 125
Ser Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Ile Tyr Asp Thr Asn Met Lys Asn Gly His
145 150 155 160
Asp Pro Asp Phe His Glu Leu Thr Met Gln Val Leu Gln Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Thr His Tyr Pro Asn Glu Ile
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Ser Glu
210 215 220
Gln Leu Pro Asp Val Pro Val Asn Asn Glu Cys Asn Leu Leu Asn Glu
225 230 235 240
Ala Glu Arg Ser Leu Leu Pro Ile Ala Gly Asn Glu Ser Thr Leu Arg
245 250 255
Arg Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Ser Pro
260 265 270
Ile Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Ile Val Lys His Thr
275 280 285
Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp
290 295 300
Gly Glu Leu His Ile His Arg Ser Thr Lys Lys Leu Thr Glu Ser Ala
305 310 315 320
Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys
325 330 335
Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu
340 345 350
Ser Thr Phe Asn Thr Met Arg Gly Arg Ile Asp Phe Glu His Asn Gln
355 360 365
Val Asn Leu Gly Gly Leu Lys Ser Arg Leu Pro Ala Ile Arg Lys Ala
370 375 380
Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu
385 390 395 400
Ala Thr Arg Ser Ile Phe Glu Glu Leu Thr Glu Ile Pro Val Ser Val
405 410 415
Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Ile Phe Arg Asp
420 425 430
Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met
435 440 445
Leu Ser Leu Asn Tyr Cys Leu Glu Arg Gly Ser Leu Thr Leu Gly Ile
450 455 460
Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ser Thr His Cys Gly Val
465 470 475 480
His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr
485 490 495
Thr Ser Gln Tyr Ile Ala Leu Val Met Val Ala Leu Ser Leu Ser Asp
500 505 510
Asp Arg Leu Ser Lys Val Glu Arg Arg Asn Glu Ile Ile Gln Gly Leu
515 520 525
Lys Leu Ile Pro Gly Gln Ile Lys Ala Val Leu Asn Leu Glu Pro Arg
530 535 540
Val Lys Asp Leu Cys Ala Lys Glu Leu Lys Asn Gln Lys Ser Leu Leu
545 550 555 560
Leu Leu Gly Arg Gly Tyr Gln Phe Ala Thr Ala Leu Glu Gly Ala Leu
565 570 575
Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly
580 585 590
Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile
595 600 605
Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Leu Ser Ser
610 615 620
Ile Glu Gln Val Thr Ala Arg Lys Gly Arg Pro Ile Val Ile Cys Asn
625 630 635 640
Glu Asn Asp Glu Val Trp Gln Ser Lys Val Lys Thr His Asn Leu Val
645 650 655
Thr Leu Glu Val Pro His Thr Val Asp Cys Leu Gln Gly Leu Leu Asn
660 665 670
Val Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu Ala Val Asn Asn Gly
675 680 685
Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
690 695 700
<210> 34
<211> 704
<212> PRT
<213> Kluyveromyces lactis strain NRRL Y-1140
<400> 34
Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Arg Glu Asp
35 40 45
Glu Thr Val Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Lys
50 55 60
Glu Ile Glu Ala His Lys Pro Asn Arg Asp Ala His Phe Val Thr His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Val Asn Cys His Pro His Arg Ser Asp Pro Ser Gly Thr Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Arg Gln Leu Leu
115 120 125
Thr Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Ile Tyr Asp Thr Asn Leu Lys Asn Gly His
145 150 155 160
Asp Pro Asp Phe His Glu Leu Thr Met Gln Val Leu Gln Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Thr His Tyr Pro Asn Glu Ile
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Ser Glu
210 215 220
Gln Leu Pro Asp Leu Pro Val Asn Asn Glu Cys Asn Leu Leu Asn Asp
225 230 235 240
Ala Asp Arg Ser Leu Leu Pro Leu Ala Gly Asp Glu Ser Thr Leu Arg
245 250 255
Arg Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Ser Pro
260 265 270
Ile Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Ile Val Lys His Thr
275 280 285
Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp
290 295 300
Gly Glu Leu His Ile His Arg Ala Asn Lys Lys Leu Thr Glu Ser Ala
305 310 315 320
Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys
325 330 335
Gly Pro Tyr Gln His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu
340 345 350
Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu His Asn Leu
355 360 365
Val Asn Leu Gly Gly Leu Lys Ser Arg Leu Ser Ala Ile Arg Lys Ala
370 375 380
Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu
385 390 395 400
Ala Thr Arg Ala Ile Phe Glu Glu Leu Thr Glu Ile Pro Val Ser Val
405 410 415
Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Ile Phe Arg Asp
420 425 430
Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met
435 440 445
Leu Ser Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Leu Gly Ile
450 455 460
Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ser Thr His Cys Gly Val
465 470 475 480
His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr
485 490 495
Thr Ser Gln Tyr Ile Ala Leu Val Met Val Ala Leu Ser Leu Ser Asp
500 505 510
Asp Arg Val Ser Lys Ile Glu Arg Arg Asn Glu Ile Ile Gln Gly Leu
515 520 525
Lys Leu Ile Pro Gly Gln Ile Lys Glu Val Leu Asn Val Glu Pro Arg
530 535 540
Ile Lys Glu Leu Cys Ala Lys Glu Leu Lys Asp Gln Lys Ser Leu Leu
545 550 555 560
Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu
565 570 575
Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly
580 585 590
Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asp Leu Pro Ile
595 600 605
Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Leu Ser Ser
610 615 620
Ile Glu Gln Val Ile Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn
625 630 635 640
Glu Asn Asp Glu Val Trp Gln Asn Lys Ala Lys Ala Asn Asn Leu Ile
645 650 655
Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Leu Asn
660 665 670
Ile Ile Pro Leu Gln Leu Thr Ser Tyr Trp Leu Ala Val Asn Asn Gly
675 680 685
Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
690 695 700
<210> 35
<211> 703
<212> PRT
<213> Eremothecium sinecaudum strain ATCC 58844
<400> 35
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Thr Arg
1 5 10 15
Gly Asp Val Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Asn Ala Gly
35 40 45
Glu Thr Phe Ile Phe Lys Gln Ile Gly Lys Val Ser Ala Leu Gln Lys
50 55 60
Glu Ile Asp Val Cys Lys Pro Asn Arg Asp Val Ser Phe Val Ser His
65 70 75 80
Cys Ala Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Arg Lys
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Glu Asn Asn Glu Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Val Asn Lys Gly Phe Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Met Glu Asn Gly His
145 150 155 160
Glu Val Asp Phe His Glu Leu Ser Lys Gln Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser Arg Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Arg Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asn Glu
210 215 220
Asp Lys Arg Glu Val Pro Leu Ala Ala Arg Asn Ser His His Lys Arg
225 230 235 240
Asn Glu Asn Leu Leu Pro Ile Thr Thr Thr Glu Ser His Leu Arg His
245 250 255
Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ala Pro Asn Pro Val
260 265 270
Glu Phe Tyr Leu Ser Ser Asp Ala Ala Ser Val Ile Lys His Thr Lys
275 280 285
Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp Gly
290 295 300
Glu Leu His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Ala Thr
305 310 315 320
Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly
325 330 335
Pro Tyr Lys His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro Glu Ser
340 345 350
Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Asn Asn Thr Val
355 360 365
Met Leu Gly Gly Leu Lys Ser Trp Leu Pro Ala Ile Arg Asn Ala Arg
370 375 380
Arg Leu Thr Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Met Ala
385 390 395 400
Ala Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile Leu Val Ser Ile Glu
405 410 415
Leu Ala Ser Asp Phe Leu Asp Arg Arg Cys Pro Val Phe Arg Asp Asp
420 425 430
Val Cys Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu
435 440 445
Ala Leu Asn Tyr Cys Ile Glu Arg Gly Ala Leu Thr Val Gly Ile Val
450 455 460
Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His
465 470 475 480
Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr
485 490 495
Ser Gln Tyr Ile Ala Leu Val Met Leu Ala Leu Ser Leu Ser Asp Asp
500 505 510
Arg Val Ser Arg Ile Glu Arg Arg Lys Glu Ile Ile Gln Gly Leu Lys
515 520 525
Lys Ile Pro Glu Gln Ile Lys Gln Val Leu Gln Leu Glu Ala Pro Ile
530 535 540
Lys Lys Leu Cys Glu Thr Glu Leu Val Asn Gln Lys Ser Leu Leu Leu
545 550 555 560
Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu Lys
565 570 575
Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu
580 585 590
Leu Lys His Gly Val Leu Ala Leu Val Asp Glu His Leu Pro Ile Ile
595 600 605
Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile
610 615 620
Glu Gln Ile Ile Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys Asn Glu
625 630 635 640
Asn Asp Glu Val Trp Glu Lys Lys Ala Thr Thr Ala Glu Val Ile Thr
645 650 655
Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Leu Asn Ile
660 665 670
Ile Pro Leu Gln Leu Thr Ala Tyr Trp Leu Ala Val Asn Asn Gly Ile
675 680 685
Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
690 695 700
<210> 36
<211> 704
<212> PRT
<213> Kluyveromyces lactis strain CBS 2105
<400> 36
Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Arg Glu Asp
35 40 45
Glu Thr Val Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Lys
50 55 60
Glu Ile Glu Ala His Lys Pro Asn Arg Asp Ala His Phe Val Thr His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Val Asn Cys His Pro His Arg Ser Asp Pro Ser Gly Thr Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Arg Gln Leu Leu
115 120 125
Thr Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Lys His Ile Tyr Asp Thr Asn Leu Lys Asn Gly His
145 150 155 160
Asp Pro Asp Phe His Glu Leu Thr Met Gln Val Leu Gln Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Thr His Tyr Pro Asn Glu Ile
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Ser Glu
210 215 220
Gln Leu Pro Asp Leu Pro Val Asn Asn Glu Cys Asn Leu Leu Asn Asp
225 230 235 240
Ala Asp Arg Ser Leu Leu Pro Leu Ala Gly Asp Glu Ser Thr Leu Arg
245 250 255
Arg Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Ser Pro
260 265 270
Ile Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Ile Val Lys His Thr
275 280 285
Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp
290 295 300
Gly Glu Leu His Ile His Arg Ala Asn Lys Lys Leu Thr Glu Ser Ala
305 310 315 320
Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys
325 330 335
Gly Pro Tyr Gln His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu
340 345 350
Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu His Asn Leu
355 360 365
Val Asn Leu Gly Gly Leu Lys Ser Arg Leu Ser Ala Ile Arg Lys Ala
370 375 380
Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu
385 390 395 400
Ala Thr Arg Ala Ile Phe Glu Glu Leu Thr Glu Ile Pro Val Ser Val
405 410 415
Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Ile Phe Arg Asp
420 425 430
Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met
435 440 445
Leu Ser Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Leu Gly Ile
450 455 460
Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ser Thr His Cys Gly Val
465 470 475 480
His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr
485 490 495
Thr Ser Gln Tyr Ile Ala Leu Val Met Val Ala Leu Ser Leu Ser Asp
500 505 510
Asp Arg Val Ser Lys Ile Glu Arg Arg Asn Glu Ile Ile Gln Gly Leu
515 520 525
Lys Leu Ile Pro Gly Gln Ile Lys Glu Val Leu Asn Val Glu Pro Arg
530 535 540
Ile Lys Glu Leu Cys Ala Lys Glu Leu Lys Asp Gln Lys Ser Leu Leu
545 550 555 560
Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu
565 570 575
Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly
580 585 590
Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asp Leu Pro Ile
595 600 605
Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Leu Ser Ser
610 615 620
Ile Glu Gln Val Ile Ala Arg Lys Gly His Pro Ile Val Ile Cys Asn
625 630 635 640
Glu Asn Asp Glu Val Trp Gln Asn Lys Ala Lys Ala Asn Asn Leu Ile
645 650 655
Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Leu Asn
660 665 670
Ile Ile Pro Leu Gln Leu Thr Ser Tyr Trp Leu Ala Val Asn Asn Gly
675 680 685
Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
690 695 700
<210> 37
<211> 706
<212> PRT
<213> Kluyveromyces marxianus DMKU3-1042
<400> 37
Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg
1 5 10 15
Gly Glu Ile Val Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Asp Glu Asp
35 40 45
Glu Thr Leu Ile Phe Lys Gln Ile Gly Lys Val Ser Ala Leu Gln Lys
50 55 60
Glu Ile Glu Lys His Asn Pro Asn Arg Asp Val His Phe Val Thr His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln
85 90 95
Val Asn Cys His Pro His Arg Ser Asp Val Thr Cys Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Tyr Arg Asp Leu Arg Gln Leu Leu
115 120 125
Thr Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Met His Ile Tyr Gln Thr Asn Leu Lys Asn Gly His
145 150 155 160
Asp Pro Asp Phe His Glu Leu Thr Lys Gln Val Leu Gln Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Thr His Tyr Pro Asn Glu Ile
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Met Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Ser Glu
210 215 220
Gln Met Pro Asp Val Pro Val Asn Asn Glu Cys Asn Leu Leu Asn Asp
225 230 235 240
Ala Glu Arg Ser Leu Leu Pro Leu Ala Gly Asn Glu Ser Thr Leu Arg
245 250 255
Arg Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Ser Pro
260 265 270
Ile Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Ile Val Lys His Thr
275 280 285
Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp
290 295 300
Gly Glu Leu His Ile His Arg Ala Thr Asn Lys Leu Asn Glu Ser Ala
305 310 315 320
Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys
325 330 335
Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu
340 345 350
Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Thr Asn Thr
355 360 365
Val Thr Leu Gly Gly Leu Thr Ser Arg Leu Pro Ala Ile Arg Arg Ala
370 375 380
Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu
385 390 395 400
Ala Ala Arg Ala Ile Phe Glu Glu Leu Thr Glu Ile Pro Val Ser Val
405 410 415
Glu Leu Ala Ser Asp Phe Leu Asp Arg Arg Ala Pro Ile Phe Arg Asp
420 425 430
Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met
435 440 445
Leu Ser Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Leu Gly Ile
450 455 460
Val Asn Ser Val Gly Ser Ser Ile Ser Arg Gly Thr His Cys Gly Val
465 470 475 480
His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr
485 490 495
Thr Ser Gln Phe Ile Ala Leu Val Met Val Ala Leu Ser Leu Ser Asp
500 505 510
Asp Arg Leu Ser Lys Leu Glu Arg Arg Lys Glu Ile Ile Gln Gly Leu
515 520 525
Lys Leu Ile Pro Glu Gln Ile Lys Gln Val Leu Lys Leu Glu Ser Gln
530 535 540
Val Lys Asp Leu Cys Ser Asn Glu Leu Lys Asp Gln Lys Ser Leu Leu
545 550 555 560
Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu
565 570 575
Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly
580 585 590
Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile
595 600 605
Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Leu Ser Ser
610 615 620
Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn
625 630 635 640
Glu Asn Asp Glu Val Trp Glu Ala Lys Lys Lys Asn Ser Asn Gly Ser
645 650 655
Leu Val Thr Leu Glu Val Pro Arg Thr Val Asp Cys Leu Gln Gly Leu
660 665 670
Leu Asn Ile Ile Pro Leu Gln Leu Thr Ser Tyr Trp Leu Ala Val Asn
675 680 685
Asn Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr
690 695 700
Val Glu
705
<210> 38
<211> 723
<212> PRT
<213> Tetrapisispora blattae CBS 6284
<400> 38
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Thr Arg
1 5 10 15
Gly Glu Ile Ile Asp Ile Leu Val Glu Gly Leu Gly Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asn Gly Asp Lys Arg Asn
35 40 45
Ser Ile Asp Val Tyr Arg Ala Ile Gly Lys Val Ser Ala Leu Lys Gln
50 55 60
Glu Ile Asp Asn Ile Asn Pro Asn Arg Asp Val Thr Tyr Ala Ser His
65 70 75 80
Ser Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Lys Gln
85 90 95
Thr Asn Cys His Pro Gln Arg Ser Asp Pro Arg Asn Leu Phe Thr Ile
100 105 110
Ile His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Val Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Phe Leu His Leu Tyr Gln Thr Asn Ile Lys Met Gly Asn
145 150 155 160
Asp Ile Asp Phe His Glu Leu Thr Lys Leu Val Leu Met Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Val Tyr Phe Pro Gly Glu Ile
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Asn Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asn Glu Asn
210 215 220
Ala Ile Gln Thr Glu Thr Pro Leu Ser Asn Glu Cys Lys Thr Asp Asn
225 230 235 240
Asn Asp Glu Leu Asn Ser Ser Asn Tyr Pro Thr Val Asp Lys Lys Glu
245 250 255
Phe His Glu Lys Ala Gly Leu Val Pro Ile Thr Ala Asn Glu Phe Asn
260 265 270
Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro
275 280 285
Ile Pro Ile Glu Phe Phe Ile Ser Ser Asp Ala Ala Ser Val Ile Lys
290 295 300
Tyr Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile
305 310 315 320
Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Lys Glu Val Gly Lys
325 330 335
Ser Met Ile Arg Ser Ile Gln Thr Leu Glu Leu Glu Leu Ala Gln Ile
340 345 350
Met Lys Gly Pro Tyr Glu His Phe Met Gln Lys Glu Ile Tyr Glu Gln
355 360 365
Pro Val Ser Thr Tyr Asn Thr Met Arg Gly Arg Leu Asp Phe Asp Asn
370 375 380
Asn Leu Val Asn Leu Gly Gly Leu Gln Gln Phe Ile Ser Thr Ile Arg
385 390 395 400
Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser
405 410 415
Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val
420 425 430
Asn Val Asp Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Ile Phe
435 440 445
Arg Asp Asp Val Cys Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp
450 455 460
Thr Met Phe Ala Leu Asn Tyr Ala Ile Asp Arg Gly Ala Leu Thr Val
465 470 475 480
Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ala Thr Asn Cys
485 490 495
Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys
500 505 510
Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Val Leu Leu
515 520 525
Gly Glu Asp Arg Ile Ser Lys Asn Glu Arg Arg Arg Glu Ile Ile Gln
530 535 540
Gly Leu Lys Leu Ile Pro Glu Gln Ile Lys Gln Val Leu Lys Leu Glu
545 550 555 560
Pro Lys Ile Lys Gln Leu Cys Glu Asn Glu Leu Ser Asp Gln Lys Ser
565 570 575
Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly
580 585 590
Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu
595 600 605
Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Glu Leu
610 615 620
Pro Ile Ile Ala Phe Gly Thr Arg Asp Tyr Leu Phe Pro Lys Val Val
625 630 635 640
Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile
645 650 655
Cys Asn Glu Asn Asp Glu Val Trp Ser Lys Lys Lys Leu Glu Asn Asp
660 665 670
Arg Leu Ile Thr Leu Glu Val Pro Thr Thr Val Asp Cys Leu Gln Gly
675 680 685
Leu Ile Asn Ile Ile Pro Leu Gln Leu Met Ser Tyr Trp Leu Ala Ser
690 695 700
Asn Arg Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val
705 710 715 720
Thr Val Glu
<210> 39
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 39
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 40
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 40
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 41
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 41
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 42
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 42
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 43
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 43
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 44
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 44
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 45
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 45
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 46
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 46
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 47
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 47
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 48
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 48
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 49
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 49
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 50
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 50
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 51
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 51
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 52
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 52
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 53
<211> 717
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic sequence
<400> 53
Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg
1 5 10 15
Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr
20 25 30
Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp
35 40 45
Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu
50 55 60
Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His
65 70 75 80
Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln
85 90 95
Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val
100 105 110
Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu
115 120 125
Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile
130 135 140
Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His
145 150 155 160
Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu
165 170 175
Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val
180 185 190
Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu
195 200 205
Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn
210 215 220
Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly
225 230 235 240
Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala
245 250 255
Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln
260 265 270
Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe
275 280 285
Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val
290 295 300
Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu
305 310 315 320
His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser
325 330 335
Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr
340 345 350
Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe
355 360 365
Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu
370 375 380
Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu
385 390 395 400
Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg
405 410 415
Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala
420 425 430
Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys
435 440 445
Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu
450 455 460
Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser
465 470 475 480
Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn
485 490 495
Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln
500 505 510
Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val
515 520 525
Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile
530 535 540
Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys
545 550 555 560
Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly
565 570 575
Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys
580 585 590
Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys
595 600 605
His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe
610 615 620
Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln
625 630 635 640
Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp
645 650 655
Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu
660 665 670
Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro
675 680 685
Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val
690 695 700
Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu
705 710 715
<210> 54
<211> 348
<212> PRT
<213> Neisseria meningitidis 35E
<400> 54
Met Pro Ser Glu Ala Phe Arg Arg His Arg Ala Tyr Arg Glu Asn Lys
1 5 10 15
Leu Gln Pro Leu Val Ser Val Leu Ile Cys Ala Tyr Asn Val Glu Lys
20 25 30
Tyr Phe Ala Gln Ser Leu Ala Ala Val Val Asn Gln Thr Trp Cys Asn
35 40 45
Leu Asp Ile Leu Ile Val Asp Asp Gly Ser Thr Asp Gly Thr Leu Ala
50 55 60
Ile Ala Gln Arg Phe Gln Glu Gln Asp Gly Arg Ile Lys Ile Leu Ala
65 70 75 80
Gln Ala Gln Asn Ser Gly Leu Ile Pro Ser Leu Asn Ile Gly Leu Asp
85 90 95
Glu Leu Ala Lys Ser Gly Met Gly Glu Tyr Ile Ala Arg Thr Asp Ala
100 105 110
Asp Asp Ile Ala Ala Pro Asp Trp Ile Glu Lys Ile Val Gly Glu Met
115 120 125
Glu Lys Asp Arg Ser Ile Ile Ala Met Gly Ala Trp Leu Glu Val Leu
130 135 140
Ser Glu Glu Lys Asp Gly Asn Arg Leu Ala Arg His His Glu His Gly
145 150 155 160
Lys Ile Trp Lys Lys Pro Thr Arg His Glu Asp Ile Ala Asp Phe Phe
165 170 175
Pro Phe Gly Asn Pro Ile His Asn Asn Thr Met Ile Met Arg Arg Ser
180 185 190
Val Ile Asp Gly Gly Leu Arg Tyr Asn Thr Glu Arg Asp Trp Ala Glu
195 200 205
Asp Tyr Gln Phe Trp Tyr Asp Val Ser Lys Leu Gly Arg Leu Ala Tyr
210 215 220
Tyr Pro Glu Ala Leu Val Lys Tyr Arg Leu His Ala Asn Gln Val Ser
225 230 235 240
Ser Lys Tyr Ser Ile Arg Gln His Glu Ile Ala Gln Gly Ile Gln Lys
245 250 255
Thr Ala Arg Asn Asp Phe Leu Gln Ser Met Gly Phe Lys Thr Arg Phe
260 265 270
Asp Ser Leu Glu Tyr Arg Gln Ile Lys Ala Val Ala Tyr Glu Leu Leu
275 280 285
Glu Lys His Leu Pro Glu Glu Asp Phe Glu Arg Ala Arg Arg Phe Leu
290 295 300
Tyr Gln Cys Phe Lys Arg Thr Asp Thr Leu Pro Ala Gly Val Trp Leu
305 310 315 320
Asp Phe Ala Ala Asn Gly Arg Met Arg Arg Leu Phe Thr Leu Arg Gln
325 330 335
Tyr Phe Gly Ile Leu His Arg Leu Leu Lys Asn Arg
340 345
<210> 55
<211> 223
<212> PRT
<213> Pasteurella multocida
<400> 55
Met Thr Asn Ile Ala Ile Ile Pro Ala Arg Ala Gly Ser Lys Gly Ile
1 5 10 15
Pro Asp Lys Asn Leu Gln Pro Val Gly Gly His Ser Leu Ile Gly Arg
20 25 30
Ala Ile Leu Ala Ala Lys Asn Ala Asp Val Phe Asp Met Ile Val Val
35 40 45
Thr Ser Asp Gly Asp Asn Ile Leu Arg Glu Ala Glu Lys Tyr Gly Ala
50 55 60
Leu Ala Leu Lys Arg Pro Ala Glu Leu Ala Gln Asp Asn Ser Arg Thr
65 70 75 80
Ile Asp Ala Ile Leu His Ala Leu Glu Ser Leu Asn Ile Arg Glu Gly
85 90 95
Thr Cys Thr Leu Leu Gln Pro Thr Ser Pro Leu Arg Asp His Leu Asp
100 105 110
Ile Lys Asn Ala Met Asp Met Tyr Val Asn Gly Gly Val His Ser Val
115 120 125
Val Ser Ala Cys Glu Cys Glu His His Pro Tyr Lys Ala Phe Ala Leu
130 135 140
Ser Lys Asp His Glu Val Leu Pro Val Arg Glu Ile Ala Asp Phe Glu
145 150 155 160
Ala Ala Arg Gln Thr Leu Pro Lys Met Tyr Arg Ala Asn Gly Ala Ile
165 170 175
Tyr Ile Asn Asp Ile Ala Gln Leu Leu Lys Glu Lys Tyr Phe Phe Ile
180 185 190
Pro Pro Leu Lys Phe Tyr Leu Met Pro Thr Tyr Arg Ser Val Asp Ile
195 200 205
Asp Val Lys Gln Asp Leu Glu Leu Ala Glu Ile Leu Ser Asn Lys
210 215 220
<210> 56
<211> 371
<212> PRT
<213> Neisseria meningitidis
<400> 56
Met Gly Leu Lys Lys Ala Cys Leu Thr Val Leu Cys Leu Ile Val Phe
1 5 10 15
Cys Phe Gly Ile Phe Tyr Thr Phe Asp Arg Val Asn Gln Gly Glu Arg
20 25 30
Asn Ala Val Ser Leu Leu Lys Glu Lys Leu Phe Asn Glu Glu Gly Glu
35 40 45
Pro Val Asn Leu Ile Phe Cys Tyr Thr Ile Leu Gln Met Lys Val Ala
50 55 60
Glu Arg Ile Met Ala Gln His Pro Gly Glu Arg Phe Tyr Val Val Leu
65 70 75 80
Met Ser Glu Asn Arg Asn Glu Lys Tyr Asp Tyr Tyr Phe Asn Gln Ile
85 90 95
Lys Asp Lys Ala Glu Arg Ala Tyr Phe Phe His Leu Pro Tyr Gly Leu
100 105 110
Asn Lys Ser Phe Asn Phe Ile Pro Thr Met Ala Glu Leu Lys Val Lys
115 120 125
Ser Met Leu Leu Pro Lys Val Lys Arg Ile Tyr Leu Ala Ser Leu Glu
130 135 140
Lys Val Ser Ile Ala Ala Phe Leu Ser Thr Tyr Pro Asp Ala Glu Ile
145 150 155 160
Lys Thr Phe Asp Asp Gly Thr Gly Asn Leu Ile Gln Ser Ser Ser Tyr
165 170 175
Leu Gly Asp Glu Phe Ser Val Asn Gly Thr Ile Lys Arg Asn Phe Ala
180 185 190
Arg Met Met Ile Gly Asp Trp Ser Ile Ala Lys Thr Arg Asn Ala Ser
195 200 205
Asp Glu His Tyr Thr Ile Phe Lys Gly Leu Lys Asn Ile Met Asp Asp
210 215 220
Gly Arg Arg Lys Met Thr Tyr Leu Pro Leu Phe Asp Ala Ser Glu Leu
225 230 235 240
Lys Thr Gly Asp Glu Thr Gly Gly Thr Val Arg Ile Leu Leu Gly Ser
245 250 255
Pro Asp Lys Glu Met Lys Glu Ile Ser Glu Lys Ala Ala Lys Asn Phe
260 265 270
Lys Ile Gln Tyr Val Ala Pro His Pro Arg Gln Thr Tyr Gly Leu Ser
275 280 285
Gly Val Thr Thr Leu Asn Ser Pro Tyr Val Ile Glu Asp Tyr Ile Leu
290 295 300
Arg Glu Ile Lys Lys Asn Pro His Thr Arg Tyr Glu Ile Tyr Thr Phe
305 310 315 320
Phe Ser Gly Ala Ala Leu Thr Met Lys Asp Phe Pro Asn Val His Val
325 330 335
Tyr Ala Leu Lys Pro Ala Ser Leu Pro Glu Asp Tyr Trp Leu Lys Pro
340 345 350
Val Tyr Ala Leu Phe Thr Gln Ser Gly Ile Pro Ile Leu Thr Phe Asp
355 360 365
Asp Lys Asn
370
<210> 57
<211> 308
<212> PRT
<213> Pasteurella multocida subsp. multocida str. Pm70
<400> 57
Met Asn Leu Ile Ile Cys Cys Thr Pro Leu Gln Val Leu Ile Ala Glu
1 5 10 15
Lys Ile Ile Ala Lys Phe Pro His Met Pro Phe Tyr Gly Val Met Leu
20 25 30
Ser Thr Val Ser Asn Lys Lys Phe Asp Phe Tyr Ala Lys Arg Leu Ala
35 40 45
Gln Gln Cys Gln Gly Phe Phe Ser Met Val Gln His Lys Asp Arg Phe
50 55 60
Asn Leu Leu Lys Glu Ile Leu Tyr Leu Lys Arg Thr Phe Ser Gly Lys
65 70 75 80
His Phe Asp Gln Val Phe Val Ala Asn Ile Asn Asp Leu Gln Ile Gln
85 90 95
Phe Leu Leu Ser Ala Ile Asp Phe Asn Leu Leu Asn Thr Phe Asp Asp
100 105 110
Gly Thr Ile Asn Ile Val Pro Asn Ser Leu Phe Tyr Gln Asp Asp Pro
115 120 125
Ala Thr Leu Gln Arg Lys Leu Ile Asn Val Leu Leu Gly Asn Lys Tyr
130 135 140
Ser Ile Gln Ser Leu Arg Ala Leu Ser His Thr His Tyr Thr Ile Tyr
145 150 155 160
Lys Gly Phe Lys Asn Ile Ile Glu Arg Val Glu Pro Ile Glu Leu Val
165 170 175
Ala Ala Asp Asn Ser Glu Lys Val Thr Ser Ala Val Ile Asn Val Leu
180 185 190
Leu Gly Gln Pro Val Phe Ala Glu Asp Glu Arg Asn Ile Ala Leu Ala
195 200 205
Glu Arg Val Ile Lys Gln Phe Asn Ile His Tyr Tyr Leu Pro His Pro
210 215 220
Arg Glu Lys Tyr Arg Leu Ala Gln Val Asn Tyr Ile Asp Thr Glu Leu
225 230 235 240
Ile Phe Glu Asp Tyr Ile Leu Gln Gln Cys Gln Thr His Lys Tyr Cys
245 250 255
Val Tyr Thr Tyr Phe Ser Ser Ala Ile Ile Asn Ile Met Asn Lys Ser
260 265 270
Asp Asn Ile Glu Val Val Ala Leu Lys Ile Asp Thr Glu Asn Pro Ala
275 280 285
Tyr Asp Ala Cys Tyr Asp Leu Phe Asp Glu Leu Gly Val Asn Val Ile
290 295 300
Asp Ile Arg Glu
305
Claims (26)
- 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포로서, 상기 세포는
(i) 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,
(ii) UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 합성할 수 있고, 바람직하게, 합성하고,
(iii) 글리코실트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,
상기 세포는 상기 UDP-GlcNAc를 사용하여 상기 글리코실화된 생산물을 생산하는 것인, 세포. - 제1항에 있어서, 상기 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 포함하는 적어도 하나의 유전자 발현 모듈에 의해 변형된 대사적으로 조작된 세포이고, 바람직하게 상기 발현 모듈로부터 발현은 항상성이거나 또는 비-화학적 유도 또는 억제 시에 조건적인 것인 세포.
- 제1항 또는 제2항에 있어서, 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고,
(i) V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나에 따른 폴리펩티드 서열을 포함하거나, 또는
(ii) 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 아미노산 서열에 대해서 적어도 200 아미노산 잔기 범위에 걸쳐서 적어도 80.0% 동일한 서열이고, V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 아미노산 서열을 포함하거나 또는 그로 이루어지는 폴리펩티드인 단백질인, 세포. - 제1항 내지 제3항 중 어느 하나의 항에 있어서, 상기 단당 서브유닛 중 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산으로 이루어진 목록으로부터 선택되는 것인 세포.
- 제1항 내지 제4항 중 어느 하나의 항에 있어서, 상기 세포는 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스로 이루어진 목록으로부터 선택되는 뉴클레오티드-당을 추가로 합성하는 것인 세포.
- 제1항 내지 제5항 중 어느 하나의 항에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제로 이루어진 목록으로부터 선택되고,
- 바람직하게, 상기 푸코실트랜스퍼라제는 알파-1,2-푸코실트랜스퍼라제, 알파-1,3-푸코실트랜스퍼라제, 알파-1,3/4-푸코실트랜스퍼라제, 알파-1,4-푸코실트랜스퍼라제 및 알파-1,6-푸코실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 시알릴트랜스퍼라제는 알파-2,3-시알릴트랜스퍼라제, 알파-2,6-시알릴트랜스퍼라제 및 알파-2,8-시알릴트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 갈락토실트랜스퍼라제는 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, 베타-1,4-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 알파-1,3-갈락토실트랜스퍼라제 및 알파-1,4-갈락토실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 글루코실트랜스퍼라제는 알파-글루코실트랜스퍼라제, 베타-1,2-글루코실트랜스퍼라제, 베타-1,3-글루코실트랜스퍼라제 및 베타-1,4-글루코실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 만노실트랜스퍼라제는 알파-1,2-만노실트랜스퍼라제, 알파-1,3-만노실트랜스퍼라제 및 알파-1,6-만노실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 N-아세틸글루코사미닐트랜스퍼라제는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 베타-1,6-N-아세틸글루코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 N-아세틸갈락토사미닐트랜스퍼라제는 알파-1,3-N-아세틸갈락토사미닐트랜스퍼라제이고,
- 바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제의 발현 또는 활성이 변형된 것인, 세포. - 제1항 내지 제6항 중 어느 하나의 항에 있어서, 상기 세포는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, 포스포아세틸글루코사민 뮤타제, UDP-N-아세틸글루코사민 파이로포스포릴라제, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제, UTP--글루코스-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 4-에피머라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 락토스 퍼미아제, UDP-N-아세틸글루코사민 2-에피머라제, N-아세틸뉴라미네이트 신타제, N-아실뉴라미네이트 시티딜릴트랜스퍼라제, 글루코스-6-포스페이트 이소머라제 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스 2-에피머라제를 포함하는 목록으로부터 선택되는 효소 중 어느 하나 이상을 추가로 발현하고,
바람직하게, 상기 세포는 상기 효소 중 적어도 하나의 발현 또는 활성이 변형된 것인, 세포. - 제1항 내지 제7항 중 어느 하나의 항에 있어서, 상기 글리코실화된 생산물은 포유동물 모유 이당 또는 올리고당, 바람직하게 인간 모유 이당 또는 올리고당, O-항원, 엔테로박테리아 공통 항원 (ECA), 캡슐 다당류에 존재하는 올리고당 반복부, 펩티도글리칸 (PG) 및 인간 ABO식 혈액형 체계의 항원을 포함하는 목록으로부터 선택되는 것인 세포.
- 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 사용하고, 바람직하게 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 둘 이상의 전구체를 사용하는 것인 세포.
- 제1항 내지 제9항 중 어느 하나의 항에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 생산하는 것인 세포.
- 제9항 또는 제10항에 있어서, 상기 글리코실화된 생산물의 합성을 위한 상기 전구체는 상기 글리코실화된 생산물로 완전하게 전환되는 것인 세포.
- 제1항 내지 제11항 중 어느 하나의 항에 있어서, 상기 세포는 세포 밖으로 적어도 하나의 이당 또는 올리고당을 배출하는 것인 세포.
- 제1항 내지 제12항 중 어느 하나의 항에 있어서, 상기 세포는 박테리아, 진균, 효모, 식물 세포, 동물 세포, 또는 원충 세포이고,
- 바람직하게 상기 박테리아는 에스케리치아 콜라이 (Escherichia coli) 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이 균주이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655이고,
- 바람직하게 상기 진균은 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium), 페니실리움 (Penicillium), 무코르 (Mucor) 또는 아스퍼질러스 (Aspergillus)를 포함하는 군으로부터 선택되는 속에 속하고,
- 바람직하게 상기 효모는 사카로마이세스 (Saccharomyces), 자이고사카로마이세스 (Zygosaccharomyces), 피키아 (Pichia), 코마가타엘라 (Komagataella), 한세눌라 (Hansenula), 클루이베로마이세스 (Kluyveromyces) 또는 데바로마이세스 (Debaromyces)를 포함하는 군으로부터 선택되는 속에 속하고,
- 바람직하게 상기 식물 세포는 조류 세포이거나 또는 담배, 알파파, 벼, 토마토, 목화, 유채, 대두, 옥수수, 또는 행운목으로부터 유래되고,
- 바람직하게 상기 동물 세포는 비-인간 포유동물, 조류, 어류, 무척추동물, 파충류, 양서류 또는 곤충으로부터 유래되거나 또는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주이고, 보다 바람직하게 상기 인간 및 비-인간 포유동물 세포는 상피 세포, 배아 신장 세포, 섬유아세포, COS 세포, 중국 햄스터 난소 (CHO) 세포, 쥐 골수종 세포, NIH-3T3 세포, 비-유선 성체 줄기 세포 또는 이의 유도체이고, 보다 바람직하게 상기 곤충 세포는 스포돕테라 프루기페르다 (Spodoptera frugiperda), 봄빅스 모리 (Bombyx mori), 마메스트라 브라시카에 (Mamestra brassicae), 트리코플루시아 니 (Trichoplusia ni), 또는 드로소필라 멜라노가스터 (Drosophila melanogaster)로부터 유래되고,
- 바람직하게 상기 원충 세포는 리슈마니아 타렌톨라에 (Leishmania tarentolae) 세포인, 세포. - 세포에 의해서 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 제조하는 방법으로서, 방법은
(a) 제1항 내지 제13항 중 어느 하나의 항에 따른 세포를 제공하는 단계, 및
(b) 상기 글리코실화된 생산물을 생산하도록 허용하는 조건 하에서 상기 세포를 배양하는 단계,
(c) 바람직하게, 상기 배양으로부터 상기 글리코실화된 생산물을 분리시키는 단계
를 포함하는 것인 제조 방법. - 제14항에 있어서, 상기 배양 동안, 상기 세포는 세포 밖으로 상기 글리코실화된 생산물을 배출하는 것인 제조 방법.
- 제14항 또는 제15항에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함하는 것인 제조 방법: 청징화, 한외여과, 나노여과, 2-층 분할법, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 비이온성 계면활성제 처리, 효소 분해, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피, 전기투석.
- 제14항 내지 제16항 중 어느 하나의 항에 있어서, 상기 세포로부터 상기 글리코실화된 생산물의 정제 단계를 더 포함하는 것인 제조 방법.
- 제17항에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함하는 것인 제조 방법: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과, 전기영동, 효소 처리 또는 이온 교환, 온도 조정, pH 조정, 알칼리 또는 산성 용액으로 pH 조정, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조, 동결건조, 분무 냉동 건조, 냉동 분무 건조, 밴드 건조, 벨트 건조, 진공 밴드 건조, 진공 벨트 건조, 드럼 건조, 롤러 건조, 진공 드럼 건조 또는 진공 롤러 건조.
- 세포 밖으로 이당 또는 올리고당을 배출하는 효모 또는 진균 세포.
- 제19항에 있어서, 상기 이당 또는 올리고당은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함하는 것인 효모 또는 진균 세포.
- 제19항 또는 제20항에 있어서, 상기 세포는 제1항 내지 제13항 중 어느 하나의 항에 따른 대사적으로 조작된 세포인 효모 또는 진균 세포.
- 제1항 및 제3항 중 어느 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자를 포함하는 벡터.
- UDP-GlcNAc로부터 유래되고, 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 제1항 내지 제13항 및 제19항 내지 제21항 중 어느 하나의 항에 따른 세포의 용도.
- UDP-GlcNAc로부터 유래되고, 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 제14항 내지 제18항 중 어느 하나의 항에 따른 방법의 용도.
- UDP-GlcNAc로부터 유래되고, 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 제1항 및 제3항 중 어느 하나의 항의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자의 용도.
- UDP-GlcNAc로부터 유래되고, 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 제22항에 따른 벡터의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21152132 | 2021-01-18 | ||
EP21152132.3 | 2021-01-18 | ||
PCT/EP2022/050918 WO2022152914A1 (en) | 2021-01-18 | 2022-01-17 | Cellular production of glycosylated products |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230132539A true KR20230132539A (ko) | 2023-09-15 |
Family
ID=74187184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237027723A KR20230132539A (ko) | 2021-01-18 | 2022-01-17 | 글리코실화된 생산물의 세포 생산 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20240084347A1 (ko) |
EP (1) | EP4277983A1 (ko) |
KR (1) | KR20230132539A (ko) |
CN (1) | CN116783291A (ko) |
AU (1) | AU2022208430A1 (ko) |
WO (1) | WO2022152914A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117343134A (zh) * | 2023-09-26 | 2024-01-05 | 大连深蓝肽科技研发有限公司 | 一种蜂王浆肽及其与纤维素载体的复合物、制备方法、用于治疗肝损伤疾病的用途 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006508643A (ja) * | 2002-07-01 | 2006-03-16 | アーキオン ライフ サイエンシーズ エルエルシー ディー/ビー/エー バイオ−テクニカル リソーセズ ディビジョン | グルコサミンおよびn−アセチルグルコサミン製造のためのプロセスおよび材料 |
NZ605093A (en) | 2010-07-12 | 2014-05-30 | Univ Gent | Metabolically engineered organisms for the production of added value bio-products |
KR101683773B1 (ko) * | 2014-06-30 | 2016-12-08 | 고려대학교 산학협력단 | 인공 자살 유전자 회로를 이용한 목적 대사산물을 과생산하는 변이균주의 스크리닝 방법 |
KR101912359B1 (ko) * | 2016-05-18 | 2018-10-26 | 고려대학교 산학협력단 | 해당과정 플럭스 조절에 의해 n-아세틸글루코사민 생성능이 향상된 변이 미생물 |
US10724015B2 (en) * | 2016-05-18 | 2020-07-28 | Korea University Research And Business Foundation | Microorganism having improved ability to produce N-acetylglucosamine as a result of modulating glycolytic flux |
EP3562951A1 (en) | 2016-12-27 | 2019-11-06 | Inbiose N.V. | In vivo synthesis of sialylated compounds |
US20210355520A1 (en) * | 2018-09-21 | 2021-11-18 | Universiteit Gent | Method for the production of amino sugar containing products |
CN114787343A (zh) | 2019-10-03 | 2022-07-22 | 龟树实验室私人有限公司 | 营养组合物以及用于生产其的方法、试剂盒和细胞组合物 |
-
2022
- 2022-01-17 CN CN202280010398.XA patent/CN116783291A/zh active Pending
- 2022-01-17 KR KR1020237027723A patent/KR20230132539A/ko unknown
- 2022-01-17 EP EP22701351.3A patent/EP4277983A1/en active Pending
- 2022-01-17 WO PCT/EP2022/050918 patent/WO2022152914A1/en active Application Filing
- 2022-01-17 US US18/261,793 patent/US20240084347A1/en active Pending
- 2022-01-17 AU AU2022208430A patent/AU2022208430A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2022208430A1 (en) | 2023-09-07 |
WO2022152914A1 (en) | 2022-07-21 |
US20240084347A1 (en) | 2024-03-14 |
CN116783291A (zh) | 2023-09-19 |
EP4277983A1 (en) | 2023-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022034071A1 (en) | Production of a mixture of neutral non-fucosylated oligosaccharides by a cell | |
EP4192946A1 (en) | Cellular production of di- and/or oligosaccharides | |
WO2022034080A1 (en) | Cellular production of sialylated di- and/or oligosaccharides | |
KR20230132539A (ko) | 글리코실화된 생산물의 세포 생산 | |
US20240209405A1 (en) | Production of a sialylated oligosaccharide mixture by a cell | |
WO2023111141A1 (en) | Sialyltransferases for the production of sialylated oligosaccharides | |
WO2023175079A1 (en) | Sialyltransferases for the production of sialylated oligosaccharides | |
KR20240035566A (ko) | 락토-n-바이오스 전환 푸코실트랜스퍼라제 | |
WO2022152915A1 (en) | Extracellular production of glycosylated products | |
WO2023187109A1 (en) | Sialyltransferases for the production of sialylated oligosaccharides | |
CN117957316A (zh) | 转化乳糖-n-二糖的岩藻糖基转移酶 | |
TW202212572A (zh) | 藉由細胞製造中性岩藻糖基化寡醣之混合物 | |
TW202221133A (zh) | 藉由細胞生產中性未岩藻醣化寡醣的混合物 |